Textbook

専門統計調査士教科書

専門統計調査士は、統計調査士の上位資格で、**標本設計・推定の理論的精緻** や **公的統計の高度な利用** が問われます。統計調査士で『調査の流れ』を学んだ人が、『なぜその設計が最適なのか』『どう精度を保証するか』を理論的に学ぶための教科書です。本書は **10 章構成**で、標本設計・推定の精緻化・公的統計の高度利用・現代統計の地平・時系列と季節調整・小地域推定・複雑標本データの解析・テキスト調査と新型データ・統計倫理・将来展望まで扱います。

第 1 章 · 標本設計の理論
標本誤差の数式的扱いと、標本設計のオプション(層化・クラスター・多段)の精緻な比較。
- 1.1 標本誤差と推定値の精度
- 1.2 層化・クラスター・多段抽出の精度比較
第 2 章 · 推定の精緻化と補正
ウエイトバック・無回答補正・代入法など、実調査での精度向上テクニックを整理します。
- 2.1 ウエイトとレシオ推定
- 2.2 無回答補正と欠測値処理
第 3 章 · 公的統計の高度利用
主要な基幹統計の調査設計の詳細と、ミクロデータ・統計的開示制御を整理します。
- 3.1 主要基幹統計の調査設計
- 3.2 ミクロデータと統計的開示制御
第 4 章 · 現代統計の地平
ビッグデータ・行政データ・国際統計といった現代統計の課題を概観します。
- 4.1 ビッグデータと行政データの統計利用
- 4.2 国際統計と SDGs 指標
第 5 章 · 時系列調査と季節調整
月次・四半期で繰り返される公的統計を、トレンド・循環・季節・不規則の 4 成分に分解し、政策判断に使える系列に整える理論と実務。
第 6 章 · 小地域推定(Small Area Estimation)
市区町村レベルなど標本サイズが小さい領域での推定。階層モデル・空間平滑化を 3 節で。
第 7 章 · 複雑標本データの解析
層化・クラスター・ウエイト付き標本データの正しい解析手法を 3 節で。
第 8 章 · テキスト調査と新型データ
Web スクレイピング・SNS データ・行政データの統計利用と質的調査を 3 節で。
第 9 章 · 統計倫理と専門職としての責任
統計家の倫理規範・調査における倫理・プライバシー保護を 3 節で。
第 10 章 · 総まとめと将来展望
9 章の総括、調査統計の未来、専門統計調査士からの次のステップを 3 節で。

Chapter 1

第 1 章 · 標本設計の理論

§1.1

標本誤差と推定値の精度

標本調査の最大の課題は『全数を見ないことから生じる誤差(標本誤差)』をいかに小さくするか。本節ではこれを数式的に扱い、設計選択の基礎を作ります。

単純無作為標本(SRS)での標本平均の誤差

公式 ─ 標本平均の分散

母集団サイズ $N$ 、標本サイズ $n$ 、母分散 $S^{2}$ のとき、単純無作為抽出での標本平均 $\overset{ˉ}{X}$ の分散は

$V [\overset{ˉ}{X}] = \frac{S ^{2}}{n} (1 - \frac{n}{N}) \approx \frac{S ^{2}}{n}$ ( $n ≪ N$ なら有限母集団修正は無視)

標準誤差 = $V [\overset{ˉ}{X}] = S / n$ 。 $n$ で減衰するので、精度を 2 倍にしたいなら標本サイズは 4 倍必要 ─ という有名な関係。

標本サイズ設計の公式

公式 ─ 必要標本サイズ

誤差を $\pm e$ 以内に抑えたい(信頼水準 $1 - α$ )とき、必要な標本サイズは:

$n = (\frac{z _{α /2} S}{e})^{2}$

母比率の場合は $S^{2} = p (1 - p)$ を用いる(最悪ケースは $p = 0.5$ )。

なぜ『$\sqrt{n}$ の壁』が大事なのか

標本サイズと精度の関係が $n$ なので、精度向上のコストは加速度的に上がる。1000 → 10000 で精度は約 3 倍になりますが、コストは 10 倍。だから無作為抽出だけに頼らず『抽出設計を工夫して同じ精度を少ない n で達成』する戦略が大事になる ─ それが層化・多段抽出です。

デザイン効果(deff)

用語 ─ デザイン効果(deff)

$deff = \frac{V _{実際の設計} [ θ ^ ]}{V _{SRS} [ θ ^ ]}$

実際の標本設計の分散を、同じ $n$ の単純無作為抽出と比べた比。deff < 1(層化など)で精度向上、deff > 1(クラスター抽出など)で精度低下。

実効標本サイズ $n_{eff} = n / deff$ という考え方も重要。「クラスター抽出で n=2000 でも、deff=2 なら実質 1000 件分の精度」と読みます。

§1.2

層化・クラスター・多段抽出の精度比較

本節では、各標本設計の 精度の数式的な性質 を整理し、なぜ層化が SRS より優れ、クラスターが劣るのかを定量的に示します。

層化抽出の精度

公式 ─ 層化抽出の分散

層 $h = 1, \dots, L$ に分け、各層から $n_{h}$ 件抽出する場合、層化標本平均 $\overset{ˉ}{X}_{s t} = \sum_{h} W_{h} \overset{ˉ}{X}_{h}$ ( $W_{h} = N_{h} / N$ は層のウエイト)の分散は:

$V [\overset{ˉ}{X}_{s t}] = \sum_{h} W_{h}^{2} \frac{S _{h}^{2}}{n _{h}}$

( $S_{h}^{2}$ は層 $h$ 内の母分散)

ポイントは 層内分散 $S_{h}^{2}$ だけが現れ、層間分散 が消えていること。層内が均質(層分けが情報量豊か)なら $S_{h}^{2}$ が小さく、SRS より精度が上がります。

層別配分法

比例配分: $n_{h} = n \cdot W_{h}$ 。実装しやすい標準
ネイマン配分(最適配分): $n_{h} \propto N_{h} S_{h}$ 。精度を最大化。層の母分散の情報が必要
コスト最適配分: $n_{h} \propto N_{h} S_{h} / c_{h}$ ( $c_{h}$ は層 $h$ の調査コスト)

クラスター抽出の精度

性質 ─ クラスター抽出の精度

クラスター(集落)を $m$ 個ランダムに選び、各クラスター全要素を調べる場合、deff はクラスター内同質性 $ρ$ (intracluster correlation)に依存し、典型的に deff > 1(精度悪化)。

$deff \approx 1 + (\overset{n}{ˉ}_{c} - 1) ρ$

( $\overset{n}{ˉ}_{c}$ はクラスター平均サイズ)

層化とクラスターは対称的な操作

層化: 母集団を 均質グループに分け て各グループから抽出 → 層内が似ているので有利、deff < 1。 クラスター: 母集団を 多様なグループに分け てグループごと選ぶ → クラスター内が似ているので情報の重複、deff > 1。なぜクラスター抽出を使うかと言えば『コストが圧倒的に安い』(地理的に集まっている家を訪問するなど)から。精度とコストのトレードオフ を意識的に選ぶのが調査設計の本質です。

多段抽出

都道府県 → 市区町村 → 世帯のように、段階的に絞り込む 抽出。各段の精度損失が掛け合わさって全体精度を決める。第 1 次抽出単位(PSU) の数を増やすほど精度が上がるが、コストも上がる。労働力調査・家計調査など多くの公的標本調査で採用。

実務での標本設計判断

全国規模の世帯調査: 多段抽出 + 層化(地域・都市規模で層別)の組合せが標準。 疫学調査: 階層 1 = 病院、階層 2 = 患者の多段抽出。 Web 調査: 母集団リストがないので無作為抽出が困難。割当抽出 + 事後ウエイト調整 で対応。 *どの設計でも『デザインベース推定』(実際の抽出確率の逆数で重み付け)が原則。

Chapter 2

第 2 章 · 推定の精緻化と補正

§2.1

ウエイトとレシオ推定

実調査では『標本のままの単純集計』ではなく、ウエイト付き集計 で母集団推計を行うのが標準です。

ウエイトの基本

用語 ─ サンプリングウエイト

各観測単位 $i$ の 抽出確率の逆数 $w_{i} = 1/ π_{i}$ をサンプリングウエイト(基本ウエイト)という。

推定値: $\hat{T} = \sum_{i \in S} w_{i} x_{i}$ (母集団総計の推定量、Horvitz-Thompson 推定量)。

単純無作為抽出なら $w_{i} = N / n$ で全員等しいが、層化・クラスターで異なるウエイトになる。

事後層別とレイキング

事後層別(post-stratification): 集計後にウエイトを調整して、母集団構成と一致させる。性別 × 年代の比率を国勢調査に合わせるなど
レイキング(raking): 複数の周辺分布(性別・年代・地域別など)を順次合わせる反復手法。事後層別の多次元版
キャリブレーション: 補助情報を使ってウエイトを最適化。最も一般的な現代的手法

レシオ推定とリグレッション推定

用語 ─ レシオ推定量

補助変数 $X$ の母集団総計 $T_{X}$ がわかっているとき、 $Y$ の総計を:

$\hat{T}_{Y}^{ratio} = T_{X} \cdot \frac{T ^ _{Y}}{T ^ _{X}}$

で推定する手法。 $X$ と $Y$ に強い相関があれば、HT 推定より高精度。

補助情報を使うと『なぜ精度が上がる』のか

母集団の総計 $T_{X}$ が既知(国勢調査などから)なら、その情報を使って『 $Y$ の推定値を、 $X$ の推定値が母数と一致するように調整』できます。これは『家計調査の世帯数が国勢調査の世帯数とずれていたら、補正する』というシンプルな発想。 $X$ と $Y$ の相関が高いほど効果が大きい ─ これが補助変数の威力です。

§2.2

無回答補正と欠測値処理

実調査では 無回答(non-response) が必ず発生します。回答してくれない人を放置すると 無回答バイアス が生じるため、補正が必須です。

無回答のメカニズム

用語 ─ MCAR / MAR / MNAR

MCAR(Missing Completely At Random、完全無作為): 回答する確率が観測されたデータに依存しない。最も扱いやすい

MAR(Missing At Random、無作為): 観測されたデータで条件づけたら無作為。多変量補正で扱える

MNAR(Missing Not At Random、無作為でない): 欠測そのものが値に依存(例: 高所得者ほど所得を答えない)。最も困難

無回答補正の方法

ウエイト調整: 回答者のウエイトを増やして、無回答層をカバー。属性別回答率の逆数を使う
単純平均代入: 該当変数の標本平均で欠測を埋める。ばらつきを過小評価する欠点
回帰代入: 他の変数からの回帰式で予測値を埋める。MAR 仮定で機能
多重代入(Multiple Imputation, MI): 複数の代入セットを作り、推定値を統合。Rubin が提唱した現代的標準
Hot Deck 法: 似た回答者の値で欠測を埋める。古典的だが頑健

多重代入(MI)が標準になった理由

単純代入(平均値で埋めるなど)は『埋めた値が真の値であるかのように扱う』ため、推定値の分散を過小評価します。MI は 複数のもっともらしい代入セット を作り、それらの結果を統合することで『代入による不確実性も含めて分散を計算』できる ─ これが理論的に正しいやり方です。R の `mice` パッケージ・Python の `IterativeImputer` などで実装可能。

公的統計の無回答補正

労働力調査などの基幹統計では、属性別の回答率を計算 → ウエイト調整 + 事後層別の組み合わせで補正します。総務省は 『標準乗率』(調査で計算するウエイトの基準値) を公表しており、利用者はそれを使うのが標準。最近では 行政データの活用(住民基本台帳・税務データ)で無回答層の属性を補完する研究も進んでいます。

Chapter 3

第 3 章 · 公的統計の高度利用

§3.1

主要基幹統計の調査設計

統計調査士で扱った主要公的統計を、標本設計の観点から精緻に 見直します。

国勢調査(総務省統計局)

5 年に 1 回の全数調査(2020・2025・2030...)
調査単位: 世帯、調査票: 世帯員ごと + 世帯共通
調査区(約 50 世帯のブロック)が一次調査単位。指導員が割り当てられる
簡易調査(西暦末尾 5)と 大規模調査(末尾 0)の交互
結果: 人口・世帯・年齢・職業・通勤通学・住居・配偶関係

労働力調査(総務省統計局)

月次標本調査、約 4 万世帯
多段抽出: 全国の調査区を層化 → 抽出 → 各調査区から世帯
同一世帯を 2 ヶ月続けて調査 → 1 ヶ月休み → 翌年同月にまた 2 ヶ月(回転標本)
結果: 完全失業率・就業率・労働時間・転職

家計調査(総務省統計局)

月次標本調査、約 9 千世帯
家計簿 に約 6 ヶ月間記入してもらう負担の重い調査
結果: 平均消費支出・貯蓄・収入。CPI のウエイト計算にも使用
サンプルが少ないため都道府県別の結果は精度が低い 課題

経済センサス(総務省・経産省)

全産業対象の悉皆調査(全数調査)
5 年周期: 基礎調査(企業の概要)+ 活動調査(売上等)
事業所・企業のセンサスデータを商工業統計の基礎に

国民経済計算(SNA、内閣府)

加工統計: 多数の調査結果を統合して GDP 等を算出
3 面等価(生産・分配・支出)が成り立つように調整
四半期 GDP は速報・改定値・確報値の 3 段階で公表

§3.2

ミクロデータと統計的開示制御

統計法改正(2007) で、研究者が公的統計のミクロデータ(個票)を二次利用できるようになりました。これに伴い 個人情報保護 との両立が重要なテーマになっています。

ミクロデータの提供形式

オーダーメイド集計: 利用者のニーズに応じた集計表を提供
匿名データ: 個人特定リスクを除いた個票データ
オンサイト利用: 認定された施設(統計センター内)で個票を直接分析

統計的開示制御(SDC)

用語 ─ 統計的開示制御

ミクロデータや集計表を提供する際に、個人や事業所が特定されないよう に施す処理の総称。次のような手法を組み合わせる:

- トップコーディング: 上位の値を集約(例: 年収 1000 万円以上はすべて『1000 万円以上』) - セルの抑制(suppression): 度数 1 か 2 のセルは公表しない - ノイズ加算: 値に小さなノイズを加える - 疑似データ生成: 統計的性質を保ったまま全く新しいデータを生成

k-匿名性と差分プライバシー

k-匿名性: どの個人もデータ中で k 件以上同じ属性の人がいる こと。最も古典的な保護基準
l-多様性 / t-近似性: k-匿名性の弱点(機密属性の偏り)を補正
差分プライバシー(DP): 個別レコードの有無で出力分布がほぼ変わらない厳密な数学的保証。現代の標準。米国国勢調査も 2020 年から DP を採用

プライバシーと統計の利用価値はトレードオフ

ノイズを多く加える → プライバシー保護が強い → 統計の正確さは下がる。逆に、ノイズを小さくすると統計は正確だが特定リスクが上がる。差分プライバシーはこのトレードオフを 数学的に厳密にコントロール できる枠組みで、近年の公的統計のグローバルスタンダードです。日本の統計法もこの方向に進化しています。

実務:ミクロデータを使った研究

経済学・社会学・公衆衛生の研究者は、統計センターのオンサイト施設(東京・大阪・京大など)で公的統計の個票を分析できます。事前申請 + 守秘義務契約 + 結果の事前審査 という厳格な手続きを経て、政策評価や因果推論研究に活用。EBPM(Evidence-Based Policy Making、エビデンスベースの政策形成)推進の中核技術です。

Chapter 4

第 4 章 · 現代統計の地平

§4.1

ビッグデータと行政データの統計利用

近年、伝統的な標本調査だけでは捉えきれない『新しいデータ源』(ビッグデータ・行政記録)を統計に活用する動きが世界的に進んでいます。

ビッグデータの特徴と限界

Volume(量): テラバイト・ペタバイト級
Velocity(速度): リアルタイムストリーム
Variety(多様性): 構造化 + 非構造化(画像・音声・テキスト)
Veracity(真実性): 必ずしも代表的サンプルではない

ビッグデータは『無作為標本』ではない

Twitter のつぶやきは Twitter ユーザーだけ のもの、SNS データは そのプラットフォーム使用者だけ のもの。これは『選択バイアス』の典型で、伝統的な標本調査の理論(無作為抽出 → 母集団推定)が そのまま使えない。ビッグデータは『データが大量にある = 全数』という錯覚を生むが、実際には 特定の母集団 を見ているに過ぎないことに注意が必要です。

行政データの統計利用

マイナンバー制度 の進展で行政記録の統合的利用が進む
税務データ(国税庁): 所得分布の正確な情報源
社会保険データ: 雇用・給与・健康の情報
住民基本台帳: 人口統計の基盤
注意点: 行政目的で集められたデータなので、統計目的の代表性が保証されない ことがある

ノルディック諸国の事例

デンマーク・スウェーデン・フィンランドは、個人 ID + 行政データ統合 が高度に進み、伝統的な標本調査を行政データで代替する『レジスター・ベース統計』が進んでいます。日本でも同方向の研究が進められていますが、プライバシー保護とのバランスが鍵です。

§4.2

国際統計と SDGs 指標

公的統計は 国際比較可能性 が重要な品質要件。国連・OECD・ILO などが共通の概念・分類を整備しています。

主要な国際機関と統計

国連統計部(UNSD): 国際統計年鑑・SDGs 指標
OECD: 経済統計・社会統計の国際比較。Better Life Index も
IMF: 国際金融統計
世界銀行: 開発統計、World Development Indicators
ILO: 労働統計
WHO: 保健統計

主要な国際統計分類

ISIC(International Standard Industrial Classification): 産業分類。日本の JSIC はこれをベース
ISCO(International Standard Classification of Occupations): 職業分類。日本の JSCO に対応
HS コード: 貿易統計の品目分類
SNA(System of National Accounts): 国民経済計算の国際基準。日本は 08SNA を採用

SDGs 指標

持続可能な開発目標(SDGs) は 2015 年に国連で採択、2030 年達成を目指す 17 目標 169 ターゲットの枠組み。各ターゲットに指標が定められ、各国がデータ提供する仕組み。日本では総務省統計局が国の SDGs 指標プラットフォームを運用しています。

Tier I: 確立された方法論・データあり
Tier II: 方法論はあるがデータが不足
Tier III: 方法論自体が未確立

Beyond GDP の動き

GDP 単独では Well-being や持続可能性を測れない という問題意識から、Stiglitz-Sen-Fitoussi 委員会(2009)以降、多次元指標(OECD Better Life Index、ブータンの GNH、Human Development Index など)の整備が進む。統計の役割 が経済から社会全般に拡大してきています。

実務でのデータ使い分け

シンクタンクの政策研究 では、伝統的な公的統計 + 行政データ + 民間ビッグデータ + 国際比較を組合せるのが主流。例: スマート農業の経済効果分析では、農業センサス(伝統的)+ 衛星データ(ビッグ)+ JA データ(行政的)を統合。異なる性質のデータを正しく扱える設計力 が、現代の統計家・データサイエンティストに求められる新しいスキルです。

ここまで専門統計調査士の主要範囲を扱いました。続く 5 章では、調査統計の中でも特に重要な『時系列調査と季節調整』 ─ 月次・四半期で繰り返される統計の変動要因をどう分解し、政策判断に使えるシリーズに整えるか ─ を学びます。

Chapter 5

第 5 章 · 時系列調査と季節調整

§5.1

時系列の構造分解

公的統計の多くは月次・四半期で繰り返し公表される 時系列(Time Series)。単純に前月比・前年比を見るだけでは『景気の本当の動き』は分かりません。本節では時系列を 4 成分 に分解する古典的枠組みを学びます。

4 つの構造成分

用語 ─ トレンド・循環・季節・不規則

T(Trend, 傾向): 数年〜数十年スパンの長期的な動向。人口減少・技術進歩など

C(Cycle, 循環): 数年スパンの景気循環(好況・不況の波)

S(Seasonal, 季節): 1 年周期で繰り返す変動。冬の暖房需要・年末商戦・農産物の収穫期

I(Irregular, 不規則): 上記で説明できない短期変動。災害・ストライキ・統計捕捉の誤差

公式 ─ 加法モデルと乗法モデル

加法モデル: $Y_{t} = T_{t} + C_{t} + S_{t} + I_{t}$ ─ 季節振幅が水準に依存しないとき

乗法モデル: $Y_{t} = T_{t} \cdot C_{t} \cdot S_{t} \cdot I_{t}$ ─ 水準に比例して季節振幅が大きくなるとき(物価・生産指数で多い)

対数変換 $lo g Y_{t}$ を取れば乗法は加法に帰着できる。

なぜ 4 成分に分けるのか

『先月から失業率が 0.2pt 上がった』とニュースで言われても、それが季節要因なのか・景気悪化なのか が分からなければ政策判断はできません。冬の建設業の落ち込みは毎年起こる季節要因なので政策対応は不要、しかし循環成分の悪化なら景気対策が必要 ─ こうした 判断のための分解 が、時系列分解の本質的役割です。新型コロナのような外的ショックは『不規則(I)』に吸収されるので、それを除いた トレンド + 循環 で景気の地下水脈を読む、というのが公的統計の使い方。

§5.2

季節調整の手法

季節調整(Seasonal Adjustment) は、原系列から季節成分 $S_{t}$ を取り除いた 季節調整済み系列(SA: Seasonally Adjusted) を作る作業。日本・米国・欧州の公的統計はほぼ例外なくこれを行います。

古典的な手法 ─ 移動平均と比率法

公式 ─ 中心化移動平均

月次データなら 12 ヶ月中心化移動平均:

$\hat{T}_{t} = \frac{1}{12} (\frac{1}{2} Y_{t - 6} + Y_{t - 5} + \dots + Y_{t + 5} + \frac{1}{2} Y_{t + 6})$

12 期にわたる移動平均で季節成分を相殺し、トレンド成分を取り出す。両端で 6 個ずつ計算できなくなるのが弱点。

Step 1: 12 ヶ月中心化移動平均でトレンド・循環 $T C_{t}$ を抽出
Step 2: $S_{t} \cdot I_{t} = Y_{t} / T C_{t}$ (乗法) または $Y_{t} - T C_{t}$ (加法)
Step 3: 各月の $S I$ 値を年で平均して 季節指数 $S_{t}$ を確定
Step 4: $SA_{t} = Y_{t} / S_{t}$ (乗法) または $Y_{t} - S_{t}$ (加法)

X-12-ARIMA / X-13ARIMA-SEATS

X-12-ARIMA(米国センサス局開発)は、移動平均ベースの分解に ARIMA モデルによる端点予測補完 を組合せた標準的な季節調整プログラム。日本の総務省統計局も多くの基幹統計でこれを採用。後継の X-13ARIMA-SEATS は TRAMO/SEATS(欧州中央銀行系)と統合され、現代の国際標準です。

用語 ─ X-13ARIMA-SEATS の主要構成

1. RegARIMA: ARIMA + 回帰で アウトライヤ・暦日効果(平日数・うるう年・休日) を除いた前処理

2. SEATS(Signal Extraction in ARIMA Time Series): ARIMA モデルの構造から、最適に季節成分を分離

3. 診断統計: M-statistic、QS-test、F-test for seasonality など、調整品質を点数化

暦日効果と祝日調整

営業日数・うるう年・GW を補正する

月による 営業日数の違い は、月次比較に大きな影響を与えます(2 月は 28 日、3 月は 31 日)。さらに『曜日構成』も重要 ─ 月によって日曜の数が 4 か 5 か違うだけで小売販売額が数 % 動く。X-13 では暦日変数(平日数・各曜日数)を回帰で除去 してから季節調整します。日本では GW・年末年始・祝日法改正 も特殊事象として扱う。

§5.3

公的統計における運用

理論を踏まえ、日本の公的統計で 季節調整がどう実務適用されているか を整理します。

主要統計の季節調整

鉱工業生産指数(経産省): X-12-ARIMA。月次ニュースで『季調済前月比』を発表
家計調査(総務省): 月次の支出変動から季節成分を除去
労働力調査(総務省): 失業率の季調済値を月次で公表
法人企業統計(財務省): 四半期で X-12-ARIMA
国民経済計算(GDP): 内閣府が四半期で SA 系列を公表。SA + 年率換算 で対外比較

季調値の改定と最終値

用語 ─ Concurrent vs Forward Adjustment

Concurrent: 新月のデータが入るたびに 過去の季節指数も更新。最新値の精度が高いが、過去値が後で動く。米国・日本の現行方式。

Forward: 年初に 1 年分の季節指数を固定し、年中は更新しない。過去値が安定するが、最新値の精度がやや落ちる。

Concurrent 方式では『季調値は 改定されうる**』のが宿命。新しいデータで季節パターンの推定が更新されるため、過去値も動く。月例経済報告で『遡及改定』が話題になるのはこの仕組みのため。

前月比 vs 前年比 vs 季調済前月比

前年同月比(YoY): 季節要因を自動的に除去できるが、1 年遅れて反応する
前月比(MoM): 季節調整前なら毎月の季節差で乱高下するので無意味
季調済前月比: 季節要因を除いた直近の動きを月次で見る ─ 景気判断の主役
3 ヶ月移動平均 や 年率換算(annualized) で短期ノイズをさらに均すこともある

DI(Diffusion Index)と CI(Composite Index)

用語 ─ 景気動向指数

DI(Diffusion Index): 採用系列のうち上昇している系列の割合(%)。50% を景気の山谷の境とする。広がりの指標。

CI(Composite Index): 採用系列の変化率を合成して景気の 強さ・テンポ を測る。日本の景気動向指数は CI 中心に移行(2008 年以降)。

DI と CI の使い分け

DI は『景気は どれくらいの企業に広がって よくなっているか』、CI は『どれくらい強く 良くなっているか』。両者は補完的で、内閣府の景気動向指数は両方を公表しています。リーマンショック後は CI に重点が移り、DI は補助指標に。強さ vs 広がりは別軸 という発想は政策統計の典型例です。

実務でのソフトウェア

X-13ARIMA-SEATS は米センサス局から無料配布され、Stata・EViews・R(`seasonal` パッケージ)・Python(`statsmodels.tsa.x13`)から呼び出せます。日本では総務省・経産省・内閣府の統計担当が業務で利用。実務家は データ → X-13 → 診断値の確認 → 必要なら手動でアウトライヤ指定 → 公表 というフローを踏みます。

ここまで 5 章で専門統計調査士の中核を扱いました。続く 6-10 章では 小地域推定・複雑標本の解析・調査ウエイトの理論・テキスト調査と新型データ・統計倫理と将来展望 を加えて、現代の調査統計家に求められる高度なスキルを完成させます。

Chapter 6

第 6 章 · 小地域推定(Small Area Estimation)

§6.1

小地域推定の問題と直接推定の限界

小地域推定(Small Area Estimation, SAE) は、市区町村単位など 標本サイズが小さい領域 で、信頼できる推定値を得る手法群。

直接推定の限界

n が 5 では平均は語れない

ある市町村に標本がたまたま 5 件しか含まれない場合、その 5 件の標本平均だけで母平均を語るのは無理。標準誤差が巨大 になり、信頼区間も実用的でない。これが小地域推定の課題で、借りる(borrow strength) という発想が必要に。

借用の方向性

時間的借用: 過去のデータも使う(時系列モデル)
空間的借用: 隣接地域のデータも使う(空間モデル)
補助情報の借用: 行政データ・センサスを共変量として(回帰)
階層的借用: 県全体平均にスムージング(階層ベイズ)

§6.2

Fay-Herriot モデルと階層ベイズ

Fay-Herriot モデル(1979)は SAE の古典的・標準的アプローチ。

Fay-Herriot モデルの定式化

公式 ─ Fay-Herriot Model

領域 $i$ の真値 $θ_{i}$ 、直接推定値 $\hat{θ}_{i}^{direct}$ :

$\hat{θ}_{i}^{direct} = θ_{i} + e_{i}, e_{i} \sim N (0, ψ_{i})$ (サンプリングモデル)

$θ_{i} = x_{i}^{⊤} β + u_{i}, u_{i} \sim N (0, σ_{u}^{2})$ (リンクモデル)

シンクロ最適化 で $\hat{θ}_{i}^{EBLUP}$ を計算。回帰予測 + 直接推定の重み付き和。

BLUP と EBLUP

BLUP(Best Linear Unbiased Predictor) は理論的最良予測量、EBLUP(Empirical BLUP) は分散成分をデータから推定して使う実用版。REML(制限付き最尤推定) で分散成分を推定するのが標準。

階層ベイズ拡張

現代の小地域推定では 階層ベイズ + MCMC が主流。Fay-Herriot を拡張し、空間相関(CAR モデル)・非線形リンク・ロバスト誤差分布 などを柔軟にモデル化可能。日本でも 総務省統計局 が市町村人口推計で使う実用例が増加中。

§6.3

実用例と評価

SAE の実用例 と評価指標を整理します。

国内外の実例

米国 SAIPE(Census Bureau): 学齢児童の貧困率を学区別に推定
EU SILC: 地域別の所得・社会指標
日本: 失業率の市町村推定・国民健康・栄養調査の県別推定
世界銀行: 開発途上国の貧困マップ作成
ESS(欧州統計制度): 加盟国全体の SAE 標準化

推定の不確実性表示

推定値だけでなく信頼区間を示す

SAE は不確実性が大きいため、点推定値だけでなく信頼区間・予測区間 をセットで提示するのが原則。地図では モザイク表示(信頼度別に表示)・色透明度 で不確実性を可視化する工夫もあります。

ML との接続

近年、機械学習を SAE に応用 する研究が活発。深層学習で衛星画像 + 行政データを統合 し、貧困マップを高解像度で作成する手法(Stanford の研究)など、データサイエンスとの境界が薄れています。

Chapter 7

第 7 章 · 複雑標本データの解析

§7.1

標本ウエイトの解析的扱い

複雑標本(complex survey) = 単純無作為以外の標本。一般の統計手法をそのまま使うと 誤った標準誤差 になります。

標本ウエイトの種類

用語 ─ ウエイトの構成要素

設計ウエイト: 抽出確率の逆数 $w_{i} = 1/ π_{i}$

無回答補正ウエイト: 無回答による偏りを修正

事後層化ウエイト: 母集団の周辺分布に合わせる調整

最終ウエイト = 上記の積。Stata なら `[pweight=w]`、R の `survey` パッケージで指定。

Horvitz-Thompson 推定量

公式 ─ Horvitz-Thompson

$\hat{T}_{H T} = \sum_{i \in s} \frac{y _{i}}{π _{i}} = \sum_{i \in s} w_{i} y_{i}$

母集団総和の不偏推定量。複雑標本での 基本中の基本。設計に応じて分散公式が変わる。

なぜ素朴な平均では駄目か

ウエイト無視の悪影響

ある層を オーバーサンプル していた場合、ウエイトを無視すると その層に引っぱられた偏った推定 に。平均年齢 が実際は 45 歳なのに、若年層オーバーサンプルで 35 歳と推定、というような誤りが起きます。

§7.2

層化・クラスター下の分散推定

複雑標本では 分散推定 がやっかい。Taylor 展開・線形化法・リサンプリング法が主要アプローチ。

Taylor 線形化法

比推定量や差推定量など 非線形 の統計量を、Taylor 1 次近似で 線形化してから分散を計算 する手法。古典的な手計算による標準誤差の主な道具。

ジャックナイフ・ブートストラップ

ジャックナイフ: 1 つずつデータを除いて推定値を再計算 → 分散推定
Balanced Repeated Replication(BRR): 半分ずつ抜く擬似標本を構成
ブートストラップ: 標本から重複抽出して標本分布を構成
Rao-Wu rescaling bootstrap: 階層化標本のブートストラップ

実装ツール

Stata: `svy:` 接頭辞で全コマンドが対応
R: `survey` パッケージ(Lumley)・`srvyr` でパイプ風記述
SAS: SURVEYMEANS/REG/LOGISTIC プロシージャ
Python: `samplics` パッケージで複雑標本の主要解析

§7.3

回帰分析での複雑標本

回帰分析を複雑標本に適用するとき、ウエイトを使う / 使わない の選択が問題になります。

ウエイト付き回帰

公式 ─ ウエイト付き OLS

$\hat{β}_{W} = (X^{⊤} W X)^{- 1} X^{⊤} W y, W = diag (w_{i})$

設計ウエイトを使った回帰。Pseudo-MLE とも呼ばれる。標準誤差は Taylor 線形化 または 複製分散推定 で。

ウエイトを使う / 使わない

目的で選ぶ

目的が母集団パラメータの推定 → ウエイト付き(Pseudo-MLE)

目的がモデルの真の係数推定(構造的・因果関係) → モデルが正しければウエイト不要(効率性のため)

両方走らせて結果が違えば、モデル指定に問題がある サインかも。

Design Effect

$deff = V_{実設計} / V_{SRS}$ 。複雑標本で 同じサンプルサイズの単純無作為と比べた効率比。クラスター抽出は deff > 1(精度ロス)、層化は deff < 1(精度向上)が一般的。

Chapter 8

第 8 章 · テキスト調査と新型データ

§8.1

Web ・ SNS データの統計利用

従来の標本調査 に代わる、または補完する 新型データ の利用が世界中で進んでいます。

新型データの主な種類

Web スクレイピング: 価格・求人・不動産情報の継続収集
SNS データ: Twitter / Reddit の投稿・センチメント分析
衛星データ: 経済活動・農業生産の推定
モバイル位置情報: 人流・観光統計
POS / クレカ: リアルタイム消費動向
スマートメーター: 電力・水道使用パターン

代表性とバイアス

ビッグ != 代表的

Twitter の投稿を全件取得しても、Twitter ユーザーは日本人口の代表ではない(若年・都市部・男性偏重)。新型データは 大量だが代表的でない ことが多く、標本調査と組合せた校正 が必要です。

校正(calibration)技術

事後層化: 既知の母集団分布で重み付け
ベンチマーク: 公的統計と整合させる
MR(Modular Regression): 補助情報モデル
Selection Bias 補正: 選択モデル(Heckit など)

§8.2

行政データと統計利用

行政が業務で集めたデータを 統計目的 に使う『レジスター・ベース統計』が世界的に進んでいます。

ノルディック諸国の事例

デンマーク・スウェーデン・フィンランド は、個人 ID + 行政データ統合 が高度に進み、伝統的な調査の代替が進行。国勢調査を行わず、行政記録だけで人口統計を作成 する国も。

日本での進展

マイナンバー制度: 2016 年運用開始、税・社会保障を統合
GビズID: 法人版マイナンバー的役割
官民データ活用推進基本法(2016): オープンデータ推進
EBPM(Evidence Based Policy Making): 行政データの政策評価利用
統計法 33 条: オーダーメード集計で研究者にもデータ提供

リスクと倫理

個人特定リスク: 統合により再識別が容易に
目的外利用: 行政目的のデータが統計目的に
透明性: 国民への説明責任
第三者監査: 倫理委員会の役割
差分プライバシー: 集計値にノイズを加える数学的保護

§8.3

質的調査と混合研究法

数値だけでない 質的データ の調査も、社会調査の重要な柱。

質的調査の主要手法

深層インタビュー: 1 対 1 の長時間インタビュー
フォーカスグループ: 6-10 人の集団議論
民族誌調査: 現場での参与観察
ケーススタディ: 個別事例の深掘り
テキスト分析: 文書・記録の解釈的分析

混合研究法(Mixed Methods)

質と量の組合せ

Mixed Methods は質的・量的を組合せる現代的アプローチ。例: 量的調査で広く把握 → 質的インタビューで深掘り → 量的調査で仮説検証、というシーケンス。現実の社会現象の複雑さ を捉えるのに有効です。

テキストマイニングと AI

形態素解析: MeCab・Sudachi で日本語を単語に分解
TF-IDF・Word2Vec・BERT: テキストの数値化
トピックモデリング(LDA): 文書から潜在トピックを抽出
LLM 活用: GPT-4 で自由回答の自動コーディング
感情分析: 投稿のポジ/ネガ判定

Chapter 9

第 9 章 · 統計倫理と専門職としての責任

§9.1

統計家の倫理規範

統計調査の専門家は『社会の意思決定の質を支える』専門職として、独自の倫理規範を持ちます。

ISI Declaration on Professional Ethics

国際統計協会(ISI) の倫理宣言は、世界の統計家共通の規範。社会への責任・データソースへの責任・調査資金提供者への責任・同僚への責任・自分への責任 の 5 軸で 30+ の項目。

日本の統計倫理

日本統計学会: 倫理規定・賛同基準
日本社会調査協会: 倫理規程と調査士認定
統計法: 調査票情報の守秘義務(第 41 条)
個人情報保護法: 調査における情報取扱

主要な倫理原則

インフォームド・コンセント: 調査目的・利用範囲を事前説明
自発的参加: 強制ではない、いつでも回答中止可
匿名性・守秘性の保証: 個別回答の保護
結果の公正な報告: 不都合な結果も含めて公開
利益相反の開示: 資金提供者・関心の透明性

§9.2

プライバシー保護の数学

プライバシー保護 は調査の倫理だけでなく、技術的に保証する手法群があります。

k-匿名化の発展

用語 ─ プライバシー保護モデル

k-匿名化: 同じ準識別子を持つ個人が常に k 人以上(Sweeney 2002)

l-多様性: k-匿名化の各グループ内で、機密属性が l 種類以上(Machanavajjhala 2007)

t-近接性: 各グループ内の機密属性分布が母集団分布に近い(Li 2007)

差分プライバシー

公式 ─ Differential Privacy

クエリ $f$ が $ε$ -差分プライバシー とは:

$P (f (D) \in S) \leq e^{ε} \cdot P (f (D^{'}) \in S)$

隣接データセット $D, D^{'}$ (1 件違い)で結果がほぼ変わらない。Laplace ノイズ・Gaussian ノイズ を集計値に加える形が代表的。Apple・Google・US Census(2020)が採用。

現代の保護技術

Synthetic Data: 統計的特性を保つ合成データ
Federated Learning: データを動かさず学習
Secure Multi-party Computation: 暗号化したまま計算
Homomorphic Encryption: 暗号文上で計算可能

§9.3

報告のガイドラインと再現可能性

正しい報告 は専門家の倫理。研究の 再現可能性 が現代の重要トピック。

報告ガイドライン

STROBE: 観察研究の報告ガイドライン
CONSORT: ランダム化試験
PRISMA: メタ分析・システマティックレビュー
STARD: 診断検査研究
TRIPOD: 予測モデル研究
国連 SDGs Reporting Guideline: SDGs 指標の報告

再現可能性

再現性危機

心理学・医学で発覚した再現性危機(Open Science Collaboration 2015)。データ・コードの公開・事前登録(プレレジストレーション) が解決策として浸透中。プレ印刷サーバー(arXiv・SSRN・bioRxiv) での公開も標準に。

オープンサイエンス

事前登録: 仮説・分析計画を実施前に公開
FAIR データ原則: Findable・Accessible・Interoperable・Reusable
OSF(Open Science Framework): プロジェクト管理プラットフォーム
Registered Reports: 結果より前に査読を受ける論文形式

Chapter 10

第 10 章 · 総まとめと将来展望

§10.1

9 章の総まとめ

専門統計調査士教科書 9 章を歩き終えました。標本設計の理論的精緻 から 倫理・プライバシー・新型データ まで、現代の調査統計家に必要な道具立てを完備しました。

9 章の地図

Ch1 標本設計の理論
Ch2 推定の精緻化と補正
Ch3 公的統計の高度利用
Ch4 現代統計の地平
Ch5 時系列調査と季節調整
Ch6 小地域推定(SAE)
Ch7 複雑標本データの解析
Ch8 テキスト調査と新型データ
Ch9 統計倫理と専門職としての責任

§10.2

調査統計の未来

今後 10-20 年の調査統計の方向性を整理します。

5 つの大きな潮流

ハイブリッド化: 伝統的調査 + 行政データ + 新型データの統合
AI 統合: 自動コーディング・欠測補完・異常検知
プライバシー強化: 差分プライバシー・連合学習の標準化
国際標準化: Eurostat・UN 主導の規格化
SDGs / Beyond GDP: 多次元指標の拡充

統計家の役割の進化

ツール → 戦略への重心移行

AI が技術的作業を自動化する時代、統計家の価値は 『何を測るか』『どう解釈するか』『社会にどう還元するか』 という戦略・倫理判断に移行。より上流の課題設定能力 が問われる時代に。

§10.3

次のステップ

専門統計調査士の次のステップは多様です。

進路 A: 学術研究へ

統計検定 1 級: 数理統計学の理論
社会調査士・専門社会調査士(社会学系)
修士・博士課程: 専門化
国際機関: 国連統計部・OECD・世界銀行

進路 B: 実務専門化

国家・地方統計部門: 政府統計家として
日銀・財務省: マクロ経済統計
民間調査会社: マーケットリサーチ
民間 DS: ビジネスでのデータ分析

進路 C: 関連分野

[因果推論](/causal-inference): 政策評価への応用
[時系列分析](/time-series): 経済予測
[機械学習](/programming): 新型データの活用
[統計検定 1 級](/textbook/grade-1): 理論を深く

💡 専門統計調査士は『社会のインフラを支える専門職』

公的統計は 民主主義のインフラ。質の高い統計が社会の意思決定の基盤を支えています。専門統計調査士の知識 は、社会全体の意思決定の質を底上げする 公共財。とても価値のある専門職です。

専門統計調査士合格、おめでとうございます。社会の知的インフラを担う専門家として、ぜひ次の旅へお進みください。

目次

単純無作為標本(SRS)での標本平均の誤差

標本サイズ設計の公式

デザイン効果(deff)

層化抽出の精度

層別配分法

クラスター抽出の精度

多段抽出

ウエイトの基本

事後層別とレイキング

レシオ推定とリグレッション推定

無回答のメカニズム

無回答補正の方法

国勢調査(総務省統計局)

労働力調査(総務省統計局)

家計調査(総務省統計局)

経済センサス(総務省・経産省)

国民経済計算(SNA、内閣府)

ミクロデータの提供形式

統計的開示制御(SDC)

k-匿名性と差分プライバシー

ビッグデータの特徴と限界

行政データの統計利用

ノルディック諸国の事例

主要な国際機関と統計

主要な国際統計分類

SDGs 指標

Beyond GDP の動き

4 つの構造成分

古典的な手法 ─ 移動平均と比率法

X-12-ARIMA / X-13ARIMA-SEATS

暦日効果と祝日調整

主要統計の季節調整

季調値の改定と最終値

前月比 vs 前年比 vs 季調済前月比

DI(Diffusion Index)と CI(Composite Index)

直接推定の限界

借用の方向性

Fay-Herriot モデルの定式化

BLUP と EBLUP

階層ベイズ拡張

国内外の実例

推定の不確実性表示

ML との接続

標本ウエイトの種類

Horvitz-Thompson 推定量

なぜ素朴な平均では駄目か

Taylor 線形化法

ジャックナイフ・ブートストラップ

実装ツール

ウエイト付き回帰

ウエイトを使う / 使わない

Design Effect

新型データの主な種類

代表性とバイアス

校正(calibration)技術

ノルディック諸国の事例

日本での進展

リスクと倫理

質的調査の主要手法

混合研究法(Mixed Methods)

テキストマイニングと AI

ISI Declaration on Professional Ethics

日本の統計倫理

主要な倫理原則

k-匿名化の発展

差分プライバシー

現代の保護技術

報告ガイドライン

再現可能性

オープン サイエンス

9 章の地図

5 つの大きな潮流

統計家の役割の進化

進路 A: 学術研究へ

進路 B: 実務専門化

進路 C: 関連分野

オープンサイエンス