専門統計調査士 教科書
専門統計調査士は、統計調査士の上位資格で、**標本設計・推定の理論的精緻** や **公的統計の高度な利用** が問われます。統計調査士で『調査の流れ』を学んだ人が、『なぜその設計が最適なのか』『どう精度を保証するか』を理論的に学ぶための教科書です。本書は 4 章で、主要トピックを駆け足で確認します。
目次
- 第 1 章 · 標本設計の理論標本誤差の数式的扱いと、標本設計のオプション(層化・クラスター・多段)の精緻な比較。
- 第 2 章 · 推定の精緻化と補正ウエイトバック・無回答補正・代入法など、実調査での精度向上テクニックを整理します。
- 第 3 章 · 公的統計の高度利用主要な基幹統計の調査設計の詳細と、ミクロデータ・統計的開示制御を整理します。
- 第 4 章 · 現代統計の地平ビッグデータ・行政データ・国際統計といった現代統計の課題を概観します。
第 1 章 · 標本設計の理論
標本誤差と推定値の精度
標本調査の最大の課題は『全数を見ないことから生じる誤差(標本誤差)』をいかに小さくするか。本節ではこれを数式的に扱い、設計選択の基礎を作ります。
単純無作為標本(SRS)での標本平均の誤差
母集団サイズ 、標本サイズ 、母分散 のとき、単純無作為抽出での標本平均 の分散は
( なら有限母集団修正は無視)
標準誤差 = 。 で減衰するので、精度を 2 倍にしたいなら標本サイズは 4 倍必要 ─ という有名な関係。
標本サイズ設計の公式
誤差を 以内に抑えたい(信頼水準 )とき、必要な標本サイズは:
母比率の場合は を用いる(最悪ケースは )。
標本サイズと精度の関係が なので、精度向上のコストは加速度的に上がる。1000 → 10000 で精度は約 3 倍になりますが、コストは 10 倍。だから無作為抽出だけに頼らず『抽出設計を工夫して同じ精度を少ない n で達成』する戦略が大事になる ─ それが層化・多段抽出です。
デザイン効果(deff)
実際の標本設計の分散を、同じ の単純無作為抽出と比べた比。deff < 1(層化など)で精度向上、deff > 1(クラスター抽出など)で精度低下。
実効標本サイズ という考え方も重要。「クラスター抽出で n=2000 でも、deff=2 なら実質 1000 件分の精度」と読みます。
層化・クラスター・多段抽出の精度比較
本節では、各標本設計の 精度の数式的な性質 を整理し、なぜ層化が SRS より優れ、クラスターが劣るのかを定量的に示します。
層化抽出の精度
層 に分け、各層から 件抽出する場合、層化標本平均 ( は層のウエイト)の分散は:
( は層 内の母分散)
ポイントは 層内分散 だけが現れ、層間分散 が消えていること。層内が均質(層分けが情報量豊か)なら が小さく、SRS より精度が上がります。
層別配分法
- 比例配分: 。実装しやすい標準
- ネイマン配分(最適配分): 。精度を最大化。層の母分散の情報が必要
- コスト最適配分: ( は層 の調査コスト)
クラスター抽出の精度
クラスター(集落)を 個ランダムに選び、各クラスター全要素を調べる場合、deff はクラスター内同質性 (intracluster correlation)に依存し、典型的に deff > 1(精度悪化)。
( はクラスター平均サイズ)
層化: 母集団を 均質グループに分け て各グループから抽出 → 層内が似ているので有利、deff < 1。 クラスター: 母集団を 多様なグループに分け てグループごと選ぶ → クラスター内が似ているので情報の重複、deff > 1。 なぜクラスター抽出を使うかと言えば『コストが圧倒的に安い』(地理的に集まっている家を訪問するなど)から。精度とコストのトレードオフ を意識的に選ぶのが調査設計の本質です。
多段抽出
都道府県 → 市区町村 → 世帯のように、段階的に絞り込む 抽出。各段の精度損失が掛け合わさって全体精度を決める。第 1 次抽出単位(PSU) の数を増やすほど精度が上がるが、コストも上がる。労働力調査・家計調査など多くの公的標本調査で採用。
全国規模の世帯調査: 多段抽出 + 層化(地域・都市規模で層別)の組合せが標準。 疫学調査: 階層 1 = 病院、階層 2 = 患者の多段抽出。 Web 調査: 母集団リストがないので無作為抽出が困難。割当抽出 + 事後ウエイト調整 で対応。 *どの設計でも『デザインベース推定』(実際の抽出確率の逆数で重み付け)が原則。
第 2 章 · 推定の精緻化と補正
ウエイトとレシオ推定
実調査では『標本のままの単純集計』ではなく、ウエイト付き集計 で母集団推計を行うのが標準です。
ウエイトの基本
各観測単位 の 抽出確率の逆数 をサンプリングウエイト(基本ウエイト)という。
推定値: (母集団総計の推定量、Horvitz-Thompson 推定量)。
単純無作為抽出なら で全員等しいが、層化・クラスターで異なるウエイトになる。
事後層別とレイキング
- 事後層別(post-stratification): 集計後にウエイトを調整して、母集団構成と一致させる。性別 × 年代の比率を国勢調査に合わせるなど
- レイキング(raking): 複数の周辺分布(性別・年代・地域別など)を順次合わせる反復手法。事後層別の多次元版
- キャリブレーション: 補助情報を使ってウエイトを最適化。最も一般的な現代的手法
レシオ推定とリグレッション推定
補助変数 の母集団総計 がわかっているとき、 の総計を:
で推定する手法。 と に強い相関があれば、HT 推定より高精度。
母集団の総計 が 既知(国勢調査などから)なら、その情報を使って『 の推定値を、 の推定値が母数と一致するように調整』できます。これは『家計調査の世帯数が国勢調査の世帯数とずれていたら、補正する』というシンプルな発想。 と の相関が高いほど効果が大きい ─ これが補助変数の威力です。
無回答補正と欠測値処理
実調査では 無回答(non-response) が必ず発生します。回答してくれない人を放置すると 無回答バイアス が生じるため、補正が必須です。
無回答のメカニズム
MCAR(Missing Completely At Random、完全無作為): 回答する確率が観測されたデータに依存しない。最も扱いやすい
MAR(Missing At Random、無作為): 観測されたデータで条件づけたら無作為。多変量補正で扱える
MNAR(Missing Not At Random、無作為でない): 欠測そのものが値に依存(例: 高所得者ほど所得を答えない)。最も困難
無回答補正の方法
- ウエイト調整: 回答者のウエイトを増やして、無回答層をカバー。属性別回答率の逆数を使う
- 単純平均代入: 該当変数の標本平均で欠測を埋める。ばらつきを過小評価する欠点
- 回帰代入: 他の変数からの回帰式で予測値を埋める。MAR 仮定で機能
- 多重代入(Multiple Imputation, MI): 複数の代入セットを作り、推定値を統合。Rubin が提唱した現代的標準
- Hot Deck 法: 似た回答者の値で欠測を埋める。古典的だが頑健
単純代入(平均値で埋めるなど)は『埋めた値が真の値であるかのように扱う』ため、推定値の分散を過小評価します。MI は 複数のもっともらしい代入セット を作り、それらの結果を統合することで『代入による不確実性も含めて分散を計算』できる ─ これが理論的に正しいやり方です。R の `mice` パッケージ・Python の `IterativeImputer` などで実装可能。
労働力調査などの基幹統計では、属性別の回答率を計算 → ウエイト調整 + 事後層別の組み合わせで補正します。総務省は 『標準乗率』(調査で計算するウエイトの基準値) を公表しており、利用者はそれを使うのが標準。最近では 行政データの活用(住民基本台帳・税務データ)で無回答層の属性を補完する研究も進んでいます。
第 3 章 · 公的統計の高度利用
主要基幹統計の調査設計
統計調査士で扱った主要公的統計を、標本設計の観点から精緻に 見直します。
国勢調査(総務省統計局)
- 5 年に 1 回の全数調査(2020・2025・2030...)
- 調査単位: 世帯、調査票: 世帯員ごと + 世帯共通
- 調査区(約 50 世帯のブロック)が一次調査単位。指導員が割り当てられる
- 簡易調査(西暦末尾 5)と 大規模調査(末尾 0)の交互
- 結果: 人口・世帯・年齢・職業・通勤通学・住居・配偶関係
労働力調査(総務省統計局)
- 月次標本調査、約 4 万世帯
- 多段抽出: 全国の調査区を層化 → 抽出 → 各調査区から世帯
- 同一世帯を 2 ヶ月続けて調査 → 1 ヶ月休み → 翌年同月にまた 2 ヶ月(回転標本)
- 結果: 完全失業率・就業率・労働時間・転職
家計調査(総務省統計局)
- 月次標本調査、約 9 千世帯
- 家計簿 に約 6 ヶ月間記入してもらう負担の重い調査
- 結果: 平均消費支出・貯蓄・収入。CPI のウエイト計算にも使用
- サンプルが少ないため都道府県別の結果は精度が低い 課題
経済センサス(総務省・経産省)
- 全産業対象の悉皆調査(全数調査)
- 5 年周期: 基礎調査(企業の概要)+ 活動調査(売上等)
- 事業所・企業のセンサスデータを商工業統計の基礎に
国民経済計算(SNA、内閣府)
- 加工統計: 多数の調査結果を統合して GDP 等を算出
- 3 面等価(生産・分配・支出)が成り立つように調整
- 四半期 GDP は速報・改定値・確報値の 3 段階で公表
ミクロデータと統計的開示制御
統計法 改正(2007) で、研究者が公的統計のミクロデータ(個票)を二次利用できるようになりました。これに伴い 個人情報保護 との両立が重要なテーマになっています。
ミクロデータの提供形式
- オーダーメイド集計: 利用者のニーズに応じた集計表を提供
- 匿名データ: 個人特定リスクを除いた個票データ
- オンサイト利用: 認定された施設(統計センター内)で個票を直接分析
統計的開示制御(SDC)
ミクロデータや集計表を提供する際に、個人や事業所が特定されないよう に施す処理の総称。次のような手法を組み合わせる:
- トップコーディング: 上位の値を集約(例: 年収 1000 万円以上はすべて『1000 万円以上』) - セルの抑制(suppression): 度数 1 か 2 のセルは公表しない - ノイズ加算: 値に小さなノイズを加える - 疑似データ生成: 統計的性質を保ったまま全く新しいデータを生成
k-匿名性と差分プライバシー
- k-匿名性: どの個人もデータ中で k 件以上同じ属性の人がいる こと。最も古典的な保護基準
- l-多様性 / t-近似性: k-匿名性の弱点(機密属性の偏り)を補正
- 差分プライバシー(DP): 個別レコードの有無で出力分布がほぼ変わらない厳密な数学的保証。現代の標準。米国国勢調査も 2020 年から DP を採用
ノイズを多く加える → プライバシー保護が強い → 統計の正確さは下がる。逆に、ノイズを小さくすると統計は正確だが特定リスクが上がる。差分プライバシーはこのトレードオフを 数学的に厳密にコントロール できる枠組みで、近年の公的統計のグローバルスタンダードです。日本の統計法もこの方向に進化しています。
経済学・社会学・公衆衛生の研究者は、統計センターのオンサイト施設(東京・大阪・京大など)で公的統計の個票を分析できます。事前申請 + 守秘義務契約 + 結果の事前審査 という厳格な手続きを経て、政策評価や因果推論研究に活用。EBPM(Evidence-Based Policy Making、エビデンスベースの政策形成)推進の中核技術です。
第 4 章 · 現代統計の地平
ビッグデータと行政データの統計利用
近年、伝統的な標本調査だけでは捉えきれない『新しいデータ源』(ビッグデータ・行政記録)を統計に活用する動きが世界的に進んでいます。
ビッグデータの特徴と限界
- Volume(量): テラバイト・ペタバイト級
- Velocity(速度): リアルタイムストリーム
- Variety(多様性): 構造化 + 非構造化(画像・音声・テキスト)
- Veracity(真実性): 必ずしも代表的サンプルではない
Twitter のつぶやきは Twitter ユーザーだけ のもの、SNS データは そのプラットフォーム使用者だけ のもの。これは『選択バイアス』の典型で、伝統的な標本調査の理論(無作為抽出 → 母集団推定)が そのまま使えない。ビッグデータは『データが大量にある = 全数』という錯覚を生むが、実際には 特定の母集団 を見ているに過ぎないことに注意が必要です。
行政データの統計利用
- マイナンバー制度 の進展で行政記録の統合的利用が進む
- 税務データ(国税庁): 所得分布の正確な情報源
- 社会保険データ: 雇用・給与・健康の情報
- 住民基本台帳: 人口統計の基盤
- 注意点: 行政目的で集められたデータなので、統計目的の代表性が保証されない ことがある
ノルディック諸国の事例
デンマーク・スウェーデン・フィンランドは、個人 ID + 行政データ統合 が高度に進み、伝統的な標本調査を行政データで代替する『レジスター・ベース統計』が進んでいます。日本でも同方向の研究が進められていますが、プライバシー保護とのバランスが鍵です。
国際統計と SDGs 指標
公的統計は 国際比較可能性 が重要な品質要件。国連・OECD・ILO などが共通の概念・分類を整備しています。
主要な国際機関と統計
- 国連統計部(UNSD): 国際統計年鑑・SDGs 指標
- OECD: 経済統計・社会統計の国際比較。Better Life Index も
- IMF: 国際金融統計
- 世界銀行: 開発統計、World Development Indicators
- ILO: 労働統計
- WHO: 保健統計
主要な国際統計分類
- ISIC(International Standard Industrial Classification): 産業分類。日本の JSIC はこれをベース
- ISCO(International Standard Classification of Occupations): 職業分類。日本の JSCO に対応
- HS コード: 貿易統計の品目分類
- SNA(System of National Accounts): 国民経済計算の国際基準。日本は 08SNA を採用
SDGs 指標
持続可能な開発目標(SDGs) は 2015 年に国連で採択、2030 年達成を目指す 17 目標 169 ターゲットの枠組み。各ターゲットに 指標 が定められ、各国がデータ提供する仕組み。日本では総務省統計局が国の SDGs 指標プラットフォームを運用しています。
- Tier I: 確立された方法論・データあり
- Tier II: 方法論はあるがデータが不足
- Tier III: 方法論自体が未確立
Beyond GDP の動き
GDP 単独では Well-being や持続可能性を測れない という問題意識から、Stiglitz-Sen-Fitoussi 委員会(2009)以降、多次元指標(OECD Better Life Index、ブータンの GNH、Human Development Index など)の整備が進む。統計の役割 が経済から社会全般に拡大してきています。
シンクタンクの政策研究 では、伝統的な公的統計 + 行政データ + 民間ビッグデータ + 国際比較を組合せるのが主流。例: スマート農業の経済効果分析では、農業センサス(伝統的)+ 衛星データ(ビッグ)+ JA データ(行政的)を統合。異なる性質のデータを正しく扱える設計力 が、現代の統計家・データサイエンティストに求められる新しいスキルです。
ここまで専門統計調査士の主要範囲を扱いました。標本設計の理論・推定の精緻化・公的統計の高度利用・現代統計の課題 ─ 統計調査士で学んだ『調査の流れ』を、より理論的・精緻に深める内容です。実際の試験ではより具体的な数式・設計表が問われるので、本サイトでの概念地図を踏まえて、問題集 + 過去問 で実戦力を磨いてください。