Textbook

統計調査士教科書

統計調査士は、社会調査の設計・実施と公的統計の知識を問う検定です。「データをどう取るか」「公的統計をどう読むか」 ─ 通常の統計検定が扱う「分析の中身」よりも、その **前段階・周辺領域** を扱います。本教科書は **10 章構成**で、統計法・主要公的統計・標本設計・調査票設計・標本誤差/非標本誤差・回答の認知過程・主要公的統計の各論・人口統計と社会指標・国際統計と SDGs・日本の統計制度史・将来展望まで網羅します。

第 1 章 · 統計法と公的統計
日本の統計制度の基本 ─ 統計法・基幹統計・主な公的統計 ─ を整理します。
- 1.1 統計法と統計の役割
- 1.2 主な公的統計の概要
第 2 章 · 標本調査の設計
母集団から標本をどう選ぶか。無作為抽出・層化抽出・系統抽出など、主要な抽出法を整理します。
- 2.1 標本抽出の基本
- 2.2 調査票の設計
第 3 章 · 調査の実施と分析
調査の実際の実施面、回答率の確保、データ点検、基礎的な集計と分析。
- 3.1 調査の実施と回答誤差
第 4 章 · 標本誤差・非標本誤差・推定の評価
調査結果の精度を評価する 2 種類の誤差。標準誤差・許容誤差・無回答バイアスを実例で押さえる。
第 5 章 · 回答プロセスと非標本誤差の制御
回答者の認知過程(CASM フレームワーク)を起点に、非標本誤差がどこで発生するかを整理し、調査運用での予防策を学びます。
第 6 章 · 主要な公的統計の各論
国勢調査・労働力調査・家計調査・経済センサスを 3 節で詳述。試験頻出領域。
第 7 章 · 人口統計と社会指標
人口動態・少子高齢化・社会指標(教育・医療・犯罪)を 3 節で。
第 8 章 · 国際統計と SDGs 指標
国連・OECD・IMF の主要国際統計、SDGs 指標を 3 節で。
第 9 章 · 公的統計の歴史と日本の制度
日本の統計制度の歴史と、現代の運用体制を 3 節で。
第 10 章 · 統計調査士総まとめと将来展望
9 章の総括、デジタル時代の調査統計の未来、専門統計調査士への接続を 3 節で。

Chapter 1

第 1 章 · 統計法と公的統計

§1.1

統計法と統計の役割

統計調査士の試験で必ず問われるのが、日本の統計制度の根幹である 統計法 に関する知識です。本節では、統計法の基本構造と、公的統計が果たす役割を整理します。

統計法とは

用語 ─ 統計法

公的統計の作成・提供・利用について定めた日本の法律。2007 年に全面改正され、2009 年 4 月施行。「統計の体系的・効率的整備」「統計データの利用促進」などを目的とする。

統計法の改正により、それまで「行政の道具」だった統計が「社会の情報基盤」として位置付け直されました。具体的には、

基幹統計 の指定(国の重要統計の明確化)
統計委員会 の設置(統計行政の中立性確保)
統計データの二次利用 の促進(研究者・民間への開放)
秘密の保護 の強化(回答者個人の特定を厳格に防ぐ)

基幹統計と一般統計

用語 ─ 基幹統計

統計法第 2 条に基づき、政策決定の基礎として特に重要な統計として総務大臣が指定したもの。報告義務・実施義務などが法律で定められている。約 50 の統計が基幹統計に指定されている。

代表的な基幹統計として、国勢統計(国勢調査)・労働力統計(労働力調査)・家計統計(家計調査)・経済構造統計(経済センサス)など。試験では「○○調査は基幹統計か?」という形で問われることがあります。

公的統計の分類

作成主体による分類: 国(府省庁)・地方公共団体・独立行政法人など
作成方法による分類: 調査統計(直接調査して作る)/ 業務統計(業務記録から派生)/ 加工統計(他の統計を組み合わせる)
周期による分類: 月次・四半期・年次・大規模調査(5 年や 10 年に 1 回)

統計の役割

公的統計が果たす役割は大きく 3 つに整理できます。

政策の根拠: 行政が政策を立てるとき、統計データに基づいて意思決定する
社会の現状把握: 人口・経済・労働・物価など、社会の姿を客観的に示す
研究・民間の活用: 学術研究・企業のマーケティング・地域分析の基礎データ

「統計は社会のインフラ」 ─ この視点を持って、各統計の意義を理解していくことが、統計調査士の核心です。

§1.2

主な公的統計の概要

本節では、統計調査士で頻出する主要な公的統計を、調査周期・主な内容・公表する省庁とともに整理します。「○○調査の主な内容は?」「○○統計を扱う省庁は?」が定型的に問われます。

公的統計は『社会の血液検査』

国勢調査・労働力調査・家計調査・消費者物価指数 ─ それぞれが社会の異なる側面を測る『検査項目』です。1 つだけ見ても全体像はわからないし、毎回違う方法で測ると経年比較ができない ─ だからこそ、決まった周期・決まった方法で測り続けることが命です。統計法が「実施機関の独立性・継続性・透明性」を厳しく求めるのは、この『検査の信頼性』を守るため。

国勢調査

概要

作成統計: 国勢統計(基幹統計) 周期: 5 年に 1 回(西暦の末尾が 0・5 の年) 実施主体: 総務省統計局対象: 日本国内に居住するすべての人と世帯 主な内容: 人口・世帯数・年齢・性別・職業・配偶関係・住居など

日本でもっとも基本的な統計。人口統計の出発点で、選挙区割り・地方交付税配分・社会保障の根拠に使われます。直近では 2020 年(令和 2 年)実施、次回は 2025 年。

労働力調査

概要

作成統計: 労働力統計(基幹統計) 周期: 月次 実施主体: 総務省統計局対象: 全国約 4 万世帯(無作為標本) 主な内容: 就業状態・完全失業率・労働時間など

「完全失業率」のニュースの源となる統計。月次で公表されるため、景気判断の重要指標として注目されます。

家計調査

概要

作成統計: 家計統計(基幹統計) 周期: 月次 実施主体: 総務省統計局対象: 全国約 9000 世帯 主な内容: 家計の収入・支出・貯蓄・負債

「家計の平均消費支出」の元となる統計。物価・消費動向の分析や、消費者物価指数のウエート付けに使われます。

経済センサス

概要

作成統計: 経済構造統計(基幹統計) 周期: 5 年に 1 回(基礎調査 = 偶数年、活動調査 = 奇数年) 実施主体: 総務省・経済産業省対象: 日本全国のすべての事業所・企業 主な内容: 事業所数・従業者数・売上高・産業構造

消費者物価指数(CPI)

概要

作成主体: 総務省統計局周期: 月次 主な内容: モノやサービスの価格を全国 167 市町村で月次調査し、基準年(現在は 2020 年)を 100 とした指数として公表

「物価上昇率」の根拠となる代表的指標。「総合」「生鮮食品を除く総合(コア)」「生鮮食品およびエネルギーを除く総合(コアコア)」の 3 種類が公表され、物価動向の分析で使い分けられます。

なぜ『コア』を見るのか

総合 CPI には生鮮食品(天候で大きく変動)やエネルギー(原油価格に左右される)が含まれるため、月ごとに数字が大きくブレます。日銀や経済の専門家が『物価の基調』を判断するときは、このノイズを除いた コア CPI(生鮮食品除く)や コアコア(さらにエネルギー除く)を見るのが定石。「天気・原油という外部要因に振り回されない、本当の物価トレンド」を見ているわけです。

GDP(国内総生産)関連統計

国民経済計算(SNA)は、内閣府が作成する基幹統計。GDP・GNI・経済成長率の元データ。複数の他統計を組み合わせる 加工統計 の代表例です。

覚えるコツ

周期と頻度 : 月次か年次か、5 年に 1 回か
実施主体 : 総務省統計局が多いが、内閣府(GDP)・厚労省(賃金)など分野で違う
標本 vs 全数 : 国勢調査は全数、労働力調査・家計調査は標本
「○○ 統計」と「○○ 調査」: 統計が「結果」、調査が「集める方法」。基幹統計に指定されるのは「統計」のほう

次節以降では、こうした統計を実際に 取る方法(標本抽出・調査設計)に踏み込んでいきます。

Chapter 2

第 2 章 · 標本調査の設計

§2.1

標本抽出の基本

「全員に聞くか、一部だけに聞くか」 ─ 統計調査の最初の選択。それぞれに長所・短所があります。本節では、全数調査と標本調査 の違い、そして 代表的な標本抽出法 4 つ を整理します。

全数調査 vs 標本調査

用語 ─ 全数調査と標本調査

全数調査(census): 母集団のすべてを調べる調査。例: 国勢調査(5 年に 1 度、すべての世帯)。

標本調査(sample survey): 母集団の一部だけを抽出して調べる調査。例: 労働力調査(全国 4 万世帯)、世論調査(1000 人程度)。

全数調査の長所: 偏りがない・すべての小集団を把握できる
全数調査の短所: コスト膨大・回答負担・実施期間が長い
標本調査の長所: コスト・期間が小さい・速報性が高い・誤差を許容して柔軟
標本調査の短所: 標本誤差 が必ず発生・代表性の確保が課題

「適切に選んだ少数」のほうが「むやみに集めた大量」より精度が高くなる ─ これが統計学の興味深いところ。世論調査が 1000 人程度で全国民の傾向を推測できるのは、無作為抽出と統計理論があるからです。

なぜ抽出方法を使い分けるのか

「全員から平等に抽出すれば公平」は理屈としては正しいのですが、実際には『全国民のリストを集めて乱数で 1000 人選び、その全員に直接アクセスする』のはコストが法外です。そこで、層に分けて代表性を保ったり、地理的に集めたり、段階的に絞り込んだりして『精度とコストのバランスを最適化』するのが標本抽出設計の本質。各方法の長所・短所はこの『どこを優先するか』の違いです。

1. 単純無作為抽出

定義 ─ 単純無作為抽出(simple random sampling)

母集団のすべての要素が 同じ確率 で選ばれるように標本を取る方法。乱数表やコンピュータの乱数で抽出。

長所: もっとも理論的にきれい・偏りがない
短所: 母集団全体のリストが必要・地理的に散らばると調査コストが膨大

2. 層化抽出

定義 ─ 層化抽出(stratified sampling)

母集団を性別・年齢・地域などの 属性で層に分け、各層から無作為に抽出する方法。各層内では単純無作為抽出を行う。

長所: 各層の代表性が保証される・推定精度が向上(層内分散が小さいとき特に)
短所: 層分け基準の設計が必要・層のサイズ情報が事前に必要

3. 系統抽出

定義 ─ 系統抽出(systematic sampling)

母集団のリストを並べ、ランダムなスタート位置から $k$ 番目ごと に抽出する方法。例: $1000$ 人から $100$ 人を取るなら、最初の 1〜10 番目から無作為に 1 人選び、その後 10 人おきに抽出。

長所: 実装が簡単・リストだけあれば実行可能
短所: 母集団に 周期性 があると偏る(例: 7 日周期のデータを 7 日おきに取ると曜日が固定)

4. 多段抽出

定義 ─ 多段抽出(multi-stage sampling)

母集団を 階層構造 で捉え、上位の単位を選んでから下位の単位を選ぶ ─ という段階的な抽出。例: 全国 → 都道府県を選択 → 市町村を選択 → 世帯を選択 → 個人を選択。

長所: 移動コスト・調査員配置の効率化・全国調査で実用的
短所: 設計が複雑・分散が単純無作為抽出より大きくなりやすい

標本サイズの決め方

標本誤差は $σ / n$ に比例します。「精度を 2 倍にしたい(誤差半分)」には標本サイズを 4 倍 にする必要がある、という $n$ の関係が成立。実務では「誤差 ±3% 以内」「信頼度 95%」のような目標から逆算して標本サイズを決めます。

代表的な世論調査 $n = 1000$ で誤差 ±3% 程度が出るのも、この $1.96 0.5 \times 0.5/1000 \approx 0.031$ から来ています。

§2.2

調査票の設計

「質問文の作り方ひとつで結果が変わる」 ─ 調査の世界では常識です。本節では、信頼できる調査票を作るための原則を整理します。

質問文設計の 5 原則

原則 1 ─ 中立・公平に書く

避けるべき: 誘導的な表現

× 「多くの人が賛成しているこの政策について、あなたはどう思いますか?」 ○ 「この政策について、あなたはどう思いますか?」

誘導表現(リーディング・クエスチョン)は回答に偏りを生む典型的な失敗。

原則 2 ─ 1 問 1 質問

避けるべき: ダブルバーレル質問

× 「サービスの 品質と価格 に満足していますか?」 ○ 「サービスの品質に満足していますか?」「サービスの価格に満足していますか?」

2 つ以上の論点を 1 問で聞くと、回答者がどちらに答えているか不明になる。

原則 3 ─ 専門用語・あいまい語を避ける

避けるべき: 不明確な言葉

× 「ときどき 運動しますか?」(『ときどき』が人によって違う) ○ 「1 週間に何回 運動しますか?(回数を記入)」

数値で答えられる形に変えると比較しやすい。

原則 4 ─ 回答選択肢は網羅的かつ排他的

選択肢が網羅的(MECE): すべての回答者がいずれかに該当できる(「その他」を入れて担保)

選択肢が排他的: 回答者が複数の選択肢に同時にあてはまらない

× 「30〜40 歳 / 40〜50 歳」(40 歳がどちらに?) ○ 「30〜39 歳 / 40〜49 歳」

原則 5 ─ 回答負担を減らす

質問数は最小限: 必要な情報だけ。長すぎる調査票は回答率を下げる。

敏感な質問は最後に: 年収・宗教・政治信条などのセンシティブな質問は後半へ(離脱を防ぐ)。

専門用語に注釈: 統計用語・業界用語が必要なら、簡潔な説明を併記。

回答形式の選び方

選択式(SA: Single Answer): 1 つだけ選ぶ。集計が容易。
選択式(MA: Multiple Answer): 複数選択可。「あてはまるすべて」
自由記述: テキストで回答。深い洞察が得られるが集計が難しい
評価尺度(リッカート尺度): 「5: とても満足〜 1: とても不満」など 5 段階や 7 段階
数値記入: 年齢・回数など、定量データを直接得たいとき

回答誤差の種類

用語 ─ 回答誤差

標本誤差: 標本調査で必ず発生する、ランダムな揺れ。標本サイズを増やすと縮む。

非標本誤差: 標本調査・全数調査どちらでも起こる誤差。 - 無回答誤差: 回答してくれない人がいることによる偏り - 回答誤差: 嘘の回答・記憶違い・社会的望ましさによる回答の歪み - 入力誤差: データ入力時のミス

非標本誤差は標本サイズを増やしても減りません。質問設計・調査員教育・データ点検によってのみ抑えられる ─ ここが標本誤差との大きな違いです。

標本誤差と非標本誤差の本質的な違い

標本誤差は『運の問題』 ─ たまたま選ばれた標本がどれだけ偏っているか。これは数学的に扱える(平均ゼロ、標準誤差が計算できる)。一方、非標本誤差は『仕組みの問題』 ─ 質問の言い回し・回収率・入力ミスによる 系統的なバイアス。これは数学では消せません。だから、いくら大きな標本(N=10万)を集めても『質問が悪い調査』は信用できない ─ サンプルサイズだけでは品質を保証できないのです。

実務での使い方:Web 調査の落とし穴

ネット調査(Lancers アンケート、Macromill など)はコストが安く即時に大量回収できますが、『回答者がアクティブな Web ユーザーに偏る』という構造的バイアスを抱えています。高齢者・IT 弱者の声は届きにくく、政治意識・購買行動の調査では電話 / 対面調査と結果が乖離することがある。実務では『どの調査方法を選んだか』を必ず明記し、結論の対象を限定する(『ネット調査の対象集団では…』のように)のが誠実です。

事前テスト(プリテスト)の重要性

本調査の前に 少数の対象者(10〜30 人程度) に試行回答してもらう「プリテスト」が必須。「質問の意味が伝わるか」「想定どおりの回答が得られるか」「所要時間は適切か」を事前に確認することで、本調査の失敗を大幅に減らせます。

Chapter 3

第 3 章 · 調査の実施と分析

§3.1

調査の実施と回答誤差

調査票の設計が終わっても、実際の調査実施でつまずくことが多いのが社会調査の難しさ。本節では、調査方法の選び方・回答率を上げる工夫・データの点検 までを整理します。

調査方法の比較

代表的な調査方法

| 方法 | 長所 | 短所 | |---|---|---| | 訪問面接 | 高い回答率・複雑な質問 OK | 高コスト・調査員バイアス | | 郵送調査 | 中程度のコスト・全国対応可 | 低い回収率(20-30% が一般的) | | 電話調査 | 速報性・中程度コスト | 在宅者バイアス・若年層届きにくい | | Web 調査 | 低コスト・速報性・大規模 | デジタル弱者がカバーされない | | オンラインパネル | 即日結果・属性絞り込み | パネル登録者バイアス |

「適した方法は調査目的による」 が大原則。年齢を問わない代表性が必要なら訪問・郵送、若年層中心なら Web、速報性重視なら電話、というように使い分けます。

回答率を上げる工夫

調査の意義を明示: 何のための調査か、結果がどう使われるかを冒頭で説明
回答負担を最小化: 質問数を絞る・短時間で答えられる設計
個人情報保護を保証: 「回答は統計的にしか使わない」「個人を特定しない」を明記
督促状を送る: 郵送調査では未回答者に 1〜2 回の督促が効果的
インセンティブ: 図書カードや QUO カードなどの謝礼(ただし回答の質に影響することも)

標本誤差と非標本誤差(復習)

用語 ─ 2 種類の誤差

標本誤差(sampling error): 標本調査特有の、ランダムな揺れ。 $n$ を増やせば縮む。

非標本誤差(non-sampling error): 全数・標本どちらでも起こる、設計や実施に由来する誤差。 $n$ を増やしても減らない。

無回答誤差: 回答してくれない層の特性が回答者と異なるとき(例: 多忙な層が抜ける)
回答誤差: 嘘の回答(社会的に望ましい方向への歪み)、記憶誤り、思い込み
入力誤差: 紙からデータベースへの入力ミス、マークシートの読み取り誤差
カバレッジ誤差: そもそも母集団のリストから漏れている人(電話帳調査で携帯のみの人が抜ける、など)

データクリーニングと点検

回答データを集めた後、そのまま分析するのは危険。必ず以下のチェックを行います。

論理チェック: 「年齢 200 歳」「性別が男性なのに妊娠経験あり」のような矛盾の検出
範囲チェック: 数値が想定範囲を超えていないか
欠損値の処理: 無回答が多い変数は分析から除外、もしくは補完(平均代入・多重代入)
外れ値の検出: 異常に大きい/小さい値は記入ミスかも
重複回答の削除: 同一回答者が複数回答していないか

結果の公表と倫理

公的統計では、個人を特定できる形での公表は厳禁。少数派(例: ある町の特定職業の女性 1 人だけ)が特定されないよう、セルの度数が小さいクロス集計は秘匿(セルを「-」表示)します。これを 統計的開示制御(SDC) といいます。

また、調査回答者には「結果がどこで公表されるか」を事前に明示するのが倫理的義務。これらを守ることで、回答者の信頼を維持し、次回以降の調査も成立する ─ という長期的な視点が、調査の世界では特に重要です。

Chapter 4

第 4 章 · 標本誤差・非標本誤差・推定の評価

§4.1

標本誤差と非標本誤差

調査結果には 必ず誤差 が含まれます。発生源は大きく 2 つで、対処法も異なります。

標本誤差(Sampling Error)

標本を取ったことによる偶然の誤差

全数調査ではなく 一部だけ抽出 して推定するため、たまたま選ばれた標本によって結果がブレる。

特徴: - 標本サイズ $n$ を増やせば縮小する( $1/ n$ で減少) - 統計理論で 数式的に評価可能(信頼区間として表現) - 公的統計では『標準誤差率』で精度を表示

非標本誤差(Non-sampling Error)

標本抽出以外で生じる系統誤差

特徴: - 標本サイズを増やしても解消しない(むしろ大標本では深刻化) - 数式的に評価しづらく、設計と実施の質 で防ぐしかない

主な発生源: - カバレッジ誤差: 母集団の一部が枠から漏れる(高齢者で固定電話のみ調査) - 無回答誤差: 回答しない人と回答する人で性質が違う - 測定誤差: 質問の聞き方・選択肢の並び順による回答歪み - 処理誤差: 入力ミス・コーディングミス

💡 大標本の落とし穴

「100 万人にアンケート取ったから精度が高い」は半分嘘。標本誤差は確かに小さいが、選挙予測の Literary Digest 事件(1936) のように、枠の偏り(郵便局名簿で富裕層中心) が原因の 非標本誤差 で大外しした例がある。サイズより 代表性 が重要。

§4.2

標準誤差と許容誤差からのサンプル設計

「○○ 万人を調べる」と決める前に、どれくらいの精度が必要か を逆算します。

標本平均の標準誤差

SE (\overset{x}{ˉ}) = \frac{σ}{n}

$n$ が 4 倍になると標準誤差は半分。逆に 誤差を半分にするには標本を 4 倍 必要。

比率の標準誤差(支持率調査などで頻出)

SE (\overset{p}{^}) = \frac{p ( 1 - p )}{n}

$p = 0.5$ のとき最大値を取り、95% 信頼区間の幅は 約 ±1.96 × SE。

必要サンプル数の見積もり

母比率の許容誤差から逆算

許容誤差 $E$ で 95% 信頼区間を作るのに必要な $n$ は:

$n = (\frac{z _{0.025}}{E})^{2} \cdot p (1 - p)$

例: 許容誤差 ±3% で支持率を測りたい(最悪ケース $p = 0.5$ ):

$n = (1.96/0.03)^{2} \cdot 0.25 \approx 1, 067$

目安: 支持率調査の標準は $n = 1, 000$ 〜 $2, 000$ 。新聞社の世論調査もこの規模。

🛠 公的統計での標準誤差率

国勢調査・労働力調査などの公表結果には 標準誤差率(=SE / 推定値) が併記される。市町村別で標準誤差率が大きい(精度が低い)場合、注釈付きで利用注意を促すのが慣行。

§4.3

無回答バイアスとウェイト調整

回収率が低い調査では、回答者と無回答者の性質が異なる ことで結果が歪みます。これが 無回答バイアス。

なぜ問題か ─ 選挙予測の例

若年層の回収率が低い → 平均回答者の年齢が高めに偏る → 高齢者支持の高い候補が有利に予測される、という典型的なズレが生じる。回収率の偏りはサイズで補えない。

対策 ─ ウェイト調整(事後層化)

母集団分布に合わせて重み付け

事後層化(post-stratification): 回答者の属性分布を、国勢調査などの 既知の母集団分布 に揃えるよう各回答者にウェイトを付けて集計。

例: 母集団で 20代が 15%、回答者で 8% → 20代回答者のウェイトを 15/8 = 1.875 に。

前提: 同じ属性内では回答者と無回答者の意見が同じ(MAR 仮定)

他の対策

訪問・電話・郵送・Web の組み合わせ(マルチモード)で回収率を上げる
フォローアップ: 一度無回答だった人に再依頼
短い質問票: 設問数を最小化して回答負担を下げる
プライバシー保証の明記: 回答してもらいやすくする
インセンティブ: 商品券・ポイント付与

💡 回収率の目安

70% 以上 = 良好、50-70% = 許容、50% 未満 = 慎重に解釈 が伝統的目安。ただし最近は Web 調査で 30% を切ることも多く、絶対値より 回収率の偏りを把握できているか が重視される。

推定の評価軸 ─ 不偏性・効率性

不偏性(Unbiasedness): 推定値の期待値が真値と一致
効率性(Efficiency): 分散が小さい(より正確)
一致性(Consistency): $n \to \infty$ で真値に収束

標準誤差は 同じ調査を何度も繰り返した場合の標本平均のばらつき という解釈で、信頼区間の幅 に直結します。調査の質を語るときの共通言語として押さえておきましょう。

Chapter 5

第 5 章 · 回答プロセスと非標本誤差の制御

§5.1

回答の認知過程 ─ CASM フレームワーク

調査票の質問は『読めば答えが返ってくる』ものではありません。回答者の頭の中では複数の認知ステップが走っており、どこかで失敗すれば回答が歪みます。これを整理した枠組みが CASM(Cognitive Aspects of Survey Methodology) です。

Tourangeau の 4 段階モデル

用語 ─ 回答プロセスの 4 段階

1. 質問の理解(Comprehension): 質問文と語句の意味を解釈する

2. 関連情報の検索(Retrieval): 記憶から関連する事実・経験を引き出す

3. 判断の形成(Judgment): 取り出した情報を統合・整理し、回答の素案を作る

4. 回答の表出(Response): 用意された選択肢にマッピング、または社会的体裁を考えて調整して答える

なぜ『質問が分かりにくい』では済まないか

回答誤差は『質問が悪い』だけが原因ではない。たとえば『過去 1 年に外食した回数』は理解できても、正確な記憶を 1 件ずつ取り出す(Retrieval)のが難しい ─ だから多くの人が『だいたいの頻度』で代用する(ヒューリスティック)。CASM の発想は『どの段階で誤差が混入するかを設計時に予測し、その段階に対して対策する』こと。質問文だけ磨いても限界がある、という気づきの枠組みです。

段階別の誤差要因

理解段階: 専門用語・否定形・二重質問(double-barreled)・あいまいな修飾
検索段階: 時間幅(『過去 6 ヶ月』vs『最近』)・頻度の正確な記憶・テレスコーピング(時期の誤認)
判断段階: 集計のヒューリスティック(数を数える vs 平均を出す)・過去の感情に引きずられる
表出段階: 選択肢の有無・社会的望ましさ(social desirability)・容認バイアス(yea-saying)

実務での認知インタビュー

Cognitive Interview: 試験的に少数の対象者に調査票を答えてもらい、思考発話法(『今、何を考えてその答えを選んだか』)で各認知段階の躓きを抽出する手法。本調査の前に必ずパイロット段階で実施するのが世界の調査機関の標準。総務省統計局・国勢調査でも採用されている手法です。

§5.2

非標本誤差の分類と発生機序

非標本誤差(non-sampling error) は、標本誤差以外のすべての誤差で、その大きさが標本誤差を上回ることも珍しくありません。発生機序ごとに分類し、対策を組み立てます。

主要な 4 種類

用語 ─ 非標本誤差の分類

1. カバレッジ誤差(coverage error): 標本フレーム(調査台帳)が母集団を正しく反映していない誤差。例: 固定電話のみのフレームで若年層が漏れる

2. 無回答誤差(non-response error): 一部の対象が回答しないことから生じる偏り。回答者と非回答者で属性が違うと深刻

3. 測定誤差(measurement error): 質問・回答プロセスのどこかで真の値とズレる誤差。CASM の 4 段階すべてで発生し得る

4. 処理誤差(processing error): コーディング・データ入力・集計・編集の段階で生じる誤差

標本誤差 vs 非標本誤差 ─ どちらが重いか

標本サイズを増やせば標本誤差は $1/ n$ で減りますが、非標本誤差は減らない。たとえば 10 万人調査でも、無回答が偏れば 1 万人調査より結果が歪むことがあります。ビッグデータの時代に『大きいから正確』が必ずしも成り立たないのはこの理由 ─ 大規模になっても非標本誤差(特に選択バイアス)は残る。だから現代の調査統計では『精度』(標本誤差)と『正確性』(非標本誤差)を分けて議論します。

カバレッジ誤差の事例

1936 年米大統領選 Literary Digest 誌: 電話帳・自動車登録名簿で 1000 万人調査 → ランドン勝利予想。実際はルーズベルト大勝。当時の電話・車所有者は富裕層に偏っていた(歴史的なカバレッジ誤差の事例)
RDD(Random Digit Dialing): 固定電話のみ → 携帯のみの世帯が漏れる
Web 調査: ネット利用者しか取れない(高齢層・低所得層が漏れがち)
住民基本台帳: 寮生・施設入居者・短期居住者の捕捉が難しい

測定誤差の代表的形態

社会的望ましさバイアス: 飲酒量・運動量・収入を実際より良く / 悪く答える
マッチング・パターン回答: 連続する質問にすべて『3』『はい』と答える(注意散漫)
順序効果(order effect): 同じ選択肢でも提示順で回答分布が変わる
仮想バイアス(hypothetical bias): 『○○なら買いますか』という想定質問で実際以上に肯定する
プライミング: 直前の質問内容が後続回答に影響する(政治・経済質問では特に注意)

§5.3

誤差を抑える実務テクニック

ここまで非標本誤差の整理をしてきました。本節では 実務で使える誤差抑制テクニック を、調査票設計・実査・後処理の 3 段階で整理します。

調査票設計の鉄則

ダブルバーレル質問は禁止: 『製品の 品質と価格 に満足ですか』 → 質を分割
時間幅は具体的に: 『最近』ではなく『過去 7 日間』『先月』のように
ヒント・例示を統一: 一部の選択肢にだけ例示を付けると注目度が偏る
否定形・二重否定を避ける: 『○○すべきでないとは思わない』は誤読の温床
スケールは 5 件法 or 7 件法: 『どちらでもない』を含むかは設問の目的に応じて
敏感な質問は調査の後半に: ラポール(信頼関係)が築かれてから収入・健康・違反等を聞く

実査時のオペレーション設計

Pretest / Pilot: 本調査の 1〜2% 規模でパイロット → 認知インタビューで質問の解釈を検証
インタビュアー訓練: 訓練マニュアル・標準応答スクリプトで聞き方のばらつきを抑制
督促・複数モード: 訪問・郵送・電話・Web のミックスで非回答を減らす(混合モード調査)
Incentive(謝礼): 事前 vs 事後・現金 vs ポイントで回答率の差。少額でも事前現金が最も効果的という多数の検証結果
応答理由の追跡: 拒否・不在・住所不明を区別して記録 → ウェイト調整に使う

後処理 ─ 編集・代入・ウェイト

用語 ─ エディットと代入

エディット(editing): 論理的におかしい回答(年齢 200 歳など)・必須項目の欠損を、ルールベースまたは統計的に修正・補完する作業。総務省・各省統計局では膨大なルール体系を整備。

代入(imputation): 欠測値を別の値で埋める処理。平均値代入(単純)・ホットデック法(類似ケース複製)・回帰代入・多重代入(MI) の順で精度向上。

用語 ─ ウェイト調整

事後層化(post-stratification): 取得した標本を年齢×性別等で集計し、母集団の構成比に合わせる重み付け。Web 調査の偏りを矯正する標準手法。

レイキング(raking): 複数の補助変数(年齢・性別・地域・所得)を反復で同時調整。事後層化の多次元版。

Propensity Score 重み付け: 回答者と非回答者で観察可能な属性から応答確率を推定し、その逆数で重み付け。

ウェイト調整の限界

事後ウェイトは『観察できる属性のずれ』しか補正できません。回答者と非回答者で 観察できない属性(意識・行動)が違えば、いくら年齢・性別を合わせても 無回答バイアス は残ります。だからウェイト調整は最後の砦であって、最初の防波堤は『回答率を上げる調査設計』 ─ 統計調査士はこの順序を理解していることが問われます。

総合的な品質指標(TSE)

現代の公的統計では Total Survey Error(TSE) という枠組みで、標本誤差 + すべての非標本誤差を 総合的な MSE(平均二乗誤差) として評価します。Eurostat・米センサス局が標準化を進めており、日本でも導入が進んでいます。精度を 2 倍にする予算をどこに投じるか(標本サイズ拡大 vs 督促強化 vs 認知インタビュー実施)を、TSE の感度分析で意思決定する ─ それが現代の調査統計家のスキルです。

ここまで 5 章で統計調査士の主要範囲を扱いました。続く 6-10 章では 主要公的統計の各論・人口/経済/社会の指標・国際統計・歴史と将来展望 で、知識を一段深めます。

Chapter 6

第 6 章 · 主要な公的統計の各論

§6.1

国勢調査

国勢調査 は日本最大の統計調査。5 年に 1 度、すべての世帯を対象に行う 全数調査 で、すべての公的統計の基礎データになっています。

歴史と特徴

1920 年(大正 9 年) が第 1 回 ─ 100 年以上の歴史
5 年に 1 度(西暦末尾 0 と 5 の年)
全数調査: 全ての世帯と人を対象
質問項目: 氏名・年齢・住所・職業・通勤先・住居形態など
法的根拠: 統計法に基づく 基幹統計(回答義務あり)

活用される場面

人口推計: 5 年間の年次値の母集団
選挙区画定: 衆議院小選挙区の定数配分
地方交付税: 自治体への交付金算定
少子化・高齢化分析: 人口動態の把握
マーケ調査: 民間の市場分析の母集団

実施上の課題

回答率低下と Web 調査化

回答率が 2000 年は 99%、2020 年は約 80% まで低下。世帯主の高齢化・単身世帯の増加・プライバシー意識の高まり が背景。Web 回答 や 調査員の戸別訪問減少 などで対応中。2025 年(令和 7 年)国勢調査 では Web 回答比率が大幅向上の見通しです。

§6.2

労働力調査と家計調査

月次で発表 される代表的な経済統計。失業率・消費者物価などのニュース統計の元データ。

労働力調査

用語 ─ 労働力調査

総務省実施・月次の標本調査。約 4 万世帯・10 万人を対象。

主要指標: - 完全失業率 = 完全失業者 / 労働力人口 - 有効求人倍率(厚労省・別調査だがセットで報じられる) - 就業率 = 就業者 / 15 歳以上人口

ILO 基準 に従う国際比較可能な調査。

家計調査

用語 ─ 家計調査

総務省実施・月次。約 8000 世帯から 家計簿(6 ヶ月)を提出してもらう調査。

主要用途: - 消費者物価指数(CPI) のウェイト算定 - GDP の家計消費 の基礎データ - エンゲル係数(食費 / 消費支出)などの社会指標 - マクロ経済政策(消費刺激策の評価)

両調査の限界

回答負担: 家計簿は半年間 → 中流以上世帯に偏る傾向
標本サイズ: 月次変動の標本誤差は数パーセント
労働力調査: 短期の不安定就業を捕捉しにくい
家計調査: 高所得層は申告精度に課題
近年は POS データ や クレカ明細 とのハイブリッドが研究中

§6.3

経済センサスと業種別統計

事業所・企業のデータ を網羅する 経済センサス。GDP の生産側計算の基礎です。

経済センサス

用語 ─ 経済センサス

経済センサス活動調査: 5 年に 1 度・全事業所対象。民間 + 国・地方公共団体 の事業所をすべて把握。

経済センサス基礎調査: 5 年に 1 度・経済構造の把握。両者を併用して切れ目なく経済構造を観測。

業種別統計の主要なもの

鉱工業生産指数(IIP)(経産省): 製造業の生産動向。月次・季調済発表
サービス産業動向調査: 第 3 次産業の動向
法人企業統計(財務省): 上場・非上場法人の財務状況
毎月勤労統計調査(厚労省): 賃金・労働時間
商業動態統計: 小売・卸売の月次動向

GDP と SNA

国民経済計算(SNA, System of National Accounts) は GDP を含む経済全体の体系。産出側・支出側・分配側 の 3 面から計算し、整合性を担保。日本は 2008SNA を採用、内閣府が四半期ごとに発表。

Chapter 7

第 7 章 · 人口統計と社会指標

§7.1

人口動態と将来推計

人口動態 は社会のあらゆる予測の基盤。出生・死亡・婚姻・離婚を継続的に観測します。

主要な人口動態指標

用語 ─ 人口統計の指標

合計特殊出生率(TFR): 1 人の女性が生涯に産む子どもの数の推定値

粗死亡率: 人口 1000 人あたりの死亡数

生命表: 各年齢の生存確率を表にしたもの。平均寿命 = 0 歳の生命表からの平均余命

老年人口比率: 65 歳以上 / 総人口 × 100

従属人口指数: (年少 + 老年人口) / 生産年齢人口

将来推計人口

国立社会保障・人口問題研究所(社人研) が 5 年に 1 度発表する 日本の将来推計人口。コーホート要因法(出生・死亡・移動を年齢別に積み上げ)で、50 年先まで推計。日本の 2056 年に総人口 1 億人を割る など重要な政策議論の基礎。

人口推計の不確実性

人口推計は 将来の出生率 に大きく依存し、シナリオ別(高位・中位・低位)で発表されます。実際は中位推計より低い ことが続いており、近年さらに保守的な値で更新されています。

§7.2

教育・医療・社会指標

教育・医療・福祉 の各分野で、政策立案の基礎となる統計が整備されています。

教育統計

学校基本調査(文科省): 在籍者数・卒業後の進路
全国学力・学習状況調査: 小 6・中 3 の学力水準
国際調査: PISA(OECD)・TIMSS(国際数学・理科)
進学率・大学進学率: 進路選択の動向

医療・健康統計

患者調査(厚労省): 医療機関を受診した患者の状況
国民健康・栄養調査: 食習慣・生活習慣・健康状態
人口動態統計: 死因別死亡数
医療経済実態調査: 医療費の動向

社会指標

犯罪統計(警察庁): 刑法犯認知件数・検挙率
社会保障費: 国民負担率の指標
自殺統計: 厚労省・警察庁の合成指標
Better Life Index(OECD): 生活の質の多次元評価

§7.3

ジニ係数と所得分布

所得格差 の代表的指標 ジニ係数。社会の不平等度を 0(完全平等)〜 1(完全不平等)で表現。

ローレンツ曲線とジニ係数

公式 ─ ジニ係数

ローレンツ曲線: 累積世帯比率(横軸)vs 累積所得比率(縦軸)。完全平等なら 45° 直線。

ジニ係数 = ローレンツ曲線と 45° 直線で囲まれた面積 × 2。

$G = 1 - 2 \int_{0}^{1} L (x) d x$

日本は約 0.33-0.38(税引き前)、0.27-0.31(税引き後)。

他の格差指標

Theil 指数: 情報理論的な不平等度。集団分解可能
Atkinson 指数: 社会厚生関数に基づく
Palma 比: 上位 10% / 下位 40% の所得比
5 分位倍率: 第 5 五分位 / 第 1 五分位
相対的貧困率: 中央値の半分未満の人の割合

💡 ピケティと所得格差

Thomas Piketty『21 世紀の資本』(2013)は、長期的な所得 / 富の格差データを国際比較し、現代資本主義の問題を提起した世紀の名著。彼の WID.world で世界の格差データが無料公開され、社会統計学の最大の公共データプロジェクトの 1 つ。

Chapter 8

第 8 章 · 国際統計と SDGs 指標

§8.1

主要国際機関と統計

国際比較可能性 は公的統計の重要な品質要件。各国際機関がそれを担保するための調整役を果たしています。

主要機関

国連統計部(UNSD): 国際統計年鑑・SDGs 指標
OECD: 経済・社会・教育・環境の国際比較
IMF: 国際金融統計・経済見通し(WEO)
世界銀行: 開発統計(World Development Indicators)
ILO: 労働統計・雇用
WHO: 保健・医療統計
UNESCO: 教育・文化統計

国際統計分類

ISIC(産業分類): 日本の JSIC がベース
ISCO(職業分類): 日本の JSCO に対応
HS コード(関税協力理事会): 貿易統計の品目分類
SNA(国民経済計算): 日本は 2008SNA を採用
ICD(国際疾病分類): 死因・診断コード

§8.2

SDGs 指標と Beyond GDP

持続可能な開発目標(SDGs) は 2015 年国連採択、2030 年達成 を目指す 17 目標 169 ターゲット。各ターゲットに指標が定められ、各国がデータ提供する仕組みです。

SDGs 指標の階層

用語 ─ Tier 分類

Tier I: 確立された方法論・データあり

Tier II: 方法論はあるがデータが不足

Tier III: 方法論自体が未確立

2024 年現在、約 230 指標のうち Tier I が約 65%、II が 25%、III が 10%。

Beyond GDP の動き

GDP の限界を超える

GDP は経済規模を測るが、幸福度・環境負荷・格差 は捉えられない。Stiglitz-Sen-Fitoussi 委員会(2009)以降、OECD Better Life Index・ブータンの GNH(Gross National Happiness)・HDI(Human Development Index) など、多次元指標の整備が世界的に進む。

日本の SDGs 取組

SDGs アクションプラン: 政府の年次計画
SDGs 達成度: 国連の指標で日本は中位
自治体 SDGs: 内閣府による SDGs 未来都市 認定
企業の SDGs: ESG 投資・統合報告書

§8.3

国際比較における注意点

国際比較は『同じ概念で測っている』前提が必須。だが実際には微妙なズレがあるため、解釈には注意が必要です。

比較を歪める要因

定義の違い: 失業率・貧困率の定義が国で違う
統計品質: 開発途上国は標本誤差・カバレッジ問題が大きい
為替変動: ドル換算で順位が動く(購買力平価 PPP で補正可)
カバレッジ: 地下経済の取り扱いが国で違う
改定頻度: GDP 改定タイミングがズレると比較が難しい

PPP(購買力平価)

用語 ─ Purchasing Power Parity

為替レートではなく、国内の物価水準を考慮した換算 で経済規模を比較。世界銀行 ICP(International Comparison Program) が推進。米ドル換算 GDP と PPP 換算 GDP で国際順位が大きく違うことがあります。

World Bank Open Data

世界銀行のオープンデータ(data.worldbank.org)は、国際比較データの宝庫。1400+ 指標 × 200+ 国 × 50+ 年が無料公開。Python の `wbdata` ライブラリで API アクセス可能。統計家の必須ブックマーク。

Chapter 9

第 9 章 · 公的統計の歴史と日本の制度

§9.1

明治から現代までの日本統計史

日本の 公的統計 の歴史は、明治政府が 近代国家建設 のために統計制度を整備したことに始まります。

明治時代の統計整備

1871 年: 太政官正院に統計司設置
1881 年: 統計院設立(初代院長:大隈重信)
1885 年: 内閣統計局へ
杉亨二(日本統計の父): ベルギー留学・統計教育
1872-73 年: 戸籍制度開始 → 人口統計の基盤

戦後の制度整備

1947 年: 統計法制定
1947 年: 経済安定本部に統計局
1950 年: 第 1 回国勢調査(戦後)
2007 年: 統計法全面改正(54 年ぶり)
2018 年: 厚労省毎月勤労統計問題 → 信頼性回復策

統計史を知るメリット

統計の整備史 = 国家の近代化史。日本の高度経済成長期(1950s-70s)に統計制度が成熟したのは偶然ではなく、データに基づく政策運営の必要性から。歴史的視点をもつと、現代の議論も深く理解できます。

§9.2

現代日本の統計組織

分散型統計組織 が日本の特徴。各府省が分担して統計を整備します。

主要府省と担当統計

総務省統計局: 国勢調査・労働力調査・家計調査
内閣府: 国民経済計算(GDP)・景気動向指数
経済産業省: 鉱工業生産指数・商業動態
財務省: 貿易統計・法人企業統計
厚生労働省: 毎月勤労統計・人口動態統計
農林水産省: 農業センサス・生産統計
国土交通省: 建築着工統計
警察庁: 犯罪統計・交通統計

統計委員会と統計法

統計委員会(内閣府)が 基幹統計の品質管理・統計制度の中央調整 を担う。統計法(2007 改正)では、基幹統計(56 種)・一般統計 の区分、回答義務、結果公表のルールが定められています。

統計法の主要条文

第 13 条: 基幹統計調査への報告義務
第 33 条: オーダーメード集計
第 33 条の 2: 個別調査票情報の提供
第 35 条: 匿名データの作成と提供
第 41-43 条: 罰則(虚偽報告・調査妨害)

§9.3

統計の信頼性と最近の事件

公的統計の 信頼性 は政策の信頼性の基盤。最近の事件と教訓を整理します。

毎月勤労統計問題(2018)

厚労省 毎月勤労統計 で 2004 年から不適切な抽出方法(東京都 500 人以上事業所を全数 → 一部抽出に変更)が長年続き、雇用保険・労災保険などの給付に影響。8 兆円規模の給付 が再計算対象に。統計委員会の機能強化 へつながりました。

信頼性向上策

統計検査: 第三者による定期検査
統計士・専門統計調査士: 専門人材の認定
EBPM(Evidence Based Policy Making): 政策評価へのデータ活用
オープンデータ化: e-Stat での網羅的公開
プロセス透明化: 調査設計から公表までを文書化

公的統計の現代的課題

回答率低下: 国勢調査・標本調査全般で
コスト増: 訪問調査の維持が困難に
ビッグデータ統合: POS データ・行政データの活用
プライバシー: 個人特定リスクと有用性のバランス
国際比較性: 各国規格との整合維持

Chapter 10

第 10 章 · 統計調査士総まとめと将来展望

§10.1

9 章の総まとめ

統計調査士教科書 9 章を歩き終えました。社会調査の理論と実践、公的統計の制度と運用 ─ 試験範囲を超えて、統計家としての社会的役割 までを学びました。

9 章の地図

Ch1 統計法と公的統計
Ch2 標本調査の設計
Ch3 調査の実施と分析
Ch4 標本誤差・非標本誤差・推定の評価
Ch5 回答プロセスと非標本誤差の制御
Ch6 主要な公的統計の各論
Ch7 人口統計と社会指標
Ch8 国際統計と SDGs
Ch9 公的統計の歴史と日本の制度

§10.2

デジタル時代の調査統計

公的統計の現場は、デジタル化・行政データ活用・AI 統合 で大きく変化中。

Web 調査・モバイル調査の進化

国勢調査の Web 回答化(2020 年で約 4 割、2025 年でさらに拡大予定)
スマホアプリ調査: 位置情報・行動ログを併用
ハイブリッドモード: 訪問・郵送・Web の混合
Web パネル調査: 民間で発達、公的統計でも実験的活用
AI チャットボット調査: 対話的回答取得

行政データの統計利用

マイナンバー制度 で行政データの統合活用が進展。税務データ・社会保険・住民基本台帳 を統計的に利用する『レジスター・ベース統計』が、ノルディック諸国を参考に研究中。プライバシー保護とのバランス が制度設計の鍵。

AI と公的統計

自動コーディング: 産業・職業分類を AI で自動付与
外れ値検出: 異常な回答を AI が検知
多重代入: 欠測値補完に機械学習を活用
Synthetic Data: 統計的特性を保つ合成データの提供
LLM: 統計報告書の自動要約・自然言語クエリ

§10.3

次のステップ

統計調査士の次のステップは多様です。

進路 A: 専門統計調査士

専門統計調査士 は統計調査士の上位資格で、標本設計の理論・推定の精緻化 を扱います。本サイトでは [専門統計調査士教科書](/certs/survey-specialist/textbook) を 10 章で用意しています。

進路 B: 公務員 / 統計関係職

国家公務員: 総務省統計局・各府省の統計部門
地方公務員: 各都道府県・市町村の統計担当
統計センター: 集計・分析業務
民間調査会社: 公的統計の請負

進路 C: 学術研究

社会学: 社会調査・量的研究
経済学: マクロ経済・労働経済
人口学: 人口動態・少子化研究
公衆衛生: 疫学調査・健康行動

💡 統計調査士は『社会の鏡を磨く仕事』

統計調査士の仕事は 社会の現実を数字に正確に翻訳する こと。政策の質、民主主義の質、企業活動の質 が、調査統計の質に依存します。とても価値のある専門職です。

統計調査士合格、おめでとうございます。ぜひ次のステップで、より深い社会統計の世界へお進みください。

目次

統計法とは

基幹統計と一般統計

公的統計の分類

統計の役割

国勢調査

労働力調査

家計調査

経済センサス

消費者物価指数(CPI)

GDP(国内総生産)関連統計

覚えるコツ

全数調査 vs 標本調査

1. 単純無作為抽出

2. 層化抽出

3. 系統抽出

4. 多段抽出

標本サイズの決め方

質問文設計の 5 原則

回答形式の選び方

回答誤差の種類

事前テスト(プリテスト)の重要性

調査方法の比較

回答率を上げる工夫

標本誤差と非標本誤差(復習)

データクリーニングと点検

結果の公表と倫理

標本誤差(Sampling Error)

非標本誤差(Non-sampling Error)

標本平均の標準誤差

比率の標準誤差(支持率調査などで頻出)

必要サンプル数の見積もり

なぜ問題か ─ 選挙予測の例

対策 ─ ウェイト調整(事後層化)

他の対策

推定の評価軸 ─ 不偏性・効率性

Tourangeau の 4 段階モデル

段階別の誤差要因

主要な 4 種類

カバレッジ誤差の事例

測定誤差の代表的形態

調査票設計の鉄則

実査時のオペレーション設計

後処理 ─ 編集・代入・ウェイト

総合的な品質指標(TSE)

歴史と特徴

活用される場面

実施上の課題

労働力調査

家計調査

両調査の限界

経済センサス

業種別統計の主要なもの

GDP と SNA

主要な人口動態指標

将来推計人口

教育統計

医療・健康統計

社会指標

ローレンツ曲線とジニ係数

他の格差指標

主要機関

国際統計分類

SDGs 指標の階層

Beyond GDP の動き

日本の SDGs 取組

比較を歪める要因

PPP(購買力平価)

World Bank Open Data

明治時代の統計整備

戦後の制度整備

主要府省と担当統計

統計委員会と統計法

統計法の主要条文

毎月勤労統計問題(2018)

信頼性向上策

公的統計の現代的課題

9 章の地図

Web 調査・モバイル調査の進化

行政データの統計利用