本文へスキップ
統計ロードマップ
Textbook

3級 教科書

3級は大学基礎レベル。4級で学んだデータの整理に、分散・標準偏差・確率分布・推定の考え方を加えていきます。「データのばらつきを数式で扱う」「ランダムさを確率で表現する」という、統計学の本格的な道具立てを身につける段階です。本書は **10 章構成**で、記述統計・確率分布・推定・仮説検定・t 分布と小標本推定・2 群比較・相関と単回帰・実生活データへの応用・2 級への橋渡しまで網羅します。

  • 10
  • 27
  • ⏱ 約 58
  • 28,873

目次

  1. 1 章 · 記述統計 ─ データを数値で要約する
    標本平均・分散・標準偏差を式で扱い、共分散と相関係数で 2 変数データの関係も読み取れるようになります。
  2. 2 章 · 確率と確率変数
    サイコロや袋から玉を取り出すような身近な試行を起点に、条件付き確率・独立性・期待値といった概念に進みます。
  3. 3 章 · 確率分布
    二項分布と正規分布という、3 級の山場となる 2 つの分布を扱います。
  4. 4 章 · 推定の入口
    標本から母集団の特徴を推し量る、推定の基本的な考え方に触れます。
  5. 5 章 · 仮説検定の基礎
    推定の延長として、仮説を立ててデータで判定する『仮説検定』の枠組みを学びます。母平均の z 検定、母比率の検定、カイ二乗の適合度検定までを扱います。
  6. 6 章 · t 分布と小標本推定
    母分散が未知の場合の推定。t 分布の登場と、それを使った母平均の信頼区間・検定を 3 節で。
  7. 7 章 · 2 群の比較
    2 つのグループの平均を比較する代表的な手法。等分散・対応・Welch の使い分けを 3 節で。
  8. 8 章 · 相関と単回帰分析
    2 変数の関係を数式で表現する。相関係数の検定と単回帰の基本を 3 節で。
  9. 9 章 · 実生活データへの応用
    ここまでの理論を実データで応用する練習。教育・健康・経済データの読み解きを 3 節で。
  10. 10 章 · 3 級総まとめと 2 級への橋渡し
    3 級教科書 9 章の総括、よく使う公式の早見、2 級で広がる新世界の予告。
Chapter 1

1 章 · 記述統計 ─ データを数値で要約する


§1.1

標本平均と分散・標準偏差

4 級では「平均」と「ばらつき(範囲・四分位範囲)」を扱いました。3 級ではばらつきを、もう一段だけ精密に扱う言葉 ─ 分散と標準偏差 ─ を学びます。これらは推定や検定など、統計学のあらゆる場面で土台となる量です。

標本平均

定義 ─ 標本平均

個のデータ に対し、 を標本平均という。総和の記号 は「足し合わせる」の略記。

は「」を短く書いたものです。3 級以降では数式表現が一気に増えるので、この 記号には早めに慣れておきましょう。

偏差と分散

ばらつきを「平均からどれだけズレているか」で考えます。各データ の平均からのズレを偏差といい、 で計算します。

ところが偏差をそのまま足すと、正と負がちょうど打ち消し合って必ず になってしまいます。そこで偏差を 2 乗してから平均をとります。これが分散です。

定義 ─ 標本分散

を標本分散という。偏差の 2 乗の平均で、データのばらつきの大きさを表す。

例題 1.1

データ の標本分散を求めよ。

: 平均は 。偏差は 、その 2 乗和は 。標本分散

標準偏差

分散はデータを 2 乗しているため、もとのデータと単位が合いません(例: 身長(cm)の分散は cm² )。そこで分散の正の平方根をとった量を使います。

定義 ─ 標本標準偏差

を標本標準偏差という。もとのデータと同じ単位でばらつきを表現できる。

例題 1.2

例題 1.1 のデータの標本標準偏差を求めよ。

: 。「平均 のまわりに、平均すると ぐらいの幅でばらついている」と読み取れる。

計算で便利な公式

分散の計算では、次の変形が手計算で重宝します。

「2 乗の平均から、平均の 2 乗を引く」と覚えます。 をそれぞれ 2 乗して平均し、最後に を引くだけなので、偏差を一つひとつ計算しなくてよく、暗算と相性が良いのが特長です。

標本分散と不偏分散(参考)

ここで紹介した分母 の量は標本分散と呼びます。一方、母集団の分散 を推定したいときには、分母を にした不偏分散 を使います。3 級では「データそのもののばらつきを記述するなら 、母集団の分散を推定するなら 」とおおまかに区別しておけば十分です(2 級で深掘りします)。

§1.2

共分散と相関係数 ─ 2 変数データを読む

ここまでは「ある 1 種類のデータ」だけを扱ってきました。実際には「身長と体重」「気温とアイスの売上」のように、2 種類のデータが対になって与えられることが多くあります。こうした 2 変数データの関係を測るための道具が、共分散と相関係数です。

散布図で関係を眺める

2 変数データ を平面上の点として描いた図を散布図といいます。散布図を眺めるだけでも、 が増えると も増える(正の関係)、 が増えると が減る(負の関係)、関係が見えない(無相関)、といった大まかな傾向はつかめます。共分散と相関係数は、この「見た目」を数値化したものです。

共分散

定義 ─ 共分散

2 変数データ に対し、 を共分散という。

符号で大きく性格が変わるのが共分散の特長です。

  • 正のとき: が同じ方向に動く傾向(正の関係)。
  • 負のとき: が逆方向に動く傾向(負の関係)。
  • に近いとき: 一方の増減が他方の増減と無関係(無相関)。

ただし共分散は単位の影響を強く受けます。たとえば身長を「m」で測るか「cm」で測るかで、共分散の値は 倍も変わってしまいます。「同じ符号の傾向」を見るには便利でも、「強さ」を客観的に比較するには使いにくいわけです。

相関係数 ─ 単位を消す

そこで、共分散をそれぞれの標準偏差で割って単位を消した量を使います。これが相関係数です。

定義 ─ 相関係数

を(ピアソンの)相関係数という。

相関係数 は必ず の範囲に収まります。値の意味は次のとおりです。

  • : 強い正の相関(右上がりの直線に近い)。
  • : 強い負の相関(右下がりの直線に近い)。
  • : ほぼ無相関(直線的な関係はない)。
  • 目安: で強い相関、 で中程度、 以下で弱い相関、と表現することが多い。
例題 1.3

ある 5 人の数学と物理のテストの点数が、それぞれ , , , , であった。相関係数 を求めよ。

: なので、数学と物理の点数には強い正の相関があると判断できる。

相関と因果は別もの

相関係数を扱う上で必ず押さえておきたい注意があります。相関があるからといって、因果関係があるとは限らない、ということです。

有名な例として「アイスの売上と水難事故の件数には強い正の相関がある」というものがあります。これは「アイスを食べると水難事故が増える」のではなく、「気温が高い日にはアイスもよく売れ、水遊びをする人も多くなる」という、共通の原因(気温)があるためです。こうしたものを擬似相関と呼びます。

相関係数はあくまで「直線的な関係の強さ」を測る道具で、原因と結果を区別する力はありません。データを見るときは、「なぜそういう関係が出るのか」をいつも一歩立ち止まって考えるクセをつけましょう。

§1.3

標準化 ─ 比較できる形に直す

「数学の 70 点」と「英語の 70 点」、どちらが優秀でしょうか? もし数学の平均が 60 点・標準偏差 10、英語の平均が 80 点・標準偏差 5 なら、答えは大きく変わります。異なるテストや異なる単位の値を、共通の物差しに乗せて比較するための変換が、本節で学ぶ標準化です。

標準化の定義

定義 ─ 標準化(z 変換)

データ に対し、 の標準化(z スコア)という。 はデータの平均、 は標準偏差。

標準化の中身を分解すると、次の 2 ステップを連続で行っていることがわかります。

  1. 平均を引く: ─ データの中心を に揃える。
  2. 標準偏差で割る: ─ ばらつきの単位を揃え、 単位がちょうど「1 標準偏差ぶん」になるようにする。

標準化したデータの性質

性質 ─ 標準化後の平均と分散

標準化したデータ は、必ず

を満たす(平均は 、標準偏差は )。

つまり、どんな単位・どんなスケールのデータでも、標準化を通せば「平均 0・標準偏差 1」という共通の物差しに揃います。これによって異なるデータどうしを公平に比較できるようになります。

例題 1.4 ─ 数学と英語、どちらが優秀?

ある人の点数が、数学 点(クラス平均 、標準偏差 )、英語 点(クラス平均 、標準偏差 )であった。どちらの科目で相対的によい成績だったか?

: 数学の z スコア 、英語の z スコア 。同じ 80 点でも、数学のほうが英語より「クラス内でずっと上位」だったとわかる(数学は平均から 2 標準偏差ぶん上、英語は 0.5 標準偏差ぶん上)。

偏差値 ─ z スコアを使いやすく

受験勉強で必ず登場する偏差値も、実は z スコアを少し変換しただけのものです。

定義 ─ 偏差値

を偏差値という。これにより、平均 ・標準偏差 の物差しでデータを表現できる。

  • 偏差値 50: 平均ちょうど(z = 0)。
  • 偏差値 60: 平均から 1 標準偏差上(z = 1)、上位 約16%。
  • 偏差値 70: 平均から 2 標準偏差上(z = 2)、上位 約2.3%。
  • 偏差値 40: 平均から 1 標準偏差下、下位 約16%。

「上位 16% / 2.3%」といった具体的な割合は、データが正規分布(後の章で学ぶ釣鐘型の分布)に従うときの目安です。テストの点数のような分布はおおむね正規分布に近いので、この対応表は実用上よく使われます。

本章のまとめ

ここまでで 3 級の記述統計の主要部分が出そろいました。

  • 1 変数の中心: 平均
  • 1 変数のばらつき: 分散 、標準偏差
  • 2 変数の関係: 共分散 、相関係数
  • スケール調整: 標準化 、偏差値

これらの道具は次章以降の確率変数・確率分布の話、そして 2 級以降の推定・検定でも繰り返し登場する基礎的な共通言語です。

Chapter 2

2 章 · 確率と確率変数


§2.1

確率の基本法則と条件付き確率

4 級では「同様に確からしい」を出発点に、確率を場合の数の比として求めました。3 級では、複数の事象が絡む状況をきれいに扱うための法則を整理し、3 級以降の主役となる条件付き確率を導入します。

確率の基本法則(復習 + 整理)

定理 ─ 加法定理

が排反()なら、

定理 ─ 余事象

。「少なくとも〜」型の問題で、直接数えるのが大変なときに威力を発揮する。

条件付き確率 ─ 「もし〜とわかったら」

「サイコロを振った人がこっそり覗いて、『偶数が出た』とだけ教えてくれた。さて、その目が である確率は?」 ─ 何の情報もないときの確率は ですが、「偶数だ」と知ってからの確率は です(偶数は の 3 通りで、そのうち は 1 通りだから)。このように 「ある事象が起こったとわかったうえでの確率」 を条件付き確率といいます。

定義 ─ 条件付き確率

事象 が起こったという条件のもとで、事象 が起こる条件付き確率を

と定める。

例題 2.1 ─ サイコロ

サイコロを 1 回振ったとき、偶数が出たとわかった。その目が である確率は?

: 「偶数」、 の目」とすると、

乗法定理 ─ 同時に起こる確率

条件付き確率の定義式を変形すると、「 も起こる確率」を求める式が得られます。

定理 ─ 乗法定理

例題 2.2 ─ もとに戻さない取り出し

袋に赤玉 3 個、白玉 2 個が入っている。1 個ずつ続けて 2 個を取り出す(もとに戻さない)とき、 個目が赤、 個目が白である確率を求めよ。

: 「1 個目が赤」、「2 個目が白」。。1 個目を赤と取った後、袋には赤 2、白 2 が残るので

独立事象 ─ 「条件を知っても確率が変わらない」

定義 ─ 独立

事象 が独立であるとは、 が成り立つこと。これは と同値。

が起こったと知ろうが知るまいが、 が起こる確率は変わらない」 ─ それが独立性の本質です。コインを 2 枚別々に投げる、別の人がそれぞれくじを引く、毎日のサイコロの目、といったケースは独立として扱えます。

例題 2.3

2 つの独立な試行で、 のとき、 も起こる確率は?

: 独立だから

全確率の法則とベイズの定理(さわり)

条件付き確率を使うと、有名な「全確率の法則」「ベイズの定理」が記述できます。3 級の試験では計算問題として問われることがあるので、形だけでも押さえておきましょう。

全確率の法則

互いに排反で全体を覆う事象 について、任意の事象 の確率は

で計算できる。

例題 2.4 ─ 検査の陽性率

ある病気の有病率が 、検査の感度(病気の人が陽性と出る確率)が 、特異度の補数(病気でない人が誤って陽性と出る確率)が のとき、無作為に選んだ人が検査で陽性となる確率は?

: 「病気」()、「病気でない」()、「陽性」とおく。

、すなわち約

ベイズの定理は「結果から原因の確率を逆算する」道具で、 という形をしています。例題 2.4 の状況で「陽性だった人が実際に病気である確率」を求めるのが、ベイズの定理の典型的な使いみち。これは準1級・1級の主要テーマでもあります。

次節では、こうした確率の枠組みの中で「数値をとる量」として扱う確率変数の話に進みます。期待値・分散がいよいよ「ランダムな量」に対して定義される、抽象度が一段上がるところです。

§2.2

確率変数と期待値・分散

前節までの確率は「事象が起こる/起こらない」を扱っていました。本節からは、もう少し抽象度の高い「ランダムな数値」 ─ 確率変数 ─ を導入し、その平均(期待値)とばらつき(分散)を考えます。

確率変数とは

定義 ─ 確率変数

試行の結果に応じて値が決まる変数を確率変数といい、 などの大文字で表す。 がとびとびの値しかとらないとき離散確率変数、連続的な値をとるとき連続確率変数という。

たとえば「サイコロを 1 回振って出た目」は離散確率変数で、 です。「明日の最高気温」は連続確率変数で、無限個の実数値をとります。3 級の中心は離散確率変数。連続版は次章の正規分布で扱います。

期待値

定義 ─ 期待値(離散の場合)

離散確率変数 がとり得る値を 、対応する確率を とする。 の期待値を

で定める。期待値は の「ならしたときの平均値」を表す。

例題 2.5 ─ サイコロの期待値

公平なサイコロを 1 回振ったとき、出る目 の期待値を求めよ。

: 。サイコロの「平均的な値」は となる( の中央値ではないことに注目)。

例題 2.6 ─ 賞金の期待値

ある宝くじは、当選確率 で 100 万円、外れ( 円)が確率 。1 枚あたりの期待賞金を求めよ。

: 円。1 枚 円で売られていれば、買い手の平均的な「儲け」は 円。逆に主催者は損をする計算になる(現実の宝くじはたいてい逆向き)。

分散

期待値だけでは「平均的にどのへんの値か」しかわかりません。「ふつうそこからどれくらいズレるか(ばらつき)」を測るのが、確率変数の分散です。考え方は記述統計の分散と同じく、「平均からのズレの 2 乗」の平均をとります。

定義 ─ 分散

計算には次の変形がよく使われます(記述統計と同じ形)。

例題 2.7

確率分布が のとき を求めよ。

: - - -

標準偏差

定義 ─ 標準偏差

を確率変数 の標準偏差という。

分散はデータを 2 乗しているため、もとの と単位が合いません。それを揃えるために平方根をとったものが標準偏差で、 と同じ単位でばらつきを語れます。例題 2.7 なら

線形変換 ─ $aX + b$ の期待値・分散

のように、確率変数を定数倍したり定数を足したりした新しい確率変数 を考えると、期待値・分散は次の規則に従って一気に計算できます。

定理 ─ 線形変換則

つまり「平均は同じ向きに動く」、「分散は定数 には影響されず、2 乗倍 で効く」。

例題 2.8

のとき、 の期待値と分散を求めよ。

: は分散には効かないことに注意。

この線形変換則は、次節の二項分布や正規分布の標準化、さらには 2 級以降の推定・検定の式変形でも繰り返し登場します。「期待値は普通の代数計算、分散は で割増し」と覚えておきましょう。

Chapter 3

3 章 · 確率分布


§3.1

二項分布

コインを 10 回投げて表が何回出るか。10 問の選択式テストで、当てずっぽうで何問正解するか。同じ試行を独立に何度も繰り返すとき、成功回数の分布として現れるのが本節の主役、二項分布です。

ベルヌーイ試行

定義 ─ ベルヌーイ試行

結果が「成功」「失敗」の 2 つしかない試行をベルヌーイ試行という。成功確率を ()とし、失敗確率は

コインを 1 回投げる(表 = 成功)、サイコロで 6 が出るかどうか(成功確率 )、ある問題に正解できるか ─ ぜんぶベルヌーイ試行です。これを 独立に繰り返したときの成功回数を とおきます。

二項分布の定義

定義 ─ 二項分布

成功確率 のベルヌーイ試行を独立に 回繰り返したときの成功回数 は二項分布 に従うという。確率関数は

なぜこの形になるかは樹形図で考えると見えます。 回中ちょうど 回成功する「並び方」は 通り、それぞれの並びの確率は 。掛け合わせて足したものが、上の式です。

例題 3.1 ─ コイン

公正なコインを 5 回投げて、表がちょうど 3 回出る確率を求めよ。

:

二項分布の期待値と分散

定理 ─ 二項分布の期待値と分散

のとき、

「平均は 試行回数 × 成功確率」「分散は 平均 × 失敗確率」と暗記してしまうのが楽です。直感的にも、コインを 10 回投げれば表は平均 5 回(= )、ばらつきは ぐらい、と納得できます。

例題 3.2

のとき、 を求めよ。

: 。標準偏差は

二項分布の形と正規分布へのつながり

二項分布の確率分布をグラフにすると、 が大きくなるほど 左右対称な釣鐘型(つりがねがた)に近づいていきます。具体的には が十分大きく も大きければ、二項分布は次節で扱う正規分布 で近似できる、ということが知られています(ラプラス・ド・モアブルの定理)。

05101520成功回数 kP(X=k)n=20, p=0.4平均 np = 8
図: $\mathrm{Bin}(20, 0.4)$ の確率分布。山の頂は平均 $np = 8$

この事実が「データ分析でよく出てくるあの釣鐘型(正規分布)」と「コインの試行(二項分布)」をつなぎます。次の 3.2 で、いよいよ正規分布そのものに踏み込みます。

§3.2

正規分布と標準化

「身長」「テストの点数」「測定誤差」 ─ 自然界や社会のさまざまな量は、データを集めると左右対称の釣鐘型のヒストグラムを描きます。この形を理想化したものが本節の主役、正規分布です。統計学のあらゆる場面に登場する、もっとも重要な分布のひとつ。

正規分布の形

定義 ─ 正規分布

確率変数 が次の確率密度関数に従うとき、 は正規分布 に従うという。

は分布の中心(平均、期待値)、 はばらつき(分散)。

式は複雑ですが、3 級では「 で中心が決まり、 で幅が決まる、左右対称の釣鐘型」とイメージできれば十分です。 が大きいほど、釣鐘の裾が広く・てっぺんが低くなります。

-3-2-10123z±1σ ≒ 68%±2σ ≒ 95%
図: 標準正規分布 $N(0,1)$。中心 ±1σ に約 68%、±2σ に約 95% が入る
なぜ釣鐘型になる?

「身長」「測定誤差」のように、たくさんの小さな独立要因が足し合わさって決まる量は、近似的に正規分布になります(中心極限定理)。この『多くのランダム要因の和』という構造が自然界・社会のあちこちで起きるからこそ、正規分布はあらゆる場面に登場するのです。

経験則(68 - 95 - 99.7 ルール)

正規分布で覚えておきたい便利な目安があります。 のとき:

  • から の範囲: 約 のデータが入る
  • から の範囲: 約
  • から の範囲: 約
例題 3.3

のとき、 となる確率を求めよ。

: 。区間 。経験則より約 、つまり

標準化 ─ 正規分布の主役技

定義 ─ 標準化

について、 とおくと、 は標準正規分布 に従う。

「平均を引いて標準偏差で割る」という変換、1.3 節で学んだ標準化と同じ式です。これによって、どんな正規分布も という共通の物差しに翻訳できます。標準正規分布表(あるいはアプリの 値計算)を一つだけ用意しておけば、ありとあらゆる正規分布の確率を計算できる、というのが標準化の威力です。

実務での使い方:外れ値検出

工場の品質管理では、製品の寸法を毎日測定し 値を計算します。 となるサンプル(=母集団の 0.3% 未満)が出たら「異常」のサインとして警報を出す、というのが管理図(control chart)の基本ロジックです。マーケティング分析でもユーザーの行動指標を で標準化し、「平均から外れすぎた異常顧客」を発見するのに使われます。

Python / R で正規分布の確率を計算する
初回のみ Pyodide(~10MB)を CDN から読み込みます

scipy.stats.norm と R の pnorm/qnorm が標準的な対応物。

例題 3.4 ─ 標準化を使った計算

のとき となる確率を求めよ。

: 。表より 、つまり約

標準正規分布表の読み方

標準正規分布表は、 ごとに並べた数表です。試験会場では持ち込み可なので、形式に慣れておきましょう。代表的な値は次のとおり ─ よく出るので暗記推奨。

  • ⇒ 両側合計
  • ⇒ 片側
  • ⇒ 両側合計

─ これらの値は次章の信頼区間や、2 級以降の検定で何度も登場します。最低限 は反射的に思い出せるようにしておきたいところです。

Chapter 4

4 章 · 推定の入口


§4.1

母平均の信頼区間

ここまでの章は「すでに分かっている分布があるとき、そこから何が起こりやすいか」を考える方向の話でした。本節からは逆向き ─ 「標本のデータから、未知の真の値(母平均)を推し量る」推定の入口を扱います。

母集団と標本

用語 ─ 母集団・標本

知りたい対象全体を母集団といい、その平均・分散を母平均 ・母分散 という。実際に調査して得られた限られたデータを標本といい、そこから計算した値が標本平均 ・標本分散

全国の高校 1 年生の身長(母集団)を全員測るのは不可能なので、500 人をランダムに選んで身長を測る(標本)。この 500 人の平均 から、未知の本当の平均 を推し量る ─ これが推定です。

標本平均の標本分布

定理 ─ 標本平均のばらつき

母平均 、母分散 の母集団から無作為に 個の標本を取ったとき、標本平均 について

が成り立つ。標本平均の標準偏差 を標準誤差(SE)という。

標本平均の期待値はちょうど母平均と一致します。「平均的にはちゃんと当たる推定量」ということ。一方、標本平均自体は標本ごとに揺れるばらつきを持ちますが、 を大きくするほどその揺れは縮みます( で割られているのがポイント)。

中心極限定理(さわり)

定理 ─ 中心極限定理

母集団の分布の形によらず、 が十分大きいとき、標本平均 は近似的に正規分布 に従う。

つまり、もとの母集団の分布が正規分布でなくても、たくさん集めた標本の平均は近似的に正規分布になる ─ これが中心極限定理。「だから標本平均は正規分布で扱ってよい」という、推定や検定の理論的な土台になっています。

n = 1n = 5n = 30(正規型)n が大きいほど、標本平均の分布は正規分布に近づく(中心極限定理)
図: もとの分布(n=1 一様)から標本平均をとると、n が大きいほど正規型に近づく
直感的には

1 回の試行は何が出るかバラバラでも、たくさん平均すれば「平均値は安定して真ん中に集まる」。これは私たちが日常的に「サンプル数が多ければ信頼できる」と感じる感覚そのものです。中心極限定理は、その『平均は釣鐘型に収束する』という事実を数学的に保証してくれる定理です。

母平均の 95% 信頼区間($\sigma$ 既知)

標本平均 を中心に、誤差 ぶんの幅を取った区間を考えます。

定義 ─ 母平均の 95% 信頼区間($\sigma$ 既知)

この区間が真の母平均 を含む確率は約

は標準正規分布で に相当する値(前節 3.2 で出てきた値です)。信頼度 に上げたければ の代わりに なら を使います。

-20(母平均)2推定値試行 #赤 = 母平均を含まない区間
図: 同じ母集団から標本を 18 回取り、95% 信頼区間を作った様子。約 1 本(=5%)が母平均を外す
「95% 信頼区間」の正しい解釈

「95% の確率で母平均がこの区間にある」と言いたくなりますが、厳密には間違いです。母平均は固定の数値で、確率的に動くのは『私たちが取る区間のほう』。正しくは「同じ手順で繰り返し標本を取って区間を作ると、その 95% は母平均を含む」という意味です。図の『赤い 1 本』が、たまたま外してしまった区間にあたります。

例題 4.1

母標準偏差 の母集団から の標本を取ったところ、標本平均 であった。母平均 の 95% 信頼区間を求めよ。

: 標準誤差 。誤差幅 。区間は

「真の母平均は、95% の信頼度で約 の間にあると考えられる」と読む。

信頼区間の正しい解釈

「95% 信頼区間に が入る確率は 95%」という説明は、厳密にはやや不正確です。正しくは「同じ手続きを多数回繰り返すと、得られる区間の約 95% が真の を含む」というのが信頼区間の意味です。

実用上はあまり気にせず「95% の信頼度で はこの区間にある」と読むことが多いですが、頭の片隅に入れておくと、検定の話に入ったときに混乱しません。次の章では、信頼区間と表裏一体である 仮説検定 の考え方を学びます。

Chapter 5

5 章 · 仮説検定の基礎


§5.1

仮説検定の枠組み

仮説検定(hypothesis test) は、母数についてあらかじめ立てた 仮説 をデータに照らして判定する手続きです。推定が『母数はいくつか』を答えるのに対し、検定は『母数がこの値とは違う、と言ってよいか』を答えます。

帰無仮説と対立仮説

定義 ─ 帰無仮説 H₀ と対立仮説 H₁

帰無仮説 : 『差がない・効果がない』を表すデフォルトの仮説。例:

対立仮説 : 帰無仮説が正しくないとき主張したい仮説。例: (両側) / (右片側) / (左片側)。

検定は『 が正しいと仮定したら、観測されたデータは起こりにくい』ことを示して 棄却 する手続き。

なぜ『帰無仮説を棄却する』形を取るか

数学的には『 を直接証明する』のは難しい(無数の値の可能性がある)が、『 が正しい場合の予測』なら 1 つの分布として扱える。だから 背理法に近い形 で『 なら起こりえない → を捨てる』と進める。これは数学の証明の道具立てを統計に持ち込んだ Fisher・Neyman-Pearson の発想で、現代の統計検定の基本枠組みです。

有意水準と棄却域

定義 ─ 有意水準 α と棄却域

有意水準 : 『 が正しいのに棄却してしまう』ミスを許容する確率。慣習的に (5%)が標準。重要な判断では

棄却域: 検定統計量がこの範囲に入ったら を棄却する領域。両側検定の z 検定で なら

μ₀閾値μ₁検定統計量H₀H₁α(第1種)β(第2種)
図: 両側 5% 棄却域(両裾各 2.5%)と、第一種の誤り α・第二種の誤り β

二種類の誤り

定義 ─ 第一種・第二種の誤り

第一種の誤り(type I error): が正しいのに棄却する誤り。発生確率 =

第二種の誤り(type II error): が誤っているのに棄却しない誤り。発生確率 =

検出力(power) = 。検出力が高い検定 = 真の差を見逃しにくい検定。

α と β はトレードオフ

を厳しくする(0.05 → 0.01)と第一種の誤りは減るが、その分 を棄却しにくくなる ので は増える(検出力が下がる)。両方を同時に下げるには 標本サイズ を増やす しかない ─ これが『大規模実験ほど信頼できる』数学的根拠です。

p 値

定義 ─ p 値

p 値(p-value): 帰無仮説 が正しいと仮定したときに、観測されたデータ以上に極端な統計量が得られる確率

判定: なら を棄却、そうでなければ棄却できない。

p 値の正しい解釈

よくある誤り: 「p = 0.03 → が正しい確率は 3%」。これは 間違い。p 値は『 が正しいと仮定したとき の、データの起こりにくさ』であり、 が正しい確率ではない。両者の混同を避けるため、近年では p 値だけでなく効果量・信頼区間を併記する のが推奨されます。

§5.2

母平均の検定 ─ z 検定

もっとも基本的な検定 ─ 母分散 がわかっているとき(または大標本で標本分散で代用してよいとき)の母平均 の検定を学びます。

検定統計量

公式 ─ 母平均の z 検定

のもとで、検定統計量

は標準正規分布 に従う。 が未知なら標本標準偏差 で代用(ただし 程度の大標本が前提)。

判定の手順

  1. 仮説を立てる: (両側 or 片側)
  2. 有意水準 を決める(通常 0.05)
  3. 棄却域を求める: 両側 5% なら 、右片側なら
  4. 検定統計量 を計算
  5. 判定: が棄却域に入れば 棄却、入らなければ棄却できない
例題 5.1 ─ 両側 z 検定

ある工場の製品重量は従来 g、 g とされる。新工程で作った 25 個の標本平均が g。新工程で平均重量が変わったといえるか?(両側 5%)

:

なので 棄却。新工程で平均重量は変わったといえる

片側検定と両側検定の使い分け

検定方向は『何を主張したいか』で決まる

変わったか』を見るのが両側、『増えた(減った)』を見るのが片側。新薬で『血圧を下げたい』なら左片側 ()、製品の不良率が『増えていないか』を監視するなら右片側 ()。事後に方向を変えるのは禁忌 ─ p 値が片側のほうが小さくなる方向に都合よく合わせるのは『p ハッキング』として現代の科学ではタブー視されます。

§5.3

母比率の検定

支持率・コンバージョン率・不良率など、データが二値(成功 / 失敗)で母比率 を扱う場合の検定。正規近似 が基本。

検定統計量

公式 ─ 母比率の z 検定

のもとで、 個の試行で 個成功 → 標本比率 。検定統計量

は大標本( かつ が目安)で標準正規分布に従う。

例題 5.2 ─ 母比率の z 検定

従来の支持率は 30%。最近 200 人にアンケートしたら 72 人が支持。支持率は変化したか?(両側 5%)

:

。標本比率

なので、5% 有意水準では 棄却できない(支持率が変化したとは言えない)。p 値 ≒ 0.064。

標本サイズの感度

同じ でも なら 強く棄却 できる。差の大きさ(=効果量)が同じでも、n が変われば判定は変わる ─ 検定の根本的な限界の一つです。だから現代では p 値だけでなく 信頼区間 / 効果量 を併記し、『差の絶対量』を示すのが推奨されます。

§5.4

適合度検定 ─ カイ二乗検定の入口

適合度検定(goodness-of-fit test) は、観測された度数分布が理論分布に従うかを判定する手法。代表的なのが カイ二乗()適合度検定 です。

観測度数と期待度数

定義 ─ 観測度数 O・期待度数 E

カテゴリ、観測度数 。理論的に予想される度数(期待度数) を、 の理論分布から計算する。

たとえば 6 面サイコロを 60 回振って各目の出現回数を見るとき、 公平 ⇒

公式 ─ カイ二乗統計量

は自由度 のカイ二乗分布に従う(大標本)。 が大きいほど『観測と理論のズレが大きい』 → 棄却域は 右片側のみ

適用の前提条件

  • 各カテゴリの 期待度数 が目安(満たさないなら隣接カテゴリと統合)
  • 観測値が独立(同じ個体を二重カウントしない)
  • は『観測度数の比は理論比に従う』形
例題 5.3 ─ サイコロの公平性

6 面サイコロを 60 回振った結果が以下:

| 出目 | 1 | 2 | 3 | 4 | 5 | 6 | |---|---|---|---|---|---|---| | 観測 | 8 | 13 | 9 | 11 | 7 | 12 |

公平か?(α=5%)

:

各目の出現確率は 1/6。期待度数は全て

自由度 のカイ二乗分布で右片側 5% 点は 11.07。

なので 棄却できない(サイコロが偏っているとはいえない)。p 値 ≒ 0.73。

独立性検定との関係

適合度検定は『観測 = 理論分布か』を見ますが、関連手法に 独立性検定(クロス表で 2 変数が独立か)があります。式は同じ ですが、 の作り方と自由度が違います。詳しくは 2 級教科書で扱います。

05101520xk = 2k = 5k = 10
図: 自由度別のカイ二乗分布。自由度が大きいほど右に重心が移動
カイ二乗統計量が右片側のみな理由

は二乗の和なので 常に非負。観測と理論が完全一致なら 、ズレが大きいほど大。だから検定は 右側だけ を棄却域とする(『一致しすぎ』も理屈上は怪しいが、ここでは棄却対象としない)。

ここまで 5 章で 3 級の中核(記述統計・確率・推定・検定)を扱いました。続く 6-10 章では t 分布・2 群比較・相関と単回帰・実用応用 を加えて、2 級への橋渡しを完成させます。

Chapter 6

6 章 · t 分布と小標本推定


§6.1

t 分布の登場

ここまでの章では母分散 既知 という(現実にはほぼあり得ない)前提を置いていました。実務では母分散も標本から推定する必要があり、そのときに登場するのが t 分布 です。

t 分布の定義

公式 ─ t 分布

が独立なとき:

自由度 の t 分布。標準正規より 裾が重く、小標本での誤差を吸収する。 で標準正規に収束。

-303t / z標準正規 N(0,1)t(自由度 30)t(自由度 3)
図: t 分布(自由度別)と標準正規分布の比較
ゴセット(Student)の発見

Student(ペンネーム)= ウィリアム・ゴセットは、ギネス醸造所の品質管理で、少数のロット標本 から母分布を推定する必要に直面。1908 年に t 分布を発見・発表。実用と理論を結ぶ歴史的な統計学の名作です。

§6.2

母平均の t 信頼区間と t 検定

母分散が未知のとき、母平均 の推定・検定は z 検定の代わりに t 検定 を使います。

標本標準偏差で代用する

公式 ─ 母平均の t 信頼区間

標本標準偏差 を使い、t 分布で標準化:

自由度は ( を計算するのに 1 自由度を消費)。 が大きいと z 区間とほぼ同じ。

t 検定統計量

公式 ─ 1 標本 t 検定

のもとで:

で棄却(両側)。z 検定の 小標本版

例題 6.1 ─ 1 標本 t 検定

新製法の重量は 100g とされる。 の標本平均 、標本標準偏差 で重さが変わったか?

: 。自由度 15 の t 分布で両側 5% 点は なので棄却できない。重さが変わったとは言えない(z 検定で同じ計算をすると棄却される ─ t の方が保守的)。

§6.3

自由度の意味と t 表の読み方

自由度(degrees of freedom, df) は、t 検定だけでなく ANOVA・回帰分析でも頻出する重要概念。

自由度の直感

『自由に動ける個数』

個のデータがあり、平均 を計算した後、残りの 個が決まれば最後の 1 個は自動的に決まる。だから『 個までが自由』 ─ これが自由度。標本分散の式 で割るのも、この自由度の概念から。

t 表の読み方

  • : 自由度
  • : 上側確率 (0.05・0.025・0.01 などの代表値)
  • 両側 なら の列を見る(両側 5% なら 0.025 列)
  • が大きい()と t 値はほぼ z 値と一致

標本サイズの目安

(『大標本の目安』)では z 検定と t 検定がほぼ同じ。 では t 検定を使うのが原則。Excel の `T.INV.2T(0.05, df)` で両側 5% の t 値を計算可能(本サイトの [統計計算ツール](/tools) でも対応)。

Chapter 7

7 章 · 2 群の比較


§7.1

対応のない 2 群の t 検定(等分散)

対応のない 2 群 とは、別々の被験者・別々のロットなど、サンプルが独立 の場合。

等分散を仮定する Student の t 検定

公式 ─ 2 標本 t 検定(等分散)

2 群の標本サイズ 、平均 、不偏分散

プールされた分散:

検定統計量:

例題 7.1

新薬群()と対照群()。 で平均に差があるか?

: 。自由度 38 の両側 5% は で棄却できない。

§7.2

Welch の t 検定 ─ 等分散を仮定しない

等分散の仮定が成り立たない ときは、Welch の t 検定を使います。実務では『まず Welch を使う』のが現代の標準。

Welch の検定統計量

公式 ─ Welch の t 検定

自由度は Satterthwaite 近似:

非整数になり得る。

なぜ Welch を最初に使うか

等分散の仮定が成り立てば Welch ≈ Student t、成り立たなければ Welch のみが正しい結果を出す。Welch は両方のケースで安全。等分散検定(F 検定・Levene)を事前にしない流派は、これを根拠にしています。R の `t.test()` は デフォルトで Welch

§7.3

対応のある 2 群の t 検定

対応のある = 同じ被験者の前後・同じ被験者で 2 つの条件を試したケース。個人差を相殺できる ので検出力が高い。

差分の検定

公式 ─ 対応のある t 検定

各個体について差 を計算し、差の母平均が 0 か を検定する 1 標本 t 検定 に帰着:

は差の標本平均・標本標準偏差。

例題 7.3 ─ 投薬前後の血圧

10 人の血圧を投薬前後で測定。差 の平均 。投薬で血圧が変化したか?

: 。自由度 9 の両側 5% は 棄却(投薬で血圧が下がった)。

対応 vs 対応なし

  • 対応あり が可能なら必ずそちらを選ぶ(検出力が高い)
  • 投薬前後・施策前後・教育介入前後など反復測定で標準
  • マッチングペア デザイン(同じ年齢・性別の対をつくる)も対応として扱う
  • 対応がなくても無理にペアを作ると 誤った推論 になるので注意
Chapter 8

8 章 · 相関と単回帰分析


§8.1

ピアソン相関と相関係数の検定

相関係数 は 2 変数の 線形関係の強さ を表す指標(Ch1 で導入)。3 級ではその 検定 を学びます。

相関係数の検定

公式 ─ 相関の検定

(無相関)のもとで:

両側 なら棄却。

Fisher の z 変換と信頼区間

公式 ─ Fisher z 変換

z 空間で正規近似 → 95% 信頼区間 → 元の 空間に逆変換。 では分布が歪むため、この変換が必要。

ピアソン vs スピアマン

  • ピアソン相関: 線形関係を測る。正規性仮定
  • スピアマン順位相関: 単調関係を測る。順位ベースで外れ値・非線形に頑健
  • ケンドール τ: 順位ペアの一致度。論文では併記が増えている
  • ピアソンが有意でもスピアマンが弱ければ、関係は単調でないかも
§8.2

単回帰モデル

単回帰(simple linear regression) は『 から を予測する直線』を引く手法。

回帰モデル

公式 ─ 単回帰モデル

最小二乗推定(残差平方和 の最小化):

決定係数 $R^2$

公式 ─ R²

全変動のうち回帰モデルが説明する割合。0 〜 1 の値。単回帰では という関係。

回帰係数の解釈

なら『 が 1 増えると が平均 2 増える』。 のときの の予測値(現実的に意味があるかは状況による)。回帰直線は 平均的な関係 を表すので、個別予測には誤差が伴います。

§8.3

回帰係数の検定と注意点

回帰係数 本当に 0 でないか(= に関係があるか)を検定します。

回帰係数の検定

公式 ─ 回帰係数の t 検定

のもとで:

。Excel の 回帰分析機能 で自動表示される。

回帰の主要な落とし穴

  • 外挿の危険: 訓練データの範囲外を予測しない
  • 外れ値の影響: 1 点で回帰直線が大きく動く
  • 因果と相関: 回帰係数は『相関的な関連』を示すだけ ─ 因果は別途仮定が必要
  • シンプソンのパラドックス: 全体と部分集団で関係が逆転することがある
  • 残差プロットの確認: 残差にパターンがあれば線形仮定が崩れている
💡 2 級でさらに広がる

重回帰(複数変数)・ロジスティック回帰(二値結果)・多項式回帰(非線形)・正則化(Lasso/Ridge)が 2 級で登場。数理統計の本格的な道具立て は 2 級で揃います。

Chapter 9

9 章 · 実生活データへの応用


§9.1

教育データの読み方

テスト成績・偏差値・全国学力調査など、教育データには 統計の言葉が満載。日常で出会う統計の典型例として読み解きます。

偏差値の正体

公式 ─ 偏差値

標準化(平均 50・標準偏差 10 にスケール変換)した値。正規分布前提 なら:

- 偏差値 50 = 平均 - 偏差値 60 = 上位 16% - 偏差値 70 = 上位 2.5% - 偏差値 75 = 上位 0.6%

全国学力テストとパーセンタイル

順位と偏差値の違い

順位: 全体での順位そのもの(20 位/100 人 = 上位 20%)

偏差値: 平均からの距離を標準化した連続値

両者は対応するが、分布が偏っている(成績分布が二峰性など)と偏差値の解釈が変わる。全国学力テスト ではパーセンタイル順位の方が公平な比較になります。

教育評価への統計の応用

  • 学校間比較: 学校別平均と全国平均の差を t 検定
  • 教育介入効果: 介入前後で対応のある t 検定
  • 性別・地域差: 多元配置 ANOVA
  • 教育格差の指標: ジニ係数(分布の不平等度)
§9.2

健康・医療データ

血圧・コレステロール・BMI などの健康指標は、統計の入門教材としても優秀です。

BMI と健康リスク

用語 ─ BMI

日本肥満学会の基準: BMI < 18.5 = 低体重、18.5-25 = 標準、25-30 = 肥満 1 度、30 以上 = 肥満 2 度以上。BMI と疾患リスクの関係は非線形(U 字型)で、極端に低くても高くてもリスク増。

健康診断の基準値

基準値外 = 病気 ではない

Ch9-1(intro)でも触れたとおり、基準値は健康な人の 95% が収まる範囲。基準値外でも 5% は健康人がいるし、ベイズの定理から 稀な病気では検査陽性者の多くが偽陽性 になる。基準値の解釈は確率的 であることを忘れずに。

疫学指標

  • 有病率: 集団に占める病気の人の割合
  • 罹患率: 単位期間あたりの新規発症数
  • 生存率: 診断から 年後の生存割合(Kaplan-Meier 推定 ─ 準 1 級)
  • 相対リスク: 曝露群と非曝露群のリスク比
  • オッズ比: ケースコントロール研究で使う(2 級 Ch5)
§9.3

ビジネスデータの読み方

売上・顧客満足度・チャーン率 などビジネスでよく扱う指標も、統計の道具で読めるようになります。

Web マーケの A/B テスト

コンバージョン率の検定

ボタンの色 A・B でクリック率を比較するのが A/B テスト。本質的には 2 標本の比率の検定(z 検定または χ² 検定)。サンプルサイズが大きい( など)ので統計的に微小な差でも有意になる ─ 効果量 で実用上重要かを判断します。

顧客分析

  • RFM 分析: Recency(最終購買)・Frequency(頻度)・Monetary(金額)で顧客を分類
  • チャーン率: 一定期間に離脱する顧客割合
  • LTV(Life Time Value): 顧客 1 人あたりの累積収益
  • コホート分析: 同期入会顧客の時系列追跡

売上予測の基本

売上予測は 時系列分析(2 級 Ch8 / 準 1 級 Ch4)・回帰分析(過去の販売量から要因を抽出)・機械学習(GBM など)を組合せます。3 級レベルでは『過去のデータから何を読むべきか』 という視点を養うことが目標。

💡 統計はビジネスの共通言語

経営層は『売上は前年比 +15% で過去最高水準』のような統計的記述で意思決定します。統計の読解力 = 経営判断の質。3 級でその基礎が身に付きます。

Chapter 10

10 章 · 3 級総まとめと 2 級への橋渡し


§10.1

3 級で身に付いた統計の力

3 級教科書 9 章を歩いてきて、統計の基礎理論がしっかり固まりました

9 章の地図

  1. Ch1 記述統計: 標本平均・分散・標準偏差・相関係数
  2. Ch2 確率と確率変数: 確率の公理・期待値・分散
  3. Ch3 確率分布: 二項・正規・標準正規分布
  4. Ch4 推定の入口: 信頼区間
  5. Ch5 仮説検定の基礎: H₀/H₁・α/β・p 値・z 検定・χ² 適合度
  6. Ch6 t 分布と小標本推定: t 信頼区間・t 検定
  7. Ch7 2 群の比較: 等分散 / Welch / 対応あり t 検定
  8. Ch8 相関と単回帰: 相関の検定・最小二乗・
  9. Ch9 実生活データ: 教育・健康・ビジネスへの応用
💡 これだけで論文の読解ができる

学術論文・調査報告書の 80% は 3 級レベルの統計 で書かれています。t 検定・カイ二乗・相関 ─ これらを正しく読めれば、専門家の議論にも入っていけます。

§10.2

公式と検定の早見表

よく使う公式と検定の早見 をまとめます。試験前の最終確認・実務でのリファレンスに。

推定の早見

  • 母平均(σ既知):
  • 母平均(σ未知):
  • 母比率:
  • 母分散:

検定の早見

  • 1 標本 z(σ既知):
  • 1 標本 t(σ未知): 、df =
  • 2 標本 t(等分散):
  • Welch の t: 上の式の を分散で重みづけ、df は Satterthwaite
  • 対応のある t: 差 について 1 標本 t
  • 1 標本比率 z:
  • カイ二乗適合度: 、df =
  • 相関の検定: 、df =

[3 級 公式集](/formulas/grade-3) で各公式の詳しい解説を見られます。

§10.3

2 級で広がる新世界

2 級では、3 級の道具を より大きな問題 に適用していきます。

2 級の主要トピック

  • Ch1 推定の精緻: 不偏性・有効性・最尤推定
  • Ch2 仮説検定: 検定の精緻・F 検定・適合度の発展
  • Ch3 回帰分析: 重回帰・多重共線性・残差診断
  • Ch4 ANOVA: 一元配置・二元配置・交互作用
  • Ch5 分割表とロジ回帰: OR・Mantel-Haenszel・GLM 入門
  • Ch6 ノンパラ検定: Wilcoxon・MWU・Kruskal-Wallis
  • Ch7 多変量入門: PCA・因子分析
  • Ch8 時系列入門: ARIMA
  • Ch9 ベイズ入門: 事前事後・共役分布

3 級から 2 級への学習法

  1. 3 級の演習問題を完璧にする ─ 計算が確実にできるレベルまで
  2. Excel / R / Python で実際に手を動かす ─ 公式が動くのを目で見る
  3. [2 級教科書](/textbook/grade-2) を読み進める ─ 1 章ずつ着実に
  4. [2 級演習問題](/quiz/grade-2) で力試し
  5. 過去問 で出題形式に慣れる
💡 3 級は基礎、2 級は応用

3 級は『統計の数式と論理』、2 級は『データに対する判断と解釈』が問われる、と言われます。3 級で身に付いた基礎力を 実データで動かす経験 が、2 級合格の最大のコツです。本サイトの [統計計算ツール](/tools) で実際に動かしながら学ぶのがおすすめ。

3 級合格、おめでとうございます。2 級の世界 で、より深い統計の旅をお楽しみください。

Recommended

3級 のおすすめ参考書

当サイトは Amazon.co.jp を宣伝しリンクすることによってサイトが紹介料を獲得できる手段を提供することを目的に設定されたアフィリエイトプログラムである、Amazon アソシエイト・プログラムの参加者です。