本文へスキップ
統計ロードマップ
Figures

図解で学ぶ統計

統計検定 4 級〜1 級と関連検定のキー概念を SVG 図 47 にまとめました。「数式だけだとピンと来ない」「全体像を 1 ページで掴みたい」というときに使ってください。各図から関連する教科書ページへ飛べます。

※ すべての図はサイト内で生成されており、ダークモードに自動追従・印刷も可能です。

Visualization

可視化の基礎

ヒストグラム vs 棒グラフ

入門・4 級
ヒストグラム(隣接)棒グラフ(隙間あり)点数(連続量)ABCDカテゴリ(質的)

連続量(隣接)と質的データ(隙間)で形を変える理由。

4 級 教科書を読む

箱ひげ図の解剖

4 級
0255075100点数外れ値最小Q1中央値Q3最大

5 数要約 + 外れ値が一目でわかる。

4 級 教科書を読む
Distributions

確率分布

二項分布の形

3 級
05101520成功回数 kP(X=k)n=20, p=0.4平均 np = 8

$\mathrm{Bin}(20, 0.4)$ は平均 $np$ あたりに山。

3 級 教科書を読む

t 分布 vs 標準正規

2 級
-303t / z標準正規 N(0,1)t(自由度 30)t(自由度 3)

自由度が小さいほど裾が厚い。

2 級 教科書を読む
Inference

推測統計と検定

中心極限定理の収束

3 級
n = 1n = 5n = 30(正規型)n が大きいほど、標本平均の分布は正規分布に近づく(中心極限定理)

もとの分布がいびつでも、標本平均は正規型に。

3 級 教科書を読む

95% 信頼区間

3 級
-20(母平均)2推定値試行 #赤 = 母平均を含まない区間

繰り返し作った区間の 95% が母平均を含む。

3 級 教科書を読む

p 値の面積イメージ

2 級
-z*0z* (観測)zp 値 / 2H₀ のもとでの分布観測 z* より外側の面積(両側)= p 値

観測 z* より外側の面積が p 値。

2 級 教科書を読む

第 1 種・第 2 種の誤り

2 級
μ₀閾値μ₁検定統計量H₀H₁α(第1種)β(第2種)

閾値を動かすと α と β はトレードオフ。

2 級 教科書を読む

F 分布と棄却域

準 1 級
012.874F棄却域(α=0.05)F(d₁=4, d₂=20)

ANOVA で使う F 分布。F > F* なら $H_0$ 棄却。

準 1 級 教科書を読む

ブートストラップ法

準 1 級 / DS
原データ復元抽出 #1復元抽出 #2復元抽出 #3各リサンプルから統計量 → 分布化

原データから復元抽出を繰り返し、統計量の分布を経験的に得る。

統計チートシートを読む
Regression

回帰

散布図と回帰直線

2 級
2464812xyŷ = 1.20 + 1.28x赤線 = 残差

残差(赤線)の 2 乗和を最小化する直線。

2 級 教科書を読む
Multivariate

多変量解析

PCA の主成分軸

準 1 級
-202-202x₁x₂PC1PC2PC1 = 分散最大方向

PC1 = 分散最大方向。データの広がりを保つ次元削減。

準 1 級 教科書を読む
Time Series

時系列解析

時系列の分解

準 1 級
原系列トレンド季節残差月(48 ヶ月)

原系列 = トレンド + 季節 + 残差 に分解。

準 1 級 教科書を読む

自己相関(ACF)プロット

準 1 級
051015-0.200.51.0ラグ kACFAR(1), φ=0.7±2/√n(95% CI)

AR(1) は指数減衰、MA(q) は q 次でストン。

準 1 級 教科書を読む
Bayesian & Theory

ベイズと数理統計

ベイズ更新

準 1 級
00.51θ(成功確率)事前 Beta(2,2)尤度(9成功 1失敗)事後 Beta(11,3)

事前 × 尤度 = 事後。データで信念が更新。

準 1 級 教科書を読む

尤度関数と MLE

1 級
00.5MLE1θ(成功確率)尤度(正規化)最尤推定点── 95% 尤度区間n=10, k=7 のベルヌーイ尤度

尤度の山頂が最尤推定値。山が鋭いほど精度が高い。

1 級 教科書を読む

MCMC のトレースプロット

1 級
0100200-2真の平均4反復θburn-in2 本の連鎖が同じ分布に収束

複数連鎖が同じ分布に収束 → サンプリング成功。

1 級 教科書を読む
Stochastic & Applied

確率過程と応用

カプラン・マイヤー生存曲線

準 1 級
0510152000.51.0時間(月)生存率治療群対照群小縦線 = 打ち切り

打ち切りを考慮した階段状の生存率推定。

準 1 級 教科書を読む

ランダムウォーク(ブラウン運動)

1 級
0100200tW(t)ランダムウォーク 3 サンプルパス

離散ランダムウォークの極限がブラウン運動。

1 級 教科書を読む
Machine Learning

機械学習

ROC 曲線

DS / G 検定
00.510.51偽陽性率 FPR真陽性率 TPR強い分類器(AUC≈0.92)普通(AUC≈0.75)ランダム(AUC=0.5)

AUC が大きいほど良い分類器。0.5 はランダム。

DS 検定 教科書を読む

バイアス・バリアンスのトレードオフ

DS / G 検定
単純複雑モデル複雑度誤差最適点バイアス²バリアンス合計誤差

最適な複雑度で総合誤差が最小。

DS 検定 教科書を読む

学習曲線(過学習)

DS / G 検定
0学習量(エポック / 複雑度)誤差早期終了の理想点過学習の領域 →訓練誤差検証誤差

検証誤差が再上昇する手前が早期終了の理想点。

DS 検定 教科書を読む

k-means クラスタリング

DS / E 資格
k=3 クラスタ✕ = 重心(centroid)

k 個のクラスタとそれぞれの重心。教師なし学習の代表。

scikit-learn 入門ブログを読む

SVM のマージン最大化

DS / E 資格
マージン● Class +1■ Class -1決定境界 (w·x + b = 0)

決定境界の両側に最大マージンを取る分類器。サポートベクトルが境界を決める。

E 資格 教科書を読む

GBDT の分割木

DS / E 資格
x₁ ≤ 5x₁ > 5x₂ ≤ 3x₂ > 3x₂ ≤ 7x₂ > 7x₁ ?x₂ ?x₂ ?−0.4+0.2+0.5+0.9葉の値 = 残差を最小化する更新量(学習率 η を掛けて加算)

残差を順次学習する弱学習器(浅い木)の集合。Kaggle 表データの定番。

scikit-learn 入門ブログ

K-Fold 交差検証

DS / G 検定
K-Fold Cross-Validation (K=5)fold 1testfold 2testfold 3testfold 4testfold 5test各 fold の test スコアを平均 → 汎化性能の推定traintest

データを K 分割してすべてを test に回し、汎化性能を頑健に推定。

DS 検定 教科書を読む

混同行列

DS / G 検定
混同行列(Confusion Matrix)予測: Positive予測: Negative実: Positive実: NegativeTP85FN15FP10TN90Precision = TP/(TP+FP) = 85/95 ≈ 0.89Recall = TP/(TP+FN) = 85/100 = 0.85 / Accuracy = 175/200 = 0.875

TP / FP / FN / TN の 4 マスから Precision・Recall・Accuracy がすべて出る。

DS 検定 教科書を読む

PR 曲線(Precision-Recall)

DS / G 検定
PR 曲線(Precision-Recall)00.5100.51RecallPrecisionランダム(=陽性率)良い分類器(高 AP)不均衡データの評価には ROC より PR が適切

不均衡データでは ROC より PR 曲線。AP(平均適合率)で総合性能を評価。

DS 検定 教科書を読む
Deep Learning

ディープラーニング

活性化関数の比較

E 資格
-202-101xSigmoidTanhReLULeaky ReLU

Sigmoid・Tanh・ReLU・Leaky ReLU の特徴を一目で。

E 資格 教科書を読む

最適化アルゴリズムの収束経路

E 資格
開始SGD(振動)MomentumAdam

SGD は振動、Momentum で慣性、Adam は適応的。

E 資格 教科書を読む

CNN アーキテクチャ

E 資格
CNN(畳み込みニューラルネット)の典型構成入力32×32×3Conv30×30×16Pool15×15×16Conv13×13×32Pool6×6×32FlattenFC128FC10→ Softmax畳み込み層プーリング全結合(FC)

Conv → Pool → Conv → Pool → FC → Softmax の標準構成。

E 資格 教科書を読む

ニューラルネットの順伝播

E 資格
x1x2x3h1h2h3h4y1y2入力層隠れ層 (ReLU)出力層z = Wx + b → 活性化 → 次の層へ

入力層 → 隠れ層 → 出力層への信号伝播。各層は線形変換 + 活性化。

E 資格 教科書を読む

Self-Attention の重み

E 資格
ThecatsatonmatThecatsatonmat0.50.20.10.10.10.10.50.20.10.10.10.30.40.10.10.10.10.20.40.20.10.40.10.10.3QueryKey

Q×K^⊤ → softmax で得られるトークン間の注目度行列。Transformer の核。

Transformer の数学ブログ

VAE アーキテクチャ

E 資格
x入力Encoderμσz=μ+σε潜在変数Decoderx'再構成Loss = 再構成誤差 + KL 発散

Encoder で μ ・ σ → reparameterization で z → Decoder で再構成。

拡散モデル ・ VAE ブログ

拡散モデルの順過程と逆過程

E 資格
順過程(forward, ノイズ追加)xx1x2x3x逆過程(reverse, ノイズ除去 = 学習)

ノイズを徐々に加える(順)→ 除去する(逆)。後者を学習するのが拡散モデル。

拡散モデル ブログ

Multi-Head Attention

E 資格
Input XConcat + W_OQ · K^⊤softmax· VHead 1Q · K^⊤softmax· VHead 2Q · K^⊤softmax· VHead 3Q · K^⊤softmax· VHead 4Multi-Head Self-Attention各 head が独立に Q ・ K ・ V を計算 → 並列実行 → 結合

複数の attention head を並列実行して結合。多視点で関係性を捉える。

Transformer の数学ブログ

Dropout

E 資格
入力層隠れ層 (p=0.5)出力層学習時に確率 p で各ニューロンを脱落 → アンサンブル効果で過学習抑制

学習時にランダムにニューロンを脱落 → アンサンブル効果で過学習抑制。

E 資格 教科書を読む

Word2Vec 埋め込み空間

E 資格
kingqueenmanwomanTokyoJapanParisFranceking − man + woman ≈ queen / Tokyo : Japan = Paris : France意味的な関係がベクトル空間の方向として現れる

意味的な関係がベクトルの方向として現れる(king − man + woman ≈ queen)。

LLM 入門ブログ

Batch Normalization

E 資格
Batch Normalization活性化(σ²,μ大)標準化μ=0, σ²=1↓ 学習可能なスケール γ・シフト βy = γ·x̂ + β次の層へ各ミニバッチで標準化 → 内部共変量シフトを抑制 → 学習が高速・安定

各層で標準化 + 学習可能なスケール/シフト。深層学習を高速・安定化する基本テク。

G 検定 教科書を読む
Quality Control

品質管理

Shewhart 管理図

QC 検定
0102030485052サンプル番号(日)UCL = 52.5CL = 50LCL = 47.5

±3σ の管理限界を超えたら工程に異常。

QC 検定 教科書を読む

OC 曲線(抜取検査)

QC 検定
05%10%15%00.51.0ロット不良率 p合格確率AQL=1%LTPD=10%n=50, c=2n=100, c=4

横軸 = ロット不良率、縦軸 = 合格確率。AQL/LTPD のマーキング。

QC 検定 教科書を読む
Reinforcement Learning

強化学習

Q-Learning のグリッド

E 資格
🚶🏁4×4 グリッドの Q 値(濃い青 = 高 Q)各セル内の 4 三角 = 上 / 右 / 下 / 左 の Q 値

4×4 グリッドで各セルの Q 値(上下左右)をヒートマップ表示。報酬最大化の方向。

強化学習 入門ブログ

RLHF(人間フィードバック強化学習)

E 資格 / G 検定
RLHF: 人間フィードバックによる強化学習SFT モデル応答 A / B人間ラベラ選好データA>B報酬モデル学習PPO 更新最終 LLM報酬デプロイ

人間の選好で報酬モデルを学習 → PPO で LLM を微調整する ChatGPT 系の核技術。

LLM 入門ブログ
Optimization

最適化

損失関数のランドスケープ

E 資格
Global minLocal minSaddle pointStart勾配降下のパス(緑)・ 局所最適 / 鞍点 / 大域最適

局所最適 ・ 鞍点 ・ 大域最適。勾配降下が辿る経路の難しさ。

線形代数を AI 視点で