図解で学ぶ統計
統計検定 4 級〜1 級と関連検定のキー概念を SVG 図 47 種 にまとめました。「数式だけだとピンと来ない」「全体像を 1 ページで掴みたい」というときに使ってください。各図から関連する教科書ページへ飛べます。
※ すべての図はサイト内で生成されており、ダークモードに自動追従・印刷も可能です。
可視化の基礎
ヒストグラム vs 棒グラフ
入門・4 級連続量(隣接)と質的データ(隙間)で形を変える理由。
4 級 教科書を読む →箱ひげ図の解剖
4 級5 数要約 + 外れ値が一目でわかる。
4 級 教科書を読む →確率分布
二項分布の形
3 級$\mathrm{Bin}(20, 0.4)$ は平均 $np$ あたりに山。
3 級 教科書を読む →標準正規分布
3 級±1σ ≒ 68%・±2σ ≒ 95% の経験則。
3 級 教科書を読む →t 分布 vs 標準正規
2 級自由度が小さいほど裾が厚い。
2 級 教科書を読む →カイ二乗分布
準 1 級自由度ごとに形が変わる。独立性検定の基本。
準 1 級 教科書を読む →推測統計と検定
中心極限定理の収束
3 級もとの分布がいびつでも、標本平均は正規型に。
3 級 教科書を読む →95% 信頼区間
3 級繰り返し作った区間の 95% が母平均を含む。
3 級 教科書を読む →両側 5% の棄却域
2 級$|z| > 1.96$ なら $H_0$ を棄却。
2 級 教科書を読む →p 値の面積イメージ
2 級観測 z* より外側の面積が p 値。
2 級 教科書を読む →第 1 種・第 2 種の誤り
2 級閾値を動かすと α と β はトレードオフ。
2 級 教科書を読む →F 分布と棄却域
準 1 級ANOVA で使う F 分布。F > F* なら $H_0$ 棄却。
準 1 級 教科書を読む →ブートストラップ法
準 1 級 / DS原データから復元抽出を繰り返し、統計量の分布を経験的に得る。
統計チートシートを読む →回帰
散布図と回帰直線
2 級残差(赤線)の 2 乗和を最小化する直線。
2 級 教科書を読む →多変量解析
PCA の主成分軸
準 1 級PC1 = 分散最大方向。データの広がりを保つ次元削減。
準 1 級 教科書を読む →時系列解析
時系列の分解
準 1 級原系列 = トレンド + 季節 + 残差 に分解。
準 1 級 教科書を読む →自己相関(ACF)プロット
準 1 級AR(1) は指数減衰、MA(q) は q 次でストン。
準 1 級 教科書を読む →ベイズと数理統計
ベイズ更新
準 1 級事前 × 尤度 = 事後。データで信念が更新。
準 1 級 教科書を読む →尤度関数と MLE
1 級尤度の山頂が最尤推定値。山が鋭いほど精度が高い。
1 級 教科書を読む →MCMC のトレースプロット
1 級複数連鎖が同じ分布に収束 → サンプリング成功。
1 級 教科書を読む →確率過程と応用
カプラン・マイヤー生存曲線
準 1 級打ち切りを考慮した階段状の生存率推定。
準 1 級 教科書を読む →ランダムウォーク(ブラウン運動)
1 級離散ランダムウォークの極限がブラウン運動。
1 級 教科書を読む →機械学習
ROC 曲線
DS / G 検定AUC が大きいほど良い分類器。0.5 はランダム。
DS 検定 教科書を読む →バイアス・バリアンスのトレードオフ
DS / G 検定最適な複雑度で総合誤差が最小。
DS 検定 教科書を読む →学習曲線(過学習)
DS / G 検定検証誤差が再上昇する手前が早期終了の理想点。
DS 検定 教科書を読む →k-means クラスタリング
DS / E 資格k 個のクラスタとそれぞれの重心。教師なし学習の代表。
scikit-learn 入門ブログを読む →SVM のマージン最大化
DS / E 資格決定境界の両側に最大マージンを取る分類器。サポートベクトルが境界を決める。
E 資格 教科書を読む →GBDT の分割木
DS / E 資格残差を順次学習する弱学習器(浅い木)の集合。Kaggle 表データの定番。
scikit-learn 入門ブログ →K-Fold 交差検証
DS / G 検定データを K 分割してすべてを test に回し、汎化性能を頑健に推定。
DS 検定 教科書を読む →混同行列
DS / G 検定TP / FP / FN / TN の 4 マスから Precision・Recall・Accuracy がすべて出る。
DS 検定 教科書を読む →PR 曲線(Precision-Recall)
DS / G 検定不均衡データでは ROC より PR 曲線。AP(平均適合率)で総合性能を評価。
DS 検定 教科書を読む →ディープラーニング
活性化関数の比較
E 資格Sigmoid・Tanh・ReLU・Leaky ReLU の特徴を一目で。
E 資格 教科書を読む →最適化アルゴリズムの収束経路
E 資格SGD は振動、Momentum で慣性、Adam は適応的。
E 資格 教科書を読む →CNN アーキテクチャ
E 資格Conv → Pool → Conv → Pool → FC → Softmax の標準構成。
E 資格 教科書を読む →ニューラルネットの順伝播
E 資格入力層 → 隠れ層 → 出力層への信号伝播。各層は線形変換 + 活性化。
E 資格 教科書を読む →Self-Attention の重み
E 資格Q×K^⊤ → softmax で得られるトークン間の注目度行列。Transformer の核。
Transformer の数学ブログ →VAE アーキテクチャ
E 資格Encoder で μ ・ σ → reparameterization で z → Decoder で再構成。
拡散モデル ・ VAE ブログ →拡散モデルの順過程と逆過程
E 資格ノイズを徐々に加える(順)→ 除去する(逆)。後者を学習するのが拡散モデル。
拡散モデル ブログ →Multi-Head Attention
E 資格複数の attention head を並列実行して結合。多視点で関係性を捉える。
Transformer の数学ブログ →Dropout
E 資格学習時にランダムにニューロンを脱落 → アンサンブル効果で過学習抑制。
E 資格 教科書を読む →Word2Vec 埋め込み空間
E 資格意味的な関係がベクトルの方向として現れる(king − man + woman ≈ queen)。
LLM 入門ブログ →Batch Normalization
E 資格各層で標準化 + 学習可能なスケール/シフト。深層学習を高速・安定化する基本テク。
G 検定 教科書を読む →品質管理
Shewhart 管理図
QC 検定±3σ の管理限界を超えたら工程に異常。
QC 検定 教科書を読む →OC 曲線(抜取検査)
QC 検定横軸 = ロット不良率、縦軸 = 合格確率。AQL/LTPD のマーキング。
QC 検定 教科書を読む →強化学習
Q-Learning のグリッド
E 資格4×4 グリッドで各セルの Q 値(上下左右)をヒートマップ表示。報酬最大化の方向。
強化学習 入門ブログ →RLHF(人間フィードバック強化学習)
E 資格 / G 検定人間の選好で報酬モデルを学習 → PPO で LLM を微調整する ChatGPT 系の核技術。
LLM 入門ブログ →最適化
損失関数のランドスケープ
E 資格局所最適 ・ 鞍点 ・ 大域最適。勾配降下が辿る経路の難しさ。
線形代数を AI 視点で →