図解で学ぶ統計

標準正規分布

3 級

±1σ ≒ 68%・±2σ ≒ 95% の経験則。

t 分布 vs 標準正規

2 級

自由度が小さいほど裾が厚い。

カイ二乗分布

準 1 級

自由度ごとに形が変わる。独立性検定の基本。

Inference

推測統計と検定

中心極限定理の収束

3 級

もとの分布がいびつでも、標本平均は正規型に。

95% 信頼区間

3 級

繰り返し作った区間の 95% が母平均を含む。

両側 5% の棄却域

2 級

$|z| > 1.96$ なら $H_0$ を棄却。

p 値の面積イメージ

2 級

観測 z* より外側の面積が p 値。

第 1 種・第 2 種の誤り

2 級

閾値を動かすと α と β はトレードオフ。

F 分布と棄却域

準 1 級

ANOVA で使う F 分布。F > F* なら $H_0$ 棄却。

ブートストラップ法

準 1 級 / DS

原データから復元抽出を繰り返し、統計量の分布を経験的に得る。

統計チートシートを読む →

Regression

回帰

散布図と回帰直線

2 級

残差(赤線)の 2 乗和を最小化する直線。

Multivariate

多変量解析

PCA の主成分軸

準 1 級

PC1 = 分散最大方向。データの広がりを保つ次元削減。

Time Series

時系列解析

時系列の分解

準 1 級

原系列 = トレンド + 季節 + 残差に分解。

自己相関(ACF)プロット

準 1 級

AR(1) は指数減衰、MA(q) は q 次でストン。

Bayesian & Theory

ベイズと数理統計

ベイズ更新

準 1 級

事前 × 尤度 = 事後。データで信念が更新。

尤度関数と MLE

1 級

尤度の山頂が最尤推定値。山が鋭いほど精度が高い。

1 級教科書を読む →

MCMC のトレースプロット

1 級

複数連鎖が同じ分布に収束 → サンプリング成功。

1 級教科書を読む →

Stochastic & Applied

確率過程と応用

カプラン・マイヤー生存曲線

準 1 級

打ち切りを考慮した階段状の生存率推定。

ランダムウォーク(ブラウン運動)

1 級

離散ランダムウォークの極限がブラウン運動。

1 級教科書を読む →

Machine Learning

機械学習

ROC 曲線

DS / G 検定

AUC が大きいほど良い分類器。0.5 はランダム。

バイアス・バリアンスのトレードオフ

DS / G 検定

最適な複雑度で総合誤差が最小。

学習曲線(過学習)

DS / G 検定

検証誤差が再上昇する手前が早期終了の理想点。

k-means クラスタリング

DS / E 資格

k 個のクラスタとそれぞれの重心。教師なし学習の代表。

scikit-learn 入門ブログを読む →

SVM のマージン最大化

DS / E 資格

決定境界の両側に最大マージンを取る分類器。サポートベクトルが境界を決める。

GBDT の分割木

DS / E 資格

残差を順次学習する弱学習器(浅い木)の集合。Kaggle 表データの定番。

scikit-learn 入門ブログ →

K-Fold 交差検証

DS / G 検定

データを K 分割してすべてを test に回し、汎化性能を頑健に推定。

混同行列

DS / G 検定

TP / FP / FN / TN の 4 マスから Precision・Recall・Accuracy がすべて出る。

PR 曲線(Precision-Recall)

DS / G 検定

不均衡データでは ROC より PR 曲線。AP(平均適合率)で総合性能を評価。

Deep Learning

ディープラーニング

活性化関数の比較

E 資格

Sigmoid・Tanh・ReLU・Leaky ReLU の特徴を一目で。

最適化アルゴリズムの収束経路

E 資格

SGD は振動、Momentum で慣性、Adam は適応的。

CNN アーキテクチャ

E 資格

Conv → Pool → Conv → Pool → FC → Softmax の標準構成。

ニューラルネットの順伝播

E 資格

入力層 → 隠れ層 → 出力層への信号伝播。各層は線形変換 + 活性化。

Self-Attention の重み

E 資格

Q×K^⊤ → softmax で得られるトークン間の注目度行列。Transformer の核。

Transformer の数学ブログ →

VAE アーキテクチャ

E 資格

Encoder で μ ・ σ → reparameterization で z → Decoder で再構成。

拡散モデル・ VAE ブログ →

拡散モデルの順過程と逆過程

E 資格

ノイズを徐々に加える(順)→ 除去する(逆)。後者を学習するのが拡散モデル。

拡散モデルブログ →

Multi-Head Attention

E 資格

複数の attention head を並列実行して結合。多視点で関係性を捉える。

Transformer の数学ブログ →

Dropout

E 資格

学習時にランダムにニューロンを脱落 → アンサンブル効果で過学習抑制。