本文へスキップ
統計ロードマップ
Glossary

統計用語集

統計検定 4級〜1級で登場する重要用語をまとめた辞典です。各用語に短い定義と「関連する教科書の節」へのリンクを付けています。試験前の最終チェックや、学習中に意味を素早く確認したいときにお使いください。全 462 語。

462/462
級フィルタ:
Level

4級レベルの用語 (34)

平均値
へいきんち · mean
4代表値

全データの合計をデータ数で割った値。データの中心位置を表すもっとも基本的な代表値。

関連する教科書の節を読む →
中央値
ちゅうおうち · median
4代表値

データを昇順に並べたとき真ん中にくる値。外れ値の影響を受けにくい代表値。

関連する教科書の節を読む →
最頻値
さいひんち · mode
4代表値

データの中でもっとも多く出現する値。質的データ(カテゴリ)で唯一使える代表値であり、分布の山の位置を表す。複数の値が同じ最大度数なら最頻値は複数となる。

関連する教科書の節を読む →
範囲
はんい · range
4ばらつき

データの最大値から最小値を引いた値。もっとも単純なばらつきの指標。

関連する教科書の節を読む →
四分位数
しぶんいすう · quartile
4ばらつき

データを昇順で 4 等分したときの 3 つの区切り値 は中央値。

関連する教科書の節を読む →
四分位範囲
しぶんいはんい · IQR (interquartile range)
4ばらつき

。中央 50% のデータの広がり。外れ値に頑健。

関連する教科書の節を読む →
箱ひげ図
はこひげず · box plot
4可視化

最小値・・中央値・・最大値の五数で分布を要約する図。複数群比較に便利。

関連する教科書の節を読む →
度数分布表
どすうぶんぷひょう · frequency table
4可視化

データを階級に分け、各階級の度数(個数)をまとめた表。ヒストグラムの基礎。

関連する教科書の節を読む →
ヒストグラム
ひすとぐらむ · histogram
4可視化

度数分布表を棒グラフ化したもの。隣の棒は隙間なく並べ、データの分布形を視覚化する。

関連する教科書の節を読む →
順列
じゅんれつ · permutation
4場合の数

異なる 個から 個を選んで順序付けて並べる方法の総数。

関連する教科書の節を読む →
組合せ
くみあわせ · combination
4場合の数

異なる 個から 個を順序を区別せず選ぶ方法の総数。

関連する教科書の節を読む →
余事象
よじしょう · complementary event
4確率

事象 が起こらない事象。。「少なくとも〜」型の問題に強い。

関連する教科書の節を読む →
度数
どすう · frequency
4データ整理

ある階級(または値)に属するデータの個数。度数分布表で各階級ごとに数えた件数のこと。

関連する教科書の節を読む →
相対度数
そうたいどすう · relative frequency
4データ整理

各階級の度数を全体の度数で割った値(=割合)。データ規模が違う集団同士の比較に便利。

関連する教科書の節を読む →
累積度数
るいせきどすう · cumulative frequency
4データ整理

ある階級までの度数を順に足し上げた値。「○○以下が何人いるか」が一目でわかる。

関連する教科書の節を読む →
階級
かいきゅう · class interval
4データ整理

度数分布表で連続データを区切る区間(例: 60〜70 点)。階級幅は基本的に揃える。

関連する教科書の節を読む →
階級値
かいきゅうち · class midpoint
4データ整理

各階級の中央の値(=区間の中点)。度数分布表から平均などを計算するときの代表値として使う。

関連する教科書の節を読む →
散布図
さんぷず · scatter plot
4可視化

2 変数を横軸 ・縦軸 に取って点でプロットした図。2 変数の関係(相関)を視覚的に確認できる。

関連する教科書の節を読む →
棒グラフ
ぼうぐらふ · bar chart
4可視化

カテゴリごとの数量を棒の高さで比べる図。質的データ・離散量に向く。隣接させない(ヒストグラムとは異なる)。

関連する教科書の節を読む →
折れ線グラフ
おれせんぐらふ · line chart
4可視化

時系列など順序のあるデータを線でつないだ図。推移・トレンドを示すのに適している。

関連する教科書の節を読む →
円グラフ
えんぐらふ · pie chart
4可視化

全体を 100% として各項目の構成比を扇形で示す図。カテゴリが多すぎると見にくい。

関連する教科書の節を読む →
試行
しこう · trial
4確率

結果が偶然に決まる行為(コイン投げ・サイコロを振るなど)。確率の議論の出発点。

関連する教科書の節を読む →
事象
じしょう · event
4確率

試行の結果として起こりうる集合(例: サイコロで偶数の目が出る)。1 個の結果は「根元事象」と呼ぶ。

関連する教科書の節を読む →
排反事象
はいはんじしょう · mutually exclusive events
4確率

同時には起こりえない事象どうし。。確率の加法定理で和の確率がそのまま足し算になる条件。

関連する教科書の節を読む →
質的データ
しつてきでーた · qualitative data
4データ整理

性別・血液型・好みなど、数値で大小を比較できないカテゴリのデータ。名義尺度・順序尺度に分類される。

関連する教科書の節を読む →
量的データ
りょうてきでーた · quantitative data
4データ整理

身長・売上・気温など、数値で大小や差を比較できるデータ。間隔尺度・比例尺度に分類される。

関連する教科書の節を読む →
離散変数と連続変数
りさんへんすうとれんぞくへんすう · discrete vs. continuous variable
4データ整理

離散変数は人数・回数のような飛び飛びの値、連続変数は身長・時間のように切れ目なく値を取る変数。扱う確率分布が異なる。

関連する教科書の節を読む →
同様に確からしい
どうようにたしからしい · equally likely
4確率

ある試行のすべての根元事象が同じ確率で起こる状態。「サイコロ・コイン・くじ」など古典的確率の前提。

関連する教科書の節を読む →
樹形図
じゅけいず · tree diagram
4場合の数

場合の数や確率を漏れなく数えるために、選択を枝分かれで描いた図。条件付き確率の理解にも有効。

関連する教科書の節を読む →
パーセンタイル
ぱーせんたいる · percentile
4ばらつき

データを小さい順に並べたとき下から の位置にある値。 パーセンタイルは中央値、 は四分位数。

関連する教科書の節を読む →
確率変数
かくりつへんすう · Random variable
4確率分布

ランダムな結果を数値に対応させた変数。サイコロの出目・身長・通勤遅延回数など。離散型(整数値)と連続型(実数値)に分類される。確率分布で振る舞いを記述。

関連する教科書の節を読む →
二項分布
にこうぶんぷ · Binomial distribution
4確率分布

成功確率 の試行を独立に 回繰り返したときの成功回数の分布。。コイン投げ・不良品個数・アンケートの賛成数。 が大きいと正規分布に近づく。

関連する教科書の節を読む →
68-95-99.7ルール
ろくじゅうはちきゅうじゅうごきゅうじゅうきゅうてんなな · 68-95-99.7 rule
4確率分布

正規分布で平均 ±1σ に約 68%、±2σ に約 95%、±3σ に約 99.7% のデータが含まれる経験則。品質管理(±3σ から外れたら異常)・偏差値(平均から ±1σ で偏差値 60-40)で実用される。

関連する教科書の節を読む →
中心極限定理
ちゅうしんきょくげんていり · Central Limit Theorem (CLT)
4確率分布

独立同分布の確率変数の和(平均)は、母集団の分布形状によらず、サンプルサイズが大きくなると正規分布に近づく定理。統計的推測(信頼区間・仮説検定)の理論的基盤。

関連する教科書の節を読む →
Level

3級レベルの用語 (45)

分散
ぶんさん · variance
3ばらつき

偏差の 2 乗の平均。データのばらつきの大きさを表す代表的な指標。

関連する教科書の節を読む →
標準偏差
ひょうじゅんへんさ · standard deviation
3ばらつき

分散の正の平方根。もとのデータと同じ単位でばらつきを表現できる。

関連する教科書の節を読む →
共分散
きょうぶんさん · covariance
32変数

。2 変数の連動の方向を示す。

関連する教科書の節を読む →
相関係数
そうかんけいすう · correlation coefficient
32変数

の値で 2 変数の直線関係の強さを表す。

関連する教科書の節を読む →
標準化
ひょうじゅんか · standardization (z-score)
3変換

により、平均 0・標準偏差 1 の物差しに変換する操作。

関連する教科書の節を読む →
偏差値
へんさち · T-score
3変換

z スコアを に変換した値。平均 50・標準偏差 10 の物差し。

関連する教科書の節を読む →
条件付き確率
じょうけんつきかくりつ · conditional probability
3確率

事象 が起こったもとで が起こる確率。

関連する教科書の節を読む →
確率変数
かくりつへんすう · random variable
3確率

試行結果に応じて値が確率的に決まる変数。離散と連続がある。 で表すのが慣例。

関連する教科書の節を読む →
期待値
きたいち · expectation
3確率

確率変数の「ならした平均値」。離散なら

関連する教科書の節を読む →
二項分布
にこうぶんぷ · binomial distribution
3分布

成功確率 のベルヌーイ試行を 回繰り返したときの成功回数 の分布。

関連する教科書の節を読む →
正規分布
せいきぶんぷ · normal (Gaussian) distribution
3分布

釣鐘型の連続分布 。中心極限定理により多くの平均量がこれに近づく。

関連する教科書の節を読む →
信頼区間
しんらいくかん · confidence interval
3推定

母集団の未知パラメータが「ある信頼度で」入る区間。例:

関連する教科書の節を読む →
中心極限定理
ちゅうしんきょくげんていり · central limit theorem (CLT)
3理論

母集団の分布によらず、 が十分大きいとき標本平均は近似的に正規分布に従う、という定理。

関連する教科書の節を読む →
母集団
ぼしゅうだん · population
3推測統計

調査・推測の対象となる全データ集団。母集団の真の値(母平均・母分散など)を「母数(パラメータ)」と呼ぶ。

関連する教科書の節を読む →
標本
ひょうほん · sample
3推測統計

母集団から抽出された一部のデータ。標本から計算した値(標本平均など)を「統計量」と呼ぶ。

関連する教科書の節を読む →
全数調査
ぜんすうちょうさ · census
3標本抽出

母集団の全要素を調べる調査(国勢調査など)。誤差は小さいがコスト・時間がかかる。

関連する教科書の節を読む →
標本調査
ひょうほんちょうさ · sample survey
3標本抽出

母集団の一部だけを調べて全体を推測する調査。コストが低く、ほとんどの社会調査で採用される。

関連する教科書の節を読む →
無作為抽出
むさくいちゅうしゅつ · random sampling
3標本抽出

母集団のどの要素も同じ確率で標本に選ばれるようにする抽出法。推測統計の前提となる。

関連する教科書の節を読む →
標準正規分布
ひょうじゅんせいきぶんぷ · standard normal distribution
3確率分布

平均 0・分散 1 の正規分布 。任意の正規分布は標準化により標準正規分布に変換できる。

関連する教科書の節を読む →
z 値
ぜっとち · z-score
3推測統計

。データを標準化したときの値。「平均から標準偏差いくつ分離れているか」を表す。

関連する教科書の節を読む →
確率密度関数
かくりつみつどかんすう · probability density function (pdf)
3確率分布

連続型確率変数の分布を表す関数 。区間 の確率は

関連する教科書の節を読む →
累積分布関数
るいせきぶんぷかんすう · cumulative distribution function (cdf)
3確率分布

。「 以下になる確率」を返す関数。pdf を積分すると得られる。

関連する教科書の節を読む →
大数の法則
たいすうのほうそく · law of large numbers
3推測統計

標本サイズ を大きくするほど、標本平均が母平均に近づく(確率収束する)という法則。推測統計の基盤。

関連する教科書の節を読む →
ベルヌーイ分布
べるぬーいぶんぷ · Bernoulli distribution
3確率分布

0 か 1 の値だけを取る最も単純な分布。 回の独立試行を集めると二項分布になる。

関連する教科書の節を読む →
復元抽出
ふくげんちゅうしゅつ · sampling with replacement
3標本抽出

抽出した要素を毎回母集団に戻してから次を引く方法。各回の試行が独立になり、二項分布などの前提となる。

関連する教科書の節を読む →
非復元抽出
ひふくげんちゅうしゅつ · sampling without replacement
3標本抽出

一度抽出した要素は戻さずに次を引く方法。実際の調査の標準。試行は独立でなく、超幾何分布などで扱う。

関連する教科書の節を読む →
母平均
ぼへいきん · population mean
3推測統計

母集団全体の平均値 。標本平均 は母平均の不偏推定量で、推測統計の中心的な対象。

関連する教科書の節を読む →
母分散
ぼぶんさん · population variance
3推測統計

母集団全体の分散 。標本分散より不偏分散( で割る)の方が母分散の不偏推定量となる。

関連する教科書の節を読む →
母比率
ぼひりつ · population proportion
3推測統計

母集団における特定属性を持つ要素の割合 。世論調査や品質管理で「賛成率」「不良率」として推定対象になる。

関連する教科書の節を読む →
標本比率
ひょうほんひりつ · sample proportion
3推測統計

標本のうち特定属性を持つ要素の割合 。大標本では に近づく(中心極限定理)。

関連する教科書の節を読む →
期待値の線形性
きたいちのせんけいせい · linearity of expectation
3確率

が独立性に関係なく常に成り立つ性質。確率論で最も使われる便利な道具。

関連する教科書の節を読む →
同時分布
どうじぶんぷ · joint distribution
3確率

複数の確率変数 が同時に取る値の確率分布。同時分布から各変数の周辺分布や条件付き分布が得られる。

関連する教科書の節を読む →
周辺分布
しゅうへんぶんぷ · marginal distribution
3確率

同時分布から他の変数を確率の足し合わせ(積分)で消去して得られる、1 つの変数の単独分布。

関連する教科書の節を読む →
二項定理
にこうていり · binomial theorem
3場合の数

。二項分布の確率関数の正体でもある重要な展開公式。

関連する教科書の節を読む →
QC7つ道具
きゅーしーななつどうぐ · Seven QC tools
3品質管理

現場の品質改善で使う 7 つの数値分析ツール ─ パレート図・特性要因図(フィッシュボーン)・ヒストグラム・散布図・管理図・チェックシート・グラフ(層別)。

関連する教科書の節を読む →
新QC7つ道具
しんきゅーしーななつどうぐ · Seven new QC tools
3品質管理

言語データ・概念整理向けの 7 つのツール ─ 親和図(KJ 法)・連関図・系統図・マトリクス図・マトリクスデータ解析法・PDPC 法・アローダイアグラム。1979 年提唱。

関連する教科書の節を読む →
PDCAサイクル
ぴーでぃーしーえーさいくる · PDCA Cycle
3品質管理

Plan(計画)→ Do(実行)→ Check(確認)→ Act(処置)を反復する継続改善の枠組み。Deming サイクルとも。仮説検証を回すというサイエンスの基本構造を経営に持ち込んだもの。

関連する教科書の節を読む →
p値
ぴーち · p-value
3仮説検定

帰無仮説 H₀ が正しいと仮定したときに、観測された統計量以上に極端な値が得られる確率。 なら H₀ を棄却する。『H₀ が正しい確率』ではないので解釈に注意。

関連する教科書の節を読む →
棄却域
ききゃくいき · Rejection region
3仮説検定

検定統計量がこの範囲に入ったら帰無仮説を棄却する領域。両側 z 検定で α=5% なら 、右片側で α=5% なら 。検定設計の中心概念。

関連する教科書の節を読む →
第一種の誤り
だいいっしゅのあやまり · Type I error
3仮説検定

帰無仮説 H₀ が正しいのに棄却してしまう誤り。発生確率 = 有意水準 。新薬で『効果がないのにある』と判定するなど。

関連する教科書の節を読む →
第二種の誤り
だいにしゅのあやまり · Type II error
3仮説検定

帰無仮説 H₀ が誤っているのに棄却しない誤り。発生確率 。検出力 = 。実際の効果を見逃すミス。第一種の誤りとはトレードオフ関係(片方を厳しくすれば他方が緩む)。

関連する教科書の節を読む →
z検定
ぜっとけんてい · z-test
3仮説検定

検定統計量 が標準正規分布に従うことを利用する検定。母分散既知 or 大標本で母平均・母比率の検定に使う。3 級で扱う最も基本的な検定。

関連する教科書の節を読む →
適合度検定
てきごうどけんてい · Goodness-of-fit test
3仮説検定

観測度数分布が理論分布に従うかを判定するカイ二乗検定。 が自由度 のカイ二乗分布に従う。サイコロの公平性、メンデルの遺伝の法則の検証など。

関連する教科書の節を読む →
片側検定
かたがわけんてい · One-sided test
3仮説検定

対立仮説 または のように方向を指定した検定。両側に比べ棄却域が片側に集中するため、同じ α で検出力が高い。事後に方向を変えるのは『p ハッキング』。

関連する教科書の節を読む →
両側検定
りょうがわけんてい · Two-sided test
3仮説検定

対立仮説 のように方向を限定しない検定。棄却域が両裾(各 )に分かれる。『変わったか』を見たい標準的な状況で使う。

関連する教科書の節を読む →
Level

2級レベルの用語 (128)

不偏分散
ふへんぶんさん · unbiased sample variance
2推定

。母分散 の不偏推定量。

関連する教科書の節を読む →
標準誤差
ひょうじゅんごさ · standard error (SE)
2推定

推定量のばらつきの大きさ。標本平均なら を増やすと縮む。

関連する教科書の節を読む →
自由度
じゆうど · degrees of freedom
2推定

推定で「自由に動ける情報の数」。不偏分散の自由度は 、回帰の残差は など。

関連する教科書の節を読む →
t 分布
てぃーぶんぷ · Student's t-distribution
2分布

標準正規より裾が厚い釣鐘型分布。母分散未知での母平均の推定・検定に使う。自由度を持つ。

関連する教科書の節を読む →
帰無仮説
きむかせつ · null hypothesis
2検定

「差はない」「効果はない」など、退屈で当たり障りのない出発点となる仮説。

関連する教科書の節を読む →
対立仮説
たいりつかせつ · alternative hypothesis
2検定

帰無仮説に反する、研究者が示したい仮説。 または

関連する教科書の節を読む →
有意水準
ゆういすいじゅん · significance level
2検定

が真なのに棄却してしまう確率」の上限。慣例的に

関連する教科書の節を読む →
p 値
ぴーち · p-value
2検定

のもとで、現在のデータと同等以上に極端なデータが観測される確率。 で棄却。

関連する教科書の節を読む →
第1種の誤り
だいいっしゅのあやまり · Type I error
2検定

が真なのに棄却してしまう誤り。確率は

関連する教科書の節を読む →
第2種の誤り
だいにしゅのあやまり · Type II error
2検定

が真なのに を棄却できない誤り。確率は 。検出力は

関連する教科書の節を読む →
カイ二乗検定
かいにじょうけんてい · chi-squared test
2検定

観測度数と期待度数の食い違いを で測る検定。適合度・独立性に使う。

関連する教科書の節を読む →
回帰係数
かいきけいすう · regression coefficient
2回帰

回帰直線の傾き が 1 単位増えたときの の予測値の変化量。

関連する教科書の節を読む →
決定係数
けっていけいすう · coefficient of determination
2回帰

。回帰モデルが応答変数の分散をどれだけ説明できたかの指標。

関連する教科書の節を読む →
最小二乗法
さいしょうにじょうほう · ordinary least squares (OLS)
2回帰

残差の 2 乗和を最小にするように回帰係数を推定する方法。

関連する教科書の節を読む →
不偏推定量
ふへんすいていりょう · unbiased estimator
2推定

期待値が母数に一致する推定量 。標本平均は母平均の不偏推定量、不偏分散は母分散の不偏推定量。

関連する教科書の節を読む →
カイ二乗分布
かいにじょうぶんぷ · chi-squared distribution
2確率分布

標準正規変数 の二乗和 の分布。自由度 。分散の検定や独立性の検定で使う。

関連する教科書の節を読む →
F 分布
えふぶんぷ · F distribution
2確率分布

2 つの独立なカイ二乗統計量の比の分布。分散分析・分散比の検定に使う。

関連する教科書の節を読む →
F 検定
えふけんてい · F test
2検定

F 分布を使った検定の総称。2 群の分散の等しさの検定や、回帰モデルの全係数 0 の検定など。

関連する教科書の節を読む →
対応のある t 検定
たいおうのあるてぃーけんてい · paired t-test
2検定

同じ被験者の前後比較など、ペア構造があるデータの平均差の検定。差 の平均が 0 かを検定する。

関連する教科書の節を読む →
対応のない t 検定
たいおうのないてぃーけんてい · two-sample t-test
2検定

独立な 2 群の平均差の検定。等分散を仮定するスチューデントの t 検定と、仮定しないウェルチの t 検定がある。

関連する教科書の節を読む →
分散分析
ぶんさんぶんせき · ANOVA (analysis of variance)
2検定

3 群以上の平均差を、群間変動と群内変動の比(F 値)で同時に検定する手法。一元配置・二元配置などがある。

関連する教科書の節を読む →
残差
ざんさ · residual
2回帰

実測値とモデルによる予測値の差 。回帰の当てはまりや前提(等分散・独立性)を残差プロットで診断する。

関連する教科書の節を読む →
多重共線性
たじゅうきょうせんせい · multicollinearity
2回帰

重回帰で説明変数どうしが強く相関している状態。係数の推定が不安定になる。VIF などで検出する。

関連する教科書の節を読む →
単純無作為抽出
たんじゅんむさくいちゅうしゅつ · simple random sampling
2標本抽出

母集団のすべての要素が等しい確率で選ばれる、最も基本的な無作為抽出法。

関連する教科書の節を読む →
層化抽出
そうかちゅうしゅつ · stratified sampling
2標本抽出

母集団を性別・年代などの層に分け、各層から無作為抽出する方法。層内が均質なほど推定精度が上がる。

関連する教科書の節を読む →
クラスター抽出
くらすたーちゅうしゅつ · cluster sampling
2標本抽出

母集団を地域・学校などの集落(クラスター)に分け、いくつかのクラスターを丸ごと抽出する方法。コスト効率が高い。

関連する教科書の節を読む →
統計法
とうけいほう · Statistics Act
2公的統計

公的統計の作成・利用に関する基本法律(2007 年全部改正)。基幹統計の指定、統計データの目的外利用、秘密保護などを規定。

関連する教科書の節を読む →
基幹統計
きかんとうけい · fundamental statistics
2公的統計

国勢統計(国勢調査)など、特に重要として総務大臣が指定する公的統計。報告義務・正確性確保の規定が強化されている。

関連する教科書の節を読む →
標本誤差
ひょうほんごさ · sampling error
2標本抽出

標本調査で全数を見ないことから生じる、推定値と母集団真値のズレ。標本サイズの平方根に反比例して小さくなる。

関連する教科書の節を読む →
非標本誤差
ひひょうほんごさ · non-sampling error
2標本抽出

回答漏れ・回答ミス・集計ミスなど、抽出以外の原因で生じる誤差。標本サイズを増やしても減らない。

関連する教科書の節を読む →
多段抽出
ただんちゅうしゅつ · multistage sampling
2標本抽出

都道府県 → 市区町村 → 世帯のように、段階的に抽出単位を絞り込む方法。大規模調査でコストを抑えられる。

関連する教科書の節を読む →
一様分布
いちようぶんぷ · uniform distribution
2確率分布

区間 で確率密度が一定の連続分布。乱数生成の基礎で、他分布のシミュレーションの出発点になる。

関連する教科書の節を読む →
幾何分布
きかぶんぷ · geometric distribution
2確率分布

成功確率 のベルヌーイ試行を繰り返したときの初めて成功するまでの試行回数の分布。

関連する教科書の節を読む →
信頼水準
しんらいすいじゅん · confidence level
2推定

信頼区間が母数を含む確率(例: 95%)。 の関係。区間幅と引き換えに信頼度を高められる。

関連する教科書の節を読む →
検出力
けんしゅつりょく · statistical power
2検定

対立仮説が真のとき正しく帰無仮説を棄却できる確率 。サンプルサイズ設計の基準として使う。

関連する教科書の節を読む →
効果量
こうかりょう · effect size
2検定

群間の差の大きさを標準化した指標(Cohen の など)。p 値だけでは分からない「実質的な大きさ」を示す。

関連する教科書の節を読む →
ノンパラメトリック検定
のんぱらめとりっくけんてい · nonparametric test
2検定

正規性などの分布仮定を置かず、順位や符号を用いる検定の総称。サンプルが小さい・分布が歪むときに有用。

関連する教科書の節を読む →
ウィルコクソンの符号順位検定
うぃるこくそんのふごうじゅんいけんてい · Wilcoxon signed-rank test
2検定

対応のある 2 群差を、差の符号と順位に基づいて検定するノンパラ手法。対応のある t 検定の正規性を仮定しない代替。

関連する教科書の節を読む →
マン・ホイットニーの U 検定
まんほいっとにーのゆーけんてい · Mann–Whitney U test
2検定

独立な 2 群の中央位置差を順位で検定するノンパラ手法。対応のない t 検定の正規性を仮定しない代替。

関連する教科書の節を読む →
スピアマンの順位相関係数
すぴあまんのじゅんいそうかんけいすう · Spearman's rank correlation
2回帰

2 変数の順位どうしのピアソン相関。単調関係を測り、外れ値や非線形変換に頑健。

関連する教科書の節を読む →
自由度調整済み決定係数
じゆうどちょうせいずみけっていけいすう · adjusted R²
2回帰

説明変数を増やすと無闇に上がる を、自由度で罰則化した指標。重回帰のモデル比較の基本ツール。

関連する教科書の節を読む →
AIC
えーあいしー · Akaike information criterion
2回帰

。当てはまり()とパラメータ数 の罰則の和。小さいほど良いモデル。

関連する教科書の節を読む →
BIC
びーあいしー · Bayesian information criterion
2回帰

。AIC よりパラメータ数の罰則が強く、より単純なモデルを選びやすい情報量規準。

関連する教科書の節を読む →
データクレンジング
でーたくれんじんぐ · data cleansing
2データ工学

入力ミス・重複・形式不統一などを発見・修正してデータを分析可能な状態にする工程。実務の分析時間の半分以上を占める。

関連する教科書の節を読む →
欠損値処理
けっそんちしょり · missing value imputation
2データ工学

欠損データを除外/平均補完/回帰補完/多重代入などで処理する手法群。欠損メカニズム(MCAR/MAR/MNAR)で適切な手法が変わる。

関連する教科書の節を読む →
標準化(スケーリング)
ひょうじゅんか · feature scaling
2データ工学

特徴量を平均 0 ・分散 1(標準化)、または (正規化)に揃える前処理。距離ベース手法・勾配法で必須。

関連する教科書の節を読む →
A/B テスト
えーびーてすと · A/B testing
2実務

ユーザーをランダムに 2 群に分け、施策の効果を比較する実験。Web マーケ・プロダクト改善で標準。仮説検定の応用そのもの。

関連する教科書の節を読む →
ピボットテーブル
ぴぼっとてーぶる · pivot table
2実務

Excel・BI ツールで、行/列/値を動的に切り替えてクロス集計を行う仕組み。DS 基礎試験では実技の中核機能。

関連する教科書の節を読む →
KPI
けーぴーあい · Key Performance Indicator
2実務

目標達成度を測る重要業績評価指標。事業の北極星指標(NSM)とともに、データドリブン経営の意思決定基準となる。

関連する教科書の節を読む →
国民経済計算
こくみんけいざいけいさん · System of National Accounts (SNA)
2公的統計

国の経済活動を生産・分配・支出の側面から体系的に記録する統計体系。GDP はその主要指標。日本は内閣府が作成。

関連する教科書の節を読む →
消費者物価指数
しょうひしゃぶっかしすう · Consumer Price Index (CPI)
2公的統計

家計が購入する商品・サービスの価格変動を、ある基準時を 100 として表す指数。総務省が作成、日銀の物価目標の対象。

関連する教科書の節を読む →
ウェイトバック集計
うぇいとばっくしゅうけい · weighting back
2公的統計

標本構成と母集団構成のズレを補正するため、各回答に「逆数(または比)」の重みを掛けて集計する手法。

関連する教科書の節を読む →
統計的開示制御
とうけいてきかいじせいぎょ · statistical disclosure control
2公的統計

公的統計データの提供時に、個人や事業所が特定されないよう、頂上値の丸めやセル抑制等で識別リスクを低減する処理。

関連する教科書の節を読む →
標本設計
ひょうほんせっけい · sample design
2公的統計

目標精度・コスト・回収率を踏まえ、抽出方法・標本サイズ・層化変数などを事前に決める計画段階。調査の質を大きく左右する。

関連する教科書の節を読む →
管理図
かんりず · control chart
2品質管理

工程から定期的に取った統計量を時系列で記録し、UCL/LCL を引いて異常を判定する図。Shewhart の X̄-R 管理図、p 管理図、c 管理図など。

関連する教科書の節を読む →
工程能力指数
こうていのうりょくしすう · process capability index (Cp/Cpk)
2品質管理

規格幅に対する工程のばらつきの大きさを表す指標。、中心ずれを考慮した も併用。製造業の目標

関連する教科書の節を読む →
シックスシグマ
しっくすしぐま · Six Sigma
2品質管理

の品質管理を目指す改革運動。100 万個に 3.4 個の不良率(3.4 PPM)。 に相当。モトローラ・GE が広めた。

関連する教科書の節を読む →
OC 曲線
おーしーきょくせん · Operating Characteristic Curve
2品質管理

抜取検査の性能を示す曲線。横軸=ロット不良率、縦軸=合格確率。AQL では合格、LTPD では不合格となるのが理想。

関連する教科書の節を読む →
AQL
えーきゅーえる · Acceptable Quality Level
2品質管理

合格品質水準。検査でほぼ常に合格とすべき不良率の上限。生産者リスク α が 5% 以下になる水準。

関連する教科書の節を読む →
LTPD
えるてぃーぴーでぃー · Lot Tolerance Percent Defective
2品質管理

ロット許容不良率。検査でほぼ常に不合格とすべき不良率。消費者リスク β が 10% 以下になる水準。

関連する教科書の節を読む →
QC 7 つ道具
きゅーしーななつどうぐ · Seven QC tools
2品質管理

パレート図・特性要因図・ヒストグラム・散布図・管理図・チェックシート・グラフ(層別)。数値データを使った品質改善の基本ツール。

関連する教科書の節を読む →
新 QC 7 つ道具
しんきゅーしーななつどうぐ · Seven new QC tools
2品質管理

親和図(KJ 法)・連関図・系統図・マトリクス図・マトリクスデータ解析・PDPC 法・アローダイアグラム。言語データ・概念整理に特化。

関連する教科書の節を読む →
TQM
てぃーきゅーえむ · Total Quality Management
2品質管理

総合的品質管理。3 本柱は『顧客重視・全員参加・継続的改善(カイゼン)』。日本の製造業の競争力の源泉となった経営手法。

関連する教科書の節を読む →
ROC曲線
あーるおーしーきょくせん · ROC Curve
2機械学習

二値分類の閾値を動かしたとき、真陽性率(縦軸)と偽陽性率(横軸)の関係を描いた曲線。AUC で性能を要約。

AUC
えーゆーしー · Area Under Curve
2機械学習

ROC 曲線の下側面積。1.0 で完璧、0.5 でランダム。閾値非依存の分類性能指標。

F1スコア
えふわんすこあ · F1 Score
2機械学習

適合率(Precision)と再現率(Recall)の調和平均。クラス不均衡なデータの分類評価で使われる。

特徴量エンジニアリング
とくちょうりょうえんじにありんぐ · Feature Engineering
2機械学習

ドメイン知識を活用して有用な特徴量を作る作業。テーブルデータのモデル性能を大きく左右する。

Welch の t 検定
うぇるちのてぃーけんてい · Welch's t-test
2仮説検定

2 標本の平均差を検定する手法のうち、等分散を仮定しないバージョン。Welch-Satterthwaite の近似自由度を用いる。現代の実務では既定値に近い扱い。

関連する教科書の節を読む →
対応のある t 検定
たいおうのあるてぃーけんてい · paired t-test
2仮説検定

同一個体・同一ペアで観測した 2 値の差について 1 標本 t 検定を行う方法。個人差が相殺されるため対応のないものより検出力が高い。

関連する教科書の節を読む →
母分散の検定
ぼぶんさんのけんてい · test for population variance
2仮説検定

正規母集団のもとで、不偏分散を で検定。製造工程のばらつき管理などに使う。正規性の崩れに敏感。

関連する教科書の節を読む →
一元配置分散分析
いちげんはいちぶんさんぶんせき · one-way ANOVA
2分散分析

3 群以上の平均を一度に比較する分散分析。多重比較問題を避けて全体差を判定する。F 統計量で群間平方和と群内平方和の比を取る。

関連する教科書の節を読む →
二元配置分散分析
にげんはいちぶんさんぶんせき · two-way ANOVA
2分散分析

2 つの因子を同時に扱う分散分析。主効果に加えて交互作用 (interaction) を検出できる。繰り返しがあれば交互作用が分離可能。

関連する教科書の節を読む →
交互作用
こうごさよう · interaction
2分散分析

2 元配置以上の分散分析で「ある因子の効果が、別の因子の水準で異なる」現象。プロットの折れ線が平行でないとき交互作用がある。

関連する教科書の節を読む →
Bonferroni 補正
ぼんふぇろーにほせい · Bonferroni correction
2多重比較

個の検定で各有意水準を に厳しくし、全体の Type I エラー率(FWER)を抑える方法。簡便だが保守的。

関連する教科書の節を読む →
Tukey の HSD
てゅーきーのえいちえすでぃー · Tukey's HSD
2多重比較

ANOVA の事後検定で、全ペア比較を等しい有意水準で行う方法。スチューデント化された範囲分布を使う。Bonferroni より検出力が高い。

重回帰分析
じゅうかいきぶんせき · multiple regression
2回帰分析

複数の説明変数を持つ線形回帰。各偏回帰係数 は他の変数を固定したときの効果。正規方程式

関連する教科書の節を読む →
偏回帰係数
へんかいきけいすう · partial regression coefficient
2回帰分析

重回帰モデルの個別の係数。「他の説明変数を固定したときの の効果」を表す。単純相関とは異なる。

関連する教科書の節を読む →
自由度調整済み決定係数
じゆうどちょうせいずみけっていけいすう · adjusted R-squared
2回帰分析

重回帰で説明変数を増やすと が必ず上がる問題を補正した指標。意味のない変数を増やすと逆に下がる。

関連する教科書の節を読む →
多重共線性
たじゅうきょうせんせい · multicollinearity
2回帰分析

説明変数同士が強く相関している状態。係数の標準誤差が膨張し、個別 t 値が小さくなる。VIF で診断。

関連する教科書の節を読む →
VIF
ぶいあいえふ · Variance Inflation Factor
2回帰分析

多重共線性の診断指標。 で計算され、5〜10 を超えると要注意。

関連する教科書の節を読む →
Cook の距離
くっくのきょり · Cook's distance
2残差診断

個別観測値が回帰係数に与える影響の総合指標。1 を大きく超える観測点はモデルへの影響が強い。

関連する教科書の節を読む →
てこ比
てこひ · leverage
2残差診断

説明変数 が他のデータから離れた観測点ほど大きい値を取る指標。 で表す。

関連する教科書の節を読む →
ヘテロスケダスティシティ
へてろすけだすてぃしてぃ · heteroscedasticity
2残差診断

回帰の残差の分散が一定でない状態(不均一分散)。残差プロットがラッパ型になる。 変換や WLS で対処。

関連する教科書の節を読む →
工程能力指数
こうていのうりょくしすう · Process capability index
2品質管理

規格幅 USL−LSL に対する工程ばらつきの相対指標。。中心ずれを考慮した 、目標値からの逸脱もペナルティ化する を併用する。

関連する教科書の節を読む →
シックスシグマ
しっくすしぐま · Six Sigma
2品質管理

規格幅が ±6σ に収まる工程能力(、不良率 ≒ 3.4 PPM)を目標とする品質改革手法。モトローラ発、GE が 1990 年代に展開。DMAIC サイクルで運用。

関連する教科書の節を読む →
管理図
かんりず · Control chart
2品質管理

工程の測定値を時系列で記録し、中心線・上下管理限界(±3σ)で異常を検出する図。Shewhart が 1924 年に考案。X̄-R / X̄-s / X-Rs(計量値)、p / np / c / u(計数値)に分かれる。

関連する教科書の節を読む →
OC曲線
おーしーきょくせん · Operating Characteristic Curve
2品質管理

抜取検査計画における『ロット不良率 p』と『合格確率 L(p)』の関係を表す曲線。AQL(生産者リスク α=5% 以下)と LTPD(消費者リスク β=10% 以下)で計画の性能を要約する。

関連する教科書の節を読む →
実験計画法
じっけんけいかくほう · Design of Experiments (DOE)
2実験計画法

限られた試行で複数因子の効果を効率よく分離する統計手法。Fisher の 3 原則(反復・無作為化・局所管理)を出発点に、一元配置・二元配置・直交表・田口メソッドに発展。

関連する教科書の節を読む →
直交表
ちょっこうひょう · Orthogonal array
2実験計画法

列で、任意の 2 列の水準組合せが同回数現れる表。 などが代表的。少ない試行で多因子の主効果を独立に推定できる。

関連する教科書の節を読む →
交互作用
こうごさよう · Interaction effect
2実験計画法

因子の組合せが主効果の単純合算で説明できない現象。二元配置 ANOVA で として検定する。交互作用を見落とすと因子の真の効果を取り違える。

関連する教科書の節を読む →
田口メソッド
たぐちめそっど · Taguchi Method
2実験計画法

田口玄一が体系化した品質工学。誤差因子のもとで応答が安定する制御因子の組合せを SN 比 の最大化で探す『ロバスト設計』。直交表が主道具。

関連する教科書の節を読む →
信頼性関数
しんらいせいかんすう · Reliability function
2信頼性工学

時刻 までに故障しない確率 。故障率 から と一意に決まる。生存解析の生存関数と同概念。

関連する教科書の節を読む →
バスタブ曲線
ばすたぶきょくせん · Bathtub curve
2信頼性工学

故障率 の典型的な時間変化。初期故障期(減少)→ 偶発故障期(一定)→ 摩耗故障期(増加)の 3 段階。バーンインで初期故障を、予防保守で摩耗故障を制御する。

関連する教科書の節を読む →
ワイブル分布
わいぶるぶんぷ · Weibull distribution
2信頼性工学

形状 と尺度 をもつ寿命分布。 で初期故障、 で指数分布(偶発故障)、 で摩耗故障 ─ バスタブ曲線の各段階を 1 つの族で表せる。

関連する教科書の節を読む →
MTBF
えむてぃーびーえふ · Mean Time Between Failures
2信頼性工学

修理可能系の平均故障間隔(MTTF + MTTR)。 で可用性を計算。SLA でファイブナイン(99.999% = 年 5 分以下停止)の根拠数字。

関連する教科書の節を読む →
FMEA
えふえむいーえー · Failure Mode and Effects Analysis
2信頼性工学

部品の故障モードを発生度・影響度・検知容易性で評価し、リスク優先数 RPN = O × S × D を算出するボトムアップの予防分析。FT が結果から原因を辿るのに対し、FMEA は原因から影響を予測。

関連する教科書の節を読む →
FT法
えふてぃーほう · Fault Tree Analysis
2信頼性工学

頂上事象(望まない結果)から AND/OR 論理ゲートで原因を分解するトップダウン安全分析手法。基本事象に確率を付与して頂上事象の発生確率を計算。航空・原発・医療機器の業界標準。

関連する教科書の節を読む →
固有値
こゆうち · Eigenvalue
2線形代数

正方行列 について ()を満たすスカラー 。特性方程式 の解。トレース = 固有値の和、行列式 = 固有値の積。

関連する教科書の節を読む →
固有ベクトル
こゆうべくとる · Eigenvector
2線形代数

を満たす非ゼロベクトル をかけても **方向が変わらない** 特別な向き。対称行列では互いに直交する固有ベクトルが選べる。

関連する教科書の節を読む →
対角化
たいかくか · Diagonalization
2線形代数

正方行列を の形に分解(P は固有ベクトル行列、Λ は固有値の対角行列)。 より行列のべき乗が容易になる。

関連する教科書の節を読む →
CASMフレームワーク
きゃすむふれーむわーく · Cognitive Aspects of Survey Methodology
2調査統計

回答者の認知過程を 4 段階(質問の理解 → 関連情報の検索 → 判断の形成 → 回答の表出)で整理した枠組み。Tourangeau らが提唱。各段階で起こる誤差を予測して調査票を設計する。

関連する教科書の節を読む →
非標本誤差
ひひょうほんごさ · Non-sampling error
2調査統計

標本誤差以外の誤差全般。カバレッジ誤差(フレーム不備)・無回答誤差・測定誤差・処理誤差の 4 種類が主軸。標本サイズを増やしても減らないので、ビッグデータでも残る。

関連する教科書の節を読む →
カバレッジ誤差
かばれっじごさ · Coverage error
2調査統計

標本フレーム(調査台帳)が母集団を正しく反映していない誤差。1936 年米大統領選 Literary Digest 誌の予測失敗が古典的事例。Web 調査・固定電話 RDD でも常に問題になる。

関連する教科書の節を読む →
社会的望ましさバイアス
しゃかいてきのぞましさばいあす · Social desirability bias
2調査統計

回答者が社会通念上『望ましい』方向に回答を歪めるバイアス。飲酒量・運動量・収入・学歴・違反行為などで顕著。匿名性の確保や間接質問法で軽減。

関連する教科書の節を読む →
事後層化
じごそうか · Post-stratification
2調査統計

取得した標本を年齢×性別等で集計し、母集団の構成比に合わせる重み付け。Web 調査・任意参加調査の偏り矯正に使う標準手法。レイキング(複数変数同時調整)に拡張可能。

関連する教科書の節を読む →
Lasso回帰
らっそかいき · Lasso regression
2機械学習

L1 正則化付き線形回帰: 。係数を完全に 0 にする効果があり、**特徴選択** に使える。多重共線性下での不安定さは ElasticNet で緩和。

関連する教科書の節を読む →
Ridge回帰
りっじかいき · Ridge regression
2機械学習

L2 正則化付き線形回帰: 。係数を縮小して多重共線性に強い。すべての特徴を残すので解釈はしやすいが、不要特徴の除去はしない。

関連する教科書の節を読む →
勾配ブースティング
こうばいぶーすてぃんぐ · Gradient Boosting
2機械学習

弱学習器(決定木)を順次に学習し、前段の残差を次の木が予測するアンサンブル手法。XGBoost・LightGBM・CatBoost が現代の表形式データ予測のデファクト標準。

関連する教科書の節を読む →
ランダムフォレスト
らんだむふぉれすと · Random Forest
2機械学習

多数の決定木をブートストラップサンプル + 特徴量サンプリングで作り、平均/多数決で予測する **バギング** 系のアンサンブル。過学習に頑健で実務の最初の選択肢。

関連する教科書の節を読む →
サポートベクターマシン
さぽーとべくたーましん · Support Vector Machine (SVM)
2機械学習

クラス境界からのマージン(最近距離)を最大化する分類器。**カーネルトリック** で非線形分離に拡張(RBF カーネルが標準)。少データ・高次元で安定。

関連する教科書の節を読む →
ロジスティック回帰
ろじすてぃっくかいき · Logistic regression
2機械学習

の線形分類器。確率出力・係数解釈性・高速。実務のベースラインで最頻出。交差エントロピー損失で学習。

関連する教科書の節を読む →
k-meansクラスタリング
けーみーんずくらすたりんぐ · k-means clustering
2機械学習

クラスタ数 を事前決定し、各点を最寄りの重心に割り当て + 重心更新を反復する教師なし学習。 決定にエルボー法・シルエットスコアを使う。初期化感度を **k-means++** で軽減。

関連する教科書の節を読む →
DBSCAN
でぃーびーすきゃん · DBSCAN
2機械学習

Density-Based Spatial Clustering of Applications with Noise。密度ベースで 不要・任意形状のクラスタ発見・外れ値自動検出が利点。`eps`・`min_samples` がハイパラ。

関連する教科書の節を読む →
t-SNE
てぃーすにー · t-Distributed Stochastic Neighbor Embedding
2機械学習

高次元データの局所近傍関係を低次元(通常 2 次元)で保つ非線形次元削減手法。可視化に強いが大域構造は壊れがち。Word Embedding 可視化の定番。後継 UMAP は大域構造もより保つ。

関連する教科書の節を読む →
協調フィルタリング
きょうちょうふぃるたりんぐ · Collaborative Filtering
2機械学習

ユーザー × アイテムの評価行列から、似たユーザー / 似たアイテムを使って好みを予測する推薦手法。**行列分解(SVD・ALS)** が中核数学。Netflix Prize 優勝モデルの基盤。

関連する教科書の節を読む →
Welchのt検定
うぇるちのてぃーけんてい · Welch's t-test
2仮説検定

等分散を仮定しない 2 標本 t 検定。Excel の T.TEST 関数で `検定の種類=3`、または分析ツール『等分散を仮定しない 2 標本検定』で実行。実務での 2 群比較の標準。

関連する教科書の節を読む →
対応のあるt検定
たいおうのあるてぃーけんてい · Paired t-test
2仮説検定

同じ被験者の前後比較で平均差を検定。被験者間のばらつきを相殺できるため検出力が高い。Excel の T.TEST で `検定の種類=1`。投薬前後・施策前後・テスト前後で頻用。

関連する教科書の節を読む →
多重比較
たじゅうひかく · Multiple comparisons
2仮説検定

3 群以上の検定で、各ペア検定を繰り返すと第一種の誤りが増殖する問題。**Bonferroni 補正**(α/m)・**Tukey の HSD**・**Dunnett 検定** で全体の α を制御するのが定石。

関連する教科書の節を読む →
Cramér's V
くらめーるぶい · Cramér's V
2分割表分析

で 0〜1 の標準化された関連の強さ指標。p 値とセットで報告し、 で弱、 で中、 で強の目安。

関連する教科書の節を読む →
Fisherの正確検定
ふぃっしゃーのせいかくけんてい · Fisher's exact test
2分割表分析

分割表の独立性を超幾何分布で厳密計算する検定。期待度数 < 5 の小標本でカイ二乗近似が破綻する場面で使う。R: `fisher.test()`、Python: `scipy.stats.fisher_exact()`。

関連する教科書の節を読む →
オッズ比
おっずひ · Odds Ratio (OR)
2分割表分析

表で 。ケースコントロール研究で頻用。 が近似的に正規分布で、SE = 。希少疾患では

関連する教科書の節を読む →
マンテル-ヘンツェル法
まんてる-へんつぇるほう · Mantel-Haenszel method
2分割表分析

層別された複数の 表を統合して合同オッズ比を算出する古典的手法。。シンプソンのパラドックスを回避。

関連する教科書の節を読む →
ロジット関数
ろじっとかんすう · Logit function
2ロジスティック回帰

。確率 にマッピング。逆関数がシグモイド 。ロジスティック回帰の中核。

関連する教科書の節を読む →
Hosmer-Lemeshow検定
ほすまー-れめしょうけんてい · Hosmer-Lemeshow test
2ロジスティック回帰

ロジスティック回帰の適合度を見る検定。予測確率を 10 分位に分け、観測 vs 期待のカイ二乗統計量で評価。p > 0.05 で『適合してる』(逆向きの仮説検定)。

関連する教科書の節を読む →
GDPR
じーでぃーぴーあーる · General Data Protection Regulation
2プライバシー

EU の一般データ保護規則(2018 施行)。EU 域内の個人データ処理に適用、忘れられる権利・データポータビリティ・DPO 選任義務など。違反は最大 2,000 万ユーロまたは全世界売上の 4%。

関連する教科書の節を読む →
EU AI Act
いーゆーえーあいあくと · EU AI Act
2AIガバナンス

世界初の包括的 AI 規制(2024 施行)。リスクレベル別(禁止 / ハイリスク / 限定リスク / 最小リスク)に要求事項。違反は最大全世界売上の 7%。EU 域外企業も EU 個人を対象なら適用対象。

関連する教科書の節を読む →
SHAP
しゃっぷ · SHapley Additive exPlanations
2AI公平性

ゲーム理論のシャプレイ値で機械学習モデルの予測を説明する手法。Local + Global 両対応で、XGBoost / LightGBM 等で標準的に使われる。XAI(説明可能 AI)の現代の代表手法。

関連する教科書の節を読む →
Model Card
もでるかーど · Model Card
2AIガバナンス

機械学習モデルの仕様書(Mitchell et al. 2019)。学習データ・性能指標・想定用途・既知の制限・公平性評価を記載。Hugging Face Hub で標準化。AI ガバナンスの基本ドキュメント。

関連する教科書の節を読む →
Level

準1級レベルの用語 (137)

ポアソン分布
ぽあそんぶんぷ · Poisson distribution
準1分布

単位時間あたり平均 回起こる稀な事象の発生回数の分布。

関連する教科書の節を読む →
指数分布
しすうぶんぷ · exponential distribution
準1分布

ポアソン過程の事象間隔(待ち時間)の分布。。無記憶性をもつ。

関連する教科書の節を読む →
多変量正規分布
たへんりょうせいきぶんぷ · multivariate normal
準1分布

正規分布の多次元版 。線形変換も周辺分布も条件付き分布も正規。

関連する教科書の節を読む →
ベイズの定理
べいずのていり · Bayes' theorem
準1ベイズ

事後分布 尤度 事前分布。データを見て信念を更新する公式。

関連する教科書の節を読む →
事後分布
じごぶんぷ · posterior distribution
準1ベイズ

データを観測した後の母数 の分布。点推定や信用区間の出発点。

関連する教科書の節を読む →
共役分布
きょうやくぶんぷ · conjugate prior
準1ベイズ

事前分布と尤度の組み合わせで、事後分布が同じ族の分布に閉じる関係。例: ベータ-二項。

関連する教科書の節を読む →
重回帰分析
じゅうかいきぶんせき · multiple regression
準1回帰

複数の説明変数を持つ線形回帰モデル。

関連する教科書の節を読む →
ロジスティック回帰
ろじすてぃっくかいき · logistic regression
準1回帰

二値応答変数(成功/失敗)を扱う GLM。オッズの対数 をモデル化する。係数 は「説明変数が 1 単位増えたときオッズが 倍になる」と解釈できる。マーケティング・医療で頻出。

関連する教科書の節を読む →
主成分分析
しゅせいぶんぶんせき · PCA (principal component analysis)
準1多変量

分散共分散行列の固有ベクトル方向に射影することで、多変量データを低次元に圧縮する手法。

関連する教科書の節を読む →
AR モデル
えーあーるもでる · autoregressive model
準1時系列

。過去の値で現在を予測する時系列モデル。

関連する教科書の節を読む →
ARIMA
ありま · ARIMA (autoregressive integrated moving average)
準1時系列

差分を取って定常化した後 ARMA でモデル化する非定常時系列の標準モデル。

関連する教科書の節を読む →
ベイズ推定
べいずすいてい · Bayesian estimation
準1ベイズ

事前分布とデータから事後分布 を求め、その分布(または期待値・MAP)で推定する方法。

関連する教科書の節を読む →
事前分布
じぜんぶんぷ · prior distribution
準1ベイズ

データを観察する前に持つパラメータ への信念を表す確率分布 。共役分布や無情報事前分布が代表的。

関連する教科書の節を読む →
偏相関係数
へんそうかんけいすう · partial correlation
準1多変量

他の変数の影響を統制(線形回帰で除去)した上での 2 変数の相関。見かけの相関と本当の関係を区別するのに使う。

関連する教科書の節を読む →
因子分析
いんしぶんせき · factor analysis
準1多変量

観測変数の背後に潜む少数の共通因子を抽出する手法。心理測定や品質工学で広く使われる。主成分分析と目的が異なる。

関連する教科書の節を読む →
クラスター分析
くらすたーぶんせき · cluster analysis
準1多変量

似たデータをグループ化する教師なし手法。階層的クラスタリング(ウォード法など)と非階層型(k-means)がある。

関連する教科書の節を読む →
一般化線形モデル
いっぱんかせんけいもでる · generalized linear model (GLM)
準1回帰

線形予測子 をリンク関数で結ぶ、線形回帰の一般化。正規・二項・ポアソンなど指数型分布族を扱える。

関連する教科書の節を読む →
リンク関数
りんくかんすう · link function
準1回帰

GLM で目的変数の期待値 と線形予測子 を結ぶ関数 。ロジット・対数・恒等など。

関連する教科書の節を読む →
生存時間解析
せいぞんじかんかいせき · survival analysis
準1応用

イベント発生までの時間を、打ち切り(まだ起きていないデータ)を考慮して扱う手法。カプラン・マイヤー・Cox 比例ハザードが代表。

関連する教科書の節を読む →
ハザード関数
はざーどかんすう · hazard function
準1応用

時刻 まで生存していた条件のもとで、その瞬間にイベントが起こる「率」。

関連する教科書の節を読む →
ホワイトノイズ
ほわいとのいず · white noise
準1時系列

平均 0・分散一定で、時刻間に相関がない時系列。予測モデルの「予測できない残差」が満たすべき性質。

関連する教科書の節を読む →
季節調整
きせつちょうせい · seasonal adjustment
準1時系列

時系列から季節パターンを取り除く処理。経済統計(GDP・小売販売額など)では原系列と季節調整値が併記される。

関連する教科書の節を読む →
教師あり学習
きょうしありがくしゅう · supervised learning
準1機械学習

正解ラベル付きのデータから入出力の関係を学習する枠組み。分類(離散ラベル)と回帰(連続値)に分かれる。

関連する教科書の節を読む →
教師なし学習
きょうしなしがくしゅう · unsupervised learning
準1機械学習

ラベルなしデータから構造(クラスター・低次元表現)を発見する枠組み。k-means・主成分分析・自己符号化器など。

関連する教科書の節を読む →
強化学習
きょうかがくしゅう · reinforcement learning
準1機械学習

エージェントが環境と相互作用し、報酬を最大化する行動方策を試行錯誤で学ぶ枠組み。AlphaGo・自動運転などで成功。

関連する教科書の節を読む →
過学習
かがくしゅう · overfitting
準1機械学習

訓練データに合わせ込みすぎ、未知データへの汎化性能が低下する現象。モデル複雑度に対しデータが少ないと起きやすい。

関連する教科書の節を読む →
正則化
せいそくか · regularization
準1機械学習

損失関数に係数の大きさへの罰則を加え過学習を抑える手法。L1(ラッソ・スパース化)と L2(リッジ・縮小)が代表的。

関連する教科書の節を読む →
交差検証
こうさけんしょう · cross validation
準1機械学習

データを K 分割し、各部分をテスト用に回しながら平均性能を評価する手法。少データでの汎化性能評価の標準手法。

関連する教科書の節を読む →
混同行列
こんどうぎょうれつ · confusion matrix
準1評価指標

分類予測を「真陽性・偽陽性・偽陰性・真陰性」の 4 マスにまとめた表。各種評価指標の出発点。

関連する教科書の節を読む →
適合率と再現率
てきごうりつとさいげんりつ · precision and recall
準1評価指標

適合率 = TP/(TP+FP)(陽性予測のうち本当に陽性)、再現率 = TP/(TP+FN)(本当の陽性のうち拾えた割合)。両者の調和平均が F1。

関連する教科書の節を読む →
ROC 曲線
あーるおーしーきょくせん · ROC curve
準1評価指標

閾値を動かしたときの「真陽性率(再現率)」と「偽陽性率」をプロットした曲線。曲線下面積 AUC が分類器の総合性能。

関連する教科書の節を読む →
勾配降下法
こうばいこうかほう · gradient descent
準1機械学習

損失関数の勾配方向と逆向きにパラメータを少しずつ更新する最適化法。バッチ・確率的(SGD)・ミニバッチがある。

関連する教科書の節を読む →
ニューラルネットワーク
にゅーらるねっとわーく · neural network
準1機械学習

線形変換と非線形活性化関数を多層に積んだ関数近似モデル。多層化したものをディープラーニングと呼ぶ。

関連する教科書の節を読む →
Transformer
とらんすふぉーまー · Transformer
準1機械学習

自己注意機構(self-attention)を中核とするディープラーニングモデル。BERT・GPT など現代の大規模言語モデルの基盤。

関連する教科書の節を読む →
バイアスとバリアンス
ばいあすとばりあんす · bias-variance tradeoff
準1機械学習

予測誤差はバイアス²(モデルの単純さの偏り)+ バリアンス(訓練データへの敏感さ)+ ノイズに分解される。両者のトレードオフがモデル選択の核心。

関連する教科書の節を読む →
ガンマ分布
がんまぶんぷ · gamma distribution
準1確率分布

形状パラメータ ・尺度 をもつ正値連続分布。 で指数分布、整数 でアーラン分布。待ち時間モデルや事前分布で頻出。

関連する教科書の節を読む →
ベータ分布
べーたぶんぷ · beta distribution
準1確率分布

区間 上の連続分布 。二項分布の共役事前分布として、比率のベイズ推定で標準的に使う。

関連する教科書の節を読む →
対数正規分布
たいすうせいきぶんぷ · log-normal distribution
準1確率分布

が正規分布に従う右に裾の長い分布。所得・株価・粒径分布など、乗算的に決まる量によく当てはまる。

関連する教科書の節を読む →
多項分布
たこうぶんぷ · multinomial distribution
準1確率分布

二項分布の多カテゴリ版。 回の試行で 個のカテゴリそれぞれに何回入るかの同時分布。

関連する教科書の節を読む →
マルコフ連鎖
まるこふれんさ · Markov chain
準1確率過程

次の状態が「現在の状態だけ」で決まる(過去に依存しない)確率過程。MCMC・状態空間モデルの基礎。

関連する教科書の節を読む →
移動平均
いどうへいきん · moving average
準1時系列

時系列を直近 期の平均で平滑化する基本手法。トレンド抽出やノイズ除去に使う。MA モデルとは別概念なので注意。

関連する教科書の節を読む →
指数平滑法
しすうへいかつほう · exponential smoothing
準1時系列

直近の値ほど重みを大きくする平滑化(重みが幾何的に減衰)。Holt・Holt–Winters でトレンド・季節性に拡張できる。

関連する教科書の節を読む →
状態空間モデル
じょうたいくうかんもでる · state space model
準1時系列

観測されない状態(state)が時間発展し、それを通じて観測値が得られるという定式化。カルマンフィルタが代表的推定手法。

関連する教科書の節を読む →
階層ベイズモデル
かいそうべいずもでる · hierarchical Bayesian model
準1ベイズ

事前分布のパラメータ自身にさらに分布(超事前分布)を仮定する多層モデル。グループ間で情報を共有し、推定を安定させる。

関連する教科書の節を読む →
ギブスサンプリング
ぎぶすさんぷりんぐ · Gibbs sampling
準1ベイズ

多次元の事後分布から、各変数を「他の変数を固定した条件付き分布」から順番にサンプルする MCMC 手法。

関連する教科書の節を読む →
メトロポリス・ヘイスティングス法
めとろぽりすへいすてぃんぐすほう · Metropolis–Hastings algorithm
準1ベイズ

提案分布から候補を発生させ、確率 で受容することで目標分布からのサンプルを得る MCMC の基本アルゴリズム。

関連する教科書の節を読む →
多次元尺度法
たじげんしゃくどほう · multidimensional scaling (MDS)
準1多変量

対象間の距離(類似度)を保つように、低次元(通常 2 次元)に布置する手法。アンケート分析やブランド地図で使う。

関連する教科書の節を読む →
決定木
けっていぎ · decision tree
準1機械学習

「ある特徴量が閾値以上か」で再帰的にデータを分割していくモデル。解釈しやすいが過学習しやすい。アンサンブルの基礎部品。

関連する教科書の節を読む →
ランダムフォレスト
らんだむふぉれすと · random forest
準1機械学習

ブートストラップ標本と特徴のランダム選択で多数の決定木を学習し、平均(または多数決)を取る代表的アンサンブル手法。

関連する教科書の節を読む →
勾配ブースティング
こうばいぶーすてぃんぐ · gradient boosting
準1機械学習

弱学習器(浅い木)を残差にフィットさせ、順次足し合わせる手法。XGBoost・LightGBM など実務分類で最も強力なアプローチの一つ。

関連する教科書の節を読む →
サポートベクターマシン
さぽーとべくたーましん · support vector machine (SVM)
準1機械学習

クラスを最もマージン広く分離する超平面を求める分類器。カーネルトリックで非線形分類にも拡張できる。

関連する教科書の節を読む →
k 近傍法
けーきんぼうほう · k-nearest neighbors (kNN)
準1機械学習

新しい点に最も近い 個の訓練点から多数決(分類)/平均(回帰)で予測する遅延学習。シンプルだが高次元で性能が落ちやすい。

関連する教科書の節を読む →
ナイーブベイズ
ないーぶべいず · naive Bayes
準1機械学習

特徴間の条件付き独立を仮定し、ベイズの定理で事後確率を計算する分類器。テキスト分類で高速かつ強力。

関連する教科書の節を読む →
アンサンブル学習
あんさんぶるがくしゅう · ensemble learning
準1機械学習

複数の弱い学習器を組み合わせて性能を上げる枠組み。バギング・ブースティング・スタッキングが三大手法。

関連する教科書の節を読む →
バギング
ばぎんぐ · bagging
準1機械学習

ブートストラップで作った複数標本で学習器を並列に訓練し、出力を平均/多数決する手法。バリアンスを下げる。ランダムフォレストの基礎。

関連する教科書の節を読む →
ブースティング
ぶーすてぃんぐ · boosting
準1機械学習

弱学習器を逐次的に学習し、誤りに重みをつけて次に活かす手法。バイアスを下げる。AdaBoost・勾配ブースティングが代表。

関連する教科書の節を読む →
ハイパーパラメータ
はいぱーぱらめーた · hyperparameter
準1機械学習

学習で最適化されず、事前に設定するパラメータ(学習率・木の深さ・正則化強度など)。グリッド/ランダム/ベイズ最適化で探索する。

関連する教科書の節を読む →
ドロップアウト
どろっぷあうと · dropout
準1機械学習

学習時に各ニューロンを確率 でランダムに無効化することで過学習を防ぐ正則化手法。推論時は全ユニットを使い出力をスケール。

関連する教科書の節を読む →
バッチ正規化
ばっちせいきか · batch normalization
準1機械学習

ミニバッチごとに中間層の出力を平均 0・分散 1 に正規化してから線形変換する手法。学習の高速化と安定化に大きく寄与する。

関連する教科書の節を読む →
アテンション機構
あてんしょんきこう · attention mechanism
準1機械学習

入力のどの部分にどれだけ注目するかを重み付けで動的に決める仕組み。Transformer の中核で、機械翻訳・LLM の性能を飛躍させた。

関連する教科書の節を読む →
転移学習
てんいがくしゅう · transfer learning
準1機械学習

大規模データで学習済みのモデル(例: ImageNet/BERT)を、別タスク用に再利用する枠組み。少データで高性能を得る現代の標準。

関連する教科書の節を読む →
ファインチューニング
ふぁいんちゅーにんぐ · fine-tuning
準1機械学習

事前学習済みモデルの一部または全パラメータを、目的タスクの少量データで追加学習する手法。LLM の業務カスタマイズで主流。

関連する教科書の節を読む →
説明可能 AI
せつめいかのうえーあい · explainable AI (XAI)
準1AI 倫理

AI モデルの予測根拠を人間が解釈できる形で示す技術や思想。SHAP・LIME・Grad-CAM などが代表。医療・与信などで必須。

関連する教科書の節を読む →
差分プライバシー
さぶんぷらいばしー · differential privacy
準1AI 倫理

個別レコードの有無で出力分布がほぼ変わらないようノイズを加え、個人特定リスクを定量的に保証するプライバシー保護技術。

関連する教科書の節を読む →
AI 倫理
えーあいりんり · AI ethics
準1AI 倫理

公平性・透明性・説明責任・プライバシー・安全性など、AI を社会で使う上での原則と実践。各国で AI ガバナンス枠組みが整備中。

関連する教科書の節を読む →
データ拡張
でーたかくちょう · data augmentation
準1機械学習

回転・反転・ノイズ付加などで訓練データを人工的に増やす手法。画像・音声で過学習抑制と汎化向上に大きく寄与する。

関連する教科書の節を読む →
ELSI
えるしー · ELSI (Ethical, Legal and Social Issues)
準1AI 倫理

新技術がもたらす倫理的・法的・社会的課題の総称。AI / ゲノム / 自動運転などで研究開発と並行して検討される。

関連する教科書の節を読む →
テンソル
てんそる · tensor
準1DL 数学

多次元配列。0 階=スカラー、1 階=ベクトル、2 階=行列、3 階以上=テンソル。DL では画像バッチを (N, C, H, W) の 4 階テンソルで扱うのが標準。

関連する教科書の節を読む →
順伝播
じゅんでんぱ · forward propagation
準1DL 基礎

ニューラルネットで、入力から出力に向かって計算を進める過程。各層で線形変換 + 活性化関数を順次適用する。

関連する教科書の節を読む →
誤差逆伝播法
ごさぎゃくでんぱほう · backpropagation
準1DL 基礎

損失関数の勾配を、出力層から入力層に向かって連鎖律で逐次的に計算するアルゴリズム。DL の学習を支える中核技術。

関連する教科書の節を読む →
ReLU
れる · ReLU (Rectified Linear Unit)
準1DL 基礎

活性化関数 。負の領域で勾配 0、正の領域で勾配 1。DL で勾配消失を緩和して学習を成功させた立役者。

関連する教科書の節を読む →
Softmax
そふとまっくす · softmax
準1DL 基礎

。多クラス分類の出力層で確率分布に変換。交差エントロピー損失と組合せて使う。

関連する教科書の節を読む →
勾配消失問題
こうばいしょうしつもんだい · vanishing gradient problem
準1DL 基礎

深いネットワークで逆伝播時に勾配が指数的に小さくなり、初期層が学習できなくなる現象。ReLU・残差接続・LSTM ゲートで緩和。

関連する教科書の節を読む →
残差接続
ざんさせつぞく · skip connection / residual connection
準1DL 基礎

。前層の入力を後層に直接足す経路。ResNet で 100 層以上の深層化を実現。

関連する教科書の節を読む →
Adam
あだむ · Adam optimizer
準1DL 基礎

Momentum と RMSProp を組合せた最適化アルゴリズム。各パラメータの学習率を適応的に調整。現在 DL の事実上のデフォルト。

関連する教科書の節を読む →
CNN
しーえぬえぬ · Convolutional Neural Network
準1DL モデル

畳み込み層 + プーリング層を中心に構成された、画像処理に特化した DL アーキテクチャ。LeNet から ResNet・EfficientNet まで多数の派生。

関連する教科書の節を読む →
プーリング
ぷーりんぐ · pooling
準1DL モデル

領域ごとに最大値(Max pooling)または平均(Average pooling)を取る操作。ダウンサンプリング + 位置のずれへの頑健性。

関連する教科書の節を読む →
LSTM
えるえすてぃーえむ · Long Short-Term Memory
準1DL モデル

RNN の一種。忘却・入力・出力の 3 ゲートを持ち、長期依存を学習可能。機械翻訳・音声認識で長らく主役だった。

関連する教科書の節を読む →
Self-Attention
せるふあてんしょん · self-attention
準1DL モデル

入力系列の各位置が他のすべての位置を参照する仕組み。 で計算。Transformer の中核。

関連する教科書の節を読む →
BERT
ばーと · BERT
準1DL モデル

Google が 2018 年に発表した Transformer Encoder ベースの事前学習モデル。マスクされた単語の予測(MLM)で学習し、ファインチューニングで様々な NLP タスクに適用。

関連する教科書の節を読む →
GPT
じーぴーてぃー · GPT (Generative Pre-trained Transformer)
準1DL モデル

OpenAI が 2018 年から発表している Transformer Decoder ベースの自己回帰生成モデル。次の単語予測で学習し、ChatGPT などの LLM の基盤に。

関連する教科書の節を読む →
VAE
ぶいえーいー · Variational Autoencoder
準1DL モデル

Encoder-Decoder で潜在変数の分布を学習する生成モデル。再構成誤差 + KL ダイバージェンスを最小化(ELBO 最大化)。

関連する教科書の節を読む →
GAN
がん · Generative Adversarial Network
準1DL モデル

生成器と識別器を競合させる生成モデル。生成器が偽物を作り、識別器が本物 / 偽物を判定。学習が不安定だが、高品質な生成が可能。

関連する教科書の節を読む →
拡散モデル
かくさんもでる · diffusion model
準1DL モデル

ノイズを段階的に加える順過程の逆を学習する生成モデル。Stable Diffusion・DALL-E 3 など現代の画像生成 AI の中核。

関連する教科書の節を読む →
RLHF
あーるえるえいちえふ · Reinforcement Learning from Human Feedback
準1強化学習

人間が比較した嗜好データから報酬モデルを学習し、LLM を強化学習で微調整する手法。ChatGPT・Claude などの『有用で安全な対話エージェント化』の核心技術。

関連する教科書の節を読む →
知識蒸留
ちしきじょうりゅう · knowledge distillation
準1DL 実装

大きい教師モデルの出力(soft target)を学習目標として、小さい生徒モデルを学習させる手法。BERT → DistilBERT が代表例。

関連する教科書の節を読む →
量子化
りょうしか · quantization
準1DL 実装

DL モデルの重み・活性を float32 から int8 などに変換し、サイズ・推論速度を改善する手法。エッジデバイスでの推論に必須。

関連する教科書の節を読む →
デザイン効果
でざいんこうか · design effect (deff)
準1標本設計

実際の標本設計の分散を、同じ n の単純無作為抽出と比べた比。deff < 1 で精度向上、deff > 1 で精度低下。クラスター抽出は通常 deff > 1。

関連する教科書の節を読む →
ネイマン配分
ねいまんはいぶん · Neyman allocation
準1標本設計

層化抽出で各層の標本サイズを (層サイズ × 層内標準偏差)で決める最適配分法。精度を最大化する。

関連する教科書の節を読む →
多重代入法
たじゅうだいにゅうほう · Multiple Imputation (MI)
準1標本設計

欠測値に対して複数のもっともらしい代入値を作り、各セットで推定 → Rubin's rules で統合する手法。代入の不確実性も含めて分散を計算できる。

関連する教科書の節を読む →
誤差逆伝播
ごさぎゃくでんぱ · Backpropagation
準1ディープラーニング

ニューラルネットの勾配を出力層から入力層へ連鎖律で計算する手法。深層学習の学習を実用化した。

活性化関数
かっせいかかんすう · Activation Function
準1ディープラーニング

ニューロンの出力を非線形に変換する関数。ReLU・Sigmoid・Tanh・GELU などが使われる。

畳み込みニューラルネット
たたみこみにゅーらるねっと · CNN
準1ディープラーニング

画像処理に特化した NN。畳み込み層で局所特徴を抽出し、プーリング層でダウンサンプリングする。

Embedding
えんべでぃんぐ · Embedding
準1ディープラーニング

離散的なトークン(単語など)を密ベクトルに変換する表現。Word2Vec・BERT 埋め込みなど。

サポートベクトルマシン
さぽーとべくとるましん · SVM
準1機械学習

クラス間のマージンを最大化する分類器。カーネル法で非線形分離も可能。

k-means法
けーみーんずほう · k-means Clustering
準1機械学習

データを k 個のクラスタに分割する代表的な教師なし学習。重心とデータ点の距離を最小化。

次元削減
じげんさくげん · Dimensionality Reduction
準1機械学習

高次元データの本質的な構造を低次元で表現する手法群。PCA・t-SNE・UMAP が代表的。

Kaggle
かぐる · Kaggle
準1実装

世界最大の機械学習コンペプラットフォーム。実データでスキル研鑽・ポートフォリオ作成ができる。

Granger 因果性
ぐれんじゃーいんがせい · Granger causality
準1時系列

の過去が の予測に役立つ、という意味の因果性 (Granger 1969)。VAR モデルで F 検定する。厳密な因果ではない点に注意。

関連する教科書の節を読む →
中断時系列分析
ちゅうだんじけいれつぶんせき · Interrupted Time Series
準1時系列

介入時点の前後でレベル変化(切片)とトレンド変化(傾き)を回帰で推定する古典的手法。公衆衛生介入の評価で広く使われる。

関連する教科書の節を読む →
判別分析
はんべつぶんせき · discriminant analysis
準1多変量解析

複数の変数からカテゴリを判別するための古典的多変量手法。Fisher の線形判別(LDA)、二次判別(QDA)が代表。教師あり分類の前身。

クラスター分析
くらすたーぶんせき · cluster analysis
準1多変量解析

ラベルなしデータをグループ化する教師なし手法。階層的クラスタリング(ウォード法・最遠隣法)、k-means、DBSCAN などが代表。

因子分析
いんしぶんせき · factor analysis
準1多変量解析

観測変数の背後にある潜在因子を推定する手法。心理学・マーケティング(顧客満足要因)で広く使用。PCA とは目的が異なる。

主成分分析
しゅせいぶんぶんせき · principal component analysis
準1多変量解析

多変量データの分散を最大化する直交軸を順に取り、低次元表現に圧縮する手法。固有値分解または SVD で計算。

関連する教科書の節を読む →
Wardの方法
うぉーどのほうほう · Ward's method
準1多変量解析

階層的クラスタリングの 1 つ。クラスター間距離をクラスター内分散の増加量で定義。コンパクトな球状クラスターを作りやすい。

k-means クラスタリング
けーみーんずくらすたりんぐ · k-means clustering
準1多変量解析

個のクラスター中心を反復更新で求める非階層クラスタリング。最も広く使われる。 の決定にはエルボー法・シルエット分析を用いる。

シルエット係数
しるえっとけいすう · silhouette coefficient
準1多変量解析

クラスタリングの良さを測る指標。各点が自クラスター内でまとまり、他クラスターから離れているほど 1 に近い。-1 〜 1 の範囲。

エルボー法
えるぼーほう · elbow method
準1多変量解析

k-means の最適クラスター数決定法の 1 つ。SSE(クラスター内二乗和)を の関数としてプロットし、減少が緩やかになる『肘』の位置を に選ぶ。

工程能力指数
こうていのうりょくしすう · process capability index (Cp, Cpk)
準1品質工学

で工程のばらつきが規格内に収まる能力を測る。 は中心ずれも考慮。Cp ≥ 1.33 で十分。

管理図
かんりず · control chart
準1品質工学

工程の中心値とばらつきを時系列で監視する図。-R 管理図、 管理図、 管理図などがある。3σ 管理限界が標準。

OC 曲線
おーしーきょくせん · Operating Characteristic curve
準1品質工学

サンプリング検査で『ロット不良率 が与えられたときに合格となる確率』を描いた曲線。生産者危険(α)・消費者危険(β)が読み取れる。

田口メソッド
たぐちめそっど · Taguchi method
準1品質工学

田口玄一の提唱した品質工学。直交配列表 + SN 比で『製品のロバスト性』を最大化する実験計画法。製造業で広く採用。

SN比
えすえぬひ · Signal-to-Noise ratio
準1品質工学

田口メソッドで製品の頑健性を測る指標。望大特性・望小特性・望目特性で式が異なる。値が大きいほどばらつきの影響を受けにくい。

パレート図
ぱれーとず · Pareto chart
準1QC 7 つ道具

QC 7 つ道具の 1 つ。不良要因を頻度順に並べた棒グラフ + 累積比率の折れ線。『2:8 法則』で重要な少数要因を特定する。

特性要因図
とくせいよういんず · fishbone diagram / Ishikawa diagram
準1QC 7 つ道具

結果に対する要因を 4M(Man, Machine, Material, Method)などで体系化する図。原因分析の出発点として QC で頻用される。

ハザード関数
はざーどかんすう · hazard function
準1生存解析

。時点 まで生存している人が次の瞬間にイベントを起こす瞬時的確率。

Kaplan-Meier 推定量
かぷらん-まいやーすいていりょう · Kaplan-Meier estimator
準1生存解析

右打ち切りデータから生存関数 をノンパラメトリックに推定する手法。階段状の推定曲線で打ち切り例も活用する。

関連する教科書の節を読む →
Cox 比例ハザードモデル
こっくすひれいはざーどもでる · Cox proportional hazards model
準1生存解析

。ベースラインハザード を特定せずに係数 を部分尤度で推定するセミパラ手法。

関連する教科書の節を読む →
ログランク検定
ろぐらんくけんてい · log-rank test
準1生存解析

2 群以上の生存曲線の差を比較するノンパラ検定。Kaplan-Meier 推定後の標準的検定として臨床試験で広く使用。

MAP 推定
まっぷすいてい · Maximum A Posteriori estimation
準1ベイズ統計

事後分布 を最大化する 。事前分布が一様なら MLE と一致。点推定としてベイズ的に妥当。

ジェフリーズ事前分布
じぇふりーずじぜんぶんぷ · Jeffreys prior
準1ベイズ統計

Fisher 情報量の平方根に比例する不変事前分布。パラメータ変換に対して不変であり『無情報事前』として議論される。

ベイズファクター
べいずふぁくたー · Bayes factor
準1ベイズ統計

2 つのモデル の周辺尤度の比。ベイズ的なモデル比較指標。Kass-Raftery の解釈基準では BF > 100 で『決定的』。

WAIC
わいっく · Widely Applicable Information Criterion
準1情報量規準

渡辺澄夫が提唱した情報量規準。AIC・BIC が階層モデルで破綻するケースでも使え、特異モデルや混合分布で安定動作。

スペクトル分解
すぺくとるぶんかい · Spectral decomposition
準1線形代数

対称行列の対角化 ( は直交行列)。固有ベクトルが直交するため と書ける。PCA は共分散行列のスペクトル分解。

関連する教科書の節を読む →
特異値分解
とくいちぶんかい · Singular Value Decomposition (SVD)
準1線形代数

任意の 行列 の分解 は直交行列、 は特異値を対角に並べた行列。 の固有値。低ランク近似・PCA・LoRA の基礎。

関連する教科書の節を読む →
低ランク近似
ていらんくきんじ · Low-rank approximation
準1線形代数

SVD で上位 個の特異値だけ残した行列 。Eckart-Young の定理によりフロベニウスノルム最小の rank- 近似。画像圧縮・推薦・LoRA の基礎。

関連する教科書の節を読む →
正定値行列
せいていちぎょうれつ · Positive definite matrix
準1線形代数

対称行列 で、任意の非ゼロ に対し が成り立つもの。すべての固有値 > 0 と同値。共分散行列の逆行列・SVM の双対問題のカーネル行列など、最適化で重要。

関連する教科書の節を読む →
二次形式
にじけいしき · Quadratic form
準1線形代数

対称行列 とベクトル に対する 。2 次の項だけからなる関数で、正定値・半正定値・不定の分類が固有値の符号で決まる。多変量正規分布の指数部にも現れる。

関連する教科書の節を読む →
総合的調査誤差
そうごうてきちょうさごさ · Total Survey Error (TSE)
準1調査統計

標本誤差 + 非標本誤差を統一的に MSE(平均二乗誤差)で評価する枠組み。Eurostat・米センサス局が推進。予算配分(標本拡大 vs 督促強化 vs 認知インタビュー)を感度分析で決める基盤。

関連する教科書の節を読む →
k-匿名化
けーとくめいか · k-anonymity
準1プライバシー

同じ準識別子(年齢・性別・住所など)を持つ個人が常に 人以上存在することを保証する匿名化技法(Sweeney 2002)。再識別攻撃への基本的な防御。l-多様性・t-近接性に発展。

関連する教科書の節を読む →
公平性指標
こうへいせいしひょう · Fairness metrics
準1AI公平性

AI モデルの公平性を測る指標。Demographic Parity・Equal Opportunity・Equalized Odds の 3 軸が代表で、群間で base rate が違う場合 **同時に満たせない**(Chouldechova / Kleinberg の不可能性定理)。

関連する教科書の節を読む →
モランのI
もらんのあい · Moran's I
準1空間統計

空間相関を測る統計量。 の範囲で、 なら似た値が空間的に集まる正の相関、 ならチェッカーボード状の負の相関、0 でランダム。R: `spdep::moran.test()`。

関連する教科書の節を読む →
クリギング
くりぎんぐ · Kriging
準1空間統計

点参照空間データから未観測地点の値を補間するベスト線形不偏予測量(BLUP)。距離に応じた共分散構造(バリオグラム)を仮定。気象・鉱業・大気汚染で標準的な空間補間法。

関連する教科書の節を読む →
PageRank
ぺーじらんく · PageRank
準1ネットワーク統計

Google の Web ページ重要度算出アルゴリズム(Brin & Page 1998)。『重要なページからリンクされているページは重要』を再帰的に定義し、遷移行列の最大固有値に対応する固有ベクトルとして計算。

関連する教科書の節を読む →
媒介中心性
ばいかいちゅうしんせい · Betweenness centrality
準1ネットワーク統計

ネットワーク中心性の一つで、他ノード間の最短経路がそのノードを通る割合。情報のハブを特定する指標。

関連する教科書の節を読む →
スケールフリーネットワーク
すけーるふりーねっとわーく · Scale-free network
準1ネットワーク統計

次数分布がべき乗則 に従うネットワーク(Barabási-Albert 1999)。少数の超高次数ハブが存在する。Web リンク・引用ネットワーク・SNS・タンパク質間相互作用で観察される。

関連する教科書の節を読む →
ERGM
いーあーるじーえむ · Exponential Random Graph Model
準1ネットワーク統計

観測ネットワークが現れる確率を で表す指数族モデル。ネットワーク統計量(エッジ・三角形・homophily 等)を説明変数化、MCMC-MLE で推定。

関連する教科書の節を読む →
Level

1級レベルの用語 (118)

指数型分布族
しすうがたぶんぷぞく · exponential family
1理論

の形に書ける分布族。十分統計量・最尤推定との相性が抜群。

関連する教科書の節を読む →
十分統計量
じゅうぶんとうけいりょう · sufficient statistic
1理論

さえあれば、 の細部はもう について情報を持たない」という統計量。フィッシャー・ネイマンの分解定理で判定。

関連する教科書の節を読む →
最尤推定
さいゆうすいてい · maximum likelihood estimation (MLE)
1推定

尤度関数 を最大化するパラメータを推定値とする方法。一致性・漸近正規性・漸近有効性をもつ。

関連する教科書の節を読む →
フィッシャー情報量
ふぃっしゃーじょうほうりょう · Fisher information
1理論

。データが について持つ情報の量。

関連する教科書の節を読む →
クラメル・ラオの下限
くらめる・らおのかげん · Cramér–Rao lower bound
1理論

正則条件下で不偏推定量の分散の下限 。MLE は漸近的にこれを達成する。

関連する教科書の節を読む →
デルタ法
でるたほう · delta method
1漸近理論

から を導く道具。

関連する教科書の節を読む →
ネイマン・ピアソン補題
ねいまん・ぴあそんほだい · Neyman–Pearson lemma
1検定理論

単純仮説どうしの検定において、有意水準 のもとでの最強力検定が尤度比検定であることを保証する定理。

関連する教科書の節を読む →
尤度比検定
ゆうどひけんてい · likelihood ratio test
1検定理論

を使った検定。 が漸近的にカイ二乗分布に従う(ウィルクスの定理)。

関連する教科書の節を読む →
EM アルゴリズム
いーえむあるごりずむ · EM (expectation-maximization)
1計算統計

潜在変数モデルでの最尤推定を、E ステップと M ステップを繰り返して反復的に解く方法。GMM・HMM などに使う。

関連する教科書の節を読む →
MCMC
えむしーえむしー · Markov chain Monte Carlo
1計算統計

目標分布に収束するマルコフ連鎖を構成して、その軌跡をサンプルとして使うベイズ推論の主役手法。MH 法・ギブス法など。

関連する教科書の節を読む →
ブートストラップ
ぶーとすとらっぷ · bootstrap
1計算統計

観測標本から復元抽出で擬似標本を多数作り、推定量の分布や標準誤差を近似する汎用的な手法。

関連する教科書の節を読む →
一致推定量
いっちすいていりょう · consistent estimator
1推定理論

標本サイズ で母数に確率収束する推定量。最尤推定量は通常の正則条件下で一致性を持つ。

関連する教科書の節を読む →
漸近正規性
ぜんきんせいきせい · asymptotic normality
1推定理論

で正規分布に分布収束する性質。最尤推定量は正則条件下でこれを満たす。

関連する教科書の節を読む →
スコア関数
すこあかんすう · score function
1推定理論

対数尤度のパラメータ偏微分 。期待値 0 で、その分散がフィッシャー情報量。

関連する教科書の節を読む →
ベイズ因子
べいずいんし · Bayes factor
1ベイズ

2 つのモデル の周辺尤度の比 。ベイズ流のモデル比較・仮説検定の基本量。

関連する教科書の節を読む →
ジェフリーズ事前分布
じぇふりーずじぜんぶんぷ · Jeffreys prior
1ベイズ

フィッシャー情報量の平方根に比例する事前分布 。再パラメータ化で不変な無情報事前分布。

関連する教科書の節を読む →
完備十分統計量
かんびじゅうぶんとうけいりょう · complete sufficient statistic
1推定理論

十分性に加え「期待値が常に 0 ⇒ ほぼ確実に 0」となる(完備性)を満たす統計量。UMVUE 構成の鍵となる概念。

関連する教科書の節を読む →
ラオ・ブラックウェルの定理
らおぶらっくうぇるのていり · Rao–Blackwell theorem
1推定理論

推定量を十分統計量で条件付け期待値を取ると、分散が必ず減少する(または不変)という定理。UMVUE 構成の中心ツール。

関連する教科書の節を読む →
M 推定量
えむすいていりょう · M-estimator
1推定理論

目的関数 の最小化(または推定方程式の零点)で定義される推定量の総称。最尤・最小二乗・ロバスト推定を含む統一枠組み。

関連する教科書の節を読む →
カーネル密度推定
かーねるみつどすいてい · kernel density estimation
1ノンパラ

観測点に滑らかな核(ガウス核など)を載せて足し合わせ、確率密度を推定するノンパラ手法。バンド幅の選択が肝。

関連する教科書の節を読む →
経験分布関数
けいけんぶんぷかんすう · empirical distribution function
1ノンパラ

観測値から作る階段関数 。標本サイズが大きいと真の cdf に一様収束する(グリヴェンコ・カンテリの定理)。

関連する教科書の節を読む →
特異値分解
とくいちぶんかい · singular value decomposition (SVD)
1DL 数学

任意の行列 に分解。 は直交、 は非負特異値の対角。データ圧縮・PCA の高次元実装・推薦システムなどで使う。

関連する教科書の節を読む →
Horvitz-Thompson 推定量
ほーびっつとんぷそんすいていりょう · Horvitz-Thompson estimator
1標本設計

サンプリングウエイト (抽出確率の逆数)を使った母集団総計の不偏推定量 。標本調査の理論的中核。

関連する教科書の節を読む →
Attention
あてんしょん · Attention Mechanism
1ディープラーニング

入力の各位置に対する『注目度』を学習する仕組み。Self-Attention では Q・K・V の内積で計算。

事前学習
じぜんがくしゅう · Pre-training
1ディープラーニング

大規模な教師なしデータで汎用表現を学習させる段階。BERT・GPT は事前学習 → ファインチューニングの流れ。

LLM
えるえるえむ · Large Language Model
1LLM

数百億〜数兆パラメータの大規模言語モデル。次トークン予測の事前学習で汎用言語能力を獲得。GPT・Claude・Gemini が代表。

プロンプトエンジニアリング
ぷろんぷとえんじにありんぐ · Prompt Engineering
1LLM

LLM への指示文(プロンプト)を設計し、出力品質を引き出す技術。Few-shot や Chain-of-Thought が代表的手法。

RAG
らぐ · Retrieval Augmented Generation
1LLM

ユーザー質問に関連する文書を検索 → LLM プロンプトに含めて生成する手法。幻覚抑制と最新情報対応が両立できる。

ハルシネーション
はるしねーしょん · Hallucination
1LLM

LLM が事実と異なる内容を、もっともらしく生成してしまう現象。RAG・温度低下・ファクトチェックで対策。

Chain-of-Thought
ちぇーんおぶそーと · Chain-of-Thought (CoT)
1LLM

LLM に推論過程を段階的に出させるプロンプト手法。複雑な数学・論理問題で正答率が向上する。

ベクトル DB
べくとるでぃーびー · Vector Database
1LLM

Embedding ベクトルを高速類似検索できる DB。Pinecone・Weaviate・pgvector など。RAG の基盤。

コンテキストウィンドウ
こんてきすとうぃんどう · Context Window
1LLM

LLM が一度に処理できる入力 + 出力の最大トークン数。GPT-4 = 128K、Claude 4.7 = 1M など年々拡大。

MLOps
えむえるおぷす · Machine Learning Operations
1MLOps

ML モデルを本番運用するためのプラクティス群。データ・コード・モデルのバージョニング、CI/CD、監視、再学習が中核。

Data Drift
でーただりふと · Data Drift
1MLOps

本番運用中に入力データ分布が学習時から変化する現象。モデル精度低下の主因。Evidently 等で監視。

Feature Store
ふぃーちゃーすとあ · Feature Store
1MLOps

特徴量を一元管理する基盤。学習と推論で同じ特徴量定義を共有でき、リーク防止と再利用に寄与。

MLflow
えむえるふろー · MLflow
1MLOps

実験追跡・モデルレジストリ・サービングを統合した OSS。Tracking UI でハイパラと評価指標を一覧できる。

因果推論
いんがすいろん · Causal Inference
1因果推論

観察データから『介入の効果』を推定する統計学。傾向スコア・操作変数・差分の差分・DAG などを駆使。

傾向スコア
けいこうすこあ · Propensity Score
1因果推論

介入を受ける確率を共変量から推定したスコア。マッチングや IPW で因果効果を推定する基本道具。

差分の差分
さぶんのさぶん · Difference-in-Differences (DID)
1因果推論

処置の前後 × 処置群と対照群 の 2 軸で差を取り、並行トレンド仮定のもとで因果効果を推定する手法。

操作変数法
そうさへんすうほう · Instrumental Variable (IV)
1因果推論

処置に影響するが結果には直接影響しない変数を用いて、内生性のある因果効果を推定する手法。

DAG
だぐ · Directed Acyclic Graph
1因果推論

変数間の因果関係を有向グラフで表現した図。Judea Pearl の do 計算で識別可能性を判定する基盤。

Stacking
すたっきんぐ · Stacking
1機械学習

複数モデルの予測を入力にメタモデルを学習するアンサンブル手法。Kaggle 上位の常套手段。

Target Encoding
たーげっとえんこーでぃんぐ · Target Encoding
1機械学習

カテゴリ変数をそのカテゴリの平均ターゲット値で数値化する手法。リーク対策のため CV 内で計算する必要あり。

ResNet
れずねっと · Residual Network
1コンピュータビジョン

残差接続(skip connection)を導入した CNN。100 層超えの深いネットワークでも勾配消失せず学習可能。

ViT
びてぃー · Vision Transformer
1コンピュータビジョン

画像を 16×16 パッチに分割し、Transformer で処理する画像分類モデル。十分な学習データで CNN を超える。

ImageNet
いめーじねっと · ImageNet
1コンピュータビジョン

1000 クラス・約 120 万枚の画像分類ベンチマーク。CV の事前学習データとして長年デファクト。

U-Net
ゆーねっと · U-Net
1コンピュータビジョン

エンコーダ・デコーダ構造 + スキップ接続。医用画像セグメンテーションの標準で、拡散モデルにも応用。

YOLO
よろ · You Only Look Once
1コンピュータビジョン

画像を 1 回処理してバウンディングボックスを出力する物体検出モデル。リアルタイム検出の代表。

IoU
あいおーゆー · Intersection over Union
1コンピュータビジョン

予測と正解のバウンディングボックスの重なり具合。物体検出 ・ セグメンテーションの主要評価指標。

NMS
えぬえむえす · Non-Maximum Suppression
1コンピュータビジョン

物体検出で重複する検出ボックスを除去する後処理。IoU 閾値を使って最高スコアの 1 つだけ残す。

セグメンテーション
せぐめんてーしょん · Segmentation
1コンピュータビジョン

画像をピクセル単位で分類するタスク。Semantic / Instance / Panoptic の 3 種類がある。

アンカーボックス
あんかーぼっくす · Anchor Box
1コンピュータビジョン

物体検出で各位置に予め用意するバウンディングボックスのテンプレート。事前形状を提供して学習を安定化。

MDP
えむでぃーぴー · Markov Decision Process
1強化学習

強化学習の数学的枠組み。(S, A, P, R, γ) で状態 ・ 行動 ・ 遷移 ・ 報酬 ・ 割引率を定義。

Q-learning
きゅーらーにんぐ · Q-learning
1強化学習

状態行動価値 Q(s, a) を学習し、最大 Q を選ぶ方策に従う強化学習アルゴリズム。Bellman 方程式に基づく。

DQN
でぃーきゅーえぬ · Deep Q-Network
1強化学習

Q-learning の Q 関数をニューラルネットで近似 + 経験再生 + ターゲットネットを使った手法。Atari で人を超えた。

Policy Gradient
ぽりしーぐらでぃえんと · Policy Gradient
1強化学習

方策 π を直接ニューラルネットでパラメータ化し、勾配上昇で報酬期待値を最大化する手法。

PPO
ぴーぴーおー · Proximal Policy Optimization
1強化学習

方策更新を一定範囲(クリップ)に抑える方策勾配法。安定性と性能のバランスが良く、RLHF の標準。

Actor-Critic
あくたーくりてぃっく · Actor-Critic
1強化学習

方策(Actor)と価値関数(Critic)を同時に学習する強化学習の枠組み。A2C ・ A3C ・ SAC が代表例。

Bellman 方程式
べるまんほうていしき · Bellman Equation
1強化学習

現在の価値 = 即時報酬 + 割引した次状態の価値、という再帰的な等式。動的計画法と強化学習の理論的中核。

報酬関数
ほうしゅうかんすう · Reward Function
1強化学習

強化学習で各 (状態, 行動) に対して報酬を返す関数。設計が学習結果を大きく左右する。

割引率
わりびきりつ · Discount Factor (γ)
1強化学習

将来の報酬を現在価値に換算する係数(0 ≤ γ < 1)。γ が小さいほど短期志向、大きいほど長期志向。

経験再生
けいけんさいせい · Experience Replay
1強化学習

過去の経験(s, a, r, s')をバッファに溜め、ランダムにサンプリングして学習する手法。サンプル効率と相関軽減に寄与。

DDPM
でぃーでぃーぴーえむ · Denoising Diffusion Probabilistic Model
1生成 AI

ノイズ予測タスクとして拡散モデルを定式化した代表論文(Ho et al. 2020)。

Classifier-Free Guidance
くらしふぁーふりーがいだんす · Classifier-Free Guidance
1生成 AI

拡散モデルの条件付き生成で、条件あり/なしの予測を線形結合してガイダンス強度を高める手法。

CLIP
くりっぷ · Contrastive Language-Image Pre-training
1生成 AI

画像とテキストを同じ埋め込み空間に対応付ける OpenAI のモデル。ゼロショット分類や拡散モデルの条件付けに使用。

AI エージェント
えーあいえーじぇんと · AI Agent
1AI エージェント

LLM が外部ツールを自律的に呼んでタスクを完遂する仕組み。ReAct ・ Tool Use ・ Multi-Agent が中心概念。

ReAct
りあくと · Reason + Act
1AI エージェント

エージェントの基本パターン。推論(Reason)とツール呼び出し(Act)を交互に行うことで複雑タスクを解く。

Tool Use
つーるゆーす · Tool Use / Function Calling
1AI エージェント

LLM が宣言された外部関数を引数を埋めて呼び出す機能。OpenAI ・ Anthropic API がネイティブ対応。

Multi-Agent
まるちえーじぇんと · Multi-Agent System
1AI エージェント

複数の専門エージェントが協調してタスクを解くアーキテクチャ。プランナー・コーダー・レビュアーなど役割分担。

ASR
えーえすあーる · Automatic Speech Recognition
1音声 AI

音声を文字に変換する技術。OpenAI Whisper が現在の業界標準で、日本語含む多言語対応。

TTS
てぃーてぃーえす · Text-to-Speech
1音声 AI

テキストを自然な音声に変換する技術。XTTS-v2 ・ ElevenLabs ・ OpenAI TTS が主要モデル。

合成統制法
ごうせいとうせいほう · Synthetic Control Method
1因果推論

複数の対照群を重み付けして処置群とそっくりな「人工対照群」を作り、介入効果を推定する手法 (Abadie & Gardeazabal 2003)。1 ユニット処置に強い。

関連する教科書の節を読む →
Double ML
だぶるえむえる · Double Machine Learning
1因果推論

高次元共変量を機械学習で扱いながら因果効果を一致推定する枠組み (Chernozhukov et al. 2018)。直交化(Neyman orthogonality)が鍵。

関連する教科書の節を読む →
Causal Forest
こーざるふぉれすと · Causal Forest
1因果推論

ランダムフォレストを「同じ葉に入った観測同士で処置効果を推定」する形に拡張した手法 (Wager & Athey 2018)。共変量ごとの異質処置効果 CATE を推定できる。

関連する教科書の節を読む →
アップリフトモデリング
あっぷりふともでりんぐ · uplift modeling
1因果推論

「処置によって行動が変わる人」を特定するモデリング。マーケでは「クーポンを送る価値がある人」を抽出するのに使う。

関連する教科書の節を読む →
CausalImpact
こーざるいんぱくと · CausalImpact
1時系列

Google が公開した因果分析ライブラリ。ベイズ構造時系列モデルで反事実を推定し、介入の効果を測る (Brodersen et al. 2015)。

関連する教科書の節を読む →
N-BEATS
えぬびーつ · Neural Basis Expansion Analysis for Time Series
1時系列

純粋な MLP ブロックで構成された時系列予測モデル (2020)。M4 コンペで Prophet を上回る精度を出した。

関連する教科書の節を読む →
Temporal Fusion Transformer
てんぽーらるふゅーじょんとらんすふぉーまー · Temporal Fusion Transformer (TFT)
1時系列

多変量時系列・カテゴリ・静的共変量を統一的に扱う Transformer ベース予測モデル (2021)。注意機構で重要な時刻を可視化できる。

関連する教科書の節を読む →
時系列基盤モデル
じけいれつきばんもでる · Time Series Foundation Model
1時系列

大規模時系列で事前学習され、Zero-shot 予測ができるモデル。Chronos・TimesFM・Lag-Llama などが 2024 年に登場。

関連する教科書の節を読む →
RAG
らぐ · Retrieval-Augmented Generation
1生成 AI

外部知識ベースから関連文書を検索してプロンプトに添付してから LLM に答えさせる手法。ハルシネーション抑制と最新情報の活用に有効。

関連する教科書の節を読む →
Chain-of-Thought
ちぇーんおぶそーと · Chain-of-Thought (CoT)
1生成 AI

「Let's think step by step」のように推論過程を明示させるプロンプティング手法。算数・推論問題で精度が大幅向上 (Wei et al. 2022)。

関連する教科書の節を読む →
ReAct
りあくと · Reasoning + Acting
1生成 AI

LLM に「考える(推論)」と「行動する(ツール使用)」を交互に行わせるパラダイム。現代の AI エージェントの基本設計。

関連する教科書の節を読む →
QLoRA
きゅーろーら · Quantized Low-Rank Adaptation
1生成 AI

4 bit 量子化と LoRA を組み合わせた省メモリファインチューニング手法。消費者向け GPU で大規模モデルを学習可能にする。

関連する教科書の節を読む →
Constitutional AI
こんすてぃちゅーしょなるえーあい · Constitutional AI
1AI 倫理

Anthropic が開発した、人間のフィードバックを AI のフィードバック(AI が AI を批判)で代替するアライメント手法。Claude シリーズに実装。

関連する教科書の節を読む →
EU AI 法
いーゆーえーあいほう · EU AI Act
1AI 倫理

2024 年採択の世界初の包括的 AI 規制。リスクを 4 段階(許容不可/高/限定/最小)に分類し義務を課す。違反は最大年間売上の 7% の罰金。

関連する教科書の節を読む →
ハルシネーション
はるしねーしょん · hallucination
1生成 AI

LLM がもっともらしい嘘を生成する現象。RAG・出典明示・検証 LLM で抑制する。

関連する教科書の節を読む →
プロンプトインジェクション
ぷろんぷといんじぇくしょん · prompt injection
1AI セキュリティ

悪意あるプロンプトでシステムプロンプトを上書きし、機密漏洩や不正動作を引き起こす攻撃。生成 AI のセキュリティ上の主要リスクの 1 つ。

関連する教科書の節を読む →
MoE
えむおーいー · Mixture of Experts
1深層学習

複数の「エキスパート」サブネットワークから条件に応じて少数だけを活性化させる Transformer アーキテクチャ。Mixtral・DeepSeek-V3 などで採用。

創発的能力
そうはつてきのうりょく · emergent abilities
1深層学習

LLM が一定規模を超えると突然現れる能力(算術・推論・コード生成など)。線形改善ではなく相転移的な現象 (Wei et al. 2022)。

関連する教科書の節を読む →
著作権法 30 条の 4
ちょさくけんほう30じょうの4 · Article 30-4 of Japanese Copyright Act
1AI 法務

著作物に表現された思想・感情の『享受目的でない』利用を許容する規定(2018 年改正)。AI 学習・解析・特徴量抽出が代表例。ただし著作権者の利益を不当に害する場合は除外。

関連する教科書の節を読む →
データドリフト
でーたどりふと · data drift / covariate shift
1MLOps

本番運用中に入力 P(X) の分布が学習時から変化する現象。季節要因や顧客属性変化が原因。KS 検定や PSI で検出。

関連する教科書の節を読む →
コンセプトドリフト
こんせぷとどりふと · concept drift
1MLOps

入力と出力の関係 P(Y|X) が時間とともに変化する現象。顧客嗜好の変化や不正パターンの進化が代表例。再学習が対策。

関連する教科書の節を読む →
シャドーデプロイ
しゃどーでぷろい · shadow deployment
1MLOps

新モデルを本番トラフィックに対して並列実行し、本番に影響を与えずに新旧モデルの結果を比較する段階リリース手法。問題なければカナリアリリースに進む。

関連する教科書の節を読む →
PSI
ぴーえすあい · Population Stability Index
1MLOps

学習データと運用データの分布変化を測る指標。。0.1 以下なら安定、0.25 以上で大きなドリフト。

関連する教科書の節を読む →
InfoNCE 損失
いんふぉえぬしーいーそんしつ · InfoNCE loss
1自己教師あり学習

対照学習で使う損失関数。正例ペアと負例ペアのコサイン類似度から、ソフトマックス交差エントロピー型で表現を学習。SimCLR・MoCo・CLIP などの基盤。

関連する教科書の節を読む →
SimCLR
しむくりあ · SimCLR
1自己教師あり学習

Chen et al. 2020 の対照学習手法。同じ画像の Augment 版を正例、バッチ内の他画像を負例として、シンプルな枠組みで強力な表現を獲得。バッチサイズが大きいほど強い。

関連する教科書の節を読む →
MAE
えむえーいー · Masked Autoencoder
1自己教師あり学習

He et al. 2021。画像の 75% をマスクして残り 25% から再構成する自己教師あり学習。ViT との相性が良く、強い視覚特徴を獲得する。

関連する教科書の節を読む →
DINO / DINOv2
でぃーのー · DINO / DINOv2
1自己教師あり学習

Caron et al. 2021/2023。自己蒸留型 SSL で、教師なしでセグメンテーション特徴を獲得する。基盤視覚モデルの 1 つ。

関連する教科書の節を読む →
能動学習
のうどうがくしゅう · active learning
1能動学習

ラベル付けが高コストな場面で、最も学習効果の高いサンプルを選んでラベル付与・再学習を繰り返す手法。獲得関数で『情報的な例』を選別する。

関連する教科書の節を読む →
Uncertainty Sampling
あんさーてぃんてぃーさんぷりんぐ · uncertainty sampling
1能動学習

能動学習の代表的獲得関数。モデルが予測に最も自信がない(エントロピー高 / 最大確率小 / margin 小)サンプルを優先してラベル付けする。

関連する教科書の節を読む →
BALD
ばるど · Bayesian Active Learning by Disagreement
1能動学習

ベイズ的な能動学習手法。Dropout や Deep Ensemble でモデルパラメータの不確実性を推定し、予測分散が大きいサンプルを優先する。

連合学習
れんごうがくしゅう · Federated Learning
1連合学習

データを中央集約せず、各クライアントでローカル学習したモデル更新だけを共有して中央モデルを改善する分散学習。プライバシー保護と規制対応に有用。

関連する教科書の節を読む →
FedAvg
ふぇどあぶ · Federated Averaging
1連合学習

連合学習の代表的アルゴリズム (McMahan et al. 2017)。各クライアントが数エポック学習した後、サーバがデータ量で重み付け平均でモデルを集約する。

関連する教科書の節を読む →
クロスデバイス連合学習
くろすでばいすれんごうがくしゅう · cross-device federated learning
1連合学習

数百万のスマートフォンや IoT デバイスが参加する連合学習形態。各デバイスのデータは小規模、参加が不安定。Google Gboard などが実例。

関連する教科書の節を読む →
クロスサイロ連合学習
くろすさいろれんごうがくしゅう · cross-silo federated learning
1連合学習

数〜数十の組織(病院・銀行・メーカー)が参加する連合学習形態。各組織のデータは大規模で参加は安定。医療画像診断・金融不正検知などで実用化。

関連する教科書の節を読む →
FedProx
ふぇどぷろっくす · FedProx
1連合学習

Non-IID データ問題に対処する連合学習アルゴリズム。各クライアントの局所更新に近接項を加え、グローバルモデルから離れすぎないよう制御する。

プルーニング
ぷるーにんぐ · pruning
1モデル軽量化

ニューラルネットの重みのうち重要でないものを 0 にする(または削除する)モデル軽量化手法。非構造化(個別重み)と構造化(チャネル・ヘッド)に大別。

関連する教科書の節を読む →
Lottery Ticket Hypothesis
ろたりーちけっとかせつ · Lottery Ticket Hypothesis
1モデル軽量化

Frankle & Carbin 2019。大きなネットワーク内には『勝者の宝くじ券』に相当する小さな部分ネットワークが存在し、それを抽出すれば元と同等の性能が出るという仮説。

関連する教科書の節を読む →
知識蒸留
ちしきじょうりゅう · knowledge distillation
1モデル軽量化

Hinton et al. 2015。大きな教師モデルの Soft Target を小さな生徒モデルに学習させる軽量化手法。温度パラメータでソフト化した分布から、クラス間類似度を継承できる。

関連する教科書の節を読む →
DistilBERT
でぃすてぃるばーと · DistilBERT
1モデル軽量化

Sanh et al. 2019。BERT-base を蒸留して 40% 軽量・60% 高速化、性能 97% 維持。蒸留の有名な実例。

関連する教科書の節を読む →
PTQ
ぴーてぃーきゅー · Post-Training Quantization
1量子化

学習後のモデルにそのまま量子化を適用する手法。代表: GPTQ・AWQ。安価だが精度低下が出やすい。

関連する教科書の節を読む →
QAT
きゅーえーてぃー · Quantization-Aware Training
1量子化

学習中に量子化を模倣し『量子化に強い重み』を学習する手法。学習コストは高いが PTQ より精度低下が少ない。

関連する教科書の節を読む →
NF4
えぬえふ4 · Normal Float 4
1量子化

QLoRA で採用される 4 bit 量子化形式 (Dettmers et al. 2023)。事前学習済み重みが正規分布に近い性質を利用して精度低下を抑制する。

関連する教科書の節を読む →
DPO
でぃーぴーおー · Direct Preference Optimization
1ファインチューニング

Rafailov et al. 2023。RLHF の RL ステージを強化学習なしの教師あり学習に置き換える手法。実装が簡単で安定し、2023 年以降急速に普及。

関連する教科書の節を読む →
DoRA
どーら · Weight-Decomposed Low-Rank Adaptation
1ファインチューニング

Liu et al. 2024。LoRA を方向と大きさに分解した改良版。LoRA より精度が向上することが報告されている。

Mamba
まんば · Mamba (S6)
1効率的アーキテクチャ

Gu & Dao 2023。Self-Attention の O(n²) を線形時間 O(n) に置き換える状態空間モデル。長系列で Transformer を凌駕する場合がある。

関連する教科書の節を読む →
Flash Attention
ふらっしゅあてんしょん · Flash Attention
1効率的アーキテクチャ

Dao et al. 2022。GPU メモリ階層を意識した Attention 実装で、数学的に同一のまま 2〜4 倍高速化。現代の LLM 学習・推論で標準採用。

関連する教科書の節を読む →
MCP
えむしーぴー · Model Context Protocol
1AI エージェント

Anthropic 2024。AI モデルと外部ツールの接続を標準化するオープンプロトコル。任意の AI クライアントが任意の MCP サーバを使える、エージェント時代のインフラ。

関連する教科書の節を読む →