Glossary

統計用語集

統計検定 4級〜1級で登場する重要用語をまとめた辞典です。各用語に短い定義と「関連する教科書の節」へのリンクを付けています。試験前の最終チェックや、学習中に意味を素早く確認したいときにお使いください。全 462 語。

462/462 語

級フィルタ:

Level

4級レベルの用語 (34)

平均値 へいきんち · mean 4級代表値: 全データの合計をデータ数で割った値。データの中心位置を表すもっとも基本的な代表値。
関連する教科書の節を読む →
中央値 ちゅうおうち · median 4級代表値: データを昇順に並べたとき真ん中にくる値。外れ値の影響を受けにくい代表値。
関連する教科書の節を読む →
最頻値 さいひんち · mode 4級代表値: データの中でもっとも多く出現する値。質的データ(カテゴリ)で唯一使える代表値であり、分布の山の位置を表す。複数の値が同じ最大度数なら最頻値は複数となる。
関連する教科書の節を読む →
範囲 はんい · range 4級ばらつき: データの最大値から最小値を引いた値。もっとも単純なばらつきの指標。
関連する教科書の節を読む →
四分位数 しぶんいすう · quartile 4級ばらつき: データを昇順で 4 等分したときの 3 つの区切り値 $Q_{1}, Q_{2}, Q_{3}$ 。 $Q_{2}$ は中央値。
関連する教科書の節を読む →
四分位範囲 しぶんいはんい · IQR (interquartile range) 4級ばらつき: $Q_{3} - Q_{1}$ 。中央 50% のデータの広がり。外れ値に頑健。
関連する教科書の節を読む →
箱ひげ図 はこひげず · box plot 4級可視化: 最小値・ $Q_{1}$ ・中央値・ $Q_{3}$ ・最大値の五数で分布を要約する図。複数群比較に便利。
関連する教科書の節を読む →
度数分布表 どすうぶんぷひょう · frequency table 4級可視化: データを階級に分け、各階級の度数(個数)をまとめた表。ヒストグラムの基礎。
関連する教科書の節を読む →
ヒストグラム ひすとぐらむ · histogram 4級可視化: 度数分布表を棒グラフ化したもの。隣の棒は隙間なく並べ、データの分布形を視覚化する。
関連する教科書の節を読む →
順列 じゅんれつ · permutation 4級場合の数: 異なる $n$ 個から $r$ 個を選んで順序付けて並べる方法の総数。 $_{n} P_{r}$ 。
関連する教科書の節を読む →
組合せ くみあわせ · combination 4級場合の数: 異なる $n$ 個から $r$ 個を順序を区別せず選ぶ方法の総数。 $_{n} C_{r}$ 。
関連する教科書の節を読む →
余事象 よじしょう · complementary event 4級確率: 事象 $A$ が起こらない事象。 $P (A^{c}) = 1 - P (A)$ 。「少なくとも〜」型の問題に強い。
関連する教科書の節を読む →
度数 どすう · frequency 4級データ整理: ある階級(または値)に属するデータの個数。度数分布表で各階級ごとに数えた件数のこと。
関連する教科書の節を読む →
相対度数 そうたいどすう · relative frequency 4級データ整理: 各階級の度数を全体の度数で割った値(=割合)。データ規模が違う集団同士の比較に便利。
関連する教科書の節を読む →
累積度数 るいせきどすう · cumulative frequency 4級データ整理: ある階級までの度数を順に足し上げた値。「○○以下が何人いるか」が一目でわかる。
関連する教科書の節を読む →
階級 かいきゅう · class interval 4級データ整理: 度数分布表で連続データを区切る区間(例: 60〜70 点)。階級幅は基本的に揃える。
関連する教科書の節を読む →
階級値 かいきゅうち · class midpoint 4級データ整理: 各階級の中央の値(=区間の中点)。度数分布表から平均などを計算するときの代表値として使う。
関連する教科書の節を読む →
散布図 さんぷず · scatter plot 4級可視化: 2 変数を横軸 $x$ ・縦軸 $y$ に取って点でプロットした図。2 変数の関係(相関)を視覚的に確認できる。
関連する教科書の節を読む →
棒グラフ ぼうぐらふ · bar chart 4級可視化: カテゴリごとの数量を棒の高さで比べる図。質的データ・離散量に向く。隣接させない(ヒストグラムとは異なる)。
関連する教科書の節を読む →
折れ線グラフ おれせんぐらふ · line chart 4級可視化: 時系列など順序のあるデータを線でつないだ図。推移・トレンドを示すのに適している。
関連する教科書の節を読む →
円グラフ えんぐらふ · pie chart 4級可視化: 全体を 100% として各項目の構成比を扇形で示す図。カテゴリが多すぎると見にくい。
関連する教科書の節を読む →
試行 しこう · trial 4級確率: 結果が偶然に決まる行為(コイン投げ・サイコロを振るなど)。確率の議論の出発点。
関連する教科書の節を読む →
事象 じしょう · event 4級確率: 試行の結果として起こりうる集合(例: サイコロで偶数の目が出る)。1 個の結果は「根元事象」と呼ぶ。
関連する教科書の節を読む →
排反事象 はいはんじしょう · mutually exclusive events 4級確率: 同時には起こりえない事象どうし。 $A \cap B = \emptyset$ 。確率の加法定理で和の確率がそのまま足し算になる条件。
関連する教科書の節を読む →
質的データ しつてきでーた · qualitative data 4級データ整理: 性別・血液型・好みなど、数値で大小を比較できないカテゴリのデータ。名義尺度・順序尺度に分類される。
関連する教科書の節を読む →
量的データ りょうてきでーた · quantitative data 4級データ整理: 身長・売上・気温など、数値で大小や差を比較できるデータ。間隔尺度・比例尺度に分類される。
関連する教科書の節を読む →
離散変数と連続変数 りさんへんすうとれんぞくへんすう · discrete vs. continuous variable 4級データ整理: 離散変数は人数・回数のような飛び飛びの値、連続変数は身長・時間のように切れ目なく値を取る変数。扱う確率分布が異なる。
関連する教科書の節を読む →
同様に確からしい どうようにたしからしい · equally likely 4級確率: ある試行のすべての根元事象が同じ確率で起こる状態。「サイコロ・コイン・くじ」など古典的確率の前提。
関連する教科書の節を読む →
樹形図 じゅけいず · tree diagram 4級場合の数: 場合の数や確率を漏れなく数えるために、選択を枝分かれで描いた図。条件付き確率の理解にも有効。
関連する教科書の節を読む →
パーセンタイル ぱーせんたいる · percentile 4級ばらつき: データを小さい順に並べたとき下から $p %$ の位置にある値。 $50$ パーセンタイルは中央値、 $25/75$ は四分位数。
関連する教科書の節を読む →
確率変数 かくりつへんすう · Random variable 4級確率分布: ランダムな結果を数値に対応させた変数。サイコロの出目・身長・通勤遅延回数など。離散型(整数値)と連続型(実数値)に分類される。確率分布で振る舞いを記述。
関連する教科書の節を読む →
二項分布 にこうぶんぷ · Binomial distribution 4級確率分布: 成功確率 $p$ の試行を独立に $n$ 回繰り返したときの成功回数の分布。 $X \sim B (n, p)$ 、 $E [X] = n p$ 、 $V [X] = n p (1 - p)$ 。コイン投げ・不良品個数・アンケートの賛成数。 $n$ が大きいと正規分布に近づく。
関連する教科書の節を読む →
68-95-99.7ルール ろくじゅうはちきゅうじゅうごきゅうじゅうきゅうてんなな · 68-95-99.7 rule 4級確率分布: 正規分布で平均 ±1σ に約 68%、±2σ に約 95%、±3σ に約 99.7% のデータが含まれる経験則。品質管理(±3σ から外れたら異常)・偏差値(平均から ±1σ で偏差値 60-40)で実用される。
関連する教科書の節を読む →
中心極限定理 ちゅうしんきょくげんていり · Central Limit Theorem (CLT) 4級確率分布: 独立同分布の確率変数の和(平均)は、母集団の分布形状によらず、サンプルサイズが大きくなると正規分布に近づく定理。統計的推測(信頼区間・仮説検定)の理論的基盤。
関連する教科書の節を読む →

Level

3級レベルの用語 (45)

分散 ぶんさん · variance 3級ばらつき: 偏差の 2 乗の平均。データのばらつきの大きさを表す代表的な指標。 $s^{2} = \frac{1}{n} \sum (x_{i} - \overset{x}{ˉ})^{2}$ 。
関連する教科書の節を読む →
標準偏差 ひょうじゅんへんさ · standard deviation 3級ばらつき: 分散の正の平方根。もとのデータと同じ単位でばらつきを表現できる。
関連する教科書の節を読む →
共分散 きょうぶんさん · covariance 3級2変数: $s_{x y} = \frac{1}{n} \sum (x_{i} - \overset{x}{ˉ}) (y_{i} - \overset{y}{ˉ})$ 。2 変数の連動の方向を示す。
関連する教科書の節を読む →
相関係数 そうかんけいすう · correlation coefficient 3級2変数: $r = s_{x y} / (s_{x} s_{y})$ 。 $- 1 \leq r \leq 1$ の値で 2 変数の直線関係の強さを表す。
関連する教科書の節を読む →
標準化 ひょうじゅんか · standardization (z-score) 3級変換: $z = (x - \overset{x}{ˉ}) / s$ により、平均 0・標準偏差 1 の物差しに変換する操作。
関連する教科書の節を読む →
偏差値 へんさち · T-score 3級変換: z スコアを $T = 50 + 10 z$ に変換した値。平均 50・標準偏差 10 の物差し。
関連する教科書の節を読む →
条件付き確率 じょうけんつきかくりつ · conditional probability 3級確率: 事象 $A$ が起こったもとで $B$ が起こる確率。 $P (B ∣ A) = P (A \cap B) / P (A)$ 。
関連する教科書の節を読む →
確率変数 かくりつへんすう · random variable 3級確率: 試行結果に応じて値が確率的に決まる変数。離散と連続がある。 $X, Y$ で表すのが慣例。
関連する教科書の節を読む →
期待値 きたいち · expectation 3級確率: 確率変数の「ならした平均値」。離散なら $E [X] = \sum x_{i} p_{i}$ 。
関連する教科書の節を読む →
二項分布 にこうぶんぷ · binomial distribution 3級分布: 成功確率 $p$ のベルヌーイ試行を $n$ 回繰り返したときの成功回数 $X$ の分布。 $E [X] = n p$ 、 $V [X] = n p (1 - p)$ 。
関連する教科書の節を読む →
正規分布 せいきぶんぷ · normal (Gaussian) distribution 3級分布: 釣鐘型の連続分布 $N (μ, σ^{2})$ 。中心極限定理により多くの平均量がこれに近づく。
関連する教科書の節を読む →
信頼区間 しんらいくかん · confidence interval 3級推定: 母集団の未知パラメータが「ある信頼度で」入る区間。例: $\overset{ˉ}{X} \pm 1.96 σ / n$ 。
関連する教科書の節を読む →
中心極限定理 ちゅうしんきょくげんていり · central limit theorem (CLT) 3級理論: 母集団の分布によらず、 $n$ が十分大きいとき標本平均は近似的に正規分布に従う、という定理。
関連する教科書の節を読む →
母集団 ぼしゅうだん · population 3級推測統計: 調査・推測の対象となる全データ集団。母集団の真の値(母平均・母分散など)を「母数(パラメータ)」と呼ぶ。
関連する教科書の節を読む →
標本 ひょうほん · sample 3級推測統計: 母集団から抽出された一部のデータ。標本から計算した値(標本平均など)を「統計量」と呼ぶ。
関連する教科書の節を読む →
全数調査 ぜんすうちょうさ · census 3級標本抽出: 母集団の全要素を調べる調査(国勢調査など)。誤差は小さいがコスト・時間がかかる。
関連する教科書の節を読む →
標本調査 ひょうほんちょうさ · sample survey 3級標本抽出: 母集団の一部だけを調べて全体を推測する調査。コストが低く、ほとんどの社会調査で採用される。
関連する教科書の節を読む →
無作為抽出 むさくいちゅうしゅつ · random sampling 3級標本抽出: 母集団のどの要素も同じ確率で標本に選ばれるようにする抽出法。推測統計の前提となる。
関連する教科書の節を読む →
標準正規分布 ひょうじゅんせいきぶんぷ · standard normal distribution 3級確率分布: 平均 0・分散 1 の正規分布 $N (0, 1)$ 。任意の正規分布は標準化により標準正規分布に変換できる。
関連する教科書の節を読む →
z 値 ぜっとち · z-score 3級推測統計: $z = (x - μ) / σ$ 。データを標準化したときの値。「平均から標準偏差いくつ分離れているか」を表す。
関連する教科書の節を読む →
確率密度関数 かくりつみつどかんすう · probability density function (pdf) 3級確率分布: 連続型確率変数の分布を表す関数 $f (x)$ 。区間 $[a, b]$ の確率は $\int_{a}^{b} f (x) d x$ 。
関連する教科書の節を読む →
累積分布関数 るいせきぶんぷかんすう · cumulative distribution function (cdf) 3級確率分布: $F (x) = P (X \leq x)$ 。「 $x$ 以下になる確率」を返す関数。pdf を積分すると得られる。
関連する教科書の節を読む →
大数の法則 たいすうのほうそく · law of large numbers 3級推測統計: 標本サイズ $n$ を大きくするほど、標本平均が母平均に近づく(確率収束する)という法則。推測統計の基盤。
関連する教科書の節を読む →
ベルヌーイ分布 べるぬーいぶんぷ · Bernoulli distribution 3級確率分布: 0 か 1 の値だけを取る最も単純な分布。 $P (X = 1) = p$ 。 $n$ 回の独立試行を集めると二項分布になる。
関連する教科書の節を読む →
復元抽出 ふくげんちゅうしゅつ · sampling with replacement 3級標本抽出: 抽出した要素を毎回母集団に戻してから次を引く方法。各回の試行が独立になり、二項分布などの前提となる。
関連する教科書の節を読む →
非復元抽出 ひふくげんちゅうしゅつ · sampling without replacement 3級標本抽出: 一度抽出した要素は戻さずに次を引く方法。実際の調査の標準。試行は独立でなく、超幾何分布などで扱う。
関連する教科書の節を読む →
母平均 ぼへいきん · population mean 3級推測統計: 母集団全体の平均値 $μ$ 。標本平均 $\overset{ˉ}{X}$ は母平均の不偏推定量で、推測統計の中心的な対象。
関連する教科書の節を読む →
母分散 ぼぶんさん · population variance 3級推測統計: 母集団全体の分散 $σ^{2}$ 。標本分散より不偏分散( $n - 1$ で割る)の方が母分散の不偏推定量となる。
関連する教科書の節を読む →
母比率 ぼひりつ · population proportion 3級推測統計: 母集団における特定属性を持つ要素の割合 $p$ 。世論調査や品質管理で「賛成率」「不良率」として推定対象になる。
関連する教科書の節を読む →
標本比率 ひょうほんひりつ · sample proportion 3級推測統計: 標本のうち特定属性を持つ要素の割合 $\overset{p}{^}$ 。大標本では $\overset{p}{^} \sim N (p, p (1 - p) / n)$ に近づく(中心極限定理)。
関連する教科書の節を読む →
期待値の線形性 きたいちのせんけいせい · linearity of expectation 3級確率: $E [a X + bY] = a E [X] + b E [Y]$ が独立性に関係なく常に成り立つ性質。確率論で最も使われる便利な道具。
関連する教科書の節を読む →
同時分布 どうじぶんぷ · joint distribution 3級確率: 複数の確率変数 $(X, Y)$ が同時に取る値の確率分布。同時分布から各変数の周辺分布や条件付き分布が得られる。
関連する教科書の節を読む →
周辺分布 しゅうへんぶんぷ · marginal distribution 3級確率: 同時分布から他の変数を確率の足し合わせ(積分)で消去して得られる、1 つの変数の単独分布。
関連する教科書の節を読む →
二項定理 にこうていり · binomial theorem 3級場合の数: $(a + b)^{n} = \sum_{k = 0}^{n}_{n} C_{k} a^{k} b^{n - k}$ 。二項分布の確率関数の正体でもある重要な展開公式。
関連する教科書の節を読む →
QC7つ道具 きゅーしーななつどうぐ · Seven QC tools 3級品質管理: 現場の品質改善で使う 7 つの数値分析ツール ─ パレート図・特性要因図(フィッシュボーン)・ヒストグラム・散布図・管理図・チェックシート・グラフ(層別)。
関連する教科書の節を読む →
新QC7つ道具 しんきゅーしーななつどうぐ · Seven new QC tools 3級品質管理: 言語データ・概念整理向けの 7 つのツール ─ 親和図(KJ 法)・連関図・系統図・マトリクス図・マトリクスデータ解析法・PDPC 法・アローダイアグラム。1979 年提唱。
関連する教科書の節を読む →
PDCAサイクル ぴーでぃーしーえーさいくる · PDCA Cycle 3級品質管理: Plan(計画)→ Do(実行)→ Check(確認)→ Act(処置)を反復する継続改善の枠組み。Deming サイクルとも。仮説検証を回すというサイエンスの基本構造を経営に持ち込んだもの。
関連する教科書の節を読む →
p値 ぴーち · p-value 3級仮説検定: 帰無仮説 H₀ が正しいと仮定したときに、観測された統計量以上に極端な値が得られる確率。 $p < α$ なら H₀ を棄却する。『H₀ が正しい確率』ではないので解釈に注意。
関連する教科書の節を読む →
棄却域 ききゃくいき · Rejection region 3級仮説検定: 検定統計量がこの範囲に入ったら帰無仮説を棄却する領域。両側 z 検定で α=5% なら $∣ Z ∣ \geq 1.96$ 、右片側で α=5% なら $Z \geq 1.645$ 。検定設計の中心概念。
関連する教科書の節を読む →
第一種の誤り だいいっしゅのあやまり · Type I error 3級仮説検定: 帰無仮説 H₀ が正しいのに棄却してしまう誤り。発生確率 = 有意水準 $α$ 。新薬で『効果がないのにある』と判定するなど。
関連する教科書の節を読む →
第二種の誤り だいにしゅのあやまり · Type II error 3級仮説検定: 帰無仮説 H₀ が誤っているのに棄却しない誤り。発生確率 $β$ 。検出力 = $1 - β$ 。実際の効果を見逃すミス。第一種の誤りとはトレードオフ関係(片方を厳しくすれば他方が緩む)。
関連する教科書の節を読む →
z検定 ぜっとけんてい · z-test 3級仮説検定: 検定統計量 $Z = (\overset{ˉ}{X} - μ_{0}) / (σ / n)$ が標準正規分布に従うことを利用する検定。母分散既知 or 大標本で母平均・母比率の検定に使う。3 級で扱う最も基本的な検定。
関連する教科書の節を読む →
適合度検定 てきごうどけんてい · Goodness-of-fit test 3級仮説検定: 観測度数分布が理論分布に従うかを判定するカイ二乗検定。 $χ^{2} = \sum (O_{i} - E_{i})^{2} / E_{i}$ が自由度 $k - 1$ のカイ二乗分布に従う。サイコロの公平性、メンデルの遺伝の法則の検証など。
関連する教科書の節を読む →
片側検定 かたがわけんてい · One-sided test 3級仮説検定: 対立仮説 $H_{1} : μ > μ_{0}$ または $μ < μ_{0}$ のように方向を指定した検定。両側に比べ棄却域が片側に集中するため、同じ α で検出力が高い。事後に方向を変えるのは『p ハッキング』。
関連する教科書の節を読む →
両側検定 りょうがわけんてい · Two-sided test 3級仮説検定: 対立仮説 $H_{1} : μ \neq = μ_{0}$ のように方向を限定しない検定。棄却域が両裾(各 $α /2$ )に分かれる。『変わったか』を見たい標準的な状況で使う。
関連する教科書の節を読む →

Level

2級レベルの用語 (128)

不偏分散 ふへんぶんさん · unbiased sample variance 2級推定: $\overset{s}{^}^{2} = \frac{1}{n - 1} \sum (X_{i} - \overset{ˉ}{X})^{2}$ 。母分散 $σ^{2}$ の不偏推定量。
関連する教科書の節を読む →
標準誤差 ひょうじゅんごさ · standard error (SE) 2級推定: 推定量のばらつきの大きさ。標本平均なら $σ / n$ 。 $n$ を増やすと縮む。
関連する教科書の節を読む →
自由度 じゆうど · degrees of freedom 2級推定: 推定で「自由に動ける情報の数」。不偏分散の自由度は $n - 1$ 、回帰の残差は $n - k - 1$ など。
関連する教科書の節を読む →
t 分布 てぃーぶんぷ · Student's t-distribution 2級分布: 標準正規より裾が厚い釣鐘型分布。母分散未知での母平均の推定・検定に使う。自由度を持つ。
関連する教科書の節を読む →
帰無仮説 きむかせつ · null hypothesis 2級検定: 「差はない」「効果はない」など、退屈で当たり障りのない出発点となる仮説。 $H_{0}$ 。
関連する教科書の節を読む →
対立仮説 たいりつかせつ · alternative hypothesis 2級検定: 帰無仮説に反する、研究者が示したい仮説。 $H_{1}$ または $H_{a}$ 。
関連する教科書の節を読む →
有意水準 ゆういすいじゅん · significance level 2級検定: 「 $H_{0}$ が真なのに棄却してしまう確率」の上限。慣例的に $α = 0.05$ や $0.01$ 。
関連する教科書の節を読む →
p 値 ぴーち · p-value 2級検定: $H_{0}$ のもとで、現在のデータと同等以上に極端なデータが観測される確率。 $p < α$ で棄却。
関連する教科書の節を読む →
第1種の誤り だいいっしゅのあやまり · Type I error 2級検定: $H_{0}$ が真なのに棄却してしまう誤り。確率は $α$ 。
関連する教科書の節を読む →
第2種の誤り だいにしゅのあやまり · Type II error 2級検定: $H_{1}$ が真なのに $H_{0}$ を棄却できない誤り。確率は $β$ 。検出力は $1 - β$ 。
関連する教科書の節を読む →
カイ二乗検定 かいにじょうけんてい · chi-squared test 2級検定: 観測度数と期待度数の食い違いを $χ^{2} = \sum (O - E)^{2} / E$ で測る検定。適合度・独立性に使う。
関連する教科書の節を読む →
回帰係数 かいきけいすう · regression coefficient 2級回帰: 回帰直線の傾き $\hat{β}$ 。 $x$ が 1 単位増えたときの $y$ の予測値の変化量。
関連する教科書の節を読む →
決定係数 けっていけいすう · coefficient of determination 2級回帰: $R^{2} = 1 - RSS / TSS$ 。回帰モデルが応答変数の分散をどれだけ説明できたかの指標。
関連する教科書の節を読む →
最小二乗法 さいしょうにじょうほう · ordinary least squares (OLS) 2級回帰: 残差の 2 乗和を最小にするように回帰係数を推定する方法。 $\hat{β} = (X^{⊤} X)^{- 1} X^{⊤} y$ 。
関連する教科書の節を読む →
不偏推定量 ふへんすいていりょう · unbiased estimator 2級推定: 期待値が母数に一致する推定量 $E [\hat{θ}] = θ$ 。標本平均は母平均の不偏推定量、不偏分散は母分散の不偏推定量。
関連する教科書の節を読む →
カイ二乗分布 かいにじょうぶんぷ · chi-squared distribution 2級確率分布: 標準正規変数 $Z_{1}, \dots, Z_{k}$ の二乗和 $\sum Z_{i}^{2}$ の分布。自由度 $k$ 。分散の検定や独立性の検定で使う。
関連する教科書の節を読む →
F 分布 えふぶんぷ · F distribution 2級確率分布: 2 つの独立なカイ二乗統計量の比の分布。分散分析・分散比の検定に使う。
関連する教科書の節を読む →
F 検定 えふけんてい · F test 2級検定: F 分布を使った検定の総称。2 群の分散の等しさの検定や、回帰モデルの全係数 0 の検定など。
関連する教科書の節を読む →
対応のある t 検定 たいおうのあるてぃーけんてい · paired t-test 2級検定: 同じ被験者の前後比較など、ペア構造があるデータの平均差の検定。差 $d_{i}$ の平均が 0 かを検定する。
関連する教科書の節を読む →
対応のない t 検定 たいおうのないてぃーけんてい · two-sample t-test 2級検定: 独立な 2 群の平均差の検定。等分散を仮定するスチューデントの t 検定と、仮定しないウェルチの t 検定がある。
関連する教科書の節を読む →
分散分析 ぶんさんぶんせき · ANOVA (analysis of variance) 2級検定: 3 群以上の平均差を、群間変動と群内変動の比(F 値)で同時に検定する手法。一元配置・二元配置などがある。
関連する教科書の節を読む →
残差 ざんさ · residual 2級回帰: 実測値とモデルによる予測値の差 $y_{i} - \overset{y}{^}_{i}$ 。回帰の当てはまりや前提(等分散・独立性)を残差プロットで診断する。
関連する教科書の節を読む →
多重共線性 たじゅうきょうせんせい · multicollinearity 2級回帰: 重回帰で説明変数どうしが強く相関している状態。係数の推定が不安定になる。VIF などで検出する。
関連する教科書の節を読む →
単純無作為抽出 たんじゅんむさくいちゅうしゅつ · simple random sampling 2級標本抽出: 母集団のすべての要素が等しい確率で選ばれる、最も基本的な無作為抽出法。
関連する教科書の節を読む →
層化抽出 そうかちゅうしゅつ · stratified sampling 2級標本抽出: 母集団を性別・年代などの層に分け、各層から無作為抽出する方法。層内が均質なほど推定精度が上がる。
関連する教科書の節を読む →
クラスター抽出 くらすたーちゅうしゅつ · cluster sampling 2級標本抽出: 母集団を地域・学校などの集落(クラスター)に分け、いくつかのクラスターを丸ごと抽出する方法。コスト効率が高い。
関連する教科書の節を読む →
統計法 とうけいほう · Statistics Act 2級公的統計: 公的統計の作成・利用に関する基本法律(2007 年全部改正)。基幹統計の指定、統計データの目的外利用、秘密保護などを規定。
関連する教科書の節を読む →
基幹統計 きかんとうけい · fundamental statistics 2級公的統計: 国勢統計(国勢調査)など、特に重要として総務大臣が指定する公的統計。報告義務・正確性確保の規定が強化されている。
関連する教科書の節を読む →
標本誤差 ひょうほんごさ · sampling error 2級標本抽出: 標本調査で全数を見ないことから生じる、推定値と母集団真値のズレ。標本サイズの平方根に反比例して小さくなる。
関連する教科書の節を読む →
非標本誤差 ひひょうほんごさ · non-sampling error 2級標本抽出: 回答漏れ・回答ミス・集計ミスなど、抽出以外の原因で生じる誤差。標本サイズを増やしても減らない。
関連する教科書の節を読む →
多段抽出 ただんちゅうしゅつ · multistage sampling 2級標本抽出: 都道府県 → 市区町村 → 世帯のように、段階的に抽出単位を絞り込む方法。大規模調査でコストを抑えられる。
関連する教科書の節を読む →
一様分布 いちようぶんぷ · uniform distribution 2級確率分布: 区間 $[a, b]$ で確率密度が一定の連続分布。乱数生成の基礎で、他分布のシミュレーションの出発点になる。
関連する教科書の節を読む →
幾何分布 きかぶんぷ · geometric distribution 2級確率分布: 成功確率 $p$ のベルヌーイ試行を繰り返したときの初めて成功するまでの試行回数の分布。 $E [X] = 1/ p$ 。
関連する教科書の節を読む →
信頼水準 しんらいすいじゅん · confidence level 2級推定: 信頼区間が母数を含む確率(例: 95%)。 $1 - α$ の関係。区間幅と引き換えに信頼度を高められる。
関連する教科書の節を読む →
検出力 けんしゅつりょく · statistical power 2級検定: 対立仮説が真のとき正しく帰無仮説を棄却できる確率 $1 - β$ 。サンプルサイズ設計の基準として使う。
関連する教科書の節を読む →
効果量 こうかりょう · effect size 2級検定: 群間の差の大きさを標準化した指標(Cohen の $d$ など)。p 値だけでは分からない「実質的な大きさ」を示す。
関連する教科書の節を読む →
ノンパラメトリック検定 のんぱらめとりっくけんてい · nonparametric test 2級検定: 正規性などの分布仮定を置かず、順位や符号を用いる検定の総称。サンプルが小さい・分布が歪むときに有用。
関連する教科書の節を読む →
ウィルコクソンの符号順位検定 うぃるこくそんのふごうじゅんいけんてい · Wilcoxon signed-rank test 2級検定: 対応のある 2 群差を、差の符号と順位に基づいて検定するノンパラ手法。対応のある t 検定の正規性を仮定しない代替。
関連する教科書の節を読む →
マン・ホイットニーの U 検定 まんほいっとにーのゆーけんてい · Mann–Whitney U test 2級検定: 独立な 2 群の中央位置差を順位で検定するノンパラ手法。対応のない t 検定の正規性を仮定しない代替。
関連する教科書の節を読む →
スピアマンの順位相関係数 すぴあまんのじゅんいそうかんけいすう · Spearman's rank correlation 2級回帰: 2 変数の順位どうしのピアソン相関。単調関係を測り、外れ値や非線形変換に頑健。
関連する教科書の節を読む →
自由度調整済み決定係数 じゆうどちょうせいずみけっていけいすう · adjusted R² 2級回帰: 説明変数を増やすと無闇に上がる $R^{2}$ を、自由度で罰則化した指標。重回帰のモデル比較の基本ツール。
関連する教科書の節を読む →
AIC えーあいしー · Akaike information criterion 2級回帰: $AIC = - 2 lo g L + 2 k$ 。当てはまり( $- 2 lo g L$ )とパラメータ数 $k$ の罰則の和。小さいほど良いモデル。
関連する教科書の節を読む →
BIC びーあいしー · Bayesian information criterion 2級回帰: $BIC = - 2 lo g L + k lo g n$ 。AIC よりパラメータ数の罰則が強く、より単純なモデルを選びやすい情報量規準。
関連する教科書の節を読む →
データクレンジング でーたくれんじんぐ · data cleansing 2級データ工学: 入力ミス・重複・形式不統一などを発見・修正してデータを分析可能な状態にする工程。実務の分析時間の半分以上を占める。
関連する教科書の節を読む →
欠損値処理 けっそんちしょり · missing value imputation 2級データ工学: 欠損データを除外/平均補完/回帰補完/多重代入などで処理する手法群。欠損メカニズム(MCAR/MAR/MNAR)で適切な手法が変わる。
関連する教科書の節を読む →
標準化(スケーリング) ひょうじゅんか · feature scaling 2級データ工学: 特徴量を平均 0 ・分散 1(標準化)、または $[0, 1]$ (正規化)に揃える前処理。距離ベース手法・勾配法で必須。
関連する教科書の節を読む →
A/B テスト えーびーてすと · A/B testing 2級実務: ユーザーをランダムに 2 群に分け、施策の効果を比較する実験。Web マーケ・プロダクト改善で標準。仮説検定の応用そのもの。
関連する教科書の節を読む →
ピボットテーブル ぴぼっとてーぶる · pivot table 2級実務: Excel・BI ツールで、行/列/値を動的に切り替えてクロス集計を行う仕組み。DS 基礎試験では実技の中核機能。
関連する教科書の節を読む →
KPI けーぴーあい · Key Performance Indicator 2級実務: 目標達成度を測る重要業績評価指標。事業の北極星指標(NSM)とともに、データドリブン経営の意思決定基準となる。
関連する教科書の節を読む →
国民経済計算 こくみんけいざいけいさん · System of National Accounts (SNA) 2級公的統計: 国の経済活動を生産・分配・支出の側面から体系的に記録する統計体系。GDP はその主要指標。日本は内閣府が作成。
関連する教科書の節を読む →
消費者物価指数 しょうひしゃぶっかしすう · Consumer Price Index (CPI) 2級公的統計: 家計が購入する商品・サービスの価格変動を、ある基準時を 100 として表す指数。総務省が作成、日銀の物価目標の対象。
関連する教科書の節を読む →
ウェイトバック集計 うぇいとばっくしゅうけい · weighting back 2級公的統計: 標本構成と母集団構成のズレを補正するため、各回答に「逆数(または比)」の重みを掛けて集計する手法。
関連する教科書の節を読む →
統計的開示制御 とうけいてきかいじせいぎょ · statistical disclosure control 2級公的統計: 公的統計データの提供時に、個人や事業所が特定されないよう、頂上値の丸めやセル抑制等で識別リスクを低減する処理。
関連する教科書の節を読む →
標本設計 ひょうほんせっけい · sample design 2級公的統計: 目標精度・コスト・回収率を踏まえ、抽出方法・標本サイズ・層化変数などを事前に決める計画段階。調査の質を大きく左右する。
関連する教科書の節を読む →
管理図 かんりず · control chart 2級品質管理: 工程から定期的に取った統計量を時系列で記録し、UCL/LCL を引いて異常を判定する図。Shewhart の X̄-R 管理図、p 管理図、c 管理図など。
関連する教科書の節を読む →
工程能力指数 こうていのうりょくしすう · process capability index (Cp/Cpk) 2級品質管理: 規格幅に対する工程のばらつきの大きさを表す指標。 $C_{p} = (U S L - L S L) / (6 σ)$ 、中心ずれを考慮した $C_{p k}$ も併用。製造業の目標 $C_{p k} \geq 1.33$ 。
関連する教科書の節を読む →
シックスシグマ しっくすしぐま · Six Sigma 2級品質管理: $\pm 6 σ$ の品質管理を目指す改革運動。100 万個に 3.4 個の不良率(3.4 PPM)。 $C_{p k} = 2.0$ に相当。モトローラ・GE が広めた。
関連する教科書の節を読む →
OC 曲線 おーしーきょくせん · Operating Characteristic Curve 2級品質管理: 抜取検査の性能を示す曲線。横軸=ロット不良率、縦軸=合格確率。AQL では合格、LTPD では不合格となるのが理想。
関連する教科書の節を読む →
AQL えーきゅーえる · Acceptable Quality Level 2級品質管理: 合格品質水準。検査でほぼ常に合格とすべき不良率の上限。生産者リスク α が 5% 以下になる水準。
関連する教科書の節を読む →
LTPD えるてぃーぴーでぃー · Lot Tolerance Percent Defective 2級品質管理: ロット許容不良率。検査でほぼ常に不合格とすべき不良率。消費者リスク β が 10% 以下になる水準。
関連する教科書の節を読む →
QC 7 つ道具 きゅーしーななつどうぐ · Seven QC tools 2級品質管理: パレート図・特性要因図・ヒストグラム・散布図・管理図・チェックシート・グラフ(層別)。数値データを使った品質改善の基本ツール。
関連する教科書の節を読む →
新 QC 7 つ道具 しんきゅーしーななつどうぐ · Seven new QC tools 2級品質管理: 親和図(KJ 法)・連関図・系統図・マトリクス図・マトリクスデータ解析・PDPC 法・アローダイアグラム。言語データ・概念整理に特化。
関連する教科書の節を読む →
TQM てぃーきゅーえむ · Total Quality Management 2級品質管理: 総合的品質管理。3 本柱は『顧客重視・全員参加・継続的改善(カイゼン)』。日本の製造業の競争力の源泉となった経営手法。
関連する教科書の節を読む →
ROC曲線 あーるおーしーきょくせん · ROC Curve 2級機械学習: 二値分類の閾値を動かしたとき、真陽性率(縦軸)と偽陽性率(横軸)の関係を描いた曲線。AUC で性能を要約。
AUC えーゆーしー · Area Under Curve 2級機械学習: ROC 曲線の下側面積。1.0 で完璧、0.5 でランダム。閾値非依存の分類性能指標。
F1スコア えふわんすこあ · F1 Score 2級機械学習: 適合率(Precision)と再現率(Recall)の調和平均。クラス不均衡なデータの分類評価で使われる。
特徴量エンジニアリング とくちょうりょうえんじにありんぐ · Feature Engineering 2級機械学習: ドメイン知識を活用して有用な特徴量を作る作業。テーブルデータのモデル性能を大きく左右する。
Welch の t 検定 うぇるちのてぃーけんてい · Welch's t-test 2級仮説検定: 2 標本の平均差を検定する手法のうち、等分散を仮定しないバージョン。Welch-Satterthwaite の近似自由度を用いる。現代の実務では既定値に近い扱い。
関連する教科書の節を読む →
対応のある t 検定 たいおうのあるてぃーけんてい · paired t-test 2級仮説検定: 同一個体・同一ペアで観測した 2 値の差について 1 標本 t 検定を行う方法。個人差が相殺されるため対応のないものより検出力が高い。
関連する教科書の節を読む →
母分散の検定 ぼぶんさんのけんてい · test for population variance 2級仮説検定: 正規母集団のもとで、不偏分散を $(n - 1) \overset{s}{^}^{2} / σ_{0}^{2} \sim χ_{n - 1}^{2}$ で検定。製造工程のばらつき管理などに使う。正規性の崩れに敏感。
関連する教科書の節を読む →
一元配置分散分析 いちげんはいちぶんさんぶんせき · one-way ANOVA 2級分散分析: 3 群以上の平均を一度に比較する分散分析。多重比較問題を避けて全体差を判定する。F 統計量で群間平方和と群内平方和の比を取る。
関連する教科書の節を読む →
二元配置分散分析 にげんはいちぶんさんぶんせき · two-way ANOVA 2級分散分析: 2 つの因子を同時に扱う分散分析。主効果に加えて交互作用 (interaction) を検出できる。繰り返しがあれば交互作用が分離可能。
関連する教科書の節を読む →
交互作用 こうごさよう · interaction 2級分散分析: 2 元配置以上の分散分析で「ある因子の効果が、別の因子の水準で異なる」現象。プロットの折れ線が平行でないとき交互作用がある。
関連する教科書の節を読む →
Bonferroni 補正 ぼんふぇろーにほせい · Bonferroni correction 2級多重比較: $m$ 個の検定で各有意水準を $α / m$ に厳しくし、全体の Type I エラー率(FWER)を抑える方法。簡便だが保守的。
関連する教科書の節を読む →
Tukey の HSD てゅーきーのえいちえすでぃー · Tukey's HSD 2級多重比較: ANOVA の事後検定で、全ペア比較を等しい有意水準で行う方法。スチューデント化された範囲分布を使う。Bonferroni より検出力が高い。
重回帰分析 じゅうかいきぶんせき · multiple regression 2級回帰分析: 複数の説明変数を持つ線形回帰。各偏回帰係数 $β_{j}$ は他の変数を固定したときの効果。正規方程式 $\hat{β} = (X^{⊤} X)^{- 1} X^{⊤} y$ 。
関連する教科書の節を読む →
偏回帰係数 へんかいきけいすう · partial regression coefficient 2級回帰分析: 重回帰モデルの個別の係数。「他の説明変数を固定したときの $x_{j}$ の効果」を表す。単純相関とは異なる。
関連する教科書の節を読む →
自由度調整済み決定係数 じゆうどちょうせいずみけっていけいすう · adjusted R-squared 2級回帰分析: 重回帰で説明変数を増やすと $R^{2}$ が必ず上がる問題を補正した指標。意味のない変数を増やすと逆に下がる。
関連する教科書の節を読む →
多重共線性 たじゅうきょうせんせい · multicollinearity 2級回帰分析: 説明変数同士が強く相関している状態。係数の標準誤差が膨張し、個別 t 値が小さくなる。VIF で診断。
関連する教科書の節を読む →
VIF ぶいあいえふ · Variance Inflation Factor 2級回帰分析: 多重共線性の診断指標。 $VIF_{j} = 1/ (1 - R_{j}^{2})$ で計算され、5〜10 を超えると要注意。
関連する教科書の節を読む →
Cook の距離 くっくのきょり · Cook's distance 2級残差診断: 個別観測値が回帰係数に与える影響の総合指標。1 を大きく超える観測点はモデルへの影響が強い。
関連する教科書の節を読む →
てこ比 てこひ · leverage 2級残差診断: 説明変数 $x$ が他のデータから離れた観測点ほど大きい値を取る指標。 $h_{ii}$ で表す。
関連する教科書の節を読む →
ヘテロスケダスティシティ へてろすけだすてぃしてぃ · heteroscedasticity 2級残差診断: 回帰の残差の分散が一定でない状態(不均一分散)。残差プロットがラッパ型になる。 $lo g y$ 変換や WLS で対処。
関連する教科書の節を読む →
工程能力指数 こうていのうりょくしすう · Process capability index 2級品質管理: 規格幅 USL−LSL に対する工程ばらつきの相対指標。 $C_{p} = (USL - LSL) / (6 σ)$ 。中心ずれを考慮した $C_{p k}$ 、目標値からの逸脱もペナルティ化する $C_{p m}$ を併用する。
関連する教科書の節を読む →
シックスシグマ しっくすしぐま · Six Sigma 2級品質管理: 規格幅が ±6σ に収まる工程能力( $C_{p k} = 2.0$ 、不良率 ≒ 3.4 PPM)を目標とする品質改革手法。モトローラ発、GE が 1990 年代に展開。DMAIC サイクルで運用。
関連する教科書の節を読む →
管理図 かんりず · Control chart 2級品質管理: 工程の測定値を時系列で記録し、中心線・上下管理限界(±3σ)で異常を検出する図。Shewhart が 1924 年に考案。X̄-R / X̄-s / X-Rs(計量値)、p / np / c / u(計数値)に分かれる。
関連する教科書の節を読む →
OC曲線 おーしーきょくせん · Operating Characteristic Curve 2級品質管理: 抜取検査計画における『ロット不良率 p』と『合格確率 L(p)』の関係を表す曲線。AQL(生産者リスク α=5% 以下)と LTPD(消費者リスク β=10% 以下)で計画の性能を要約する。
関連する教科書の節を読む →
実験計画法 じっけんけいかくほう · Design of Experiments (DOE) 2級実験計画法: 限られた試行で複数因子の効果を効率よく分離する統計手法。Fisher の 3 原則(反復・無作為化・局所管理)を出発点に、一元配置・二元配置・直交表・田口メソッドに発展。
関連する教科書の節を読む →
直交表 ちょっこうひょう · Orthogonal array 2級実験計画法: $n$ 行 $k$ 列で、任意の 2 列の水準組合せが同回数現れる表。 $L_{8} (2^{7}), L_{9} (3^{4}), L_{16} (2^{15})$ などが代表的。少ない試行で多因子の主効果を独立に推定できる。
関連する教科書の節を読む →
交互作用 こうごさよう · Interaction effect 2級実験計画法: 因子の組合せが主効果の単純合算で説明できない現象。二元配置 ANOVA で $S_{A \times B}$ として検定する。交互作用を見落とすと因子の真の効果を取り違える。
関連する教科書の節を読む →
田口メソッド たぐちめそっど · Taguchi Method 2級実験計画法: 田口玄一が体系化した品質工学。誤差因子のもとで応答が安定する制御因子の組合せを SN 比 $SN = 10 lo g_{10} (\overset{y}{ˉ}^{2} / s^{2})$ の最大化で探す『ロバスト設計』。直交表が主道具。
関連する教科書の節を読む →
信頼性関数 しんらいせいかんすう · Reliability function 2級信頼性工学: 時刻 $t$ までに故障しない確率 $R (t) = P (T > t) = 1 - F (t)$ 。故障率 $λ (t) = f (t) / R (t)$ から $R (t) = exp (- \int_{0}^{t} λ)$ と一意に決まる。生存解析の生存関数と同概念。
関連する教科書の節を読む →
バスタブ曲線 ばすたぶきょくせん · Bathtub curve 2級信頼性工学: 故障率 $λ (t)$ の典型的な時間変化。初期故障期(減少)→ 偶発故障期(一定)→ 摩耗故障期(増加)の 3 段階。バーンインで初期故障を、予防保守で摩耗故障を制御する。
関連する教科書の節を読む →
ワイブル分布 わいぶるぶんぷ · Weibull distribution 2級信頼性工学: 形状 $m$ と尺度 $η$ をもつ寿命分布。 $R (t) = exp (- (t / η)^{m})$ 。 $m < 1$ で初期故障、 $m = 1$ で指数分布(偶発故障)、 $m > 1$ で摩耗故障 ─ バスタブ曲線の各段階を 1 つの族で表せる。
関連する教科書の節を読む →
MTBF えむてぃーびーえふ · Mean Time Between Failures 2級信頼性工学: 修理可能系の平均故障間隔(MTTF + MTTR)。 $Availability = MTBF / (MTBF + MTTR)$ で可用性を計算。SLA でファイブナイン(99.999% = 年 5 分以下停止)の根拠数字。
関連する教科書の節を読む →
FMEA えふえむいーえー · Failure Mode and Effects Analysis 2級信頼性工学: 部品の故障モードを発生度・影響度・検知容易性で評価し、リスク優先数 RPN = O × S × D を算出するボトムアップの予防分析。FT が結果から原因を辿るのに対し、FMEA は原因から影響を予測。
関連する教科書の節を読む →
FT法 えふてぃーほう · Fault Tree Analysis 2級信頼性工学: 頂上事象(望まない結果)から AND/OR 論理ゲートで原因を分解するトップダウン安全分析手法。基本事象に確率を付与して頂上事象の発生確率を計算。航空・原発・医療機器の業界標準。
関連する教科書の節を読む →
固有値 こゆうち · Eigenvalue 2級線形代数: 正方行列 $A$ について $A v = λ v$ ( $v \neq = 0$ )を満たすスカラー $λ$ 。特性方程式 $det (A - λ I) = 0$ の解。トレース = 固有値の和、行列式 = 固有値の積。
関連する教科書の節を読む →
固有ベクトル こゆうべくとる · Eigenvector 2級線形代数: $A v = λ v$ を満たす非ゼロベクトル $v$ 。 $A$ をかけても **方向が変わらない** 特別な向き。対称行列では互いに直交する固有ベクトルが選べる。
関連する教科書の節を読む →
対角化 たいかくか · Diagonalization 2級線形代数: 正方行列を $A = P Λ P^{- 1}$ の形に分解(P は固有ベクトル行列、Λ は固有値の対角行列)。 $A^{k} = P Λ^{k} P^{- 1}$ より行列のべき乗が容易になる。
関連する教科書の節を読む →
CASMフレームワーク きゃすむふれーむわーく · Cognitive Aspects of Survey Methodology 2級調査統計: 回答者の認知過程を 4 段階(質問の理解 → 関連情報の検索 → 判断の形成 → 回答の表出)で整理した枠組み。Tourangeau らが提唱。各段階で起こる誤差を予測して調査票を設計する。
関連する教科書の節を読む →
非標本誤差 ひひょうほんごさ · Non-sampling error 2級調査統計: 標本誤差以外の誤差全般。カバレッジ誤差(フレーム不備)・無回答誤差・測定誤差・処理誤差の 4 種類が主軸。標本サイズを増やしても減らないので、ビッグデータでも残る。
関連する教科書の節を読む →
カバレッジ誤差 かばれっじごさ · Coverage error 2級調査統計: 標本フレーム(調査台帳)が母集団を正しく反映していない誤差。1936 年米大統領選 Literary Digest 誌の予測失敗が古典的事例。Web 調査・固定電話 RDD でも常に問題になる。
関連する教科書の節を読む →
社会的望ましさバイアス しゃかいてきのぞましさばいあす · Social desirability bias 2級調査統計: 回答者が社会通念上『望ましい』方向に回答を歪めるバイアス。飲酒量・運動量・収入・学歴・違反行為などで顕著。匿名性の確保や間接質問法で軽減。
関連する教科書の節を読む →
事後層化 じごそうか · Post-stratification 2級調査統計: 取得した標本を年齢×性別等で集計し、母集団の構成比に合わせる重み付け。Web 調査・任意参加調査の偏り矯正に使う標準手法。レイキング(複数変数同時調整)に拡張可能。
関連する教科書の節を読む →
Lasso回帰 らっそかいき · Lasso regression 2級機械学習: L1 正則化付き線形回帰: $∥ y - X β ∥^{2} + λ ∥ β ∥_{1}$ 。係数を完全に 0 にする効果があり、**特徴選択** に使える。多重共線性下での不安定さは ElasticNet で緩和。
関連する教科書の節を読む →
Ridge回帰 りっじかいき · Ridge regression 2級機械学習: L2 正則化付き線形回帰: $∥ y - X β ∥^{2} + λ ∥ β ∥_{2}^{2}$ 。係数を縮小して多重共線性に強い。すべての特徴を残すので解釈はしやすいが、不要特徴の除去はしない。
関連する教科書の節を読む →
勾配ブースティング こうばいぶーすてぃんぐ · Gradient Boosting 2級機械学習: 弱学習器(決定木)を順次に学習し、前段の残差を次の木が予測するアンサンブル手法。XGBoost・LightGBM・CatBoost が現代の表形式データ予測のデファクト標準。
関連する教科書の節を読む →
ランダムフォレスト らんだむふぉれすと · Random Forest 2級機械学習: 多数の決定木をブートストラップサンプル + 特徴量サンプリングで作り、平均/多数決で予測する **バギング** 系のアンサンブル。過学習に頑健で実務の最初の選択肢。
関連する教科書の節を読む →
サポートベクターマシン さぽーとべくたーましん · Support Vector Machine (SVM) 2級機械学習: クラス境界からのマージン(最近距離)を最大化する分類器。**カーネルトリック** で非線形分離に拡張(RBF カーネルが標準)。少データ・高次元で安定。
関連する教科書の節を読む →
ロジスティック回帰 ろじすてぃっくかいき · Logistic regression 2級機械学習: $P (y = 1 ∣ x) = σ (w^{⊤} x + b)$ の線形分類器。確率出力・係数解釈性・高速。実務のベースラインで最頻出。交差エントロピー損失で学習。
関連する教科書の節を読む →
k-meansクラスタリング けーみーんずくらすたりんぐ · k-means clustering 2級機械学習: クラスタ数 $k$ を事前決定し、各点を最寄りの重心に割り当て + 重心更新を反復する教師なし学習。 $k$ 決定にエルボー法・シルエットスコアを使う。初期化感度を **k-means++** で軽減。
関連する教科書の節を読む →
DBSCAN でぃーびーすきゃん · DBSCAN 2級機械学習: Density-Based Spatial Clustering of Applications with Noise。密度ベースで $k$ 不要・任意形状のクラスタ発見・外れ値自動検出が利点。`eps`・`min_samples` がハイパラ。
関連する教科書の節を読む →
t-SNE てぃーすにー · t-Distributed Stochastic Neighbor Embedding 2級機械学習: 高次元データの局所近傍関係を低次元(通常 2 次元)で保つ非線形次元削減手法。可視化に強いが大域構造は壊れがち。Word Embedding 可視化の定番。後継 UMAP は大域構造もより保つ。
関連する教科書の節を読む →
協調フィルタリング きょうちょうふぃるたりんぐ · Collaborative Filtering 2級機械学習: ユーザー × アイテムの評価行列から、似たユーザー / 似たアイテムを使って好みを予測する推薦手法。**行列分解(SVD・ALS)** が中核数学。Netflix Prize 優勝モデルの基盤。
関連する教科書の節を読む →
Welchのt検定 うぇるちのてぃーけんてい · Welch's t-test 2級仮説検定: 等分散を仮定しない 2 標本 t 検定。Excel の T.TEST 関数で `検定の種類=3`、または分析ツール『等分散を仮定しない 2 標本検定』で実行。実務での 2 群比較の標準。
関連する教科書の節を読む →
対応のあるt検定 たいおうのあるてぃーけんてい · Paired t-test 2級仮説検定: 同じ被験者の前後比較で平均差を検定。被験者間のばらつきを相殺できるため検出力が高い。Excel の T.TEST で `検定の種類=1`。投薬前後・施策前後・テスト前後で頻用。
関連する教科書の節を読む →
多重比較 たじゅうひかく · Multiple comparisons 2級仮説検定: 3 群以上の検定で、各ペア検定を繰り返すと第一種の誤りが増殖する問題。**Bonferroni 補正**(α/m)・**Tukey の HSD**・**Dunnett 検定** で全体の α を制御するのが定石。
関連する教科書の節を読む →
Cramér's V くらめーるぶい · Cramér's V 2級分割表分析: $V = χ^{2} / (N \cdot min (r - 1, c - 1))$ で 0〜1 の標準化された関連の強さ指標。p 値とセットで報告し、 $V \approx 0.1$ で弱、 $0.3$ で中、 $0.5$ で強の目安。
関連する教科書の節を読む →
Fisherの正確検定 ふぃっしゃーのせいかくけんてい · Fisher's exact test 2級分割表分析: $2 \times 2$ 分割表の独立性を超幾何分布で厳密計算する検定。期待度数 < 5 の小標本でカイ二乗近似が破綻する場面で使う。R: `fisher.test()`、Python: `scipy.stats.fisher_exact()`。
関連する教科書の節を読む →
オッズ比 おっずひ · Odds Ratio (OR) 2級分割表分析: $2 \times 2$ 表で $OR = a d / b c$ 。ケースコントロール研究で頻用。 $ln OR$ が近似的に正規分布で、SE = $1/ a + 1/ b + 1/ c + 1/ d$ 。希少疾患では $OR \approx RR$ 。
関連する教科書の節を読む →
マンテル-ヘンツェル法 まんてる-へんつぇるほう · Mantel-Haenszel method 2級分割表分析: 層別された複数の $2 \times 2$ 表を統合して合同オッズ比を算出する古典的手法。 $OR_{MH} = \sum a_{k} d_{k} / n_{k} / \sum b_{k} c_{k} / n_{k}$ 。シンプソンのパラドックスを回避。
関連する教科書の節を読む →
ロジット関数 ろじっとかんすう · Logit function 2級ロジスティック回帰: $logit (p) = ln (p / (1 - p))$ 。確率 $p$ を $(- \infty, \infty)$ にマッピング。逆関数がシグモイド $σ (z) = 1/ (1 + e^{- z})$ 。ロジスティック回帰の中核。
関連する教科書の節を読む →
Hosmer-Lemeshow検定 ほすまー-れめしょうけんてい · Hosmer-Lemeshow test 2級ロジスティック回帰: ロジスティック回帰の適合度を見る検定。予測確率を 10 分位に分け、観測 vs 期待のカイ二乗統計量で評価。p > 0.05 で『適合してる』(逆向きの仮説検定)。
関連する教科書の節を読む →
GDPR じーでぃーぴーあーる · General Data Protection Regulation 2級プライバシー: EU の一般データ保護規則(2018 施行)。EU 域内の個人データ処理に適用、忘れられる権利・データポータビリティ・DPO 選任義務など。違反は最大 2,000 万ユーロまたは全世界売上の 4%。
関連する教科書の節を読む →
EU AI Act いーゆーえーあいあくと · EU AI Act 2級AIガバナンス: 世界初の包括的 AI 規制(2024 施行)。リスクレベル別(禁止 / ハイリスク / 限定リスク / 最小リスク)に要求事項。違反は最大全世界売上の 7%。EU 域外企業も EU 個人を対象なら適用対象。
関連する教科書の節を読む →
SHAP しゃっぷ · SHapley Additive exPlanations 2級AI公平性: ゲーム理論のシャプレイ値で機械学習モデルの予測を説明する手法。Local + Global 両対応で、XGBoost / LightGBM 等で標準的に使われる。XAI(説明可能 AI)の現代の代表手法。
関連する教科書の節を読む →
Model Card もでるかーど · Model Card 2級AIガバナンス: 機械学習モデルの仕様書(Mitchell et al. 2019)。学習データ・性能指標・想定用途・既知の制限・公平性評価を記載。Hugging Face Hub で標準化。AI ガバナンスの基本ドキュメント。
関連する教科書の節を読む →

Level

準1級レベルの用語 (137)

ポアソン分布 ぽあそんぶんぷ · Poisson distribution 準1級分布: 単位時間あたり平均 $λ$ 回起こる稀な事象の発生回数の分布。 $E [X] = V [X] = λ$ 。
関連する教科書の節を読む →
指数分布 しすうぶんぷ · exponential distribution 準1級分布: ポアソン過程の事象間隔(待ち時間)の分布。 $E [T] = 1/ λ$ 。無記憶性をもつ。
関連する教科書の節を読む →
多変量正規分布 たへんりょうせいきぶんぷ · multivariate normal 準1級分布: 正規分布の多次元版 $N_{k} (μ, Σ)$ 。線形変換も周辺分布も条件付き分布も正規。
関連する教科書の節を読む →
ベイズの定理 べいずのていり · Bayes' theorem 準1級ベイズ: 事後分布 $\propto$ 尤度 $\times$ 事前分布。データを見て信念を更新する公式。
関連する教科書の節を読む →
事後分布 じごぶんぷ · posterior distribution 準1級ベイズ: データを観測した後の母数 $θ$ の分布。点推定や信用区間の出発点。
関連する教科書の節を読む →
共役分布 きょうやくぶんぷ · conjugate prior 準1級ベイズ: 事前分布と尤度の組み合わせで、事後分布が同じ族の分布に閉じる関係。例: ベータ-二項。
関連する教科書の節を読む →
重回帰分析 じゅうかいきぶんせき · multiple regression 準1級回帰: 複数の説明変数を持つ線形回帰モデル。 $y = X β + ε$ 。
関連する教科書の節を読む →
ロジスティック回帰 ろじすてぃっくかいき · logistic regression 準1級回帰: 二値応答変数(成功/失敗)を扱う GLM。オッズの対数 $lo g (p / (1 - p)) = β_{0} + β_{1} x + \dots$ をモデル化する。係数 $β_{j}$ は「説明変数が 1 単位増えたときオッズが $e^{β_{j}}$ 倍になる」と解釈できる。マーケティング・医療で頻出。
関連する教科書の節を読む →
主成分分析 しゅせいぶんぶんせき · PCA (principal component analysis) 準1級多変量: 分散共分散行列の固有ベクトル方向に射影することで、多変量データを低次元に圧縮する手法。
関連する教科書の節を読む →
AR モデル えーあーるもでる · autoregressive model 準1級時系列: $X_{t} = ϕ_{1} X_{t - 1} + \dots + ϕ_{p} X_{t - p} + ε_{t}$ 。過去の値で現在を予測する時系列モデル。
関連する教科書の節を読む →
ARIMA ありま · ARIMA (autoregressive integrated moving average) 準1級時系列: 差分を取って定常化した後 ARMA でモデル化する非定常時系列の標準モデル。 $ARIMA (p, d, q)$ 。
関連する教科書の節を読む →
ベイズ推定 べいずすいてい · Bayesian estimation 準1級ベイズ: 事前分布とデータから事後分布 $p (θ ∣ x) \propto p (x ∣ θ) p (θ)$ を求め、その分布(または期待値・MAP)で推定する方法。
関連する教科書の節を読む →
事前分布 じぜんぶんぷ · prior distribution 準1級ベイズ: データを観察する前に持つパラメータ $θ$ への信念を表す確率分布 $p (θ)$ 。共役分布や無情報事前分布が代表的。
関連する教科書の節を読む →
偏相関係数 へんそうかんけいすう · partial correlation 準1級多変量: 他の変数の影響を統制(線形回帰で除去)した上での 2 変数の相関。見かけの相関と本当の関係を区別するのに使う。
関連する教科書の節を読む →
因子分析 いんしぶんせき · factor analysis 準1級多変量: 観測変数の背後に潜む少数の共通因子を抽出する手法。心理測定や品質工学で広く使われる。主成分分析と目的が異なる。
関連する教科書の節を読む →
クラスター分析 くらすたーぶんせき · cluster analysis 準1級多変量: 似たデータをグループ化する教師なし手法。階層的クラスタリング(ウォード法など)と非階層型(k-means)がある。
関連する教科書の節を読む →
一般化線形モデル いっぱんかせんけいもでる · generalized linear model (GLM) 準1級回帰: 線形予測子 $η = X β$ をリンク関数で結ぶ、線形回帰の一般化。正規・二項・ポアソンなど指数型分布族を扱える。
関連する教科書の節を読む →
リンク関数 りんくかんすう · link function 準1級回帰: GLM で目的変数の期待値 $μ$ と線形予測子 $η$ を結ぶ関数 $g (μ) = η$ 。ロジット・対数・恒等など。
関連する教科書の節を読む →
生存時間解析 せいぞんじかんかいせき · survival analysis 準1級応用: イベント発生までの時間を、打ち切り(まだ起きていないデータ)を考慮して扱う手法。カプラン・マイヤー・Cox 比例ハザードが代表。
関連する教科書の節を読む →
ハザード関数 はざーどかんすう · hazard function 準1級応用: 時刻 $t$ まで生存していた条件のもとで、その瞬間にイベントが起こる「率」。 $h (t) = f (t) / S (t)$ 。
関連する教科書の節を読む →
ホワイトノイズ ほわいとのいず · white noise 準1級時系列: 平均 0・分散一定で、時刻間に相関がない時系列。予測モデルの「予測できない残差」が満たすべき性質。
関連する教科書の節を読む →
季節調整 きせつちょうせい · seasonal adjustment 準1級時系列: 時系列から季節パターンを取り除く処理。経済統計(GDP・小売販売額など)では原系列と季節調整値が併記される。
関連する教科書の節を読む →
教師あり学習 きょうしありがくしゅう · supervised learning 準1級機械学習: 正解ラベル付きのデータから入出力の関係を学習する枠組み。分類(離散ラベル)と回帰(連続値)に分かれる。
関連する教科書の節を読む →
教師なし学習 きょうしなしがくしゅう · unsupervised learning 準1級機械学習: ラベルなしデータから構造(クラスター・低次元表現)を発見する枠組み。k-means・主成分分析・自己符号化器など。
関連する教科書の節を読む →
強化学習 きょうかがくしゅう · reinforcement learning 準1級機械学習: エージェントが環境と相互作用し、報酬を最大化する行動方策を試行錯誤で学ぶ枠組み。AlphaGo・自動運転などで成功。
関連する教科書の節を読む →
過学習 かがくしゅう · overfitting 準1級機械学習: 訓練データに合わせ込みすぎ、未知データへの汎化性能が低下する現象。モデル複雑度に対しデータが少ないと起きやすい。
関連する教科書の節を読む →
正則化 せいそくか · regularization 準1級機械学習: 損失関数に係数の大きさへの罰則を加え過学習を抑える手法。L1(ラッソ・スパース化)と L2(リッジ・縮小)が代表的。
関連する教科書の節を読む →
交差検証 こうさけんしょう · cross validation 準1級機械学習: データを K 分割し、各部分をテスト用に回しながら平均性能を評価する手法。少データでの汎化性能評価の標準手法。
関連する教科書の節を読む →
混同行列 こんどうぎょうれつ · confusion matrix 準1級評価指標: 分類予測を「真陽性・偽陽性・偽陰性・真陰性」の 4 マスにまとめた表。各種評価指標の出発点。
関連する教科書の節を読む →
適合率と再現率 てきごうりつとさいげんりつ · precision and recall 準1級評価指標: 適合率 = TP/(TP+FP)(陽性予測のうち本当に陽性)、再現率 = TP/(TP+FN)(本当の陽性のうち拾えた割合)。両者の調和平均が F1。
関連する教科書の節を読む →
ROC 曲線 あーるおーしーきょくせん · ROC curve 準1級評価指標: 閾値を動かしたときの「真陽性率(再現率)」と「偽陽性率」をプロットした曲線。曲線下面積 AUC が分類器の総合性能。
関連する教科書の節を読む →
勾配降下法 こうばいこうかほう · gradient descent 準1級機械学習: 損失関数の勾配方向と逆向きにパラメータを少しずつ更新する最適化法。バッチ・確率的(SGD)・ミニバッチがある。
関連する教科書の節を読む →
ニューラルネットワーク にゅーらるねっとわーく · neural network 準1級機械学習: 線形変換と非線形活性化関数を多層に積んだ関数近似モデル。多層化したものをディープラーニングと呼ぶ。
関連する教科書の節を読む →
Transformer とらんすふぉーまー · Transformer 準1級機械学習: 自己注意機構(self-attention)を中核とするディープラーニングモデル。BERT・GPT など現代の大規模言語モデルの基盤。
関連する教科書の節を読む →
バイアスとバリアンス ばいあすとばりあんす · bias-variance tradeoff 準1級機械学習: 予測誤差はバイアス²(モデルの単純さの偏り)+ バリアンス(訓練データへの敏感さ)+ ノイズに分解される。両者のトレードオフがモデル選択の核心。
関連する教科書の節を読む →
ガンマ分布 がんまぶんぷ · gamma distribution 準1級確率分布: 形状パラメータ $α$ ・尺度 $β$ をもつ正値連続分布。 $α = 1$ で指数分布、整数 $α$ でアーラン分布。待ち時間モデルや事前分布で頻出。
関連する教科書の節を読む →
ベータ分布 べーたぶんぷ · beta distribution 準1級確率分布: 区間 $[0, 1]$ 上の連続分布 $Beta (α, β)$ 。二項分布の共役事前分布として、比率のベイズ推定で標準的に使う。
関連する教科書の節を読む →
対数正規分布 たいすうせいきぶんぷ · log-normal distribution 準1級確率分布: $lo g X$ が正規分布に従う右に裾の長い分布。所得・株価・粒径分布など、乗算的に決まる量によく当てはまる。
関連する教科書の節を読む →
多項分布 たこうぶんぷ · multinomial distribution 準1級確率分布: 二項分布の多カテゴリ版。 $n$ 回の試行で $k$ 個のカテゴリそれぞれに何回入るかの同時分布。
関連する教科書の節を読む →
マルコフ連鎖 まるこふれんさ · Markov chain 準1級確率過程: 次の状態が「現在の状態だけ」で決まる(過去に依存しない)確率過程。MCMC・状態空間モデルの基礎。
関連する教科書の節を読む →
移動平均 いどうへいきん · moving average 準1級時系列: 時系列を直近 $k$ 期の平均で平滑化する基本手法。トレンド抽出やノイズ除去に使う。MA モデルとは別概念なので注意。
関連する教科書の節を読む →
指数平滑法 しすうへいかつほう · exponential smoothing 準1級時系列: 直近の値ほど重みを大きくする平滑化(重みが幾何的に減衰)。Holt・Holt–Winters でトレンド・季節性に拡張できる。
関連する教科書の節を読む →
状態空間モデル じょうたいくうかんもでる · state space model 準1級時系列: 観測されない状態(state)が時間発展し、それを通じて観測値が得られるという定式化。カルマンフィルタが代表的推定手法。
関連する教科書の節を読む →
階層ベイズモデル かいそうべいずもでる · hierarchical Bayesian model 準1級ベイズ: 事前分布のパラメータ自身にさらに分布(超事前分布)を仮定する多層モデル。グループ間で情報を共有し、推定を安定させる。
関連する教科書の節を読む →
ギブスサンプリング ぎぶすさんぷりんぐ · Gibbs sampling 準1級ベイズ: 多次元の事後分布から、各変数を「他の変数を固定した条件付き分布」から順番にサンプルする MCMC 手法。
関連する教科書の節を読む →
メトロポリス・ヘイスティングス法 めとろぽりすへいすてぃんぐすほう · Metropolis–Hastings algorithm 準1級ベイズ: 提案分布から候補を発生させ、確率 $min (1, r)$ で受容することで目標分布からのサンプルを得る MCMC の基本アルゴリズム。
関連する教科書の節を読む →
多次元尺度法 たじげんしゃくどほう · multidimensional scaling (MDS) 準1級多変量: 対象間の距離(類似度)を保つように、低次元(通常 2 次元)に布置する手法。アンケート分析やブランド地図で使う。
関連する教科書の節を読む →
決定木 けっていぎ · decision tree 準1級機械学習: 「ある特徴量が閾値以上か」で再帰的にデータを分割していくモデル。解釈しやすいが過学習しやすい。アンサンブルの基礎部品。
関連する教科書の節を読む →
ランダムフォレスト らんだむふぉれすと · random forest 準1級機械学習: ブートストラップ標本と特徴のランダム選択で多数の決定木を学習し、平均(または多数決)を取る代表的アンサンブル手法。
関連する教科書の節を読む →
勾配ブースティング こうばいぶーすてぃんぐ · gradient boosting 準1級機械学習: 弱学習器(浅い木)を残差にフィットさせ、順次足し合わせる手法。XGBoost・LightGBM など実務分類で最も強力なアプローチの一つ。
関連する教科書の節を読む →
サポートベクターマシン さぽーとべくたーましん · support vector machine (SVM) 準1級機械学習: クラスを最もマージン広く分離する超平面を求める分類器。カーネルトリックで非線形分類にも拡張できる。
関連する教科書の節を読む →
k 近傍法 けーきんぼうほう · k-nearest neighbors (kNN) 準1級機械学習: 新しい点に最も近い $k$ 個の訓練点から多数決(分類)/平均(回帰)で予測する遅延学習。シンプルだが高次元で性能が落ちやすい。
関連する教科書の節を読む →
ナイーブベイズ ないーぶべいず · naive Bayes 準1級機械学習: 特徴間の条件付き独立を仮定し、ベイズの定理で事後確率を計算する分類器。テキスト分類で高速かつ強力。
関連する教科書の節を読む →
アンサンブル学習 あんさんぶるがくしゅう · ensemble learning 準1級機械学習: 複数の弱い学習器を組み合わせて性能を上げる枠組み。バギング・ブースティング・スタッキングが三大手法。
関連する教科書の節を読む →
バギング ばぎんぐ · bagging 準1級機械学習: ブートストラップで作った複数標本で学習器を並列に訓練し、出力を平均/多数決する手法。バリアンスを下げる。ランダムフォレストの基礎。
関連する教科書の節を読む →
ブースティング ぶーすてぃんぐ · boosting 準1級機械学習: 弱学習器を逐次的に学習し、誤りに重みをつけて次に活かす手法。バイアスを下げる。AdaBoost・勾配ブースティングが代表。
関連する教科書の節を読む →
ハイパーパラメータ はいぱーぱらめーた · hyperparameter 準1級機械学習: 学習で最適化されず、事前に設定するパラメータ(学習率・木の深さ・正則化強度など)。グリッド/ランダム/ベイズ最適化で探索する。
関連する教科書の節を読む →
ドロップアウト どろっぷあうと · dropout 準1級機械学習: 学習時に各ニューロンを確率 $p$ でランダムに無効化することで過学習を防ぐ正則化手法。推論時は全ユニットを使い出力をスケール。
関連する教科書の節を読む →
バッチ正規化 ばっちせいきか · batch normalization 準1級機械学習: ミニバッチごとに中間層の出力を平均 0・分散 1 に正規化してから線形変換する手法。学習の高速化と安定化に大きく寄与する。
関連する教科書の節を読む →
アテンション機構 あてんしょんきこう · attention mechanism 準1級機械学習: 入力のどの部分にどれだけ注目するかを重み付けで動的に決める仕組み。Transformer の中核で、機械翻訳・LLM の性能を飛躍させた。
関連する教科書の節を読む →
転移学習 てんいがくしゅう · transfer learning 準1級機械学習: 大規模データで学習済みのモデル(例: ImageNet/BERT)を、別タスク用に再利用する枠組み。少データで高性能を得る現代の標準。
関連する教科書の節を読む →
ファインチューニング ふぁいんちゅーにんぐ · fine-tuning 準1級機械学習: 事前学習済みモデルの一部または全パラメータを、目的タスクの少量データで追加学習する手法。LLM の業務カスタマイズで主流。
関連する教科書の節を読む →
説明可能 AI せつめいかのうえーあい · explainable AI (XAI) 準1級AI 倫理: AI モデルの予測根拠を人間が解釈できる形で示す技術や思想。SHAP・LIME・Grad-CAM などが代表。医療・与信などで必須。
関連する教科書の節を読む →
差分プライバシー さぶんぷらいばしー · differential privacy 準1級AI 倫理: 個別レコードの有無で出力分布がほぼ変わらないようノイズを加え、個人特定リスクを定量的に保証するプライバシー保護技術。
関連する教科書の節を読む →
AI 倫理 えーあいりんり · AI ethics 準1級AI 倫理: 公平性・透明性・説明責任・プライバシー・安全性など、AI を社会で使う上での原則と実践。各国で AI ガバナンス枠組みが整備中。
関連する教科書の節を読む →
データ拡張 でーたかくちょう · data augmentation 準1級機械学習: 回転・反転・ノイズ付加などで訓練データを人工的に増やす手法。画像・音声で過学習抑制と汎化向上に大きく寄与する。
関連する教科書の節を読む →
ELSI えるしー · ELSI (Ethical, Legal and Social Issues) 準1級AI 倫理: 新技術がもたらす倫理的・法的・社会的課題の総称。AI / ゲノム / 自動運転などで研究開発と並行して検討される。
関連する教科書の節を読む →
テンソル てんそる · tensor 準1級DL 数学: 多次元配列。0 階=スカラー、1 階=ベクトル、2 階=行列、3 階以上=テンソル。DL では画像バッチを (N, C, H, W) の 4 階テンソルで扱うのが標準。
関連する教科書の節を読む →
順伝播 じゅんでんぱ · forward propagation 準1級DL 基礎: ニューラルネットで、入力から出力に向かって計算を進める過程。各層で線形変換 $W x + b$ + 活性化関数を順次適用する。
関連する教科書の節を読む →
誤差逆伝播法 ごさぎゃくでんぱほう · backpropagation 準1級DL 基礎: 損失関数の勾配を、出力層から入力層に向かって連鎖律で逐次的に計算するアルゴリズム。DL の学習を支える中核技術。
関連する教科書の節を読む →
ReLU れる · ReLU (Rectified Linear Unit) 準1級DL 基礎: 活性化関数 $max (0, x)$ 。負の領域で勾配 0、正の領域で勾配 1。DL で勾配消失を緩和して学習を成功させた立役者。
関連する教科書の節を読む →
Softmax そふとまっくす · softmax 準1級DL 基礎: $σ (z)_{i} = e^{z_{i}} / \sum_{j} e^{z_{j}}$ 。多クラス分類の出力層で確率分布に変換。交差エントロピー損失と組合せて使う。
関連する教科書の節を読む →
勾配消失問題 こうばいしょうしつもんだい · vanishing gradient problem 準1級DL 基礎: 深いネットワークで逆伝播時に勾配が指数的に小さくなり、初期層が学習できなくなる現象。ReLU・残差接続・LSTM ゲートで緩和。
関連する教科書の節を読む →
残差接続 ざんさせつぞく · skip connection / residual connection 準1級DL 基礎: $a^{(l)} = a^{(l - 1)} + F (a^{(l - 1)})$ 。前層の入力を後層に直接足す経路。ResNet で 100 層以上の深層化を実現。
関連する教科書の節を読む →
Adam あだむ · Adam optimizer 準1級DL 基礎: Momentum と RMSProp を組合せた最適化アルゴリズム。各パラメータの学習率を適応的に調整。現在 DL の事実上のデフォルト。
関連する教科書の節を読む →
CNN しーえぬえぬ · Convolutional Neural Network 準1級DL モデル: 畳み込み層 + プーリング層を中心に構成された、画像処理に特化した DL アーキテクチャ。LeNet から ResNet・EfficientNet まで多数の派生。
関連する教科書の節を読む →
プーリング ぷーりんぐ · pooling 準1級DL モデル: 領域ごとに最大値(Max pooling)または平均(Average pooling)を取る操作。ダウンサンプリング + 位置のずれへの頑健性。
関連する教科書の節を読む →
LSTM えるえすてぃーえむ · Long Short-Term Memory 準1級DL モデル: RNN の一種。忘却・入力・出力の 3 ゲートを持ち、長期依存を学習可能。機械翻訳・音声認識で長らく主役だった。
関連する教科書の節を読む →
Self-Attention せるふあてんしょん · self-attention 準1級DL モデル: 入力系列の各位置が他のすべての位置を参照する仕組み。 $softmax (Q K^{⊤} / d_{k}) V$ で計算。Transformer の中核。
関連する教科書の節を読む →
BERT ばーと · BERT 準1級DL モデル: Google が 2018 年に発表した Transformer Encoder ベースの事前学習モデル。マスクされた単語の予測(MLM)で学習し、ファインチューニングで様々な NLP タスクに適用。
関連する教科書の節を読む →
GPT じーぴーてぃー · GPT (Generative Pre-trained Transformer) 準1級DL モデル: OpenAI が 2018 年から発表している Transformer Decoder ベースの自己回帰生成モデル。次の単語予測で学習し、ChatGPT などの LLM の基盤に。
関連する教科書の節を読む →
VAE ぶいえーいー · Variational Autoencoder 準1級DL モデル: Encoder-Decoder で潜在変数の分布を学習する生成モデル。再構成誤差 + KL ダイバージェンスを最小化(ELBO 最大化)。
関連する教科書の節を読む →
GAN がん · Generative Adversarial Network 準1級DL モデル: 生成器と識別器を競合させる生成モデル。生成器が偽物を作り、識別器が本物 / 偽物を判定。学習が不安定だが、高品質な生成が可能。
関連する教科書の節を読む →
拡散モデル かくさんもでる · diffusion model 準1級DL モデル: ノイズを段階的に加える順過程の逆を学習する生成モデル。Stable Diffusion・DALL-E 3 など現代の画像生成 AI の中核。
関連する教科書の節を読む →
RLHF あーるえるえいちえふ · Reinforcement Learning from Human Feedback 準1級強化学習: 人間が比較した嗜好データから報酬モデルを学習し、LLM を強化学習で微調整する手法。ChatGPT・Claude などの『有用で安全な対話エージェント化』の核心技術。
関連する教科書の節を読む →
知識蒸留 ちしきじょうりゅう · knowledge distillation 準1級DL 実装: 大きい教師モデルの出力(soft target)を学習目標として、小さい生徒モデルを学習させる手法。BERT → DistilBERT が代表例。
関連する教科書の節を読む →
量子化 りょうしか · quantization 準1級DL 実装: DL モデルの重み・活性を float32 から int8 などに変換し、サイズ・推論速度を改善する手法。エッジデバイスでの推論に必須。
関連する教科書の節を読む →
デザイン効果 でざいんこうか · design effect (deff) 準1級標本設計: 実際の標本設計の分散を、同じ n の単純無作為抽出と比べた比。deff < 1 で精度向上、deff > 1 で精度低下。クラスター抽出は通常 deff > 1。
関連する教科書の節を読む →
ネイマン配分 ねいまんはいぶん · Neyman allocation 準1級標本設計: 層化抽出で各層の標本サイズを $n_{h} \propto N_{h} S_{h}$ (層サイズ × 層内標準偏差)で決める最適配分法。精度を最大化する。
関連する教科書の節を読む →
多重代入法 たじゅうだいにゅうほう · Multiple Imputation (MI) 準1級標本設計: 欠測値に対して複数のもっともらしい代入値を作り、各セットで推定 → Rubin's rules で統合する手法。代入の不確実性も含めて分散を計算できる。
関連する教科書の節を読む →
誤差逆伝播 ごさぎゃくでんぱ · Backpropagation 準1級ディープラーニング: ニューラルネットの勾配を出力層から入力層へ連鎖律で計算する手法。深層学習の学習を実用化した。
活性化関数 かっせいかかんすう · Activation Function 準1級ディープラーニング: ニューロンの出力を非線形に変換する関数。ReLU・Sigmoid・Tanh・GELU などが使われる。
畳み込みニューラルネット たたみこみにゅーらるねっと · CNN 準1級ディープラーニング: 画像処理に特化した NN。畳み込み層で局所特徴を抽出し、プーリング層でダウンサンプリングする。
Embedding えんべでぃんぐ · Embedding 準1級ディープラーニング: 離散的なトークン(単語など)を密ベクトルに変換する表現。Word2Vec・BERT 埋め込みなど。
サポートベクトルマシン さぽーとべくとるましん · SVM 準1級機械学習: クラス間のマージンを最大化する分類器。カーネル法で非線形分離も可能。
k-means法 けーみーんずほう · k-means Clustering 準1級機械学習: データを k 個のクラスタに分割する代表的な教師なし学習。重心とデータ点の距離を最小化。
次元削減 じげんさくげん · Dimensionality Reduction 準1級機械学習: 高次元データの本質的な構造を低次元で表現する手法群。PCA・t-SNE・UMAP が代表的。
Kaggle かぐる · Kaggle 準1級実装: 世界最大の機械学習コンペプラットフォーム。実データでスキル研鑽・ポートフォリオ作成ができる。
Granger 因果性 ぐれんじゃーいんがせい · Granger causality 準1級時系列: $X$ の過去が $Y$ の予測に役立つ、という意味の因果性 (Granger 1969)。VAR モデルで F 検定する。厳密な因果ではない点に注意。
関連する教科書の節を読む →
中断時系列分析 ちゅうだんじけいれつぶんせき · Interrupted Time Series 準1級時系列: 介入時点の前後でレベル変化(切片)とトレンド変化(傾き)を回帰で推定する古典的手法。公衆衛生介入の評価で広く使われる。
関連する教科書の節を読む →
判別分析 はんべつぶんせき · discriminant analysis 準1級多変量解析: 複数の変数からカテゴリを判別するための古典的多変量手法。Fisher の線形判別(LDA)、二次判別(QDA)が代表。教師あり分類の前身。
クラスター分析 くらすたーぶんせき · cluster analysis 準1級多変量解析: ラベルなしデータをグループ化する教師なし手法。階層的クラスタリング(ウォード法・最遠隣法)、k-means、DBSCAN などが代表。
因子分析 いんしぶんせき · factor analysis 準1級多変量解析: 観測変数の背後にある潜在因子を推定する手法。心理学・マーケティング(顧客満足要因)で広く使用。PCA とは目的が異なる。
主成分分析 しゅせいぶんぶんせき · principal component analysis 準1級多変量解析: 多変量データの分散を最大化する直交軸を順に取り、低次元表現に圧縮する手法。固有値分解または SVD で計算。
関連する教科書の節を読む →
Wardの方法 うぉーどのほうほう · Ward's method 準1級多変量解析: 階層的クラスタリングの 1 つ。クラスター間距離をクラスター内分散の増加量で定義。コンパクトな球状クラスターを作りやすい。
k-means クラスタリング けーみーんずくらすたりんぐ · k-means clustering 準1級多変量解析: $k$ 個のクラスター中心を反復更新で求める非階層クラスタリング。最も広く使われる。 $k$ の決定にはエルボー法・シルエット分析を用いる。
シルエット係数 しるえっとけいすう · silhouette coefficient 準1級多変量解析: クラスタリングの良さを測る指標。各点が自クラスター内でまとまり、他クラスターから離れているほど 1 に近い。-1 〜 1 の範囲。
エルボー法 えるぼーほう · elbow method 準1級多変量解析: k-means の最適クラスター数決定法の 1 つ。SSE(クラスター内二乗和)を $k$ の関数としてプロットし、減少が緩やかになる『肘』の位置を $k$ に選ぶ。
工程能力指数 こうていのうりょくしすう · process capability index (Cp, Cpk) 準1級品質工学: $C_{p} = (U S L - L S L) / (6 σ)$ で工程のばらつきが規格内に収まる能力を測る。 $C_{p k}$ は中心ずれも考慮。Cp ≥ 1.33 で十分。
管理図 かんりず · control chart 準1級品質工学: 工程の中心値とばらつきを時系列で監視する図。 $\overset{ˉ}{X}$ -R 管理図、 $p$ 管理図、 $n p$ 管理図などがある。3σ 管理限界が標準。
OC 曲線 おーしーきょくせん · Operating Characteristic curve 準1級品質工学: サンプリング検査で『ロット不良率 $p$ が与えられたときに合格となる確率』を描いた曲線。生産者危険(α)・消費者危険(β)が読み取れる。
田口メソッド たぐちめそっど · Taguchi method 準1級品質工学: 田口玄一の提唱した品質工学。直交配列表 + SN 比で『製品のロバスト性』を最大化する実験計画法。製造業で広く採用。
SN比 えすえぬひ · Signal-to-Noise ratio 準1級品質工学: 田口メソッドで製品の頑健性を測る指標。望大特性・望小特性・望目特性で式が異なる。値が大きいほどばらつきの影響を受けにくい。
パレート図 ぱれーとず · Pareto chart 準1級QC 7 つ道具: QC 7 つ道具の 1 つ。不良要因を頻度順に並べた棒グラフ + 累積比率の折れ線。『2:8 法則』で重要な少数要因を特定する。
特性要因図 とくせいよういんず · fishbone diagram / Ishikawa diagram 準1級QC 7 つ道具: 結果に対する要因を 4M(Man, Machine, Material, Method)などで体系化する図。原因分析の出発点として QC で頻用される。
ハザード関数 はざーどかんすう · hazard function 準1級生存解析: $h (t) = lim_{Δ t \to 0} P (t \leq T < t + Δ t ∣ T \geq t) /Δ t$ 。時点 $t$ まで生存している人が次の瞬間にイベントを起こす瞬時的確率。
Kaplan-Meier 推定量 かぷらん-まいやーすいていりょう · Kaplan-Meier estimator 準1級生存解析: 右打ち切りデータから生存関数 $S (t) = P (T > t)$ をノンパラメトリックに推定する手法。階段状の推定曲線で打ち切り例も活用する。
関連する教科書の節を読む →
Cox 比例ハザードモデル こっくすひれいはざーどもでる · Cox proportional hazards model 準1級生存解析: $h (t ∣ x) = h_{0} (t) exp (β^{⊤} x)$ 。ベースラインハザード $h_{0} (t)$ を特定せずに係数 $β$ を部分尤度で推定するセミパラ手法。
関連する教科書の節を読む →
ログランク検定 ろぐらんくけんてい · log-rank test 準1級生存解析: 2 群以上の生存曲線の差を比較するノンパラ検定。Kaplan-Meier 推定後の標準的検定として臨床試験で広く使用。
MAP 推定 まっぷすいてい · Maximum A Posteriori estimation 準1級ベイズ統計: 事後分布 $π (θ ∣ x)$ を最大化する $θ$ 。事前分布が一様なら MLE と一致。点推定としてベイズ的に妥当。
ジェフリーズ事前分布 じぇふりーずじぜんぶんぷ · Jeffreys prior 準1級ベイズ統計: Fisher 情報量の平方根に比例する不変事前分布。パラメータ変換に対して不変であり『無情報事前』として議論される。
ベイズファクター べいずふぁくたー · Bayes factor 準1級ベイズ統計: 2 つのモデル $M_{0}, M_{1}$ の周辺尤度の比。ベイズ的なモデル比較指標。Kass-Raftery の解釈基準では BF > 100 で『決定的』。
WAIC わいっく · Widely Applicable Information Criterion 準1級情報量規準: 渡辺澄夫が提唱した情報量規準。AIC・BIC が階層モデルで破綻するケースでも使え、特異モデルや混合分布で安定動作。
スペクトル分解 すぺくとるぶんかい · Spectral decomposition 準1級線形代数: 対称行列の対角化 $A = Q Λ Q^{⊤}$ ( $Q$ は直交行列)。固有ベクトルが直交するため $P^{- 1} = P^{⊤}$ と書ける。PCA は共分散行列のスペクトル分解。
関連する教科書の節を読む →
特異値分解 とくいちぶんかい · Singular Value Decomposition (SVD) 準1級線形代数: 任意の $m \times n$ 行列 $A$ の分解 $A = U Σ V^{⊤}$ 。 $U, V$ は直交行列、 $Σ$ は特異値を対角に並べた行列。 $σ_{i}^{2}$ は $A^{⊤} A$ の固有値。低ランク近似・PCA・LoRA の基礎。
関連する教科書の節を読む →
低ランク近似 ていらんくきんじ · Low-rank approximation 準1級線形代数: SVD で上位 $k$ 個の特異値だけ残した行列 $A_{k} = \sum_{i = 1}^{k} σ_{i} u_{i} v_{i}^{⊤}$ 。Eckart-Young の定理によりフロベニウスノルム最小の rank- $k$ 近似。画像圧縮・推薦・LoRA の基礎。
関連する教科書の節を読む →
正定値行列 せいていちぎょうれつ · Positive definite matrix 準1級線形代数: 対称行列 $A$ で、任意の非ゼロ $x$ に対し $x^{⊤} A x > 0$ が成り立つもの。すべての固有値 > 0 と同値。共分散行列の逆行列・SVM の双対問題のカーネル行列など、最適化で重要。
関連する教科書の節を読む →
二次形式 にじけいしき · Quadratic form 準1級線形代数: 対称行列 $A$ とベクトル $x$ に対する $Q (x) = x^{⊤} A x$ 。2 次の項だけからなる関数で、正定値・半正定値・不定の分類が固有値の符号で決まる。多変量正規分布の指数部にも現れる。
関連する教科書の節を読む →
総合的調査誤差 そうごうてきちょうさごさ · Total Survey Error (TSE) 準1級調査統計: 標本誤差 + 非標本誤差を統一的に MSE(平均二乗誤差)で評価する枠組み。Eurostat・米センサス局が推進。予算配分(標本拡大 vs 督促強化 vs 認知インタビュー)を感度分析で決める基盤。
関連する教科書の節を読む →
k-匿名化 けーとくめいか · k-anonymity 準1級プライバシー: 同じ準識別子(年齢・性別・住所など)を持つ個人が常に $k$ 人以上存在することを保証する匿名化技法(Sweeney 2002)。再識別攻撃への基本的な防御。l-多様性・t-近接性に発展。
関連する教科書の節を読む →
公平性指標 こうへいせいしひょう · Fairness metrics 準1級AI公平性: AI モデルの公平性を測る指標。Demographic Parity・Equal Opportunity・Equalized Odds の 3 軸が代表で、群間で base rate が違う場合 **同時に満たせない**(Chouldechova / Kleinberg の不可能性定理)。
関連する教科書の節を読む →
モランのI もらんのあい · Moran's I 準1級空間統計: 空間相関を測る統計量。 $- 1$ 〜 $+ 1$ の範囲で、 $+$ なら似た値が空間的に集まる正の相関、 $-$ ならチェッカーボード状の負の相関、0 でランダム。R: `spdep::moran.test()`。
関連する教科書の節を読む →
クリギング くりぎんぐ · Kriging 準1級空間統計: 点参照空間データから未観測地点の値を補間するベスト線形不偏予測量(BLUP)。距離に応じた共分散構造(バリオグラム)を仮定。気象・鉱業・大気汚染で標準的な空間補間法。
関連する教科書の節を読む →
PageRank ぺーじらんく · PageRank 準1級ネットワーク統計: Google の Web ページ重要度算出アルゴリズム(Brin & Page 1998)。『重要なページからリンクされているページは重要』を再帰的に定義し、遷移行列の最大固有値に対応する固有ベクトルとして計算。
関連する教科書の節を読む →
媒介中心性 ばいかいちゅうしんせい · Betweenness centrality 準1級ネットワーク統計: ネットワーク中心性の一つで、他ノード間の最短経路がそのノードを通る割合。情報のハブを特定する指標。 $B C (v) = \sum_{s \neq = v \neq = t} σ_{s t} (v) / σ_{s t}$ 。
関連する教科書の節を読む →
スケールフリーネットワーク すけーるふりーねっとわーく · Scale-free network 準1級ネットワーク統計: 次数分布がべき乗則 $P (k) \sim k^{- γ}$ に従うネットワーク(Barabási-Albert 1999)。少数の超高次数ハブが存在する。Web リンク・引用ネットワーク・SNS・タンパク質間相互作用で観察される。
関連する教科書の節を読む →
ERGM いーあーるじーえむ · Exponential Random Graph Model 準1級ネットワーク統計: 観測ネットワークが現れる確率を $P (Y = y) \propto exp (θ^{⊤} s (y))$ で表す指数族モデル。ネットワーク統計量(エッジ・三角形・homophily 等)を説明変数化、MCMC-MLE で推定。
関連する教科書の節を読む →

Level

1級レベルの用語 (118)

指数型分布族 しすうがたぶんぷぞく · exponential family 1級理論: $f (x; θ) = h (x) exp (η (θ) T (x) - A (θ))$ の形に書ける分布族。十分統計量・最尤推定との相性が抜群。
関連する教科書の節を読む →
十分統計量 じゅうぶんとうけいりょう · sufficient statistic 1級理論: 「 $T$ さえあれば、 $X$ の細部はもう $θ$ について情報を持たない」という統計量。フィッシャー・ネイマンの分解定理で判定。
関連する教科書の節を読む →
最尤推定 さいゆうすいてい · maximum likelihood estimation (MLE) 1級推定: 尤度関数 $L (θ) = \prod f (X_{i}; θ)$ を最大化するパラメータを推定値とする方法。一致性・漸近正規性・漸近有効性をもつ。
関連する教科書の節を読む →
フィッシャー情報量 ふぃっしゃーじょうほうりょう · Fisher information 1級理論: $I (θ) = - E [\partial^{2} lo g f / \partial θ^{2}]$ 。データが $θ$ について持つ情報の量。
関連する教科書の節を読む →
クラメル・ラオの下限 くらめる・らおのかげん · Cramér–Rao lower bound 1級理論: 正則条件下で不偏推定量の分散の下限 $V [\hat{θ}] \geq 1/ (n I (θ))$ 。MLE は漸近的にこれを達成する。
関連する教科書の節を読む →
デルタ法 でるたほう · delta method 1級漸近理論: $n (\hat{θ} - θ) \to N (0, σ^{2})$ から $n (g (\hat{θ}) - g (θ)) \to N (0, g^{'} (θ)^{2} σ^{2})$ を導く道具。
関連する教科書の節を読む →
ネイマン・ピアソン補題 ねいまん・ぴあそんほだい · Neyman–Pearson lemma 1級検定理論: 単純仮説どうしの検定において、有意水準 $α$ のもとでの最強力検定が尤度比検定であることを保証する定理。
関連する教科書の節を読む →
尤度比検定 ゆうどひけんてい · likelihood ratio test 1級検定理論: $Λ = sup L (θ_{0}) / sup L (θ)$ を使った検定。 $- 2 lo g Λ$ が漸近的にカイ二乗分布に従う(ウィルクスの定理)。
関連する教科書の節を読む →
EM アルゴリズム いーえむあるごりずむ · EM (expectation-maximization) 1級計算統計: 潜在変数モデルでの最尤推定を、E ステップと M ステップを繰り返して反復的に解く方法。GMM・HMM などに使う。
関連する教科書の節を読む →
MCMC えむしーえむしー · Markov chain Monte Carlo 1級計算統計: 目標分布に収束するマルコフ連鎖を構成して、その軌跡をサンプルとして使うベイズ推論の主役手法。MH 法・ギブス法など。
関連する教科書の節を読む →
ブートストラップ ぶーとすとらっぷ · bootstrap 1級計算統計: 観測標本から復元抽出で擬似標本を多数作り、推定量の分布や標準誤差を近似する汎用的な手法。
関連する教科書の節を読む →
一致推定量 いっちすいていりょう · consistent estimator 1級推定理論: 標本サイズ $n \to \infty$ で母数に確率収束する推定量。最尤推定量は通常の正則条件下で一致性を持つ。
関連する教科書の節を読む →
漸近正規性 ぜんきんせいきせい · asymptotic normality 1級推定理論: $n (\hat{θ} - θ)$ が $n \to \infty$ で正規分布に分布収束する性質。最尤推定量は正則条件下でこれを満たす。
関連する教科書の節を読む →
スコア関数 すこあかんすう · score function 1級推定理論: 対数尤度のパラメータ偏微分 $U (θ) = \partial lo g L / \partial θ$ 。期待値 0 で、その分散がフィッシャー情報量。
関連する教科書の節を読む →
ベイズ因子 べいずいんし · Bayes factor 1級ベイズ: 2 つのモデル $M_{1}, M_{0}$ の周辺尤度の比 $B_{10} = p (x ∣ M_{1}) / p (x ∣ M_{0})$ 。ベイズ流のモデル比較・仮説検定の基本量。
関連する教科書の節を読む →
ジェフリーズ事前分布 じぇふりーずじぜんぶんぷ · Jeffreys prior 1級ベイズ: フィッシャー情報量の平方根に比例する事前分布 $p (θ) \propto I (θ)$ 。再パラメータ化で不変な無情報事前分布。
関連する教科書の節を読む →
完備十分統計量 かんびじゅうぶんとうけいりょう · complete sufficient statistic 1級推定理論: 十分性に加え「期待値が常に 0 ⇒ ほぼ確実に 0」となる(完備性)を満たす統計量。UMVUE 構成の鍵となる概念。
関連する教科書の節を読む →
ラオ・ブラックウェルの定理 らおぶらっくうぇるのていり · Rao–Blackwell theorem 1級推定理論: 推定量を十分統計量で条件付け期待値を取ると、分散が必ず減少する(または不変)という定理。UMVUE 構成の中心ツール。
関連する教科書の節を読む →
M 推定量 えむすいていりょう · M-estimator 1級推定理論: 目的関数 $\sum ρ (x_{i}, θ)$ の最小化(または推定方程式の零点)で定義される推定量の総称。最尤・最小二乗・ロバスト推定を含む統一枠組み。
関連する教科書の節を読む →
カーネル密度推定 かーねるみつどすいてい · kernel density estimation 1級ノンパラ: 観測点に滑らかな核(ガウス核など)を載せて足し合わせ、確率密度を推定するノンパラ手法。バンド幅の選択が肝。
関連する教科書の節を読む →
経験分布関数 けいけんぶんぷかんすう · empirical distribution function 1級ノンパラ: 観測値から作る階段関数 $F_{n} (x) = \frac{1}{n} \sum 1_{X_{i} \leq x}$ 。標本サイズが大きいと真の cdf に一様収束する(グリヴェンコ・カンテリの定理)。
関連する教科書の節を読む →
特異値分解 とくいちぶんかい · singular value decomposition (SVD) 1級DL 数学: 任意の行列 $A$ を $A = U Σ V^{⊤}$ に分解。 $U, V$ は直交、 $Σ$ は非負特異値の対角。データ圧縮・PCA の高次元実装・推薦システムなどで使う。
関連する教科書の節を読む →
Horvitz-Thompson 推定量 ほーびっつとんぷそんすいていりょう · Horvitz-Thompson estimator 1級標本設計: サンプリングウエイト $w_{i} = 1/ π_{i}$ (抽出確率の逆数)を使った母集団総計の不偏推定量 $\hat{T} = \sum w_{i} x_{i}$ 。標本調査の理論的中核。
関連する教科書の節を読む →
Attention あてんしょん · Attention Mechanism 1級ディープラーニング: 入力の各位置に対する『注目度』を学習する仕組み。Self-Attention では Q・K・V の内積で計算。
事前学習 じぜんがくしゅう · Pre-training 1級ディープラーニング: 大規模な教師なしデータで汎用表現を学習させる段階。BERT・GPT は事前学習 → ファインチューニングの流れ。
LLM えるえるえむ · Large Language Model 1級LLM: 数百億〜数兆パラメータの大規模言語モデル。次トークン予測の事前学習で汎用言語能力を獲得。GPT・Claude・Gemini が代表。
プロンプトエンジニアリング ぷろんぷとえんじにありんぐ · Prompt Engineering 1級LLM: LLM への指示文(プロンプト)を設計し、出力品質を引き出す技術。Few-shot や Chain-of-Thought が代表的手法。
RAG らぐ · Retrieval Augmented Generation 1級LLM: ユーザー質問に関連する文書を検索 → LLM プロンプトに含めて生成する手法。幻覚抑制と最新情報対応が両立できる。
ハルシネーション はるしねーしょん · Hallucination 1級LLM: LLM が事実と異なる内容を、もっともらしく生成してしまう現象。RAG・温度低下・ファクトチェックで対策。
Chain-of-Thought ちぇーんおぶそーと · Chain-of-Thought (CoT) 1級LLM: LLM に推論過程を段階的に出させるプロンプト手法。複雑な数学・論理問題で正答率が向上する。
ベクトル DB べくとるでぃーびー · Vector Database 1級LLM: Embedding ベクトルを高速類似検索できる DB。Pinecone・Weaviate・pgvector など。RAG の基盤。
コンテキストウィンドウ こんてきすとうぃんどう · Context Window 1級LLM: LLM が一度に処理できる入力 + 出力の最大トークン数。GPT-4 = 128K、Claude 4.7 = 1M など年々拡大。
MLOps えむえるおぷす · Machine Learning Operations 1級MLOps: ML モデルを本番運用するためのプラクティス群。データ・コード・モデルのバージョニング、CI/CD、監視、再学習が中核。
Data Drift でーただりふと · Data Drift 1級MLOps: 本番運用中に入力データ分布が学習時から変化する現象。モデル精度低下の主因。Evidently 等で監視。
Feature Store ふぃーちゃーすとあ · Feature Store 1級MLOps: 特徴量を一元管理する基盤。学習と推論で同じ特徴量定義を共有でき、リーク防止と再利用に寄与。
MLflow えむえるふろー · MLflow 1級MLOps: 実験追跡・モデルレジストリ・サービングを統合した OSS。Tracking UI でハイパラと評価指標を一覧できる。
因果推論 いんがすいろん · Causal Inference 1級因果推論: 観察データから『介入の効果』を推定する統計学。傾向スコア・操作変数・差分の差分・DAG などを駆使。
傾向スコア けいこうすこあ · Propensity Score 1級因果推論: 介入を受ける確率を共変量から推定したスコア。マッチングや IPW で因果効果を推定する基本道具。
差分の差分 さぶんのさぶん · Difference-in-Differences (DID) 1級因果推論: 処置の前後 × 処置群と対照群の 2 軸で差を取り、並行トレンド仮定のもとで因果効果を推定する手法。
操作変数法 そうさへんすうほう · Instrumental Variable (IV) 1級因果推論: 処置に影響するが結果には直接影響しない変数を用いて、内生性のある因果効果を推定する手法。
DAG だぐ · Directed Acyclic Graph 1級因果推論: 変数間の因果関係を有向グラフで表現した図。Judea Pearl の do 計算で識別可能性を判定する基盤。
Stacking すたっきんぐ · Stacking 1級機械学習: 複数モデルの予測を入力にメタモデルを学習するアンサンブル手法。Kaggle 上位の常套手段。
Target Encoding たーげっとえんこーでぃんぐ · Target Encoding 1級機械学習: カテゴリ変数をそのカテゴリの平均ターゲット値で数値化する手法。リーク対策のため CV 内で計算する必要あり。
ResNet れずねっと · Residual Network 1級コンピュータビジョン: 残差接続(skip connection)を導入した CNN。100 層超えの深いネットワークでも勾配消失せず学習可能。
ViT びてぃー · Vision Transformer 1級コンピュータビジョン: 画像を 16×16 パッチに分割し、Transformer で処理する画像分類モデル。十分な学習データで CNN を超える。
ImageNet いめーじねっと · ImageNet 1級コンピュータビジョン: 1000 クラス・約 120 万枚の画像分類ベンチマーク。CV の事前学習データとして長年デファクト。
U-Net ゆーねっと · U-Net 1級コンピュータビジョン: エンコーダ・デコーダ構造 + スキップ接続。医用画像セグメンテーションの標準で、拡散モデルにも応用。
YOLO よろ · You Only Look Once 1級コンピュータビジョン: 画像を 1 回処理してバウンディングボックスを出力する物体検出モデル。リアルタイム検出の代表。
IoU あいおーゆー · Intersection over Union 1級コンピュータビジョン: 予測と正解のバウンディングボックスの重なり具合。物体検出・セグメンテーションの主要評価指標。
NMS えぬえむえす · Non-Maximum Suppression 1級コンピュータビジョン: 物体検出で重複する検出ボックスを除去する後処理。IoU 閾値を使って最高スコアの 1 つだけ残す。
セグメンテーション せぐめんてーしょん · Segmentation 1級コンピュータビジョン: 画像をピクセル単位で分類するタスク。Semantic / Instance / Panoptic の 3 種類がある。
アンカーボックス あんかーぼっくす · Anchor Box 1級コンピュータビジョン: 物体検出で各位置に予め用意するバウンディングボックスのテンプレート。事前形状を提供して学習を安定化。
MDP えむでぃーぴー · Markov Decision Process 1級強化学習: 強化学習の数学的枠組み。(S, A, P, R, γ) で状態・行動・遷移・報酬・割引率を定義。
Q-learning きゅーらーにんぐ · Q-learning 1級強化学習: 状態行動価値 Q(s, a) を学習し、最大 Q を選ぶ方策に従う強化学習アルゴリズム。Bellman 方程式に基づく。
DQN でぃーきゅーえぬ · Deep Q-Network 1級強化学習: Q-learning の Q 関数をニューラルネットで近似 + 経験再生 + ターゲットネットを使った手法。Atari で人を超えた。
Policy Gradient ぽりしーぐらでぃえんと · Policy Gradient 1級強化学習: 方策 π を直接ニューラルネットでパラメータ化し、勾配上昇で報酬期待値を最大化する手法。
PPO ぴーぴーおー · Proximal Policy Optimization 1級強化学習: 方策更新を一定範囲(クリップ)に抑える方策勾配法。安定性と性能のバランスが良く、RLHF の標準。
Actor-Critic あくたーくりてぃっく · Actor-Critic 1級強化学習: 方策(Actor)と価値関数(Critic)を同時に学習する強化学習の枠組み。A2C ・ A3C ・ SAC が代表例。
Bellman 方程式 べるまんほうていしき · Bellman Equation 1級強化学習: 現在の価値 = 即時報酬 + 割引した次状態の価値、という再帰的な等式。動的計画法と強化学習の理論的中核。
報酬関数 ほうしゅうかんすう · Reward Function 1級強化学習: 強化学習で各 (状態, 行動) に対して報酬を返す関数。設計が学習結果を大きく左右する。
割引率 わりびきりつ · Discount Factor (γ) 1級強化学習: 将来の報酬を現在価値に換算する係数(0 ≤ γ < 1)。γ が小さいほど短期志向、大きいほど長期志向。
経験再生 けいけんさいせい · Experience Replay 1級強化学習: 過去の経験(s, a, r, s')をバッファに溜め、ランダムにサンプリングして学習する手法。サンプル効率と相関軽減に寄与。
DDPM でぃーでぃーぴーえむ · Denoising Diffusion Probabilistic Model 1級生成 AI: ノイズ予測タスクとして拡散モデルを定式化した代表論文(Ho et al. 2020)。
Classifier-Free Guidance くらしふぁーふりーがいだんす · Classifier-Free Guidance 1級生成 AI: 拡散モデルの条件付き生成で、条件あり/なしの予測を線形結合してガイダンス強度を高める手法。
CLIP くりっぷ · Contrastive Language-Image Pre-training 1級生成 AI: 画像とテキストを同じ埋め込み空間に対応付ける OpenAI のモデル。ゼロショット分類や拡散モデルの条件付けに使用。
AI エージェント えーあいえーじぇんと · AI Agent 1級AI エージェント: LLM が外部ツールを自律的に呼んでタスクを完遂する仕組み。ReAct ・ Tool Use ・ Multi-Agent が中心概念。
ReAct りあくと · Reason + Act 1級AI エージェント: エージェントの基本パターン。推論(Reason)とツール呼び出し(Act)を交互に行うことで複雑タスクを解く。
Tool Use つーるゆーす · Tool Use / Function Calling 1級AI エージェント: LLM が宣言された外部関数を引数を埋めて呼び出す機能。OpenAI ・ Anthropic API がネイティブ対応。
Multi-Agent まるちえーじぇんと · Multi-Agent System 1級AI エージェント: 複数の専門エージェントが協調してタスクを解くアーキテクチャ。プランナー・コーダー・レビュアーなど役割分担。
ASR えーえすあーる · Automatic Speech Recognition 1級音声 AI: 音声を文字に変換する技術。OpenAI Whisper が現在の業界標準で、日本語含む多言語対応。
TTS てぃーてぃーえす · Text-to-Speech 1級音声 AI: テキストを自然な音声に変換する技術。XTTS-v2 ・ ElevenLabs ・ OpenAI TTS が主要モデル。
合成統制法 ごうせいとうせいほう · Synthetic Control Method 1級因果推論: 複数の対照群を重み付けして処置群とそっくりな「人工対照群」を作り、介入効果を推定する手法 (Abadie & Gardeazabal 2003)。1 ユニット処置に強い。
関連する教科書の節を読む →
Double ML だぶるえむえる · Double Machine Learning 1級因果推論: 高次元共変量を機械学習で扱いながら因果効果を一致推定する枠組み (Chernozhukov et al. 2018)。直交化(Neyman orthogonality)が鍵。
関連する教科書の節を読む →
Causal Forest こーざるふぉれすと · Causal Forest 1級因果推論: ランダムフォレストを「同じ葉に入った観測同士で処置効果を推定」する形に拡張した手法 (Wager & Athey 2018)。共変量ごとの異質処置効果 CATE を推定できる。
関連する教科書の節を読む →
アップリフトモデリング あっぷりふともでりんぐ · uplift modeling 1級因果推論: 「処置によって行動が変わる人」を特定するモデリング。マーケでは「クーポンを送る価値がある人」を抽出するのに使う。
関連する教科書の節を読む →
CausalImpact こーざるいんぱくと · CausalImpact 1級時系列: Google が公開した因果分析ライブラリ。ベイズ構造時系列モデルで反事実を推定し、介入の効果を測る (Brodersen et al. 2015)。
関連する教科書の節を読む →
N-BEATS えぬびーつ · Neural Basis Expansion Analysis for Time Series 1級時系列: 純粋な MLP ブロックで構成された時系列予測モデル (2020)。M4 コンペで Prophet を上回る精度を出した。
関連する教科書の節を読む →
Temporal Fusion Transformer てんぽーらるふゅーじょんとらんすふぉーまー · Temporal Fusion Transformer (TFT) 1級時系列: 多変量時系列・カテゴリ・静的共変量を統一的に扱う Transformer ベース予測モデル (2021)。注意機構で重要な時刻を可視化できる。
関連する教科書の節を読む →
時系列基盤モデル じけいれつきばんもでる · Time Series Foundation Model 1級時系列: 大規模時系列で事前学習され、Zero-shot 予測ができるモデル。Chronos・TimesFM・Lag-Llama などが 2024 年に登場。
関連する教科書の節を読む →
RAG らぐ · Retrieval-Augmented Generation 1級生成 AI: 外部知識ベースから関連文書を検索してプロンプトに添付してから LLM に答えさせる手法。ハルシネーション抑制と最新情報の活用に有効。
関連する教科書の節を読む →
Chain-of-Thought ちぇーんおぶそーと · Chain-of-Thought (CoT) 1級生成 AI: 「Let's think step by step」のように推論過程を明示させるプロンプティング手法。算数・推論問題で精度が大幅向上 (Wei et al. 2022)。
関連する教科書の節を読む →
ReAct りあくと · Reasoning + Acting 1級生成 AI: LLM に「考える(推論)」と「行動する(ツール使用)」を交互に行わせるパラダイム。現代の AI エージェントの基本設計。
関連する教科書の節を読む →
QLoRA きゅーろーら · Quantized Low-Rank Adaptation 1級生成 AI: 4 bit 量子化と LoRA を組み合わせた省メモリファインチューニング手法。消費者向け GPU で大規模モデルを学習可能にする。
関連する教科書の節を読む →
Constitutional AI こんすてぃちゅーしょなるえーあい · Constitutional AI 1級AI 倫理: Anthropic が開発した、人間のフィードバックを AI のフィードバック(AI が AI を批判)で代替するアライメント手法。Claude シリーズに実装。
関連する教科書の節を読む →
EU AI 法 いーゆーえーあいほう · EU AI Act 1級AI 倫理: 2024 年採択の世界初の包括的 AI 規制。リスクを 4 段階(許容不可/高/限定/最小)に分類し義務を課す。違反は最大年間売上の 7% の罰金。
関連する教科書の節を読む →
ハルシネーション はるしねーしょん · hallucination 1級生成 AI: LLM がもっともらしい嘘を生成する現象。RAG・出典明示・検証 LLM で抑制する。
関連する教科書の節を読む →
プロンプトインジェクション ぷろんぷといんじぇくしょん · prompt injection 1級AI セキュリティ: 悪意あるプロンプトでシステムプロンプトを上書きし、機密漏洩や不正動作を引き起こす攻撃。生成 AI のセキュリティ上の主要リスクの 1 つ。
関連する教科書の節を読む →
MoE えむおーいー · Mixture of Experts 1級深層学習: 複数の「エキスパート」サブネットワークから条件に応じて少数だけを活性化させる Transformer アーキテクチャ。Mixtral・DeepSeek-V3 などで採用。
創発的能力 そうはつてきのうりょく · emergent abilities 1級深層学習: LLM が一定規模を超えると突然現れる能力(算術・推論・コード生成など)。線形改善ではなく相転移的な現象 (Wei et al. 2022)。
関連する教科書の節を読む →
著作権法 30 条の 4 ちょさくけんほう30じょうの4 · Article 30-4 of Japanese Copyright Act 1級AI 法務: 著作物に表現された思想・感情の『享受目的でない』利用を許容する規定(2018 年改正)。AI 学習・解析・特徴量抽出が代表例。ただし著作権者の利益を不当に害する場合は除外。
関連する教科書の節を読む →
データドリフト でーたどりふと · data drift / covariate shift 1級MLOps: 本番運用中に入力 P(X) の分布が学習時から変化する現象。季節要因や顧客属性変化が原因。KS 検定や PSI で検出。
関連する教科書の節を読む →
コンセプトドリフト こんせぷとどりふと · concept drift 1級MLOps: 入力と出力の関係 P(Y|X) が時間とともに変化する現象。顧客嗜好の変化や不正パターンの進化が代表例。再学習が対策。
関連する教科書の節を読む →
シャドーデプロイ しゃどーでぷろい · shadow deployment 1級MLOps: 新モデルを本番トラフィックに対して並列実行し、本番に影響を与えずに新旧モデルの結果を比較する段階リリース手法。問題なければカナリアリリースに進む。
関連する教科書の節を読む →
PSI ぴーえすあい · Population Stability Index 1級MLOps: 学習データと運用データの分布変化を測る指標。 $PSI = \sum (p_{i} - q_{i}) lo g (p_{i} / q_{i})$ 。0.1 以下なら安定、0.25 以上で大きなドリフト。
関連する教科書の節を読む →
InfoNCE 損失 いんふぉえぬしーいーそんしつ · InfoNCE loss 1級自己教師あり学習: 対照学習で使う損失関数。正例ペアと負例ペアのコサイン類似度から、ソフトマックス交差エントロピー型で表現を学習。SimCLR・MoCo・CLIP などの基盤。
関連する教科書の節を読む →
SimCLR しむくりあ · SimCLR 1級自己教師あり学習: Chen et al. 2020 の対照学習手法。同じ画像の Augment 版を正例、バッチ内の他画像を負例として、シンプルな枠組みで強力な表現を獲得。バッチサイズが大きいほど強い。
関連する教科書の節を読む →
MAE えむえーいー · Masked Autoencoder 1級自己教師あり学習: He et al. 2021。画像の 75% をマスクして残り 25% から再構成する自己教師あり学習。ViT との相性が良く、強い視覚特徴を獲得する。
関連する教科書の節を読む →
DINO / DINOv2 でぃーのー · DINO / DINOv2 1級自己教師あり学習: Caron et al. 2021/2023。自己蒸留型 SSL で、教師なしでセグメンテーション特徴を獲得する。基盤視覚モデルの 1 つ。
関連する教科書の節を読む →
能動学習 のうどうがくしゅう · active learning 1級能動学習: ラベル付けが高コストな場面で、最も学習効果の高いサンプルを選んでラベル付与・再学習を繰り返す手法。獲得関数で『情報的な例』を選別する。
関連する教科書の節を読む →
Uncertainty Sampling あんさーてぃんてぃーさんぷりんぐ · uncertainty sampling 1級能動学習: 能動学習の代表的獲得関数。モデルが予測に最も自信がない(エントロピー高 / 最大確率小 / margin 小)サンプルを優先してラベル付けする。
関連する教科書の節を読む →
BALD ばるど · Bayesian Active Learning by Disagreement 1級能動学習: ベイズ的な能動学習手法。Dropout や Deep Ensemble でモデルパラメータの不確実性を推定し、予測分散が大きいサンプルを優先する。
連合学習 れんごうがくしゅう · Federated Learning 1級連合学習: データを中央集約せず、各クライアントでローカル学習したモデル更新だけを共有して中央モデルを改善する分散学習。プライバシー保護と規制対応に有用。
関連する教科書の節を読む →
FedAvg ふぇどあぶ · Federated Averaging 1級連合学習: 連合学習の代表的アルゴリズム (McMahan et al. 2017)。各クライアントが数エポック学習した後、サーバがデータ量で重み付け平均でモデルを集約する。
関連する教科書の節を読む →
クロスデバイス連合学習 くろすでばいすれんごうがくしゅう · cross-device federated learning 1級連合学習: 数百万のスマートフォンや IoT デバイスが参加する連合学習形態。各デバイスのデータは小規模、参加が不安定。Google Gboard などが実例。
関連する教科書の節を読む →
クロスサイロ連合学習 くろすさいろれんごうがくしゅう · cross-silo federated learning 1級連合学習: 数〜数十の組織(病院・銀行・メーカー)が参加する連合学習形態。各組織のデータは大規模で参加は安定。医療画像診断・金融不正検知などで実用化。
関連する教科書の節を読む →
FedProx ふぇどぷろっくす · FedProx 1級連合学習: Non-IID データ問題に対処する連合学習アルゴリズム。各クライアントの局所更新に近接項を加え、グローバルモデルから離れすぎないよう制御する。
プルーニング ぷるーにんぐ · pruning 1級モデル軽量化: ニューラルネットの重みのうち重要でないものを 0 にする(または削除する)モデル軽量化手法。非構造化(個別重み)と構造化(チャネル・ヘッド)に大別。
関連する教科書の節を読む →
Lottery Ticket Hypothesis ろたりーちけっとかせつ · Lottery Ticket Hypothesis 1級モデル軽量化: Frankle & Carbin 2019。大きなネットワーク内には『勝者の宝くじ券』に相当する小さな部分ネットワークが存在し、それを抽出すれば元と同等の性能が出るという仮説。
関連する教科書の節を読む →
知識蒸留 ちしきじょうりゅう · knowledge distillation 1級モデル軽量化: Hinton et al. 2015。大きな教師モデルの Soft Target を小さな生徒モデルに学習させる軽量化手法。温度パラメータでソフト化した分布から、クラス間類似度を継承できる。
関連する教科書の節を読む →
DistilBERT でぃすてぃるばーと · DistilBERT 1級モデル軽量化: Sanh et al. 2019。BERT-base を蒸留して 40% 軽量・60% 高速化、性能 97% 維持。蒸留の有名な実例。
関連する教科書の節を読む →
PTQ ぴーてぃーきゅー · Post-Training Quantization 1級量子化: 学習後のモデルにそのまま量子化を適用する手法。代表: GPTQ・AWQ。安価だが精度低下が出やすい。
関連する教科書の節を読む →
QAT きゅーえーてぃー · Quantization-Aware Training 1級量子化: 学習中に量子化を模倣し『量子化に強い重み』を学習する手法。学習コストは高いが PTQ より精度低下が少ない。
関連する教科書の節を読む →
NF4 えぬえふ4 · Normal Float 4 1級量子化: QLoRA で採用される 4 bit 量子化形式 (Dettmers et al. 2023)。事前学習済み重みが正規分布に近い性質を利用して精度低下を抑制する。
関連する教科書の節を読む →
DPO でぃーぴーおー · Direct Preference Optimization 1級ファインチューニング: Rafailov et al. 2023。RLHF の RL ステージを強化学習なしの教師あり学習に置き換える手法。実装が簡単で安定し、2023 年以降急速に普及。
関連する教科書の節を読む →
DoRA どーら · Weight-Decomposed Low-Rank Adaptation 1級ファインチューニング: Liu et al. 2024。LoRA を方向と大きさに分解した改良版。LoRA より精度が向上することが報告されている。
Mamba まんば · Mamba (S6) 1級効率的アーキテクチャ: Gu & Dao 2023。Self-Attention の O(n²) を線形時間 O(n) に置き換える状態空間モデル。長系列で Transformer を凌駕する場合がある。
関連する教科書の節を読む →
Flash Attention ふらっしゅあてんしょん · Flash Attention 1級効率的アーキテクチャ: Dao et al. 2022。GPU メモリ階層を意識した Attention 実装で、数学的に同一のまま 2〜4 倍高速化。現代の LLM 学習・推論で標準採用。
関連する教科書の節を読む →
MCP えむしーぴー · Model Context Protocol 1級AI エージェント: Anthropic 2024。AI モデルと外部ツールの接続を標準化するオープンプロトコル。任意の AI クライアントが任意の MCP サーバを使える、エージェント時代のインフラ。
関連する教科書の節を読む →