統計用語集
統計検定 4級〜1級で登場する重要用語をまとめた辞典です。各用語に短い定義と「関連する教科書の節」へのリンクを付けています。試験前の最終チェックや、学習中に意味を素早く確認したいときにお使いください。全 462 語。
4級レベルの用語 (34)
- 平均値へいきんち · mean4級代表値
全データの合計をデータ数で割った値。データの中心位置を表すもっとも基本的な代表値。
関連する教科書の節を読む →- 中央値ちゅうおうち · median4級代表値
データを昇順に並べたとき真ん中にくる値。外れ値の影響を受けにくい代表値。
関連する教科書の節を読む →- 最頻値さいひんち · mode4級代表値
データの中でもっとも多く出現する値。質的データ(カテゴリ)で唯一使える代表値であり、分布の山の位置を表す。複数の値が同じ最大度数なら最頻値は複数となる。
関連する教科書の節を読む →- 範囲はんい · range4級ばらつき
データの最大値から最小値を引いた値。もっとも単純なばらつきの指標。
関連する教科書の節を読む →- 四分位数しぶんいすう · quartile4級ばらつき
データを昇順で 4 等分したときの 3 つの区切り値 。 は中央値。
関連する教科書の節を読む →- 四分位範囲しぶんいはんい · IQR (interquartile range)4級ばらつき
。中央 50% のデータの広がり。外れ値に頑健。
関連する教科書の節を読む →- 箱ひげ図はこひげず · box plot4級可視化
最小値・・中央値・・最大値の五数で分布を要約する図。複数群比較に便利。
関連する教科書の節を読む →- 度数分布表どすうぶんぷひょう · frequency table4級可視化
データを階級に分け、各階級の度数(個数)をまとめた表。ヒストグラムの基礎。
関連する教科書の節を読む →- ヒストグラムひすとぐらむ · histogram4級可視化
度数分布表を棒グラフ化したもの。隣の棒は隙間なく並べ、データの分布形を視覚化する。
関連する教科書の節を読む →- 順列じゅんれつ · permutation4級場合の数
異なる 個から 個を選んで順序付けて並べる方法の総数。。
関連する教科書の節を読む →- 組合せくみあわせ · combination4級場合の数
異なる 個から 個を順序を区別せず選ぶ方法の総数。。
関連する教科書の節を読む →- 余事象よじしょう · complementary event4級確率
事象 が起こらない事象。。「少なくとも〜」型の問題に強い。
関連する教科書の節を読む →- 度数どすう · frequency4級データ整理
ある階級(または値)に属するデータの個数。度数分布表で各階級ごとに数えた件数のこと。
関連する教科書の節を読む →- 相対度数そうたいどすう · relative frequency4級データ整理
各階級の度数を全体の度数で割った値(=割合)。データ規模が違う集団同士の比較に便利。
関連する教科書の節を読む →- 累積度数るいせきどすう · cumulative frequency4級データ整理
ある階級までの度数を順に足し上げた値。「○○以下が何人いるか」が一目でわかる。
関連する教科書の節を読む →- 階級かいきゅう · class interval4級データ整理
度数分布表で連続データを区切る区間(例: 60〜70 点)。階級幅は基本的に揃える。
関連する教科書の節を読む →- 階級値かいきゅうち · class midpoint4級データ整理
各階級の中央の値(=区間の中点)。度数分布表から平均などを計算するときの代表値として使う。
関連する教科書の節を読む →- 散布図さんぷず · scatter plot4級可視化
2 変数を横軸 ・縦軸 に取って点でプロットした図。2 変数の関係(相関)を視覚的に確認できる。
関連する教科書の節を読む →- 棒グラフぼうぐらふ · bar chart4級可視化
カテゴリごとの数量を棒の高さで比べる図。質的データ・離散量に向く。隣接させない(ヒストグラムとは異なる)。
関連する教科書の節を読む →- 折れ線グラフおれせんぐらふ · line chart4級可視化
時系列など順序のあるデータを線でつないだ図。推移・トレンドを示すのに適している。
関連する教科書の節を読む →- 円グラフえんぐらふ · pie chart4級可視化
全体を 100% として各項目の構成比を扇形で示す図。カテゴリが多すぎると見にくい。
関連する教科書の節を読む →- 試行しこう · trial4級確率
結果が偶然に決まる行為(コイン投げ・サイコロを振るなど)。確率の議論の出発点。
関連する教科書の節を読む →- 事象じしょう · event4級確率
試行の結果として起こりうる集合(例: サイコロで偶数の目が出る)。1 個の結果は「根元事象」と呼ぶ。
関連する教科書の節を読む →- 排反事象はいはんじしょう · mutually exclusive events4級確率
同時には起こりえない事象どうし。。確率の加法定理で和の確率がそのまま足し算になる条件。
関連する教科書の節を読む →- 質的データしつてきでーた · qualitative data4級データ整理
性別・血液型・好みなど、数値で大小を比較できないカテゴリのデータ。名義尺度・順序尺度に分類される。
関連する教科書の節を読む →- 量的データりょうてきでーた · quantitative data4級データ整理
身長・売上・気温など、数値で大小や差を比較できるデータ。間隔尺度・比例尺度に分類される。
関連する教科書の節を読む →- 離散変数と連続変数りさんへんすうとれんぞくへんすう · discrete vs. continuous variable4級データ整理
離散変数は人数・回数のような飛び飛びの値、連続変数は身長・時間のように切れ目なく値を取る変数。扱う確率分布が異なる。
関連する教科書の節を読む →- 同様に確からしいどうようにたしからしい · equally likely4級確率
ある試行のすべての根元事象が同じ確率で起こる状態。「サイコロ・コイン・くじ」など古典的確率の前提。
関連する教科書の節を読む →- 樹形図じゅけいず · tree diagram4級場合の数
場合の数や確率を漏れなく数えるために、選択を枝分かれで描いた図。条件付き確率の理解にも有効。
関連する教科書の節を読む →- パーセンタイルぱーせんたいる · percentile4級ばらつき
データを小さい順に並べたとき下から の位置にある値。 パーセンタイルは中央値、 は四分位数。
関連する教科書の節を読む →- 確率変数かくりつへんすう · Random variable4級確率分布
ランダムな結果を数値に対応させた変数。サイコロの出目・身長・通勤遅延回数など。離散型(整数値)と連続型(実数値)に分類される。確率分布で振る舞いを記述。
関連する教科書の節を読む →- 二項分布にこうぶんぷ · Binomial distribution4級確率分布
成功確率 の試行を独立に 回繰り返したときの成功回数の分布。、、。コイン投げ・不良品個数・アンケートの賛成数。 が大きいと正規分布に近づく。
関連する教科書の節を読む →- 68-95-99.7ルールろくじゅうはちきゅうじゅうごきゅうじゅうきゅうてんなな · 68-95-99.7 rule4級確率分布
正規分布で平均 ±1σ に約 68%、±2σ に約 95%、±3σ に約 99.7% のデータが含まれる経験則。品質管理(±3σ から外れたら異常)・偏差値(平均から ±1σ で偏差値 60-40)で実用される。
関連する教科書の節を読む →- 中心極限定理ちゅうしんきょくげんていり · Central Limit Theorem (CLT)4級確率分布
独立同分布の確率変数の和(平均)は、母集団の分布形状によらず、サンプルサイズが大きくなると正規分布に近づく定理。統計的推測(信頼区間・仮説検定)の理論的基盤。
関連する教科書の節を読む →
3級レベルの用語 (45)
- 分散ぶんさん · variance3級ばらつき
偏差の 2 乗の平均。データのばらつきの大きさを表す代表的な指標。。
関連する教科書の節を読む →- 標準偏差ひょうじゅんへんさ · standard deviation3級ばらつき
分散の正の平方根。もとのデータと同じ単位でばらつきを表現できる。
関連する教科書の節を読む →- 共分散きょうぶんさん · covariance3級2変数
。2 変数の連動の方向を示す。
関連する教科書の節を読む →- 相関係数そうかんけいすう · correlation coefficient3級2変数
。 の値で 2 変数の直線関係の強さを表す。
関連する教科書の節を読む →- 標準化ひょうじゅんか · standardization (z-score)3級変換
により、平均 0・標準偏差 1 の物差しに変換する操作。
関連する教科書の節を読む →- 偏差値へんさち · T-score3級変換
z スコアを に変換した値。平均 50・標準偏差 10 の物差し。
関連する教科書の節を読む →- 条件付き確率じょうけんつきかくりつ · conditional probability3級確率
事象 が起こったもとで が起こる確率。。
関連する教科書の節を読む →- 確率変数かくりつへんすう · random variable3級確率
試行結果に応じて値が確率的に決まる変数。離散と連続がある。 で表すのが慣例。
関連する教科書の節を読む →- 期待値きたいち · expectation3級確率
確率変数の「ならした平均値」。離散なら 。
関連する教科書の節を読む →- 二項分布にこうぶんぷ · binomial distribution3級分布
成功確率 のベルヌーイ試行を 回繰り返したときの成功回数 の分布。、。
関連する教科書の節を読む →- 正規分布せいきぶんぷ · normal (Gaussian) distribution3級分布
釣鐘型の連続分布 。中心極限定理により多くの平均量がこれに近づく。
関連する教科書の節を読む →- 信頼区間しんらいくかん · confidence interval3級推定
母集団の未知パラメータが「ある信頼度で」入る区間。例: 。
関連する教科書の節を読む →- 中心極限定理ちゅうしんきょくげんていり · central limit theorem (CLT)3級理論
母集団の分布によらず、 が十分大きいとき標本平均は近似的に正規分布に従う、という定理。
関連する教科書の節を読む →- 母集団ぼしゅうだん · population3級推測統計
調査・推測の対象となる全データ集団。母集団の真の値(母平均・母分散など)を「母数(パラメータ)」と呼ぶ。
関連する教科書の節を読む →- 標本ひょうほん · sample3級推測統計
母集団から抽出された一部のデータ。標本から計算した値(標本平均など)を「統計量」と呼ぶ。
関連する教科書の節を読む →- 全数調査ぜんすうちょうさ · census3級標本抽出
母集団の全要素を調べる調査(国勢調査など)。誤差は小さいがコスト・時間がかかる。
関連する教科書の節を読む →- 標本調査ひょうほんちょうさ · sample survey3級標本抽出
母集団の一部だけを調べて全体を推測する調査。コストが低く、ほとんどの社会調査で採用される。
関連する教科書の節を読む →- 無作為抽出むさくいちゅうしゅつ · random sampling3級標本抽出
母集団のどの要素も同じ確率で標本に選ばれるようにする抽出法。推測統計の前提となる。
関連する教科書の節を読む →- 標準正規分布ひょうじゅんせいきぶんぷ · standard normal distribution3級確率分布
平均 0・分散 1 の正規分布 。任意の正規分布は標準化により標準正規分布に変換できる。
関連する教科書の節を読む →- z 値ぜっとち · z-score3級推測統計
。データを標準化したときの値。「平均から標準偏差いくつ分離れているか」を表す。
関連する教科書の節を読む →- 確率密度関数かくりつみつどかんすう · probability density function (pdf)3級確率分布
連続型確率変数の分布を表す関数 。区間 の確率は 。
関連する教科書の節を読む →- 累積分布関数るいせきぶんぷかんすう · cumulative distribution function (cdf)3級確率分布
。「 以下になる確率」を返す関数。pdf を積分すると得られる。
関連する教科書の節を読む →- 大数の法則たいすうのほうそく · law of large numbers3級推測統計
標本サイズ を大きくするほど、標本平均が母平均に近づく(確率収束する)という法則。推測統計の基盤。
関連する教科書の節を読む →- ベルヌーイ分布べるぬーいぶんぷ · Bernoulli distribution3級確率分布
0 か 1 の値だけを取る最も単純な分布。。 回の独立試行を集めると二項分布になる。
関連する教科書の節を読む →- 復元抽出ふくげんちゅうしゅつ · sampling with replacement3級標本抽出
抽出した要素を毎回母集団に戻してから次を引く方法。各回の試行が独立になり、二項分布などの前提となる。
関連する教科書の節を読む →- 非復元抽出ひふくげんちゅうしゅつ · sampling without replacement3級標本抽出
一度抽出した要素は戻さずに次を引く方法。実際の調査の標準。試行は独立でなく、超幾何分布などで扱う。
関連する教科書の節を読む →- 母平均ぼへいきん · population mean3級推測統計
母集団全体の平均値 。標本平均 は母平均の不偏推定量で、推測統計の中心的な対象。
関連する教科書の節を読む →- 母分散ぼぶんさん · population variance3級推測統計
母集団全体の分散 。標本分散より不偏分散( で割る)の方が母分散の不偏推定量となる。
関連する教科書の節を読む →- 母比率ぼひりつ · population proportion3級推測統計
母集団における特定属性を持つ要素の割合 。世論調査や品質管理で「賛成率」「不良率」として推定対象になる。
関連する教科書の節を読む →- 標本比率ひょうほんひりつ · sample proportion3級推測統計
標本のうち特定属性を持つ要素の割合 。大標本では に近づく(中心極限定理)。
関連する教科書の節を読む →- 期待値の線形性きたいちのせんけいせい · linearity of expectation3級確率
が独立性に関係なく常に成り立つ性質。確率論で最も使われる便利な道具。
関連する教科書の節を読む →- 同時分布どうじぶんぷ · joint distribution3級確率
複数の確率変数 が同時に取る値の確率分布。同時分布から各変数の周辺分布や条件付き分布が得られる。
関連する教科書の節を読む →- 周辺分布しゅうへんぶんぷ · marginal distribution3級確率
同時分布から他の変数を確率の足し合わせ(積分)で消去して得られる、1 つの変数の単独分布。
関連する教科書の節を読む →- 二項定理にこうていり · binomial theorem3級場合の数
。二項分布の確率関数の正体でもある重要な展開公式。
関連する教科書の節を読む →- QC7つ道具きゅーしーななつどうぐ · Seven QC tools3級品質管理
現場の品質改善で使う 7 つの数値分析ツール ─ パレート図・特性要因図(フィッシュボーン)・ヒストグラム・散布図・管理図・チェックシート・グラフ(層別)。
関連する教科書の節を読む →- 新QC7つ道具しんきゅーしーななつどうぐ · Seven new QC tools3級品質管理
言語データ・概念整理向けの 7 つのツール ─ 親和図(KJ 法)・連関図・系統図・マトリクス図・マトリクスデータ解析法・PDPC 法・アローダイアグラム。1979 年提唱。
関連する教科書の節を読む →- PDCAサイクルぴーでぃーしーえーさいくる · PDCA Cycle3級品質管理
Plan(計画)→ Do(実行)→ Check(確認)→ Act(処置)を反復する継続改善の枠組み。Deming サイクルとも。仮説検証を回すというサイエンスの基本構造を経営に持ち込んだもの。
関連する教科書の節を読む →- p値ぴーち · p-value3級仮説検定
帰無仮説 H₀ が正しいと仮定したときに、観測された統計量以上に極端な値が得られる確率。 なら H₀ を棄却する。『H₀ が正しい確率』ではないので解釈に注意。
関連する教科書の節を読む →- 棄却域ききゃくいき · Rejection region3級仮説検定
検定統計量がこの範囲に入ったら帰無仮説を棄却する領域。両側 z 検定で α=5% なら 、右片側で α=5% なら 。検定設計の中心概念。
関連する教科書の節を読む →- 第一種の誤りだいいっしゅのあやまり · Type I error3級仮説検定
帰無仮説 H₀ が正しいのに棄却してしまう誤り。発生確率 = 有意水準 。新薬で『効果がないのにある』と判定するなど。
関連する教科書の節を読む →- 第二種の誤りだいにしゅのあやまり · Type II error3級仮説検定
帰無仮説 H₀ が誤っているのに棄却しない誤り。発生確率 。検出力 = 。実際の効果を見逃すミス。第一種の誤りとはトレードオフ関係(片方を厳しくすれば他方が緩む)。
関連する教科書の節を読む →- z検定ぜっとけんてい · z-test3級仮説検定
検定統計量 が標準正規分布に従うことを利用する検定。母分散既知 or 大標本で母平均・母比率の検定に使う。3 級で扱う最も基本的な検定。
関連する教科書の節を読む →- 適合度検定てきごうどけんてい · Goodness-of-fit test3級仮説検定
観測度数分布が理論分布に従うかを判定するカイ二乗検定。 が自由度 のカイ二乗分布に従う。サイコロの公平性、メンデルの遺伝の法則の検証など。
関連する教科書の節を読む →- 片側検定かたがわけんてい · One-sided test3級仮説検定
対立仮説 または のように方向を指定した検定。両側に比べ棄却域が片側に集中するため、同じ α で検出力が高い。事後に方向を変えるのは『p ハッキング』。
関連する教科書の節を読む →- 両側検定りょうがわけんてい · Two-sided test3級仮説検定
対立仮説 のように方向を限定しない検定。棄却域が両裾(各 )に分かれる。『変わったか』を見たい標準的な状況で使う。
関連する教科書の節を読む →
2級レベルの用語 (128)
- 不偏分散ふへんぶんさん · unbiased sample variance2級推定
。母分散 の不偏推定量。
関連する教科書の節を読む →- 標準誤差ひょうじゅんごさ · standard error (SE)2級推定
推定量のばらつきの大きさ。標本平均なら 。 を増やすと縮む。
関連する教科書の節を読む →- 自由度じゆうど · degrees of freedom2級推定
推定で「自由に動ける情報の数」。不偏分散の自由度は 、回帰の残差は など。
関連する教科書の節を読む →- t 分布てぃーぶんぷ · Student's t-distribution2級分布
標準正規より裾が厚い釣鐘型分布。母分散未知での母平均の推定・検定に使う。自由度を持つ。
関連する教科書の節を読む →- 帰無仮説きむかせつ · null hypothesis2級検定
「差はない」「効果はない」など、退屈で当たり障りのない出発点となる仮説。。
関連する教科書の節を読む →- 対立仮説たいりつかせつ · alternative hypothesis2級検定
帰無仮説に反する、研究者が示したい仮説。 または 。
関連する教科書の節を読む →- 有意水準ゆういすいじゅん · significance level2級検定
「 が真なのに棄却してしまう確率」の上限。慣例的に や 。
関連する教科書の節を読む →- p 値ぴーち · p-value2級検定
のもとで、現在のデータと同等以上に極端なデータが観測される確率。 で棄却。
関連する教科書の節を読む →- 第1種の誤りだいいっしゅのあやまり · Type I error2級検定
が真なのに棄却してしまう誤り。確率は 。
関連する教科書の節を読む →- 第2種の誤りだいにしゅのあやまり · Type II error2級検定
が真なのに を棄却できない誤り。確率は 。検出力は 。
関連する教科書の節を読む →- カイ二乗検定かいにじょうけんてい · chi-squared test2級検定
観測度数と期待度数の食い違いを で測る検定。適合度・独立性に使う。
関連する教科書の節を読む →- 回帰係数かいきけいすう · regression coefficient2級回帰
回帰直線の傾き 。 が 1 単位増えたときの の予測値の変化量。
関連する教科書の節を読む →- 決定係数けっていけいすう · coefficient of determination2級回帰
。回帰モデルが応答変数の分散をどれだけ説明できたかの指標。
関連する教科書の節を読む →- 最小二乗法さいしょうにじょうほう · ordinary least squares (OLS)2級回帰
残差の 2 乗和を最小にするように回帰係数を推定する方法。。
関連する教科書の節を読む →- 不偏推定量ふへんすいていりょう · unbiased estimator2級推定
期待値が母数に一致する推定量 。標本平均は母平均の不偏推定量、不偏分散は母分散の不偏推定量。
関連する教科書の節を読む →- カイ二乗分布かいにじょうぶんぷ · chi-squared distribution2級確率分布
標準正規変数 の二乗和 の分布。自由度 。分散の検定や独立性の検定で使う。
関連する教科書の節を読む →- F 分布えふぶんぷ · F distribution2級確率分布
2 つの独立なカイ二乗統計量の比の分布。分散分析・分散比の検定に使う。
関連する教科書の節を読む →- F 検定えふけんてい · F test2級検定
F 分布を使った検定の総称。2 群の分散の等しさの検定や、回帰モデルの全係数 0 の検定など。
関連する教科書の節を読む →- 対応のある t 検定たいおうのあるてぃーけんてい · paired t-test2級検定
同じ被験者の前後比較など、ペア構造があるデータの平均差の検定。差 の平均が 0 かを検定する。
関連する教科書の節を読む →- 対応のない t 検定たいおうのないてぃーけんてい · two-sample t-test2級検定
独立な 2 群の平均差の検定。等分散を仮定するスチューデントの t 検定と、仮定しないウェルチの t 検定がある。
関連する教科書の節を読む →- 分散分析ぶんさんぶんせき · ANOVA (analysis of variance)2級検定
3 群以上の平均差を、群間変動と群内変動の比(F 値)で同時に検定する手法。一元配置・二元配置などがある。
関連する教科書の節を読む →- 残差ざんさ · residual2級回帰
実測値とモデルによる予測値の差 。回帰の当てはまりや前提(等分散・独立性)を残差プロットで診断する。
関連する教科書の節を読む →- 多重共線性たじゅうきょうせんせい · multicollinearity2級回帰
重回帰で説明変数どうしが強く相関している状態。係数の推定が不安定になる。VIF などで検出する。
関連する教科書の節を読む →- 単純無作為抽出たんじゅんむさくいちゅうしゅつ · simple random sampling2級標本抽出
母集団のすべての要素が等しい確率で選ばれる、最も基本的な無作為抽出法。
関連する教科書の節を読む →- 層化抽出そうかちゅうしゅつ · stratified sampling2級標本抽出
母集団を性別・年代などの層に分け、各層から無作為抽出する方法。層内が均質なほど推定精度が上がる。
関連する教科書の節を読む →- クラスター抽出くらすたーちゅうしゅつ · cluster sampling2級標本抽出
母集団を地域・学校などの集落(クラスター)に分け、いくつかのクラスターを丸ごと抽出する方法。コスト効率が高い。
関連する教科書の節を読む →- 統計法とうけいほう · Statistics Act2級公的統計
公的統計の作成・利用に関する基本法律(2007 年全部改正)。基幹統計の指定、統計データの目的外利用、秘密保護などを規定。
関連する教科書の節を読む →- 基幹統計きかんとうけい · fundamental statistics2級公的統計
国勢統計(国勢調査)など、特に重要として総務大臣が指定する公的統計。報告義務・正確性確保の規定が強化されている。
関連する教科書の節を読む →- 標本誤差ひょうほんごさ · sampling error2級標本抽出
標本調査で全数を見ないことから生じる、推定値と母集団真値のズレ。標本サイズの平方根に反比例して小さくなる。
関連する教科書の節を読む →- 非標本誤差ひひょうほんごさ · non-sampling error2級標本抽出
回答漏れ・回答ミス・集計ミスなど、抽出以外の原因で生じる誤差。標本サイズを増やしても減らない。
関連する教科書の節を読む →- 多段抽出ただんちゅうしゅつ · multistage sampling2級標本抽出
都道府県 → 市区町村 → 世帯のように、段階的に抽出単位を絞り込む方法。大規模調査でコストを抑えられる。
関連する教科書の節を読む →- 一様分布いちようぶんぷ · uniform distribution2級確率分布
区間 で確率密度が一定の連続分布。乱数生成の基礎で、他分布のシミュレーションの出発点になる。
関連する教科書の節を読む →- 幾何分布きかぶんぷ · geometric distribution2級確率分布
成功確率 のベルヌーイ試行を繰り返したときの初めて成功するまでの試行回数の分布。。
関連する教科書の節を読む →- 信頼水準しんらいすいじゅん · confidence level2級推定
信頼区間が母数を含む確率(例: 95%)。 の関係。区間幅と引き換えに信頼度を高められる。
関連する教科書の節を読む →- 検出力けんしゅつりょく · statistical power2級検定
対立仮説が真のとき正しく帰無仮説を棄却できる確率 。サンプルサイズ設計の基準として使う。
関連する教科書の節を読む →- 効果量こうかりょう · effect size2級検定
群間の差の大きさを標準化した指標(Cohen の など)。p 値だけでは分からない「実質的な大きさ」を示す。
関連する教科書の節を読む →- ノンパラメトリック検定のんぱらめとりっくけんてい · nonparametric test2級検定
正規性などの分布仮定を置かず、順位や符号を用いる検定の総称。サンプルが小さい・分布が歪むときに有用。
関連する教科書の節を読む →- ウィルコクソンの符号順位検定うぃるこくそんのふごうじゅんいけんてい · Wilcoxon signed-rank test2級検定
対応のある 2 群差を、差の符号と順位に基づいて検定するノンパラ手法。対応のある t 検定の正規性を仮定しない代替。
関連する教科書の節を読む →- マン・ホイットニーの U 検定まんほいっとにーのゆーけんてい · Mann–Whitney U test2級検定
独立な 2 群の中央位置差を順位で検定するノンパラ手法。対応のない t 検定の正規性を仮定しない代替。
関連する教科書の節を読む →- スピアマンの順位相関係数すぴあまんのじゅんいそうかんけいすう · Spearman's rank correlation2級回帰
2 変数の順位どうしのピアソン相関。単調関係を測り、外れ値や非線形変換に頑健。
関連する教科書の節を読む →- 自由度調整済み決定係数じゆうどちょうせいずみけっていけいすう · adjusted R²2級回帰
説明変数を増やすと無闇に上がる を、自由度で罰則化した指標。重回帰のモデル比較の基本ツール。
関連する教科書の節を読む →- AICえーあいしー · Akaike information criterion2級回帰
。当てはまり()とパラメータ数 の罰則の和。小さいほど良いモデル。
関連する教科書の節を読む →- BICびーあいしー · Bayesian information criterion2級回帰
。AIC よりパラメータ数の罰則が強く、より単純なモデルを選びやすい情報量規準。
関連する教科書の節を読む →- データクレンジングでーたくれんじんぐ · data cleansing2級データ工学
入力ミス・重複・形式不統一などを発見・修正してデータを分析可能な状態にする工程。実務の分析時間の半分以上を占める。
関連する教科書の節を読む →- 欠損値処理けっそんちしょり · missing value imputation2級データ工学
欠損データを除外/平均補完/回帰補完/多重代入などで処理する手法群。欠損メカニズム(MCAR/MAR/MNAR)で適切な手法が変わる。
関連する教科書の節を読む →- 標準化(スケーリング)ひょうじゅんか · feature scaling2級データ工学
特徴量を平均 0 ・分散 1(標準化)、または (正規化)に揃える前処理。距離ベース手法・勾配法で必須。
関連する教科書の節を読む →- A/B テストえーびーてすと · A/B testing2級実務
ユーザーをランダムに 2 群に分け、施策の効果を比較する実験。Web マーケ・プロダクト改善で標準。仮説検定の応用そのもの。
関連する教科書の節を読む →- ピボットテーブルぴぼっとてーぶる · pivot table2級実務
Excel・BI ツールで、行/列/値を動的に切り替えてクロス集計を行う仕組み。DS 基礎試験では実技の中核機能。
関連する教科書の節を読む →- KPIけーぴーあい · Key Performance Indicator2級実務
目標達成度を測る重要業績評価指標。事業の北極星指標(NSM)とともに、データドリブン経営の意思決定基準となる。
関連する教科書の節を読む →- 国民経済計算こくみんけいざいけいさん · System of National Accounts (SNA)2級公的統計
国の経済活動を生産・分配・支出の側面から体系的に記録する統計体系。GDP はその主要指標。日本は内閣府が作成。
関連する教科書の節を読む →- 消費者物価指数しょうひしゃぶっかしすう · Consumer Price Index (CPI)2級公的統計
家計が購入する商品・サービスの価格変動を、ある基準時を 100 として表す指数。総務省が作成、日銀の物価目標の対象。
関連する教科書の節を読む →- ウェイトバック集計うぇいとばっくしゅうけい · weighting back2級公的統計
標本構成と母集団構成のズレを補正するため、各回答に「逆数(または比)」の重みを掛けて集計する手法。
関連する教科書の節を読む →- 統計的開示制御とうけいてきかいじせいぎょ · statistical disclosure control2級公的統計
公的統計データの提供時に、個人や事業所が特定されないよう、頂上値の丸めやセル抑制等で識別リスクを低減する処理。
関連する教科書の節を読む →- 標本設計ひょうほんせっけい · sample design2級公的統計
目標精度・コスト・回収率を踏まえ、抽出方法・標本サイズ・層化変数などを事前に決める計画段階。調査の質を大きく左右する。
関連する教科書の節を読む →- 管理図かんりず · control chart2級品質管理
工程から定期的に取った統計量を時系列で記録し、UCL/LCL を引いて異常を判定する図。Shewhart の X̄-R 管理図、p 管理図、c 管理図など。
関連する教科書の節を読む →- 工程能力指数こうていのうりょくしすう · process capability index (Cp/Cpk)2級品質管理
規格幅に対する工程のばらつきの大きさを表す指標。、中心ずれを考慮した も併用。製造業の目標 。
関連する教科書の節を読む →- シックスシグマしっくすしぐま · Six Sigma2級品質管理
の品質管理を目指す改革運動。100 万個に 3.4 個の不良率(3.4 PPM)。 に相当。モトローラ・GE が広めた。
関連する教科書の節を読む →- OC 曲線おーしーきょくせん · Operating Characteristic Curve2級品質管理
抜取検査の性能を示す曲線。横軸=ロット不良率、縦軸=合格確率。AQL では合格、LTPD では不合格となるのが理想。
関連する教科書の節を読む →- AQLえーきゅーえる · Acceptable Quality Level2級品質管理
合格品質水準。検査でほぼ常に合格とすべき不良率の上限。生産者リスク α が 5% 以下になる水準。
関連する教科書の節を読む →- LTPDえるてぃーぴーでぃー · Lot Tolerance Percent Defective2級品質管理
ロット許容不良率。検査でほぼ常に不合格とすべき不良率。消費者リスク β が 10% 以下になる水準。
関連する教科書の節を読む →- QC 7 つ道具きゅーしーななつどうぐ · Seven QC tools2級品質管理
パレート図・特性要因図・ヒストグラム・散布図・管理図・チェックシート・グラフ(層別)。数値データを使った品質改善の基本ツール。
関連する教科書の節を読む →- 新 QC 7 つ道具しんきゅーしーななつどうぐ · Seven new QC tools2級品質管理
親和図(KJ 法)・連関図・系統図・マトリクス図・マトリクスデータ解析・PDPC 法・アローダイアグラム。言語データ・概念整理に特化。
関連する教科書の節を読む →- TQMてぃーきゅーえむ · Total Quality Management2級品質管理
総合的品質管理。3 本柱は『顧客重視・全員参加・継続的改善(カイゼン)』。日本の製造業の競争力の源泉となった経営手法。
関連する教科書の節を読む →- ROC曲線あーるおーしーきょくせん · ROC Curve2級機械学習
二値分類の閾値を動かしたとき、真陽性率(縦軸)と偽陽性率(横軸)の関係を描いた曲線。AUC で性能を要約。
- AUCえーゆーしー · Area Under Curve2級機械学習
ROC 曲線の下側面積。1.0 で完璧、0.5 でランダム。閾値非依存の分類性能指標。
- F1スコアえふわんすこあ · F1 Score2級機械学習
適合率(Precision)と再現率(Recall)の調和平均。クラス不均衡なデータの分類評価で使われる。
- 特徴量エンジニアリングとくちょうりょうえんじにありんぐ · Feature Engineering2級機械学習
ドメイン知識を活用して有用な特徴量を作る作業。テーブルデータのモデル性能を大きく左右する。
- Welch の t 検定うぇるちのてぃーけんてい · Welch's t-test2級仮説検定
2 標本の平均差を検定する手法のうち、等分散を仮定しないバージョン。Welch-Satterthwaite の近似自由度を用いる。現代の実務では既定値に近い扱い。
関連する教科書の節を読む →- 対応のある t 検定たいおうのあるてぃーけんてい · paired t-test2級仮説検定
同一個体・同一ペアで観測した 2 値の差について 1 標本 t 検定を行う方法。個人差が相殺されるため対応のないものより検出力が高い。
関連する教科書の節を読む →- 母分散の検定ぼぶんさんのけんてい · test for population variance2級仮説検定
正規母集団のもとで、不偏分散を で検定。製造工程のばらつき管理などに使う。正規性の崩れに敏感。
関連する教科書の節を読む →- 一元配置分散分析いちげんはいちぶんさんぶんせき · one-way ANOVA2級分散分析
3 群以上の平均を一度に比較する分散分析。多重比較問題を避けて全体差を判定する。F 統計量で群間平方和と群内平方和の比を取る。
関連する教科書の節を読む →- 二元配置分散分析にげんはいちぶんさんぶんせき · two-way ANOVA2級分散分析
2 つの因子を同時に扱う分散分析。主効果に加えて交互作用 (interaction) を検出できる。繰り返しがあれば交互作用が分離可能。
関連する教科書の節を読む →- 交互作用こうごさよう · interaction2級分散分析
2 元配置以上の分散分析で「ある因子の効果が、別の因子の水準で異なる」現象。プロットの折れ線が平行でないとき交互作用がある。
関連する教科書の節を読む →- Bonferroni 補正ぼんふぇろーにほせい · Bonferroni correction2級多重比較
個の検定で各有意水準を に厳しくし、全体の Type I エラー率(FWER)を抑える方法。簡便だが保守的。
関連する教科書の節を読む →- Tukey の HSDてゅーきーのえいちえすでぃー · Tukey's HSD2級多重比較
ANOVA の事後検定で、全ペア比較を等しい有意水準で行う方法。スチューデント化された範囲分布を使う。Bonferroni より検出力が高い。
- 重回帰分析じゅうかいきぶんせき · multiple regression2級回帰分析
複数の説明変数を持つ線形回帰。各偏回帰係数 は他の変数を固定したときの効果。正規方程式 。
関連する教科書の節を読む →- 偏回帰係数へんかいきけいすう · partial regression coefficient2級回帰分析
重回帰モデルの個別の係数。「他の説明変数を固定したときの の効果」を表す。単純相関とは異なる。
関連する教科書の節を読む →- 自由度調整済み決定係数じゆうどちょうせいずみけっていけいすう · adjusted R-squared2級回帰分析
重回帰で説明変数を増やすと が必ず上がる問題を補正した指標。意味のない変数を増やすと逆に下がる。
関連する教科書の節を読む →- 多重共線性たじゅうきょうせんせい · multicollinearity2級回帰分析
説明変数同士が強く相関している状態。係数の標準誤差が膨張し、個別 t 値が小さくなる。VIF で診断。
関連する教科書の節を読む →- VIFぶいあいえふ · Variance Inflation Factor2級回帰分析
多重共線性の診断指標。 で計算され、5〜10 を超えると要注意。
関連する教科書の節を読む →- Cook の距離くっくのきょり · Cook's distance2級残差診断
個別観測値が回帰係数に与える影響の総合指標。1 を大きく超える観測点はモデルへの影響が強い。
関連する教科書の節を読む →- てこ比てこひ · leverage2級残差診断
説明変数 が他のデータから離れた観測点ほど大きい値を取る指標。 で表す。
関連する教科書の節を読む →- ヘテロスケダスティシティへてろすけだすてぃしてぃ · heteroscedasticity2級残差診断
回帰の残差の分散が一定でない状態(不均一分散)。残差プロットがラッパ型になる。 変換や WLS で対処。
関連する教科書の節を読む →- 工程能力指数こうていのうりょくしすう · Process capability index2級品質管理
規格幅 USL−LSL に対する工程ばらつきの相対指標。。中心ずれを考慮した 、目標値からの逸脱もペナルティ化する を併用する。
関連する教科書の節を読む →- シックスシグマしっくすしぐま · Six Sigma2級品質管理
規格幅が ±6σ に収まる工程能力(、不良率 ≒ 3.4 PPM)を目標とする品質改革手法。モトローラ発、GE が 1990 年代に展開。DMAIC サイクルで運用。
関連する教科書の節を読む →- 管理図かんりず · Control chart2級品質管理
工程の測定値を時系列で記録し、中心線・上下管理限界(±3σ)で異常を検出する図。Shewhart が 1924 年に考案。X̄-R / X̄-s / X-Rs(計量値)、p / np / c / u(計数値)に分かれる。
関連する教科書の節を読む →- OC曲線おーしーきょくせん · Operating Characteristic Curve2級品質管理
抜取検査計画における『ロット不良率 p』と『合格確率 L(p)』の関係を表す曲線。AQL(生産者リスク α=5% 以下)と LTPD(消費者リスク β=10% 以下)で計画の性能を要約する。
関連する教科書の節を読む →- 実験計画法じっけんけいかくほう · Design of Experiments (DOE)2級実験計画法
限られた試行で複数因子の効果を効率よく分離する統計手法。Fisher の 3 原則(反復・無作為化・局所管理)を出発点に、一元配置・二元配置・直交表・田口メソッドに発展。
関連する教科書の節を読む →- 直交表ちょっこうひょう · Orthogonal array2級実験計画法
行 列で、任意の 2 列の水準組合せが同回数現れる表。 などが代表的。少ない試行で多因子の主効果を独立に推定できる。
関連する教科書の節を読む →- 交互作用こうごさよう · Interaction effect2級実験計画法
因子の組合せが主効果の単純合算で説明できない現象。二元配置 ANOVA で として検定する。交互作用を見落とすと因子の真の効果を取り違える。
関連する教科書の節を読む →- 田口メソッドたぐちめそっど · Taguchi Method2級実験計画法
田口玄一が体系化した品質工学。誤差因子のもとで応答が安定する制御因子の組合せを SN 比 の最大化で探す『ロバスト設計』。直交表が主道具。
関連する教科書の節を読む →- 信頼性関数しんらいせいかんすう · Reliability function2級信頼性工学
時刻 までに故障しない確率 。故障率 から と一意に決まる。生存解析の生存関数と同概念。
関連する教科書の節を読む →- バスタブ曲線ばすたぶきょくせん · Bathtub curve2級信頼性工学
故障率 の典型的な時間変化。初期故障期(減少)→ 偶発故障期(一定)→ 摩耗故障期(増加)の 3 段階。バーンインで初期故障を、予防保守で摩耗故障を制御する。
関連する教科書の節を読む →- ワイブル分布わいぶるぶんぷ · Weibull distribution2級信頼性工学
形状 と尺度 をもつ寿命分布。。 で初期故障、 で指数分布(偶発故障)、 で摩耗故障 ─ バスタブ曲線の各段階を 1 つの族で表せる。
関連する教科書の節を読む →- MTBFえむてぃーびーえふ · Mean Time Between Failures2級信頼性工学
修理可能系の平均故障間隔(MTTF + MTTR)。 で可用性を計算。SLA でファイブナイン(99.999% = 年 5 分以下停止)の根拠数字。
関連する教科書の節を読む →- FMEAえふえむいーえー · Failure Mode and Effects Analysis2級信頼性工学
部品の故障モードを発生度・影響度・検知容易性で評価し、リスク優先数 RPN = O × S × D を算出するボトムアップの予防分析。FT が結果から原因を辿るのに対し、FMEA は原因から影響を予測。
関連する教科書の節を読む →- FT法えふてぃーほう · Fault Tree Analysis2級信頼性工学
頂上事象(望まない結果)から AND/OR 論理ゲートで原因を分解するトップダウン安全分析手法。基本事象に確率を付与して頂上事象の発生確率を計算。航空・原発・医療機器の業界標準。
関連する教科書の節を読む →- 固有値こゆうち · Eigenvalue2級線形代数
正方行列 について ()を満たすスカラー 。特性方程式 の解。トレース = 固有値の和、行列式 = 固有値の積。
関連する教科書の節を読む →- 固有ベクトルこゆうべくとる · Eigenvector2級線形代数
を満たす非ゼロベクトル 。 をかけても **方向が変わらない** 特別な向き。対称行列では互いに直交する固有ベクトルが選べる。
関連する教科書の節を読む →- 対角化たいかくか · Diagonalization2級線形代数
正方行列を の形に分解(P は固有ベクトル行列、Λ は固有値の対角行列)。 より行列のべき乗が容易になる。
関連する教科書の節を読む →- CASMフレームワークきゃすむふれーむわーく · Cognitive Aspects of Survey Methodology2級調査統計
回答者の認知過程を 4 段階(質問の理解 → 関連情報の検索 → 判断の形成 → 回答の表出)で整理した枠組み。Tourangeau らが提唱。各段階で起こる誤差を予測して調査票を設計する。
関連する教科書の節を読む →- 非標本誤差ひひょうほんごさ · Non-sampling error2級調査統計
標本誤差以外の誤差全般。カバレッジ誤差(フレーム不備)・無回答誤差・測定誤差・処理誤差の 4 種類が主軸。標本サイズを増やしても減らないので、ビッグデータでも残る。
関連する教科書の節を読む →- カバレッジ誤差かばれっじごさ · Coverage error2級調査統計
標本フレーム(調査台帳)が母集団を正しく反映していない誤差。1936 年米大統領選 Literary Digest 誌の予測失敗が古典的事例。Web 調査・固定電話 RDD でも常に問題になる。
関連する教科書の節を読む →- 社会的望ましさバイアスしゃかいてきのぞましさばいあす · Social desirability bias2級調査統計
回答者が社会通念上『望ましい』方向に回答を歪めるバイアス。飲酒量・運動量・収入・学歴・違反行為などで顕著。匿名性の確保や間接質問法で軽減。
関連する教科書の節を読む →- 事後層化じごそうか · Post-stratification2級調査統計
取得した標本を年齢×性別等で集計し、母集団の構成比に合わせる重み付け。Web 調査・任意参加調査の偏り矯正に使う標準手法。レイキング(複数変数同時調整)に拡張可能。
関連する教科書の節を読む →- Lasso回帰らっそかいき · Lasso regression2級機械学習
L1 正則化付き線形回帰: 。係数を完全に 0 にする効果があり、**特徴選択** に使える。多重共線性下での不安定さは ElasticNet で緩和。
関連する教科書の節を読む →- Ridge回帰りっじかいき · Ridge regression2級機械学習
L2 正則化付き線形回帰: 。係数を縮小して多重共線性に強い。すべての特徴を残すので解釈はしやすいが、不要特徴の除去はしない。
関連する教科書の節を読む →- 勾配ブースティングこうばいぶーすてぃんぐ · Gradient Boosting2級機械学習
弱学習器(決定木)を順次に学習し、前段の残差を次の木が予測するアンサンブル手法。XGBoost・LightGBM・CatBoost が現代の表形式データ予測のデファクト標準。
関連する教科書の節を読む →- ランダムフォレストらんだむふぉれすと · Random Forest2級機械学習
多数の決定木をブートストラップサンプル + 特徴量サンプリングで作り、平均/多数決で予測する **バギング** 系のアンサンブル。過学習に頑健で実務の最初の選択肢。
関連する教科書の節を読む →- サポートベクターマシンさぽーとべくたーましん · Support Vector Machine (SVM)2級機械学習
クラス境界からのマージン(最近距離)を最大化する分類器。**カーネルトリック** で非線形分離に拡張(RBF カーネルが標準)。少データ・高次元で安定。
関連する教科書の節を読む →- ロジスティック回帰ろじすてぃっくかいき · Logistic regression2級機械学習
の線形分類器。確率出力・係数解釈性・高速。実務のベースラインで最頻出。交差エントロピー損失で学習。
関連する教科書の節を読む →- k-meansクラスタリングけーみーんずくらすたりんぐ · k-means clustering2級機械学習
クラスタ数 を事前決定し、各点を最寄りの重心に割り当て + 重心更新を反復する教師なし学習。 決定にエルボー法・シルエットスコアを使う。初期化感度を **k-means++** で軽減。
関連する教科書の節を読む →- DBSCANでぃーびーすきゃん · DBSCAN2級機械学習
Density-Based Spatial Clustering of Applications with Noise。密度ベースで 不要・任意形状のクラスタ発見・外れ値自動検出が利点。`eps`・`min_samples` がハイパラ。
関連する教科書の節を読む →- t-SNEてぃーすにー · t-Distributed Stochastic Neighbor Embedding2級機械学習
高次元データの局所近傍関係を低次元(通常 2 次元)で保つ非線形次元削減手法。可視化に強いが大域構造は壊れがち。Word Embedding 可視化の定番。後継 UMAP は大域構造もより保つ。
関連する教科書の節を読む →- 協調フィルタリングきょうちょうふぃるたりんぐ · Collaborative Filtering2級機械学習
ユーザー × アイテムの評価行列から、似たユーザー / 似たアイテムを使って好みを予測する推薦手法。**行列分解(SVD・ALS)** が中核数学。Netflix Prize 優勝モデルの基盤。
関連する教科書の節を読む →- Welchのt検定うぇるちのてぃーけんてい · Welch's t-test2級仮説検定
等分散を仮定しない 2 標本 t 検定。Excel の T.TEST 関数で `検定の種類=3`、または分析ツール『等分散を仮定しない 2 標本検定』で実行。実務での 2 群比較の標準。
関連する教科書の節を読む →- 対応のあるt検定たいおうのあるてぃーけんてい · Paired t-test2級仮説検定
同じ被験者の前後比較で平均差を検定。被験者間のばらつきを相殺できるため検出力が高い。Excel の T.TEST で `検定の種類=1`。投薬前後・施策前後・テスト前後で頻用。
関連する教科書の節を読む →- 多重比較たじゅうひかく · Multiple comparisons2級仮説検定
3 群以上の検定で、各ペア検定を繰り返すと第一種の誤りが増殖する問題。**Bonferroni 補正**(α/m)・**Tukey の HSD**・**Dunnett 検定** で全体の α を制御するのが定石。
関連する教科書の節を読む →- Cramér's Vくらめーるぶい · Cramér's V2級分割表分析
で 0〜1 の標準化された関連の強さ指標。p 値とセットで報告し、 で弱、 で中、 で強の目安。
関連する教科書の節を読む →- Fisherの正確検定ふぃっしゃーのせいかくけんてい · Fisher's exact test2級分割表分析
分割表の独立性を超幾何分布で厳密計算する検定。期待度数 < 5 の小標本でカイ二乗近似が破綻する場面で使う。R: `fisher.test()`、Python: `scipy.stats.fisher_exact()`。
関連する教科書の節を読む →- オッズ比おっずひ · Odds Ratio (OR)2級分割表分析
表で 。ケースコントロール研究で頻用。 が近似的に正規分布で、SE = 。希少疾患では 。
関連する教科書の節を読む →- マンテル-ヘンツェル法まんてる-へんつぇるほう · Mantel-Haenszel method2級分割表分析
層別された複数の 表を統合して合同オッズ比を算出する古典的手法。。シンプソンのパラドックスを回避。
関連する教科書の節を読む →- ロジット関数ろじっとかんすう · Logit function2級ロジスティック回帰
。確率 を にマッピング。逆関数がシグモイド 。ロジスティック回帰の中核。
関連する教科書の節を読む →- Hosmer-Lemeshow検定ほすまー-れめしょうけんてい · Hosmer-Lemeshow test2級ロジスティック回帰
ロジスティック回帰の適合度を見る検定。予測確率を 10 分位に分け、観測 vs 期待のカイ二乗統計量で評価。p > 0.05 で『適合してる』(逆向きの仮説検定)。
関連する教科書の節を読む →- GDPRじーでぃーぴーあーる · General Data Protection Regulation2級プライバシー
EU の一般データ保護規則(2018 施行)。EU 域内の個人データ処理に適用、忘れられる権利・データポータビリティ・DPO 選任義務など。違反は最大 2,000 万ユーロまたは全世界売上の 4%。
関連する教科書の節を読む →- EU AI Actいーゆーえーあいあくと · EU AI Act2級AIガバナンス
世界初の包括的 AI 規制(2024 施行)。リスクレベル別(禁止 / ハイリスク / 限定リスク / 最小リスク)に要求事項。違反は最大全世界売上の 7%。EU 域外企業も EU 個人を対象なら適用対象。
関連する教科書の節を読む →- SHAPしゃっぷ · SHapley Additive exPlanations2級AI公平性
ゲーム理論のシャプレイ値で機械学習モデルの予測を説明する手法。Local + Global 両対応で、XGBoost / LightGBM 等で標準的に使われる。XAI(説明可能 AI)の現代の代表手法。
関連する教科書の節を読む →- Model Cardもでるかーど · Model Card2級AIガバナンス
機械学習モデルの仕様書(Mitchell et al. 2019)。学習データ・性能指標・想定用途・既知の制限・公平性評価を記載。Hugging Face Hub で標準化。AI ガバナンスの基本ドキュメント。
関連する教科書の節を読む →
準1級レベルの用語 (137)
- ポアソン分布ぽあそんぶんぷ · Poisson distribution準1級分布
単位時間あたり平均 回起こる稀な事象の発生回数の分布。。
関連する教科書の節を読む →- 指数分布しすうぶんぷ · exponential distribution準1級分布
ポアソン過程の事象間隔(待ち時間)の分布。。無記憶性をもつ。
関連する教科書の節を読む →- 多変量正規分布たへんりょうせいきぶんぷ · multivariate normal準1級分布
正規分布の多次元版 。線形変換も周辺分布も条件付き分布も正規。
関連する教科書の節を読む →- ベイズの定理べいずのていり · Bayes' theorem準1級ベイズ
事後分布 尤度 事前分布。データを見て信念を更新する公式。
関連する教科書の節を読む →- 事後分布じごぶんぷ · posterior distribution準1級ベイズ
データを観測した後の母数 の分布。点推定や信用区間の出発点。
関連する教科書の節を読む →- 共役分布きょうやくぶんぷ · conjugate prior準1級ベイズ
事前分布と尤度の組み合わせで、事後分布が同じ族の分布に閉じる関係。例: ベータ-二項。
関連する教科書の節を読む →- 重回帰分析じゅうかいきぶんせき · multiple regression準1級回帰
複数の説明変数を持つ線形回帰モデル。。
関連する教科書の節を読む →- ロジスティック回帰ろじすてぃっくかいき · logistic regression準1級回帰
二値応答変数(成功/失敗)を扱う GLM。オッズの対数 をモデル化する。係数 は「説明変数が 1 単位増えたときオッズが 倍になる」と解釈できる。マーケティング・医療で頻出。
関連する教科書の節を読む →- 主成分分析しゅせいぶんぶんせき · PCA (principal component analysis)準1級多変量
分散共分散行列の固有ベクトル方向に射影することで、多変量データを低次元に圧縮する手法。
関連する教科書の節を読む →- AR モデルえーあーるもでる · autoregressive model準1級時系列
。過去の値で現在を予測する時系列モデル。
関連する教科書の節を読む →- ARIMAありま · ARIMA (autoregressive integrated moving average)準1級時系列
差分を取って定常化した後 ARMA でモデル化する非定常時系列の標準モデル。。
関連する教科書の節を読む →- ベイズ推定べいずすいてい · Bayesian estimation準1級ベイズ
事前分布とデータから事後分布 を求め、その分布(または期待値・MAP)で推定する方法。
関連する教科書の節を読む →- 事前分布じぜんぶんぷ · prior distribution準1級ベイズ
データを観察する前に持つパラメータ への信念を表す確率分布 。共役分布や無情報事前分布が代表的。
関連する教科書の節を読む →- 偏相関係数へんそうかんけいすう · partial correlation準1級多変量
他の変数の影響を統制(線形回帰で除去)した上での 2 変数の相関。見かけの相関と本当の関係を区別するのに使う。
関連する教科書の節を読む →- 因子分析いんしぶんせき · factor analysis準1級多変量
観測変数の背後に潜む少数の共通因子を抽出する手法。心理測定や品質工学で広く使われる。主成分分析と目的が異なる。
関連する教科書の節を読む →- クラスター分析くらすたーぶんせき · cluster analysis準1級多変量
似たデータをグループ化する教師なし手法。階層的クラスタリング(ウォード法など)と非階層型(k-means)がある。
関連する教科書の節を読む →- 一般化線形モデルいっぱんかせんけいもでる · generalized linear model (GLM)準1級回帰
線形予測子 をリンク関数で結ぶ、線形回帰の一般化。正規・二項・ポアソンなど指数型分布族を扱える。
関連する教科書の節を読む →- リンク関数りんくかんすう · link function準1級回帰
GLM で目的変数の期待値 と線形予測子 を結ぶ関数 。ロジット・対数・恒等など。
関連する教科書の節を読む →- 生存時間解析せいぞんじかんかいせき · survival analysis準1級応用
イベント発生までの時間を、打ち切り(まだ起きていないデータ)を考慮して扱う手法。カプラン・マイヤー・Cox 比例ハザードが代表。
関連する教科書の節を読む →- ハザード関数はざーどかんすう · hazard function準1級応用
時刻 まで生存していた条件のもとで、その瞬間にイベントが起こる「率」。。
関連する教科書の節を読む →- ホワイトノイズほわいとのいず · white noise準1級時系列
平均 0・分散一定で、時刻間に相関がない時系列。予測モデルの「予測できない残差」が満たすべき性質。
関連する教科書の節を読む →- 季節調整きせつちょうせい · seasonal adjustment準1級時系列
時系列から季節パターンを取り除く処理。経済統計(GDP・小売販売額など)では原系列と季節調整値が併記される。
関連する教科書の節を読む →- 教師あり学習きょうしありがくしゅう · supervised learning準1級機械学習
正解ラベル付きのデータから入出力の関係を学習する枠組み。分類(離散ラベル)と回帰(連続値)に分かれる。
関連する教科書の節を読む →- 教師なし学習きょうしなしがくしゅう · unsupervised learning準1級機械学習
ラベルなしデータから構造(クラスター・低次元表現)を発見する枠組み。k-means・主成分分析・自己符号化器など。
関連する教科書の節を読む →- 強化学習きょうかがくしゅう · reinforcement learning準1級機械学習
エージェントが環境と相互作用し、報酬を最大化する行動方策を試行錯誤で学ぶ枠組み。AlphaGo・自動運転などで成功。
関連する教科書の節を読む →- 過学習かがくしゅう · overfitting準1級機械学習
訓練データに合わせ込みすぎ、未知データへの汎化性能が低下する現象。モデル複雑度に対しデータが少ないと起きやすい。
関連する教科書の節を読む →- 正則化せいそくか · regularization準1級機械学習
損失関数に係数の大きさへの罰則を加え過学習を抑える手法。L1(ラッソ・スパース化)と L2(リッジ・縮小)が代表的。
関連する教科書の節を読む →- 交差検証こうさけんしょう · cross validation準1級機械学習
データを K 分割し、各部分をテスト用に回しながら平均性能を評価する手法。少データでの汎化性能評価の標準手法。
関連する教科書の節を読む →- 混同行列こんどうぎょうれつ · confusion matrix準1級評価指標
分類予測を「真陽性・偽陽性・偽陰性・真陰性」の 4 マスにまとめた表。各種評価指標の出発点。
関連する教科書の節を読む →- 適合率と再現率てきごうりつとさいげんりつ · precision and recall準1級評価指標
適合率 = TP/(TP+FP)(陽性予測のうち本当に陽性)、再現率 = TP/(TP+FN)(本当の陽性のうち拾えた割合)。両者の調和平均が F1。
関連する教科書の節を読む →- ROC 曲線あーるおーしーきょくせん · ROC curve準1級評価指標
閾値を動かしたときの「真陽性率(再現率)」と「偽陽性率」をプロットした曲線。曲線下面積 AUC が分類器の総合性能。
関連する教科書の節を読む →- 勾配降下法こうばいこうかほう · gradient descent準1級機械学習
損失関数の勾配方向と逆向きにパラメータを少しずつ更新する最適化法。バッチ・確率的(SGD)・ミニバッチがある。
関連する教科書の節を読む →- ニューラルネットワークにゅーらるねっとわーく · neural network準1級機械学習
線形変換と非線形活性化関数を多層に積んだ関数近似モデル。多層化したものをディープラーニングと呼ぶ。
関連する教科書の節を読む →- Transformerとらんすふぉーまー · Transformer準1級機械学習
自己注意機構(self-attention)を中核とするディープラーニングモデル。BERT・GPT など現代の大規模言語モデルの基盤。
関連する教科書の節を読む →- バイアスとバリアンスばいあすとばりあんす · bias-variance tradeoff準1級機械学習
予測誤差はバイアス²(モデルの単純さの偏り)+ バリアンス(訓練データへの敏感さ)+ ノイズに分解される。両者のトレードオフがモデル選択の核心。
関連する教科書の節を読む →- ガンマ分布がんまぶんぷ · gamma distribution準1級確率分布
形状パラメータ ・尺度 をもつ正値連続分布。 で指数分布、整数 でアーラン分布。待ち時間モデルや事前分布で頻出。
関連する教科書の節を読む →- ベータ分布べーたぶんぷ · beta distribution準1級確率分布
区間 上の連続分布 。二項分布の共役事前分布として、比率のベイズ推定で標準的に使う。
関連する教科書の節を読む →- 対数正規分布たいすうせいきぶんぷ · log-normal distribution準1級確率分布
が正規分布に従う右に裾の長い分布。所得・株価・粒径分布など、乗算的に決まる量によく当てはまる。
関連する教科書の節を読む →- 多項分布たこうぶんぷ · multinomial distribution準1級確率分布
二項分布の多カテゴリ版。 回の試行で 個のカテゴリそれぞれに何回入るかの同時分布。
関連する教科書の節を読む →- マルコフ連鎖まるこふれんさ · Markov chain準1級確率過程
次の状態が「現在の状態だけ」で決まる(過去に依存しない)確率過程。MCMC・状態空間モデルの基礎。
関連する教科書の節を読む →- 移動平均いどうへいきん · moving average準1級時系列
時系列を直近 期の平均で平滑化する基本手法。トレンド抽出やノイズ除去に使う。MA モデルとは別概念なので注意。
関連する教科書の節を読む →- 指数平滑法しすうへいかつほう · exponential smoothing準1級時系列
直近の値ほど重みを大きくする平滑化(重みが幾何的に減衰)。Holt・Holt–Winters でトレンド・季節性に拡張できる。
関連する教科書の節を読む →- 状態空間モデルじょうたいくうかんもでる · state space model準1級時系列
観測されない状態(state)が時間発展し、それを通じて観測値が得られるという定式化。カルマンフィルタが代表的推定手法。
関連する教科書の節を読む →- 階層ベイズモデルかいそうべいずもでる · hierarchical Bayesian model準1級ベイズ
事前分布のパラメータ自身にさらに分布(超事前分布)を仮定する多層モデル。グループ間で情報を共有し、推定を安定させる。
関連する教科書の節を読む →- ギブスサンプリングぎぶすさんぷりんぐ · Gibbs sampling準1級ベイズ
多次元の事後分布から、各変数を「他の変数を固定した条件付き分布」から順番にサンプルする MCMC 手法。
関連する教科書の節を読む →- メトロポリス・ヘイスティングス法めとろぽりすへいすてぃんぐすほう · Metropolis–Hastings algorithm準1級ベイズ
提案分布から候補を発生させ、確率 で受容することで目標分布からのサンプルを得る MCMC の基本アルゴリズム。
関連する教科書の節を読む →- 多次元尺度法たじげんしゃくどほう · multidimensional scaling (MDS)準1級多変量
対象間の距離(類似度)を保つように、低次元(通常 2 次元)に布置する手法。アンケート分析やブランド地図で使う。
関連する教科書の節を読む →- 決定木けっていぎ · decision tree準1級機械学習
「ある特徴量が閾値以上か」で再帰的にデータを分割していくモデル。解釈しやすいが過学習しやすい。アンサンブルの基礎部品。
関連する教科書の節を読む →- ランダムフォレストらんだむふぉれすと · random forest準1級機械学習
ブートストラップ標本と特徴のランダム選択で多数の決定木を学習し、平均(または多数決)を取る代表的アンサンブル手法。
関連する教科書の節を読む →- 勾配ブースティングこうばいぶーすてぃんぐ · gradient boosting準1級機械学習
弱学習器(浅い木)を残差にフィットさせ、順次足し合わせる手法。XGBoost・LightGBM など実務分類で最も強力なアプローチの一つ。
関連する教科書の節を読む →- サポートベクターマシンさぽーとべくたーましん · support vector machine (SVM)準1級機械学習
クラスを最もマージン広く分離する超平面を求める分類器。カーネルトリックで非線形分類にも拡張できる。
関連する教科書の節を読む →- k 近傍法けーきんぼうほう · k-nearest neighbors (kNN)準1級機械学習
新しい点に最も近い 個の訓練点から多数決(分類)/平均(回帰)で予測する遅延学習。シンプルだが高次元で性能が落ちやすい。
関連する教科書の節を読む →- ナイーブベイズないーぶべいず · naive Bayes準1級機械学習
特徴間の条件付き独立を仮定し、ベイズの定理で事後確率を計算する分類器。テキスト分類で高速かつ強力。
関連する教科書の節を読む →- アンサンブル学習あんさんぶるがくしゅう · ensemble learning準1級機械学習
複数の弱い学習器を組み合わせて性能を上げる枠組み。バギング・ブースティング・スタッキングが三大手法。
関連する教科書の節を読む →- バギングばぎんぐ · bagging準1級機械学習
ブートストラップで作った複数標本で学習器を並列に訓練し、出力を平均/多数決する手法。バリアンスを下げる。ランダムフォレストの基礎。
関連する教科書の節を読む →- ブースティングぶーすてぃんぐ · boosting準1級機械学習
弱学習器を逐次的に学習し、誤りに重みをつけて次に活かす手法。バイアスを下げる。AdaBoost・勾配ブースティングが代表。
関連する教科書の節を読む →- ハイパーパラメータはいぱーぱらめーた · hyperparameter準1級機械学習
学習で最適化されず、事前に設定するパラメータ(学習率・木の深さ・正則化強度など)。グリッド/ランダム/ベイズ最適化で探索する。
関連する教科書の節を読む →- ドロップアウトどろっぷあうと · dropout準1級機械学習
学習時に各ニューロンを確率 でランダムに無効化することで過学習を防ぐ正則化手法。推論時は全ユニットを使い出力をスケール。
関連する教科書の節を読む →- バッチ正規化ばっちせいきか · batch normalization準1級機械学習
ミニバッチごとに中間層の出力を平均 0・分散 1 に正規化してから線形変換する手法。学習の高速化と安定化に大きく寄与する。
関連する教科書の節を読む →- アテンション機構あてんしょんきこう · attention mechanism準1級機械学習
入力のどの部分にどれだけ注目するかを重み付けで動的に決める仕組み。Transformer の中核で、機械翻訳・LLM の性能を飛躍させた。
関連する教科書の節を読む →- 転移学習てんいがくしゅう · transfer learning準1級機械学習
大規模データで学習済みのモデル(例: ImageNet/BERT)を、別タスク用に再利用する枠組み。少データで高性能を得る現代の標準。
関連する教科書の節を読む →- ファインチューニングふぁいんちゅーにんぐ · fine-tuning準1級機械学習
事前学習済みモデルの一部または全パラメータを、目的タスクの少量データで追加学習する手法。LLM の業務カスタマイズで主流。
関連する教科書の節を読む →- 説明可能 AIせつめいかのうえーあい · explainable AI (XAI)準1級AI 倫理
AI モデルの予測根拠を人間が解釈できる形で示す技術や思想。SHAP・LIME・Grad-CAM などが代表。医療・与信などで必須。
関連する教科書の節を読む →- 差分プライバシーさぶんぷらいばしー · differential privacy準1級AI 倫理
個別レコードの有無で出力分布がほぼ変わらないようノイズを加え、個人特定リスクを定量的に保証するプライバシー保護技術。
関連する教科書の節を読む →- AI 倫理えーあいりんり · AI ethics準1級AI 倫理
公平性・透明性・説明責任・プライバシー・安全性など、AI を社会で使う上での原則と実践。各国で AI ガバナンス枠組みが整備中。
関連する教科書の節を読む →- データ拡張でーたかくちょう · data augmentation準1級機械学習
回転・反転・ノイズ付加などで訓練データを人工的に増やす手法。画像・音声で過学習抑制と汎化向上に大きく寄与する。
関連する教科書の節を読む →- ELSIえるしー · ELSI (Ethical, Legal and Social Issues)準1級AI 倫理
新技術がもたらす倫理的・法的・社会的課題の総称。AI / ゲノム / 自動運転などで研究開発と並行して検討される。
関連する教科書の節を読む →- テンソルてんそる · tensor準1級DL 数学
多次元配列。0 階=スカラー、1 階=ベクトル、2 階=行列、3 階以上=テンソル。DL では画像バッチを (N, C, H, W) の 4 階テンソルで扱うのが標準。
関連する教科書の節を読む →- 順伝播じゅんでんぱ · forward propagation準1級DL 基礎
ニューラルネットで、入力から出力に向かって計算を進める過程。各層で線形変換 + 活性化関数を順次適用する。
関連する教科書の節を読む →- 誤差逆伝播法ごさぎゃくでんぱほう · backpropagation準1級DL 基礎
損失関数の勾配を、出力層から入力層に向かって連鎖律で逐次的に計算するアルゴリズム。DL の学習を支える中核技術。
関連する教科書の節を読む →- ReLUれる · ReLU (Rectified Linear Unit)準1級DL 基礎
活性化関数 。負の領域で勾配 0、正の領域で勾配 1。DL で勾配消失を緩和して学習を成功させた立役者。
関連する教科書の節を読む →- Softmaxそふとまっくす · softmax準1級DL 基礎
。多クラス分類の出力層で確率分布に変換。交差エントロピー損失と組合せて使う。
関連する教科書の節を読む →- 勾配消失問題こうばいしょうしつもんだい · vanishing gradient problem準1級DL 基礎
深いネットワークで逆伝播時に勾配が指数的に小さくなり、初期層が学習できなくなる現象。ReLU・残差接続・LSTM ゲートで緩和。
関連する教科書の節を読む →- 残差接続ざんさせつぞく · skip connection / residual connection準1級DL 基礎
。前層の入力を後層に直接足す経路。ResNet で 100 層以上の深層化を実現。
関連する教科書の節を読む →- Adamあだむ · Adam optimizer準1級DL 基礎
Momentum と RMSProp を組合せた最適化アルゴリズム。各パラメータの学習率を適応的に調整。現在 DL の事実上のデフォルト。
関連する教科書の節を読む →- CNNしーえぬえぬ · Convolutional Neural Network準1級DL モデル
畳み込み層 + プーリング層を中心に構成された、画像処理に特化した DL アーキテクチャ。LeNet から ResNet・EfficientNet まで多数の派生。
関連する教科書の節を読む →- プーリングぷーりんぐ · pooling準1級DL モデル
領域ごとに最大値(Max pooling)または平均(Average pooling)を取る操作。ダウンサンプリング + 位置のずれへの頑健性。
関連する教科書の節を読む →- LSTMえるえすてぃーえむ · Long Short-Term Memory準1級DL モデル
RNN の一種。忘却・入力・出力の 3 ゲートを持ち、長期依存を学習可能。機械翻訳・音声認識で長らく主役だった。
関連する教科書の節を読む →- Self-Attentionせるふあてんしょん · self-attention準1級DL モデル
入力系列の各位置が他のすべての位置を参照する仕組み。 で計算。Transformer の中核。
関連する教科書の節を読む →- BERTばーと · BERT準1級DL モデル
Google が 2018 年に発表した Transformer Encoder ベースの事前学習モデル。マスクされた単語の予測(MLM)で学習し、ファインチューニングで様々な NLP タスクに適用。
関連する教科書の節を読む →- GPTじーぴーてぃー · GPT (Generative Pre-trained Transformer)準1級DL モデル
OpenAI が 2018 年から発表している Transformer Decoder ベースの自己回帰生成モデル。次の単語予測で学習し、ChatGPT などの LLM の基盤に。
関連する教科書の節を読む →- VAEぶいえーいー · Variational Autoencoder準1級DL モデル
Encoder-Decoder で潜在変数の分布を学習する生成モデル。再構成誤差 + KL ダイバージェンスを最小化(ELBO 最大化)。
関連する教科書の節を読む →- GANがん · Generative Adversarial Network準1級DL モデル
生成器と識別器を競合させる生成モデル。生成器が偽物を作り、識別器が本物 / 偽物を判定。学習が不安定だが、高品質な生成が可能。
関連する教科書の節を読む →- 拡散モデルかくさんもでる · diffusion model準1級DL モデル
ノイズを段階的に加える順過程の逆を学習する生成モデル。Stable Diffusion・DALL-E 3 など現代の画像生成 AI の中核。
関連する教科書の節を読む →- RLHFあーるえるえいちえふ · Reinforcement Learning from Human Feedback準1級強化学習
人間が比較した嗜好データから報酬モデルを学習し、LLM を強化学習で微調整する手法。ChatGPT・Claude などの『有用で安全な対話エージェント化』の核心技術。
関連する教科書の節を読む →- 知識蒸留ちしきじょうりゅう · knowledge distillation準1級DL 実装
大きい教師モデルの出力(soft target)を学習目標として、小さい生徒モデルを学習させる手法。BERT → DistilBERT が代表例。
関連する教科書の節を読む →- 量子化りょうしか · quantization準1級DL 実装
DL モデルの重み・活性を float32 から int8 などに変換し、サイズ・推論速度を改善する手法。エッジデバイスでの推論に必須。
関連する教科書の節を読む →- デザイン効果でざいんこうか · design effect (deff)準1級標本設計
実際の標本設計の分散を、同じ n の単純無作為抽出と比べた比。deff < 1 で精度向上、deff > 1 で精度低下。クラスター抽出は通常 deff > 1。
関連する教科書の節を読む →- ネイマン配分ねいまんはいぶん · Neyman allocation準1級標本設計
層化抽出で各層の標本サイズを (層サイズ × 層内標準偏差)で決める最適配分法。精度を最大化する。
関連する教科書の節を読む →- 多重代入法たじゅうだいにゅうほう · Multiple Imputation (MI)準1級標本設計
欠測値に対して複数のもっともらしい代入値を作り、各セットで推定 → Rubin's rules で統合する手法。代入の不確実性も含めて分散を計算できる。
関連する教科書の節を読む →- 誤差逆伝播ごさぎゃくでんぱ · Backpropagation準1級ディープラーニング
ニューラルネットの勾配を出力層から入力層へ連鎖律で計算する手法。深層学習の学習を実用化した。
- 活性化関数かっせいかかんすう · Activation Function準1級ディープラーニング
ニューロンの出力を非線形に変換する関数。ReLU・Sigmoid・Tanh・GELU などが使われる。
- 畳み込みニューラルネットたたみこみにゅーらるねっと · CNN準1級ディープラーニング
画像処理に特化した NN。畳み込み層で局所特徴を抽出し、プーリング層でダウンサンプリングする。
- Embeddingえんべでぃんぐ · Embedding準1級ディープラーニング
離散的なトークン(単語など)を密ベクトルに変換する表現。Word2Vec・BERT 埋め込みなど。
- サポートベクトルマシンさぽーとべくとるましん · SVM準1級機械学習
クラス間のマージンを最大化する分類器。カーネル法で非線形分離も可能。
- k-means法けーみーんずほう · k-means Clustering準1級機械学習
データを k 個のクラスタに分割する代表的な教師なし学習。重心とデータ点の距離を最小化。
- 次元削減じげんさくげん · Dimensionality Reduction準1級機械学習
高次元データの本質的な構造を低次元で表現する手法群。PCA・t-SNE・UMAP が代表的。
- Kaggleかぐる · Kaggle準1級実装
世界最大の機械学習コンペプラットフォーム。実データでスキル研鑽・ポートフォリオ作成ができる。
- Granger 因果性ぐれんじゃーいんがせい · Granger causality準1級時系列
の過去が の予測に役立つ、という意味の因果性 (Granger 1969)。VAR モデルで F 検定する。厳密な因果ではない点に注意。
関連する教科書の節を読む →- 中断時系列分析ちゅうだんじけいれつぶんせき · Interrupted Time Series準1級時系列
介入時点の前後でレベル変化(切片)とトレンド変化(傾き)を回帰で推定する古典的手法。公衆衛生介入の評価で広く使われる。
関連する教科書の節を読む →- 判別分析はんべつぶんせき · discriminant analysis準1級多変量解析
複数の変数からカテゴリを判別するための古典的多変量手法。Fisher の線形判別(LDA)、二次判別(QDA)が代表。教師あり分類の前身。
- クラスター分析くらすたーぶんせき · cluster analysis準1級多変量解析
ラベルなしデータをグループ化する教師なし手法。階層的クラスタリング(ウォード法・最遠隣法)、k-means、DBSCAN などが代表。
- 因子分析いんしぶんせき · factor analysis準1級多変量解析
観測変数の背後にある潜在因子を推定する手法。心理学・マーケティング(顧客満足要因)で広く使用。PCA とは目的が異なる。
- 主成分分析しゅせいぶんぶんせき · principal component analysis準1級多変量解析
多変量データの分散を最大化する直交軸を順に取り、低次元表現に圧縮する手法。固有値分解または SVD で計算。
関連する教科書の節を読む →- Wardの方法うぉーどのほうほう · Ward's method準1級多変量解析
階層的クラスタリングの 1 つ。クラスター間距離をクラスター内分散の増加量で定義。コンパクトな球状クラスターを作りやすい。
- k-means クラスタリングけーみーんずくらすたりんぐ · k-means clustering準1級多変量解析
個のクラスター中心を反復更新で求める非階層クラスタリング。最も広く使われる。 の決定にはエルボー法・シルエット分析を用いる。
- シルエット係数しるえっとけいすう · silhouette coefficient準1級多変量解析
クラスタリングの良さを測る指標。各点が自クラスター内でまとまり、他クラスターから離れているほど 1 に近い。-1 〜 1 の範囲。
- エルボー法えるぼーほう · elbow method準1級多変量解析
k-means の最適クラスター数決定法の 1 つ。SSE(クラスター内二乗和)を の関数としてプロットし、減少が緩やかになる『肘』の位置を に選ぶ。
- 工程能力指数こうていのうりょくしすう · process capability index (Cp, Cpk)準1級品質工学
で工程のばらつきが規格内に収まる能力を測る。 は中心ずれも考慮。Cp ≥ 1.33 で十分。
- 管理図かんりず · control chart準1級品質工学
工程の中心値とばらつきを時系列で監視する図。-R 管理図、 管理図、 管理図などがある。3σ 管理限界が標準。
- OC 曲線おーしーきょくせん · Operating Characteristic curve準1級品質工学
サンプリング検査で『ロット不良率 が与えられたときに合格となる確率』を描いた曲線。生産者危険(α)・消費者危険(β)が読み取れる。
- 田口メソッドたぐちめそっど · Taguchi method準1級品質工学
田口玄一の提唱した品質工学。直交配列表 + SN 比で『製品のロバスト性』を最大化する実験計画法。製造業で広く採用。
- SN比えすえぬひ · Signal-to-Noise ratio準1級品質工学
田口メソッドで製品の頑健性を測る指標。望大特性・望小特性・望目特性で式が異なる。値が大きいほどばらつきの影響を受けにくい。
- パレート図ぱれーとず · Pareto chart準1級QC 7 つ道具
QC 7 つ道具の 1 つ。不良要因を頻度順に並べた棒グラフ + 累積比率の折れ線。『2:8 法則』で重要な少数要因を特定する。
- 特性要因図とくせいよういんず · fishbone diagram / Ishikawa diagram準1級QC 7 つ道具
結果に対する要因を 4M(Man, Machine, Material, Method)などで体系化する図。原因分析の出発点として QC で頻用される。
- ハザード関数はざーどかんすう · hazard function準1級生存解析
。時点 まで生存している人が次の瞬間にイベントを起こす瞬時的確率。
- Kaplan-Meier 推定量かぷらん-まいやーすいていりょう · Kaplan-Meier estimator準1級生存解析
右打ち切りデータから生存関数 をノンパラメトリックに推定する手法。階段状の推定曲線で打ち切り例も活用する。
関連する教科書の節を読む →- Cox 比例ハザードモデルこっくすひれいはざーどもでる · Cox proportional hazards model準1級生存解析
。ベースラインハザード を特定せずに係数 を部分尤度で推定するセミパラ手法。
関連する教科書の節を読む →- ログランク検定ろぐらんくけんてい · log-rank test準1級生存解析
2 群以上の生存曲線の差を比較するノンパラ検定。Kaplan-Meier 推定後の標準的検定として臨床試験で広く使用。
- MAP 推定まっぷすいてい · Maximum A Posteriori estimation準1級ベイズ統計
事後分布 を最大化する 。事前分布が一様なら MLE と一致。点推定としてベイズ的に妥当。
- ジェフリーズ事前分布じぇふりーずじぜんぶんぷ · Jeffreys prior準1級ベイズ統計
Fisher 情報量の平方根に比例する不変事前分布。パラメータ変換に対して不変であり『無情報事前』として議論される。
- ベイズファクターべいずふぁくたー · Bayes factor準1級ベイズ統計
2 つのモデル の周辺尤度の比。ベイズ的なモデル比較指標。Kass-Raftery の解釈基準では BF > 100 で『決定的』。
- WAICわいっく · Widely Applicable Information Criterion準1級情報量規準
渡辺澄夫が提唱した情報量規準。AIC・BIC が階層モデルで破綻するケースでも使え、特異モデルや混合分布で安定動作。
- スペクトル分解すぺくとるぶんかい · Spectral decomposition準1級線形代数
対称行列の対角化 ( は直交行列)。固有ベクトルが直交するため と書ける。PCA は共分散行列のスペクトル分解。
関連する教科書の節を読む →- 特異値分解とくいちぶんかい · Singular Value Decomposition (SVD)準1級線形代数
任意の 行列 の分解 。 は直交行列、 は特異値を対角に並べた行列。 は の固有値。低ランク近似・PCA・LoRA の基礎。
関連する教科書の節を読む →- 低ランク近似ていらんくきんじ · Low-rank approximation準1級線形代数
SVD で上位 個の特異値だけ残した行列 。Eckart-Young の定理によりフロベニウスノルム最小の rank- 近似。画像圧縮・推薦・LoRA の基礎。
関連する教科書の節を読む →- 正定値行列せいていちぎょうれつ · Positive definite matrix準1級線形代数
対称行列 で、任意の非ゼロ に対し が成り立つもの。すべての固有値 > 0 と同値。共分散行列の逆行列・SVM の双対問題のカーネル行列など、最適化で重要。
関連する教科書の節を読む →- 二次形式にじけいしき · Quadratic form準1級線形代数
対称行列 とベクトル に対する 。2 次の項だけからなる関数で、正定値・半正定値・不定の分類が固有値の符号で決まる。多変量正規分布の指数部にも現れる。
関連する教科書の節を読む →- 総合的調査誤差そうごうてきちょうさごさ · Total Survey Error (TSE)準1級調査統計
標本誤差 + 非標本誤差を統一的に MSE(平均二乗誤差)で評価する枠組み。Eurostat・米センサス局が推進。予算配分(標本拡大 vs 督促強化 vs 認知インタビュー)を感度分析で決める基盤。
関連する教科書の節を読む →- k-匿名化けーとくめいか · k-anonymity準1級プライバシー
同じ準識別子(年齢・性別・住所など)を持つ個人が常に 人以上存在することを保証する匿名化技法(Sweeney 2002)。再識別攻撃への基本的な防御。l-多様性・t-近接性に発展。
関連する教科書の節を読む →- 公平性指標こうへいせいしひょう · Fairness metrics準1級AI公平性
AI モデルの公平性を測る指標。Demographic Parity・Equal Opportunity・Equalized Odds の 3 軸が代表で、群間で base rate が違う場合 **同時に満たせない**(Chouldechova / Kleinberg の不可能性定理)。
関連する教科書の節を読む →- モランのIもらんのあい · Moran's I準1級空間統計
空間相関を測る統計量。 〜 の範囲で、 なら似た値が空間的に集まる正の相関、 ならチェッカーボード状の負の相関、0 でランダム。R: `spdep::moran.test()`。
関連する教科書の節を読む →- クリギングくりぎんぐ · Kriging準1級空間統計
点参照空間データから未観測地点の値を補間するベスト線形不偏予測量(BLUP)。距離に応じた共分散構造(バリオグラム)を仮定。気象・鉱業・大気汚染で標準的な空間補間法。
関連する教科書の節を読む →- PageRankぺーじらんく · PageRank準1級ネットワーク統計
Google の Web ページ重要度算出アルゴリズム(Brin & Page 1998)。『重要なページからリンクされているページは重要』を再帰的に定義し、遷移行列の最大固有値に対応する固有ベクトルとして計算。
関連する教科書の節を読む →- 媒介中心性ばいかいちゅうしんせい · Betweenness centrality準1級ネットワーク統計
ネットワーク中心性の一つで、他ノード間の最短経路がそのノードを通る割合。情報のハブを特定する指標。。
関連する教科書の節を読む →- スケールフリーネットワークすけーるふりーねっとわーく · Scale-free network準1級ネットワーク統計
次数分布がべき乗則 に従うネットワーク(Barabási-Albert 1999)。少数の超高次数ハブが存在する。Web リンク・引用ネットワーク・SNS・タンパク質間相互作用で観察される。
関連する教科書の節を読む →- ERGMいーあーるじーえむ · Exponential Random Graph Model準1級ネットワーク統計
観測ネットワークが現れる確率を で表す指数族モデル。ネットワーク統計量(エッジ・三角形・homophily 等)を説明変数化、MCMC-MLE で推定。
関連する教科書の節を読む →
1級レベルの用語 (118)
- 指数型分布族しすうがたぶんぷぞく · exponential family1級理論
の形に書ける分布族。十分統計量・最尤推定との相性が抜群。
関連する教科書の節を読む →- 十分統計量じゅうぶんとうけいりょう · sufficient statistic1級理論
「 さえあれば、 の細部はもう について情報を持たない」という統計量。フィッシャー・ネイマンの分解定理で判定。
関連する教科書の節を読む →- 最尤推定さいゆうすいてい · maximum likelihood estimation (MLE)1級推定
尤度関数 を最大化するパラメータを推定値とする方法。一致性・漸近正規性・漸近有効性をもつ。
関連する教科書の節を読む →- フィッシャー情報量ふぃっしゃーじょうほうりょう · Fisher information1級理論
。データが について持つ情報の量。
関連する教科書の節を読む →- クラメル・ラオの下限くらめる・らおのかげん · Cramér–Rao lower bound1級理論
正則条件下で不偏推定量の分散の下限 。MLE は漸近的にこれを達成する。
関連する教科書の節を読む →- デルタ法でるたほう · delta method1級漸近理論
から を導く道具。
関連する教科書の節を読む →- ネイマン・ピアソン補題ねいまん・ぴあそんほだい · Neyman–Pearson lemma1級検定理論
単純仮説どうしの検定において、有意水準 のもとでの最強力検定が尤度比検定であることを保証する定理。
関連する教科書の節を読む →- 尤度比検定ゆうどひけんてい · likelihood ratio test1級検定理論
を使った検定。 が漸近的にカイ二乗分布に従う(ウィルクスの定理)。
関連する教科書の節を読む →- EM アルゴリズムいーえむあるごりずむ · EM (expectation-maximization)1級計算統計
潜在変数モデルでの最尤推定を、E ステップと M ステップを繰り返して反復的に解く方法。GMM・HMM などに使う。
関連する教科書の節を読む →- MCMCえむしーえむしー · Markov chain Monte Carlo1級計算統計
目標分布に収束するマルコフ連鎖を構成して、その軌跡をサンプルとして使うベイズ推論の主役手法。MH 法・ギブス法など。
関連する教科書の節を読む →- ブートストラップぶーとすとらっぷ · bootstrap1級計算統計
観測標本から復元抽出で擬似標本を多数作り、推定量の分布や標準誤差を近似する汎用的な手法。
関連する教科書の節を読む →- 一致推定量いっちすいていりょう · consistent estimator1級推定理論
標本サイズ で母数に確率収束する推定量。最尤推定量は通常の正則条件下で一致性を持つ。
関連する教科書の節を読む →- 漸近正規性ぜんきんせいきせい · asymptotic normality1級推定理論
が で正規分布に分布収束する性質。最尤推定量は正則条件下でこれを満たす。
関連する教科書の節を読む →- スコア関数すこあかんすう · score function1級推定理論
対数尤度のパラメータ偏微分 。期待値 0 で、その分散がフィッシャー情報量。
関連する教科書の節を読む →- ベイズ因子べいずいんし · Bayes factor1級ベイズ
2 つのモデル の周辺尤度の比 。ベイズ流のモデル比較・仮説検定の基本量。
関連する教科書の節を読む →- ジェフリーズ事前分布じぇふりーずじぜんぶんぷ · Jeffreys prior1級ベイズ
フィッシャー情報量の平方根に比例する事前分布 。再パラメータ化で不変な無情報事前分布。
関連する教科書の節を読む →- 完備十分統計量かんびじゅうぶんとうけいりょう · complete sufficient statistic1級推定理論
十分性に加え「期待値が常に 0 ⇒ ほぼ確実に 0」となる(完備性)を満たす統計量。UMVUE 構成の鍵となる概念。
関連する教科書の節を読む →- ラオ・ブラックウェルの定理らおぶらっくうぇるのていり · Rao–Blackwell theorem1級推定理論
推定量を十分統計量で条件付け期待値を取ると、分散が必ず減少する(または不変)という定理。UMVUE 構成の中心ツール。
関連する教科書の節を読む →- M 推定量えむすいていりょう · M-estimator1級推定理論
目的関数 の最小化(または推定方程式の零点)で定義される推定量の総称。最尤・最小二乗・ロバスト推定を含む統一枠組み。
関連する教科書の節を読む →- カーネル密度推定かーねるみつどすいてい · kernel density estimation1級ノンパラ
観測点に滑らかな核(ガウス核など)を載せて足し合わせ、確率密度を推定するノンパラ手法。バンド幅の選択が肝。
関連する教科書の節を読む →- 経験分布関数けいけんぶんぷかんすう · empirical distribution function1級ノンパラ
観測値から作る階段関数 。標本サイズが大きいと真の cdf に一様収束する(グリヴェンコ・カンテリの定理)。
関連する教科書の節を読む →- 特異値分解とくいちぶんかい · singular value decomposition (SVD)1級DL 数学
任意の行列 を に分解。 は直交、 は非負特異値の対角。データ圧縮・PCA の高次元実装・推薦システムなどで使う。
関連する教科書の節を読む →- Horvitz-Thompson 推定量ほーびっつとんぷそんすいていりょう · Horvitz-Thompson estimator1級標本設計
サンプリングウエイト (抽出確率の逆数)を使った母集団総計の不偏推定量 。標本調査の理論的中核。
関連する教科書の節を読む →- Attentionあてんしょん · Attention Mechanism1級ディープラーニング
入力の各位置に対する『注目度』を学習する仕組み。Self-Attention では Q・K・V の内積で計算。
- 事前学習じぜんがくしゅう · Pre-training1級ディープラーニング
大規模な教師なしデータで汎用表現を学習させる段階。BERT・GPT は事前学習 → ファインチューニングの流れ。
- LLMえるえるえむ · Large Language Model1級LLM
数百億〜数兆パラメータの大規模言語モデル。次トークン予測の事前学習で汎用言語能力を獲得。GPT・Claude・Gemini が代表。
- プロンプトエンジニアリングぷろんぷとえんじにありんぐ · Prompt Engineering1級LLM
LLM への指示文(プロンプト)を設計し、出力品質を引き出す技術。Few-shot や Chain-of-Thought が代表的手法。
- RAGらぐ · Retrieval Augmented Generation1級LLM
ユーザー質問に関連する文書を検索 → LLM プロンプトに含めて生成する手法。幻覚抑制と最新情報対応が両立できる。
- ハルシネーションはるしねーしょん · Hallucination1級LLM
LLM が事実と異なる内容を、もっともらしく生成してしまう現象。RAG・温度低下・ファクトチェックで対策。
- Chain-of-Thoughtちぇーんおぶそーと · Chain-of-Thought (CoT)1級LLM
LLM に推論過程を段階的に出させるプロンプト手法。複雑な数学・論理問題で正答率が向上する。
- ベクトル DBべくとるでぃーびー · Vector Database1級LLM
Embedding ベクトルを高速類似検索できる DB。Pinecone・Weaviate・pgvector など。RAG の基盤。
- コンテキストウィンドウこんてきすとうぃんどう · Context Window1級LLM
LLM が一度に処理できる入力 + 出力の最大トークン数。GPT-4 = 128K、Claude 4.7 = 1M など年々拡大。
- MLOpsえむえるおぷす · Machine Learning Operations1級MLOps
ML モデルを本番運用するためのプラクティス群。データ・コード・モデルのバージョニング、CI/CD、監視、再学習が中核。
- Data Driftでーただりふと · Data Drift1級MLOps
本番運用中に入力データ分布が学習時から変化する現象。モデル精度低下の主因。Evidently 等で監視。
- Feature Storeふぃーちゃーすとあ · Feature Store1級MLOps
特徴量を一元管理する基盤。学習と推論で同じ特徴量定義を共有でき、リーク防止と再利用に寄与。
- MLflowえむえるふろー · MLflow1級MLOps
実験追跡・モデルレジストリ・サービングを統合した OSS。Tracking UI でハイパラと評価指標を一覧できる。
- 因果推論いんがすいろん · Causal Inference1級因果推論
観察データから『介入の効果』を推定する統計学。傾向スコア・操作変数・差分の差分・DAG などを駆使。
- 傾向スコアけいこうすこあ · Propensity Score1級因果推論
介入を受ける確率を共変量から推定したスコア。マッチングや IPW で因果効果を推定する基本道具。
- 差分の差分さぶんのさぶん · Difference-in-Differences (DID)1級因果推論
処置の前後 × 処置群と対照群 の 2 軸で差を取り、並行トレンド仮定のもとで因果効果を推定する手法。
- 操作変数法そうさへんすうほう · Instrumental Variable (IV)1級因果推論
処置に影響するが結果には直接影響しない変数を用いて、内生性のある因果効果を推定する手法。
- DAGだぐ · Directed Acyclic Graph1級因果推論
変数間の因果関係を有向グラフで表現した図。Judea Pearl の do 計算で識別可能性を判定する基盤。
- Stackingすたっきんぐ · Stacking1級機械学習
複数モデルの予測を入力にメタモデルを学習するアンサンブル手法。Kaggle 上位の常套手段。
- Target Encodingたーげっとえんこーでぃんぐ · Target Encoding1級機械学習
カテゴリ変数をそのカテゴリの平均ターゲット値で数値化する手法。リーク対策のため CV 内で計算する必要あり。
- ResNetれずねっと · Residual Network1級コンピュータビジョン
残差接続(skip connection)を導入した CNN。100 層超えの深いネットワークでも勾配消失せず学習可能。
- ViTびてぃー · Vision Transformer1級コンピュータビジョン
画像を 16×16 パッチに分割し、Transformer で処理する画像分類モデル。十分な学習データで CNN を超える。
- ImageNetいめーじねっと · ImageNet1級コンピュータビジョン
1000 クラス・約 120 万枚の画像分類ベンチマーク。CV の事前学習データとして長年デファクト。
- U-Netゆーねっと · U-Net1級コンピュータビジョン
エンコーダ・デコーダ構造 + スキップ接続。医用画像セグメンテーションの標準で、拡散モデルにも応用。
- YOLOよろ · You Only Look Once1級コンピュータビジョン
画像を 1 回処理してバウンディングボックスを出力する物体検出モデル。リアルタイム検出の代表。
- IoUあいおーゆー · Intersection over Union1級コンピュータビジョン
予測と正解のバウンディングボックスの重なり具合。物体検出 ・ セグメンテーションの主要評価指標。
- NMSえぬえむえす · Non-Maximum Suppression1級コンピュータビジョン
物体検出で重複する検出ボックスを除去する後処理。IoU 閾値を使って最高スコアの 1 つだけ残す。
- セグメンテーションせぐめんてーしょん · Segmentation1級コンピュータビジョン
画像をピクセル単位で分類するタスク。Semantic / Instance / Panoptic の 3 種類がある。
- アンカーボックスあんかーぼっくす · Anchor Box1級コンピュータビジョン
物体検出で各位置に予め用意するバウンディングボックスのテンプレート。事前形状を提供して学習を安定化。
- MDPえむでぃーぴー · Markov Decision Process1級強化学習
強化学習の数学的枠組み。(S, A, P, R, γ) で状態 ・ 行動 ・ 遷移 ・ 報酬 ・ 割引率を定義。
- Q-learningきゅーらーにんぐ · Q-learning1級強化学習
状態行動価値 Q(s, a) を学習し、最大 Q を選ぶ方策に従う強化学習アルゴリズム。Bellman 方程式に基づく。
- DQNでぃーきゅーえぬ · Deep Q-Network1級強化学習
Q-learning の Q 関数をニューラルネットで近似 + 経験再生 + ターゲットネットを使った手法。Atari で人を超えた。
- Policy Gradientぽりしーぐらでぃえんと · Policy Gradient1級強化学習
方策 π を直接ニューラルネットでパラメータ化し、勾配上昇で報酬期待値を最大化する手法。
- PPOぴーぴーおー · Proximal Policy Optimization1級強化学習
方策更新を一定範囲(クリップ)に抑える方策勾配法。安定性と性能のバランスが良く、RLHF の標準。
- Actor-Criticあくたーくりてぃっく · Actor-Critic1級強化学習
方策(Actor)と価値関数(Critic)を同時に学習する強化学習の枠組み。A2C ・ A3C ・ SAC が代表例。
- Bellman 方程式べるまんほうていしき · Bellman Equation1級強化学習
現在の価値 = 即時報酬 + 割引した次状態の価値、という再帰的な等式。動的計画法と強化学習の理論的中核。
- 報酬関数ほうしゅうかんすう · Reward Function1級強化学習
強化学習で各 (状態, 行動) に対して報酬を返す関数。設計が学習結果を大きく左右する。
- 割引率わりびきりつ · Discount Factor (γ)1級強化学習
将来の報酬を現在価値に換算する係数(0 ≤ γ < 1)。γ が小さいほど短期志向、大きいほど長期志向。
- 経験再生けいけんさいせい · Experience Replay1級強化学習
過去の経験(s, a, r, s')をバッファに溜め、ランダムにサンプリングして学習する手法。サンプル効率と相関軽減に寄与。
- DDPMでぃーでぃーぴーえむ · Denoising Diffusion Probabilistic Model1級生成 AI
ノイズ予測タスクとして拡散モデルを定式化した代表論文(Ho et al. 2020)。
- Classifier-Free Guidanceくらしふぁーふりーがいだんす · Classifier-Free Guidance1級生成 AI
拡散モデルの条件付き生成で、条件あり/なしの予測を線形結合してガイダンス強度を高める手法。
- CLIPくりっぷ · Contrastive Language-Image Pre-training1級生成 AI
画像とテキストを同じ埋め込み空間に対応付ける OpenAI のモデル。ゼロショット分類や拡散モデルの条件付けに使用。
- AI エージェントえーあいえーじぇんと · AI Agent1級AI エージェント
LLM が外部ツールを自律的に呼んでタスクを完遂する仕組み。ReAct ・ Tool Use ・ Multi-Agent が中心概念。
- ReActりあくと · Reason + Act1級AI エージェント
エージェントの基本パターン。推論(Reason)とツール呼び出し(Act)を交互に行うことで複雑タスクを解く。
- Tool Useつーるゆーす · Tool Use / Function Calling1級AI エージェント
LLM が宣言された外部関数を引数を埋めて呼び出す機能。OpenAI ・ Anthropic API がネイティブ対応。
- Multi-Agentまるちえーじぇんと · Multi-Agent System1級AI エージェント
複数の専門エージェントが協調してタスクを解くアーキテクチャ。プランナー・コーダー・レビュアーなど役割分担。
- ASRえーえすあーる · Automatic Speech Recognition1級音声 AI
音声を文字に変換する技術。OpenAI Whisper が現在の業界標準で、日本語含む多言語対応。
- TTSてぃーてぃーえす · Text-to-Speech1級音声 AI
テキストを自然な音声に変換する技術。XTTS-v2 ・ ElevenLabs ・ OpenAI TTS が主要モデル。
- 合成統制法ごうせいとうせいほう · Synthetic Control Method1級因果推論
複数の対照群を重み付けして処置群とそっくりな「人工対照群」を作り、介入効果を推定する手法 (Abadie & Gardeazabal 2003)。1 ユニット処置に強い。
関連する教科書の節を読む →- Double MLだぶるえむえる · Double Machine Learning1級因果推論
高次元共変量を機械学習で扱いながら因果効果を一致推定する枠組み (Chernozhukov et al. 2018)。直交化(Neyman orthogonality)が鍵。
関連する教科書の節を読む →- Causal Forestこーざるふぉれすと · Causal Forest1級因果推論
ランダムフォレストを「同じ葉に入った観測同士で処置効果を推定」する形に拡張した手法 (Wager & Athey 2018)。共変量ごとの異質処置効果 CATE を推定できる。
関連する教科書の節を読む →- アップリフトモデリングあっぷりふともでりんぐ · uplift modeling1級因果推論
「処置によって行動が変わる人」を特定するモデリング。マーケでは「クーポンを送る価値がある人」を抽出するのに使う。
関連する教科書の節を読む →- CausalImpactこーざるいんぱくと · CausalImpact1級時系列
Google が公開した因果分析ライブラリ。ベイズ構造時系列モデルで反事実を推定し、介入の効果を測る (Brodersen et al. 2015)。
関連する教科書の節を読む →- N-BEATSえぬびーつ · Neural Basis Expansion Analysis for Time Series1級時系列
純粋な MLP ブロックで構成された時系列予測モデル (2020)。M4 コンペで Prophet を上回る精度を出した。
関連する教科書の節を読む →- Temporal Fusion Transformerてんぽーらるふゅーじょんとらんすふぉーまー · Temporal Fusion Transformer (TFT)1級時系列
多変量時系列・カテゴリ・静的共変量を統一的に扱う Transformer ベース予測モデル (2021)。注意機構で重要な時刻を可視化できる。
関連する教科書の節を読む →- 時系列基盤モデルじけいれつきばんもでる · Time Series Foundation Model1級時系列
大規模時系列で事前学習され、Zero-shot 予測ができるモデル。Chronos・TimesFM・Lag-Llama などが 2024 年に登場。
関連する教科書の節を読む →- RAGらぐ · Retrieval-Augmented Generation1級生成 AI
外部知識ベースから関連文書を検索してプロンプトに添付してから LLM に答えさせる手法。ハルシネーション抑制と最新情報の活用に有効。
関連する教科書の節を読む →- Chain-of-Thoughtちぇーんおぶそーと · Chain-of-Thought (CoT)1級生成 AI
「Let's think step by step」のように推論過程を明示させるプロンプティング手法。算数・推論問題で精度が大幅向上 (Wei et al. 2022)。
関連する教科書の節を読む →- ReActりあくと · Reasoning + Acting1級生成 AI
LLM に「考える(推論)」と「行動する(ツール使用)」を交互に行わせるパラダイム。現代の AI エージェントの基本設計。
関連する教科書の節を読む →- QLoRAきゅーろーら · Quantized Low-Rank Adaptation1級生成 AI
4 bit 量子化と LoRA を組み合わせた省メモリファインチューニング手法。消費者向け GPU で大規模モデルを学習可能にする。
関連する教科書の節を読む →- Constitutional AIこんすてぃちゅーしょなるえーあい · Constitutional AI1級AI 倫理
Anthropic が開発した、人間のフィードバックを AI のフィードバック(AI が AI を批判)で代替するアライメント手法。Claude シリーズに実装。
関連する教科書の節を読む →- EU AI 法いーゆーえーあいほう · EU AI Act1級AI 倫理
2024 年採択の世界初の包括的 AI 規制。リスクを 4 段階(許容不可/高/限定/最小)に分類し義務を課す。違反は最大年間売上の 7% の罰金。
関連する教科書の節を読む →- ハルシネーションはるしねーしょん · hallucination1級生成 AI
LLM がもっともらしい嘘を生成する現象。RAG・出典明示・検証 LLM で抑制する。
関連する教科書の節を読む →- プロンプトインジェクションぷろんぷといんじぇくしょん · prompt injection1級AI セキュリティ
悪意あるプロンプトでシステムプロンプトを上書きし、機密漏洩や不正動作を引き起こす攻撃。生成 AI のセキュリティ上の主要リスクの 1 つ。
関連する教科書の節を読む →- MoEえむおーいー · Mixture of Experts1級深層学習
複数の「エキスパート」サブネットワークから条件に応じて少数だけを活性化させる Transformer アーキテクチャ。Mixtral・DeepSeek-V3 などで採用。
- 創発的能力そうはつてきのうりょく · emergent abilities1級深層学習
LLM が一定規模を超えると突然現れる能力(算術・推論・コード生成など)。線形改善ではなく相転移的な現象 (Wei et al. 2022)。
関連する教科書の節を読む →- 著作権法 30 条の 4ちょさくけんほう30じょうの4 · Article 30-4 of Japanese Copyright Act1級AI 法務
著作物に表現された思想・感情の『享受目的でない』利用を許容する規定(2018 年改正)。AI 学習・解析・特徴量抽出が代表例。ただし著作権者の利益を不当に害する場合は除外。
関連する教科書の節を読む →- データドリフトでーたどりふと · data drift / covariate shift1級MLOps
本番運用中に入力 P(X) の分布が学習時から変化する現象。季節要因や顧客属性変化が原因。KS 検定や PSI で検出。
関連する教科書の節を読む →- コンセプトドリフトこんせぷとどりふと · concept drift1級MLOps
入力と出力の関係 P(Y|X) が時間とともに変化する現象。顧客嗜好の変化や不正パターンの進化が代表例。再学習が対策。
関連する教科書の節を読む →- シャドーデプロイしゃどーでぷろい · shadow deployment1級MLOps
新モデルを本番トラフィックに対して並列実行し、本番に影響を与えずに新旧モデルの結果を比較する段階リリース手法。問題なければカナリアリリースに進む。
関連する教科書の節を読む →- PSIぴーえすあい · Population Stability Index1級MLOps
学習データと運用データの分布変化を測る指標。。0.1 以下なら安定、0.25 以上で大きなドリフト。
関連する教科書の節を読む →- InfoNCE 損失いんふぉえぬしーいーそんしつ · InfoNCE loss1級自己教師あり学習
対照学習で使う損失関数。正例ペアと負例ペアのコサイン類似度から、ソフトマックス交差エントロピー型で表現を学習。SimCLR・MoCo・CLIP などの基盤。
関連する教科書の節を読む →- SimCLRしむくりあ · SimCLR1級自己教師あり学習
Chen et al. 2020 の対照学習手法。同じ画像の Augment 版を正例、バッチ内の他画像を負例として、シンプルな枠組みで強力な表現を獲得。バッチサイズが大きいほど強い。
関連する教科書の節を読む →- MAEえむえーいー · Masked Autoencoder1級自己教師あり学習
He et al. 2021。画像の 75% をマスクして残り 25% から再構成する自己教師あり学習。ViT との相性が良く、強い視覚特徴を獲得する。
関連する教科書の節を読む →- DINO / DINOv2でぃーのー · DINO / DINOv21級自己教師あり学習
Caron et al. 2021/2023。自己蒸留型 SSL で、教師なしでセグメンテーション特徴を獲得する。基盤視覚モデルの 1 つ。
関連する教科書の節を読む →- 能動学習のうどうがくしゅう · active learning1級能動学習
ラベル付けが高コストな場面で、最も学習効果の高いサンプルを選んでラベル付与・再学習を繰り返す手法。獲得関数で『情報的な例』を選別する。
関連する教科書の節を読む →- Uncertainty Samplingあんさーてぃんてぃーさんぷりんぐ · uncertainty sampling1級能動学習
能動学習の代表的獲得関数。モデルが予測に最も自信がない(エントロピー高 / 最大確率小 / margin 小)サンプルを優先してラベル付けする。
関連する教科書の節を読む →- BALDばるど · Bayesian Active Learning by Disagreement1級能動学習
ベイズ的な能動学習手法。Dropout や Deep Ensemble でモデルパラメータの不確実性を推定し、予測分散が大きいサンプルを優先する。
- 連合学習れんごうがくしゅう · Federated Learning1級連合学習
データを中央集約せず、各クライアントでローカル学習したモデル更新だけを共有して中央モデルを改善する分散学習。プライバシー保護と規制対応に有用。
関連する教科書の節を読む →- FedAvgふぇどあぶ · Federated Averaging1級連合学習
連合学習の代表的アルゴリズム (McMahan et al. 2017)。各クライアントが数エポック学習した後、サーバがデータ量で重み付け平均でモデルを集約する。
関連する教科書の節を読む →- クロスデバイス連合学習くろすでばいすれんごうがくしゅう · cross-device federated learning1級連合学習
数百万のスマートフォンや IoT デバイスが参加する連合学習形態。各デバイスのデータは小規模、参加が不安定。Google Gboard などが実例。
関連する教科書の節を読む →- クロスサイロ連合学習くろすさいろれんごうがくしゅう · cross-silo federated learning1級連合学習
数〜数十の組織(病院・銀行・メーカー)が参加する連合学習形態。各組織のデータは大規模で参加は安定。医療画像診断・金融不正検知などで実用化。
関連する教科書の節を読む →- FedProxふぇどぷろっくす · FedProx1級連合学習
Non-IID データ問題に対処する連合学習アルゴリズム。各クライアントの局所更新に近接項を加え、グローバルモデルから離れすぎないよう制御する。
- プルーニングぷるーにんぐ · pruning1級モデル軽量化
ニューラルネットの重みのうち重要でないものを 0 にする(または削除する)モデル軽量化手法。非構造化(個別重み)と構造化(チャネル・ヘッド)に大別。
関連する教科書の節を読む →- Lottery Ticket Hypothesisろたりーちけっとかせつ · Lottery Ticket Hypothesis1級モデル軽量化
Frankle & Carbin 2019。大きなネットワーク内には『勝者の宝くじ券』に相当する小さな部分ネットワークが存在し、それを抽出すれば元と同等の性能が出るという仮説。
関連する教科書の節を読む →- 知識蒸留ちしきじょうりゅう · knowledge distillation1級モデル軽量化
Hinton et al. 2015。大きな教師モデルの Soft Target を小さな生徒モデルに学習させる軽量化手法。温度パラメータでソフト化した分布から、クラス間類似度を継承できる。
関連する教科書の節を読む →- DistilBERTでぃすてぃるばーと · DistilBERT1級モデル軽量化
Sanh et al. 2019。BERT-base を蒸留して 40% 軽量・60% 高速化、性能 97% 維持。蒸留の有名な実例。
関連する教科書の節を読む →- PTQぴーてぃーきゅー · Post-Training Quantization1級量子化
学習後のモデルにそのまま量子化を適用する手法。代表: GPTQ・AWQ。安価だが精度低下が出やすい。
関連する教科書の節を読む →- QATきゅーえーてぃー · Quantization-Aware Training1級量子化
学習中に量子化を模倣し『量子化に強い重み』を学習する手法。学習コストは高いが PTQ より精度低下が少ない。
関連する教科書の節を読む →- NF4えぬえふ4 · Normal Float 41級量子化
QLoRA で採用される 4 bit 量子化形式 (Dettmers et al. 2023)。事前学習済み重みが正規分布に近い性質を利用して精度低下を抑制する。
関連する教科書の節を読む →- DPOでぃーぴーおー · Direct Preference Optimization1級ファインチューニング
Rafailov et al. 2023。RLHF の RL ステージを強化学習なしの教師あり学習に置き換える手法。実装が簡単で安定し、2023 年以降急速に普及。
関連する教科書の節を読む →- DoRAどーら · Weight-Decomposed Low-Rank Adaptation1級ファインチューニング
Liu et al. 2024。LoRA を方向と大きさに分解した改良版。LoRA より精度が向上することが報告されている。
- Mambaまんば · Mamba (S6)1級効率的アーキテクチャ
Gu & Dao 2023。Self-Attention の O(n²) を線形時間 O(n) に置き換える状態空間モデル。長系列で Transformer を凌駕する場合がある。
関連する教科書の節を読む →- Flash Attentionふらっしゅあてんしょん · Flash Attention1級効率的アーキテクチャ
Dao et al. 2022。GPU メモリ階層を意識した Attention 実装で、数学的に同一のまま 2〜4 倍高速化。現代の LLM 学習・推論で標準採用。
関連する教科書の節を読む →- MCPえむしーぴー · Model Context Protocol1級AI エージェント
Anthropic 2024。AI モデルと外部ツールの接続を標準化するオープンプロトコル。任意の AI クライアントが任意の MCP サーバを使える、エージェント時代のインフラ。
関連する教科書の節を読む →