統計用語集
統計検定 4級〜1級で登場する重要用語をまとめた辞典です。各用語に短い定義と「関連する教科書の節」へのリンクを付けています。試験前の最終チェックや、学習中に意味を素早く確認したいときにお使いください。全 240 語。
4級レベルの用語
- 平均値へいきんち · mean4級代表値
全データの合計をデータ数で割った値。データの中心位置を表すもっとも基本的な代表値。
関連する教科書の節を読む →- 中央値ちゅうおうち · median4級代表値
データを昇順に並べたとき真ん中にくる値。外れ値の影響を受けにくい代表値。
関連する教科書の節を読む →- 最頻値さいひんち · mode4級代表値
データの中でもっとも多く出現する値。質的データ(カテゴリ)で唯一使える代表値であり、分布の山の位置を表す。複数の値が同じ最大度数なら最頻値は複数となる。
関連する教科書の節を読む →- 範囲はんい · range4級ばらつき
データの最大値から最小値を引いた値。もっとも単純なばらつきの指標。
関連する教科書の節を読む →- 四分位数しぶんいすう · quartile4級ばらつき
データを昇順で 4 等分したときの 3 つの区切り値 。 は中央値。
関連する教科書の節を読む →- 四分位範囲しぶんいはんい · IQR (interquartile range)4級ばらつき
。中央 50% のデータの広がり。外れ値に頑健。
関連する教科書の節を読む →- 箱ひげ図はこひげず · box plot4級可視化
最小値・・中央値・・最大値の五数で分布を要約する図。複数群比較に便利。
関連する教科書の節を読む →- 度数分布表どすうぶんぷひょう · frequency table4級可視化
データを階級に分け、各階級の度数(個数)をまとめた表。ヒストグラムの基礎。
関連する教科書の節を読む →- ヒストグラムひすとぐらむ · histogram4級可視化
度数分布表を棒グラフ化したもの。隣の棒は隙間なく並べ、データの分布形を視覚化する。
関連する教科書の節を読む →- 順列じゅんれつ · permutation4級場合の数
異なる 個から 個を選んで順序付けて並べる方法の総数。。
関連する教科書の節を読む →- 組合せくみあわせ · combination4級場合の数
異なる 個から 個を順序を区別せず選ぶ方法の総数。。
関連する教科書の節を読む →- 余事象よじしょう · complementary event4級確率
事象 が起こらない事象。。「少なくとも〜」型の問題に強い。
関連する教科書の節を読む →- 度数どすう · frequency4級データ整理
ある階級(または値)に属するデータの個数。度数分布表で各階級ごとに数えた件数のこと。
関連する教科書の節を読む →- 相対度数そうたいどすう · relative frequency4級データ整理
各階級の度数を全体の度数で割った値(=割合)。データ規模が違う集団同士の比較に便利。
関連する教科書の節を読む →- 累積度数るいせきどすう · cumulative frequency4級データ整理
ある階級までの度数を順に足し上げた値。「○○以下が何人いるか」が一目でわかる。
関連する教科書の節を読む →- 階級かいきゅう · class interval4級データ整理
度数分布表で連続データを区切る区間(例: 60〜70 点)。階級幅は基本的に揃える。
関連する教科書の節を読む →- 階級値かいきゅうち · class midpoint4級データ整理
各階級の中央の値(=区間の中点)。度数分布表から平均などを計算するときの代表値として使う。
関連する教科書の節を読む →- 散布図さんぷず · scatter plot4級可視化
2 変数を横軸 ・縦軸 に取って点でプロットした図。2 変数の関係(相関)を視覚的に確認できる。
関連する教科書の節を読む →- 棒グラフぼうぐらふ · bar chart4級可視化
カテゴリごとの数量を棒の高さで比べる図。質的データ・離散量に向く。隣接させない(ヒストグラムとは異なる)。
関連する教科書の節を読む →- 折れ線グラフおれせんぐらふ · line chart4級可視化
時系列など順序のあるデータを線でつないだ図。推移・トレンドを示すのに適している。
関連する教科書の節を読む →- 円グラフえんぐらふ · pie chart4級可視化
全体を 100% として各項目の構成比を扇形で示す図。カテゴリが多すぎると見にくい。
関連する教科書の節を読む →- 試行しこう · trial4級確率
結果が偶然に決まる行為(コイン投げ・サイコロを振るなど)。確率の議論の出発点。
関連する教科書の節を読む →- 事象じしょう · event4級確率
試行の結果として起こりうる集合(例: サイコロで偶数の目が出る)。1 個の結果は「根元事象」と呼ぶ。
関連する教科書の節を読む →- 排反事象はいはんじしょう · mutually exclusive events4級確率
同時には起こりえない事象どうし。。確率の加法定理で和の確率がそのまま足し算になる条件。
関連する教科書の節を読む →- 質的データしつてきでーた · qualitative data4級データ整理
性別・血液型・好みなど、数値で大小を比較できないカテゴリのデータ。名義尺度・順序尺度に分類される。
関連する教科書の節を読む →- 量的データりょうてきでーた · quantitative data4級データ整理
身長・売上・気温など、数値で大小や差を比較できるデータ。間隔尺度・比例尺度に分類される。
関連する教科書の節を読む →- 離散変数と連続変数りさんへんすうとれんぞくへんすう · discrete vs. continuous variable4級データ整理
離散変数は人数・回数のような飛び飛びの値、連続変数は身長・時間のように切れ目なく値を取る変数。扱う確率分布が異なる。
関連する教科書の節を読む →- 同様に確からしいどうようにたしからしい · equally likely4級確率
ある試行のすべての根元事象が同じ確率で起こる状態。「サイコロ・コイン・くじ」など古典的確率の前提。
関連する教科書の節を読む →- 樹形図じゅけいず · tree diagram4級場合の数
場合の数や確率を漏れなく数えるために、選択を枝分かれで描いた図。条件付き確率の理解にも有効。
関連する教科書の節を読む →- パーセンタイルぱーせんたいる · percentile4級ばらつき
データを小さい順に並べたとき下から の位置にある値。 パーセンタイルは中央値、 は四分位数。
関連する教科書の節を読む →
3級レベルの用語
- 分散ぶんさん · variance3級ばらつき
偏差の 2 乗の平均。データのばらつきの大きさを表す代表的な指標。。
関連する教科書の節を読む →- 標準偏差ひょうじゅんへんさ · standard deviation3級ばらつき
分散の正の平方根。もとのデータと同じ単位でばらつきを表現できる。
関連する教科書の節を読む →- 共分散きょうぶんさん · covariance3級2変数
。2 変数の連動の方向を示す。
関連する教科書の節を読む →- 相関係数そうかんけいすう · correlation coefficient3級2変数
。 の値で 2 変数の直線関係の強さを表す。
関連する教科書の節を読む →- 標準化ひょうじゅんか · standardization (z-score)3級変換
により、平均 0・標準偏差 1 の物差しに変換する操作。
関連する教科書の節を読む →- 偏差値へんさち · T-score3級変換
z スコアを に変換した値。平均 50・標準偏差 10 の物差し。
関連する教科書の節を読む →- 条件付き確率じょうけんつきかくりつ · conditional probability3級確率
事象 が起こったもとで が起こる確率。。
関連する教科書の節を読む →- 確率変数かくりつへんすう · random variable3級確率
試行結果に応じて値が確率的に決まる変数。離散と連続がある。 で表すのが慣例。
関連する教科書の節を読む →- 期待値きたいち · expectation3級確率
確率変数の「ならした平均値」。離散なら 。
関連する教科書の節を読む →- 二項分布にこうぶんぷ · binomial distribution3級分布
成功確率 のベルヌーイ試行を 回繰り返したときの成功回数 の分布。、。
関連する教科書の節を読む →- 正規分布せいきぶんぷ · normal (Gaussian) distribution3級分布
釣鐘型の連続分布 。中心極限定理により多くの平均量がこれに近づく。
関連する教科書の節を読む →- 信頼区間しんらいくかん · confidence interval3級推定
母集団の未知パラメータが「ある信頼度で」入る区間。例: 。
関連する教科書の節を読む →- 中心極限定理ちゅうしんきょくげんていり · central limit theorem (CLT)3級理論
母集団の分布によらず、 が十分大きいとき標本平均は近似的に正規分布に従う、という定理。
関連する教科書の節を読む →- 母集団ぼしゅうだん · population3級推測統計
調査・推測の対象となる全データ集団。母集団の真の値(母平均・母分散など)を「母数(パラメータ)」と呼ぶ。
関連する教科書の節を読む →- 標本ひょうほん · sample3級推測統計
母集団から抽出された一部のデータ。標本から計算した値(標本平均など)を「統計量」と呼ぶ。
関連する教科書の節を読む →- 全数調査ぜんすうちょうさ · census3級標本抽出
母集団の全要素を調べる調査(国勢調査など)。誤差は小さいがコスト・時間がかかる。
関連する教科書の節を読む →- 標本調査ひょうほんちょうさ · sample survey3級標本抽出
母集団の一部だけを調べて全体を推測する調査。コストが低く、ほとんどの社会調査で採用される。
関連する教科書の節を読む →- 無作為抽出むさくいちゅうしゅつ · random sampling3級標本抽出
母集団のどの要素も同じ確率で標本に選ばれるようにする抽出法。推測統計の前提となる。
関連する教科書の節を読む →- 標準正規分布ひょうじゅんせいきぶんぷ · standard normal distribution3級確率分布
平均 0・分散 1 の正規分布 。任意の正規分布は標準化により標準正規分布に変換できる。
関連する教科書の節を読む →- z 値ぜっとち · z-score3級推測統計
。データを標準化したときの値。「平均から標準偏差いくつ分離れているか」を表す。
関連する教科書の節を読む →- 確率密度関数かくりつみつどかんすう · probability density function (pdf)3級確率分布
連続型確率変数の分布を表す関数 。区間 の確率は 。
関連する教科書の節を読む →- 累積分布関数るいせきぶんぷかんすう · cumulative distribution function (cdf)3級確率分布
。「 以下になる確率」を返す関数。pdf を積分すると得られる。
関連する教科書の節を読む →- 大数の法則たいすうのほうそく · law of large numbers3級推測統計
標本サイズ を大きくするほど、標本平均が母平均に近づく(確率収束する)という法則。推測統計の基盤。
関連する教科書の節を読む →- ベルヌーイ分布べるぬーいぶんぷ · Bernoulli distribution3級確率分布
0 か 1 の値だけを取る最も単純な分布。。 回の独立試行を集めると二項分布になる。
関連する教科書の節を読む →- 復元抽出ふくげんちゅうしゅつ · sampling with replacement3級標本抽出
抽出した要素を毎回母集団に戻してから次を引く方法。各回の試行が独立になり、二項分布などの前提となる。
関連する教科書の節を読む →- 非復元抽出ひふくげんちゅうしゅつ · sampling without replacement3級標本抽出
一度抽出した要素は戻さずに次を引く方法。実際の調査の標準。試行は独立でなく、超幾何分布などで扱う。
関連する教科書の節を読む →- 母平均ぼへいきん · population mean3級推測統計
母集団全体の平均値 。標本平均 は母平均の不偏推定量で、推測統計の中心的な対象。
関連する教科書の節を読む →- 母分散ぼぶんさん · population variance3級推測統計
母集団全体の分散 。標本分散より不偏分散( で割る)の方が母分散の不偏推定量となる。
関連する教科書の節を読む →- 母比率ぼひりつ · population proportion3級推測統計
母集団における特定属性を持つ要素の割合 。世論調査や品質管理で「賛成率」「不良率」として推定対象になる。
関連する教科書の節を読む →- 標本比率ひょうほんひりつ · sample proportion3級推測統計
標本のうち特定属性を持つ要素の割合 。大標本では に近づく(中心極限定理)。
関連する教科書の節を読む →- 期待値の線形性きたいちのせんけいせい · linearity of expectation3級確率
が独立性に関係なく常に成り立つ性質。確率論で最も使われる便利な道具。
関連する教科書の節を読む →- 同時分布どうじぶんぷ · joint distribution3級確率
複数の確率変数 が同時に取る値の確率分布。同時分布から各変数の周辺分布や条件付き分布が得られる。
関連する教科書の節を読む →- 周辺分布しゅうへんぶんぷ · marginal distribution3級確率
同時分布から他の変数を確率の足し合わせ(積分)で消去して得られる、1 つの変数の単独分布。
関連する教科書の節を読む →- 二項定理にこうていり · binomial theorem3級場合の数
。二項分布の確率関数の正体でもある重要な展開公式。
関連する教科書の節を読む →
2級レベルの用語
- 不偏分散ふへんぶんさん · unbiased sample variance2級推定
。母分散 の不偏推定量。
関連する教科書の節を読む →- 標準誤差ひょうじゅんごさ · standard error (SE)2級推定
推定量のばらつきの大きさ。標本平均なら 。 を増やすと縮む。
関連する教科書の節を読む →- 自由度じゆうど · degrees of freedom2級推定
推定で「自由に動ける情報の数」。不偏分散の自由度は 、回帰の残差は など。
関連する教科書の節を読む →- t 分布てぃーぶんぷ · Student's t-distribution2級分布
標準正規より裾が厚い釣鐘型分布。母分散未知での母平均の推定・検定に使う。自由度を持つ。
関連する教科書の節を読む →- 帰無仮説きむかせつ · null hypothesis2級検定
「差はない」「効果はない」など、退屈で当たり障りのない出発点となる仮説。。
関連する教科書の節を読む →- 対立仮説たいりつかせつ · alternative hypothesis2級検定
帰無仮説に反する、研究者が示したい仮説。 または 。
関連する教科書の節を読む →- 有意水準ゆういすいじゅん · significance level2級検定
「 が真なのに棄却してしまう確率」の上限。慣例的に や 。
関連する教科書の節を読む →- p 値ぴーち · p-value2級検定
のもとで、現在のデータと同等以上に極端なデータが観測される確率。 で棄却。
関連する教科書の節を読む →- 第1種の誤りだいいっしゅのあやまり · Type I error2級検定
が真なのに棄却してしまう誤り。確率は 。
関連する教科書の節を読む →- 第2種の誤りだいにしゅのあやまり · Type II error2級検定
が真なのに を棄却できない誤り。確率は 。検出力は 。
関連する教科書の節を読む →- カイ二乗検定かいにじょうけんてい · chi-squared test2級検定
観測度数と期待度数の食い違いを で測る検定。適合度・独立性に使う。
関連する教科書の節を読む →- 回帰係数かいきけいすう · regression coefficient2級回帰
回帰直線の傾き 。 が 1 単位増えたときの の予測値の変化量。
関連する教科書の節を読む →- 決定係数けっていけいすう · coefficient of determination2級回帰
。回帰モデルが応答変数の分散をどれだけ説明できたかの指標。
関連する教科書の節を読む →- 最小二乗法さいしょうにじょうほう · ordinary least squares (OLS)2級回帰
残差の 2 乗和を最小にするように回帰係数を推定する方法。。
関連する教科書の節を読む →- 不偏推定量ふへんすいていりょう · unbiased estimator2級推定
期待値が母数に一致する推定量 。標本平均は母平均の不偏推定量、不偏分散は母分散の不偏推定量。
関連する教科書の節を読む →- カイ二乗分布かいにじょうぶんぷ · chi-squared distribution2級確率分布
標準正規変数 の二乗和 の分布。自由度 。分散の検定や独立性の検定で使う。
関連する教科書の節を読む →- F 分布えふぶんぷ · F distribution2級確率分布
2 つの独立なカイ二乗統計量の比の分布。分散分析・分散比の検定に使う。
関連する教科書の節を読む →- F 検定えふけんてい · F test2級検定
F 分布を使った検定の総称。2 群の分散の等しさの検定や、回帰モデルの全係数 0 の検定など。
関連する教科書の節を読む →- 対応のある t 検定たいおうのあるてぃーけんてい · paired t-test2級検定
同じ被験者の前後比較など、ペア構造があるデータの平均差の検定。差 の平均が 0 かを検定する。
関連する教科書の節を読む →- 対応のない t 検定たいおうのないてぃーけんてい · two-sample t-test2級検定
独立な 2 群の平均差の検定。等分散を仮定するスチューデントの t 検定と、仮定しないウェルチの t 検定がある。
関連する教科書の節を読む →- 分散分析ぶんさんぶんせき · ANOVA (analysis of variance)2級検定
3 群以上の平均差を、群間変動と群内変動の比(F 値)で同時に検定する手法。一元配置・二元配置などがある。
関連する教科書の節を読む →- 残差ざんさ · residual2級回帰
実測値とモデルによる予測値の差 。回帰の当てはまりや前提(等分散・独立性)を残差プロットで診断する。
関連する教科書の節を読む →- 多重共線性たじゅうきょうせんせい · multicollinearity2級回帰
重回帰で説明変数どうしが強く相関している状態。係数の推定が不安定になる。VIF などで検出する。
関連する教科書の節を読む →- 単純無作為抽出たんじゅんむさくいちゅうしゅつ · simple random sampling2級標本抽出
母集団のすべての要素が等しい確率で選ばれる、最も基本的な無作為抽出法。
関連する教科書の節を読む →- 層化抽出そうかちゅうしゅつ · stratified sampling2級標本抽出
母集団を性別・年代などの層に分け、各層から無作為抽出する方法。層内が均質なほど推定精度が上がる。
関連する教科書の節を読む →- クラスター抽出くらすたーちゅうしゅつ · cluster sampling2級標本抽出
母集団を地域・学校などの集落(クラスター)に分け、いくつかのクラスターを丸ごと抽出する方法。コスト効率が高い。
関連する教科書の節を読む →- 統計法とうけいほう · Statistics Act2級公的統計
公的統計の作成・利用に関する基本法律(2007 年全部改正)。基幹統計の指定、統計データの目的外利用、秘密保護などを規定。
関連する教科書の節を読む →- 基幹統計きかんとうけい · fundamental statistics2級公的統計
国勢統計(国勢調査)など、特に重要として総務大臣が指定する公的統計。報告義務・正確性確保の規定が強化されている。
関連する教科書の節を読む →- 標本誤差ひょうほんごさ · sampling error2級標本抽出
標本調査で全数を見ないことから生じる、推定値と母集団真値のズレ。標本サイズの平方根に反比例して小さくなる。
関連する教科書の節を読む →- 非標本誤差ひひょうほんごさ · non-sampling error2級標本抽出
回答漏れ・回答ミス・集計ミスなど、抽出以外の原因で生じる誤差。標本サイズを増やしても減らない。
関連する教科書の節を読む →- 多段抽出ただんちゅうしゅつ · multistage sampling2級標本抽出
都道府県 → 市区町村 → 世帯のように、段階的に抽出単位を絞り込む方法。大規模調査でコストを抑えられる。
関連する教科書の節を読む →- 一様分布いちようぶんぷ · uniform distribution2級確率分布
区間 で確率密度が一定の連続分布。乱数生成の基礎で、他分布のシミュレーションの出発点になる。
関連する教科書の節を読む →- 幾何分布きかぶんぷ · geometric distribution2級確率分布
成功確率 のベルヌーイ試行を繰り返したときの初めて成功するまでの試行回数の分布。。
関連する教科書の節を読む →- 信頼水準しんらいすいじゅん · confidence level2級推定
信頼区間が母数を含む確率(例: 95%)。 の関係。区間幅と引き換えに信頼度を高められる。
関連する教科書の節を読む →- 検出力けんしゅつりょく · statistical power2級検定
対立仮説が真のとき正しく帰無仮説を棄却できる確率 。サンプルサイズ設計の基準として使う。
関連する教科書の節を読む →- 効果量こうかりょう · effect size2級検定
群間の差の大きさを標準化した指標(Cohen の など)。p 値だけでは分からない「実質的な大きさ」を示す。
関連する教科書の節を読む →- ノンパラメトリック検定のんぱらめとりっくけんてい · nonparametric test2級検定
正規性などの分布仮定を置かず、順位や符号を用いる検定の総称。サンプルが小さい・分布が歪むときに有用。
関連する教科書の節を読む →- ウィルコクソンの符号順位検定うぃるこくそんのふごうじゅんいけんてい · Wilcoxon signed-rank test2級検定
対応のある 2 群差を、差の符号と順位に基づいて検定するノンパラ手法。対応のある t 検定の正規性を仮定しない代替。
関連する教科書の節を読む →- マン・ホイットニーの U 検定まんほいっとにーのゆーけんてい · Mann–Whitney U test2級検定
独立な 2 群の中央位置差を順位で検定するノンパラ手法。対応のない t 検定の正規性を仮定しない代替。
関連する教科書の節を読む →- スピアマンの順位相関係数すぴあまんのじゅんいそうかんけいすう · Spearman's rank correlation2級回帰
2 変数の順位どうしのピアソン相関。単調関係を測り、外れ値や非線形変換に頑健。
関連する教科書の節を読む →- 自由度調整済み決定係数じゆうどちょうせいずみけっていけいすう · adjusted R²2級回帰
説明変数を増やすと無闇に上がる を、自由度で罰則化した指標。重回帰のモデル比較の基本ツール。
関連する教科書の節を読む →- AICえーあいしー · Akaike information criterion2級回帰
。当てはまり()とパラメータ数 の罰則の和。小さいほど良いモデル。
関連する教科書の節を読む →- BICびーあいしー · Bayesian information criterion2級回帰
。AIC よりパラメータ数の罰則が強く、より単純なモデルを選びやすい情報量規準。
関連する教科書の節を読む →- データクレンジングでーたくれんじんぐ · data cleansing2級データ工学
入力ミス・重複・形式不統一などを発見・修正してデータを分析可能な状態にする工程。実務の分析時間の半分以上を占める。
関連する教科書の節を読む →- 欠損値処理けっそんちしょり · missing value imputation2級データ工学
欠損データを除外/平均補完/回帰補完/多重代入などで処理する手法群。欠損メカニズム(MCAR/MAR/MNAR)で適切な手法が変わる。
関連する教科書の節を読む →- 標準化(スケーリング)ひょうじゅんか · feature scaling2級データ工学
特徴量を平均 0 ・分散 1(標準化)、または (正規化)に揃える前処理。距離ベース手法・勾配法で必須。
関連する教科書の節を読む →- A/B テストえーびーてすと · A/B testing2級実務
ユーザーをランダムに 2 群に分け、施策の効果を比較する実験。Web マーケ・プロダクト改善で標準。仮説検定の応用そのもの。
関連する教科書の節を読む →- ピボットテーブルぴぼっとてーぶる · pivot table2級実務
Excel・BI ツールで、行/列/値を動的に切り替えてクロス集計を行う仕組み。DS 基礎試験では実技の中核機能。
関連する教科書の節を読む →- KPIけーぴーあい · Key Performance Indicator2級実務
目標達成度を測る重要業績評価指標。事業の北極星指標(NSM)とともに、データドリブン経営の意思決定基準となる。
関連する教科書の節を読む →- 国民経済計算こくみんけいざいけいさん · System of National Accounts (SNA)2級公的統計
国の経済活動を生産・分配・支出の側面から体系的に記録する統計体系。GDP はその主要指標。日本は内閣府が作成。
関連する教科書の節を読む →- 消費者物価指数しょうひしゃぶっかしすう · Consumer Price Index (CPI)2級公的統計
家計が購入する商品・サービスの価格変動を、ある基準時を 100 として表す指数。総務省が作成、日銀の物価目標の対象。
関連する教科書の節を読む →- ウェイトバック集計うぇいとばっくしゅうけい · weighting back2級公的統計
標本構成と母集団構成のズレを補正するため、各回答に「逆数(または比)」の重みを掛けて集計する手法。
関連する教科書の節を読む →- 統計的開示制御とうけいてきかいじせいぎょ · statistical disclosure control2級公的統計
公的統計データの提供時に、個人や事業所が特定されないよう、頂上値の丸めやセル抑制等で識別リスクを低減する処理。
関連する教科書の節を読む →- 標本設計ひょうほんせっけい · sample design2級公的統計
目標精度・コスト・回収率を踏まえ、抽出方法・標本サイズ・層化変数などを事前に決める計画段階。調査の質を大きく左右する。
関連する教科書の節を読む →- 管理図かんりず · control chart2級品質管理
工程から定期的に取った統計量を時系列で記録し、UCL/LCL を引いて異常を判定する図。Shewhart の X̄-R 管理図、p 管理図、c 管理図など。
関連する教科書の節を読む →- 工程能力指数こうていのうりょくしすう · process capability index (Cp/Cpk)2級品質管理
規格幅に対する工程のばらつきの大きさを表す指標。、中心ずれを考慮した も併用。製造業の目標 。
関連する教科書の節を読む →- シックスシグマしっくすしぐま · Six Sigma2級品質管理
の品質管理を目指す改革運動。100 万個に 3.4 個の不良率(3.4 PPM)。 に相当。モトローラ・GE が広めた。
関連する教科書の節を読む →- OC 曲線おーしーきょくせん · Operating Characteristic Curve2級品質管理
抜取検査の性能を示す曲線。横軸=ロット不良率、縦軸=合格確率。AQL では合格、LTPD では不合格となるのが理想。
関連する教科書の節を読む →- AQLえーきゅーえる · Acceptable Quality Level2級品質管理
合格品質水準。検査でほぼ常に合格とすべき不良率の上限。生産者リスク α が 5% 以下になる水準。
関連する教科書の節を読む →- LTPDえるてぃーぴーでぃー · Lot Tolerance Percent Defective2級品質管理
ロット許容不良率。検査でほぼ常に不合格とすべき不良率。消費者リスク β が 10% 以下になる水準。
関連する教科書の節を読む →- QC 7 つ道具きゅーしーななつどうぐ · Seven QC tools2級品質管理
パレート図・特性要因図・ヒストグラム・散布図・管理図・チェックシート・グラフ(層別)。数値データを使った品質改善の基本ツール。
関連する教科書の節を読む →- 新 QC 7 つ道具しんきゅーしーななつどうぐ · Seven new QC tools2級品質管理
親和図(KJ 法)・連関図・系統図・マトリクス図・マトリクスデータ解析・PDPC 法・アローダイアグラム。言語データ・概念整理に特化。
関連する教科書の節を読む →- TQMてぃーきゅーえむ · Total Quality Management2級品質管理
総合的品質管理。3 本柱は『顧客重視・全員参加・継続的改善(カイゼン)』。日本の製造業の競争力の源泉となった経営手法。
関連する教科書の節を読む →
準1級レベルの用語
- ポアソン分布ぽあそんぶんぷ · Poisson distribution準1級分布
単位時間あたり平均 回起こる稀な事象の発生回数の分布。。
関連する教科書の節を読む →- 指数分布しすうぶんぷ · exponential distribution準1級分布
ポアソン過程の事象間隔(待ち時間)の分布。。無記憶性をもつ。
関連する教科書の節を読む →- 多変量正規分布たへんりょうせいきぶんぷ · multivariate normal準1級分布
正規分布の多次元版 。線形変換も周辺分布も条件付き分布も正規。
関連する教科書の節を読む →- ベイズの定理べいずのていり · Bayes' theorem準1級ベイズ
事後分布 尤度 事前分布。データを見て信念を更新する公式。
関連する教科書の節を読む →- 事後分布じごぶんぷ · posterior distribution準1級ベイズ
データを観測した後の母数 の分布。点推定や信用区間の出発点。
関連する教科書の節を読む →- 共役分布きょうやくぶんぷ · conjugate prior準1級ベイズ
事前分布と尤度の組み合わせで、事後分布が同じ族の分布に閉じる関係。例: ベータ-二項。
関連する教科書の節を読む →- 重回帰分析じゅうかいきぶんせき · multiple regression準1級回帰
複数の説明変数を持つ線形回帰モデル。。
関連する教科書の節を読む →- ロジスティック回帰ろじすてぃっくかいき · logistic regression準1級回帰
二値応答変数(成功/失敗)を扱う GLM。オッズの対数 をモデル化する。係数 は「説明変数が 1 単位増えたときオッズが 倍になる」と解釈できる。マーケティング・医療で頻出。
関連する教科書の節を読む →- 主成分分析しゅせいぶんぶんせき · PCA (principal component analysis)準1級多変量
分散共分散行列の固有ベクトル方向に射影することで、多変量データを低次元に圧縮する手法。
関連する教科書の節を読む →- AR モデルえーあーるもでる · autoregressive model準1級時系列
。過去の値で現在を予測する時系列モデル。
関連する教科書の節を読む →- ARIMAありま · ARIMA (autoregressive integrated moving average)準1級時系列
差分を取って定常化した後 ARMA でモデル化する非定常時系列の標準モデル。。
関連する教科書の節を読む →- ベイズ推定べいずすいてい · Bayesian estimation準1級ベイズ
事前分布とデータから事後分布 を求め、その分布(または期待値・MAP)で推定する方法。
関連する教科書の節を読む →- 事前分布じぜんぶんぷ · prior distribution準1級ベイズ
データを観察する前に持つパラメータ への信念を表す確率分布 。共役分布や無情報事前分布が代表的。
関連する教科書の節を読む →- 偏相関係数へんそうかんけいすう · partial correlation準1級多変量
他の変数の影響を統制(線形回帰で除去)した上での 2 変数の相関。見かけの相関と本当の関係を区別するのに使う。
関連する教科書の節を読む →- 因子分析いんしぶんせき · factor analysis準1級多変量
観測変数の背後に潜む少数の共通因子を抽出する手法。心理測定や品質工学で広く使われる。主成分分析と目的が異なる。
関連する教科書の節を読む →- クラスター分析くらすたーぶんせき · cluster analysis準1級多変量
似たデータをグループ化する教師なし手法。階層的クラスタリング(ウォード法など)と非階層型(k-means)がある。
関連する教科書の節を読む →- 一般化線形モデルいっぱんかせんけいもでる · generalized linear model (GLM)準1級回帰
線形予測子 をリンク関数で結ぶ、線形回帰の一般化。正規・二項・ポアソンなど指数型分布族を扱える。
関連する教科書の節を読む →- リンク関数りんくかんすう · link function準1級回帰
GLM で目的変数の期待値 と線形予測子 を結ぶ関数 。ロジット・対数・恒等など。
関連する教科書の節を読む →- 生存時間解析せいぞんじかんかいせき · survival analysis準1級応用
イベント発生までの時間を、打ち切り(まだ起きていないデータ)を考慮して扱う手法。カプラン・マイヤー・Cox 比例ハザードが代表。
関連する教科書の節を読む →- ハザード関数はざーどかんすう · hazard function準1級応用
時刻 まで生存していた条件のもとで、その瞬間にイベントが起こる「率」。。
関連する教科書の節を読む →- ホワイトノイズほわいとのいず · white noise準1級時系列
平均 0・分散一定で、時刻間に相関がない時系列。予測モデルの「予測できない残差」が満たすべき性質。
関連する教科書の節を読む →- 季節調整きせつちょうせい · seasonal adjustment準1級時系列
時系列から季節パターンを取り除く処理。経済統計(GDP・小売販売額など)では原系列と季節調整値が併記される。
関連する教科書の節を読む →- 教師あり学習きょうしありがくしゅう · supervised learning準1級機械学習
正解ラベル付きのデータから入出力の関係を学習する枠組み。分類(離散ラベル)と回帰(連続値)に分かれる。
関連する教科書の節を読む →- 教師なし学習きょうしなしがくしゅう · unsupervised learning準1級機械学習
ラベルなしデータから構造(クラスター・低次元表現)を発見する枠組み。k-means・主成分分析・自己符号化器など。
関連する教科書の節を読む →- 強化学習きょうかがくしゅう · reinforcement learning準1級機械学習
エージェントが環境と相互作用し、報酬を最大化する行動方策を試行錯誤で学ぶ枠組み。AlphaGo・自動運転などで成功。
関連する教科書の節を読む →- 過学習かがくしゅう · overfitting準1級機械学習
訓練データに合わせ込みすぎ、未知データへの汎化性能が低下する現象。モデル複雑度に対しデータが少ないと起きやすい。
関連する教科書の節を読む →- 正則化せいそくか · regularization準1級機械学習
損失関数に係数の大きさへの罰則を加え過学習を抑える手法。L1(ラッソ・スパース化)と L2(リッジ・縮小)が代表的。
関連する教科書の節を読む →- 交差検証こうさけんしょう · cross validation準1級機械学習
データを K 分割し、各部分をテスト用に回しながら平均性能を評価する手法。少データでの汎化性能評価の標準手法。
関連する教科書の節を読む →- 混同行列こんどうぎょうれつ · confusion matrix準1級評価指標
分類予測を「真陽性・偽陽性・偽陰性・真陰性」の 4 マスにまとめた表。各種評価指標の出発点。
関連する教科書の節を読む →- 適合率と再現率てきごうりつとさいげんりつ · precision and recall準1級評価指標
適合率 = TP/(TP+FP)(陽性予測のうち本当に陽性)、再現率 = TP/(TP+FN)(本当の陽性のうち拾えた割合)。両者の調和平均が F1。
関連する教科書の節を読む →- ROC 曲線あーるおーしーきょくせん · ROC curve準1級評価指標
閾値を動かしたときの「真陽性率(再現率)」と「偽陽性率」をプロットした曲線。曲線下面積 AUC が分類器の総合性能。
関連する教科書の節を読む →- 勾配降下法こうばいこうかほう · gradient descent準1級機械学習
損失関数の勾配方向と逆向きにパラメータを少しずつ更新する最適化法。バッチ・確率的(SGD)・ミニバッチがある。
関連する教科書の節を読む →- ニューラルネットワークにゅーらるねっとわーく · neural network準1級機械学習
線形変換と非線形活性化関数を多層に積んだ関数近似モデル。多層化したものをディープラーニングと呼ぶ。
関連する教科書の節を読む →- Transformerとらんすふぉーまー · Transformer準1級機械学習
自己注意機構(self-attention)を中核とするディープラーニングモデル。BERT・GPT など現代の大規模言語モデルの基盤。
関連する教科書の節を読む →- バイアスとバリアンスばいあすとばりあんす · bias-variance tradeoff準1級機械学習
予測誤差はバイアス²(モデルの単純さの偏り)+ バリアンス(訓練データへの敏感さ)+ ノイズに分解される。両者のトレードオフがモデル選択の核心。
関連する教科書の節を読む →- ガンマ分布がんまぶんぷ · gamma distribution準1級確率分布
形状パラメータ ・尺度 をもつ正値連続分布。 で指数分布、整数 でアーラン分布。待ち時間モデルや事前分布で頻出。
関連する教科書の節を読む →- ベータ分布べーたぶんぷ · beta distribution準1級確率分布
区間 上の連続分布 。二項分布の共役事前分布として、比率のベイズ推定で標準的に使う。
関連する教科書の節を読む →- 対数正規分布たいすうせいきぶんぷ · log-normal distribution準1級確率分布
が正規分布に従う右に裾の長い分布。所得・株価・粒径分布など、乗算的に決まる量によく当てはまる。
関連する教科書の節を読む →- 多項分布たこうぶんぷ · multinomial distribution準1級確率分布
二項分布の多カテゴリ版。 回の試行で 個のカテゴリそれぞれに何回入るかの同時分布。
関連する教科書の節を読む →- マルコフ連鎖まるこふれんさ · Markov chain準1級確率過程
次の状態が「現在の状態だけ」で決まる(過去に依存しない)確率過程。MCMC・状態空間モデルの基礎。
関連する教科書の節を読む →- 移動平均いどうへいきん · moving average準1級時系列
時系列を直近 期の平均で平滑化する基本手法。トレンド抽出やノイズ除去に使う。MA モデルとは別概念なので注意。
関連する教科書の節を読む →- 指数平滑法しすうへいかつほう · exponential smoothing準1級時系列
直近の値ほど重みを大きくする平滑化(重みが幾何的に減衰)。Holt・Holt–Winters でトレンド・季節性に拡張できる。
関連する教科書の節を読む →- 状態空間モデルじょうたいくうかんもでる · state space model準1級時系列
観測されない状態(state)が時間発展し、それを通じて観測値が得られるという定式化。カルマンフィルタが代表的推定手法。
関連する教科書の節を読む →- 階層ベイズモデルかいそうべいずもでる · hierarchical Bayesian model準1級ベイズ
事前分布のパラメータ自身にさらに分布(超事前分布)を仮定する多層モデル。グループ間で情報を共有し、推定を安定させる。
関連する教科書の節を読む →- ギブスサンプリングぎぶすさんぷりんぐ · Gibbs sampling準1級ベイズ
多次元の事後分布から、各変数を「他の変数を固定した条件付き分布」から順番にサンプルする MCMC 手法。
関連する教科書の節を読む →- メトロポリス・ヘイスティングス法めとろぽりすへいすてぃんぐすほう · Metropolis–Hastings algorithm準1級ベイズ
提案分布から候補を発生させ、確率 で受容することで目標分布からのサンプルを得る MCMC の基本アルゴリズム。
関連する教科書の節を読む →- 多次元尺度法たじげんしゃくどほう · multidimensional scaling (MDS)準1級多変量
対象間の距離(類似度)を保つように、低次元(通常 2 次元)に布置する手法。アンケート分析やブランド地図で使う。
関連する教科書の節を読む →- 決定木けっていぎ · decision tree準1級機械学習
「ある特徴量が閾値以上か」で再帰的にデータを分割していくモデル。解釈しやすいが過学習しやすい。アンサンブルの基礎部品。
関連する教科書の節を読む →- ランダムフォレストらんだむふぉれすと · random forest準1級機械学習
ブートストラップ標本と特徴のランダム選択で多数の決定木を学習し、平均(または多数決)を取る代表的アンサンブル手法。
関連する教科書の節を読む →- 勾配ブースティングこうばいぶーすてぃんぐ · gradient boosting準1級機械学習
弱学習器(浅い木)を残差にフィットさせ、順次足し合わせる手法。XGBoost・LightGBM など実務分類で最も強力なアプローチの一つ。
関連する教科書の節を読む →- サポートベクターマシンさぽーとべくたーましん · support vector machine (SVM)準1級機械学習
クラスを最もマージン広く分離する超平面を求める分類器。カーネルトリックで非線形分類にも拡張できる。
関連する教科書の節を読む →- k 近傍法けーきんぼうほう · k-nearest neighbors (kNN)準1級機械学習
新しい点に最も近い 個の訓練点から多数決(分類)/平均(回帰)で予測する遅延学習。シンプルだが高次元で性能が落ちやすい。
関連する教科書の節を読む →- ナイーブベイズないーぶべいず · naive Bayes準1級機械学習
特徴間の条件付き独立を仮定し、ベイズの定理で事後確率を計算する分類器。テキスト分類で高速かつ強力。
関連する教科書の節を読む →- アンサンブル学習あんさんぶるがくしゅう · ensemble learning準1級機械学習
複数の弱い学習器を組み合わせて性能を上げる枠組み。バギング・ブースティング・スタッキングが三大手法。
関連する教科書の節を読む →- バギングばぎんぐ · bagging準1級機械学習
ブートストラップで作った複数標本で学習器を並列に訓練し、出力を平均/多数決する手法。バリアンスを下げる。ランダムフォレストの基礎。
関連する教科書の節を読む →- ブースティングぶーすてぃんぐ · boosting準1級機械学習
弱学習器を逐次的に学習し、誤りに重みをつけて次に活かす手法。バイアスを下げる。AdaBoost・勾配ブースティングが代表。
関連する教科書の節を読む →- ハイパーパラメータはいぱーぱらめーた · hyperparameter準1級機械学習
学習で最適化されず、事前に設定するパラメータ(学習率・木の深さ・正則化強度など)。グリッド/ランダム/ベイズ最適化で探索する。
関連する教科書の節を読む →- ドロップアウトどろっぷあうと · dropout準1級機械学習
学習時に各ニューロンを確率 でランダムに無効化することで過学習を防ぐ正則化手法。推論時は全ユニットを使い出力をスケール。
関連する教科書の節を読む →- バッチ正規化ばっちせいきか · batch normalization準1級機械学習
ミニバッチごとに中間層の出力を平均 0・分散 1 に正規化してから線形変換する手法。学習の高速化と安定化に大きく寄与する。
関連する教科書の節を読む →- アテンション機構あてんしょんきこう · attention mechanism準1級機械学習
入力のどの部分にどれだけ注目するかを重み付けで動的に決める仕組み。Transformer の中核で、機械翻訳・LLM の性能を飛躍させた。
関連する教科書の節を読む →- 転移学習てんいがくしゅう · transfer learning準1級機械学習
大規模データで学習済みのモデル(例: ImageNet/BERT)を、別タスク用に再利用する枠組み。少データで高性能を得る現代の標準。
関連する教科書の節を読む →- ファインチューニングふぁいんちゅーにんぐ · fine-tuning準1級機械学習
事前学習済みモデルの一部または全パラメータを、目的タスクの少量データで追加学習する手法。LLM の業務カスタマイズで主流。
関連する教科書の節を読む →- 説明可能 AIせつめいかのうえーあい · explainable AI (XAI)準1級AI 倫理
AI モデルの予測根拠を人間が解釈できる形で示す技術や思想。SHAP・LIME・Grad-CAM などが代表。医療・与信などで必須。
関連する教科書の節を読む →- 差分プライバシーさぶんぷらいばしー · differential privacy準1級AI 倫理
個別レコードの有無で出力分布がほぼ変わらないようノイズを加え、個人特定リスクを定量的に保証するプライバシー保護技術。
関連する教科書の節を読む →- AI 倫理えーあいりんり · AI ethics準1級AI 倫理
公平性・透明性・説明責任・プライバシー・安全性など、AI を社会で使う上での原則と実践。各国で AI ガバナンス枠組みが整備中。
関連する教科書の節を読む →- データ拡張でーたかくちょう · data augmentation準1級機械学習
回転・反転・ノイズ付加などで訓練データを人工的に増やす手法。画像・音声で過学習抑制と汎化向上に大きく寄与する。
関連する教科書の節を読む →- ELSIえるしー · ELSI (Ethical, Legal and Social Issues)準1級AI 倫理
新技術がもたらす倫理的・法的・社会的課題の総称。AI / ゲノム / 自動運転などで研究開発と並行して検討される。
関連する教科書の節を読む →- テンソルてんそる · tensor準1級DL 数学
多次元配列。0 階=スカラー、1 階=ベクトル、2 階=行列、3 階以上=テンソル。DL では画像バッチを (N, C, H, W) の 4 階テンソルで扱うのが標準。
関連する教科書の節を読む →- 順伝播じゅんでんぱ · forward propagation準1級DL 基礎
ニューラルネットで、入力から出力に向かって計算を進める過程。各層で線形変換 + 活性化関数を順次適用する。
関連する教科書の節を読む →- 誤差逆伝播法ごさぎゃくでんぱほう · backpropagation準1級DL 基礎
損失関数の勾配を、出力層から入力層に向かって連鎖律で逐次的に計算するアルゴリズム。DL の学習を支える中核技術。
関連する教科書の節を読む →- ReLUれる · ReLU (Rectified Linear Unit)準1級DL 基礎
活性化関数 。負の領域で勾配 0、正の領域で勾配 1。DL で勾配消失を緩和して学習を成功させた立役者。
関連する教科書の節を読む →- Softmaxそふとまっくす · softmax準1級DL 基礎
。多クラス分類の出力層で確率分布に変換。交差エントロピー損失と組合せて使う。
関連する教科書の節を読む →- 勾配消失問題こうばいしょうしつもんだい · vanishing gradient problem準1級DL 基礎
深いネットワークで逆伝播時に勾配が指数的に小さくなり、初期層が学習できなくなる現象。ReLU・残差接続・LSTM ゲートで緩和。
関連する教科書の節を読む →- 残差接続ざんさせつぞく · skip connection / residual connection準1級DL 基礎
。前層の入力を後層に直接足す経路。ResNet で 100 層以上の深層化を実現。
関連する教科書の節を読む →- Adamあだむ · Adam optimizer準1級DL 基礎
Momentum と RMSProp を組合せた最適化アルゴリズム。各パラメータの学習率を適応的に調整。現在 DL の事実上のデフォルト。
関連する教科書の節を読む →- CNNしーえぬえぬ · Convolutional Neural Network準1級DL モデル
畳み込み層 + プーリング層を中心に構成された、画像処理に特化した DL アーキテクチャ。LeNet から ResNet・EfficientNet まで多数の派生。
関連する教科書の節を読む →- プーリングぷーりんぐ · pooling準1級DL モデル
領域ごとに最大値(Max pooling)または平均(Average pooling)を取る操作。ダウンサンプリング + 位置のずれへの頑健性。
関連する教科書の節を読む →- LSTMえるえすてぃーえむ · Long Short-Term Memory準1級DL モデル
RNN の一種。忘却・入力・出力の 3 ゲートを持ち、長期依存を学習可能。機械翻訳・音声認識で長らく主役だった。
関連する教科書の節を読む →- Self-Attentionせるふあてんしょん · self-attention準1級DL モデル
入力系列の各位置が他のすべての位置を参照する仕組み。 で計算。Transformer の中核。
関連する教科書の節を読む →- BERTばーと · BERT準1級DL モデル
Google が 2018 年に発表した Transformer Encoder ベースの事前学習モデル。マスクされた単語の予測(MLM)で学習し、ファインチューニングで様々な NLP タスクに適用。
関連する教科書の節を読む →- GPTじーぴーてぃー · GPT (Generative Pre-trained Transformer)準1級DL モデル
OpenAI が 2018 年から発表している Transformer Decoder ベースの自己回帰生成モデル。次の単語予測で学習し、ChatGPT などの LLM の基盤に。
関連する教科書の節を読む →- VAEぶいえーいー · Variational Autoencoder準1級DL モデル
Encoder-Decoder で潜在変数の分布を学習する生成モデル。再構成誤差 + KL ダイバージェンスを最小化(ELBO 最大化)。
関連する教科書の節を読む →- GANがん · Generative Adversarial Network準1級DL モデル
生成器と識別器を競合させる生成モデル。生成器が偽物を作り、識別器が本物 / 偽物を判定。学習が不安定だが、高品質な生成が可能。
関連する教科書の節を読む →- 拡散モデルかくさんもでる · diffusion model準1級DL モデル
ノイズを段階的に加える順過程の逆を学習する生成モデル。Stable Diffusion・DALL-E 3 など現代の画像生成 AI の中核。
関連する教科書の節を読む →- RLHFあーるえるえいちえふ · Reinforcement Learning from Human Feedback準1級強化学習
人間が比較した嗜好データから報酬モデルを学習し、LLM を強化学習で微調整する手法。ChatGPT・Claude などの『有用で安全な対話エージェント化』の核心技術。
関連する教科書の節を読む →- 知識蒸留ちしきじょうりゅう · knowledge distillation準1級DL 実装
大きい教師モデルの出力(soft target)を学習目標として、小さい生徒モデルを学習させる手法。BERT → DistilBERT が代表例。
関連する教科書の節を読む →- 量子化りょうしか · quantization準1級DL 実装
DL モデルの重み・活性を float32 から int8 などに変換し、サイズ・推論速度を改善する手法。エッジデバイスでの推論に必須。
関連する教科書の節を読む →- デザイン効果でざいんこうか · design effect (deff)準1級標本設計
実際の標本設計の分散を、同じ n の単純無作為抽出と比べた比。deff < 1 で精度向上、deff > 1 で精度低下。クラスター抽出は通常 deff > 1。
関連する教科書の節を読む →- ネイマン配分ねいまんはいぶん · Neyman allocation準1級標本設計
層化抽出で各層の標本サイズを (層サイズ × 層内標準偏差)で決める最適配分法。精度を最大化する。
関連する教科書の節を読む →- 多重代入法たじゅうだいにゅうほう · Multiple Imputation (MI)準1級標本設計
欠測値に対して複数のもっともらしい代入値を作り、各セットで推定 → Rubin's rules で統合する手法。代入の不確実性も含めて分散を計算できる。
関連する教科書の節を読む →
1級レベルの用語
- 指数型分布族しすうがたぶんぷぞく · exponential family1級理論
の形に書ける分布族。十分統計量・最尤推定との相性が抜群。
関連する教科書の節を読む →- 十分統計量じゅうぶんとうけいりょう · sufficient statistic1級理論
「 さえあれば、 の細部はもう について情報を持たない」という統計量。フィッシャー・ネイマンの分解定理で判定。
関連する教科書の節を読む →- 最尤推定さいゆうすいてい · maximum likelihood estimation (MLE)1級推定
尤度関数 を最大化するパラメータを推定値とする方法。一致性・漸近正規性・漸近有効性をもつ。
関連する教科書の節を読む →- フィッシャー情報量ふぃっしゃーじょうほうりょう · Fisher information1級理論
。データが について持つ情報の量。
関連する教科書の節を読む →- クラメル・ラオの下限くらめる・らおのかげん · Cramér–Rao lower bound1級理論
正則条件下で不偏推定量の分散の下限 。MLE は漸近的にこれを達成する。
関連する教科書の節を読む →- デルタ法でるたほう · delta method1級漸近理論
から を導く道具。
関連する教科書の節を読む →- ネイマン・ピアソン補題ねいまん・ぴあそんほだい · Neyman–Pearson lemma1級検定理論
単純仮説どうしの検定において、有意水準 のもとでの最強力検定が尤度比検定であることを保証する定理。
関連する教科書の節を読む →- 尤度比検定ゆうどひけんてい · likelihood ratio test1級検定理論
を使った検定。 が漸近的にカイ二乗分布に従う(ウィルクスの定理)。
関連する教科書の節を読む →- EM アルゴリズムいーえむあるごりずむ · EM (expectation-maximization)1級計算統計
潜在変数モデルでの最尤推定を、E ステップと M ステップを繰り返して反復的に解く方法。GMM・HMM などに使う。
関連する教科書の節を読む →- MCMCえむしーえむしー · Markov chain Monte Carlo1級計算統計
目標分布に収束するマルコフ連鎖を構成して、その軌跡をサンプルとして使うベイズ推論の主役手法。MH 法・ギブス法など。
関連する教科書の節を読む →- ブートストラップぶーとすとらっぷ · bootstrap1級計算統計
観測標本から復元抽出で擬似標本を多数作り、推定量の分布や標準誤差を近似する汎用的な手法。
関連する教科書の節を読む →- 一致推定量いっちすいていりょう · consistent estimator1級推定理論
標本サイズ で母数に確率収束する推定量。最尤推定量は通常の正則条件下で一致性を持つ。
関連する教科書の節を読む →- 漸近正規性ぜんきんせいきせい · asymptotic normality1級推定理論
が で正規分布に分布収束する性質。最尤推定量は正則条件下でこれを満たす。
関連する教科書の節を読む →- スコア関数すこあかんすう · score function1級推定理論
対数尤度のパラメータ偏微分 。期待値 0 で、その分散がフィッシャー情報量。
関連する教科書の節を読む →- ベイズ因子べいずいんし · Bayes factor1級ベイズ
2 つのモデル の周辺尤度の比 。ベイズ流のモデル比較・仮説検定の基本量。
関連する教科書の節を読む →- ジェフリーズ事前分布じぇふりーずじぜんぶんぷ · Jeffreys prior1級ベイズ
フィッシャー情報量の平方根に比例する事前分布 。再パラメータ化で不変な無情報事前分布。
関連する教科書の節を読む →- 完備十分統計量かんびじゅうぶんとうけいりょう · complete sufficient statistic1級推定理論
十分性に加え「期待値が常に 0 ⇒ ほぼ確実に 0」となる(完備性)を満たす統計量。UMVUE 構成の鍵となる概念。
関連する教科書の節を読む →- ラオ・ブラックウェルの定理らおぶらっくうぇるのていり · Rao–Blackwell theorem1級推定理論
推定量を十分統計量で条件付け期待値を取ると、分散が必ず減少する(または不変)という定理。UMVUE 構成の中心ツール。
関連する教科書の節を読む →- M 推定量えむすいていりょう · M-estimator1級推定理論
目的関数 の最小化(または推定方程式の零点)で定義される推定量の総称。最尤・最小二乗・ロバスト推定を含む統一枠組み。
関連する教科書の節を読む →- カーネル密度推定かーねるみつどすいてい · kernel density estimation1級ノンパラ
観測点に滑らかな核(ガウス核など)を載せて足し合わせ、確率密度を推定するノンパラ手法。バンド幅の選択が肝。
関連する教科書の節を読む →- 経験分布関数けいけんぶんぷかんすう · empirical distribution function1級ノンパラ
観測値から作る階段関数 。標本サイズが大きいと真の cdf に一様収束する(グリヴェンコ・カンテリの定理)。
関連する教科書の節を読む →- 特異値分解とくいちぶんかい · singular value decomposition (SVD)1級DL 数学
任意の行列 を に分解。 は直交、 は非負特異値の対角。データ圧縮・PCA の高次元実装・推薦システムなどで使う。
関連する教科書の節を読む →- Horvitz-Thompson 推定量ほーびっつとんぷそんすいていりょう · Horvitz-Thompson estimator1級標本設計
サンプリングウエイト (抽出確率の逆数)を使った母集団総計の不偏推定量 。標本調査の理論的中核。
関連する教科書の節を読む →