統計検定 学習帳
Glossary

統計用語集

統計検定 4級〜1級で登場する重要用語をまとめた辞典です。各用語に短い定義と「関連する教科書の節」へのリンクを付けています。試験前の最終チェックや、学習中に意味を素早く確認したいときにお使いください。全 240 語。

Level

4級レベルの用語

平均値
へいきんち · mean
4代表値

全データの合計をデータ数で割った値。データの中心位置を表すもっとも基本的な代表値。

関連する教科書の節を読む →
中央値
ちゅうおうち · median
4代表値

データを昇順に並べたとき真ん中にくる値。外れ値の影響を受けにくい代表値。

関連する教科書の節を読む →
最頻値
さいひんち · mode
4代表値

データの中でもっとも多く出現する値。質的データ(カテゴリ)で唯一使える代表値であり、分布の山の位置を表す。複数の値が同じ最大度数なら最頻値は複数となる。

関連する教科書の節を読む →
範囲
はんい · range
4ばらつき

データの最大値から最小値を引いた値。もっとも単純なばらつきの指標。

関連する教科書の節を読む →
四分位数
しぶんいすう · quartile
4ばらつき

データを昇順で 4 等分したときの 3 つの区切り値 は中央値。

関連する教科書の節を読む →
四分位範囲
しぶんいはんい · IQR (interquartile range)
4ばらつき

。中央 50% のデータの広がり。外れ値に頑健。

関連する教科書の節を読む →
箱ひげ図
はこひげず · box plot
4可視化

最小値・・中央値・・最大値の五数で分布を要約する図。複数群比較に便利。

関連する教科書の節を読む →
度数分布表
どすうぶんぷひょう · frequency table
4可視化

データを階級に分け、各階級の度数(個数)をまとめた表。ヒストグラムの基礎。

関連する教科書の節を読む →
ヒストグラム
ひすとぐらむ · histogram
4可視化

度数分布表を棒グラフ化したもの。隣の棒は隙間なく並べ、データの分布形を視覚化する。

関連する教科書の節を読む →
順列
じゅんれつ · permutation
4場合の数

異なる 個から 個を選んで順序付けて並べる方法の総数。

関連する教科書の節を読む →
組合せ
くみあわせ · combination
4場合の数

異なる 個から 個を順序を区別せず選ぶ方法の総数。

関連する教科書の節を読む →
余事象
よじしょう · complementary event
4確率

事象 が起こらない事象。。「少なくとも〜」型の問題に強い。

関連する教科書の節を読む →
度数
どすう · frequency
4データ整理

ある階級(または値)に属するデータの個数。度数分布表で各階級ごとに数えた件数のこと。

関連する教科書の節を読む →
相対度数
そうたいどすう · relative frequency
4データ整理

各階級の度数を全体の度数で割った値(=割合)。データ規模が違う集団同士の比較に便利。

関連する教科書の節を読む →
累積度数
るいせきどすう · cumulative frequency
4データ整理

ある階級までの度数を順に足し上げた値。「○○以下が何人いるか」が一目でわかる。

関連する教科書の節を読む →
階級
かいきゅう · class interval
4データ整理

度数分布表で連続データを区切る区間(例: 60〜70 点)。階級幅は基本的に揃える。

関連する教科書の節を読む →
階級値
かいきゅうち · class midpoint
4データ整理

各階級の中央の値(=区間の中点)。度数分布表から平均などを計算するときの代表値として使う。

関連する教科書の節を読む →
散布図
さんぷず · scatter plot
4可視化

2 変数を横軸 ・縦軸 に取って点でプロットした図。2 変数の関係(相関)を視覚的に確認できる。

関連する教科書の節を読む →
棒グラフ
ぼうぐらふ · bar chart
4可視化

カテゴリごとの数量を棒の高さで比べる図。質的データ・離散量に向く。隣接させない(ヒストグラムとは異なる)。

関連する教科書の節を読む →
折れ線グラフ
おれせんぐらふ · line chart
4可視化

時系列など順序のあるデータを線でつないだ図。推移・トレンドを示すのに適している。

関連する教科書の節を読む →
円グラフ
えんぐらふ · pie chart
4可視化

全体を 100% として各項目の構成比を扇形で示す図。カテゴリが多すぎると見にくい。

関連する教科書の節を読む →
試行
しこう · trial
4確率

結果が偶然に決まる行為(コイン投げ・サイコロを振るなど)。確率の議論の出発点。

関連する教科書の節を読む →
事象
じしょう · event
4確率

試行の結果として起こりうる集合(例: サイコロで偶数の目が出る)。1 個の結果は「根元事象」と呼ぶ。

関連する教科書の節を読む →
排反事象
はいはんじしょう · mutually exclusive events
4確率

同時には起こりえない事象どうし。。確率の加法定理で和の確率がそのまま足し算になる条件。

関連する教科書の節を読む →
質的データ
しつてきでーた · qualitative data
4データ整理

性別・血液型・好みなど、数値で大小を比較できないカテゴリのデータ。名義尺度・順序尺度に分類される。

関連する教科書の節を読む →
量的データ
りょうてきでーた · quantitative data
4データ整理

身長・売上・気温など、数値で大小や差を比較できるデータ。間隔尺度・比例尺度に分類される。

関連する教科書の節を読む →
離散変数と連続変数
りさんへんすうとれんぞくへんすう · discrete vs. continuous variable
4データ整理

離散変数は人数・回数のような飛び飛びの値、連続変数は身長・時間のように切れ目なく値を取る変数。扱う確率分布が異なる。

関連する教科書の節を読む →
同様に確からしい
どうようにたしからしい · equally likely
4確率

ある試行のすべての根元事象が同じ確率で起こる状態。「サイコロ・コイン・くじ」など古典的確率の前提。

関連する教科書の節を読む →
樹形図
じゅけいず · tree diagram
4場合の数

場合の数や確率を漏れなく数えるために、選択を枝分かれで描いた図。条件付き確率の理解にも有効。

関連する教科書の節を読む →
パーセンタイル
ぱーせんたいる · percentile
4ばらつき

データを小さい順に並べたとき下から の位置にある値。 パーセンタイルは中央値、 は四分位数。

関連する教科書の節を読む →
Level

3級レベルの用語

分散
ぶんさん · variance
3ばらつき

偏差の 2 乗の平均。データのばらつきの大きさを表す代表的な指標。

関連する教科書の節を読む →
標準偏差
ひょうじゅんへんさ · standard deviation
3ばらつき

分散の正の平方根。もとのデータと同じ単位でばらつきを表現できる。

関連する教科書の節を読む →
共分散
きょうぶんさん · covariance
32変数

。2 変数の連動の方向を示す。

関連する教科書の節を読む →
相関係数
そうかんけいすう · correlation coefficient
32変数

の値で 2 変数の直線関係の強さを表す。

関連する教科書の節を読む →
標準化
ひょうじゅんか · standardization (z-score)
3変換

により、平均 0・標準偏差 1 の物差しに変換する操作。

関連する教科書の節を読む →
偏差値
へんさち · T-score
3変換

z スコアを に変換した値。平均 50・標準偏差 10 の物差し。

関連する教科書の節を読む →
条件付き確率
じょうけんつきかくりつ · conditional probability
3確率

事象 が起こったもとで が起こる確率。

関連する教科書の節を読む →
確率変数
かくりつへんすう · random variable
3確率

試行結果に応じて値が確率的に決まる変数。離散と連続がある。 で表すのが慣例。

関連する教科書の節を読む →
期待値
きたいち · expectation
3確率

確率変数の「ならした平均値」。離散なら

関連する教科書の節を読む →
二項分布
にこうぶんぷ · binomial distribution
3分布

成功確率 のベルヌーイ試行を 回繰り返したときの成功回数 の分布。

関連する教科書の節を読む →
正規分布
せいきぶんぷ · normal (Gaussian) distribution
3分布

釣鐘型の連続分布 。中心極限定理により多くの平均量がこれに近づく。

関連する教科書の節を読む →
信頼区間
しんらいくかん · confidence interval
3推定

母集団の未知パラメータが「ある信頼度で」入る区間。例:

関連する教科書の節を読む →
中心極限定理
ちゅうしんきょくげんていり · central limit theorem (CLT)
3理論

母集団の分布によらず、 が十分大きいとき標本平均は近似的に正規分布に従う、という定理。

関連する教科書の節を読む →
母集団
ぼしゅうだん · population
3推測統計

調査・推測の対象となる全データ集団。母集団の真の値(母平均・母分散など)を「母数(パラメータ)」と呼ぶ。

関連する教科書の節を読む →
標本
ひょうほん · sample
3推測統計

母集団から抽出された一部のデータ。標本から計算した値(標本平均など)を「統計量」と呼ぶ。

関連する教科書の節を読む →
全数調査
ぜんすうちょうさ · census
3標本抽出

母集団の全要素を調べる調査(国勢調査など)。誤差は小さいがコスト・時間がかかる。

関連する教科書の節を読む →
標本調査
ひょうほんちょうさ · sample survey
3標本抽出

母集団の一部だけを調べて全体を推測する調査。コストが低く、ほとんどの社会調査で採用される。

関連する教科書の節を読む →
無作為抽出
むさくいちゅうしゅつ · random sampling
3標本抽出

母集団のどの要素も同じ確率で標本に選ばれるようにする抽出法。推測統計の前提となる。

関連する教科書の節を読む →
標準正規分布
ひょうじゅんせいきぶんぷ · standard normal distribution
3確率分布

平均 0・分散 1 の正規分布 。任意の正規分布は標準化により標準正規分布に変換できる。

関連する教科書の節を読む →
z 値
ぜっとち · z-score
3推測統計

。データを標準化したときの値。「平均から標準偏差いくつ分離れているか」を表す。

関連する教科書の節を読む →
確率密度関数
かくりつみつどかんすう · probability density function (pdf)
3確率分布

連続型確率変数の分布を表す関数 。区間 の確率は

関連する教科書の節を読む →
累積分布関数
るいせきぶんぷかんすう · cumulative distribution function (cdf)
3確率分布

。「 以下になる確率」を返す関数。pdf を積分すると得られる。

関連する教科書の節を読む →
大数の法則
たいすうのほうそく · law of large numbers
3推測統計

標本サイズ を大きくするほど、標本平均が母平均に近づく(確率収束する)という法則。推測統計の基盤。

関連する教科書の節を読む →
ベルヌーイ分布
べるぬーいぶんぷ · Bernoulli distribution
3確率分布

0 か 1 の値だけを取る最も単純な分布。 回の独立試行を集めると二項分布になる。

関連する教科書の節を読む →
復元抽出
ふくげんちゅうしゅつ · sampling with replacement
3標本抽出

抽出した要素を毎回母集団に戻してから次を引く方法。各回の試行が独立になり、二項分布などの前提となる。

関連する教科書の節を読む →
非復元抽出
ひふくげんちゅうしゅつ · sampling without replacement
3標本抽出

一度抽出した要素は戻さずに次を引く方法。実際の調査の標準。試行は独立でなく、超幾何分布などで扱う。

関連する教科書の節を読む →
母平均
ぼへいきん · population mean
3推測統計

母集団全体の平均値 。標本平均 は母平均の不偏推定量で、推測統計の中心的な対象。

関連する教科書の節を読む →
母分散
ぼぶんさん · population variance
3推測統計

母集団全体の分散 。標本分散より不偏分散( で割る)の方が母分散の不偏推定量となる。

関連する教科書の節を読む →
母比率
ぼひりつ · population proportion
3推測統計

母集団における特定属性を持つ要素の割合 。世論調査や品質管理で「賛成率」「不良率」として推定対象になる。

関連する教科書の節を読む →
標本比率
ひょうほんひりつ · sample proportion
3推測統計

標本のうち特定属性を持つ要素の割合 。大標本では に近づく(中心極限定理)。

関連する教科書の節を読む →
期待値の線形性
きたいちのせんけいせい · linearity of expectation
3確率

が独立性に関係なく常に成り立つ性質。確率論で最も使われる便利な道具。

関連する教科書の節を読む →
同時分布
どうじぶんぷ · joint distribution
3確率

複数の確率変数 が同時に取る値の確率分布。同時分布から各変数の周辺分布や条件付き分布が得られる。

関連する教科書の節を読む →
周辺分布
しゅうへんぶんぷ · marginal distribution
3確率

同時分布から他の変数を確率の足し合わせ(積分)で消去して得られる、1 つの変数の単独分布。

関連する教科書の節を読む →
二項定理
にこうていり · binomial theorem
3場合の数

。二項分布の確率関数の正体でもある重要な展開公式。

関連する教科書の節を読む →
Level

2級レベルの用語

不偏分散
ふへんぶんさん · unbiased sample variance
2推定

。母分散 の不偏推定量。

関連する教科書の節を読む →
標準誤差
ひょうじゅんごさ · standard error (SE)
2推定

推定量のばらつきの大きさ。標本平均なら を増やすと縮む。

関連する教科書の節を読む →
自由度
じゆうど · degrees of freedom
2推定

推定で「自由に動ける情報の数」。不偏分散の自由度は 、回帰の残差は など。

関連する教科書の節を読む →
t 分布
てぃーぶんぷ · Student's t-distribution
2分布

標準正規より裾が厚い釣鐘型分布。母分散未知での母平均の推定・検定に使う。自由度を持つ。

関連する教科書の節を読む →
帰無仮説
きむかせつ · null hypothesis
2検定

「差はない」「効果はない」など、退屈で当たり障りのない出発点となる仮説。

関連する教科書の節を読む →
対立仮説
たいりつかせつ · alternative hypothesis
2検定

帰無仮説に反する、研究者が示したい仮説。 または

関連する教科書の節を読む →
有意水準
ゆういすいじゅん · significance level
2検定

が真なのに棄却してしまう確率」の上限。慣例的に

関連する教科書の節を読む →
p 値
ぴーち · p-value
2検定

のもとで、現在のデータと同等以上に極端なデータが観測される確率。 で棄却。

関連する教科書の節を読む →
第1種の誤り
だいいっしゅのあやまり · Type I error
2検定

が真なのに棄却してしまう誤り。確率は

関連する教科書の節を読む →
第2種の誤り
だいにしゅのあやまり · Type II error
2検定

が真なのに を棄却できない誤り。確率は 。検出力は

関連する教科書の節を読む →
カイ二乗検定
かいにじょうけんてい · chi-squared test
2検定

観測度数と期待度数の食い違いを で測る検定。適合度・独立性に使う。

関連する教科書の節を読む →
回帰係数
かいきけいすう · regression coefficient
2回帰

回帰直線の傾き が 1 単位増えたときの の予測値の変化量。

関連する教科書の節を読む →
決定係数
けっていけいすう · coefficient of determination
2回帰

。回帰モデルが応答変数の分散をどれだけ説明できたかの指標。

関連する教科書の節を読む →
最小二乗法
さいしょうにじょうほう · ordinary least squares (OLS)
2回帰

残差の 2 乗和を最小にするように回帰係数を推定する方法。

関連する教科書の節を読む →
不偏推定量
ふへんすいていりょう · unbiased estimator
2推定

期待値が母数に一致する推定量 。標本平均は母平均の不偏推定量、不偏分散は母分散の不偏推定量。

関連する教科書の節を読む →
カイ二乗分布
かいにじょうぶんぷ · chi-squared distribution
2確率分布

標準正規変数 の二乗和 の分布。自由度 。分散の検定や独立性の検定で使う。

関連する教科書の節を読む →
F 分布
えふぶんぷ · F distribution
2確率分布

2 つの独立なカイ二乗統計量の比の分布。分散分析・分散比の検定に使う。

関連する教科書の節を読む →
F 検定
えふけんてい · F test
2検定

F 分布を使った検定の総称。2 群の分散の等しさの検定や、回帰モデルの全係数 0 の検定など。

関連する教科書の節を読む →
対応のある t 検定
たいおうのあるてぃーけんてい · paired t-test
2検定

同じ被験者の前後比較など、ペア構造があるデータの平均差の検定。差 の平均が 0 かを検定する。

関連する教科書の節を読む →
対応のない t 検定
たいおうのないてぃーけんてい · two-sample t-test
2検定

独立な 2 群の平均差の検定。等分散を仮定するスチューデントの t 検定と、仮定しないウェルチの t 検定がある。

関連する教科書の節を読む →
分散分析
ぶんさんぶんせき · ANOVA (analysis of variance)
2検定

3 群以上の平均差を、群間変動と群内変動の比(F 値)で同時に検定する手法。一元配置・二元配置などがある。

関連する教科書の節を読む →
残差
ざんさ · residual
2回帰

実測値とモデルによる予測値の差 。回帰の当てはまりや前提(等分散・独立性)を残差プロットで診断する。

関連する教科書の節を読む →
多重共線性
たじゅうきょうせんせい · multicollinearity
2回帰

重回帰で説明変数どうしが強く相関している状態。係数の推定が不安定になる。VIF などで検出する。

関連する教科書の節を読む →
単純無作為抽出
たんじゅんむさくいちゅうしゅつ · simple random sampling
2標本抽出

母集団のすべての要素が等しい確率で選ばれる、最も基本的な無作為抽出法。

関連する教科書の節を読む →
層化抽出
そうかちゅうしゅつ · stratified sampling
2標本抽出

母集団を性別・年代などの層に分け、各層から無作為抽出する方法。層内が均質なほど推定精度が上がる。

関連する教科書の節を読む →
クラスター抽出
くらすたーちゅうしゅつ · cluster sampling
2標本抽出

母集団を地域・学校などの集落(クラスター)に分け、いくつかのクラスターを丸ごと抽出する方法。コスト効率が高い。

関連する教科書の節を読む →
統計法
とうけいほう · Statistics Act
2公的統計

公的統計の作成・利用に関する基本法律(2007 年全部改正)。基幹統計の指定、統計データの目的外利用、秘密保護などを規定。

関連する教科書の節を読む →
基幹統計
きかんとうけい · fundamental statistics
2公的統計

国勢統計(国勢調査)など、特に重要として総務大臣が指定する公的統計。報告義務・正確性確保の規定が強化されている。

関連する教科書の節を読む →
標本誤差
ひょうほんごさ · sampling error
2標本抽出

標本調査で全数を見ないことから生じる、推定値と母集団真値のズレ。標本サイズの平方根に反比例して小さくなる。

関連する教科書の節を読む →
非標本誤差
ひひょうほんごさ · non-sampling error
2標本抽出

回答漏れ・回答ミス・集計ミスなど、抽出以外の原因で生じる誤差。標本サイズを増やしても減らない。

関連する教科書の節を読む →
多段抽出
ただんちゅうしゅつ · multistage sampling
2標本抽出

都道府県 → 市区町村 → 世帯のように、段階的に抽出単位を絞り込む方法。大規模調査でコストを抑えられる。

関連する教科書の節を読む →
一様分布
いちようぶんぷ · uniform distribution
2確率分布

区間 で確率密度が一定の連続分布。乱数生成の基礎で、他分布のシミュレーションの出発点になる。

関連する教科書の節を読む →
幾何分布
きかぶんぷ · geometric distribution
2確率分布

成功確率 のベルヌーイ試行を繰り返したときの初めて成功するまでの試行回数の分布。

関連する教科書の節を読む →
信頼水準
しんらいすいじゅん · confidence level
2推定

信頼区間が母数を含む確率(例: 95%)。 の関係。区間幅と引き換えに信頼度を高められる。

関連する教科書の節を読む →
検出力
けんしゅつりょく · statistical power
2検定

対立仮説が真のとき正しく帰無仮説を棄却できる確率 。サンプルサイズ設計の基準として使う。

関連する教科書の節を読む →
効果量
こうかりょう · effect size
2検定

群間の差の大きさを標準化した指標(Cohen の など)。p 値だけでは分からない「実質的な大きさ」を示す。

関連する教科書の節を読む →
ノンパラメトリック検定
のんぱらめとりっくけんてい · nonparametric test
2検定

正規性などの分布仮定を置かず、順位や符号を用いる検定の総称。サンプルが小さい・分布が歪むときに有用。

関連する教科書の節を読む →
ウィルコクソンの符号順位検定
うぃるこくそんのふごうじゅんいけんてい · Wilcoxon signed-rank test
2検定

対応のある 2 群差を、差の符号と順位に基づいて検定するノンパラ手法。対応のある t 検定の正規性を仮定しない代替。

関連する教科書の節を読む →
マン・ホイットニーの U 検定
まんほいっとにーのゆーけんてい · Mann–Whitney U test
2検定

独立な 2 群の中央位置差を順位で検定するノンパラ手法。対応のない t 検定の正規性を仮定しない代替。

関連する教科書の節を読む →
スピアマンの順位相関係数
すぴあまんのじゅんいそうかんけいすう · Spearman's rank correlation
2回帰

2 変数の順位どうしのピアソン相関。単調関係を測り、外れ値や非線形変換に頑健。

関連する教科書の節を読む →
自由度調整済み決定係数
じゆうどちょうせいずみけっていけいすう · adjusted R²
2回帰

説明変数を増やすと無闇に上がる を、自由度で罰則化した指標。重回帰のモデル比較の基本ツール。

関連する教科書の節を読む →
AIC
えーあいしー · Akaike information criterion
2回帰

。当てはまり()とパラメータ数 の罰則の和。小さいほど良いモデル。

関連する教科書の節を読む →
BIC
びーあいしー · Bayesian information criterion
2回帰

。AIC よりパラメータ数の罰則が強く、より単純なモデルを選びやすい情報量規準。

関連する教科書の節を読む →
データクレンジング
でーたくれんじんぐ · data cleansing
2データ工学

入力ミス・重複・形式不統一などを発見・修正してデータを分析可能な状態にする工程。実務の分析時間の半分以上を占める。

関連する教科書の節を読む →
欠損値処理
けっそんちしょり · missing value imputation
2データ工学

欠損データを除外/平均補完/回帰補完/多重代入などで処理する手法群。欠損メカニズム(MCAR/MAR/MNAR)で適切な手法が変わる。

関連する教科書の節を読む →
標準化(スケーリング)
ひょうじゅんか · feature scaling
2データ工学

特徴量を平均 0 ・分散 1(標準化)、または (正規化)に揃える前処理。距離ベース手法・勾配法で必須。

関連する教科書の節を読む →
A/B テスト
えーびーてすと · A/B testing
2実務

ユーザーをランダムに 2 群に分け、施策の効果を比較する実験。Web マーケ・プロダクト改善で標準。仮説検定の応用そのもの。

関連する教科書の節を読む →
ピボットテーブル
ぴぼっとてーぶる · pivot table
2実務

Excel・BI ツールで、行/列/値を動的に切り替えてクロス集計を行う仕組み。DS 基礎試験では実技の中核機能。

関連する教科書の節を読む →
KPI
けーぴーあい · Key Performance Indicator
2実務

目標達成度を測る重要業績評価指標。事業の北極星指標(NSM)とともに、データドリブン経営の意思決定基準となる。

関連する教科書の節を読む →
国民経済計算
こくみんけいざいけいさん · System of National Accounts (SNA)
2公的統計

国の経済活動を生産・分配・支出の側面から体系的に記録する統計体系。GDP はその主要指標。日本は内閣府が作成。

関連する教科書の節を読む →
消費者物価指数
しょうひしゃぶっかしすう · Consumer Price Index (CPI)
2公的統計

家計が購入する商品・サービスの価格変動を、ある基準時を 100 として表す指数。総務省が作成、日銀の物価目標の対象。

関連する教科書の節を読む →
ウェイトバック集計
うぇいとばっくしゅうけい · weighting back
2公的統計

標本構成と母集団構成のズレを補正するため、各回答に「逆数(または比)」の重みを掛けて集計する手法。

関連する教科書の節を読む →
統計的開示制御
とうけいてきかいじせいぎょ · statistical disclosure control
2公的統計

公的統計データの提供時に、個人や事業所が特定されないよう、頂上値の丸めやセル抑制等で識別リスクを低減する処理。

関連する教科書の節を読む →
標本設計
ひょうほんせっけい · sample design
2公的統計

目標精度・コスト・回収率を踏まえ、抽出方法・標本サイズ・層化変数などを事前に決める計画段階。調査の質を大きく左右する。

関連する教科書の節を読む →
管理図
かんりず · control chart
2品質管理

工程から定期的に取った統計量を時系列で記録し、UCL/LCL を引いて異常を判定する図。Shewhart の X̄-R 管理図、p 管理図、c 管理図など。

関連する教科書の節を読む →
工程能力指数
こうていのうりょくしすう · process capability index (Cp/Cpk)
2品質管理

規格幅に対する工程のばらつきの大きさを表す指標。、中心ずれを考慮した も併用。製造業の目標

関連する教科書の節を読む →
シックスシグマ
しっくすしぐま · Six Sigma
2品質管理

の品質管理を目指す改革運動。100 万個に 3.4 個の不良率(3.4 PPM)。 に相当。モトローラ・GE が広めた。

関連する教科書の節を読む →
OC 曲線
おーしーきょくせん · Operating Characteristic Curve
2品質管理

抜取検査の性能を示す曲線。横軸=ロット不良率、縦軸=合格確率。AQL では合格、LTPD では不合格となるのが理想。

関連する教科書の節を読む →
AQL
えーきゅーえる · Acceptable Quality Level
2品質管理

合格品質水準。検査でほぼ常に合格とすべき不良率の上限。生産者リスク α が 5% 以下になる水準。

関連する教科書の節を読む →
LTPD
えるてぃーぴーでぃー · Lot Tolerance Percent Defective
2品質管理

ロット許容不良率。検査でほぼ常に不合格とすべき不良率。消費者リスク β が 10% 以下になる水準。

関連する教科書の節を読む →
QC 7 つ道具
きゅーしーななつどうぐ · Seven QC tools
2品質管理

パレート図・特性要因図・ヒストグラム・散布図・管理図・チェックシート・グラフ(層別)。数値データを使った品質改善の基本ツール。

関連する教科書の節を読む →
新 QC 7 つ道具
しんきゅーしーななつどうぐ · Seven new QC tools
2品質管理

親和図(KJ 法)・連関図・系統図・マトリクス図・マトリクスデータ解析・PDPC 法・アローダイアグラム。言語データ・概念整理に特化。

関連する教科書の節を読む →
TQM
てぃーきゅーえむ · Total Quality Management
2品質管理

総合的品質管理。3 本柱は『顧客重視・全員参加・継続的改善(カイゼン)』。日本の製造業の競争力の源泉となった経営手法。

関連する教科書の節を読む →
Level

準1級レベルの用語

ポアソン分布
ぽあそんぶんぷ · Poisson distribution
準1分布

単位時間あたり平均 回起こる稀な事象の発生回数の分布。

関連する教科書の節を読む →
指数分布
しすうぶんぷ · exponential distribution
準1分布

ポアソン過程の事象間隔(待ち時間)の分布。。無記憶性をもつ。

関連する教科書の節を読む →
多変量正規分布
たへんりょうせいきぶんぷ · multivariate normal
準1分布

正規分布の多次元版 。線形変換も周辺分布も条件付き分布も正規。

関連する教科書の節を読む →
ベイズの定理
べいずのていり · Bayes' theorem
準1ベイズ

事後分布 尤度 事前分布。データを見て信念を更新する公式。

関連する教科書の節を読む →
事後分布
じごぶんぷ · posterior distribution
準1ベイズ

データを観測した後の母数 の分布。点推定や信用区間の出発点。

関連する教科書の節を読む →
共役分布
きょうやくぶんぷ · conjugate prior
準1ベイズ

事前分布と尤度の組み合わせで、事後分布が同じ族の分布に閉じる関係。例: ベータ-二項。

関連する教科書の節を読む →
重回帰分析
じゅうかいきぶんせき · multiple regression
準1回帰

複数の説明変数を持つ線形回帰モデル。

関連する教科書の節を読む →
ロジスティック回帰
ろじすてぃっくかいき · logistic regression
準1回帰

二値応答変数(成功/失敗)を扱う GLM。オッズの対数 をモデル化する。係数 は「説明変数が 1 単位増えたときオッズが 倍になる」と解釈できる。マーケティング・医療で頻出。

関連する教科書の節を読む →
主成分分析
しゅせいぶんぶんせき · PCA (principal component analysis)
準1多変量

分散共分散行列の固有ベクトル方向に射影することで、多変量データを低次元に圧縮する手法。

関連する教科書の節を読む →
AR モデル
えーあーるもでる · autoregressive model
準1時系列

。過去の値で現在を予測する時系列モデル。

関連する教科書の節を読む →
ARIMA
ありま · ARIMA (autoregressive integrated moving average)
準1時系列

差分を取って定常化した後 ARMA でモデル化する非定常時系列の標準モデル。

関連する教科書の節を読む →
ベイズ推定
べいずすいてい · Bayesian estimation
準1ベイズ

事前分布とデータから事後分布 を求め、その分布(または期待値・MAP)で推定する方法。

関連する教科書の節を読む →
事前分布
じぜんぶんぷ · prior distribution
準1ベイズ

データを観察する前に持つパラメータ への信念を表す確率分布 。共役分布や無情報事前分布が代表的。

関連する教科書の節を読む →
偏相関係数
へんそうかんけいすう · partial correlation
準1多変量

他の変数の影響を統制(線形回帰で除去)した上での 2 変数の相関。見かけの相関と本当の関係を区別するのに使う。

関連する教科書の節を読む →
因子分析
いんしぶんせき · factor analysis
準1多変量

観測変数の背後に潜む少数の共通因子を抽出する手法。心理測定や品質工学で広く使われる。主成分分析と目的が異なる。

関連する教科書の節を読む →
クラスター分析
くらすたーぶんせき · cluster analysis
準1多変量

似たデータをグループ化する教師なし手法。階層的クラスタリング(ウォード法など)と非階層型(k-means)がある。

関連する教科書の節を読む →
一般化線形モデル
いっぱんかせんけいもでる · generalized linear model (GLM)
準1回帰

線形予測子 をリンク関数で結ぶ、線形回帰の一般化。正規・二項・ポアソンなど指数型分布族を扱える。

関連する教科書の節を読む →
リンク関数
りんくかんすう · link function
準1回帰

GLM で目的変数の期待値 と線形予測子 を結ぶ関数 。ロジット・対数・恒等など。

関連する教科書の節を読む →
生存時間解析
せいぞんじかんかいせき · survival analysis
準1応用

イベント発生までの時間を、打ち切り(まだ起きていないデータ)を考慮して扱う手法。カプラン・マイヤー・Cox 比例ハザードが代表。

関連する教科書の節を読む →
ハザード関数
はざーどかんすう · hazard function
準1応用

時刻 まで生存していた条件のもとで、その瞬間にイベントが起こる「率」。

関連する教科書の節を読む →
ホワイトノイズ
ほわいとのいず · white noise
準1時系列

平均 0・分散一定で、時刻間に相関がない時系列。予測モデルの「予測できない残差」が満たすべき性質。

関連する教科書の節を読む →
季節調整
きせつちょうせい · seasonal adjustment
準1時系列

時系列から季節パターンを取り除く処理。経済統計(GDP・小売販売額など)では原系列と季節調整値が併記される。

関連する教科書の節を読む →
教師あり学習
きょうしありがくしゅう · supervised learning
準1機械学習

正解ラベル付きのデータから入出力の関係を学習する枠組み。分類(離散ラベル)と回帰(連続値)に分かれる。

関連する教科書の節を読む →
教師なし学習
きょうしなしがくしゅう · unsupervised learning
準1機械学習

ラベルなしデータから構造(クラスター・低次元表現)を発見する枠組み。k-means・主成分分析・自己符号化器など。

関連する教科書の節を読む →
強化学習
きょうかがくしゅう · reinforcement learning
準1機械学習

エージェントが環境と相互作用し、報酬を最大化する行動方策を試行錯誤で学ぶ枠組み。AlphaGo・自動運転などで成功。

関連する教科書の節を読む →
過学習
かがくしゅう · overfitting
準1機械学習

訓練データに合わせ込みすぎ、未知データへの汎化性能が低下する現象。モデル複雑度に対しデータが少ないと起きやすい。

関連する教科書の節を読む →
正則化
せいそくか · regularization
準1機械学習

損失関数に係数の大きさへの罰則を加え過学習を抑える手法。L1(ラッソ・スパース化)と L2(リッジ・縮小)が代表的。

関連する教科書の節を読む →
交差検証
こうさけんしょう · cross validation
準1機械学習

データを K 分割し、各部分をテスト用に回しながら平均性能を評価する手法。少データでの汎化性能評価の標準手法。

関連する教科書の節を読む →
混同行列
こんどうぎょうれつ · confusion matrix
準1評価指標

分類予測を「真陽性・偽陽性・偽陰性・真陰性」の 4 マスにまとめた表。各種評価指標の出発点。

関連する教科書の節を読む →
適合率と再現率
てきごうりつとさいげんりつ · precision and recall
準1評価指標

適合率 = TP/(TP+FP)(陽性予測のうち本当に陽性)、再現率 = TP/(TP+FN)(本当の陽性のうち拾えた割合)。両者の調和平均が F1。

関連する教科書の節を読む →
ROC 曲線
あーるおーしーきょくせん · ROC curve
準1評価指標

閾値を動かしたときの「真陽性率(再現率)」と「偽陽性率」をプロットした曲線。曲線下面積 AUC が分類器の総合性能。

関連する教科書の節を読む →
勾配降下法
こうばいこうかほう · gradient descent
準1機械学習

損失関数の勾配方向と逆向きにパラメータを少しずつ更新する最適化法。バッチ・確率的(SGD)・ミニバッチがある。

関連する教科書の節を読む →
ニューラルネットワーク
にゅーらるねっとわーく · neural network
準1機械学習

線形変換と非線形活性化関数を多層に積んだ関数近似モデル。多層化したものをディープラーニングと呼ぶ。

関連する教科書の節を読む →
Transformer
とらんすふぉーまー · Transformer
準1機械学習

自己注意機構(self-attention)を中核とするディープラーニングモデル。BERT・GPT など現代の大規模言語モデルの基盤。

関連する教科書の節を読む →
バイアスとバリアンス
ばいあすとばりあんす · bias-variance tradeoff
準1機械学習

予測誤差はバイアス²(モデルの単純さの偏り)+ バリアンス(訓練データへの敏感さ)+ ノイズに分解される。両者のトレードオフがモデル選択の核心。

関連する教科書の節を読む →
ガンマ分布
がんまぶんぷ · gamma distribution
準1確率分布

形状パラメータ ・尺度 をもつ正値連続分布。 で指数分布、整数 でアーラン分布。待ち時間モデルや事前分布で頻出。

関連する教科書の節を読む →
ベータ分布
べーたぶんぷ · beta distribution
準1確率分布

区間 上の連続分布 。二項分布の共役事前分布として、比率のベイズ推定で標準的に使う。

関連する教科書の節を読む →
対数正規分布
たいすうせいきぶんぷ · log-normal distribution
準1確率分布

が正規分布に従う右に裾の長い分布。所得・株価・粒径分布など、乗算的に決まる量によく当てはまる。

関連する教科書の節を読む →
多項分布
たこうぶんぷ · multinomial distribution
準1確率分布

二項分布の多カテゴリ版。 回の試行で 個のカテゴリそれぞれに何回入るかの同時分布。

関連する教科書の節を読む →
マルコフ連鎖
まるこふれんさ · Markov chain
準1確率過程

次の状態が「現在の状態だけ」で決まる(過去に依存しない)確率過程。MCMC・状態空間モデルの基礎。

関連する教科書の節を読む →
移動平均
いどうへいきん · moving average
準1時系列

時系列を直近 期の平均で平滑化する基本手法。トレンド抽出やノイズ除去に使う。MA モデルとは別概念なので注意。

関連する教科書の節を読む →
指数平滑法
しすうへいかつほう · exponential smoothing
準1時系列

直近の値ほど重みを大きくする平滑化(重みが幾何的に減衰)。Holt・Holt–Winters でトレンド・季節性に拡張できる。

関連する教科書の節を読む →
状態空間モデル
じょうたいくうかんもでる · state space model
準1時系列

観測されない状態(state)が時間発展し、それを通じて観測値が得られるという定式化。カルマンフィルタが代表的推定手法。

関連する教科書の節を読む →
階層ベイズモデル
かいそうべいずもでる · hierarchical Bayesian model
準1ベイズ

事前分布のパラメータ自身にさらに分布(超事前分布)を仮定する多層モデル。グループ間で情報を共有し、推定を安定させる。

関連する教科書の節を読む →
ギブスサンプリング
ぎぶすさんぷりんぐ · Gibbs sampling
準1ベイズ

多次元の事後分布から、各変数を「他の変数を固定した条件付き分布」から順番にサンプルする MCMC 手法。

関連する教科書の節を読む →
メトロポリス・ヘイスティングス法
めとろぽりすへいすてぃんぐすほう · Metropolis–Hastings algorithm
準1ベイズ

提案分布から候補を発生させ、確率 で受容することで目標分布からのサンプルを得る MCMC の基本アルゴリズム。

関連する教科書の節を読む →
多次元尺度法
たじげんしゃくどほう · multidimensional scaling (MDS)
準1多変量

対象間の距離(類似度)を保つように、低次元(通常 2 次元)に布置する手法。アンケート分析やブランド地図で使う。

関連する教科書の節を読む →
決定木
けっていぎ · decision tree
準1機械学習

「ある特徴量が閾値以上か」で再帰的にデータを分割していくモデル。解釈しやすいが過学習しやすい。アンサンブルの基礎部品。

関連する教科書の節を読む →
ランダムフォレスト
らんだむふぉれすと · random forest
準1機械学習

ブートストラップ標本と特徴のランダム選択で多数の決定木を学習し、平均(または多数決)を取る代表的アンサンブル手法。

関連する教科書の節を読む →
勾配ブースティング
こうばいぶーすてぃんぐ · gradient boosting
準1機械学習

弱学習器(浅い木)を残差にフィットさせ、順次足し合わせる手法。XGBoost・LightGBM など実務分類で最も強力なアプローチの一つ。

関連する教科書の節を読む →
サポートベクターマシン
さぽーとべくたーましん · support vector machine (SVM)
準1機械学習

クラスを最もマージン広く分離する超平面を求める分類器。カーネルトリックで非線形分類にも拡張できる。

関連する教科書の節を読む →
k 近傍法
けーきんぼうほう · k-nearest neighbors (kNN)
準1機械学習

新しい点に最も近い 個の訓練点から多数決(分類)/平均(回帰)で予測する遅延学習。シンプルだが高次元で性能が落ちやすい。

関連する教科書の節を読む →
ナイーブベイズ
ないーぶべいず · naive Bayes
準1機械学習

特徴間の条件付き独立を仮定し、ベイズの定理で事後確率を計算する分類器。テキスト分類で高速かつ強力。

関連する教科書の節を読む →
アンサンブル学習
あんさんぶるがくしゅう · ensemble learning
準1機械学習

複数の弱い学習器を組み合わせて性能を上げる枠組み。バギング・ブースティング・スタッキングが三大手法。

関連する教科書の節を読む →
バギング
ばぎんぐ · bagging
準1機械学習

ブートストラップで作った複数標本で学習器を並列に訓練し、出力を平均/多数決する手法。バリアンスを下げる。ランダムフォレストの基礎。

関連する教科書の節を読む →
ブースティング
ぶーすてぃんぐ · boosting
準1機械学習

弱学習器を逐次的に学習し、誤りに重みをつけて次に活かす手法。バイアスを下げる。AdaBoost・勾配ブースティングが代表。

関連する教科書の節を読む →
ハイパーパラメータ
はいぱーぱらめーた · hyperparameter
準1機械学習

学習で最適化されず、事前に設定するパラメータ(学習率・木の深さ・正則化強度など)。グリッド/ランダム/ベイズ最適化で探索する。

関連する教科書の節を読む →
ドロップアウト
どろっぷあうと · dropout
準1機械学習

学習時に各ニューロンを確率 でランダムに無効化することで過学習を防ぐ正則化手法。推論時は全ユニットを使い出力をスケール。

関連する教科書の節を読む →
バッチ正規化
ばっちせいきか · batch normalization
準1機械学習

ミニバッチごとに中間層の出力を平均 0・分散 1 に正規化してから線形変換する手法。学習の高速化と安定化に大きく寄与する。

関連する教科書の節を読む →
アテンション機構
あてんしょんきこう · attention mechanism
準1機械学習

入力のどの部分にどれだけ注目するかを重み付けで動的に決める仕組み。Transformer の中核で、機械翻訳・LLM の性能を飛躍させた。

関連する教科書の節を読む →
転移学習
てんいがくしゅう · transfer learning
準1機械学習

大規模データで学習済みのモデル(例: ImageNet/BERT)を、別タスク用に再利用する枠組み。少データで高性能を得る現代の標準。

関連する教科書の節を読む →
ファインチューニング
ふぁいんちゅーにんぐ · fine-tuning
準1機械学習

事前学習済みモデルの一部または全パラメータを、目的タスクの少量データで追加学習する手法。LLM の業務カスタマイズで主流。

関連する教科書の節を読む →
説明可能 AI
せつめいかのうえーあい · explainable AI (XAI)
準1AI 倫理

AI モデルの予測根拠を人間が解釈できる形で示す技術や思想。SHAP・LIME・Grad-CAM などが代表。医療・与信などで必須。

関連する教科書の節を読む →
差分プライバシー
さぶんぷらいばしー · differential privacy
準1AI 倫理

個別レコードの有無で出力分布がほぼ変わらないようノイズを加え、個人特定リスクを定量的に保証するプライバシー保護技術。

関連する教科書の節を読む →
AI 倫理
えーあいりんり · AI ethics
準1AI 倫理

公平性・透明性・説明責任・プライバシー・安全性など、AI を社会で使う上での原則と実践。各国で AI ガバナンス枠組みが整備中。

関連する教科書の節を読む →
データ拡張
でーたかくちょう · data augmentation
準1機械学習

回転・反転・ノイズ付加などで訓練データを人工的に増やす手法。画像・音声で過学習抑制と汎化向上に大きく寄与する。

関連する教科書の節を読む →
ELSI
えるしー · ELSI (Ethical, Legal and Social Issues)
準1AI 倫理

新技術がもたらす倫理的・法的・社会的課題の総称。AI / ゲノム / 自動運転などで研究開発と並行して検討される。

関連する教科書の節を読む →
テンソル
てんそる · tensor
準1DL 数学

多次元配列。0 階=スカラー、1 階=ベクトル、2 階=行列、3 階以上=テンソル。DL では画像バッチを (N, C, H, W) の 4 階テンソルで扱うのが標準。

関連する教科書の節を読む →
順伝播
じゅんでんぱ · forward propagation
準1DL 基礎

ニューラルネットで、入力から出力に向かって計算を進める過程。各層で線形変換 + 活性化関数を順次適用する。

関連する教科書の節を読む →
誤差逆伝播法
ごさぎゃくでんぱほう · backpropagation
準1DL 基礎

損失関数の勾配を、出力層から入力層に向かって連鎖律で逐次的に計算するアルゴリズム。DL の学習を支える中核技術。

関連する教科書の節を読む →
ReLU
れる · ReLU (Rectified Linear Unit)
準1DL 基礎

活性化関数 。負の領域で勾配 0、正の領域で勾配 1。DL で勾配消失を緩和して学習を成功させた立役者。

関連する教科書の節を読む →
Softmax
そふとまっくす · softmax
準1DL 基礎

。多クラス分類の出力層で確率分布に変換。交差エントロピー損失と組合せて使う。

関連する教科書の節を読む →
勾配消失問題
こうばいしょうしつもんだい · vanishing gradient problem
準1DL 基礎

深いネットワークで逆伝播時に勾配が指数的に小さくなり、初期層が学習できなくなる現象。ReLU・残差接続・LSTM ゲートで緩和。

関連する教科書の節を読む →
残差接続
ざんさせつぞく · skip connection / residual connection
準1DL 基礎

。前層の入力を後層に直接足す経路。ResNet で 100 層以上の深層化を実現。

関連する教科書の節を読む →
Adam
あだむ · Adam optimizer
準1DL 基礎

Momentum と RMSProp を組合せた最適化アルゴリズム。各パラメータの学習率を適応的に調整。現在 DL の事実上のデフォルト。

関連する教科書の節を読む →
CNN
しーえぬえぬ · Convolutional Neural Network
準1DL モデル

畳み込み層 + プーリング層を中心に構成された、画像処理に特化した DL アーキテクチャ。LeNet から ResNet・EfficientNet まで多数の派生。

関連する教科書の節を読む →
プーリング
ぷーりんぐ · pooling
準1DL モデル

領域ごとに最大値(Max pooling)または平均(Average pooling)を取る操作。ダウンサンプリング + 位置のずれへの頑健性。

関連する教科書の節を読む →
LSTM
えるえすてぃーえむ · Long Short-Term Memory
準1DL モデル

RNN の一種。忘却・入力・出力の 3 ゲートを持ち、長期依存を学習可能。機械翻訳・音声認識で長らく主役だった。

関連する教科書の節を読む →
Self-Attention
せるふあてんしょん · self-attention
準1DL モデル

入力系列の各位置が他のすべての位置を参照する仕組み。 で計算。Transformer の中核。

関連する教科書の節を読む →
BERT
ばーと · BERT
準1DL モデル

Google が 2018 年に発表した Transformer Encoder ベースの事前学習モデル。マスクされた単語の予測(MLM)で学習し、ファインチューニングで様々な NLP タスクに適用。

関連する教科書の節を読む →
GPT
じーぴーてぃー · GPT (Generative Pre-trained Transformer)
準1DL モデル

OpenAI が 2018 年から発表している Transformer Decoder ベースの自己回帰生成モデル。次の単語予測で学習し、ChatGPT などの LLM の基盤に。

関連する教科書の節を読む →
VAE
ぶいえーいー · Variational Autoencoder
準1DL モデル

Encoder-Decoder で潜在変数の分布を学習する生成モデル。再構成誤差 + KL ダイバージェンスを最小化(ELBO 最大化)。

関連する教科書の節を読む →
GAN
がん · Generative Adversarial Network
準1DL モデル

生成器と識別器を競合させる生成モデル。生成器が偽物を作り、識別器が本物 / 偽物を判定。学習が不安定だが、高品質な生成が可能。

関連する教科書の節を読む →
拡散モデル
かくさんもでる · diffusion model
準1DL モデル

ノイズを段階的に加える順過程の逆を学習する生成モデル。Stable Diffusion・DALL-E 3 など現代の画像生成 AI の中核。

関連する教科書の節を読む →
RLHF
あーるえるえいちえふ · Reinforcement Learning from Human Feedback
準1強化学習

人間が比較した嗜好データから報酬モデルを学習し、LLM を強化学習で微調整する手法。ChatGPT・Claude などの『有用で安全な対話エージェント化』の核心技術。

関連する教科書の節を読む →
知識蒸留
ちしきじょうりゅう · knowledge distillation
準1DL 実装

大きい教師モデルの出力(soft target)を学習目標として、小さい生徒モデルを学習させる手法。BERT → DistilBERT が代表例。

関連する教科書の節を読む →
量子化
りょうしか · quantization
準1DL 実装

DL モデルの重み・活性を float32 から int8 などに変換し、サイズ・推論速度を改善する手法。エッジデバイスでの推論に必須。

関連する教科書の節を読む →
デザイン効果
でざいんこうか · design effect (deff)
準1標本設計

実際の標本設計の分散を、同じ n の単純無作為抽出と比べた比。deff < 1 で精度向上、deff > 1 で精度低下。クラスター抽出は通常 deff > 1。

関連する教科書の節を読む →
ネイマン配分
ねいまんはいぶん · Neyman allocation
準1標本設計

層化抽出で各層の標本サイズを (層サイズ × 層内標準偏差)で決める最適配分法。精度を最大化する。

関連する教科書の節を読む →
多重代入法
たじゅうだいにゅうほう · Multiple Imputation (MI)
準1標本設計

欠測値に対して複数のもっともらしい代入値を作り、各セットで推定 → Rubin's rules で統合する手法。代入の不確実性も含めて分散を計算できる。

関連する教科書の節を読む →
Level

1級レベルの用語

指数型分布族
しすうがたぶんぷぞく · exponential family
1理論

の形に書ける分布族。十分統計量・最尤推定との相性が抜群。

関連する教科書の節を読む →
十分統計量
じゅうぶんとうけいりょう · sufficient statistic
1理論

さえあれば、 の細部はもう について情報を持たない」という統計量。フィッシャー・ネイマンの分解定理で判定。

関連する教科書の節を読む →
最尤推定
さいゆうすいてい · maximum likelihood estimation (MLE)
1推定

尤度関数 を最大化するパラメータを推定値とする方法。一致性・漸近正規性・漸近有効性をもつ。

関連する教科書の節を読む →
フィッシャー情報量
ふぃっしゃーじょうほうりょう · Fisher information
1理論

。データが について持つ情報の量。

関連する教科書の節を読む →
クラメル・ラオの下限
くらめる・らおのかげん · Cramér–Rao lower bound
1理論

正則条件下で不偏推定量の分散の下限 。MLE は漸近的にこれを達成する。

関連する教科書の節を読む →
デルタ法
でるたほう · delta method
1漸近理論

から を導く道具。

関連する教科書の節を読む →
ネイマン・ピアソン補題
ねいまん・ぴあそんほだい · Neyman–Pearson lemma
1検定理論

単純仮説どうしの検定において、有意水準 のもとでの最強力検定が尤度比検定であることを保証する定理。

関連する教科書の節を読む →
尤度比検定
ゆうどひけんてい · likelihood ratio test
1検定理論

を使った検定。 が漸近的にカイ二乗分布に従う(ウィルクスの定理)。

関連する教科書の節を読む →
EM アルゴリズム
いーえむあるごりずむ · EM (expectation-maximization)
1計算統計

潜在変数モデルでの最尤推定を、E ステップと M ステップを繰り返して反復的に解く方法。GMM・HMM などに使う。

関連する教科書の節を読む →
MCMC
えむしーえむしー · Markov chain Monte Carlo
1計算統計

目標分布に収束するマルコフ連鎖を構成して、その軌跡をサンプルとして使うベイズ推論の主役手法。MH 法・ギブス法など。

関連する教科書の節を読む →
ブートストラップ
ぶーとすとらっぷ · bootstrap
1計算統計

観測標本から復元抽出で擬似標本を多数作り、推定量の分布や標準誤差を近似する汎用的な手法。

関連する教科書の節を読む →
一致推定量
いっちすいていりょう · consistent estimator
1推定理論

標本サイズ で母数に確率収束する推定量。最尤推定量は通常の正則条件下で一致性を持つ。

関連する教科書の節を読む →
漸近正規性
ぜんきんせいきせい · asymptotic normality
1推定理論

で正規分布に分布収束する性質。最尤推定量は正則条件下でこれを満たす。

関連する教科書の節を読む →
スコア関数
すこあかんすう · score function
1推定理論

対数尤度のパラメータ偏微分 。期待値 0 で、その分散がフィッシャー情報量。

関連する教科書の節を読む →
ベイズ因子
べいずいんし · Bayes factor
1ベイズ

2 つのモデル の周辺尤度の比 。ベイズ流のモデル比較・仮説検定の基本量。

関連する教科書の節を読む →
ジェフリーズ事前分布
じぇふりーずじぜんぶんぷ · Jeffreys prior
1ベイズ

フィッシャー情報量の平方根に比例する事前分布 。再パラメータ化で不変な無情報事前分布。

関連する教科書の節を読む →
完備十分統計量
かんびじゅうぶんとうけいりょう · complete sufficient statistic
1推定理論

十分性に加え「期待値が常に 0 ⇒ ほぼ確実に 0」となる(完備性)を満たす統計量。UMVUE 構成の鍵となる概念。

関連する教科書の節を読む →
ラオ・ブラックウェルの定理
らおぶらっくうぇるのていり · Rao–Blackwell theorem
1推定理論

推定量を十分統計量で条件付け期待値を取ると、分散が必ず減少する(または不変)という定理。UMVUE 構成の中心ツール。

関連する教科書の節を読む →
M 推定量
えむすいていりょう · M-estimator
1推定理論

目的関数 の最小化(または推定方程式の零点)で定義される推定量の総称。最尤・最小二乗・ロバスト推定を含む統一枠組み。

関連する教科書の節を読む →
カーネル密度推定
かーねるみつどすいてい · kernel density estimation
1ノンパラ

観測点に滑らかな核(ガウス核など)を載せて足し合わせ、確率密度を推定するノンパラ手法。バンド幅の選択が肝。

関連する教科書の節を読む →
経験分布関数
けいけんぶんぷかんすう · empirical distribution function
1ノンパラ

観測値から作る階段関数 。標本サイズが大きいと真の cdf に一様収束する(グリヴェンコ・カンテリの定理)。

関連する教科書の節を読む →
特異値分解
とくいちぶんかい · singular value decomposition (SVD)
1DL 数学

任意の行列 に分解。 は直交、 は非負特異値の対角。データ圧縮・PCA の高次元実装・推薦システムなどで使う。

関連する教科書の節を読む →
Horvitz-Thompson 推定量
ほーびっつとんぷそんすいていりょう · Horvitz-Thompson estimator
1標本設計

サンプリングウエイト (抽出確率の逆数)を使った母集団総計の不偏推定量 。標本調査の理論的中核。

関連する教科書の節を読む →