本文へスキップ
統計ロードマップ
Glossary

Q-learning

読み: きゅーらーにんぐ英: Q-learning1強化学習

定義

状態行動価値 Q(s, a) を学習し、最大 Q を選ぶ方策に従う強化学習アルゴリズム。Bellman 方程式に基づく。

関連する用語(強化学習)