Glossary

報酬関数

読み: ほうしゅうかんすう英: Reward Function1級強化学習

定義

強化学習で各 (状態, 行動) に対して報酬を返す関数。設計が学習結果を大きく左右する。

関連する用語(強化学習)