ホーム›用語集›報酬関数Glossary報酬関数☆読み: ほうしゅうかんすう英: Reward Function1級強化学習定義強化学習で各 (状態, 行動) に対して報酬を返す関数。設計が学習結果を大きく左右する。関連する用語(強化学習)RLHFあーるえるえいちえふMDPえむでぃーぴーQ-learningきゅーらーにんぐDQNでぃーきゅーえぬPolicy GradientぽりしーぐらでぃえんとPPOぴーぴーおーActor-CriticあくたーくりてぃっくBellman 方程式べるまんほうていしき割引率わりびきりつ経験再生けいけんさいせい指数型分布族しすうがたぶんぷぞく十分統計量じゅうぶんとうけいりょう← 用語集トップへサイト内を検索