機械学習:q_学習
差分
このページの2つのバージョン間の差分を表示します。
両方とも前のリビジョン前のリビジョン次のリビジョン | 前のリビジョン | ||
機械学習:q_学習 [2016/04/01 19:41] – sakaimiho | 機械学習:q_学習 [2016/12/02 15:00] (現在) – 削除 n.arakawa | ||
---|---|---|---|
行 1: | 行 1: | ||
- | #Q学習 | ||
- | 強化学習の代表的な手法。 | ||
- | 各状態(Situation)に対する、行動(Action)に対して、Q値が定義されます。 | ||
- | Q値というのは、強化学習の生みの親のBertoによると、Qualityの先頭文字だそうです。 | ||
- | |||
- | 主な、情報として概略は[[Wikipedia|https:// | ||
- | また戦略の方策決定方法として、 |
機械学習/q_学習.1459507285.txt.gz · 最終更新: 2016/04/01 19:41 by sakaimiho