機械学習:q_学習
差分
このページの2つのバージョン間の差分を表示します。
| 両方とも前のリビジョン前のリビジョン | |||
| 機械学習:q_学習 [2016/12/02 14:47] – n.arakawa | 機械学習:q_学習 [2016/12/02 15:00] (現在) – 削除 n.arakawa | ||
|---|---|---|---|
| 行 1: | 行 1: | ||
| - | ==== Q学習 ==== | ||
| - | 強化学習の代表的な手法\\ | ||
| - | 各状態(Situation)に対する行動(Action)に対して Q値が定義されます。\\ | ||
| - | Q値というのは、強化学習の生みの親のBertoによると Qualityの先頭文字だそうです。 | ||
| - | |||
| - | ⇒ [[https:// | ||
機械学習/q_学習.1480657649.txt.gz · 最終更新: 2016/12/02 14:47 by n.arakawa
