機械学習:q_学習

差分

このページの2つのバージョン間の差分を表示します。

この比較画面へのリンク

--- 機械学習:q_学習 [2016/04/01 19:41] – sakaimiho
+++ 機械学習:q_学習 [2016/12/02 15:00] (現在) – 削除 n.arakawa
@@ 行 1: / 行 1: @@
-#Q学習
-強化学習の代表的な手法。
-各状態(Situation)に対する、行動(Action)に対して、Q値が定義されます。
-Q値というのは、強化学習の生みの親のBertoによると、Qualityの先頭文字だそうです。
-主な、情報として概略は[[Wikipedia|https://ja.wikipedia.org/wiki/Q%E5%AD%A6%E7%BF%92]]に載っている。
-また戦略の方策決定方法として、

機械学習/q_学習.1459507285.txt.gz · 最終更新: 2016/04/01 19:41 by sakaimiho