機械学習:q_学習

差分

このページの2つのバージョン間の差分を表示します。

この比較画面へのリンク

--- 機械学習:q_学習 [2016/12/02 14:45] – n.arakawa
+++ 機械学習:q_学習 [2016/12/02 15:00] (現在) – 削除 n.arakawa
@@ 行 1: / 行 1: @@
-==== Q学習 ====
-強化学習の代表的な手法。
-各状態（Situation）に対する、行動（Action）に対して Q値が定義されます。
-Q値というのは、強化学習の生みの親のBertoによると Qualityの先頭文字だそうです。
-⇒ [[https://ja.wikipedia.org/wiki/Q学習|Wikipedia]]

機械学習/q_学習.1480657532.txt.gz · 最終更新: 2016/12/02 14:45 by n.arakawa