ユーザ用ツール

サイト用ツール


機械学習:q_学習

差分

このページの2つのバージョン間の差分を表示します。

この比較画面へのリンク

両方とも前のリビジョン前のリビジョン
次のリビジョン
前のリビジョン
機械学習:q_学習 [2016/04/01 19:41] sakaimiho機械学習:q_学習 [2016/12/02 15:00] (現在) – 削除 n.arakawa
行 1: 行 1:
-#Q学習 
  
-強化学習の代表的な手法。 
-各状態(Situation)に対する、行動(Action)に対して、Q値が定義されます。 
-Q値というのは、強化学習の生みの親のBertoによると、Qualityの先頭文字だそうです。 
- 
-主な、情報として概略は[[Wikipedia|https://ja.wikipedia.org/wiki/Q%E5%AD%A6%E7%BF%92]]に載っている。 
-また戦略の方策決定方法として、 
機械学習/q_学習.1459507285.txt.gz · 最終更新: 2016/04/01 19:41 by sakaimiho