ユーザ用ツール

サイト用ツール


機械学習:q_学習

差分

このページの2つのバージョン間の差分を表示します。

この比較画面へのリンク

次のリビジョン
前のリビジョン
機械学習:q_学習 [2016/04/01 19:41] – 作成 sakaimiho機械学習:q_学習 [2016/12/02 15:00] (現在) – 削除 n.arakawa
行 1: 行 1:
-#Q学習 
  
-強化学習の代表的な手法。 
-各状態(Situation)に対する、行動(Action)に対して、Q値が定義されます。 
-Q値というのは、強化学習の生みの親のBertoによると、Qualityの頭文字と考えることが出来ます。 
- 
-主な、情報として概略は[[Wikipedia|https://ja.wikipedia.org/wiki/Q%E5%AD%A6%E7%BF%92]]に載っている。 
-また戦略の方策決定方法として、 
機械学習/q_学習.1459507262.txt.gz · 最終更新: 2016/04/01 19:41 by sakaimiho