ユーザ用ツール

サイト用ツール


機械学習:q_学習

文書の過去の版を表示しています。


#Q学習

強化学習の代表的な手法。 各状態(Situation)に対する、行動(Action)に対して、Q値が定義されます。 Q値というのは、強化学習の生みの親のBertoによると、Qualityの頭文字と考えることが出来ます。

主な、情報として概略はhttps://ja.wikipedia.org/wiki/Q%E5%AD%A6%E7%BF%92に載っている。 また戦略の方策決定方法として、

機械学習/q_学習.1459507262.txt.gz · 最終更新: 2016/04/01 19:41 by sakaimiho