ユーザ用ツール

サイト用ツール


機械学習:q_学習

文書の過去の版を表示しています。


Q学習

強化学習の代表的な手法
各状態(Situation)に対する行動(Action)に対して Q値が定義されます。
Q値というのは、強化学習の生みの親のBertoによると Qualityの先頭文字だそうです。

Wikipedia

機械学習/q_学習.1480657649.txt.gz · 最終更新: 2016/12/02 14:47 by n.arakawa