差分
このページの2つのバージョン間の差分を表示します。
次のリビジョン 両方とも次のリビジョン | |||
機械学習:強化学習 [2016/02/18 11:12] asakawa 作成 |
機械学習:強化学習 [2016/02/18 12:05] asakawa |
||
---|---|---|---|
行 9: | 行 9: | ||
2014年には強化学習の手法とディープラーニングとを組み合わせて,アタリのビデオゲームを行う DQN と名付けられたシステムがゲームによっては人間の成績を上回ることで話題になりました。 | 2014年には強化学習の手法とディープラーニングとを組み合わせて,アタリのビデオゲームを行う DQN と名付けられたシステムがゲームによっては人間の成績を上回ることで話題になりました。 | ||
- | - Q 学習 | + | - [[機械学習: |
- | - TD 学習 | + | - [[機械学習: |
- | - アクタークリティック法 (Actor Qritique Methods) | + | - [[機械学習: |