機械学習:lstm代替案

文書の過去の版を表示しています。


LSTMとは

LSTMは、リカレントニューラルネットワークのアーキテクチャーをもとに、1997年に Sepp Hochreiter and Jürgen Schmidhuberによって提唱されたモデルです。リカレントニューラルネットワークと同様に、ニューラルネットワークでは扱いが難しかった時系列データ(文章、音声、映像)に対して有効な手法です。

リカレントネットワークモデルと比べ、短期記憶の影響を長期に渡って保持する能力を持つことで長期的な依存関係を学習出来ない問題を回避しました。このため未知のサイズで時間的な遅れがある場合には、リカレントニューラルネットワークよりも経験からより良く学ぶ傾向があります。

・Cahiner ・Karpath

参考記事として、概要としてはChristopher Olah氏のブログ記事、全脳アーキテクチャー若手の会の八木氏の資料「わかるLSTM~ 最近の動向と共に」 により分かりやすい説明内容が書いてあります。また、LSTMのパラメタ評価としてGreff(2015)が参考になります。

  • 機械学習/lstm代替案.1457607640.txt.gz
  • 最終更新: 2016/03/10 20:00
  • by sakaimiho