Blog

第3回全脳アーキテクチャハッカソンのご報告

 

 9月16日(土)〜18日(月・祝)、第3回全脳アーキテクチャハッカソンが、「目覚めよ海馬!:汎用人工知能プロトタイプにむけた海馬モデルの組み込み」をテーマに、開催されました。このハッカソンは、私たちのミッション「全脳アーキテクチャのオープンな開発を促進する」に基づくもので、重要な位置付けにあります。
 8チームが参加し、予め提供された新皮質+基底核モジュールと連携するように海馬モデルを提案・改良・実装することなどで、さまざまな認知タスクを実行できる脳型の認知アーキテクチャを目指しました。課題は迷路探索とし、神経科学的妥当性、工学的有用性、オリジナリティを基準に開発を競いました。

https://www.youtube.com/watch?v=bEpCuUiVlxw

 最終日に各チームによる発表が行われ、最終的に、最優秀賞、優秀賞、奨励賞(2件)、スポンサー賞(ふるや総合会計事務所賞:2件、ベジタデジタ賞:1件)が選出されました。

開催概要

  • 主催:NPO法人全脳アーキテクチャ・イニシアティブ(運営支援: WBAIサポーターズ)
  • 協力:ドワンゴ人工知能研究所
  • スポンサー:
    • ふるや総合会計事務所
  • 後援:人工知能学会汎用人工知能研究会
  • 後援:新学術領域研究 人工知能と脳科学の対照と融合
  • 後援:文部科学省 ポスト「京」萌芽的課題 「全脳シミュレーションと脳型人工知能」

取材記事

AINOW: http://ainow.ai/2017/11/02/123332/

ビジネス+IT 前編: https://www.sbbit.jp/article/cont1/34135

ビジネス+IT 後編: https://www.sbbit.jp/article/cont1/34200

発表内容

preplay を利用した探索の補助

チーム名:tiss

メンバー:石井琢満,鈴ヶ嶺聡哲

 “Preplay”とは、休息中や睡眠中に、経験に先立って、場所細胞の発火が起こる現象を指します。このチームは、マウスによる実験結果から「Preplayによって情報探索の基盤が作られるのでは」と考察し、この現象を利用した探索補助を実装しました。

 具体的な実装ではDeep Q Network の“Experience Replay”と同様に、ランダムサンプリングで画像とアクションをいくつか抽出しましたが、その中から、方針1「過去の経験から類似ベクトルを選ぶ(コサイン類似度で判定)」、方針2「PredNetを利用する」、の2つの方針でアクションの価値推定を試しました。方針1では、あまり良い結果は得られず、類似したものに対する行動をランダムに選択しており、予測とは言い難いことが分かりました。方針2では、いずれのアクションについても画像の予測は難しく、特に正面に進むときの画像の予測が難しいことが分かりました。

セルアセンブリの構築を目指して

チーム名:セルアセンブリの構築を目指して

メンバー:加藤雄貴,福田優太朗,栗原洸太,疋田聡

 海馬の構成要素は、歯状回やCA3, CA1などからなります。

 今回、このチームは、歯状回とCA3〜1に注目しました。歯状回は情報のキャッシュ、CA3〜CA1は時間表現を司っているとみなしました。

 2017年に提案されたNeural Episodic Controlという手法を用い、環境の特徴からQ学習を行うことで、海馬でのエピソード記憶を実装しようとする試みを行いました。

 また、歯状回のキャッシュ機能に相当するモジュールの作成ができましたが、DQNによる学習との差別化に課題が残りました。

エピソード記憶と価値推定による行動選択

チーム名:HM-SYS

メンバー:宮田真宏,早川博章,川添紗奈,栢沼晋太郎,堤優奈

 このチームはエピソード記憶、すなわち「いつ、どこで、誰と、何をしたか」に基づいた行動を実装しようと試みました。エピソード記憶を中心に海馬をモデル化することで、汎用的なエージェントになると考えたためです。

 エピソード記憶には、しばしば感情(価値)が付随すると考え、感覚器官からの特徴量の集合としてモデル化を行うことを検討。視覚情報、SFA階層ネットワーク、エピソード記憶(ランドマークなど遠くにある情報を抽出)、行動決定、報酬/感情(価値)をSFA階層ネットワークに戻しての学習……といった構造を持つモデルを作成し、規定課題において成果をあげることができました。

Brain-inspired A3C

チーム名:Brain-inspired A3C

メンバー:妹尾卓磨,菊池俊基,松森匠也,滝本佑介

 このチームは、2016年に大いに着目されたA3Cをベースにすることを考えました。タスクが公開された時に、「Experience Replay にはランダム性があるため、時系列が関わるタスクは難しいのではないか」と考えたと述べました。

 A3Cは高速、シンプル、ロバストな強化学習モデルであり、今回はBrain-inspired な A3Cモデルを作ることを試みました。海馬の機能のうち、エピソード記憶と空間認知機能に着目し、エピソード記憶を「価値を伴う記憶」として実装。エピソード記憶の鍵として、空間情報を付加しました。

 考察では、LSTMの導入が効果を発揮しなかったタスクに着目し、「探索の際に、端にはある程度長く留まるため探索が行えるが、通過してしまう真ん中の部分は探索しにくいのではないか」との考えなどを述べました。

DQN + VAE

チーム名:wba_hackathon_2017

メンバー:小山内 琢也

 このチームは、実装が間に合わなかったため、何をやりたかったかを中心に発表を行いました。

 VAE (Variational Autoencoder) の応用として、潜在変数zから次の最適な行動を選択できるのではないか、という仮説を立てました。

 実装方法としては、現在の状態を潜在変数zにエンコードし、VAEへの入力とすることで、次の行動を得ます。

 懸念点として、プラス報酬時の潜在変数zを記録し予測に利用するため、学習始めがどうしても安定しないことが挙げられました。そもそも、プラス報酬時の潜在変数が一定範囲に収まるのかという問題もあります。

 今回は残念ながら実装が完成しませんでしたが、今後、プログラムを完成させ、想定の正否を判断したり、チューニングや他の生成モデルの実装などを試みたいと語りました。

可視化の実験

チーム名:Engram

メンバー:麻生ひろゆき

 このチームは、探索課題に取り組むのではなく、Microsoft社の「HoloLens」を用いて、コネクトームのデータを可視化することに取り組みました。

DQNへのLSTMの適用

チーム名:EK-Kaiba

メンバー:衛澤峰,岸海斗

 海馬のCA3野は、反回性回路を持ち、再帰性を持つ、と考えられてきました。この知見に基づいて、与えられたサンプルコードにLSTMを組み込み、海馬のCA3野を再現することを試みました。

 通常のDQNと異なり、ステップごとに状態を更新するのではなく、エピソード全体の状態遷移を一つの時系列データとして学習させる必要があります。そのため、このチームでは、DQNによく用いられるExperience Replay は敢えて用いないことにしました。

 残念ながら、不具合を解消できなかったため、動作させることができませんでした。今後、どこに問題があったのかを調べたいと語りました。

わかったの瞬間

チーム名:わかったの瞬間

メンバー:戸田惠介

 このチームは、各方向に評価値を持ったセルオートマトンを用いることで、移動した経路を抽象化しようと考えましたが、実装を完成させることができませんでした。

 今後は、まずは今回の実装を完成させることを考えた上で、「汎用AIを目指す一人として、脳や神経との整合性はとても気になる。西日本(九州)でもこうしたイベントをやりたい」と語りました。

審査結果

奨励賞 2件

  • tiss
  • セルアセンブリの構築を目指して

優秀賞

  • HM-SYS

最優秀賞

  • Brain-inspired A3C

スポンサー賞

  • ふるや総合会計事務所賞
    • tiss
    • HM-SYS
  • ベジタデジタ賞
    • わかったの瞬間

 

 

 

Leave a Comment

Name*

Email* (never published)

Website

%d人のブロガーが「いいね」をつけました。