大会名称
2018年 情報科学技術フォーラム(FIT)
大会コ-ド
F
開催年
2018
発行日
2018-09-12
セッション番号
5f
セッション名
機械学習(3)
講演日
2018/09/20
講演場所(会議室等)
D棟D23
講演番号
F-042
タイトル
可視化によるDeep Q Networkの行動価値根拠の分析
著者名
長嶺一輝遠藤聡志山田孝治當間愛晃赤嶺有平
キーワード
深層強化学習, Deep Q Network
抄録
人間がビデオゲームといったタスクを解くとき、そのタスクに出現するオブジェクトやその位置関係などの視覚的特徴に注視する。画像ベースのゲームタスクにおいて人間並みのパフォーマンスを発揮する、Deep Q Network という深層強化学習アルゴリズムでも同様な事象が起きていると推測できる。そこで、本研究では、DQNが行動価値を計算する際に用いる CNN を Grad-CAM という手法で可視化して、学習過程でどのような特徴を捉えているか分析することを目的とする。
本文pdf
PDF download (438.7KB)