講演名 2017-06-29
複素ニューラルネットワークを用いた複素強化学習手法
持田 昌樹(東京都市大), 中野 秀洋(東京都市大), 宮内 新(東京都市大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 複素強化学習における行動価値関数を複素ニューラルネットワークによって近似する手法を示す.複素強化学習は行動価値を複素数に拡張し,文脈情報を付加することで少ないメモリと計算によって不完全知覚環境に対応する.多数の状態を有する大規模な環境に適用するために,本論文では複素ニューラルネットワークを用いた行動価値関数の関数近似を導入する.状態に連続値を持つMountain Car 環境でシミュレーション実験を行う.
抄録(英) This paper proposes the method to approximate the action-value function in complex-valued reinforcement learning by using complex-valued neural networks. Complex-valued reinforcement learning extends action–values to complex numbers and adding action-values to some context information enables the learning algorithm to adapt perceptual aliasing with less memory usage. In order to apply larger environment with the large number of sates, this paper introduces the function approximation for the action-value function by using complex-valued neural networks. We perform simulation experiments on the Mountain Car environment which has continuous states.
キーワード(和) 強化学習 / 不完全知覚 / 複素強化学習 / 複素ニューラルネットワーク
キーワード(英) reinforcement learning / perceptual aliasing / complex-valued reinforcement learning / complex-valued neural networks
資料番号 CCS2017-1
発行日 2017-06-22 (CCS)

研究会情報
研究会 CCS
開催期間 2017/6/29(から2日開催)
開催地(和) 茨城大学工学部日立キャンパス
開催地(英) Ibaraki Univ.
テーマ(和) 相互作用(インタラクション)と情報伝達(コミュニケーション)
テーマ(英) Interaction and Communication, etc.
委員長氏名(和) 若宮 直紀(阪大)
委員長氏名(英) Naoki Wakamiya(Osaka Univ.)
副委員長氏名(和) 長谷川 幹雄(東京理科大) / 成瀬 誠(NICT)
副委員長氏名(英) Mikio Hasegawa(Tokyo Univ. of Science) / Makoto Naruse(NICT)
幹事氏名(和) 寺前 順之介(阪大) / 中野 秀洋(東京都市大)
幹事氏名(英) Junnosuke Teramae(Osaka Univ.) / Hidehiro Nakano(Tokyo City Univ.)
幹事補佐氏名(和) 高野 知佐(広島市立大) / 島田 尚(東大) / 鈴木 智也(茨城大) / 高橋 亮(愛知工科大)
幹事補佐氏名(英) Chisa Takano(Hirishima City Univ.) / Takashi Shimada(Univ. of Tokyo) / Tomoya Suzuki(Ibaraki Univ.) / Ryo Takahashi(AUT)

講演論文情報詳細
申込み研究会 Technical Committee on Complex Communication Sciences
本文の言語 JPN
タイトル(和) 複素ニューラルネットワークを用いた複素強化学習手法
サブタイトル(和)
タイトル(英) A Complex-Valued Reinforcement Learning Method Using Complex-Valued Neural Networks
サブタイトル(和)
キーワード(1)(和/英) 強化学習 / reinforcement learning
キーワード(2)(和/英) 不完全知覚 / perceptual aliasing
キーワード(3)(和/英) 複素強化学習 / complex-valued reinforcement learning
キーワード(4)(和/英) 複素ニューラルネットワーク / complex-valued neural networks
第 1 著者 氏名(和/英) 持田 昌樹 / Masaki Mochida
第 1 著者 所属(和/英) 東京都市大学(略称:東京都市大)
Tokyo City University(略称:Tokyo City Univ.)
第 2 著者 氏名(和/英) 中野 秀洋 / Hidehiro Nakano
第 2 著者 所属(和/英) 東京都市大学(略称:東京都市大)
Tokyo City University(略称:Tokyo City Univ.)
第 3 著者 氏名(和/英) 宮内 新 / Arata Miyauchi
第 3 著者 所属(和/英) 東京都市大学(略称:東京都市大)
Tokyo City University(略称:Tokyo City Univ.)
発表年月日 2017-06-29
資料番号 CCS2017-1
巻番号(vol) vol.117
号番号(no) CCS-112
ページ範囲 pp.1-5(CCS),
ページ数 5
発行日 2017-06-22 (CCS)