スパイキングニューラルネットワークとreward-modulated STDPによるリザバーコンピューティング

鶴海 杭之; 田中 剛平

講演名	2022-06-09 スパイキングニューラルネットワークとreward-modulated STDPによるリザバーコンピューティング鶴海杭之(東大), 田中剛平(東大),
PDFダウンロードページ	PDFダウンロードページへ
抄録(和)	先行研究にて，リザバーコンピューティングの代表的なモデルであるecho state network（ESN）の学習則としてreward-modulated Hebbian learning （RMHL）を用いて，非線形性やワーキングメモリを必要とするタスクが遂行できることが確かめられている．また，ESNより生物学的妥当性の高い，スパイキングニューラルネットワーク（SNN）を用いたリザバーコンピューティングの代表的なモデルであるliquid state machine（LSM）を，強化学習に使った研究はあるが，RMHLに類似したSNNの学習則であるreward-modulated STDP（RM-STDP）が学習則として用いられたことはなかった．本発表では，リザバーにSNNを用い，RM-STDPによって学習するリザバーコンピューティングを，線形分離不可能なXOR問題に適用した実験について発表する．
抄録(英)	In a previous study, it was verified that tasks requiring nonlinearity and working memory can be performed using reward-modulated Hebbian learning (RMHL) as a learning rule for echo state networks (ESN), which is a representative model for reservoir computing. Also, some studies have used liquid state machines (LSM) for reinforcement learning, which is a more biologically relevant model for reservoir computing based on spiking neural networks (SNN) than the ESNs. However, reward-modulated STDP (RM-STDP), which is a learning rule for SNN similar to RMHL, has not been used as a learning rule in those studies. In this presentation, we will show an experiment in which a reservoir computing model based on an SNN reservoir and RM-STDP, is applied to the linearly inseparable XOR problem.
キーワード(和)	スパイキングニューラルネットワーク / reward-modulated STDP / リザバーコンピューティング / 強化学習
キーワード(英)	spiking neural network / reward-modulated STDP / reservoir computing / reinforcement learning
資料番号	NLP2022-7,CCS2022-7
発行日	2022-06-02 (NLP, CCS)

研究会情報
研究会	CCS / NLP
開催期間	2022/6/9(から2日開催)
開催地（和）	大阪大学豊中キャンパスシグマホール
開催地（英）
テーマ（和）	一般
テーマ（英）
委員長氏名（和）	赤井恵(北大) / 常田明夫(熊本大)
委員長氏名（英）	Megumi Akai(Hokkaido Univ.) / Akio Tsuneda(Kumamoto Univ.)
副委員長氏名（和）	会田雅樹(都立大) / 中野秀洋(東京都市大) / 鳥飼弘幸(法政大)
副委員長氏名（英）	Masaki Aida(TMU) / Hidehiro Nakano(Tokyo City Univ.) / Hiroyuki Torikai(Hosei Univ.)
幹事氏名（和）	眞田耕輔(三重大) / 宮田純子(芝浦工大) / 吉岡大三郎(崇城大) / 伊藤大輔(岐阜大)
幹事氏名（英）	Kosuke Sanada(TDK) / Sumiko Miyata(Shibaura Insti. of Tech.) / Daisaburo Yoshioka(Sojo Univ.) / Daisuke Ito(Gifu Univ.)
幹事補佐氏名（和）	佐々木智志(湘南工科大学) / 安東弘泰(筑波大) / 小林幹(立正大学) / 安田裕之(東京大学) / 横井裕一(長崎大) / 山仲芳和(宇都宮大)
幹事補佐氏名（英）	Tomoyuki Sasaki(Shonan Instit. of Tech.) / Hiroyasu Ando(Tsukuba Univ.) / Miki Kobayashi(Rissho Univ.) / " Hiroyuki YASUDA(The Univ. of Tokyo) / Yuichi Yokoi(Nagasaki Univ.) / Yoshikazu Yamanaka(Utsunomiya Univ.)

講演論文情報詳細
申込み研究会	Technical Committee on Complex Communication Sciences / Technical Committee on Nonlinear Problems
本文の言語	JPN
タイトル（和）	スパイキングニューラルネットワークとreward-modulated STDPによるリザバーコンピューティング
サブタイトル（和）
タイトル（英）	Reservoir computing with spiking neural networks and reward-modulated STDP
サブタイトル（和）
キーワード(1)（和/英）	スパイキングニューラルネットワーク / spiking neural network
キーワード(2)（和/英）	reward-modulated STDP / reward-modulated STDP
キーワード(3)（和/英）	リザバーコンピューティング / reservoir computing
キーワード(4)（和/英）	強化学習 / reinforcement learning
第 1 著者氏名（和/英）	鶴海杭之 / Takayuki Tsurumi
第 1 著者所属（和/英）	東京大学(略称：東大) The University of Tokyo(略称：UTokyo)
第 2 著者氏名（和/英）	田中剛平 / Gouhei Tanaka
第 2 著者所属（和/英）	東京大学(略称：東大) The University of Tokyo(略称：UTokyo)
発表年月日	2022-06-09
資料番号	NLP2022-7,CCS2022-7
巻番号（vol）	vol.122
号番号（no）	NLP-65,CCS-66
ページ範囲	pp.31-35(NLP), pp.31-35(CCS),
ページ数	5
発行日	2022-06-02 (NLP, CCS)