講演名 2022-06-09
スパイキングニューラルネットワークとreward-modulated STDPによるリザバーコンピューティング
鶴海 杭之(東大), 田中 剛平(東大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 先行研究にて,リザバーコンピューティングの代表的なモデルであるecho state network(ESN)の学習則としてreward-modulated Hebbian learning (RMHL)を用いて,非線形性やワーキングメモリを必要とするタスクが遂行できることが確かめられている.また,ESNより生物学的妥当性の高い,スパイキングニューラルネットワーク(SNN)を用いたリザバーコンピューティングの代表的なモデルであるliquid state machine(LSM)を,強化学習に使った研究はあるが,RMHLに類似したSNNの学習則であるreward-modulated STDP(RM-STDP)が学習則として用いられたことはなかった.本発表では,リザバーにSNNを用い,RM-STDPによって学習するリザバーコンピューティングを,線形分離不可能なXOR問題に適用した実験について発表する.
抄録(英) In a previous study, it was verified that tasks requiring nonlinearity and working memory can be performed using reward-modulated Hebbian learning (RMHL) as a learning rule for echo state networks (ESN), which is a representative model for reservoir computing. Also, some studies have used liquid state machines (LSM) for reinforcement learning, which is a more biologically relevant model for reservoir computing based on spiking neural networks (SNN) than the ESNs. However, reward-modulated STDP (RM-STDP), which is a learning rule for SNN similar to RMHL, has not been used as a learning rule in those studies. In this presentation, we will show an experiment in which a reservoir computing model based on an SNN reservoir and RM-STDP, is applied to the linearly inseparable XOR problem.
キーワード(和) スパイキングニューラルネットワーク / reward-modulated STDP / リザバーコンピューティング / 強化学習
キーワード(英) spiking neural network / reward-modulated STDP / reservoir computing / reinforcement learning
資料番号 NLP2022-7,CCS2022-7
発行日 2022-06-02 (NLP, CCS)

研究会情報
研究会 CCS / NLP
開催期間 2022/6/9(から2日開催)
開催地(和) 大阪大学 豊中キャンパス シグマホール
開催地(英)
テーマ(和) 一般
テーマ(英)
委員長氏名(和) 赤井 恵(北大) / 常田 明夫(熊本大)
委員長氏名(英) Megumi Akai(Hokkaido Univ.) / Akio Tsuneda(Kumamoto Univ.)
副委員長氏名(和) 会田 雅樹(都立大) / 中野 秀洋(東京都市大) / 鳥飼 弘幸(法政大)
副委員長氏名(英) Masaki Aida(TMU) / Hidehiro Nakano(Tokyo City Univ.) / Hiroyuki Torikai(Hosei Univ.)
幹事氏名(和) 眞田 耕輔(三重大) / 宮田 純子(芝浦工大) / 吉岡 大三郎(崇城大) / 伊藤 大輔(岐阜大)
幹事氏名(英) Kosuke Sanada(TDK) / Sumiko Miyata(Shibaura Insti. of Tech.) / Daisaburo Yoshioka(Sojo Univ.) / Daisuke Ito(Gifu Univ.)
幹事補佐氏名(和) 佐々木 智志(湘南工科大学) / 安東 弘泰(筑波大) / 小林 幹(立正大学) / 安田 裕之(東京大学) / 横井 裕一(長崎大) / 山仲 芳和(宇都宮大)
幹事補佐氏名(英) Tomoyuki Sasaki(Shonan Instit. of Tech.) / Hiroyasu Ando(Tsukuba Univ.) / Miki Kobayashi(Rissho Univ.) / " Hiroyuki YASUDA(The Univ. of Tokyo) / Yuichi Yokoi(Nagasaki Univ.) / Yoshikazu Yamanaka(Utsunomiya Univ.)

講演論文情報詳細
申込み研究会 Technical Committee on Complex Communication Sciences / Technical Committee on Nonlinear Problems
本文の言語 JPN
タイトル(和) スパイキングニューラルネットワークとreward-modulated STDPによるリザバーコンピューティング
サブタイトル(和)
タイトル(英) Reservoir computing with spiking neural networks and reward-modulated STDP
サブタイトル(和)
キーワード(1)(和/英) スパイキングニューラルネットワーク / spiking neural network
キーワード(2)(和/英) reward-modulated STDP / reward-modulated STDP
キーワード(3)(和/英) リザバーコンピューティング / reservoir computing
キーワード(4)(和/英) 強化学習 / reinforcement learning
第 1 著者 氏名(和/英) 鶴海 杭之 / Takayuki Tsurumi
第 1 著者 所属(和/英) 東京大学(略称:東大)
The University of Tokyo(略称:UTokyo)
第 2 著者 氏名(和/英) 田中 剛平 / Gouhei Tanaka
第 2 著者 所属(和/英) 東京大学(略称:東大)
The University of Tokyo(略称:UTokyo)
発表年月日 2022-06-09
資料番号 NLP2022-7,CCS2022-7
巻番号(vol) vol.122
号番号(no) NLP-65,CCS-66
ページ範囲 pp.31-35(NLP), pp.31-35(CCS),
ページ数 5
発行日 2022-06-02 (NLP, CCS)