お知らせ 2023年度・2024年度 学生員 会費割引キャンペーン実施中です
お知らせ 技術研究報告と和文論文誌Cの同時投稿施策(掲載料1割引き)について
お知らせ 電子情報通信学会における研究会開催について
お知らせ NEW 参加費の返金について
電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
[ログイン]
技報アーカイブ
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2010-06-18 14:15
多本腕バンディット問題に対する綱引きモデルについて ~ 非局所的に相関した並列サーチのための生物からヒントを得た計算手法 ~
金 成主青野真士原 正彦理研NLP2010-4 NC2010-4
抄録 (和) 単細胞アメーバ・真性粘菌Physarum の光刺激回避行動に着想を得た「綱引きモデル」という並列探索アルゴリズムを提案する。このモデルでは、アメーバの複数の分枝が、環境情報を収集する探索エージェントとして機
能する。アメーバは、その総リソース量(総体積)を保存しつつ、複数の分枝を伸縮させることで光刺激を受容し、どの分枝を伸長させるかを決定する。このとき、保存則を介して生じる分枝間の「非局所的な相関」が、「多本腕バンディット問題」における“exploration–exploitation dilemma” と呼ばれるトレードオフ状況の効率的解決に寄与することを示す。また、他の分枝から伝わる光刺激情報がパフォーマンスに及ぼす影響についても報告する。 
(英) The ``tug-of-war (TOW) model'' proposed in this study is a unique method for parallel searches inspired by the photoavoidance behavior of the single-celled amoeba, the true slime mold \textit{Physarum}.
In the TOW model, many branches of the amoeba act as search agents to collect information on light stimulations while conserving the total sum of their resources.
We show that the ``nonlocal correlation'' via resource conservation can be advantageous to manage the ``exploration--exploitation dilemma'' for solving the multi-armed bandit problem.
We also show the effect of the information on light stimulations from other branches on the TOW model's performance.
キーワード (和) 強化学習 / 多本腕バンディット問題 / 生物からヒントを得た計算 / 並列探索 / / / /  
(英) reinforcement learning / multi-armed bandit problem / bio-inspired computing / parallel search / / / /  
文献情報 信学技報, vol. 110, no. 82, NLP2010-4, pp. 19-24, 2010年6月.
資料番号 NLP2010-4 
発行日 2010-06-11 (NLP, NC) 
ISSN Print edition: ISSN 0913-5685    Online edition: ISSN 2432-6380
著作権に
ついて
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
PDFダウンロード NLP2010-4 NC2010-4

研究会情報
研究会 NC NLP IPSJ-BIO  
開催期間 2010-06-18 - 2010-06-19 
開催地(和) 琉球大学50周年記念館 
開催地(英) Ryukyu-daigaku-gozyu-syunen-kinenn-kaikan 
テーマ(和) 機械学習によるバイオデータマインニング, 生命現象の非線形性, 一般 
テーマ(英) Machine Learning for bio-datamining 
講演論文情報の詳細
申込み研究会 NLP 
会議コード 2010-06-NC-NLP-BIO 
本文の言語 日本語 
タイトル(和) 多本腕バンディット問題に対する綱引きモデルについて 
サブタイトル(和) 非局所的に相関した並列サーチのための生物からヒントを得た計算手法 
タイトル(英) On the Tug-of-war Model for Multi-armed Bandit Problem: 
サブタイトル(英) Bio-inspired Computing Method for Nonlocally-correlated Parallel Searches 
キーワード(1)(和/英) 強化学習 / reinforcement learning  
キーワード(2)(和/英) 多本腕バンディット問題 / multi-armed bandit problem  
キーワード(3)(和/英) 生物からヒントを得た計算 / bio-inspired computing  
キーワード(4)(和/英) 並列探索 / parallel search  
キーワード(5)(和/英) /  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 金 成主 / Song-Ju Kim / キム ソンジュ
第1著者 所属(和/英) 理化学研究所 (略称: 理研)
RIKEN-HYU (略称: RIKEN)
第2著者 氏名(和/英/ヨミ) 青野 真士 / Masashi Aono / アオノ マサシ
第2著者 所属(和/英) 理化学研究所 (略称: 理研)
RIKEN-HYU (略称: RIKEN)
第3著者 氏名(和/英/ヨミ) 原 正彦 / Masahiko Hara / ハラ マサヒコ
第3著者 所属(和/英) 理化学研究所 (略称: 理研)
RIKEN-HYU (略称: RIKEN)
第4著者 氏名(和/英/ヨミ) / /
第4著者 所属(和/英) (略称: )
(略称: )
第5著者 氏名(和/英/ヨミ) / /
第5著者 所属(和/英) (略称: )
(略称: )
第6著者 氏名(和/英/ヨミ) / /
第6著者 所属(和/英) (略称: )
(略称: )
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者 第1著者 
発表日時 2010-06-18 14:15:00 
発表時間 25分 
申込先研究会 NLP 
資料番号 NLP2010-4, NC2010-4 
巻番号(vol) vol.110 
号番号(no) no.82(NLP), no.83(NC) 
ページ範囲 pp.19-24 
ページ数
発行日 2010-06-11 (NLP, NC) 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会