講演名 2018-03-12
Thompson抽出に基く分散協調型確率的Banditの検討
神村 素輝(阪大), 林 直樹(阪大), 高井 重昌(阪大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 機械学習の一種であるBandit問題は,複数の選択肢を相手に探索・活用のトレードオフを定式化し,オンライン広告やコグニティブ無線のチャンネル選択,ゲーム木探索など広い応用をもつ.今日の研究のほとんどはBanditアルゴリズムを実行するプレイヤーという存在が1人である場合のリグレット解析を行っており,マルチプレイヤーに対する研究は少ない.しかしIoT時代の本格到来が迫る今日,マルチプレイヤー版のBandit方策の重要性が増してきたと考えられる.本稿ではThompson抽出と呼ばれるアルゴリズムを分散協調的に実行する拡張について検討する.
抄録(英) The bandit problem is a mathematical model which formulates the trade-off between the exploration for the better strategy and the exploitation of the reliable knowledge obtained so far.The bandit problem has various applications such as online advertising systems, channel selection in cognitive radio systems, and game tree search in machine learning.Most of the recent research focuses on the situation with a single player. However, along with the rapid growth of IoT, the importance for multi-player bandit algorithms has been increasing.In this paper, we consider a distributed cooperative multi-player bandit algorithm based on the Thompson sampling method.
キーワード(和) Bandit問題 / Thompson抽出 / マルチプレイヤー
キーワード(英) Bandit problem / Thompson抽出 / Multi-player
資料番号 MSS2017-80
発行日 2018-03-05 (MSS)

研究会情報
研究会 MSS / NLP
開催期間 2018/3/12(から3日開催)
開催地(和) 大阪大学豊中キャンパス
開催地(英)
テーマ(和) SICE-DES研究会,IEICE-NLP, MSSの3研究会併催,一般および Work In Progress(WIP) ※(WIPセッションはDES,MSSのみ.「詳細はこちら」参照)
テーマ(英)
委員長氏名(和) 名嘉村 盛和(琉球大) / 安達 雅春(東京電機大)
委員長氏名(英) Morikazu Nakamura(Univ. of Ryukyus) / Masaharu Adachi(Tokyo Denki Univ.)
副委員長氏名(和) 髙井 重昌(阪大) / 高橋 規一(岡山大)
副委員長氏名(英) Shigemasa Takai(Osaka Univ.) / Norikazu Takahashi(Okayama Univ.)
幹事氏名(和) 豊嶋 伊知郎(東芝エネルギーシステムズ) / 金澤 尚史(阪大) / 坪根 正(長岡技科大) / 山内 将行(広島工大)
幹事氏名(英) Ichiro Toyoshima(Toshiba) / Takahumi Kanazawa(Osaka Univ.) / Tadashi Tsubone(Nagaoka Univ. of Tech.) / Masayuki Yamauchi(Hiroshima Inst. of Tech.)
幹事補佐氏名(和) 金城 秀樹(沖縄大) / 橘 俊宏(湘南工科大) / 木村 真之(京大)
幹事補佐氏名(英) Hideki Kinjo(Okinawa Univ.) / Toshihiro Tachibana(Shonan Inst. of Tech.) / Masayuki Kimura(Kyoto Univ.)

講演論文情報詳細
申込み研究会 Technical Committee on Mathematical Systems Science and its applications / Technical Committee on Nonlinear Problems
本文の言語 JPN
タイトル(和) Thompson抽出に基く分散協調型確率的Banditの検討
サブタイトル(和)
タイトル(英) Analysis of Distributed Cooperative Thompson Sampling
サブタイトル(和)
キーワード(1)(和/英) Bandit問題 / Bandit problem
キーワード(2)(和/英) Thompson抽出 / Thompson抽出
キーワード(3)(和/英) マルチプレイヤー / Multi-player
第 1 著者 氏名(和/英) 神村 素輝 / Motoki Kamimura
第 1 著者 所属(和/英) 大阪大学(略称:阪大)
Osaka University(略称:Osaka Univ.)
第 2 著者 氏名(和/英) 林 直樹 / Naoki Hayashi
第 2 著者 所属(和/英) 大阪大学(略称:阪大)
Osaka University(略称:Osaka Univ.)
第 3 著者 氏名(和/英) 高井 重昌 / Shigemasa Takai
第 3 著者 所属(和/英) 大阪大学(略称:阪大)
Osaka University(略称:Osaka Univ.)
発表年月日 2018-03-12
資料番号 MSS2017-80
巻番号(vol) vol.117
号番号(no) MSS-506
ページ範囲 pp.15-20(MSS),
ページ数 6
発行日 2018-03-05 (MSS)