講演名 2015-06-23
HedgeとExp3アルゴリズム間の橋渡し
中村 篤祥(北大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) Hedgeアルゴリズムは,それまでのパフォーマンスに基づく確率分布に従ってエキスパートを選択するオンライン学習アルゴリズムである.Hedgeは選択したエキスパートのみでなく,すべてのエキスパートの利得を毎回知ることができるフルインフォメーション設定において動作するように設計されているが,選択したエキスパートの利得のみ知ることができるバンディット設定において動作するように改造された版はExp3アルゴリズムとして知られている.本稿では,これら2つの設定をパラメータ${gamma_i}$で結ぶ新しいモデルを考え,2つのアルゴリズムの拡張であるHExp3アルゴリズムを提案し,擬似リグレットの上界と下界を証明する.
抄録(英) Hedge is an online learning algorithm that draws an expert according to a probability distribution which depends on the performance of each expert so far. Hedge works for the {em full-information} setting, in which the rewards of all the experts are revealed. Exp3 is a Hedge-based algorithm modified so as to work for {em bandit} setting, in which only the reward of the selectedexpert is revealed. In this paper, we consider a new model with parameters ${gamma_i}$ that connect the two settings, and propose HExp3 algorithm that is an extension of both the two algorithms. We show upper and lower bounds of pseudo regret of HExp3.
キーワード(和) オンライン学習 / バンディット / リグレット分析
キーワード(英) online learning / bandit / regret analysis
資料番号 IBISML2015-13
発行日 2015-06-16 (IBISML)

研究会情報
研究会 NC / IPSJ-BIO / IBISML / IPSJ-MPS
開催期間 2015/6/23(から3日開催)
開催地(和) 沖縄科学技術大学院大学
開催地(英) Okinawa Institute of Science and Technology
テーマ(和) 機械学習によるバイオデータマインニング、一般
テーマ(英) Machine Learning Approach to Biodata Mining, and General
委員長氏名(和) 斎藤 利通(法政大) / 関嶋 政和(東工大) / 鷲尾 隆(阪大) / 庄野 逸(電通大)
委員長氏名(英) Toshimichi Saito(Hosei Univ.) / Masakazu Sekijima(東工大) / Takashi Washio(Osaka Univ.) / Hayaru Shouno(電通大)
副委員長氏名(和) 佐藤 茂雄(東北大) / / 福水 健次(統計数理研) / 杉山 将(東工大)
副委員長氏名(英) Shigeo Sato(Tohoku Univ.) / / Kenji Fukumizu(ISM) / Masashi Sugiyama(Tokyo Inst. of Tech.)
幹事氏名(和) 堀尾 恵一(九工大) / 田中 宏喜(京都産大) / 大羽 成征(京大) / 瀬々 潤(お茶の水女子大) / 吉本 潤一郎(OIST) / 松井 知子(統計数理研) / 大羽 成征(京大) / 小野 智司(鹿児島大) / 但馬 康宏(岡山県立大) / 林田 守広(京大) / 岩田 具治(NTT) / 吉田 哲也(北大) / 松田 健(静岡理工科大)
幹事氏名(英) Keiichi Horio(Kyushu Inst. of Tech.) / Hiroki Tanaka(Kyoto Sangyo Univ.) / Shigeyuki Oba(京大) / Jun Sese(お茶の水女子大) / Junichiro Yoshimoto(OIST) / Tomoko Matsui(ISM) / Shigeyuki Ohba(Kyoto Univ.) / Satoshi Ono(鹿児島大) / Yasuhiro Tajima(岡山県立大) / Morihiro Hayashida(京大) / Tomoharu Iwata(NTT) / Tetsuya Yoshida(北大) / Takeshi Matsuda(静岡理工科大)
幹事補佐氏名(和) 神原 裕行(東工大) / 秋間 学尚(東北大) / / 津田 宏治(東大) / 鹿島 久嗣(京大)
幹事補佐氏名(英) Hiroyuki Kanbara(Tokyo Inst. of Tech.) / Hisanao Akima(Tohoku Univ.) / / Koji Tsuda(Univ. of Tokyo) / Hisashi Kashima(Kyoto Univ.)

講演論文情報詳細
申込み研究会 Technical Committee on Neurocomputing / Special Interest Group on Bioinformatics and Genomics / Technical Committee on Infomation-Based Induction Sciences and Machine Learning / Special Interest Group on Mathematical Modeling and Problem Solving
本文の言語 JPN
タイトル(和) HedgeとExp3アルゴリズム間の橋渡し
サブタイトル(和)
タイトル(英) A Bridge between Hedge and Exp3 Algorithms
サブタイトル(和)
キーワード(1)(和/英) オンライン学習 / online learning
キーワード(2)(和/英) バンディット / bandit
キーワード(3)(和/英) リグレット分析 / regret analysis
第 1 著者 氏名(和/英) 中村 篤祥 / Atsuyoshi Nakamura
第 1 著者 所属(和/英) 北海道大学(略称:北大)
Hokkaido University(略称:Hokkaido Univ.)
発表年月日 2015-06-23
資料番号 IBISML2015-13
巻番号(vol) vol.115
号番号(no) IBISML-112
ページ範囲 pp.81-86(IBISML),
ページ数 6
発行日 2015-06-16 (IBISML)