大会名称 |
---|
2016年 ソサイエティ大会 |
大会コ-ド |
2016S |
開催年 |
2016 |
発行日 |
2016-09-06 |
セッション番号 |
A-10 |
セッション名 |
システム数理と応用 |
講演日 |
2016/9/20 |
講演場所(会議室等) |
工学部 情報科学研究科棟 A22 |
講演番号 |
A-10-5 |
タイトル |
指数分布に従うバンディット問題に対するオーバーテイク手法の適用 |
著者名 |
◎佐野耕平, 上浦 基, |
キーワード |
機械学習, バンディット問題 |
抄録 |
バンディット問題とは機械学習の代表的なテーマの一つである。バンディット問題を解くのに重要なのは探索と搾取のジレンマをどのように解決するかであり、有名な手法にUCB手法が存在する。オーバーテイクアルゴリズムはUCBとは異なる理論で構築されている。この論文では、指数分布に従って報酬を返すバンディット問題で、二つの手法を比較した。 |
本文pdf |
PDF download
|