講演抄録/キーワード |
講演名 |
2020-03-11 15:35
一般のベータ事前分布を用いたトンプソンサンプリングのリグレット解析 ○川村優斗・田中利幸(京大) IBISML2019-49 |
抄録 |
(和) |
ベルヌーイバンディットに対するトンプソンサンプリングにおいて、事前分布として一様分布を用いた際のリグレットの漸近最適性は既に証明されている。しかし、一般の事前分布に対するリグレットの理論解析は十分になされていない。本研究では、事前分布を一般のベータ分布に拡張し、リグレットの漸近最適性を証明した。 |
(英) |
For Bernoulli bandits, the asymptotic optimality of Thompson sampling with the uniform prior in terms of the regret has already been established. However, regret analysis of Thompson sampling with other priors has not been well studied. In this paper, we perform regret analysis of Thompson sampling with the general beta prior and prove its asymptotic optimality. |
キーワード |
(和) |
ベルヌーイバンディット / トンプソンサンプリング / リグレット / 漸近最適性 / / / / |
(英) |
Bernoulli bandit / Thompson sampling / regret / asymptotic optimality / / / / |
文献情報 |
信学技報, vol. 119, no. 476, IBISML2019-49, pp. 107-112, 2020年3月. |
資料番号 |
IBISML2019-49 |
発行日 |
2020-03-03 (IBISML) |
ISSN |
Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
IBISML2019-49 |