講演抄録/キーワード |
講演名 |
2017-06-24 09:55
悪腕存在チェック問題のアルゴリズム ○中村篤祥(北大) IBISML2017-2 |
抄録 |
(和) |
確率的$K$腕バンディット問題の設定で,期待報酬が閾値以上のものが存在するか否かをできる限り少ないプレイ回数で判定するtextbf{悪腕存在チェック問題}を考える.これは,$K$個の検査対象物の内1個でも異常なものがないかを,できるだけ少ない検査回数で判定する問題を定式化したものである.本稿では,まず,与えられたスロットマシン1台に対し,期待報酬が閾値以上であるか否かを判定するtextbf{腕識別問題}を考え,アルゴリズムを与えサンプル複雑度(プレイ回数)の上界を示す.悪腕存在チェック問題に関しては,腕識別問題のアルゴリズムをサブルーチンとして用いる逐次削除アルゴリズムと逐次検査アルゴリズムを示し,各々のサンプル複雑度の上界を示す. |
(英) |
We study a bad arm existence checking problem, in which a solver algorithm must judge whether
an arm with an expected reward at least a given threshold exists or not by drawing as small number of arms as possible in the framework of stochastic $K$-armed bandit problem. This is a formalization of the checking problem for the existence of a bad object among $K$ objects. In this manuscript, we first consider a simpler problem called an arm discrimination problem whose solver algorithm must discriminate whether a given slot machine has an expected reward at least a given threshold or not by drawing as small number of arms as possible.
We give an algorithm for this problem and show an upper bound of the sample complexity (the number of arm draws). We construct a successive elimination algorithm and a successive checking algorithm that make use of the algorithm for the arm discrimination problem as a subroutine, and also show the sample complexity upper bounds of those algorithms. |
キーワード |
(和) |
バンディット問題 / 最適腕識別 / / / / / / |
(英) |
bandit problem / best arm identification / / / / / / |
文献情報 |
信学技報, vol. 117, no. 110, IBISML2017-2, pp. 49-54, 2017年6月. |
資料番号 |
IBISML2017-2 |
発行日 |
2017-06-17 (IBISML) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
IBISML2017-2 |