講演名 2020-12-02
ベイズ符号の解析に基づいた分類誤り確率の評価
齋藤 翔太(早大), 松嶋 敏泰(早大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) パラメトライズされた確率分布$P_{theta^*}$と$P_{xi^*}$から発生した二つの訓練データが得られているとする.ただし,$theta^*$と$xi^*$は未知の真のパラメータである.これらの訓練データが与えられたもとで,テストデータが$P_{theta^*}$と$P_{xi^*}$のどちらの分布から発生したのかを判別する問題を考える.これは仮説検定の問題とみなすことができる.我々の従来研究により,ベイズ符号の解析を利用して,第1種と第2種の誤り確率の重み付き平均に関する従来よりも精密な上界,下界が導出されていた.しかしながら,この研究には以下の不十分な点があった.i) $theta$と$xi$の事前分布が同一であると仮定していること,ii) 二つの仮説の事前分布が一様分布であると仮定していること,iii) 上界と下界がどれほどタイトであるか不明であること.本研究では,これらの問題を解決する.すなわち,i)とii)の制約を取り除き,一般的な上界と下界を導出する.さらに,問題iii)に対しては,具体的な確率モデルに対して数値計算を実施する.
抄録(英) Suppose that we have two training sequences generated by parametrized distributions $P_{theta^*}$ and $P_{xi^*}$, where $theta^*$ and $xi^*$ are unknown true parameters. Given training sequences, we study the problem of classifying whether a test sequence was generated according to $P_{theta^*}$ or $P_{xi^*}$. This problem can be thought of as a hypothesis testing problem and our aim is to analyze the weighted sum of type-I and type-II error probabilities. Utilizing the analysis of the codeword lengths of the Bayes code, our previous study derived more refined bounds on the error probability than known previously. However, our previous study had the following deficiencies: i) the prior distributions of $theta$ and $xi$ are the same; ii) the prior distributions of two hypotheses are uniform; iii) the tightness of the upper and lower bounds were not clear. This study solves these problems. We remove the restrictions i) and ii) and derive more general results than obtained previously. To deal with the problem iii), we perform numerical calculation for a concrete model.
キーワード(和) ベイズ符号 / チャーノフ情報量 / 仮説検定 / 統計的分類問題
キーワード(英) Bayes code / Chernoff information / hypothesis testing / statistical classification problem
資料番号 IT2020-32
発行日 2020-11-24 (IT)

研究会情報
研究会 IT
開催期間 2020/12/1(から3日開催)
開催地(和) オンライン開催
開催地(英) Online
テーマ(和) 若手研究者のための講演会,一般
テーマ(英) Lectures for Young Researchers, General
委員長氏名(和) 和田山 正(名工大)
委員長氏名(英) Tadashi Wadayama(Nagoya Inst. of Tech.)
副委員長氏名(和) 小嶋 徹也(東京高専)
副委員長氏名(英) Tetsuya Kojima(Tokyo Kosen)
幹事氏名(和) 野崎 隆之(山口大) / 廣友 雅徳(佐賀大)
幹事氏名(英) Takayuki Nozaki(Yamaguchi Univ.) / Masanori Hirotomo(Saga Univ.)
幹事補佐氏名(和) 太田 隆博(専修大)
幹事補佐氏名(英) Takahiro Ohta(Senshu Univ.)

講演論文情報詳細
申込み研究会 Technical Committee on Information Theory
本文の言語 ENG-JTITLE
タイトル(和) ベイズ符号の解析に基づいた分類誤り確率の評価
サブタイトル(和) 拡張と具体例
タイトル(英) Error Probability of Classification Based on the Analysis of the Bayes Code
サブタイトル(和) Extension and Example
キーワード(1)(和/英) ベイズ符号 / Bayes code
キーワード(2)(和/英) チャーノフ情報量 / Chernoff information
キーワード(3)(和/英) 仮説検定 / hypothesis testing
キーワード(4)(和/英) 統計的分類問題 / statistical classification problem
第 1 著者 氏名(和/英) 齋藤 翔太 / Shota Saito
第 1 著者 所属(和/英) 早稲田大学(略称:早大)
Waseda University(略称:Waseda Univ.)
第 2 著者 氏名(和/英) 松嶋 敏泰 / Toshiyasu Matsushima
第 2 著者 所属(和/英) 早稲田大学(略称:早大)
Waseda University(略称:Waseda Univ.)
発表年月日 2020-12-02
資料番号 IT2020-32
巻番号(vol) vol.120
号番号(no) IT-268
ページ範囲 pp.44-49(IT),
ページ数 6
発行日 2020-11-24 (IT)