講演名 2017-03-20
識別境界付近のデータを選択的に用いる半教師あり学習
田中 遼平(東芝), 丁 皛(東芝), 小野 聡一郎(東芝), 古畑 彰夫(東芝),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 半教師あり学習は少数のラベルありデータに加え多数のラベルなしデータも学習に利用することで効率的に高精度な辞書を生成する手法として注目されている.従来,ラベルありデータの学習結果からラベルなしデータのラベル付けを行い学習に利用するself-trainingという半教師あり学習手法では,設計者の設定した基準以上の確信度の高いデータをラベル付けの対象としてきた.本研究では,認識精度向上への貢献が大きい識別境界付近のデータを選択的に辞書に取り込むことで精度の向上を図る方法と,識別境界付近の選別閾値を最適化する最適領域蓄積法を提案し,実験によってそれらの有効性を示した.
抄録(英) Semi-supervised learning (SSL) is a technique which makes use of unlabeled data in addition to labeled data to obtain better learning accuracies. The most fundamental and widely applicable subtype of SSL is called self-training, which produces additional labeled data from unlabeled data using the results of the classifier trained with the existing labeled data. Conventionally, the additional labeling is performed only on unlabeled data with high prediction confidence above the built-in threshold predetermined by the designer. On the other hand, it is known that learning data near the decision boundary play a crucial role for classification performances. In this paper, we introduce this knowledge to self-training by selectively labeling unconfident unlabeled data near the decision boundary. We also propose a novel method using optimal region accumulation which automatically optimizes the labeling threshold to accumulate data near the boundary.
キーワード(和) 半教師あり学習 / self-training / 部分空間法 / 手書き数字認識
キーワード(英) Semi-supervised learning / self-training / subspace method / handwritten digits recognition
資料番号 BioX2016-33,PRMU2016-196
発行日 2017-03-13 (BioX, PRMU)

研究会情報
研究会 PRMU / BioX
開催期間 2017/3/20(から2日開催)
開催地(和) 名城大
開催地(英)
テーマ(和) 安心安全と社会
テーマ(英)
委員長氏名(和) 前田 英作(NTT) / 西垣 正勝(静岡大)
委員長氏名(英) Eisaku Maeda(NTT) / Masakatsu Nishigaki(Shizuoka Univ.)
副委員長氏名(和) 内田 誠一(九大) / 藤吉 弘亘(中部大) / 大塚 玲(産総研) / 高野 博史(富山県立大)
副委員長氏名(英) Seiichi Uchida(Kyushu Univ.) / Hironobu Fujiyoshi(Chubu Univ.) / Akira Otsuka(AIST) / Hiroshi Takano(Toyama Pref. Univ.)
幹事氏名(和) 近藤 一晃(京大) / 木村 昭悟(NTT) / 今岡 仁(NEC) / 大木 哲史(産総研)
幹事氏名(英) Kazuaki Kondo(Kyoto Univ.) / Akisato Kimura(NTT) / Hitoshi Imaoka(NEC) / Tetsushi Ohki(AIST)
幹事補佐氏名(和) 大西 正輝(産総研) / 舩冨 卓哉(奈良先端大) / 市野 将嗣(電通大) / 高田 直幸(セコム) / 青木 隆浩(富士通研)
幹事補佐氏名(英) Masaki Oonishi(AIST) / Takuya Funatomi(NAIST) / Masatsugu Ichino(Univ. of Electro-Comm.) / Naoyuki Takada(Secom) / Takahiro Aoki(Fujitsu Labs.)

講演論文情報詳細
申込み研究会 Technical Committee on Pattern Recognition and Media Understanding / Technical Committee on Biometrics
本文の言語 JPN
タイトル(和) 識別境界付近のデータを選択的に用いる半教師あり学習
サブタイトル(和)
タイトル(英) Selection of Near-Boundary Data for Semi-Supervised Learning
サブタイトル(和)
キーワード(1)(和/英) 半教師あり学習 / Semi-supervised learning
キーワード(2)(和/英) self-training / self-training
キーワード(3)(和/英) 部分空間法 / subspace method
キーワード(4)(和/英) 手書き数字認識 / handwritten digits recognition
第 1 著者 氏名(和/英) 田中 遼平 / Ryohei Tanaka
第 1 著者 所属(和/英) 株式会社東芝(略称:東芝)
Toshiba Corporation(略称:Toshiba)
第 2 著者 氏名(和/英) 丁 皛 / Xiao Ding
第 2 著者 所属(和/英) 株式会社東芝(略称:東芝)
Toshiba Corporation(略称:Toshiba)
第 3 著者 氏名(和/英) 小野 聡一郎 / Soichiro Ono
第 3 著者 所属(和/英) 株式会社東芝(略称:東芝)
Toshiba Corporation(略称:Toshiba)
第 4 著者 氏名(和/英) 古畑 彰夫 / Akio Furuhata
第 4 著者 所属(和/英) 株式会社東芝(略称:東芝)
Toshiba Corporation(略称:Toshiba)
発表年月日 2017-03-20
資料番号 BioX2016-33,PRMU2016-196
巻番号(vol) vol.116
号番号(no) BioX-527,PRMU-528
ページ範囲 pp.1-6(BioX), pp.1-6(PRMU),
ページ数 6
発行日 2017-03-13 (BioX, PRMU)