講演名 2018-12-13
データの系列性を利用したラベル修正によるアノテーターの判別能力に頑健な機械学習
澤田 あずさ(NEC), 柴田 剛志(NEC),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 近年の機械学習技術の発展により,パターン認識において達成できる精度は大幅に向上してきた.しかし,学習で得られる性能は学習用データの正解付けの質に強く依存するため,実際の認識モデルの精度はアノテータの正解付け能力によって制限される.そこで,我々はアノテータにが見逃した正例データを探し正例への感度がより高いモデルを得るための新たな枠組みを提案する.本提案では,潜在的正例を発見するのに有用な系列をなすデータに着目し,(1)系列に沿った正例探索によるラベル修正と(2)修正後のラベルによるモデルの学習を組み合わせて行う.人工データセットを用いた実験により,提案手法が従来の学習手法よりも潜在的な正例を正確に識別でき,さらに真のラベルを学習した場合に劣らない識別能力を獲得できることを,AUC (area under the curve)による比較から示した.
抄録(英) Although recent progress in machine learning has substantially improved the accuracy of pattern recognition task, the performances of these learned models depend on the annotation quality. Therefore, in the real world, the accuracy of these models is limited by the labelling skills of the annotators. To tackle this problem, we propose a novel learning framework that can obtain an accurate model by finding latent positive samples that are often overlooked by non-skilled annotators. The key of the proposed method is to focus on the data series that is helpful to find the latent positive labels. The proposed method has two main interacting components: 1) a label correction part to seek positives along data series and 2) a model training part on modified labels. The experimental results on simulated data show that the proposed method can obtain the same performance as supervision by oracle label and outperforms the existing method in terms of area under the curve (AUC).
キーワード(和) 機械学習 / ラベル修正 / データ系列 / 早期検知
キーワード(英) machine learning / label correction / data series / early detection
資料番号 PRMU2018-81
発行日 2018-12-06 (PRMU)

研究会情報
研究会 PRMU
開催期間 2018/12/13(から2日開催)
開催地(和) 東北大学
開催地(英)
テーマ(和) 深層学習とPRMU技術およひ?その応用
テーマ(英)
委員長氏名(和) 佐藤 真一(NII)
委員長氏名(英) Shinichi Sato(NII)
副委員長氏名(和) 井尻 善久(オムロン) / 玉木 徹(広島大)
副委員長氏名(英) Yoshihisa Ijiri(Omron) / Toru Tamaki(Hiroshima Univ.)
幹事氏名(和) 石井 雅人(NEC) / 菅野 裕介(阪大)
幹事氏名(英) Masato Ishii(NEC) / Yusuke Sugano(Osaka Univ.)
幹事補佐氏名(和) 入江 豪(NTT) / 牛久 祥孝(OSX)
幹事補佐氏名(英) Go Irie(NTT) / Yoshitaka Ushiku(OSX)

講演論文情報詳細
申込み研究会 Technical Committee on Pattern Recognition and Media Understanding
本文の言語 JPN-ONLY
タイトル(和) データの系列性を利用したラベル修正によるアノテーターの判別能力に頑健な機械学習
サブタイトル(和)
タイトル(英)
サブタイトル(和)
キーワード(1)(和/英) 機械学習 / machine learning
キーワード(2)(和/英) ラベル修正 / label correction
キーワード(3)(和/英) データ系列 / data series
キーワード(4)(和/英) 早期検知 / early detection
第 1 著者 氏名(和/英) 澤田 あずさ / Azusa Sawada
第 1 著者 所属(和/英) NEC(略称:NEC)
NEC Corporation(略称:NEC Corp.)
第 2 著者 氏名(和/英) 柴田 剛志 / Takashi Shibata
第 2 著者 所属(和/英) NEC(略称:NEC)
NEC Corporation(略称:NEC Corp.)
発表年月日 2018-12-13
資料番号 PRMU2018-81
巻番号(vol) vol.118
号番号(no) PRMU-362
ページ範囲 pp.35-38(PRMU),
ページ数 4
発行日 2018-12-06 (PRMU)