講演名 2017-06-24
Risk Minimization Framework for Multiple Instance Learning from Positive and Unlabeled Bags
包 含(東大), 坂井 智哉(東大/理研), 佐藤 一誠(東大/理研), 杉山 将(理研/東大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) マルチインスタンス学習(MIL)は教師付き学習の一種で,バッグと呼ばれるデータがインスタンスと呼ばれる子要素からなっており,バッグのラベルのみが判明しているような問題設定である.MILは物体検出や薬物の活性予測,医療診断等の幅広い分野に応用可能である.多くのMILの既存研究では,訓練データに含まれるバッグはすべてラベル付けがなされていることを仮定している.しかし,実際にはラベル無しデータは入手が容易なのに対して,十分な数のラベル付きデータを入手するのが難しいケースが多い.この問題は,正のデータ(positive)とラベル無しデータ(unlabeled)から学習を行うPU学習という枠組みによって解決できる.本研究では,正のバッグとラベル無しバッグのみが与えられている状況下でのMILを解くようなPU学習(PU-MIL)の凸最適化アルゴリズムを提案する.また,PU-MILの既存手法に比べて高速に最適化でき,良い性能が得られることを実験的に示す.
抄録(英) Multiple instance learning (MIL) is a variation of traditional supervised learning problems where data (referred to as bags) are composed of sub-elements (referred to as instances) and only bag labels are available. MIL has a variety of applications such as content-based image retrieval, text categorization and medical diagnosis. Most of the previous work for MIL assume that the training bags are fully labeled. However, it is often difficult to obtain an enough number of labeled bags in practical situations, while many unlabeled bags are available. A learning framework called PU learning (positive and unlabeled learning) can address this problem. In this paper, we propose a convex PU learning method to solve an MIL problem. We experimentally show that the proposed method achieves better performance with significantly lower computational costs than an existing method for PU-MIL.
キーワード(和) マルチインスタンス学習 / PU学習
キーワード(英) Multiple Instance Learning / PU learning
資料番号 IBISML2017-3
発行日 2017-06-17 (IBISML)

研究会情報
研究会 NC / IPSJ-BIO / IBISML / IPSJ-MPS
開催期間 2017/6/23(から3日開催)
開催地(和) 沖縄科学技術大学院大学
開催地(英) Okinawa Institute of Science and Technology
テーマ(和) 機械学習によるバイオデータマインニング、一般
テーマ(英) Machine Learning Approach to Biodata Mining, and General
委員長氏名(和) 萩原 将文(慶大) / / 福水 健次(統計数理研)
委員長氏名(英) Masafumi Hagiwara(Keio Univ.) / / Kenji Fukumizu(ISM)
副委員長氏名(和) 平田 豊(中部大) / / 杉山 将(東大)
副委員長氏名(英) Yutaka Hirata(Chubu Univ.) / / Masashi Sugiyama(Univ. of Tokyo)
幹事氏名(和) 青西 亨(東工大) / 吉川 大弘(名大) / / 鹿島 久嗣(京大) / 津田 宏治(東大)
幹事氏名(英) Toru Aonishi(Tokyo Inst. of Tech.) / Tomohiro Yoshikawa(Nagoya Univ.) / / Hisashi Kashima(Kyoto Univ.) / Koji Tsuda(Univ. of Tokyo)
幹事補佐氏名(和) 篠沢 佳久(慶大) / 稲垣 圭一郎(中部大) / / 竹内 一郎(名工大) / 神嶌 敏弘(産総研)
幹事補佐氏名(英) Yoshihisa Shinozawa(Keio Univ.) / Keiichiro Inagaki(Chubu Univ.) / / Ichiro Takeuchi(Nagoya Inst. of Tech.) / Toshihiro Kamishima(AIST)

講演論文情報詳細
申込み研究会 Technical Committee on Neurocomputing / Special Interest Group on Bioinformatics and Genomics / Technical Committee on Infomation-Based Induction Sciences and Machine Learning / Special Interest Group on Mathematical Modeling and Problem Solving
本文の言語 ENG
タイトル(和)
サブタイトル(和)
タイトル(英) Risk Minimization Framework for Multiple Instance Learning from Positive and Unlabeled Bags
サブタイトル(和)
キーワード(1)(和/英) マルチインスタンス学習 / Multiple Instance Learning
キーワード(2)(和/英) PU学習 / PU learning
第 1 著者 氏名(和/英) 包 含 / Han Bao
第 1 著者 所属(和/英) 東京大学(略称:東大)
The University of Tokyo(略称:Univ. of Tokyo)
第 2 著者 氏名(和/英) 坂井 智哉 / Tomoya Sakai
第 2 著者 所属(和/英) 東京大学/理化学研究所(略称:東大/理研)
The University of Tokyo/RIKEN(略称:Univ. of Tokyo/RIKEN)
第 3 著者 氏名(和/英) 佐藤 一誠 / Issei Sato
第 3 著者 所属(和/英) 東京大学/理化学研究所(略称:東大/理研)
The University of Tokyo/RIKEN(略称:Univ. of Tokyo/RIKEN)
第 4 著者 氏名(和/英) 杉山 将 / Masashi Sugiyama
第 4 著者 所属(和/英) 理化学研究所/東京大学(略称:理研/東大)
RIKEN/The University of Tokyo(略称:RIKEN/Univ. of Tokyo)
発表年月日 2017-06-24
資料番号 IBISML2017-3
巻番号(vol) vol.117
号番号(no) IBISML-110
ページ範囲 pp.55-62(IBISML),
ページ数 8
発行日 2017-06-17 (IBISML)