講演名 2017-11-16
転移学習によるクラス未知の文書分類
白井 匡人(島根大), 劉 健全(NEC),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本研究では,学習データ内に出現しないクラスを対象として,転移学習を用いて文書分類を行う新たな学習手法を提案する.従来の文書分類では,学習データから得られた各クラスの特徴に基づきクラスが未知の文書を既知のクラスに分類する.クラスを表す特徴を得るにはクラスごとに大量のラベル付きデータが必要となる.このため,学習データ内に存在しない新規のクラスを分類先とすることができない.転移学習を用いた文書分類では,対象領域の文書を分類するために情報源領域に存在するラベル付き文書を利用する.提案手法は,学習データ内に存在しない新規のクラスを対象として分類を行うために,学習済みのクラスと新規クラスのクラス名自体の情報に基づき知識の転移を行う.これにより学習データ内に存在しないクラスを持つ対象領域の文書を分類する.
抄録(英) In this investigation, we propose a new classification method based on transfer learning to classify new classes without training data of that class. Generally,features of classes is obtained from labelled data. However, large amount of labeled data is required to obtain features of classes . Transfer learning utilizes extracted knowledge from source domain to analyze the target domain. We extract latent topics based on topic model from source domain. And we select appropriate source domain corresponding to class of target domain using features of class tag. We estimate a class of document in target domain by class information of source domain.
キーワード(和) 転移学習 / 文書分類 / トピックモデル
キーワード(英) Transfer learning / Document classification / Topic model
資料番号 CAS2017-48,MSS2017-32
発行日 2017-11-09 (CAS, MSS)

研究会情報
研究会 CAS / MSS / IPSJ-AL
開催期間 2017/11/16(から2日開催)
開催地(和) 日立中央研究所
開催地(英)
テーマ(和) システムのモデリングと制御・検証・最適化の手法,機械学習的アプローチ及び一般
テーマ(英)
委員長氏名(和) 平木 充(ルネサス エレクトロニクス) / 名嘉村 盛和(琉球大) / 堀山 貴史(埼玉大学)
委員長氏名(英) Mitsuru Hiraki(Renesas) / Morikazu Nakamura(Univ. of Ryukyus) / Takashi Horiyama(Saitama University)
副委員長氏名(和) 岡崎 秀晃(湘南工科大) / 髙井 重昌(阪大)
副委員長氏名(英) Hideaki Okazaki(Shonan Inst. of Tech.) / Shigemasa Takai(Osaka Univ.)
幹事氏名(和) 山口 基(ルネサス エレクトロニクス) / 橘 俊宏(湘南工科大) / 豊嶋 伊知郎(東芝) / 金澤 尚史(阪大) / 岡本 吉央(電気通信大学) / 川原 純(奈良先端科学技術大学院大学) / 河村 彰星(東京大学)
幹事氏名(英) Motoi Yamaguchi(Renesas) / Toshihiro Tachibana(Shonan Inst. of Tech.) / Ichiro Toyoshima(Toshiba) / Takahumi Kanazawa(Osaka Univ.) / Yoshio Okamoto(The University of Electro-Communications) / Jun Kawahara(Nara Institute of Science and Technology) / Akitoshi Kawamura(University of Tokyo)
幹事補佐氏名(和) 中村 洋平(日立) / 金城 秀樹(沖縄大)
幹事補佐氏名(英) Yohei Nakamura(Hitachi) / Hideki Kinjo(Okinawa Univ.)

講演論文情報詳細
申込み研究会 Technical Committee on Circuits and Systems / Technical Committee on Mathematical Systems Science and its applications / Special Interest Group on Algorithms
本文の言語 JPN
タイトル(和) 転移学習によるクラス未知の文書分類
サブタイトル(和)
タイトル(英) Document classification on unknown class using transfer learning
サブタイトル(和)
キーワード(1)(和/英) 転移学習 / Transfer learning
キーワード(2)(和/英) 文書分類 / Document classification
キーワード(3)(和/英) トピックモデル / Topic model
第 1 著者 氏名(和/英) 白井 匡人 / Masato Shirai
第 1 著者 所属(和/英) 島根大学(略称:島根大)
Shimane University(略称:Shimane Univ.)
第 2 著者 氏名(和/英) 劉 健全 / Jianquan Liu
第 2 著者 所属(和/英) 日本電気株式会社(略称:NEC)
NEC Corporation(略称:NEC)
発表年月日 2017-11-16
資料番号 CAS2017-48,MSS2017-32
巻番号(vol) vol.117
号番号(no) CAS-300,MSS-301
ページ範囲 pp.51-56(CAS), pp.51-56(MSS),
ページ数 6
発行日 2017-11-09 (CAS, MSS)