講演名 2019-06-21
深層学習を用いた感情分類における教師ラベルの半自動構築
増田 京祐(山梨大), 西崎 博光(山梨大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 我々はこれまでに,ソーシャル・ネットワーキング・サービス(SNS)の一つであるTwitterを対象とした,深層学習に基づく感情分類手法の検討を行ってきた.深層学習(機械学習)を用いる場合,大規模な感情ラベル付きコーパスが必要となるが,これを人手で用意・整備するためには非常にコストがかかってしまう.そこで,我々は,人手によって僅かなシード感情語を用意し,この感情語を用いることで,半自動的に感情ラベル付きコーパスを構築していた.しかし,この手法では,当然ながら,ラベルに誤りを多く含んでいるため,深層学習モデルによる分類精度が低下することになるという問題があった.そこで,本稿では,ラベル間違いを多く含む学習データを自動的に修正することによってコーパスの品質を改善していく方法を提案する.実験の結果,感情ラベルを自動訂正することによって,感情分類精度が55.1%から63.8%に改善することを示す.
抄録(英) We previously considered that the emotional classification method based on deep learning for tweets on social networking service Twitter. In the case of using the deep learning (machine learning) framework for emotion classification, we have to prepare a large emotion corpus in which each sentence has emotion label(s). However, it high costs to construct the emotion corpus. Therefore, we have semi-automatically constructed the emotion corpus from Twitter using some seed emotion words which were selected from the emotion dictionary, in which the emotion words are well-defined. Tweets were retrieved by one seed emotion word and the retrieved texts were attached the emotion label(s) based on the emotion category of the seed word. However, the deep learning-based emotion classification model could not achieve the high-accurate emotion classification because the semi-automatically constructed corpus had a lot of errors of emotion labels. In this paper, therefore, we propose a method for improving the quality of the emotion labels by automatically correcting the errors of emotion labels. The experimental result showed that the our proposed method worked well and the classification accuracy was improved to 63.8% from the 55.1% on the Twitter emotion classification task.
キーワード(和) 深層学習 / 感情分類 / 繰り返し学習 / 自動ラベル修正
キーワード(英) Deep learning / emotion recognition / Iteration training / automatic label correction
資料番号 NLC2019-5
発行日 2019-06-14 (NLC)

研究会情報
研究会 NLC / IPSJ-ICS
開催期間 2019/6/21(から2日開催)
開催地(和) 広島経済大学 立町キャンパス
開催地(英) Hiroshima University of Economics (Tatemachi Campus)
テーマ(和) 言語処理・知能システムの社会応用,および一般
テーマ(英) Application of natural language processing and intelligent systems, and general topic of NLP
委員長氏名(和) 榊 剛史(ホットリンク)
委員長氏名(英) Takeshi Sakaki(Hottolink)
副委員長氏名(和) 吉田 光男(豊橋技科大) / 嶋田 和孝(九工大)
副委員長氏名(英) Mitsuo Yoshida(Toyohashi Univ. of Tech.) / Kazutaka Shimada(Kyushu Inst. of Tech.)
幹事氏名(和) 渡辺 靖彦(龍谷大) / 東中 竜一郎(NTT)
幹事氏名(英) Yasuhiko Watanabe(Ryukoku Univ.) / Ryuichiro Higashinaka(NTT)
幹事補佐氏名(和) 小早川 健(NHK) / 坂地 泰紀(東大)
幹事補佐氏名(英) Takeshi Kobayakawa(NHK) / Hiroki Sakaji(Univ. of Tokyo)

講演論文情報詳細
申込み研究会 Technical Committee on Natural Language Understanding and Models of Communication / Special Interest Group on Intelligence and Complex Systems
本文の言語 JPN
タイトル(和) 深層学習を用いた感情分類における教師ラベルの半自動構築
サブタイトル(和)
タイトル(英) Semi-Automatic Labeling for Emotion Classification with Deep Learning
サブタイトル(和)
キーワード(1)(和/英) 深層学習 / Deep learning
キーワード(2)(和/英) 感情分類 / emotion recognition
キーワード(3)(和/英) 繰り返し学習 / Iteration training
キーワード(4)(和/英) 自動ラベル修正 / automatic label correction
第 1 著者 氏名(和/英) 増田 京祐 / Kyosuke Masuda
第 1 著者 所属(和/英) 山梨大学大学院(略称:山梨大)
University of Ymanashi(略称:Univ. of Yamanashi)
第 2 著者 氏名(和/英) 西崎 博光 / Hiromitsu Nishizaki
第 2 著者 所属(和/英) 山梨大学大学院(略称:山梨大)
University of Ymanashi(略称:Univ. of Yamanashi)
発表年月日 2019-06-21
資料番号 NLC2019-5
巻番号(vol) vol.119
号番号(no) NLC-98
ページ範囲 pp.29-33(NLC),
ページ数 5
発行日 2019-06-14 (NLC)