講演名 2020-12-17
A Novel Data Augmentation Framework Based on SeqGAN for Sentiment Analysis
羅 家偉(慶大), Mondher Bouazizi(慶大), 大槻 知明(慶大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和)
抄録(英) Sentiment analysis is an important field in Natural Language Processing (NLP). It can analyze people's sentiment through their articles. On a related topic, machine learning has achieved high accuracy in sentiment analysis. However, it requires a large amount of high-quality training data that are hard to be collected. In this work, a novel data augmentation framework based on sequence generative adversarial networks (SeqGAN) is proposed to improve the sentiment analysis accuracy. In our framework, we conduct sentence compression and use a sentiment dictionary to retain the sentiment words for compressed data. The compressed data are used to train SeqGAN. We use the trained SeqGAN to generate artificial data for sentiment analysis. A classifier is used to discard generated data that may contain incorrect sentiment information. The results show that the proposed data augmentation framework helps SeqGAN generate high quality and novel text data. The data generated by the proposed framework improve the accuracy of the sentiment analysis classifier on some of the benchmark sentiment analysis dataset available.
キーワード(和)
キーワード(英) data augmentationsentiment analysismachine learningsentence compressionSeqGAN
資料番号 PRMU2020-43
発行日 2020-12-10 (PRMU)

研究会情報
研究会 PRMU
開催期間 2020/12/17(から2日開催)
開催地(和) オンライン開催
開催地(英) Online
テーマ(和) 転移学習・少数データからの学習
テーマ(英) Transfer learning and few shot learning
委員長氏名(和) 佐藤 洋一(東大)
委員長氏名(英) Yoichi Sato(Univ. of Tokyo)
副委員長氏名(和) 木村 昭悟(NTT) / 岩村 雅一(阪府大)
副委員長氏名(英) Akisato Kimura(NTT) / Masakazu Iwamura(Osaka Pref. Univ.)
幹事氏名(和) 内田 祐介(Mobility Technologies) / 山下 隆義(中部大)
幹事氏名(英) Yusuke Uchida(Mobility Technologies) / Takayoshi Yamashita(Chubu Univ.)
幹事補佐氏名(和) 柴田 剛志(NTT) / 西山 正志(鳥取大)
幹事補佐氏名(英) Takashi Shibata(NTT) / Masashi Nishiyama(Tottori Univ.)

講演論文情報詳細
申込み研究会 Technical Committee on Pattern Recognition and Media Understanding
本文の言語 ENG
タイトル(和)
サブタイトル(和)
タイトル(英) A Novel Data Augmentation Framework Based on SeqGAN for Sentiment Analysis
サブタイトル(和)
キーワード(1)(和/英) / data augmentationsentiment analysismachine learningsentence compressionSeqGAN
第 1 著者 氏名(和/英) 羅 家偉 / Jiawei Luo
第 1 著者 所属(和/英) 慶応義塾大学(略称:慶大)
Keio University(略称:Keio Univ.)
第 2 著者 氏名(和/英) Mondher Bouazizi / Mondher Bouazizi
第 2 著者 所属(和/英) 慶応義塾大学(略称:慶大)
Keio University(略称:Keio Univ.)
第 3 著者 氏名(和/英) 大槻 知明 / Tomoaki Ohtsuki
第 3 著者 所属(和/英) 慶応義塾大学(略称:慶大)
Keio University(略称:Keio Univ.)
発表年月日 2020-12-17
資料番号 PRMU2020-43
巻番号(vol) vol.120
号番号(no) PRMU-300
ページ範囲 pp.30-35(PRMU),
ページ数 6
発行日 2020-12-10 (PRMU)