講演名 2019-11-28
W2Vを用いたLSTMの前処理としての特徴選択の有効性
古賀 詩織(九大), 峯 恒憲(九大), 廣川 佐千男(九大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) RNNの中でも特にLSTMは長期記憶が可能で,より優れた文脈情報を含んだ情報の獲得が期待でき,分類問題をはじめ,様々な問題に利用されてきた.そのような分類問題において,文章を構成する単語の中から分類に寄与する単語などの情報を選ぶ特徴選択により,分類精度の向上を行う様々な試みが行われてきた.しかしながら,LSTMは文脈を重要視しているため,LSTMの入力中の単語を取捨選択する試みは,筆者らの知る限り行われていない.本研究では,LSTMの入力文中の単語表現としてWord2Vecを用い,LSTMの入力の前処理として特徴選択を行うことの有効性を示す.実験結果から,特徴選択を行うと分類精度が向上することが示された.
抄録(英) Among RNNs, especially LSTM is capable of long-term memory, and can be expected to acquire information including better contextual information, and has been used for various problems including classification problems. In such classification problems, various attempts have been made to improve the accuracy of classification by selecting features such as words that contribute to classification from among the words that make up sentences.However, since LSTM attaches importance to the context, no attempt has been made to select words in LSTM input as far as we know.In this study, we show the effectiveness of using Word2Vec as a word expression in an LSTM input sentence and performing feature selection as a pre-processing of the LSTM input. The results show that the accuracy of classification improves when feature selection is performed.
キーワード(和) 文書分類 / LSTM / 特徴選択 / Word2Vec
キーワード(英) text classification / LSTM / feature selection / Word2Vec
資料番号 AI2019-34
発行日 2019-11-21 (AI)

研究会情報
研究会 AI
開催期間 2019/11/28(から1日開催)
開催地(和) 九州大学 伊都キャンパス
開催地(英)
テーマ(和) 「コンテキストを意識した知識の利用」および一般
テーマ(英)
委員長氏名(和) 福田 直樹(静岡大)
委員長氏名(英) Naoki Fukuta(Shizuoka Univ.)
副委員長氏名(和) 清 雄一(電通大) / 櫻井 祐子(産総研)
副委員長氏名(英) Yuichi Sei(Univ. of Electro-Comm.) / Yuko Sakurai(AIST)
幹事氏名(和) 福井 健一(阪大) / 藤田 桂英(東京農工大)
幹事氏名(英) Kenichi Fukui(Osaka Univ.) / Katsuhide Fujita(Tokyo Univ. of Agriculture and Technology)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Technical Committee on Artificial Intelligence and Knowledge-Based Processing
本文の言語 JPN
タイトル(和) W2Vを用いたLSTMの前処理としての特徴選択の有効性
サブタイトル(和)
タイトル(英) Effectiveness of feature selection as pre-processing of LSTM using W2V
サブタイトル(和)
キーワード(1)(和/英) 文書分類 / text classification
キーワード(2)(和/英) LSTM / LSTM
キーワード(3)(和/英) 特徴選択 / feature selection
キーワード(4)(和/英) Word2Vec / Word2Vec
第 1 著者 氏名(和/英) 古賀 詩織 / Shiori Koga
第 1 著者 所属(和/英) 九州大学(略称:九大)
Kyushu University(略称:Kyushu Univ.)
第 2 著者 氏名(和/英) 峯 恒憲 / Tsunenori Mine
第 2 著者 所属(和/英) 九州大学(略称:九大)
Kyushu University(略称:Kyushu Univ.)
第 3 著者 氏名(和/英) 廣川 佐千男 / Sachio Hirokawa
第 3 著者 所属(和/英) 九州大学情報基盤研究開発センター(略称:九大)
Research Institute for Information Technology, Kyushu University(略称:Kyushu Univ.)
発表年月日 2019-11-28
資料番号 AI2019-34
巻番号(vol) vol.119
号番号(no) AI-317
ページ範囲 pp.25-30(AI),
ページ数 6
発行日 2019-11-21 (AI)