講演名 2007/7/17
単語極性反転モデルによる評価文分類(感情・評価)
池田 大介, 高村 大也, / 奥村 学,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本稿では単語に対して付与された極性を評価文分類に利用する手法について述べる.最も単純には,文中に出現する感情極性付きの単語の数を数える多数決による手法が考えられる.しかし,評価文中の単語の極性は否定や逆接等で反転することがあり,誤りの原因となる.そこで,本研究ではこういった極性の反転を捉えるため,単語極性反転モデルとこれを用いた評価文分類手法を提案する.このモデルを用いることで,単語の極性反転を捉えることができ,先述のような誤りは防ぐことができる.また,単語ごとではなく文単位にこのモデルを学習することで,文中の単語の極性に着目しつつも直接評価文分類問題を解くことができる.さらに,このモデルは既存の評価文分類モデルと容易に結合でき,単語の極性を利用しつつ, Bag-of-Wordsや依存構造といった,これまで提案されてきた様々な情報を考慮したモデルが構築可能である.提案手法を用いることで,単語の極性を用いない評価文分類手法と比べ,最大4.2ポイント正解率が向上した.
抄録(英) In this paper, we propose a machine learning method that uses word-level semantic orientations for sentiment classification of sentences. The simplest solution to this problem would be the majority voting by the number of positive words and the number of negative words in the given sentence. However, the semantic orientations of words in a sentence are not always the same as that of the sentence, because there can be polarity-shifters such as negation expressions. This inconsistency of word-level orientation and sentence-level orientation often causes errors in classification by the simple majority voting method. The machine learning method that we propose in this paper models the polarity-shifters. Our model can be trained in two different levelsrword level and sentence level. While the word-level training focuses on the prediction of polarity shifts, the sentence-level training focuses more on the prediction of sentence orientations. The model can also combined with features used in previous work such as bag-of-words and dependency trees. We report that the proposed method improves the accuracy of sentence classification by up to 4.2 points compared with other simpler methods.
キーワード(和) 評価文分類 / 単語極性反転モデル / 単語極性辞書
キーワード(英) Sentiment Classification of Sentences / Polarity-Shifting Model / Sentiment Dictionary
資料番号 NLC2007-8
発行日

研究会情報
研究会 NLC
開催期間 2007/7/17(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Natural Language Understanding and Models of Communication (NLC)
本文の言語 JPN
タイトル(和) 単語極性反転モデルによる評価文分類(感情・評価)
サブタイトル(和)
タイトル(英) Sentiment Classification of Sentences by Modeling Word-Level Polarity-Shifters
サブタイトル(和)
キーワード(1)(和/英) 評価文分類 / Sentiment Classification of Sentences
キーワード(2)(和/英) 単語極性反転モデル / Polarity-Shifting Model
キーワード(3)(和/英) 単語極性辞書 / Sentiment Dictionary
第 1 著者 氏名(和/英) 池田 大介 / Daisuke IKEDA
第 1 著者 所属(和/英) 東京工業大学大学院総合理工学研究科
Interdisciplinary Graduate School of Science and Engineering, Tokyo Institute of Technology
第 2 著者 氏名(和/英) 高村 大也 / Hiroya TAKAMURA
第 2 著者 所属(和/英) 東京工業大学精密工学研究所
Precision and Intelligence Laboratory, Tokyo Institute of Technology
第 3 著者 氏名(和/英) / 奥村 学 / Lev-Arie Ratinov
第 3 著者 所属(和/英) / 東京工業大学精密工学研究所
Department of Computer Science, University of Illinois at Urbana-Champaign
発表年月日 2007/7/17
資料番号 NLC2007-8
巻番号(vol) vol.107
号番号(no) 158
ページ範囲 pp.-
ページ数 6
発行日