講演名 2005-09-21
日本語と英語の文タイプの自動付与とその特徴素(一般セッション, ロボットとの相互作用のための言語処理・パターン認識・メディア理解)
関 洋平, 神門 典子, 青野 雅樹,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本研究の目的は, テキストからの主観的情報の抽出に関して, 関連する手法を整理し, 従来余り注目されることの少なかった文脈情報の手がかりとしての有効性を検証することにある.主観的情報とは, テキストの著者や, 第三者である専門家などの意見, 評価, 感情などを主に指す.主観的情報を機械学習などに基づき自動抽出する際の特徴素については, 評判情報の抽出への応用等の目的で, Web文書から肯定, 否定などの情報を抽出する場合, 手がかりとしては一文中の共起語の組合せパターンなどが着目されてきた.しかし, 社会調査として複数の見解を分析するために, 新聞記事から主観的情報を抽出する場合には, テキスト構造を考慮することが重要となる.このことを検証するために, 日本語と英語の主観的情報を識別し, ラベルとして付与したデータを用いて実験を行った.本稿の実験の結果, 前後の文などの文脈情報を特徴素として利用することで, 主観的情報の自動抽出の精度が有意に向上することが明らかとなった.
抄録(英) The purpose of thie study it to testing for using contextual information as a subjective feature, which is not focused on in other related works for annotating subjectivity. Subjectivity usually refers to aspects of language used to express author's or autority's opinions, evaluations, and speculations. Subjectivity analysis was mainly applied to measure the perceptions of Web site reputation, which did not contain complex text structure, but did contain some key extraction patterns. On the other hand, subjectivity analysis on newspaper articles for information analysis in political domains, text structure also performs as a good clue. We evaluated the effectiveness of contextual information with two datasets, which containing English and Japanese newspaper articles with manually annotated opinion information. We found significant improvements for accuracy, precision, and recall for automatic annotation by using contextual information as a feature.
キーワード(和) 文タイプ付与 / 主観的情報の分析 / 文脈
キーワード(英) Sentence-type Annotation / Subjectivity Analysis / Context
資料番号 NLC2005-28,PRMU2005-55
発行日

研究会情報
研究会 PRMU
開催期間 2005/9/14(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Pattern Recognition and Media Understanding (PRMU)
本文の言語 JPN
タイトル(和) 日本語と英語の文タイプの自動付与とその特徴素(一般セッション, ロボットとの相互作用のための言語処理・パターン認識・メディア理解)
サブタイトル(和)
タイトル(英) Automatic Annotation and its Features of Japanese and English Sentence Types
サブタイトル(和)
キーワード(1)(和/英) 文タイプ付与 / Sentence-type Annotation
キーワード(2)(和/英) 主観的情報の分析 / Subjectivity Analysis
キーワード(3)(和/英) 文脈 / Context
第 1 著者 氏名(和/英) 関 洋平 / Yohei SEKI
第 1 著者 所属(和/英) 豊橋技術科学大学情報工学系
Department of Information and Computer Sciences, Toyohashi University of Technology
第 2 著者 氏名(和/英) 神門 典子 / Noriko KANDO
第 2 著者 所属(和/英) 国立情報学研究所
National Institute of Informatics
第 3 著者 氏名(和/英) 青野 雅樹 / Masaki AONO
第 3 著者 所属(和/英) 豊橋技術科学大学情報工学系
Department of Information and Computer Sciences, Toyohashi University of Technology
発表年月日 2005-09-21
資料番号 NLC2005-28,PRMU2005-55
巻番号(vol) vol.105
号番号(no) 301
ページ範囲 pp.-
ページ数 6
発行日