二段階アプローチによるWeblogからの意見文抽出(情報抽出,特集「Web情報処理」及び一般)

川口 敏広; 松井 藤五郎; 大和田 勇人

講演名	2007-01-23 二段階アプローチによるWeblogからの意見文抽出(情報抽出,特集「Web情報処理」及び一般) 川口敏広, 松井藤五郎, 大和田勇人,
PDFダウンロードページ	PDFダウンロードページへ
抄録(和)	我々はこれまでにSupport Vector Machineを用いてWeblog記事から主観的な意見を含むレビュー記事を抽出し,新聞記事から抽出した辞書に基づいてレビュー記事から意見文を抽出する二段階抽出手法を提案した.本論文では,二段階抽出手法を用いた意見文検索システムについて述べる.実験の結果,本システムを用いることによって非レビュー記事から抽出されたしまう文を46%削減できた.また,抽出上位50文のPrecisionは0.72だった.
抄録(英)	We proposed a two-stage approach for sentiment extraction that it firstly extracts review articles from Weblog articles using Support Vector Machines (SVMs) and secondly extracts sentiments from review articles using feature words generated by newspaper articles. In this paper, we describe an implementation of sentiments search system based on this method. As a result, we reduced 46% of wrong sentence from non-review articles, and the precision of the top 50 sentences was 0.72.
キーワード(和)	意見文抽出 / Weblog / Support Vector Machine / 新聞記事
キーワード(英)	Sentiment Extraction / Weblog / Support Vector Machines / Newspaper Articles
資料番号	KBSE2006-63
発行日

研究会情報
研究会	KBSE
開催期間	2007/1/16(から1日開催)
開催地（和）
開催地（英）
テーマ（和）
テーマ（英）
委員長氏名（和）
委員長氏名（英）
副委員長氏名（和）
副委員長氏名（英）
幹事氏名（和）
幹事氏名（英）
幹事補佐氏名（和）
幹事補佐氏名（英）

講演論文情報詳細
申込み研究会	Knowledge-Based Software Engineering (KBSE)
本文の言語	JPN
タイトル（和）	二段階アプローチによるWeblogからの意見文抽出(情報抽出,特集「Web情報処理」及び一般)
サブタイトル（和）
タイトル（英）	A Two-Stage Approach for Sentiment Extraction from Weblog
サブタイトル（和）
キーワード(1)（和/英）	意見文抽出 / Sentiment Extraction
キーワード(2)（和/英）	Weblog / Weblog
キーワード(3)（和/英）	Support Vector Machine / Support Vector Machines
キーワード(4)（和/英）	新聞記事 / Newspaper Articles
第 1 著者氏名（和/英）	川口敏広 / Toshihiro KAWAGUCHI
第 1 著者所属（和/英）	東京理科大学大学院理工学研究科 Graduate School of Science and Technology, Tokyo University of Science
第 2 著者氏名（和/英）	松井藤五郎 / Tohgoroh MATSUI
第 2 著者所属（和/英）	東京理科大学理工学部 Faculty of Science and Technology, Tokyo University of Science
第 3 著者氏名（和/英）	大和田勇人 / Hayato OHWADA
第 3 著者所属（和/英）	東京理科大学理工学部 Faculty of Science and Technology, Tokyo University of Science
発表年月日	2007-01-23
資料番号	KBSE2006-63
巻番号（vol）	vol.106
号番号（no）	473
ページ範囲	pp.-
ページ数	6
発行日