講演名 2007/7/17
情報の信頼性分析に向けた評価データおよびプロトタイプシステムWISDOM(QA・Web検索)
宮森 恒, 赤峯 享, 加藤 義清, 兼岩 憲, 角 薫, 乾 健太郎, 黒橋 禎夫,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本稿では,情報の信頼性を自然言語処理に基づいて分析する際に必要となる評価用データおよびプロトタイプシステムWISDOMについて述べる.われわれは,ウェブ上のテキストを主な対象として,情報信頼性を分析することを目指したプロジェクトを2006年4月より進めている.本プロジェクトでは,ウェブ上の情報の信頼性を,情報内容,情報発信者,情報外観,社会的評価といった4つの基準で捉えることを提案しており,これらを述語項構造を単位とする自然言語処理によって論理的に分析・組織化することを目指している.本稿で述べる評価用データは,これら種々の分析処理の学習・検証用データとして構築されたものであり,時事問題,医療問題等の20トピックを選定し,各100ウェブページを収集して,各評価尺度のデータを人手で付与したものである.また,情報信頼性を多角的に評価するプロトタイプシステムWISDOMを開発した.本システムを用いて上記評価尺度で条件を様々に変化させて情報閲覧することにより,興味のトピックについて,信頼できる情報をより確実に見極めることができるようになる.
抄録(英) Evaluation data and a prototype system named WISDOM used for analyzing information credibility based on natural language processing are described. Our group started the Information Credibility Criteria project in April, 2006, mainly to analyze the credibility of information (text) on the Web. The project proposes to capture information credibility based on four criteria (content, sender, appearance, and social valuation) and aims to analyze and organize them logically using natural language processing based on predicate argument structure. The evaluation data were developed as learning and verifying data for these various analysis modules, and were composed of manually-annotated data based on each evaluation criteria about pre-selected 20 topics such as current events and medical issues with 100 pages per topic being collected from the Web. The prototype system WISDOM was developed to provide information credibility from different perspectives. Users will be able to find credible information more reliably by browsing information using different evaluation criteria and conditions provided by the system.
キーワード(和) Web / 情報信頼性 / 情報分析 / 自然言語処理 / 述語項構造 / 評価尺度
キーワード(英) Web / information credibility / information analysis / natural language processing / predicate argument structure / credibilitv criteria
資料番号 NLC2007-18
発行日

研究会情報
研究会 NLC
開催期間 2007/7/17(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Natural Language Understanding and Models of Communication (NLC)
本文の言語 ENG
タイトル(和) 情報の信頼性分析に向けた評価データおよびプロトタイプシステムWISDOM(QA・Web検索)
サブタイトル(和)
タイトル(英) Evaluation Data and Prototype System WISDOM for Information Credibility Analysis
サブタイトル(和)
キーワード(1)(和/英) Web / Web
キーワード(2)(和/英) 情報信頼性 / information credibility
キーワード(3)(和/英) 情報分析 / information analysis
キーワード(4)(和/英) 自然言語処理 / natural language processing
キーワード(5)(和/英) 述語項構造 / predicate argument structure
キーワード(6)(和/英) 評価尺度 / credibilitv criteria
第 1 著者 氏名(和/英) 宮森 恒 / Hisashi MIYAMORI
第 1 著者 所属(和/英) 情報通信研究機構知識処理グループ
Knowledge Clustered Group, NICT
第 2 著者 氏名(和/英) 赤峯 享 / Susumu AKAMINE
第 2 著者 所属(和/英) 情報通信研究機構知識処理グループ
Knowledge Clustered Group, NICT
第 3 著者 氏名(和/英) 加藤 義清 / Yoshikiyo KATO
第 3 著者 所属(和/英) 情報通信研究機構知識処理グループ
Knowledge Clustered Group, NICT
第 4 著者 氏名(和/英) 兼岩 憲 / Ken KANEIWA
第 4 著者 所属(和/英) 情報通信研究機構知識処理グループ
Knowledge Clustered Group, NICT
第 5 著者 氏名(和/英) 角 薫 / Kaoru SUMI
第 5 著者 所属(和/英) 情報通信研究機構知識処理グループ
Knowledge Clustered Group, NICT
第 6 著者 氏名(和/英) 乾 健太郎 / Kentaro INUI
第 6 著者 所属(和/英) 情報通信研究機構知識処理グループ:奈良先端科学技術大学院大学情報科学研究科
Knowledge Clustered Group, NICT:Graduate School of Information Science, Nara Institute of Science and Technology
第 7 著者 氏名(和/英) 黒橋 禎夫 / Sadao KUROHASHI
第 7 著者 所属(和/英) 情報通信研究機構知識処理グループ:京都大学大学院情報学研究科
Knowledge Clustered Group, NICT:Graduate School of Informatics, Kyoto University
発表年月日 2007/7/17
資料番号 NLC2007-18
巻番号(vol) vol.107
号番号(no) 158
ページ範囲 pp.-
ページ数 6
発行日