講演名 2006-03-07
WEB文書の頻出語情報を利用した解答検索システムの構築(一般,コミュニケーションとAI及び一般)
藤枝 直樹, 岩沼 宏治, 鍋島 英知,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 現在WWW上には膨大な量のWebページが存在し,ユーザは検索エンジンを使用することで,目的とする情報を絞り込むことができる.しかし検索エンジンの実際の出力は求める情報が記述してあるページへのハイパーリンクであり,ユーザはそのページへアクセスしその情報が本当に自分の求めているものか,その情報が正しいのかを判断する必要がある.また場合によっては複数のページを参照・比較し,求める情報を探さなければならない.この問題を解決する手法の一つとして,現在質問応答型の検索エンジンに関する研究が幅広く行われている.本研究では,質問応答システムへの足がかりとして,ユーザが入力可能な質問文を単語のみに限定し,Web上からその単語の説明文を収集し,単語の頻度情報などを利用して最も妥当だと思われる説明文から上位数件を出力するシステムを構築した.具体的にはユーザの入力を汎用検索エンジンでWeb上から検索し,検索結果から入力語句の説明として適当な文章を抽出した後,抽出した文章をTF・IDFを用いてランク付けし,ユーザへ出力する.このシステムを実装し,評価実験を行ったので報告する.
抄録(英) In this paper, we propose two kinds of simple question answering systems. These systems search answers based on majority rule, that is, information which occurs frequently on Web is valuable information. The first system is based on the multi-lingual usage consultation tool Kiwi proposed by Tanaka et al. The system accepts a Japanese question sentence in limited form which consists of two or more clauses, and outputs as an answer a word which occurs frequently as the word following the question sentence. The 2nd system outputs a sentence as an answer by using the principle that the sentence containing many important words is also important. The experimental results show the usefulness of our systems.
キーワード(和) WWW / 質問応答システム / 用語抽出 / TF・IDF
キーワード(英) WWW / Question Answering System / Term extraction / TF・IDF
資料番号 AI2005-51
発行日

研究会情報
研究会 AI
開催期間 2006/2/28(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Artificial Intelligence and Knowledge-Based Processing (AI)
本文の言語 JPN
タイトル(和) WEB文書の頻出語情報を利用した解答検索システムの構築(一般,コミュニケーションとAI及び一般)
サブタイトル(和)
タイトル(英) Question Answering System Based on Frequent Words in Web Documents
サブタイトル(和)
キーワード(1)(和/英) WWW / WWW
キーワード(2)(和/英) 質問応答システム / Question Answering System
キーワード(3)(和/英) 用語抽出 / Term extraction
キーワード(4)(和/英) TF・IDF / TF・IDF
第 1 著者 氏名(和/英) 藤枝 直樹 / Naoki FUJIEDA
第 1 著者 所属(和/英) 山梨大学大学院医学工学総合教育部修士課程コンピュータ・メディア工学専攻
Computer Science and Media Engineering, Master's Course, Graduate School of Medical and Engineering Science Department of Education, University of Yamanashi
第 2 著者 氏名(和/英) 岩沼 宏治 / Koji IWANUMA
第 2 著者 所属(和/英) 山梨大学大学院医学工学総合研究部
Graduate School of Medical and Engineering Science Department of Research, University of Yamanashi
第 3 著者 氏名(和/英) 鍋島 英知 / Hidetomo NABESHIMA
第 3 著者 所属(和/英) 山梨大学大学院医学工学総合研究部
Graduate School of Medical and Engineering Science Department of Research, University of Yamanashi
発表年月日 2006-03-07
資料番号 AI2005-51
巻番号(vol) vol.105
号番号(no) 640
ページ範囲 pp.-
ページ数 5
発行日