講演名 2004/2/12
文書画像に対する質問応答システムIQAS(文字とドキュメントの認識・理解)
福嶋 祥太, 黄瀬 浩一, 松本 啓之亮,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本稿では,文書画像に対する質問応答システムを提案する.質問応答システム(question answering system)とは自然言語文の検索質問に対して計算機が文書データベースから回答を記述した部分を返すシステムのことである.従来の質問応答システムは電子テキストを研究対象としており,文書画像を研究対象とするものはほとんどない.しかし,文書画像は電子図書館に多く存在し,電子テキストにはない情報を持っている.そこで文書画像を対象とした質問応答システムIQ AS (document Image Question Answering System) を構築しその有効性を検討する. IQASの特徴は,文書画像における単語の位置情報を用いて回答が含まれている部分を特定する点にある.1253ページ(197ドキュメント),20質問を用いた実験の結果,MRR(Mean Reciprocal Rank)が0.45となった.
抄録(英) In this report, we propose a question answering system for document images. Question answering systems are to extract from document databases exact parts of articles that directly answer the questions given by a user. Most of conventional question answering systems deal with electronic texts. However a great number of document images exist in electronic library. Such document images have unique information which is not obtained from electronic texts. In order to utilize these document images, we propose a question answering system for document images: IQAS(document Image Question Answering System). A characteristic point of IQAS is that it returns exact parts of document images based on 2D position information of terms. The experimental results on 1,253 pages (197 documents) with 20 queries show that MRR (Mean Reciprocal Rank) is 0.45.
キーワード(和) 質問応答システム / 文書画像 / 単語の二次元出現密度分布 / レイアウト情報
キーワード(英) quesion answering system / document image / 2D denstiy distributions of terms / layout information
資料番号 TL2003-31,PRMU2003-217
発行日

研究会情報
研究会 PRMU
開催期間 2004/2/12(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Pattern Recognition and Media Understanding (PRMU)
本文の言語 JPN
タイトル(和) 文書画像に対する質問応答システムIQAS(文字とドキュメントの認識・理解)
サブタイトル(和)
タイトル(英) Question Answering System for Document Images: IQAS
サブタイトル(和)
キーワード(1)(和/英) 質問応答システム / quesion answering system
キーワード(2)(和/英) 文書画像 / document image
キーワード(3)(和/英) 単語の二次元出現密度分布 / 2D denstiy distributions of terms
キーワード(4)(和/英) レイアウト情報 / layout information
第 1 著者 氏名(和/英) 福嶋 祥太 / Shota FUKUSHIMA
第 1 著者 所属(和/英) 大阪府立大学工学部情報工学科
Dept. of Computer arid Systems Sciences, Osaka Prefecture University
第 2 著者 氏名(和/英) 黄瀬 浩一 / Kohichi KISE
第 2 著者 所属(和/英) 大阪府立大学大学院工学研究科情報工学分野
Dept. of Computer and Systems Sciences, Graduate School of ENG., Osaka Prefecture University
第 3 著者 氏名(和/英) 松本 啓之亮 / Keinosuke MATSUMOTO
第 3 著者 所属(和/英) 大阪府立大学大学院工学研究科情報工学分野
Dept. of Computer and Systems Sciences, Graduate School of ENG., Osaka Prefecture University
発表年月日 2004/2/12
資料番号 TL2003-31,PRMU2003-217
巻番号(vol) vol.103
号番号(no) 658
ページ範囲 pp.-
ページ数 6
発行日