講演名 2002/5/10
文字の2次元出現密度分布に基づく文書画像の部分検索
黄瀬 浩一, 辻野 雅章, 松本 啓之亮,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 文書画像データベース検索の一手法として,ユーザの検索質問に関連する文書画像を選択するだけではなく,その画像の中で検索質問に関連する「部分」を特定可能な手法,すなわち文書画像の部分検索法を提案する.部分検索法では,文書画像中で検索質問に関連する部分を特定でき,また,検索質問に関連しない部分からの影響を排除できるため,利便性や検索精度の向上が期待できる.提案手法は,「検索質問を構成する文字が密集する部分は検索質問に関連する部分である可能性が高い」という考えに基づく手法である.本手法の特徴は,(1)密集度合の計測に,検索質問の2次元出現密度という量を用いること,(2)出現密度の計算には,文書画像中での文字の分布だけを用いるため,文字認識やレイアウト解析の誤りに対して耐性があること,の2点にある.日本語新聞画像を対象とした実験の結果,部分検索の機能を持たない手法と比べて,提案手法が優れていることが明らかとなった.
抄録(英) This report presents a new method of document image retrieval that is capable of spotting parts of page images relevant to a user's query. This enables us to improve the effectiveness and the usability of retrieval, since the method is capable of spotting only relevant parts and thus free from the influence by irrelevant parts. The proposed method is based on the assumption that parts of page images which densely contain characters in a query are relevant to it. The characteristics of the proposed method are as follows: (1) Two-dimensional density distributions of a query are calculated for ranking parts of page images, (2) The method relies only on the distribution of characters in page images so as not to be severely affected by the errors of character recognition and layout analysis. Based on the experimental results of retrieving Japanese newspaper articles, it is shown that the proposed method is superior to a method without the function of dealing with parts.
キーワード(和) 文書画像データベース / 文書画像検索 / 文書検索 / 出現密度分布 / パッセージ検索
キーワード(英) Document image database / Document image retrieval / Document retrieval / Density distribution / Passage retrieval
資料番号 MI2002-32
発行日

研究会情報
研究会 MI
開催期間 2002/5/10(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Medical Imaging (MI)
本文の言語 JPN
タイトル(和) 文字の2次元出現密度分布に基づく文書画像の部分検索
サブタイトル(和)
タイトル(英) Retrieval of Relevant Parts of Document Images Based on Density Distributions of Characters
サブタイトル(和)
キーワード(1)(和/英) 文書画像データベース / Document image database
キーワード(2)(和/英) 文書画像検索 / Document image retrieval
キーワード(3)(和/英) 文書検索 / Document retrieval
キーワード(4)(和/英) 出現密度分布 / Density distribution
キーワード(5)(和/英) パッセージ検索 / Passage retrieval
第 1 著者 氏名(和/英) 黄瀬 浩一 / Koichi KISE
第 1 著者 所属(和/英) 大阪府立大学 大学院 工学研究科 情報工学分野
Dept. of Computer and Systems Sciences, Graduate School of Engineering, Osaka Prefecture University
第 2 著者 氏名(和/英) 辻野 雅章 / Masaaki TSUJINO
第 2 著者 所属(和/英) 大阪府立大学 大学院 工学研究科 情報工学分野
Dept. of Computer and Systems Sciences, Graduate School of Engineering, Osaka Prefecture University
第 3 著者 氏名(和/英) 松本 啓之亮 / Keinosuke MATSUMOTO
第 3 著者 所属(和/英) 大阪府立大学 大学院 工学研究科 情報工学分野
Dept. of Computer and Systems Sciences, Graduate School of Engineering, Osaka Prefecture University
発表年月日 2002/5/10
資料番号 MI2002-32
巻番号(vol) vol.102
号番号(no) 57
ページ範囲 pp.-
ページ数 8
発行日