講演名 2011-11-24
レイアウトの変動にも対応できる文書画像検索法(テーマセッション,実世界文字認識と理解)
上田 敬介, 黄瀬 浩一,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) レイアウトが変更されていても,コンテンツが一致すれば検索が可能な文書画像検索法を提案する.文書画像検索の既存手法は大きく分けて2種類ある.1つは,各文字や各単語の近傍位置関係を特徴として検索する手法である.もう1つは,文字認識を行い,文書をコード化して検索を行う手法である.しかし,これらの手法にはそれぞれ問題点がある.前者の手法では,データベースの文書画像とレイアウトが違う文書画像を与えると検索ができなくなる.後者の手法では,レイアウト変動には柔軟であるが,処理時間が長いという問題点がある.そこで本研究では,レイアウトの変動にも対応でき,文字認識ほど厳密な処理を行わない手法を提案する.レイアウトの違う文書300ページをクエリ画像とし,データベースの画像10,000枚に対して検索実験を行ったところ,認識精度93.7%,検索時間417[ms]を得た.これはOCRを用いて得られる認識精度99.0%には劣るものの,検索時間は1/4となっていることから高速な検索が可能であることがわかった.
抄録(英)
キーワード(和) 文書画像検索 / カメラベース / OCR / k-NN
キーワード(英)
資料番号 PRMU2011-103
発行日

研究会情報
研究会 PRMU
開催期間 2011/11/17(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Pattern Recognition and Media Understanding (PRMU)
本文の言語 JPN
タイトル(和) レイアウトの変動にも対応できる文書画像検索法(テーマセッション,実世界文字認識と理解)
サブタイトル(和)
タイトル(英)
サブタイトル(和)
キーワード(1)(和/英) 文書画像検索
キーワード(2)(和/英) カメラベース
キーワード(3)(和/英) OCR
キーワード(4)(和/英) k-NN
第 1 著者 氏名(和/英) 上田 敬介
第 1 著者 所属(和/英) 大阪府立大学大学院工学研究科
第 2 著者 氏名(和/英) 黄瀬 浩一
第 2 著者 所属(和/英) 大阪府立大学大学院工学研究科
発表年月日 2011-11-24
資料番号 PRMU2011-103
巻番号(vol) vol.111
号番号(no) 317
ページ範囲 pp.-
ページ数 6
発行日