講演名 | 2011-11-24 レイアウトの変動にも対応できる文書画像検索法(テーマセッション,実世界文字認識と理解) 上田 敬介, 黄瀬 浩一, |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | レイアウトが変更されていても,コンテンツが一致すれば検索が可能な文書画像検索法を提案する.文書画像検索の既存手法は大きく分けて2種類ある.1つは,各文字や各単語の近傍位置関係を特徴として検索する手法である.もう1つは,文字認識を行い,文書をコード化して検索を行う手法である.しかし,これらの手法にはそれぞれ問題点がある.前者の手法では,データベースの文書画像とレイアウトが違う文書画像を与えると検索ができなくなる.後者の手法では,レイアウト変動には柔軟であるが,処理時間が長いという問題点がある.そこで本研究では,レイアウトの変動にも対応でき,文字認識ほど厳密な処理を行わない手法を提案する.レイアウトの違う文書300ページをクエリ画像とし,データベースの画像10,000枚に対して検索実験を行ったところ,認識精度93.7%,検索時間417[ms]を得た.これはOCRを用いて得られる認識精度99.0%には劣るものの,検索時間は1/4となっていることから高速な検索が可能であることがわかった. |
抄録(英) | |
キーワード(和) | 文書画像検索 / カメラベース / OCR / k-NN |
キーワード(英) | |
資料番号 | PRMU2011-103 |
発行日 |
研究会情報 | |
研究会 | PRMU |
---|---|
開催期間 | 2011/11/17(から1日開催) |
開催地(和) | |
開催地(英) | |
テーマ(和) | |
テーマ(英) | |
委員長氏名(和) | |
委員長氏名(英) | |
副委員長氏名(和) | |
副委員長氏名(英) | |
幹事氏名(和) | |
幹事氏名(英) | |
幹事補佐氏名(和) | |
幹事補佐氏名(英) |
講演論文情報詳細 | |
申込み研究会 | Pattern Recognition and Media Understanding (PRMU) |
---|---|
本文の言語 | JPN |
タイトル(和) | レイアウトの変動にも対応できる文書画像検索法(テーマセッション,実世界文字認識と理解) |
サブタイトル(和) | |
タイトル(英) | |
サブタイトル(和) | |
キーワード(1)(和/英) | 文書画像検索 |
キーワード(2)(和/英) | カメラベース |
キーワード(3)(和/英) | OCR |
キーワード(4)(和/英) | k-NN |
第 1 著者 氏名(和/英) | 上田 敬介 |
第 1 著者 所属(和/英) | 大阪府立大学大学院工学研究科 |
第 2 著者 氏名(和/英) | 黄瀬 浩一 |
第 2 著者 所属(和/英) | 大阪府立大学大学院工学研究科 |
発表年月日 | 2011-11-24 |
資料番号 | PRMU2011-103 |
巻番号(vol) | vol.111 |
号番号(no) | 317 |
ページ範囲 | pp.- |
ページ数 | 6 |
発行日 |