講演名 2011-03-10
1,000万ページのデータベースを対象とした実時間文書画像検索のためのメモリ削減と安定性向上(テーマセッション,文字・文書の認識と理解)
竹田 一貴, 黄瀬 浩一, 岩村 雅一,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本稿では,Locally Likely Arrangement Hashing (LLAH)を用いた実時間検索が可能な大規模文書画像検索法を提案する.LLAHは高いロバスト性を実現するために,必要メモリ量が多いという問題がある.また,大規模化に対処するには,特徴量の識別性・安定性が十分でないという問題もある.これらの問題点を解決するため,以下の3点の改良を施す.第1は,ハッシュに保存する特徴点をサンプリングすることによる必要メモリ量の削減である.第2は,特徴量の次元数を増加させることによる識別性向上である.第3は,特徴量の冗長な次元を削除することによる安定性向上である.実験により,これらの改善によって必要メモリ量が約50%削減されることが確認された.また,提案手法を用いて1,000万ページのデータベースを作成し実験を行ったところ,精度99.4% ,処理時間38msで検索可能であることが確認された.
抄録(英) In this paper, we propose a large-scale document image retrieval method which realizes real-time processing with Locally Likely Arrangement Hashing (LLAH). Although LLAH has high accuracy and robustness, it requires a large amount of memory. It is also required to increase the discrimination power and stability of features for scaling up the database. For these purposes, we introduce the following three improvements. The first one is reduction of the required amount of memory by sampling feature points stored in the database. The second improvement is to increase the discrimination power by increasing the dimension of features. The last one is advancement of stability by removing redundant dimensions of features. From the experimental results, we have confirmed that the proposed improvements help to realize accuracy of 99.4% and processing time of 38ms for the database of 10 million pages.
キーワード(和) 文書画像検索 / リアルタイム処理 / LLAH / 大規模データベース
キーワード(英) Document image retrieval / Real-time 10 million pages processing / LLAH / Large-scale database
資料番号 PRMU2010-238
発行日

研究会情報
研究会 PRMU
開催期間 2011/3/3(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Pattern Recognition and Media Understanding (PRMU)
本文の言語 JPN
タイトル(和) 1,000万ページのデータベースを対象とした実時間文書画像検索のためのメモリ削減と安定性向上(テーマセッション,文字・文書の認識と理解)
サブタイトル(和)
タイトル(英) Memory Reduction and Stability Improvement for Real-Time Document Image Retrieval with a Database of 10 Million Pages
サブタイトル(和)
キーワード(1)(和/英) 文書画像検索 / Document image retrieval
キーワード(2)(和/英) リアルタイム処理 / Real-time 10 million pages processing
キーワード(3)(和/英) LLAH / LLAH
キーワード(4)(和/英) 大規模データベース / Large-scale database
第 1 著者 氏名(和/英) 竹田 一貴 / Kazutaka TAKEDA
第 1 著者 所属(和/英) 大阪府立大学工学部
School of Engineering, Osaka Prefecture University
第 2 著者 氏名(和/英) 黄瀬 浩一 / Koichi KISE
第 2 著者 所属(和/英) 大阪府立大学大学院工学研究科
Graduate School of Engineering, Osaka Prefecture University
第 3 著者 氏名(和/英) 岩村 雅一 / Masakazu IWAMURA
第 3 著者 所属(和/英) 大阪府立大学大学院工学研究科
Graduate School of Engineering, Osaka Prefecture University
発表年月日 2011-03-10
資料番号 PRMU2010-238
巻番号(vol) vol.110
号番号(no) 467
ページ範囲 pp.-
ページ数 6
発行日