講演抄録/キーワード |
講演名 |
2011-03-10 09:30
1,000万ページのデータベースを対象とした実時間文書画像検索のためのメモリ削減と安定性向上 ○竹田一貴・黄瀬浩一・岩村雅一(阪府大) PRMU2010-238 |
抄録 |
(和) |
本稿では,Locally Likely Arrangement Hashing (LLAH)を用いた実時間検索が可能な大規模文書画像検索法を提案する.LLAHは高いロバスト性を実現するために,必要メモリ量が多いという問題がある.また,大規模化に対処するには,特徴量の識別性・安定性が十分でないという問題もある.これらの問題点を解決するため,以下の3点の改良を施す.第1は,ハッシュに保存する特徴点をサンプリングすることによる必要メモリ量の削減である.第2は,特徴量の次元数を増加させることによる識別性向上である.第3は,特徴量の冗長な次元を削除することによる安定性向上である.実験により,これらの改善によって必要メモリ量が約50%削減されることが確認された.また,提案手法を用いて1,000万ページのデータベースを作成し実験を行ったところ,精度99.4%,処理時間38msで検索可能であることが確認された. |
(英) |
In this paper, we propose a large-scale document image retrieval method which realizes real-time processing with Locally Likely Arrangement Hashing (LLAH). Although LLAH has high accuracy and robustness, it requires a large amount of memory. It is also required to increase the discrimination power and stability of features for scaling up the database. For these purposes, we introduce the following three improvements. The first one is reduction of the required amount of memory by sampling feature points stored in the database. The second improvement is to increase the discrimination power by increasing the dimension of features. The last one is advancement of stability by removing redundant dimensions of features. From the experimental results, we have confirmed that the proposed improvements help to realize accuracy of 99.4% and processing time of 38ms for the database of 10 million pages. |
キーワード |
(和) |
文書画像検索 / リアルタイム処理 / LLAH / 大規模データベース / / / / |
(英) |
Document image retrieval / Real-time 10 million pages processing / LLAH / Large-scale database / / / / |
文献情報 |
信学技報, vol. 110, no. 467, PRMU2010-238, pp. 7-12, 2011年3月. |
資料番号 |
PRMU2010-238 |
発行日 |
2011-03-03 (PRMU) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
PRMU2010-238 |