講演名 | 2012-02-10 カメラを用いたレイアウトフリー文書画像検索(一般セッション,時系列パターン認識) 上田 敬介, 黄瀬 浩一, |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | 本稿では,我々が構築している,コンテンツ一致を基準としたカメラベースの文書画像検索手法における検索精度の向上法を提案する.我々はこれまでに,次のような特徴を持つ手法(従来手法と呼ぶ)を提案した.すなわち,(1)単語ごとの特徴抽出とクラスタリングを用いた単語画像の簡易コード化,(2)メッシュ特徴による特徴抽出,(3)単語クラスタIDのn-gramによる索引付け,の3つである.しかし,従来手法には3つの問題点がある.単語の回転を考慮していないこと,フォントの変化に弱いこと,n-gramの特定性を考慮していないことである.これら対して,提案手法では回転処理を加えた単語の形状から特徴抽出を行い,更に,データベース文書を複数のフォントで登録するとともに,重み付けを加える.その結果,従来手法よりも精度の向上が見られた.レイアウトや撮影方法の異なる文書画像320枚をクエリ画像とし,データベースの画像2,500枚に対して検索実験を行ったところ,検索精度88.1%,処理時間671[ms]を得た.検索精度については,従来手法の42.8%,OCRを用いた手法の70.3%から大幅に改善しており,処理時間についても,OCRを用いた手法の1/5であったことから,有効性が実証された. |
抄録(英) | |
キーワード(和) | 文書画像検索 / カメラベース / OCR / k-NN |
キーワード(英) | |
資料番号 | PRMU2011-227,SP2011-142 |
発行日 |
研究会情報 | |
研究会 | PRMU |
---|---|
開催期間 | 2012/2/2(から1日開催) |
開催地(和) | |
開催地(英) | |
テーマ(和) | |
テーマ(英) | |
委員長氏名(和) | |
委員長氏名(英) | |
副委員長氏名(和) | |
副委員長氏名(英) | |
幹事氏名(和) | |
幹事氏名(英) | |
幹事補佐氏名(和) | |
幹事補佐氏名(英) |
講演論文情報詳細 | |
申込み研究会 | Pattern Recognition and Media Understanding (PRMU) |
---|---|
本文の言語 | JPN |
タイトル(和) | カメラを用いたレイアウトフリー文書画像検索(一般セッション,時系列パターン認識) |
サブタイトル(和) | |
タイトル(英) | |
サブタイトル(和) | |
キーワード(1)(和/英) | 文書画像検索 |
キーワード(2)(和/英) | カメラベース |
キーワード(3)(和/英) | OCR |
キーワード(4)(和/英) | k-NN |
第 1 著者 氏名(和/英) | 上田 敬介 |
第 1 著者 所属(和/英) | 大阪府立大学大学院工学研究科 |
第 2 著者 氏名(和/英) | 黄瀬 浩一 |
第 2 著者 所属(和/英) | 大阪府立大学大学院工学研究科 |
発表年月日 | 2012-02-10 |
資料番号 | PRMU2011-227,SP2011-142 |
巻番号(vol) | vol.111 |
号番号(no) | 430 |
ページ範囲 | pp.- |
ページ数 | 6 |
発行日 |