講演名 2012-02-10
カメラを用いたレイアウトフリー文書画像検索(一般セッション,時系列パターン認識)
上田 敬介, 黄瀬 浩一,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本稿では,我々が構築している,コンテンツ一致を基準としたカメラベースの文書画像検索手法における検索精度の向上法を提案する.我々はこれまでに,次のような特徴を持つ手法(従来手法と呼ぶ)を提案した.すなわち,(1)単語ごとの特徴抽出とクラスタリングを用いた単語画像の簡易コード化,(2)メッシュ特徴による特徴抽出,(3)単語クラスタIDのn-gramによる索引付け,の3つである.しかし,従来手法には3つの問題点がある.単語の回転を考慮していないこと,フォントの変化に弱いこと,n-gramの特定性を考慮していないことである.これら対して,提案手法では回転処理を加えた単語の形状から特徴抽出を行い,更に,データベース文書を複数のフォントで登録するとともに,重み付けを加える.その結果,従来手法よりも精度の向上が見られた.レイアウトや撮影方法の異なる文書画像320枚をクエリ画像とし,データベースの画像2,500枚に対して検索実験を行ったところ,検索精度88.1%,処理時間671[ms]を得た.検索精度については,従来手法の42.8%,OCRを用いた手法の70.3%から大幅に改善しており,処理時間についても,OCRを用いた手法の1/5であったことから,有効性が実証された.
抄録(英)
キーワード(和) 文書画像検索 / カメラベース / OCR / k-NN
キーワード(英)
資料番号 PRMU2011-227,SP2011-142
発行日

研究会情報
研究会 PRMU
開催期間 2012/2/2(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Pattern Recognition and Media Understanding (PRMU)
本文の言語 JPN
タイトル(和) カメラを用いたレイアウトフリー文書画像検索(一般セッション,時系列パターン認識)
サブタイトル(和)
タイトル(英)
サブタイトル(和)
キーワード(1)(和/英) 文書画像検索
キーワード(2)(和/英) カメラベース
キーワード(3)(和/英) OCR
キーワード(4)(和/英) k-NN
第 1 著者 氏名(和/英) 上田 敬介
第 1 著者 所属(和/英) 大阪府立大学大学院工学研究科
第 2 著者 氏名(和/英) 黄瀬 浩一
第 2 著者 所属(和/英) 大阪府立大学大学院工学研究科
発表年月日 2012-02-10
資料番号 PRMU2011-227,SP2011-142
巻番号(vol) vol.111
号番号(no) 430
ページ範囲 pp.-
ページ数 6
発行日