講演名 2011-03-10
和文古文書画像からの高速単語検索アルゴリズム(テーマセッション,文字・文書の認識と理解)
並河 将樹, 浜田 望,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 毛筆文字で書かれた文書などはOCRの適用が困難である.こういった文書に対する解析手法として,文書を画像として扱い,テンプレートマッチングの要領で特定の単語を検索するという方法(ワードスポッティング)が提案されている.本研究はこの手法の高速化法を提案する.ある照合範囲におけるクエリーとの距離から,始点を固定して照合範囲を拡大した場合のクエリーとの距離の最小値を計算する.最小値が探索に用いる閾値より小さければ,クエリーとの照合を行う必要が無くなるため,照合回数を削減することができる.実際の手書き文書の画像を用いて実験を行った結果,計算時間を80%から50%程度まで削減することができた.
抄録(英) It is still difficult to apply the optical character recognition system to characterize hand-written documents such as those written by writing brushes. As a retrieving method to those documents, a method treating documents as the series of images and searching in them like template matching is proposed. This paper proposes a faster method. The proposed method estimates the lowest-distance between a query and a given image area. If an estimated lowest-distance is smaller than a threshold, we need not to verify with query. In experiments performed by using historical handwritten Japanese documents, the computational time of the proposed method reduces up to 50-80% of the previous.
キーワード(和) ワードスポッティング / 文書画像検索 / 固有空間法 / 高速化 / 毛筆手書き文書 / DTW
キーワード(英) Word Spotting / Document Image Search / Eignen-Space Method / Fast Algorithm / calligraphy-brush documents / DTW
資料番号 PRMU2010-242
発行日

研究会情報
研究会 PRMU
開催期間 2011/3/3(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Pattern Recognition and Media Understanding (PRMU)
本文の言語 JPN
タイトル(和) 和文古文書画像からの高速単語検索アルゴリズム(テーマセッション,文字・文書の認識と理解)
サブタイトル(和)
タイトル(英) Fast Wordspotting algorithm for Historical Japanese Document Images
サブタイトル(和)
キーワード(1)(和/英) ワードスポッティング / Word Spotting
キーワード(2)(和/英) 文書画像検索 / Document Image Search
キーワード(3)(和/英) 固有空間法 / Eignen-Space Method
キーワード(4)(和/英) 高速化 / Fast Algorithm
キーワード(5)(和/英) 毛筆手書き文書 / calligraphy-brush documents
キーワード(6)(和/英) DTW / DTW
第 1 著者 氏名(和/英) 並河 将樹 / Masaki NAMIKAWA
第 1 著者 所属(和/英) 慶應義塾大学大学院理工学研究科総合デザイン工学専攻
School of Integrated Design Engineering, Graduate School of Science and Technology, Keio University
第 2 著者 氏名(和/英) 浜田 望 / Nozomu HAMADA
第 2 著者 所属(和/英) 慶應義塾大学理工学部システムデザイン工学科
Department of System Design Engineering, Faculty of Science and Technology, Keio University
発表年月日 2011-03-10
資料番号 PRMU2010-242
巻番号(vol) vol.110
号番号(no) 467
ページ範囲 pp.-
ページ数 6
発行日