講演名 | 2011-03-10 和文古文書画像からの高速単語検索アルゴリズム(テーマセッション,文字・文書の認識と理解) 並河 将樹, 浜田 望, |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | 毛筆文字で書かれた文書などはOCRの適用が困難である.こういった文書に対する解析手法として,文書を画像として扱い,テンプレートマッチングの要領で特定の単語を検索するという方法(ワードスポッティング)が提案されている.本研究はこの手法の高速化法を提案する.ある照合範囲におけるクエリーとの距離から,始点を固定して照合範囲を拡大した場合のクエリーとの距離の最小値を計算する.最小値が探索に用いる閾値より小さければ,クエリーとの照合を行う必要が無くなるため,照合回数を削減することができる.実際の手書き文書の画像を用いて実験を行った結果,計算時間を80%から50%程度まで削減することができた. |
抄録(英) | It is still difficult to apply the optical character recognition system to characterize hand-written documents such as those written by writing brushes. As a retrieving method to those documents, a method treating documents as the series of images and searching in them like template matching is proposed. This paper proposes a faster method. The proposed method estimates the lowest-distance between a query and a given image area. If an estimated lowest-distance is smaller than a threshold, we need not to verify with query. In experiments performed by using historical handwritten Japanese documents, the computational time of the proposed method reduces up to 50-80% of the previous. |
キーワード(和) | ワードスポッティング / 文書画像検索 / 固有空間法 / 高速化 / 毛筆手書き文書 / DTW |
キーワード(英) | Word Spotting / Document Image Search / Eignen-Space Method / Fast Algorithm / calligraphy-brush documents / DTW |
資料番号 | PRMU2010-242 |
発行日 |
研究会情報 | |
研究会 | PRMU |
---|---|
開催期間 | 2011/3/3(から1日開催) |
開催地(和) | |
開催地(英) | |
テーマ(和) | |
テーマ(英) | |
委員長氏名(和) | |
委員長氏名(英) | |
副委員長氏名(和) | |
副委員長氏名(英) | |
幹事氏名(和) | |
幹事氏名(英) | |
幹事補佐氏名(和) | |
幹事補佐氏名(英) |
講演論文情報詳細 | |
申込み研究会 | Pattern Recognition and Media Understanding (PRMU) |
---|---|
本文の言語 | JPN |
タイトル(和) | 和文古文書画像からの高速単語検索アルゴリズム(テーマセッション,文字・文書の認識と理解) |
サブタイトル(和) | |
タイトル(英) | Fast Wordspotting algorithm for Historical Japanese Document Images |
サブタイトル(和) | |
キーワード(1)(和/英) | ワードスポッティング / Word Spotting |
キーワード(2)(和/英) | 文書画像検索 / Document Image Search |
キーワード(3)(和/英) | 固有空間法 / Eignen-Space Method |
キーワード(4)(和/英) | 高速化 / Fast Algorithm |
キーワード(5)(和/英) | 毛筆手書き文書 / calligraphy-brush documents |
キーワード(6)(和/英) | DTW / DTW |
第 1 著者 氏名(和/英) | 並河 将樹 / Masaki NAMIKAWA |
第 1 著者 所属(和/英) | 慶應義塾大学大学院理工学研究科総合デザイン工学専攻 School of Integrated Design Engineering, Graduate School of Science and Technology, Keio University |
第 2 著者 氏名(和/英) | 浜田 望 / Nozomu HAMADA |
第 2 著者 所属(和/英) | 慶應義塾大学理工学部システムデザイン工学科 Department of System Design Engineering, Faculty of Science and Technology, Keio University |
発表年月日 | 2011-03-10 |
資料番号 | PRMU2010-242 |
巻番号(vol) | vol.110 |
号番号(no) | 467 |
ページ範囲 | pp.- |
ページ数 | 6 |
発行日 |