講演名 2006-10-20
テクスチャを特徴量とする手書き文字領域と活字文字領域の判別
小山 純平, 加藤 雅弘, 廣瀬 明,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 非定型文書を手書き文字領域と活字文字領域に判別する技術の実現は,それぞれに特化したOptical Character Reader (OCR)を用いて文字認識を行う作業を自動化する観点から非常に有用である.われわれは手書きに起因する揺らぎを利用した手書き文字領域と活字文字領域の判別手法を提案する.本報告では、文書画像に二次元フーリエ変換を施して得た周波数空間画像をテクスチャ特徴量として利用する.ここでは、手書き文字の揺らぎ基軸の水平・鉛直からのずれや基軸へのスペクトルの非集中性として表現される.その揺らぎを評価するために手書き文字度という新しい評価尺度を定義した.提案手法による漢字サンプルデータを利用した実験の結果、手書き文字と活字文字の差異を顕著に表す評価量を得ることに成功した.
抄録(英) The realization of a technique to distinguish between hand-written-character and printed-character regions is significantly important because it can automates the process that an optical character reader reads the characters by switching specifically prepared engines. We propose a new technique paying attention to fluctuations in characters, which is caused by hand writing. Two-dimensional Fourier transform generates a Fourier domain image, i.e., spectrum, from which we extract feature quantities in texture. In this image, the fluctuations in characters are expressed as non-concentricity of the power onto principal axes (PAs) and the skew of the PAs. Based on the spectral image, we define the degree of hand-written-character region. Experimental results show that our method successfully indicates the difference between hand-written-character regions and printed-character ones.
キーワード(和) 手書き / 活字 / 二次元フーリエ変換 / 文書領域判別 / テクスチャ / 光学文字読取装置(OCR)
キーワード(英) hand-written character / printed character / two-dimensional Fourier transform / text-regions / texture / optical character reader (OCR)
資料番号 PRMU2006-108
発行日

研究会情報
研究会 PRMU
開催期間 2006/10/13(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Pattern Recognition and Media Understanding (PRMU)
本文の言語 JPN
タイトル(和) テクスチャを特徴量とする手書き文字領域と活字文字領域の判別
サブタイトル(和)
タイトル(英) Distinction between Hand-Written-Character and Printed-Character Regions Based on Textural Features
サブタイトル(和)
キーワード(1)(和/英) 手書き / hand-written character
キーワード(2)(和/英) 活字 / printed character
キーワード(3)(和/英) 二次元フーリエ変換 / two-dimensional Fourier transform
キーワード(4)(和/英) 文書領域判別 / text-regions
キーワード(5)(和/英) テクスチャ / texture
キーワード(6)(和/英) 光学文字読取装置(OCR) / optical character reader (OCR)
第 1 著者 氏名(和/英) 小山 純平 / Jumpei KOYAMA
第 1 著者 所属(和/英) 東京大学大学院工学系研究科電子工学専攻
Department of Electronic Engineering School of Engineering, The University of Tokyo
第 2 著者 氏名(和/英) 加藤 雅弘 / Masahiro KATO
第 2 著者 所属(和/英) 富士ゼロックス株式会社
Fuji Xerox Co., Ltd.
第 3 著者 氏名(和/英) 廣瀬 明 / Akira HIROSE
第 3 著者 所属(和/英) 東京大学大学院工学系研究科電子工学専攻
Department of Electronic Engineering School of Engineering, The University of Tokyo
発表年月日 2006-10-20
資料番号 PRMU2006-108
巻番号(vol) vol.106
号番号(no) 301
ページ範囲 pp.-
ページ数 6
発行日