講演名 2001/9/7
撮影距離の変化に対する情景内文字の認識特性
新村 貴彦, 白木 善尚, 武川 直樹, 澤木 美奈子, 萩田 紀博,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 情景内文字認識においては, カメラ位置と姿勢の変化による文字変形, 照明変動, 撮影距離による解像度低下など, 文書文字認識にはなかった様々な解決すべき問題がある.本報告では、文字解像度低下の問題を取り上げ, 文書文字認識の処理方法の認識特性を明らかにする.特徴ベクトルとして局所方向寄与度(LDC)特徴と2値パターン特徴の2種類を用いた.前処理手法として, 2値化閾値と3種類のサイズ正規化の効果を調べた.20フォント26英大文字の実験の結果, マルチテンプレートで比較して, LDC特徴の方が認識率90%以上となる撮影距離範囲が広いこと, 解像度が低くなると両特徴とも認識率が著しく低下しズーム制御が必要になること, そして動的2値化法が撮影距離の許容範囲を拡大することに有効であることが示す.
抄録(英) Character recognition systems using digital camera images should not only deal with the degradation of the character images but also address factors like camera distance, different illumination conditions and zoom control. In this paper, we report some results concerning the depth-related properties of several character recognition methods using two features (the "LDC", representing stroke direction distribution, and the "binary pattern-feature", representing blurred character patterns) and several preprocessings. Our experimental results for 26 alphabet characters with 20 fonts show that the tolerance range with LDC is superior, achieving a recognition rate over 90% for high-resolution images. However a zoom controller has to be employed in the case of low-resolution images to improve recognition. It also shows that the use of binary patterns coming from different binarization thresholds as input makes the tolerance range expand.
キーワード(和) 情景内画像 / パターン認識 / 文字認識
キーワード(英) scene images / pattern recognition / character recognition
資料番号 PRMU2001-97
発行日

研究会情報
研究会 PRMU
開催期間 2001/9/7(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Pattern Recognition and Media Understanding (PRMU)
本文の言語 JPN
タイトル(和) 撮影距離の変化に対する情景内文字の認識特性
サブタイトル(和)
タイトル(英) Camera-distance-related properties of character recognition in everyday scene images
サブタイトル(和)
キーワード(1)(和/英) 情景内画像 / scene images
キーワード(2)(和/英) パターン認識 / pattern recognition
キーワード(3)(和/英) 文字認識 / character recognition
第 1 著者 氏名(和/英) 新村 貴彦 / Takahiko SHIMMURA
第 1 著者 所属(和/英) 日本電信電話株式会社 NTT コミュニケーション科学基礎研究所
NTT Communication Science Laboratories, NTT Corporation
第 2 著者 氏名(和/英) 白木 善尚 / Yoshinao SHIRAKI
第 2 著者 所属(和/英) 日本電信電話株式会社 NTT コミュニケーション科学基礎研究所
NTT Communication Science Laboratories, NTT Corporation
第 3 著者 氏名(和/英) 武川 直樹 / Naoki MUKAWA
第 3 著者 所属(和/英) 日本電信電話株式会社 NTT コミュニケーション科学基礎研究所
NTT Communication Science Laboratories, NTT Corporation
第 4 著者 氏名(和/英) 澤木 美奈子 / Minako SAWAKI
第 4 著者 所属(和/英) 日本電信電話株式会社 NTT コミュニケーション科学基礎研究所
NTT Communication Science Laboratories, NTT Corporation
第 5 著者 氏名(和/英) 萩田 紀博 / Norihiro HAGITA
第 5 著者 所属(和/英) 日本電信電話株式会社 NTT コミュニケーション科学基礎研究所
NTT Communication Science Laboratories, NTT Corporation
発表年月日 2001/9/7
資料番号 PRMU2001-97
巻番号(vol) vol.101
号番号(no) 303
ページ範囲 pp.-
ページ数 7
発行日