講演名 2002/5/10
低品質文字認識のための情景文字画像の高品質化手法
高橋 裕樹, 尾形 幸祐, 中嶋 正之,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本報告では,ディジタルカメラで撮影した画像中に存在する文字情報の抽出,認識,翻訳等の処理を行うシステムの構築を目指して,画像の高品質化によって認識性能を向上する手法を提案する.提案手法では,ディジタルカメラで撮影した文字列を含む画像に対し,JPEG圧縮によるノイズの削減とDCTの高周波成分復元による拡大,2値化処理を行い,市販の文字認識ソフトウエアを用いて文字認識を行った.画像の拡大では,拡大に伴う、モスキートノイズやブロックノイズの影響が少ない拡大手法を提案する.文書画像をディジタルカメラで撮影した画像と看板やプレートに書かれた文字を撮影した画像に対して実験を行った.本報告では,画像の高品質化処理を目的としているため,文字の切り出しは手作業で行っている.これらの対象画像に対し,拡大処理を施さずに2値化処理を行った文字画像や共1次内挿法で拡大した画像と比べ,従来の文字認識技術を用いて文字認識率を向上することができた.
抄録(英) This paper proposes a method to enhance text images for a system which extracts, recognizes and translates characters in scenery images captured by a digital camera. The proposed method magnifies text images in frequency domain. It restores hi-frequency component caused by JPEG(Joint Photographic Experts Group) compression and reduces mosquito noise and block noise caused by magnification process. The obtained enhanced text images are binarized and then recognized by a commercial character recognition software. Experiments are performed for printed documents, sign boards and plates captured by a digital camera. In our experiments, texts are manually extracted from images because our goal in this paper is image enhancement. Compared with traditional approaches, the recognition ratio for our enhanced images by using a commercial character recognition software improves.
キーワード(和) 離散的コサイン変換 / 画像拡大 / 2値化 / 劣化画像 / 文字認識
キーワード(英) DCT(Discrete Cosine Transform) / Image enhancement / Binarization / Degraded image / Character recognition
資料番号 MI2002-33
発行日

研究会情報
研究会 MI
開催期間 2002/5/10(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Medical Imaging (MI)
本文の言語 JPN
タイトル(和) 低品質文字認識のための情景文字画像の高品質化手法
サブタイトル(和)
タイトル(英) Image Enhancement of Text in Scenery Images for Degraded Character Recognition
サブタイトル(和)
キーワード(1)(和/英) 離散的コサイン変換 / DCT(Discrete Cosine Transform)
キーワード(2)(和/英) 画像拡大 / Image enhancement
キーワード(3)(和/英) 2値化 / Binarization
キーワード(4)(和/英) 劣化画像 / Degraded image
キーワード(5)(和/英) 文字認識 / Character recognition
第 1 著者 氏名(和/英) 高橋 裕樹 / Hiroki TAKAHASHI
第 1 著者 所属(和/英) 東京工業大学 大学院 情報理工学研究科
Graduate School of Information Science & Engineering, Tokyo Institute of Technology
第 2 著者 氏名(和/英) 尾形 幸祐 / Kousuke OGATA
第 2 著者 所属(和/英) 東京工業大学 大学院 情報理工学研究科
Graduate School of Information Science & Engineering, Tokyo Institute of Technology
第 3 著者 氏名(和/英) 中嶋 正之 / Masayuki NAKAJIMA
第 3 著者 所属(和/英) 東京工業大学 大学院 情報理工学研究科
Graduate School of Information Science & Engineering, Tokyo Institute of Technology
発表年月日 2002/5/10
資料番号 MI2002-33
巻番号(vol) vol.102
号番号(no) 57
ページ範囲 pp.-
ページ数 6
発行日