講演名 2000/2/22
多値文書画像における適応的二値化手法
村形 明, 恩田 憲一, 小沢 慎治,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 多値文書画像を入力として, OCRを用いた文字認識を行なう場合, スキャナで入力であっても文字の構造の影響が表れ, 従来の二値化手法では不十分である.また, ディジタルカメラで入力した場合, 文字の構造の影響のみならず画像全体にシェーディングの影響を受けるので二値化がより困難になる.シェーディングの影響は閾値を決定を困難にし, 文字の構造の影響は多値文字画像が潰れたり掠れたりするので文字の品質を悪化させる.本手法は上記の問題を扱う適応的な二値化手法を提案する.ディジタルカメラ入力の画像を文字と背景の2状態だけではなく, 文字画素, 遷移画素, 背景画素が存在すると仮定する.遷移領域の画素に着目し微分特徴量を利用しこれらの領域をはじめに二値化する.フォントの違う画像に対してOCR文字認識率の向上を確認した.
抄録(英) Gray scale document image is less suitable for conventional binarization algorithm because of character struture when used for OCR. Digital camera image is difficult to binarize conventional binarization algorithm because of strong shading. Strong shading causes difficulty to decide threshold level, and character structure tend to make binarized character scratchy or blurred. This paper presents a model based adaptive binarization algorithm, which handles above problems. we assumed digitized binary image has not only two states (black and white) but also three states. They are Background, Transition and Character pixel. We attach importance to Transition pixels, and utilize gradient information from this area for first stage binarization. Finally, we examine the performance of this method on sets of character image for several types of fonts, and we found certain percentage of improvement in OCR results.
キーワード(和) 二値化 / 文書画像 / ディジタルカメラ / OCR
キーワード(英) Binarization / document image / digital camera / OCR
資料番号 PRMU99-232
発行日

研究会情報
研究会 PRMU
開催期間 2000/2/22(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Pattern Recognition and Media Understanding (PRMU)
本文の言語 JPN
タイトル(和) 多値文書画像における適応的二値化手法
サブタイトル(和)
タイトル(英) An Adaptive Threshold Method for Gray Scale Document Images
サブタイトル(和)
キーワード(1)(和/英) 二値化 / Binarization
キーワード(2)(和/英) 文書画像 / document image
キーワード(3)(和/英) ディジタルカメラ / digital camera
キーワード(4)(和/英) OCR / OCR
第 1 著者 氏名(和/英) 村形 明 / Akira Murakata
第 1 著者 所属(和/英) 慶應義塾大学大学院理工学部研究科
Faculty of Science and Technology, Keio University
第 2 著者 氏名(和/英) 恩田 憲一 / Norikazu Onda
第 2 著者 所属(和/英) 慶應義塾大学大学院理工学部研究科
Faculty of Science and Technology, Keio University
第 3 著者 氏名(和/英) 小沢 慎治 / Shinji Ozawa
第 3 著者 所属(和/英) 慶應義塾大学大学院理工学部研究科
Faculty of Science and Technology, Keio University
発表年月日 2000/2/22
資料番号 PRMU99-232
巻番号(vol) vol.99
号番号(no) 649
ページ範囲 pp.-
ページ数 8
発行日