講演名 2014-12-19
OCRによる印刷文字の読み取り精度向上に関する検討(システムオンシリコン,近距離無線通信応用システム,一般)
安田 翔悟, 木村 誠聡, 辻 裕之,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 複雑な模様を持つ背景に印刷された文字をOCRで読み取る際,2値化後の画像にスパイク状や線状の雑音が重畳し,文字の読み取り精度が著しく低下する場合がある.本研究では,このような状況を改善するため,2値化後の画像からスパイク状の雑音を効果的に除去する前処理フィルタを導入し,読み取り精度向上を実現する手法の提案を行った.オープンソースのOCRエンジンであるTesseractに本手法を適用することにより,提案法の有効性を確認した.
抄録(英) When reading characters printed on the background of fine patterns with OCR, the binarization process often fails and generates spike-like and/or line-shaped noise in the binary results, which makes the OCR reading accuracy significantly reduced. In this report, we proposed a pre-processing scheme that can effectively remove spike-like noise without altering the silhouette of each character in order to improve the OCR reading accuracy. The effectiveness of the proposed method was confirmed by applying the method to an open source OCR engine, named "Tesseract".
キーワード(和) 光学文字認識 / OCR / シリアル番号認識 / インパルス雑音除去
キーワード(英) Optical character recognition / OCR / Serial number recognition / Impulse noise removal
資料番号 SIS2014-82
発行日

研究会情報
研究会 SIS
開催期間 2014/12/11(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Smart Info-Media Systems (SIS)
本文の言語 JPN
タイトル(和) OCRによる印刷文字の読み取り精度向上に関する検討(システムオンシリコン,近距離無線通信応用システム,一般)
サブタイトル(和)
タイトル(英) Improving OCR accuracy of reading printed characters on the noisy background
サブタイトル(和)
キーワード(1)(和/英) 光学文字認識 / Optical character recognition
キーワード(2)(和/英) OCR / OCR
キーワード(3)(和/英) シリアル番号認識 / Serial number recognition
キーワード(4)(和/英) インパルス雑音除去 / Impulse noise removal
第 1 著者 氏名(和/英) 安田 翔悟 / Shogo YASUDA
第 1 著者 所属(和/英) 神奈川工科大学情報学部
Kanagawa Institute of Technology
第 2 著者 氏名(和/英) 木村 誠聡 / Tomoaki KIMURA
第 2 著者 所属(和/英) 神奈川工科大学情報学部
Kanagawa Institute of Technology
第 3 著者 氏名(和/英) 辻 裕之 / Hiroyuki TSUJI
第 3 著者 所属(和/英) 神奈川工科大学情報学部
Kanagawa Institute of Technology
発表年月日 2014-12-19
資料番号 SIS2014-82
巻番号(vol) vol.114
号番号(no) 370
ページ範囲 pp.-
ページ数 5
発行日