講演名 2004/2/13
手書き数字列認識における文字列レベルでの識別器学習(文字とドキュメントの認識・理解)
劉 成林, 丸川 勝美,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 我々はこれまで、切り出しと文字識別の統合型認識をベースに、単体文字識別と非文字の学習等の研究を進め、手書き数字列認識の精度を向上させてきた。本報告は、数字列認識で更なる精度向上を実現するため、文字列レベルでの識別器(パラメータ)の学習方法を実験的に評価検討したものである。学習処理では、文字列画像を動的に切出して文字識別を行い、パターンネットワーク上でパス探索を行うことで、パターン列候補を生成する。次にMCE(Minimum Classification Error)基準に基づき、切出したパターン列候補から文字列レベルで識別器を学習する。文字列レベルの識別器の学習効果を測定するため、幾つかの識別器に対して、NIST Special Database 19を用いて実験を行った。その結果、文字列レベルの学習により数字列の切出しミス低減を確認した。また、単体文字レベルで学習された識別器と文字列レベルで学習された識別器の適切な組合せにより数字列認識精度をさらに精度向上することができた。
抄録(英) In handwritten numeral string recognition integrating segmentation and recognition, we have previously obtained superior results by training classifiers with segmented characters and non-character samples. This paper describes our works of string-level classifier training for further improving the string recognition performance. In this scheme, the classifier is initially trained on segmented characters, and then the classifier parameters are adjusted on string samples. During training, the string samples are dynamically segmented by candidate pattern classification and path search, and the classifier parameters are adjusted on segmented patterns under the minimum classification error (MCE) criterion of Juang et al. We tested the effectiveness of string-level training with various classifier structures on the numeral string images of NIST Special Database 19. It was observed that string-level training yields higher string recognition accuracy than character-level training via decreasing segmentation errors while sacrificing the classification accuracy on segmented characters. By combining the string-level trained classifier and the character-level trained classifier, we have achieved even higher string recognition accuracy.
キーワード(和) 数字列認識 / 切り出しと文字認識統合型 / 文字識別 / 文字列レベル学習 / MCE基準 / 識別器複合化
キーワード(英) Numeral string recognition / integrated segmentation and recognition / character classification / string-level training / minimum classification error (MCE) criterion / classifier combination
資料番号 TL2003-46,PRMU2003-232
発行日

研究会情報
研究会 TL
開催期間 2004/2/13(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Thought and Language (TL)
本文の言語 ENG
タイトル(和) 手書き数字列認識における文字列レベルでの識別器学習(文字とドキュメントの認識・理解)
サブタイトル(和)
タイトル(英) String-Level Discriminative Training of Classifiers for Handwritten Numeral String Recognition
サブタイトル(和)
キーワード(1)(和/英) 数字列認識 / Numeral string recognition
キーワード(2)(和/英) 切り出しと文字認識統合型 / integrated segmentation and recognition
キーワード(3)(和/英) 文字識別 / character classification
キーワード(4)(和/英) 文字列レベル学習 / string-level training
キーワード(5)(和/英) MCE基準 / minimum classification error (MCE) criterion
キーワード(6)(和/英) 識別器複合化 / classifier combination
第 1 著者 氏名(和/英) 劉 成林 / Cheng-Lin LIU
第 1 著者 所属(和/英) (株)日立製作所中央研究所
Central Research Laboratory, Hitachi, Ltd.
第 2 著者 氏名(和/英) 丸川 勝美 / Katsumi MARUKAWA
第 2 著者 所属(和/英) (株)日立製作所中央研究所
Central Research Laboratory, Hitachi, Ltd.
発表年月日 2004/2/13
資料番号 TL2003-46,PRMU2003-232
巻番号(vol) vol.103
号番号(no) 657
ページ範囲 pp.-
ページ数 6
発行日