講演名 2003/3/6
多段階手続きによる日本語活字文字認識
伊藤 仁志, 大羽 成征, 山形 秀明, 石井 信,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 日本語活字OCRソフトウェアは、おおまかに分けて、文字切り出し、画像特徴の抽出、判別処理、文脈解析といった多段階処理によって、文字の認識を行っている。本研究では、特に判別処理(文字認識器)に注目し、その改善を試みた。本研究で提案する判別処理は、計算量および辞書容量と認識率との間のトレードオフを解決することを目的として、多段階手続きを基本とする。まず、大分類として、全文字種代表点に対するおおまかなクラスタリング結果を用いて文字種候補の絞り込みを行うことで、判別時の計算量を削減した。修正二次判別関数に基づく中分類では、正準判別分析による特徴選択により、認識率の向上を実現した。また、小分類では、中分類で認識困難な文字種組に対してサポートベクトルマシンによるニクラス分類を適用し、さらなる認識性能向上に成功した。
抄録(英) OCR softwares for Japanese printed characters consist of many processes; cutting out a character, extracting features, character recognition, context analysis, and so on. We focus on the character recognition process and discuss an improvement of its performance. In order to solve the trade-off between improving recognition accuracy and saving computational resources, our method is based on a multi-step procedure. In the first step, clustering is applied to representative vectors, each of which corresponds to a single character, and candidates are successfully reduced by referring the clustering result. In the next step, the recognition based on modified quadratic discriminant function is done by incorporating a discriminant analysis. In the final step, a support vector machine is used to distinguish confusing character pairs. An experimenal result shows that the proposed method has a high recognition performance.
キーワード(和) OCR / 文字認識 / 特徴選択 / 階層処理 / 分類
キーワード(英) OCR / character recognition / feature selection / hierarchical procedure / classification
資料番号 PRMU2002-236
発行日

研究会情報
研究会 PRMU
開催期間 2003/3/6(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Pattern Recognition and Media Understanding (PRMU)
本文の言語 JPN
タイトル(和) 多段階手続きによる日本語活字文字認識
サブタイトル(和)
タイトル(英) Japanese printed character recognition using a multi-step procedure
サブタイトル(和)
キーワード(1)(和/英) OCR / OCR
キーワード(2)(和/英) 文字認識 / character recognition
キーワード(3)(和/英) 特徴選択 / feature selection
キーワード(4)(和/英) 階層処理 / hierarchical procedure
キーワード(5)(和/英) 分類 / classification
第 1 著者 氏名(和/英) 伊藤 仁志 / Hitoshi ITOH
第 1 著者 所属(和/英) 奈良先端科学技術大学院大学
Nara Institute of Science and Technology
第 2 著者 氏名(和/英) 大羽 成征 / Shigeyuki OBA
第 2 著者 所属(和/英) 奈良先端科学技術大学院大学
Nara Institute of Science and Technology
第 3 著者 氏名(和/英) 山形 秀明 / Hideaki YAMAGATA
第 3 著者 所属(和/英) 株式会社リコー
RICOH COMPANY, LTD.
第 4 著者 氏名(和/英) 石井 信 / Shin ISHII
第 4 著者 所属(和/英) 奈良先端科学技術大学院大学
Nara Institute of Science and Technology
発表年月日 2003/3/6
資料番号 PRMU2002-236
巻番号(vol) vol.102
号番号(no) 707
ページ範囲 pp.-
ページ数 6
発行日