講演名 2006-03-16
高次情報を利用した数式文字認識の誤り訂正法の一検討(一般セッション(3),CVのためのパターン認識・学習理論の新展開)
瀧口 祐介, 岡田 稔, 三宅 康二,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 我々の研究室では印刷数式の知的二次利用を目的とした,オフライン数式認識理解システム(以下,本システム)の開発を進めている.本システムには,数式構成記号の文字認識を行う低次認識と,数式の二次元的な構造の認識と数字的な意味の理解を行う高次認識の二つの認識過程が含まれる.本論文では,その高次認識過程における文字認識の誤り訂正法を提案する.提案手法では文字認識と数式の構造認識の結果に基づいてコストツリーを生成し,数式に現れるキーワードと隣接する文字の共起確率の2種類の情報を利用することで,文字の誤認識を訂正する.提案手法の有効性を確かめるために幾つかの数式画像を用いて実験を行った結果,記号単位の文字認識率が79.8%から90.2%に,また数式単位の認識率が5.8%から41.1%に改善されることを確認した.
抄録(英) In this paper we propose a method for correcting character recognition errors at the higher level recognition step of the mathematical formulae recognition and understanding system. The system consists of two-level recognition steps: the low level recognition including character recognition, and the higher level recognition including layout recognition. We apply the layout information recognized in the latter step, and character recognition errors are corrected by using two sources of information. One is by some keywords such as mathematical function names, and the other is based on a cost tree and co-occurrence probabilities between symbols. Availability of the proposed method is indicated by some experimental results, and the character recognition rate raised from 79.8% to 90.2% and the formula recognition rate raised from 5.8% to 41.1% are confirmed.
キーワード(和) 数式認識 / 高次情報 / 文字認識誤り訂正 / コストツリー / 共起確率
キーワード(英) mathematical formulae recognition / higher level information / character recognition error correction / cost tree / co-occurrence probability
資料番号 PRMU2005-248
発行日

研究会情報
研究会 PRMU
開催期間 2006/3/9(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Pattern Recognition and Media Understanding (PRMU)
本文の言語 JPN
タイトル(和) 高次情報を利用した数式文字認識の誤り訂正法の一検討(一般セッション(3),CVのためのパターン認識・学習理論の新展開)
サブタイトル(和)
タイトル(英) A Study on Character Recognition Error Correction Method for Mathematical Formulae using Higher Level Information
サブタイトル(和)
キーワード(1)(和/英) 数式認識 / mathematical formulae recognition
キーワード(2)(和/英) 高次情報 / higher level information
キーワード(3)(和/英) 文字認識誤り訂正 / character recognition error correction
キーワード(4)(和/英) コストツリー / cost tree
キーワード(5)(和/英) 共起確率 / co-occurrence probability
第 1 著者 氏名(和/英) 瀧口 祐介 / Yusuke TAKIGUCHI
第 1 著者 所属(和/英) 早稲田大学大学院情報生産システム研究科
Graduate School of Information, Production and Systems, Waseda University
第 2 著者 氏名(和/英) 岡田 稔 / Minoru OKADA
第 2 著者 所属(和/英) 早稲田大学大学院情報生産システム研究科
Graduate School of Information, Production and Systems, Waseda University
第 3 著者 氏名(和/英) 三宅 康二 / Yasuji MIYAKE
第 3 著者 所属(和/英) 中部大学工学部
College of Engineering, Chubu University
発表年月日 2006-03-16
資料番号 PRMU2005-248
巻番号(vol) vol.105
号番号(no) 673
ページ範囲 pp.-
ページ数 6
発行日