講演名 2007-03-16
高次情報を利用した数式文字誤認識訂正における候補文字数の影響(テーマセッション4(数式),文字・文書の認識・理解)
瀧口 祐介, 岡田 稔, 宅 康,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 筆者らは既に,数式を対象とした文字誤認識訂正法(以下,本訂正法)を提案している.本訂正法は数式中の隣接文字の共起確率と数式キーワードという二つの高次情報を利用しており,訂正対象字種を制限しないことが特徴である.本論文では,本訂正法による誤認識訂正結果の個別・大局的な評価を行い,その知見に基づいた今後の課題について述べる.特に訂正に失敗した結果に注目し,訂正失敗の具体的な要因ついて考察する.考察より,数学的意味を考慮した字種の分類,隣り合う文字同士のサイズ比の考慮,共起確率による重みの検討,のそれぞれの必要性を確認した.
抄録(英) The authors have already proposed a method for correcting character recognition errors for mathematical formulae. The method uses two kinds of higher-level information such as co-occurrence probabilities between adjacent symbols in a mathematical formula and mathematical keywords using mathematical function names etc., and the method does not restrict the symbols that can be used in the character recognition and error correction. In this paper we evaluate correction results by the method individually and globally, and finally describe possible future directions for work motivated by the present results. Especially, we focus on failure correction results and discuss the factors which are assumed as triggers of failure correction results. From the discussion, we indicate needs to classify symbols using mathematical semantics, to consider the ratio of sizes between an adjacent symbol pair and to discuss influence about the weight defined by co-occurrence probabilities.
キーワード(和) 数式認識 / 高次情報 / 文字誤認識訂正 / コストツリー / 共起確率 / 数式キーワード / 個別・大局的評価
キーワード(英) mathematical formulae recognition / higher level information / character recognition error correction / cost tree / co-occurrence probability
資料番号 PRMU2006-256
発行日

研究会情報
研究会 PRMU
開催期間 2007/3/9(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Pattern Recognition and Media Understanding (PRMU)
本文の言語 JPN
タイトル(和) 高次情報を利用した数式文字誤認識訂正における候補文字数の影響(テーマセッション4(数式),文字・文書の認識・理解)
サブタイトル(和)
タイトル(英) Influence of the Number of Candidates in Character Recognition Error Correction for Mathematical Formulae with Higher Level Information
サブタイトル(和)
キーワード(1)(和/英) 数式認識 / mathematical formulae recognition
キーワード(2)(和/英) 高次情報 / higher level information
キーワード(3)(和/英) 文字誤認識訂正 / character recognition error correction
キーワード(4)(和/英) コストツリー / cost tree
キーワード(5)(和/英) 共起確率 / co-occurrence probability
キーワード(6)(和/英) 数式キーワード
キーワード(7)(和/英) 個別・大局的評価
第 1 著者 氏名(和/英) 瀧口 祐介 / Yusuke TAKIGUCHI
第 1 著者 所属(和/英) 早稲田大学大学院情報生産システム研究科
Graduate School of Information, Production and Systems, Waseda University
第 2 著者 氏名(和/英) 岡田 稔 / Minoru OKADA
第 2 著者 所属(和/英) 早稲田大学大学院情報生産システム研究科
Graduate School of Information, Production and Systems, Waseda University
第 3 著者 氏名(和/英) 宅 康 / Yasuji MIYAKE
第 3 著者 所属(和/英) 中部大学工学部
College of Engineering, Chubu University
発表年月日 2007-03-16
資料番号 PRMU2006-256
巻番号(vol) vol.106
号番号(no) 606
ページ範囲 pp.-
ページ数 6
発行日