講演名 2000/3/17
スキップマルコフ連鎖モデルを用いた日本文の誤り検出、訂正方法
荒木 哲郎, 池原 悟, 橋本 憲久,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) OCRや音声認識装置等から入力された文に含まれる誤りを自動的に検出する方法の一つとして、誤り箇所におけるマルコフ連鎖モデルの文字連鎖確率が連続して減少し、その減少回数が、誤り種別と誤り文字数に依存することに着目した方法が提案されている[6]。この方法には、(1)脱落誤りの検出精度が置換または挿入誤りなどと比べて低いこと、(2)置換、挿入および脱落の誤りが組み合わさった混合誤りを正しく検出・訂正できないこと等の問題がある。本論文では、その解決法として、離散的な文字の結合力をみるスキップタイプのマルコフ連鎖モデルを用いる方法を提案した。また、この方法を日本語新聞記事(擬似的に発生させた標本文3, 400件の誤り)を用いて、検出と訂正の実験を行い、従来の方法と比較評価した。その結果、脱落誤りについては、検出精度が(再現率と適合率の調和平均で)14%程度向上し、その検出精度は90%程度となった。また、混合誤りについては、「置換1文字+脱落1文字誤り」で検出精度が93.4%、訂正精度が61.1%、「置換1文字+挿入1文字誤り」で検出精度が90.4%、訂正精度が83.3%であることがわかった。
抄録(英) In optical character recognition and continuous speech recognition of a natural language, there are crroneous characters that have been wrongly substituted, inserted and deleted. We have previously proposed a method to detect and correct these errors using the Markov chain model. In this paper, we propose a improved method to detect erroneous characters wrongly deleted, and compound errors of wrongly inserted, substituted and deleted characters, using skipped Markov chain models. From the results of the experiments, it is concluded that this method is useful for detecting as well as correcting these erroneous characters.
キーワード(和) マルコフ連鎖モデル / スキップマルコフ連鎖モデル / 脱落誤り / 混合誤り
キーワード(英) Markov chain model / Skipped Markov chain models / wrongly deleted characters / Compound error strings
資料番号 NLC99-78,PRMU99-261
発行日

研究会情報
研究会 PRMU
開催期間 2000/3/17(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Pattern Recognition and Media Understanding (PRMU)
本文の言語 JPN
タイトル(和) スキップマルコフ連鎖モデルを用いた日本文の誤り検出、訂正方法
サブタイトル(和)
タイトル(英) A method to detect and correct erroneous characters wrongly inserted, substituted and deleted in Japanese sentence using Skipped Markov chain models
サブタイトル(和)
キーワード(1)(和/英) マルコフ連鎖モデル / Markov chain model
キーワード(2)(和/英) スキップマルコフ連鎖モデル / Skipped Markov chain models
キーワード(3)(和/英) 脱落誤り / wrongly deleted characters
キーワード(4)(和/英) 混合誤り / Compound error strings
第 1 著者 氏名(和/英) 荒木 哲郎 / Tetsuo ARAKI
第 1 著者 所属(和/英) 福井大学工学部知能システム工学科
Department of Human and artificial Intelligent Systems, Factory of Engineering, Fukui Univ.
第 2 著者 氏名(和/英) 池原 悟 / Satoru IkEHARA
第 2 著者 所属(和/英) 鳥取大学知能情報工学科
Department of Intelligence Information Engineering, Factory of Engineering, Tottori Univ.
第 3 著者 氏名(和/英) 橋本 憲久 / Norihisa HASHIMOTO
第 3 著者 所属(和/英) 福井大学工学部知能システム工学科
Department of Human and artificial Intelligent Systems, Factory of Engineering, Fukui Univ.
発表年月日 2000/3/17
資料番号 NLC99-78,PRMU99-261
巻番号(vol) vol.99
号番号(no) 710
ページ範囲 pp.-
ページ数 8
発行日