講演名 2005-03-17
文書理解におけるベイズ推論(文書・文字メディアの認識・理解, 一般)
金 鎭衡,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 近年, オンライン, オフライン双方の文書理解において, ベイジアン・アプローチは基本的な推論技法として一般的になりつつある.ベイジアン・アプローチは, 画像強調, 構造モデル化, モデルに基づく照合, 統計的言語モデルに基づく後処理, さらには多識別器の組み合わせなど, 文書解析・理解のほぼ全ての処理に適用されている.適用の際の具体的な枠組みとしては, 隠れマルコフモデル, ベイジアンネット, マルコフ確率場モデルなど, 様々なものがある.本講演では, 統計的ストローク解析を用いたオンライン, オフライン文字認識に対するベイジアンネットの利用について詳しく述べる.東洋文字の認識における構造解析の有効性を考慮し, 我々は, ストロークの形状とストローク間の関係について統合的な確率モデル化を行っている.このモデル化は, 構造解析と統計的アプローチを, 両者の利点を保ったまま統合するという美しい枠組みとなっている.点-ストローク-文字の階層構造, ならびにこの構造の統計的依存関係を用いて, 文字はベイジアンネットによってモデル化される.これにより, ナイーブベイズ法のモデル化の粗さや, 力ずくのベイジアン・アプローチの計算量に関する問題点を克服している.また, ベイジアンネットを用いることによって, 文字の形状とストローク間の関係はデータから学習可能であり, さらに解析の結果として確率値を得ることができるため, 後の解析や他手法との統合に有益である.また本講演では, KAISTで研究されている様々な方法論や革新的なアプリケーションについて, 最近, あるいは現在進行中のものを簡単に紹介する.方法論としては, 超解像による例に基づくベイジアン画像強調, 依存関係を考慮した多識別器の組み合わせ, 東洋言語コーパスを用いた統計的言語モデルについて述べる.また, アプリケーションとしては, 電子図書館のための古文書解析, 3次元空間に文字を書くというインタフェースについて述べる.
抄録(英) Recently Bayesian approach gains popularity as basic inference engine for online and offline document understanding. It is applied for almost every step of document analysis and understanding, such as image enhancement, structure modeling, model-based matching, postprocessing by stochastic language models, as well as multiple classifier combination. Such Bayesian approach is applied under the various frameworks such as Hidden Markov Model, Bayesian Network, Markov random field, etc. Large portions of this talk will be devoted on Bayesian Network approach for online and offline character recognition with stochastic stroke analyses. Noticing the value of structure analysis in oriental character recognition, a unified probabilistic framework is developed for modeling shapes of constituent strokes and their relations. Such modeling scheme is a noble combination of structural analysis and statistical approach preserving advantages of both approaches. Utilizing point-stroke-character hierarchy and statistical dependencies in such structure, characters are modeled as a Bayesian Network which overcomes the crudeness of naive Bayesian approach as well as the complexity of brute force Bayesian approach. Therefore, character shapes and stroke relationships are learnable from training data set, and the result of model analysis yields a probability value which can be used for further analysis and combined easily with other analysis results. Briefly mentioned will be recent or on-going works at KAIST on various methodologies and innovative applications of document analysis. The methodologies include example-based Bayesian image enhancement by super-resolution, dependency-based multiple classifier combination, stochastic language modeling techniques from oriental language corpus, while the applications include historical document analysis for digital libraries and interface by writing in 3D space.
キーワード(和) 文書解析 / 手書き東洋文字認識 / ベイジアンネット / ストローク形状解析 / ストローク関係解析
キーワード(英) Document analysis / Handwritten oriental character recognition / Bayesian network / Stroke shape analysis / Stroke relationship analysis
資料番号 TL2004-60,PRMU2004-228
発行日

研究会情報
研究会 TL
開催期間 2005/3/10(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Thought and Language (TL)
本文の言語 ENG
タイトル(和) 文書理解におけるベイズ推論(文書・文字メディアの認識・理解, 一般)
サブタイトル(和)
タイトル(英) Bayesian Inference in Document Understanding
サブタイトル(和)
キーワード(1)(和/英) 文書解析 / Document analysis
キーワード(2)(和/英) 手書き東洋文字認識 / Handwritten oriental character recognition
キーワード(3)(和/英) ベイジアンネット / Bayesian network
キーワード(4)(和/英) ストローク形状解析 / Stroke shape analysis
キーワード(5)(和/英) ストローク関係解析 / Stroke relationship analysis
第 1 著者 氏名(和/英) 金 鎭衡 / Jin Hyung Kim
第 1 著者 所属(和/英) 韓國科學技術院電算學科
Computer Science Department
発表年月日 2005-03-17
資料番号 TL2004-60,PRMU2004-228
巻番号(vol) vol.104
号番号(no) 739
ページ範囲 pp.-
ページ数 87
発行日