講演名 2011-03-10
HMMを用いたオフライン手書き単語認識における環境クラスタリングとGMMの同時最適化(テーマセッション,文字・文書の認識と理解)
浜村 倫行, 入江 文平, 西本 卓也, 小野 順貴, 嵯峨山 茂樹,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 音声認識で広く使われている環境依存HMMには、環境クラスタリングとtied-mixtureの二つのアプローチがあり、環境クラスタリングの方が認識精度が高いことが報告されている。しかし、手書き単語認識の場合、筆記体とブロック体など全く異なる字体が一つの文字カテゴリに混在するため、環境クラスタリングが困難となる。そこで、これを解決する方法として、環境クラスタリングと混合ガウス分布(GMM)の同時最適化法を提案する。まず環境クラスタリングをEMアルゴリズムで最適化する方法を述べ、更にそれを拡張しGMMの同時最適化を導く。CEDARデータベースを用いた実験によりtied-mixtureによる従来法と比べ最大24.2%のエラー削減率を確認した。また計算効率同等の条件でも提案法の認識精度が高いことを確認した。
抄録(英) Context-dependent HMM is commonly used in speech recognition. The model can be realized by two ways : context clustering or tied-mixuture. In speech recognition, the former is reported to be more efficient. However, there is some difficulty in applying context clustering to handwritten word recognition, since the distribution of each character is typically a mixture of some different distributions, such as block-printed, cursive, etc. To deal with this problem, a method for concurrent optimization of context clustering and Gaussian Mixture Model (GMM) is proposed in this paper. Optimization of context clustering by EM algorithm is described first, followed by its expansion to concurrent optimization of context clustering and GMM. The recognition rate of the proposed method is higher than the conventional one which exploits tied-mixture with equivalent computational cost. Experimental results showed 24.2% error reduction on CEDAR database, compared with the conventional tied-mixture based method.
キーワード(和) 手書き単語認識 / 環境依存HMM / 環境クラスタリング / GMM / EMアルゴリズム
キーワード(英) Handwritten word recognition / Context-dependent HMM / Context clustering / GMM / EM algorithm
資料番号 PRMU2010-244
発行日

研究会情報
研究会 PRMU
開催期間 2011/3/3(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Pattern Recognition and Media Understanding (PRMU)
本文の言語 JPN
タイトル(和) HMMを用いたオフライン手書き単語認識における環境クラスタリングとGMMの同時最適化(テーマセッション,文字・文書の認識と理解)
サブタイトル(和)
タイトル(英) Simultaneous Optimization of Context Clustering and GMM for Offline Handwritten Word Recognition Using HMM
サブタイトル(和)
キーワード(1)(和/英) 手書き単語認識 / Handwritten word recognition
キーワード(2)(和/英) 環境依存HMM / Context-dependent HMM
キーワード(3)(和/英) 環境クラスタリング / Context clustering
キーワード(4)(和/英) GMM / GMM
キーワード(5)(和/英) EMアルゴリズム / EM algorithm
第 1 著者 氏名(和/英) 浜村 倫行 / Tomoyuki HAMAMURA
第 1 著者 所属(和/英) 株式会社東芝:東京大学大学院情報理工学系研究科
TOSHIBA Corp.:Graduate School of Information Science and Technology, The University of Tokyo
第 2 著者 氏名(和/英) 入江 文平 / Bunpei IRIE
第 2 著者 所属(和/英) 株式会社東芝
TOSHIBA Corp.
第 3 著者 氏名(和/英) 西本 卓也 / Takuya NISHIMOTO
第 3 著者 所属(和/英) 東京大学大学院情報理工学系研究科
Graduate School of Information Science and Technology, The University of Tokyo
第 4 著者 氏名(和/英) 小野 順貴 / Nobutaka ONO
第 4 著者 所属(和/英) 東京大学大学院情報理工学系研究科
Graduate School of Information Science and Technology, The University of Tokyo
第 5 著者 氏名(和/英) 嵯峨山 茂樹 / Shigeki SAGAYAMA
第 5 著者 所属(和/英) 東京大学大学院情報理工学系研究科
Graduate School of Information Science and Technology, The University of Tokyo
発表年月日 2011-03-10
資料番号 PRMU2010-244
巻番号(vol) vol.110
号番号(no) 467
ページ範囲 pp.-
ページ数 6
発行日