講演名 2004/12/13
変分ベイズ法に基づく音響モデルのトポロジー学習および混合分布要素の分割(ポスターセッション)
實廣 貴敏, 中村 哲,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本論文では,変分ベイズ法に基づく手法で,非均一な長さの環境依存HMM構造を自動で生成する方法および混合分布要素を分割する方法を提案する.ゆう度最大化規準(ML)がHMM構造作成に一般に用いられるが,過学習問題が存在する.これを避けるため,近年,変分ベイズ法が音声認識の音響モデルに適用されてきている.我々は変分ベイズ法を逐次状態分割法(Successive State Splitting, SSS)法に適用する.この手法は環境方向だけでなく,時間方向のバリエーションを生成できる.実験結果から,提案法は従来法より効率的なモデルを自動で作成できることが分かった.さらに,時間方向の構造も考慮した変分ベイズ法に基づく混合分布数の増加手法についても検討した.変分ベイズ的手法により,従来法と比較して,より少ない混合数でほぼ同様な性能が得られることが分かった.
抄録(英) We propose a automatic generation method of non-uniform and context-dependent HMM topology and a splitting method of mixture components based on the Variational Bayesian (VB) approach. Although the Maximum' Likelihood (ML) criterion is generally used to create HMM topologies, it has an over-fitting problem. Recently, to avoid this problem, the VB approach has been applied to create acoustic models for speech recognition. We introduce the VB approach to the Successive State Splitting (SSS) algorithm, which can create both contextual and temporal variations for HMMs. Experimental results show that the proposed method can automatically create more efficient models than those by the original method. We employ the VB approach to increase the number of mixture components. The VB approach obtained almost the same performance with the smaller number of mixture components in comparison with that obtained by using ML-based methods.
キーワード(和) 音声認識 / 音響モデル / トポロジー学習 / SSS法 / 変分ベイズ法
キーワード(英) speech recognition / acoustic model / topology training / SSS algorithm / Variational Bayesian approach
資料番号 NLC2004-51,SP2004-91
発行日

研究会情報
研究会 SP
開催期間 2004/12/13(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Speech (SP)
本文の言語 ENG
タイトル(和) 変分ベイズ法に基づく音響モデルのトポロジー学習および混合分布要素の分割(ポスターセッション)
サブタイトル(和)
タイトル(英) Variational Bayesian Based Topology Training and Mixture Component Splitting for Acoustic Modeling
サブタイトル(和)
キーワード(1)(和/英) 音声認識 / speech recognition
キーワード(2)(和/英) 音響モデル / acoustic model
キーワード(3)(和/英) トポロジー学習 / topology training
キーワード(4)(和/英) SSS法 / SSS algorithm
キーワード(5)(和/英) 変分ベイズ法 / Variational Bayesian approach
第 1 著者 氏名(和/英) 實廣 貴敏 / Takatoshi JITSUHIRO
第 1 著者 所属(和/英) ATR音声言語コミュニケーション研究所
ATR Spoken Language Translation Research Laboratories
第 2 著者 氏名(和/英) 中村 哲 / Satoshi NAKAMURA
第 2 著者 所属(和/英) ATR音声言語コミュニケーション研究所
ATR Spoken Language Translation Research Laboratories
発表年月日 2004/12/13
資料番号 NLC2004-51,SP2004-91
巻番号(vol) vol.104
号番号(no) 541
ページ範囲 pp.-
ページ数 6
発行日