講演名 2004/12/13
HMM/BN音響モデルの設計と実装(国際ワークショップ"Beyond HMM")
マルコフ コンスタンティン, 中村 哲,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 近年、従来のHMMを超えた音声モデリングの進むべき方向に関する研究が盛んに行われている。その一つの有効な手法として、ベイズネットワーク(BN)による音声モデルがあり、最近、ダイナミックBNを基とした認識システムとBNによる音響モデルが提案された。我々ATRは、混合ガウス分布にかえ、BNによってHMMの状態確率分布をモデリングするハイブリットHMM/BNモデルを提案した。本稿では、ハイブリットHMM/BN音響モデルのフレームワークに関し、特に設計と実装の問題に焦点をあてて、記述する。HMM/BN学習は、ピタビ学習に基づく方法によって,BN学習とHMM状態遷移確率の更新という2つのステップを交互に行う。認識において、BN推論はある特定の場合、混合ガウスの計算と同等となり、既存のデコーダに修正せずに、HMM/BNモデルの使用可能である。本稿で、音声認識システムへのHMM/BNモデルの適用例を2つ示す。様々な条件で、複数種類のタスクによる実験を行った結果、HMM/BNモデルが従来の混合ガウスHMMに比べ、常に良い性能が得られた。
抄録(英) In recent years, the number of studies investigating new directions in speech modeling that goes beyond the conventional HMM has increased considerably. One promising approach is to use Bayesian Networks (BN) as speech model. Full recognition systems based on Dynamic BN as well as acoustic models using BN have been proposed lately. Our group at ATR has been developing the hybrid HMM/BN model which is a HMM where the state probability distribution is modeled by a BN, instead of commonly used mixture of Gaussian functions. In this paper, we describe the hybrid HMM/BN acoustic modeling framework especially emphasizing on some model design and implementation issues. The HMM/BN training is based on the Viterbi training paradigm and consists of two alternating steps - BN training and HMM transitions update. For recognition, in some cases, BN inference is computationally equivalent to mixture of Gaussians which allows HMM/BN model to be used in existing decoders without any modification. We present two examples of HMM/BN model application in speech recognition systems. Evaluations.under various conditions and for different tasks showed that the HMM/BN model gives consistently better performance than the standard mixture of Gaussians HMM.
キーワード(和) HMM/BN / 音響モデル / ベイズネットワーク
キーワード(英) HMM/BN / acoustic model / Bayesian network
資料番号 NLC2004-43,SP2004-83
発行日

研究会情報
研究会 SP
開催期間 2004/12/13(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Speech (SP)
本文の言語 ENG
タイトル(和) HMM/BN音響モデルの設計と実装(国際ワークショップ"Beyond HMM")
サブタイトル(和)
タイトル(英) Design and Implementation of HMM/BN Acoustic Models
サブタイトル(和)
キーワード(1)(和/英) HMM/BN / HMM/BN
キーワード(2)(和/英) 音響モデル / acoustic model
キーワード(3)(和/英) ベイズネットワーク / Bayesian network
第 1 著者 氏名(和/英) マルコフ コンスタンティン / Konstantin MARKOV
第 1 著者 所属(和/英) ATR音声言語コミュニケーション研究所音声音響処理研究室
Department of Acoustics and Speech Research, Spoken Language Translation Research Labs. ATR
第 2 著者 氏名(和/英) 中村 哲 / Satoshi NAKAMURA
第 2 著者 所属(和/英) ATR音声言語コミュニケーション研究所音声音響処理研究室
Department of Acoustics and Speech Research, Spoken Language Translation Research Labs. ATR
発表年月日 2004/12/13
資料番号 NLC2004-43,SP2004-83
巻番号(vol) vol.104
号番号(no) 541
ページ範囲 pp.-
ページ数 6
発行日