講演名 2006/12/15
ベイジアンネットとジャンクションツリー分解を用いて知識を組み込んだ統計的音響モデル(Session-5 特徴量・音響モデル,第8回音声言語シンポジウム)
, / 中村 哲,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 我々は,ベイジアンネットワークとジャンクションツリー分解を用い,HMMを基礎とした統計的音響モデルへ知識を組み込むための新しい手法を提案する.本提案手法により推定された音響モデルは,異なるタイプの英語アクセントで発話された音声コーパスを用い,大語彙連続音声認識実験により評価された.実験結果より,提案手法は知識が組み込まれていない標準的なHMMと比較して,高い単語正解精度が得られることを確認した.
抄録(英) We propose a new method of incorporating the additional knowledge sources into HMM based statistical acoustic model by utilizing Bayesian network and junction tree decomposition. The aim of using such graphical model framework are: (1) to define the probabilistic relationship between information sources, (2) to find ways to decompose a global calculation on a joint probability function into a linked set of local computations so that a simplified form of the model can be reliably estimated using the available training data. We apply this framework to the problem of incorporating wide-phonetic knowledge information, which often suffers from data sparsity and memory constraints. Furthermore, we also attempt to integrate another additional knowledge, such accent and gender information. The performance of the proposed model was evaluated using LVCSR task with two different types of accented English speech data. Experimental results show that our method improves the word accuracy with respect to the standard HMM when no additional knowledge sources were used.
キーワード(和) 音響モデル / 知識を組み込む / ベイジアンネットワーク / ジャンクションツリー / 長い音素環境
キーワード(英) Acoustic modeling / knowledge incorporation / Bayesian network / junction tree / wide-context dependency
資料番号 NLC2006-60,SP2006-116
発行日

研究会情報
研究会 SP
開催期間 2006/12/15(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Speech (SP)
本文の言語 ENG
タイトル(和) ベイジアンネットとジャンクションツリー分解を用いて知識を組み込んだ統計的音響モデル(Session-5 特徴量・音響モデル,第8回音声言語シンポジウム)
サブタイトル(和)
タイトル(英) Utilizing Bayesian Network and Junction Tree Decomposition for Incorporating Additional Knowledge Sources into a Statistical Acoustic Model
サブタイトル(和)
キーワード(1)(和/英) 音響モデル / Acoustic modeling
キーワード(2)(和/英) 知識を組み込む / knowledge incorporation
キーワード(3)(和/英) ベイジアンネットワーク / Bayesian network
キーワード(4)(和/英) ジャンクションツリー / junction tree
キーワード(5)(和/英) 長い音素環境 / wide-context dependency
第 1 著者 氏名(和/英) / Sakriani SAKTI
第 1 著者 所属(和/英) 独立行政法人情報通信研究機構知識創成コミュニケーション研究センター音声言語グループ:ATR音声言語コミュニケーション研究所
National Institute of Information and Communication Technology:ATR Spoken Language Communication Research Laboratories
第 2 著者 氏名(和/英) / 中村 哲 / Konstantin MARKOV
第 2 著者 所属(和/英) 独立行政法人情報通信研究機構知識創成コミュニケーション研究センター音声言語グループ:ATR音声言語コミュニケーション研究所
National Institute of Information and Communication Technology:ATR Spoken Language Communication Research Laboratories
発表年月日 2006/12/15
資料番号 NLC2006-60,SP2006-116
巻番号(vol) vol.106
号番号(no) 444
ページ範囲 pp.-
ページ数 6
発行日