講演名 | 2006/12/15 ベイジアンネットとジャンクションツリー分解を用いて知識を組み込んだ統計的音響モデル(Session-5 特徴量・音響モデル,第8回音声言語シンポジウム) , / 中村 哲, |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | 我々は,ベイジアンネットワークとジャンクションツリー分解を用い,HMMを基礎とした統計的音響モデルへ知識を組み込むための新しい手法を提案する.本提案手法により推定された音響モデルは,異なるタイプの英語アクセントで発話された音声コーパスを用い,大語彙連続音声認識実験により評価された.実験結果より,提案手法は知識が組み込まれていない標準的なHMMと比較して,高い単語正解精度が得られることを確認した. |
抄録(英) | We propose a new method of incorporating the additional knowledge sources into HMM based statistical acoustic model by utilizing Bayesian network and junction tree decomposition. The aim of using such graphical model framework are: (1) to define the probabilistic relationship between information sources, (2) to find ways to decompose a global calculation on a joint probability function into a linked set of local computations so that a simplified form of the model can be reliably estimated using the available training data. We apply this framework to the problem of incorporating wide-phonetic knowledge information, which often suffers from data sparsity and memory constraints. Furthermore, we also attempt to integrate another additional knowledge, such accent and gender information. The performance of the proposed model was evaluated using LVCSR task with two different types of accented English speech data. Experimental results show that our method improves the word accuracy with respect to the standard HMM when no additional knowledge sources were used. |
キーワード(和) | 音響モデル / 知識を組み込む / ベイジアンネットワーク / ジャンクションツリー / 長い音素環境 |
キーワード(英) | Acoustic modeling / knowledge incorporation / Bayesian network / junction tree / wide-context dependency |
資料番号 | NLC2006-60,SP2006-116 |
発行日 |
研究会情報 | |
研究会 | SP |
---|---|
開催期間 | 2006/12/15(から1日開催) |
開催地(和) | |
開催地(英) | |
テーマ(和) | |
テーマ(英) | |
委員長氏名(和) | |
委員長氏名(英) | |
副委員長氏名(和) | |
副委員長氏名(英) | |
幹事氏名(和) | |
幹事氏名(英) | |
幹事補佐氏名(和) | |
幹事補佐氏名(英) |
講演論文情報詳細 | |
申込み研究会 | Speech (SP) |
---|---|
本文の言語 | ENG |
タイトル(和) | ベイジアンネットとジャンクションツリー分解を用いて知識を組み込んだ統計的音響モデル(Session-5 特徴量・音響モデル,第8回音声言語シンポジウム) |
サブタイトル(和) | |
タイトル(英) | Utilizing Bayesian Network and Junction Tree Decomposition for Incorporating Additional Knowledge Sources into a Statistical Acoustic Model |
サブタイトル(和) | |
キーワード(1)(和/英) | 音響モデル / Acoustic modeling |
キーワード(2)(和/英) | 知識を組み込む / knowledge incorporation |
キーワード(3)(和/英) | ベイジアンネットワーク / Bayesian network |
キーワード(4)(和/英) | ジャンクションツリー / junction tree |
キーワード(5)(和/英) | 長い音素環境 / wide-context dependency |
第 1 著者 氏名(和/英) | / Sakriani SAKTI |
第 1 著者 所属(和/英) | 独立行政法人情報通信研究機構知識創成コミュニケーション研究センター音声言語グループ:ATR音声言語コミュニケーション研究所 National Institute of Information and Communication Technology:ATR Spoken Language Communication Research Laboratories |
第 2 著者 氏名(和/英) | / 中村 哲 / Konstantin MARKOV |
第 2 著者 所属(和/英) | 独立行政法人情報通信研究機構知識創成コミュニケーション研究センター音声言語グループ:ATR音声言語コミュニケーション研究所 National Institute of Information and Communication Technology:ATR Spoken Language Communication Research Laboratories |
発表年月日 | 2006/12/15 |
資料番号 | NLC2006-60,SP2006-116 |
巻番号(vol) | vol.106 |
号番号(no) | 444 |
ページ範囲 | pp.- |
ページ数 | 6 |
発行日 |