講演名 2005/8/19
HMM音声合成のための系列内変動を考慮した音声パラメータ生成アルゴリズム(合成, 生成, 韻律, 一般)
戸田 智基, 徳田 恵一,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) HMMに基づく音声合成方式では, あらかじめ音声パラメータ系列をモデル化するHMMを学習しておき, 合成時には入力テキストに対応するHMMから尤度最大化基準により音声パラメータを生成する.静的・動的特徴量間の明示的な制約条件を導入することで, 適切な遷移を満たすパラメータ系列の生成が可能となり, 不連続感の少ない滑らかで安定した合成音声が得られる.一方で, 音声信号がもつ詳細な特徴は統計処理により失われるため, 生成されるパラメータは過剰に平滑化されたものとなり, 合成音声の肉声感は大きく損なわれる.本稿では, 音響モデリングで失われる特徴量の一つとして, パラメータ系列全体における変動量に着目し, 従来考慮されている静的・動的特徴量に対する尤度のみでなく, 系列内変動に対する尤度も考慮した音声パラメータ生成アルゴリズムを提案する.新たに導入される尤度は, 従来法において顕著にみられる生成パラメータの系列内変動の減少を抑える働きをする.実験的評価結果から, 提案法により合成音声の自然性は大幅に改善されることを示す.
抄録(英) This paper describes a novel parameter generation algorithm for the HMM-based speech synthesis. The conventional algorithm generates a trajectory of static features that maximizes an output probability of a parameter sequence consisting of the static and dynamic features from HMMs under an explicit constraint between the two features. The generated trajectory is often excessively smoothed due to the statistical processing. Using the over-smoothed trajectory causes muffled sounds. In order to alleviate the over-smoothing effect, we propose a generation algorithm considering not only the output probability used for the conventional method but also that of a global variance (GV) of the generated trajectory. The latter probability works as a penalty for a reduction of the variance of the generated trajectory. A result of a perceptual evaluation demonstrates that the proposed method causes large improvements of the naturalness of synthetic speech.
キーワード(和) HMM音声合成 / パラメータ生成 / 過剰な平滑化 / 系列内変動 / 自然性
キーワード(英) HMM-based speech synthesis / parameter generation / over-smoothing / global variance / naturalness
資料番号 SP2005-52
発行日

研究会情報
研究会 SP
開催期間 2005/8/19(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Speech (SP)
本文の言語 JPN
タイトル(和) HMM音声合成のための系列内変動を考慮した音声パラメータ生成アルゴリズム(合成, 生成, 韻律, 一般)
サブタイトル(和)
タイトル(英) Speech Parameter Generation Algorithm Considering Global Variance for HMM-Based Speech Synthesis
サブタイトル(和)
キーワード(1)(和/英) HMM音声合成 / HMM-based speech synthesis
キーワード(2)(和/英) パラメータ生成 / parameter generation
キーワード(3)(和/英) 過剰な平滑化 / over-smoothing
キーワード(4)(和/英) 系列内変動 / global variance
キーワード(5)(和/英) 自然性 / naturalness
第 1 著者 氏名(和/英) 戸田 智基 / Tomoki TODA
第 1 著者 所属(和/英) 奈良先端科学技術大学院大学情報科学研究科
Graduate School of Information Science, Nara Institute of Science and Technology
第 2 著者 氏名(和/英) 徳田 恵一 / Keiichi TOKUDA
第 2 著者 所属(和/英) 名古屋工業大学大学院工学研究科
Graduate School of Engineering, Nagoya Institute of Technology
発表年月日 2005/8/19
資料番号 SP2005-52
巻番号(vol) vol.105
号番号(no) 253
ページ範囲 pp.-
ページ数 6
発行日