講演名 1998/9/11
HMMに基づく音声合成のための状態継続長モデルの構築
吉村 貴克, 徳田 恵一, 益子 貴史, 小林 隆夫, 北村 正,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本論文では, HMMに基づく音声合成のための状態継続長モデルの構築法について述べる.音素HMMの各状態の状態継続長は1次元のガウス分布でモデル化し, 一つの音素HMMの全状態の状態継続長分布をまとめて一つの多次元のガウス分布として状態継続長モデルとする.状態継続長モデルは, 状態継続長に影響を与える要因を考慮して, 決定木によるコンテキストクラスタリングによりクラスタリングする.音声合成時には, 状態継続長モデルから尤度最大化基準により状態継続長を決定し, それに従いHMMからスペクトル列を生成する.予備実験において先行・当該・後続音素のみを考慮した状態継続長モデルでも, 自然のタイミングに近い合成音声を得ることができることを既に確認している.本論文では, さらにアクセント型, 構文情報のような状態継続長に影響を与える他の変動要因も考慮した実験を行った.
抄録(英) This paper proposes a new approach to state duration modeling for HMM-based speech synthesis. A set of state durations of each phoneme HMM is modeled by a multi-dimensional Gaussian distribution. Duration models are clustered using a decision tree based context clustering technique. In the synthesis stage, state durations are determined by maximizing the state duration probability. In this paper, we take account of contextual factors such as mora count, stress and part-of-speech in addition to current, preceding and succeeding phonemes. Experimental results show that the synthetic speech has a good quality with natural timing.
キーワード(和) HMM / テキスト音声合成 / 状態継続長モデル / メルケプストラム / コンテキストクラスタリング
キーワード(英) HMM / text-to-speech synthesis / state duration model / mel-cepstrum / context clustering
資料番号 DSP98-85,SP98-64
発行日

研究会情報
研究会 SP
開催期間 1998/9/11(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Speech (SP)
本文の言語 JPN
タイトル(和) HMMに基づく音声合成のための状態継続長モデルの構築
サブタイトル(和)
タイトル(英) State Duration Modeling for HMM-Based Speech Synthesis
サブタイトル(和)
キーワード(1)(和/英) HMM / HMM
キーワード(2)(和/英) テキスト音声合成 / text-to-speech synthesis
キーワード(3)(和/英) 状態継続長モデル / state duration model
キーワード(4)(和/英) メルケプストラム / mel-cepstrum
キーワード(5)(和/英) コンテキストクラスタリング / context clustering
第 1 著者 氏名(和/英) 吉村 貴克 / Takayoshi Yoshimura
第 1 著者 所属(和/英) 名古屋工業大学知能情報システム学科
Department of Computer Science, Nagoya Inst.of Tech.
第 2 著者 氏名(和/英) 徳田 恵一 / Keiichi Tokuda
第 2 著者 所属(和/英) 名古屋工業大学知能情報システム学科
Department of Computer Science, Nagoya Inst.of Tech.
第 3 著者 氏名(和/英) 益子 貴史 / Takashi Masuko
第 3 著者 所属(和/英) 東京工業大学精密工学研究所
Precision and Intelligence Lab., Tokyo Inst.of Tech.
第 4 著者 氏名(和/英) 小林 隆夫 / Takao Kobayashi
第 4 著者 所属(和/英) 東京工業大学大学院総合理工学研究科
Interdisciplinary Graduate School of Science and Engineering, Tokyo Inst.of Tech.
第 5 著者 氏名(和/英) 北村 正 / Tadashi Kitamura
第 5 著者 所属(和/英) 名古屋工業大学知能情報システム学科
Department of Computer Science, Nagoya Inst.of Tech.
発表年月日 1998/9/11
資料番号 DSP98-85,SP98-64
巻番号(vol) vol.98
号番号(no) 264
ページ範囲 pp.-
ページ数 6
発行日