講演抄録/キーワード |
講演名 |
2009-12-22 15:50
多重ベータ混合モデルを用いた調波時間構造のモデル化による音声合成の検討 ○中鹿 亘(神戸大)・立花隆輝・西村雅史(日本IBM)・滝口哲也・有木康雄(神戸大) NLC2009-26 SP2009-90 |
抄録 |
(和) |
これまでに数多くの音声合成技術が提案されているが,我々は,音素信号の調波時間スペクトル形状をモ
デル関数で近似し,音声合成を行うという新たなフレームワークについて検討する.音素スペクトルの調波成分のみ
を取り出し,各ハーモニクスのエンベロープをスペクトルモデル関数でモデリングする.モデル関数のパラメータか
ら音素信号を復元し,音声を合成する手法について同時に提案する.近似するモデル関数として,ベータ分布をベー
スにした多重ベータ混合モデルを考案し,評価実験により我々の提案するモデルの有効性について述べる. |
(英) |
There are currently some researches related to speech synthesis, but here we present a new framework
for speech synthesis, in which we approximate an envelope shape of each harmonic in a phoneme signal by a spectro-
modeling function. In this approach only harmonic-parts are extracted from the phoneme spectrum, and the
time-varying spectrum corresponding to the harmonics or sinusoidal components is modeled by the modeling function.
In addition, we propose a method to synthesize a speech signal using Multi Beta Mixture Model (MBMM)
based on Beta distribution. We discuss the effectiveness of our proposed model through the experimental results. |
キーワード |
(和) |
音声合成 / TTS / 多重ベータ混合モデル / 調波構造 / スペクトルモデル関数 / / / |
(英) |
speech synthesis / text-to-speech / multi beta mixture model / harmonics structure / spectro-modeling function / / / |
文献情報 |
信学技報, vol. 109, no. 356, SP2009-90, pp. 165-170, 2009年12月. |
資料番号 |
SP2009-90 |
発行日 |
2009-12-14 (NLC, SP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
NLC2009-26 SP2009-90 |