講演抄録/キーワード |
講演名 |
2009-01-30 15:30
スペクトル系列の最尤推定に基づく短遅延声質変換法 ○村松敬司・大谷大和・戸田智基・猿渡 洋・鹿野清宏(奈良先端大) SP2008-141 |
抄録 |
(和) |
本稿では,スペクトル変換手法,及びスペクトル変換後の後処理について検討し,高品質かつリアルタイムなVC の実現を目指す.混合正規分布モデルに基づく声質変換手法において,代表的な2つのスペクトル変換手法:1)フレーム毎に変換を行う最小平均自乗誤差変換,及び2)一発話の系列を同時に変換する最尤スペクトル系列変換が提案されている.前者はリアルタイム変換が可能であるが,不自然なスペクトル遷移が生じる可能性がある.一方後者はスペクトルの動的特徴量を考慮する事により変換性能が高いが,リアルタイム変換が出来ない.動的特徴量を考慮したリアルタイム変換を実現するため,最尤スペクトル系列変換に対して時間再帰アルゴリズムを適用する.また,統計量に基づくVC では,統計処理によってスペクトルの過剰な平滑化が生じてしまう.これに対してスペクトルの系列内変動(GV)を考慮した最尤特徴量変換法が提案されているが,短遅延変換に適用するのは困難である.本稿では,GV を考慮したポストフィルタを短遅延処理に適用する手法を提案する.実験的評価により,提案手法の有効性を示す. |
(英) |
In this paper, we aim to achieve high-quality and real-time VC considering spectral conversion method and post-processing of spectral conversion. As typical voice conversion methods, two spectral conversion processes have been proposed: 1) the frame-based conversion that converts spectral parameters frame by frame and 2) the trajectory-based conversion that converts all spectral parameters over an utterance simultaneously. The former process is capable of real-time conversion but it sometimes causes inappropriate spectral movements. On the other hand, the latter process provides the converted spectral parameters exhibiting proper dynamic characteristics but it isn’t capable of real-time conversion. To realize the real-time conversion process considering spectral dynamic characteristics, we propose a time-recursive conversion algorithm based on maximum likelihood estimation of spectral parameter trajectory. And, the converted trajectory is often excessively smoothed due to the statistical processing. Although the maximum likelihood feature conversion method which considers global variance (GV) is proposed, it is complicated to apply to the low-delay conversion. In this paper, we propose a technique using post-filter which considers GV. Experimental results show that the proposed methods are effective. |
キーワード |
(和) |
音声合成 / 声質変換 / 混合正規分布モデル / 最尤スペクトル系列変換 / 短遅延処理 / / / |
(英) |
speech synthesis / voice conversion / Gaussian mixture model / maximum likelihood estimation / low-delay processing / / / |
文献情報 |
信学技報, vol. 108, no. 422, SP2008-141, pp. 91-96, 2009年1月. |
資料番号 |
SP2008-141 |
発行日 |
2009-01-22 (SP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
SP2008-141 |