講演抄録/キーワード |
講演名 |
2012-11-08 10:30
テンソル表現に基づく任意話者声質変換に対する話者正規化学習の効果 ○齋藤大輔・峯松信明・広瀬啓吉(東大) SP2012-72 |
抄録 |
(和) |
本報告ではテンソル表現に基づく任意話者声質変換における話者正規化学習の効果について検証する.声質変換の研究において,任意話者の音声を入力または出力として,変換を実現することはアプリケーション応用の観点からも重要な目的の一つである.任意話者声質変換を実現する技術として,固有声混合正規分布モデル (EV-GMM) に基づく固有声変換法 (EVC) が提案されている.EVCでは多数の話者を用いて構築された話者空間表現によって,ごく少量の発声のみを用いて効率的な変換モデルの構築が可能となる.しかし,話者モデルを構築する発声を増やした場合でも必ずしも変換性能の向上がみられるわけではない.これは,GMMスーパーベクトルを用いた特徴量表現に内在する問題に起因すると考えられる.この問題に対して,先行研究において我々は,テンソル表現に基づく話者空間表現を用いた任意話者声質変換を提案し,より柔軟な話者性制御を実現した.本報告では,声質変換のさらなる性能向上のため,話者正規化学習とテンソルに基づく話者空間表現を統合する手法を提案する.提案法によってより柔軟で精緻な変換モデルの構築が可能となる.一対多声質変換の実験によって提案法における話者正規化学習の有効性を示す. |
(英) |
In this paper, speaker adaptive training techniques are introduced to tensor-based arbitrary speaker conversion. In voice conversion studies, realization of conversion from/to an arbitrary speaker's voice is one of the important objectives. For this purpose, eigenvoice conversion (EVC), which is based on an eigenvoice Gaussian mixture model (EV-GMM), was proposed. Although the EVC can effectively construct the conversion model for arbitrary target speakers using only a few utterances, increase of the utterances used to construct the conversion model does not always improve the conversion performance. This is because the EV-GMM method has an inherent problem in representation of GMM supervectors. We previously proposed tensor-based speaker space as a solution for this problem, and realized more flexible control of speaker characteristics. In this paper, to aim larger improvement of the performance of VC, speaker adaptive training and tensor-based speaker representation are integrated. The proposed method can construct the flexible and precise conversion model, and experimental results of one-to-many voice conversion demonstrate the effectiveness of the proposed approach. |
キーワード |
(和) |
声質変換 / 混合正規分布モデル / Tucker分解 / 話者正規化学習 / / / / |
(英) |
voice conversion / Gaussian mixture model / Tucker decomposition / speaker adaptive training / / / / |
文献情報 |
信学技報, vol. 112, no. 281, SP2012-72, pp. 1-6, 2012年11月. |
資料番号 |
SP2012-72 |
発行日 |
2012-11-01 (SP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
SP2012-72 |
|