講演抄録/キーワード |
講演名 |
2014-11-13 14:35
HMMに基づく感情音声合成のための共有感情付与モデル ○大谷大和・那須 悠・森中 亮・田村正統・森田眞弘・赤嶺政巳(東芝) SP2014-92 |
抄録 |
(和) |
我々はこれまでにHMM音声合成において加算構造に基づく感情付与法を提案している.
この技術は,ある目標話者の平静音声モデルに対して,音声に含まれる感情表現の要素を表現した感情付与モデルを適用することで目標話者の声による感情合成音声を生成することができる.
従来の感情付与法では,ある学習話者からの感情音声を用いて感情付与モデルを構築していたため,感情付与モデルと目標話者の平静音声モデル間でのパラメータの不整合により,感情つき合成音声の音質が低下する問題があった.
この問題点を解決するため,複数の学習話者の感情音声を用いて,学習話者共通の感情成分を持つ共有感情付与モデルを学習することを提案する.
共有感情付与モデルを任意の平静音声モデルへ適用することで,音質の劣化を抑え,品質のよい感情合成音声の生成を目指す. |
(英) |
We have proposed an emotion addition method based on additive structure in HMM-based speech synthesis.
This technique generates emotional synthetic speech of a target speaker by applying an emotion additive model which represents emotional factors to a target neutral voice model.
In the conventional technique, the emotion additive model is trained with the emotion speech data of a training speaker and thus synthetic speech quality is degraded by parameter mismatches between the emotion additive model and the target neutral voice model.
In order to address this problem, we train a shared emotion additive model with the emotion speech data sets consisting of the multiple training speakers.
The shared emotion additive model includes common emotional factors of training speakers and therefore this model can prevent from the quality degradation of emotional synthetic speech. |
キーワード |
(和) |
HMM音声合成 / 隠れマルコフモデル / 感情音声 / 加算構造モデル / クラスタ適応学習 / / / |
(英) |
HMM-based speech synthesis / hidden Markov model / emotional speech / additive structure model / cluster adaptive training / / / |
文献情報 |
信学技報, vol. 114, no. 303, SP2014-92, pp. 13-18, 2014年11月. |
資料番号 |
SP2014-92 |
発行日 |
2014-11-06 (SP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
SP2014-92 |