講演抄録/キーワード |
講演名 |
2014-11-13 13:45
HMMに基づく対話音声合成におけるパラ言語情報制御手法の比較 ○森 大毅・高橋俊介・永田智洋(宇都宮大) SP2014-90 |
抄録 |
(和) |
パラ言語情報の制御が可能な対話音声合成の実現を目指し,
快-不快や覚醒-睡眠などの抽象次元に基づくパラ言語情報ラベルを有する
対話コーパスに基づくHMM音声合成を提案している.
パラ言語情報制御を実現する方法として,これまでコンテキスト情報に
基づく方法とパラ言語情報正規化学習・変換に基づく方法を提案してきた.
本報告では,合成音声の自然性およびパラ言語情報の可制御性の観点から
これらの手法の有効性を比較検討する.
16名の被験者による主観評価実験の結果,変換に基づく方法では,コンテキス
ト情報に基づく方法と比較して,多くの場合で自然性に影響を与えることなく
パラ言語情報の可制御性を向上できることがわかった. |
(英) |
Toward the realization of dialogue speech synthesis with capability to
control paralinguistic information,
we have proposed the HMM-based speech synthesis based on dialogue
corpus that accompanies with paralinguistic information labels of
abstract dimensions such as pleasantness or arousal.
As methods for controlling paralinguistic information,
context information-based method and adaptive
training/conversion-based method have been proposed so far.
In this report, effectiveness of these methods are compared from the
viewpoints of naturalness and controllability of paralinguistic
information.
The results of subjective evaluation tests by 16 subjects revealed
that the conversion-based method can better control paralinguistic
information than the context information-based method, without
sacrificing naturalness. |
キーワード |
(和) |
感情 / ノンバーバル / 話し言葉 / 対話コーパス / HMM音声合成 / コンテキスト / 適応 / 正規化学習 |
(英) |
emotion / nonverbal / spoken language / dialogue corpus / HMM-based speech synthesis / context / adaptation / adaptive training |
文献情報 |
信学技報, vol. 114, no. 303, SP2014-90, pp. 1-6, 2014年11月. |
資料番号 |
SP2014-90 |
発行日 |
2014-11-06 (SP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
SP2014-90 |