講演名 2004/12/14
部分空間法による感情音声合成(ポスターセッション)(第6回音声言語シンポジウム)
森 真也, 森山 剛, 小沢 慎治,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 音声の合成は,近年のハードウェアの進歩によって,録音編集方式が一般的となってきており,音素環境,感情,話者性といった音声における多様性を実現できる技術が望まれている.従来提案されていた方法では,その多様性の数だけ音声波形を用意し,それらを結合することによって合成していたが,考慮する要因が増えると,それに伴ってより多くの音声波形を必要とし,また,蓄積された波形以外の合成音を得ることはできなかった.本研究では,主成分分析により音声の多様性を平均の音声からの分散で表現する統計モデルを構築し,含まれる感情を連続的に変化させた音声を文節単位で合成し,それを結合することで,自由なテキストから合成音声を得る手法を提案する.学習サンプルの主成分分析結果及び統計モデルによる音声合成実験の結果より,本手法の有効性を確認したので報告する.
抄録(英) Recent progress in hardware made tex-to-speech system general in wave form splicing. Technology to implement variations in speech, such as phonemic environment, emotion and speaker, is required. The main difficulty in the existing technology is that they require the same number of wave forms as the number of varieties considered. Thus, as the number of factors increases, the more wave forms the system requires. Furthermore, wave forms not stored in the database cannot be generated in principle. We propose a method to synthesize emotional speech from arbitrary text using principal component analysis(PCA). Developing the statistical model from the varience of the speech parameters by PCA, prosodic parameters of the target speech can be generated efficiently. Synthetic speech of a sentense is generated by concatenating the subphrases synthesized separately where emotional information has been generaged from the model proposed. We confirmed the effectiveness of our method by our examining the result of principal component analysis and the quality evaluation of synthesized speech generaged by our statistical model toreport.
キーワード(和) 音声合成 / 感情 / 主成分分析 / PSOLA
キーワード(英) speech synthesis / emotion / principal component analysis / PSOLA
資料番号 NLC2004-68,SP2004-108
発行日

研究会情報
研究会 SP
開催期間 2004/12/14(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Speech (SP)
本文の言語 JPN
タイトル(和) 部分空間法による感情音声合成(ポスターセッション)(第6回音声言語シンポジウム)
サブタイトル(和)
タイトル(英) A Synthesis of Emotional Speech Using Eigenspeech
サブタイトル(和)
キーワード(1)(和/英) 音声合成 / speech synthesis
キーワード(2)(和/英) 感情 / emotion
キーワード(3)(和/英) 主成分分析 / principal component analysis
キーワード(4)(和/英) PSOLA / PSOLA
第 1 著者 氏名(和/英) 森 真也 / Shinya MORI
第 1 著者 所属(和/英) 慶應義塾大学理工学部情報工学科
Keio University
第 2 著者 氏名(和/英) 森山 剛 / Tsuyoshi MORIYAMA
第 2 著者 所属(和/英) 慶應義塾大学理工学部情報工学科
Keio University
第 3 著者 氏名(和/英) 小沢 慎治 / Shinji OZAWA
第 3 著者 所属(和/英) 慶應義塾大学理工学部情報工学科
Keio University
発表年月日 2004/12/14
資料番号 NLC2004-68,SP2004-108
巻番号(vol) vol.104
号番号(no) 542
ページ範囲 pp.-
ページ数 6
発行日