講演名 | 2004/12/14 部分空間法による感情音声合成(ポスターセッション)(第6回音声言語シンポジウム) 森 真也, 森山 剛, 小沢 慎治, |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | 音声の合成は,近年のハードウェアの進歩によって,録音編集方式が一般的となってきており,音素環境,感情,話者性といった音声における多様性を実現できる技術が望まれている.従来提案されていた方法では,その多様性の数だけ音声波形を用意し,それらを結合することによって合成していたが,考慮する要因が増えると,それに伴ってより多くの音声波形を必要とし,また,蓄積された波形以外の合成音を得ることはできなかった.本研究では,主成分分析により音声の多様性を平均の音声からの分散で表現する統計モデルを構築し,含まれる感情を連続的に変化させた音声を文節単位で合成し,それを結合することで,自由なテキストから合成音声を得る手法を提案する.学習サンプルの主成分分析結果及び統計モデルによる音声合成実験の結果より,本手法の有効性を確認したので報告する. |
抄録(英) | Recent progress in hardware made tex-to-speech system general in wave form splicing. Technology to implement variations in speech, such as phonemic environment, emotion and speaker, is required. The main difficulty in the existing technology is that they require the same number of wave forms as the number of varieties considered. Thus, as the number of factors increases, the more wave forms the system requires. Furthermore, wave forms not stored in the database cannot be generated in principle. We propose a method to synthesize emotional speech from arbitrary text using principal component analysis(PCA). Developing the statistical model from the varience of the speech parameters by PCA, prosodic parameters of the target speech can be generated efficiently. Synthetic speech of a sentense is generated by concatenating the subphrases synthesized separately where emotional information has been generaged from the model proposed. We confirmed the effectiveness of our method by our examining the result of principal component analysis and the quality evaluation of synthesized speech generaged by our statistical model toreport. |
キーワード(和) | 音声合成 / 感情 / 主成分分析 / PSOLA |
キーワード(英) | speech synthesis / emotion / principal component analysis / PSOLA |
資料番号 | NLC2004-68,SP2004-108 |
発行日 |
研究会情報 | |
研究会 | SP |
---|---|
開催期間 | 2004/12/14(から1日開催) |
開催地(和) | |
開催地(英) | |
テーマ(和) | |
テーマ(英) | |
委員長氏名(和) | |
委員長氏名(英) | |
副委員長氏名(和) | |
副委員長氏名(英) | |
幹事氏名(和) | |
幹事氏名(英) | |
幹事補佐氏名(和) | |
幹事補佐氏名(英) |
講演論文情報詳細 | |
申込み研究会 | Speech (SP) |
---|---|
本文の言語 | JPN |
タイトル(和) | 部分空間法による感情音声合成(ポスターセッション)(第6回音声言語シンポジウム) |
サブタイトル(和) | |
タイトル(英) | A Synthesis of Emotional Speech Using Eigenspeech |
サブタイトル(和) | |
キーワード(1)(和/英) | 音声合成 / speech synthesis |
キーワード(2)(和/英) | 感情 / emotion |
キーワード(3)(和/英) | 主成分分析 / principal component analysis |
キーワード(4)(和/英) | PSOLA / PSOLA |
第 1 著者 氏名(和/英) | 森 真也 / Shinya MORI |
第 1 著者 所属(和/英) | 慶應義塾大学理工学部情報工学科 Keio University |
第 2 著者 氏名(和/英) | 森山 剛 / Tsuyoshi MORIYAMA |
第 2 著者 所属(和/英) | 慶應義塾大学理工学部情報工学科 Keio University |
第 3 著者 氏名(和/英) | 小沢 慎治 / Shinji OZAWA |
第 3 著者 所属(和/英) | 慶應義塾大学理工学部情報工学科 Keio University |
発表年月日 | 2004/12/14 |
資料番号 | NLC2004-68,SP2004-108 |
巻番号(vol) | vol.104 |
号番号(no) | 542 |
ページ範囲 | pp.- |
ページ数 | 6 |
発行日 |