講演名 | 2005/1/20 HMM素片選択を用いた話者変換方式の検討 大久保 雅史, 望月 亮, 小林 哲則, |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | 本論文では, HMMによる素片選択手法を用いて小規模な目的話者データベースにより高音質な話者変換音声を得るための手法を提案する.高音質で, 発話全体で安定したスペクトルを持つ音声を合成する手法として, 著者らによって波形重畳型音声合成におけるHMMを用いた素片選択手法が提案されている.しかしながら, このような高音質な音声合成が可能であるコーパスベースの音声合成手法において, 多様な話者性の音声の合成には膨大なデータベースが必要であり, 大変な手間がかかる.一方, MLLR等をHMM音声合成に適用した小規模データでの話者変換技術が提案されている.本手法では, MLLRを用いた話者変換技術をHMMによる素片選択手法に応用することで, 高音質な波形重畳型音声合成の枠組みで, 小規模な目的話者データベースによる変換話者音声の合成を可能とした.評価実験により, 音質, 話者性の面で本手法の有効性を確認した. |
抄録(英) | This paper proposes a speaker conversion algorithm based on HMM-based unit selection method and MLLR adaptation method. In this method, voice characteristics can be adapted by a small corpus. HMM-based unit selection method for concatenative speech synthesis has been proposed by authors to synthesize high intelligibility and stability of voice quality. However, to synthesize various voice characteristics by the corpus-based synthesizer, it requires large corpus with huge amount of speeches and man-hours. On the contrary, speaker adaptation technique based on a HMM-based text-to-speech system and MLLR adaptation algorithm proposed recently can adapt voice characteristics using small target speaker's speeches. We applied MLLR adaptation technique to the concatenative synthesizer using HMM-based unit selection method. As a result, high sound quality and conversion-accuracy for speaker individuality was achieved. A subjective test showed the effectiveness of the proposed method. |
キーワード(和) | 音声合成 / 素片選択 / 話者変換 |
キーワード(英) | speech synthesis / PSOLA / HMM / unit selection / speaker conversion |
資料番号 | SP2004-139 |
発行日 |
研究会情報 | |
研究会 | SP |
---|---|
開催期間 | 2005/1/20(から1日開催) |
開催地(和) | |
開催地(英) | |
テーマ(和) | |
テーマ(英) | |
委員長氏名(和) | |
委員長氏名(英) | |
副委員長氏名(和) | |
副委員長氏名(英) | |
幹事氏名(和) | |
幹事氏名(英) | |
幹事補佐氏名(和) | |
幹事補佐氏名(英) |
講演論文情報詳細 | |
申込み研究会 | Speech (SP) |
---|---|
本文の言語 | JPN |
タイトル(和) | HMM素片選択を用いた話者変換方式の検討 |
サブタイトル(和) | |
タイトル(英) | Speaker Conversion Using HMM Unit Selection |
サブタイトル(和) | |
キーワード(1)(和/英) | 音声合成 / speech synthesis |
キーワード(2)(和/英) | 素片選択 / PSOLA |
キーワード(3)(和/英) | 話者変換 / HMM |
第 1 著者 氏名(和/英) | 大久保 雅史 / Tadashi OKUBO |
第 1 著者 所属(和/英) | 早稲田大学理工学部 Sch. of Sci. and Eng., Waseda Univ. |
第 2 著者 氏名(和/英) | 望月 亮 / Ryo MOCHIZUKI |
第 2 著者 所属(和/英) | 早稲田大学理工学部:松下電器産業株式会社 Sch. of Sci. and Eng., Waseda Univ.:Matsushita Electric Ind. Co., Ltd. |
第 3 著者 氏名(和/英) | 小林 哲則 / Tetsunori KOBAYASHI |
第 3 著者 所属(和/英) | 早稲田大学理工学部 Sch. of Sci. and Eng., Waseda Univ. |
発表年月日 | 2005/1/20 |
資料番号 | SP2004-139 |
巻番号(vol) | vol.104 |
号番号(no) | 630 |
ページ範囲 | pp.- |
ページ数 | 6 |
発行日 |