講演名 2006/8/23
固有声に基づく声質変換法(合成,生成,韻律,一般)
戸田 智基, 大谷 大和, 鹿野 清宏,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 声質変換(Voice Conversion: VC)の新しい枠組みとして,固有声に基づく声質変換法(Eigenvoice Conversion: EVC)を提案する.本報告では,ある特定の話者から任意の話者への変換(一対多VC),および任意の話者からある特定の話者への変換(多対一VC)に対してEVCを適用する.EVCでは,予め収録された多数話者によるパラレルデータを用いて,固有声混合正規分布モデル(Eigenvoice Gaussian Mixture Model: EV-GMM)を事前に学習する.EV-GMMは出力(多対一VCでは入力)音声の声質を制御する少量のフリーパラメータを持つ.所望の話者に対する変換モデルは,その話者の音声データに対してフリーパラメータを最尤推定する事で構築される.この際に,発話内容に関する情報は一切使用しないため,完全な教師なしモデル適応が実現される.さらに,一対多VCにおいては,フリーパラメータを声質制御イコライザーとして用いることで,出力変換音声の声質を手動で制御する事も可能である.一対多VCおよび多対一VCにおいて実験的評価を行った結果,EVCでは所望の話者の音声データが2文程度あれば,高い変換精度が得られる事が分かった.
抄録(英) This paper describes a novel framework of voice conversion (VC). We call it eigenvoice conversion (EVC). EVC is applied to both the conversion from a source speaker's voice to arbitrary target speakers' ones, i.e., one-to-many VC and vice versa, i.e., many-to-one VC. Using multiple parallel data sets consisting of utterance-pairs of a certain speaker and multiple pre-stored speakers, an eigenvoice Gaussian mixture model (EV-GMM) is trained in advance. That model has a small number of free parameters for controlling speaker individuality. Those parameters are estimated using only speech data of the desired speaker without any linguistic restrictions. Moreover, the EV-GMM for one-to-many VC enables us to flexibly control the speaker individuality of the converted speech by manually setting the free parameters. We objectively evaluate the performance of EVC. Experimental results demonstrate that EVC works very well even if we use only a few utterances of the desired speaker.
キーワード(和) 声質変換 / 混合正規分布モデル / 固有声 / 一対多変換 / 多対一変換
キーワード(英) voice conversion / GMM / eigenvoice / one-to-many conversion / many-to-one conversion
資料番号 SP2006-39
発行日

研究会情報
研究会 SP
開催期間 2006/8/23(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Speech (SP)
本文の言語 JPN
タイトル(和) 固有声に基づく声質変換法(合成,生成,韻律,一般)
サブタイトル(和)
タイトル(英) A Voice Conversion Algorithm Based on Eigenvoice
サブタイトル(和)
キーワード(1)(和/英) 声質変換 / voice conversion
キーワード(2)(和/英) 混合正規分布モデル / GMM
キーワード(3)(和/英) 固有声 / eigenvoice
キーワード(4)(和/英) 一対多変換 / one-to-many conversion
キーワード(5)(和/英) 多対一変換 / many-to-one conversion
第 1 著者 氏名(和/英) 戸田 智基 / Tomoki TODA
第 1 著者 所属(和/英) 奈良先端科学技術大学院大学 情報科学研究科
Graduate School of Information Science, Nara Institute of Science and Technology
第 2 著者 氏名(和/英) 大谷 大和 / Yamato OHTANI
第 2 著者 所属(和/英) 奈良先端科学技術大学院大学 情報科学研究科
Graduate School of Information Science, Nara Institute of Science and Technology
第 3 著者 氏名(和/英) 鹿野 清宏 / Kiyohiro SHIKANO
第 3 著者 所属(和/英) 奈良先端科学技術大学院大学 情報科学研究科
Graduate School of Information Science, Nara Institute of Science and Technology
発表年月日 2006/8/23
資料番号 SP2006-39
巻番号(vol) vol.106
号番号(no) 221
ページ範囲 pp.-
ページ数 6
発行日