事前収録話者データを用いた多対一声質変換法(合成,生成,韻律,一般)

谷 大輔; 大谷 大和; 戸田 智基; 猿渡 洋; 鹿野 清宏

講演名	2007/10/18 事前収録話者データを用いた多対一声質変換法(合成,生成,韻律,一般) 谷大輔, 大谷大和, 戸田智基, 猿渡洋, 鹿野清宏,
PDFダウンロードページ	PDFダウンロードページへ
抄録(和)	任意の話者の声質から特定の話者の声質への変換を可能とする多対一声質変換(Voice Conversion:VC)アルゴリズムの評価について述べる.多対一VCでは,多数の事前収録入力話者と一人の目標話者からなる複数のパラレルデータセットを使用することで,新たな入力話者のための変換モデルを効果的に構築する.本稿では,従来法である不特定入力話者モデルに基づく変換法や固有声に基づく変換法とともに,新たに提案する話者選択に基づく変換法および話者正規化学習法を用いた固有声に基づく変換法に対して性能評価を行う.実験結果から,適応処理によって変換精度が向上することを確認するとともに,適応文数によって最良なアルゴリズムが異なることを示す.
抄録(英)	This paper describes an evaluation of four many-to-one voice conversion (VC) algorithms converting an arbitrary speaker's voice into a particular target speaker's voice. These algorithms effectively generate a conversion model for a new source speaker using multiple parallel data sets of many pre-stored source speakers and the single target speaker. We conducted experimental evaluations for demonstrating the conversion performance of each of the many-to-one VC algorithms, including not only the conventional algorithms based on a speaker independent model and on eigenvoice conversion (EVC), but also new algorithms based on speaker selection and on EVC with speaker adaptive training (SAT). As a result, it is shown that an adaptation process of the conversion model improves significantly conversion performance, and the algorithm based on speaker selection is effective even when using a very limited amount of adaptation data.
キーワード(和)	声質変換 / 多対一声質変換 / 固有声変換 / 話者正規化学習法 / 話者選択
キーワード(英)	voice conversion / many-to-one VC / EVC / SAT / speaker selection
資料番号	SP2007-81
発行日

研究会情報
研究会	SP
開催期間	2007/10/18(から1日開催)
開催地（和）
開催地（英）
テーマ（和）
テーマ（英）
委員長氏名（和）
委員長氏名（英）
副委員長氏名（和）
副委員長氏名（英）
幹事氏名（和）
幹事氏名（英）
幹事補佐氏名（和）
幹事補佐氏名（英）

講演論文情報詳細
申込み研究会	Speech (SP)
本文の言語	JPN
タイトル（和）	事前収録話者データを用いた多対一声質変換法(合成,生成,韻律,一般)
サブタイトル（和）
タイトル（英）	Many-to-One Voice Conversion Algorithms with Pre-Stored Speaker Data Sets
サブタイトル（和）
キーワード(1)（和/英）	声質変換 / voice conversion
キーワード(2)（和/英）	多対一声質変換 / many-to-one VC
キーワード(3)（和/英）	固有声変換 / EVC
キーワード(4)（和/英）	話者正規化学習法 / SAT
キーワード(5)（和/英）	話者選択 / speaker selection
第 1 著者氏名（和/英）	谷大輔 / Daisuke TANI
第 1 著者所属（和/英）	奈良先端科学技術大学院大学情報科学研究科 Graduate School of Information Science, Nara Institute of Science and Technology
第 2 著者氏名（和/英）	大谷大和 / Yamato OHTANI
第 2 著者所属（和/英）	奈良先端科学技術大学院大学情報科学研究科 Graduate School of Information Science, Nara Institute of Science and Technology
第 3 著者氏名（和/英）	戸田智基 / Tomoki TODA
第 3 著者所属（和/英）	奈良先端科学技術大学院大学情報科学研究科 Graduate School of Information Science, Nara Institute of Science and Technology
第 4 著者氏名（和/英）	猿渡洋 / Hiroshi SARUWATARI
第 4 著者所属（和/英）	奈良先端科学技術大学院大学情報科学研究科 Graduate School of Information Science, Nara Institute of Science and Technology
第 5 著者氏名（和/英）	鹿野清宏 / Kiyohiro SHIKANO
第 5 著者所属（和/英）	奈良先端科学技術大学院大学情報科学研究科 Graduate School of Information Science, Nara Institute of Science and Technology
発表年月日	2007/10/18
資料番号	SP2007-81
巻番号（vol）	vol.107
号番号（no）	282
ページ範囲	pp.-
ページ数	6
発行日