講演名 | 2007/10/18 事前収録話者データを用いた多対一声質変換法(合成,生成,韻律,一般) 谷 大輔, 大谷 大和, 戸田 智基, 猿渡 洋, 鹿野 清宏, |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | 任意の話者の声質から特定の話者の声質への変換を可能とする多対一声質変換(Voice Conversion:VC)アルゴリズムの評価について述べる.多対一VCでは,多数の事前収録入力話者と一人の目標話者からなる複数のパラレルデータセットを使用することで,新たな入力話者のための変換モデルを効果的に構築する.本稿では,従来法である不特定入力話者モデルに基づく変換法や固有声に基づく変換法とともに,新たに提案する話者選択に基づく変換法および話者正規化学習法を用いた固有声に基づく変換法に対して性能評価を行う.実験結果から,適応処理によって変換精度が向上することを確認するとともに,適応文数によって最良なアルゴリズムが異なることを示す. |
抄録(英) | This paper describes an evaluation of four many-to-one voice conversion (VC) algorithms converting an arbitrary speaker's voice into a particular target speaker's voice. These algorithms effectively generate a conversion model for a new source speaker using multiple parallel data sets of many pre-stored source speakers and the single target speaker. We conducted experimental evaluations for demonstrating the conversion performance of each of the many-to-one VC algorithms, including not only the conventional algorithms based on a speaker independent model and on eigenvoice conversion (EVC), but also new algorithms based on speaker selection and on EVC with speaker adaptive training (SAT). As a result, it is shown that an adaptation process of the conversion model improves significantly conversion performance, and the algorithm based on speaker selection is effective even when using a very limited amount of adaptation data. |
キーワード(和) | 声質変換 / 多対一声質変換 / 固有声変換 / 話者正規化学習法 / 話者選択 |
キーワード(英) | voice conversion / many-to-one VC / EVC / SAT / speaker selection |
資料番号 | SP2007-81 |
発行日 |
研究会情報 | |
研究会 | SP |
---|---|
開催期間 | 2007/10/18(から1日開催) |
開催地(和) | |
開催地(英) | |
テーマ(和) | |
テーマ(英) | |
委員長氏名(和) | |
委員長氏名(英) | |
副委員長氏名(和) | |
副委員長氏名(英) | |
幹事氏名(和) | |
幹事氏名(英) | |
幹事補佐氏名(和) | |
幹事補佐氏名(英) |
講演論文情報詳細 | |
申込み研究会 | Speech (SP) |
---|---|
本文の言語 | JPN |
タイトル(和) | 事前収録話者データを用いた多対一声質変換法(合成,生成,韻律,一般) |
サブタイトル(和) | |
タイトル(英) | Many-to-One Voice Conversion Algorithms with Pre-Stored Speaker Data Sets |
サブタイトル(和) | |
キーワード(1)(和/英) | 声質変換 / voice conversion |
キーワード(2)(和/英) | 多対一声質変換 / many-to-one VC |
キーワード(3)(和/英) | 固有声変換 / EVC |
キーワード(4)(和/英) | 話者正規化学習法 / SAT |
キーワード(5)(和/英) | 話者選択 / speaker selection |
第 1 著者 氏名(和/英) | 谷 大輔 / Daisuke TANI |
第 1 著者 所属(和/英) | 奈良先端科学技術大学院大学情報科学研究科 Graduate School of Information Science, Nara Institute of Science and Technology |
第 2 著者 氏名(和/英) | 大谷 大和 / Yamato OHTANI |
第 2 著者 所属(和/英) | 奈良先端科学技術大学院大学情報科学研究科 Graduate School of Information Science, Nara Institute of Science and Technology |
第 3 著者 氏名(和/英) | 戸田 智基 / Tomoki TODA |
第 3 著者 所属(和/英) | 奈良先端科学技術大学院大学情報科学研究科 Graduate School of Information Science, Nara Institute of Science and Technology |
第 4 著者 氏名(和/英) | 猿渡 洋 / Hiroshi SARUWATARI |
第 4 著者 所属(和/英) | 奈良先端科学技術大学院大学情報科学研究科 Graduate School of Information Science, Nara Institute of Science and Technology |
第 5 著者 氏名(和/英) | 鹿野 清宏 / Kiyohiro SHIKANO |
第 5 著者 所属(和/英) | 奈良先端科学技術大学院大学情報科学研究科 Graduate School of Information Science, Nara Institute of Science and Technology |
発表年月日 | 2007/10/18 |
資料番号 | SP2007-81 |
巻番号(vol) | vol.107 |
号番号(no) | 282 |
ページ範囲 | pp.- |
ページ数 | 6 |
発行日 |