一対多固有声変換に基づく声質制御法の評価(合成,生成,韻律,一般)

太田 久美; 大谷 大和; 戸田 智基; 猿渡 洋; 鹿野 清宏

講演名	2007/10/18 一対多固有声変換に基づく声質制御法の評価(合成,生成,韻律,一般) 太田久美, 大谷大和, 戸田智基, 猿渡洋, 鹿野清宏,
PDFダウンロードページ	PDFダウンロードページへ
抄録(和)	本報告では,一対多固有声変換(Eigenvoice Conversion:EVC)に基づく特定話者に対する声質制御法を提案する.一対多EVCでは,入力話者と複数の事前収録出力話者によるパラレルデータを用いて,固有声に基づく混合正規分布モデル(Eigenvoice Gaussian Mixture Model:EV-GMM)を学習する.EV-GMMの少量のパラメータである固有ベクトルに対する重みを手動制御することにより,変換音声の声質を制御することが可能である.しかし,各固有ベクトルは,直感的に表現しやすい声質を明確に表さないため,操作性に優れた声質制御の実現は困難である.この問題に対処するため,EVCに基づく声質制御のための重回帰手法を提案する.変換音声の声質は,特定の声質の特徴を捉えた低次元の声質制御ベクトルを用いて制御される.実験的評価により,提案法の有効性を示す.
抄録(英)	This paper proposes techniques for flexibly controlling voice quality of converted speech from a particular source speaker based on one-to-many eigenvoice conversion (EVC). EVC realizes a voice quality control based on the manipulation of a small number of parameters, i.e., weights for eigenvectors, of an eigenvoice Gaussian mixture model (EV-GMM), which is trained with multiple parallel data sets consisting of a single source speaker and many pre-stored target speakers. However, it is difficult to control intuitively the desired voice quality with those parameters because each eigenvector does not usually represent a specific physical meaning. In order to cope with this problem, we propose regression approaches to the EVC-based voice quality control. The tractable voice quality control of the converted speech is achieved with a low-dimensional voice quality control vector capturing specific voice characteristics. Results of experimental evaluations show that the proposed approach allows us to intuitively control the voice quality of the converted speech.
キーワード(和)	声質変換 / 声質制御 / 混合正規分布モデル / 固有声
キーワード(英)	voice conversion / voice quality control / GMM / eigenvoice
資料番号	SP2007-82
発行日

研究会情報
研究会	SP
開催期間	2007/10/18(から1日開催)
開催地（和）
開催地（英）
テーマ（和）
テーマ（英）
委員長氏名（和）
委員長氏名（英）
副委員長氏名（和）
副委員長氏名（英）
幹事氏名（和）
幹事氏名（英）
幹事補佐氏名（和）
幹事補佐氏名（英）

講演論文情報詳細
申込み研究会	Speech (SP)
本文の言語	JPN
タイトル（和）	一対多固有声変換に基づく声質制御法の評価(合成,生成,韻律,一般)
サブタイトル（和）
タイトル（英）	Evaluation of Voice Quality Control Based on One-to-Many Eigenvoice Conversion
サブタイトル（和）
キーワード(1)（和/英）	声質変換 / voice conversion
キーワード(2)（和/英）	声質制御 / voice quality control
キーワード(3)（和/英）	混合正規分布モデル / GMM
キーワード(4)（和/英）	固有声 / eigenvoice
第 1 著者氏名（和/英）	太田久美 / Kumi OHTA
第 1 著者所属（和/英）	奈良先端科学技術大学院大学情報科学研究科 Graduate School of Information Science, Nara Institute of Science and Technology
第 2 著者氏名（和/英）	大谷大和 / Yamato OHTANI
第 2 著者所属（和/英）	奈良先端科学技術大学院大学情報科学研究科 Graduate School of Information Science, Nara Institute of Science and Technology
第 3 著者氏名（和/英）	戸田智基 / Tomoki TODA
第 3 著者所属（和/英）	奈良先端科学技術大学院大学情報科学研究科 Graduate School of Information Science, Nara Institute of Science and Technology
第 4 著者氏名（和/英）	猿渡洋 / Hiroshi SARUWATARI
第 4 著者所属（和/英）	奈良先端科学技術大学院大学情報科学研究科 Graduate School of Information Science, Nara Institute of Science and Technology
第 5 著者氏名（和/英）	鹿野清宏 / Kiyohiro SHIKANO
第 5 著者所属（和/英）	奈良先端科学技術大学院大学情報科学研究科 Graduate School of Information Science, Nara Institute of Science and Technology
発表年月日	2007/10/18
資料番号	SP2007-82
巻番号（vol）	vol.107
号番号（no）	282
ページ範囲	pp.-
ページ数	6
発行日