講演抄録/キーワード |
講演名 |
2010-01-21 10:40
F0量子化と非パラレル学習に基づく声質変換の評価 ○太田悠平・能勢 隆・小林隆夫(東工大) CQ2009-60 PRMU2009-159 SP2009-100 MVE2009-82 |
抄録 |
(和) |
コンテキスト依存HMMに基づく声質変換法の有効性を示すためにGMMに基づく声質変換法との比較を中心に,客観及び主観評価実験を行った結果を報告する.この手法では元話者の入力音声に対して音韻及び韻律の情報を抽出し,これらの情報に基づいてあらかじめ学習した目標話者の音響モデルから音声を生成することで声質変換を実現している.また韻律のうち,ピッチ情報を適切にモデル化するために,従来HMM音声合成で用いられていた手動ラベリングに基づくアクセント情報ではなく,学習データのF0値自体を粗く量子化したシンボルをコンテキストとして利用することで学習データに対する自動ラベリングが可能である.さらに従来提案されているGMMに基づく声質変換法では音素単位や複数の音素にわたる音響的特徴に含まれる話者の個人性を適切に変換することが困難であったのに対し,HMMに基づく手法では音韻・韻律に関わるコンテキスト依存モデルを利用することにより,このようなセグメンタル・スープラセグメンタル特徴も変換することができる.評価の結果,HMMに基づく手法を用いることにより,従来法よりも自然性が大幅に改善され,また話者性の変換においても従来を上回る結果が得られた. |
(英) |
This paper describes the performance evaluation results of a context-dependent HMM-based voice conversion technique to show its effectiveness by comparing with a GMM-based one. In HMM-based conversion, first we extract the phonetic and prosodic information from input speech of a source speaker. Then, converted synthetic speech is generated from the pre-trained acoustic model of a target speaker. To appropriately model the pitch information, we use a roughly quantized F0 symbol sequence as the prosodic context instead of accent information obtained by manual labeling for training data. By using the phonetically and prosodically context-dependent HMMs, the speaker characteristics appearing in segmental and supra-segmental features can be also converted, which is difficult in conventional GMM-based techniques. Objective and subjective experimental results show that the naturalness and speaker individuality of converted speech are significantly improved by using HMM-based voice conversion. |
キーワード |
(和) |
声質変換 / HMM音声合成 / 韻律情報 / F0量子化 / GMM / / / |
(英) |
voice conversion / HMM-based speech synthesis / prosodic information / F0 quantization / GMM / / / |
文献情報 |
信学技報, vol. 109, no. 375, SP2009-100, pp. 27-32, 2010年1月. |
資料番号 |
SP2009-100 |
発行日 |
2010-01-14 (CQ, PRMU, SP, MVE) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
CQ2009-60 PRMU2009-159 SP2009-100 MVE2009-82 |
研究会情報 |
研究会 |
PRMU SP MVE CQ |
開催期間 |
2010-01-21 - 2010-01-22 |
開催地(和) |
京大 |
開催地(英) |
Kyoto Univ. |
テーマ(和) |
クロスモーダル |
テーマ(英) |
|
講演論文情報の詳細 |
申込み研究会 |
SP |
会議コード |
2010-01-PRMU-SP-MVE-CQ |
本文の言語 |
日本語 |
タイトル(和) |
F0量子化と非パラレル学習に基づく声質変換の評価 |
サブタイトル(和) |
|
タイトル(英) |
Performance evaluation of Voice Conversion Based on F0 Quantization and Non-parallel Training |
サブタイトル(英) |
|
キーワード(1)(和/英) |
声質変換 / voice conversion |
キーワード(2)(和/英) |
HMM音声合成 / HMM-based speech synthesis |
キーワード(3)(和/英) |
韻律情報 / prosodic information |
キーワード(4)(和/英) |
F0量子化 / F0 quantization |
キーワード(5)(和/英) |
GMM / GMM |
キーワード(6)(和/英) |
/ |
キーワード(7)(和/英) |
/ |
キーワード(8)(和/英) |
/ |
第1著者 氏名(和/英/ヨミ) |
太田 悠平 / Yuhei Ota / オオタ ユウヘイ |
第1著者 所属(和/英) |
東京工業大学 (略称: 東工大)
Tokyo Institute of Technology (略称: Tokyo Inst. of Tech.) |
第2著者 氏名(和/英/ヨミ) |
能勢 隆 / Takashi Nose / ノセ タカシ |
第2著者 所属(和/英) |
東京工業大学 (略称: 東工大)
Tokyo Institute of Technology (略称: Tokyo Inst. of Tech.) |
第3著者 氏名(和/英/ヨミ) |
小林 隆夫 / Takao Kobayashi / コバヤシ タカオ |
第3著者 所属(和/英) |
東京工業大学 (略称: 東工大)
Tokyo Institute of Technology (略称: Tokyo Inst. of Tech.) |
第4著者 氏名(和/英/ヨミ) |
/ / |
第4著者 所属(和/英) |
(略称: )
(略称: ) |
第5著者 氏名(和/英/ヨミ) |
/ / |
第5著者 所属(和/英) |
(略称: )
(略称: ) |
第6著者 氏名(和/英/ヨミ) |
/ / |
第6著者 所属(和/英) |
(略称: )
(略称: ) |
第7著者 氏名(和/英/ヨミ) |
/ / |
第7著者 所属(和/英) |
(略称: )
(略称: ) |
第8著者 氏名(和/英/ヨミ) |
/ / |
第8著者 所属(和/英) |
(略称: )
(略称: ) |
第9著者 氏名(和/英/ヨミ) |
/ / |
第9著者 所属(和/英) |
(略称: )
(略称: ) |
第10著者 氏名(和/英/ヨミ) |
/ / |
第10著者 所属(和/英) |
(略称: )
(略称: ) |
第11著者 氏名(和/英/ヨミ) |
/ / |
第11著者 所属(和/英) |
(略称: )
(略称: ) |
第12著者 氏名(和/英/ヨミ) |
/ / |
第12著者 所属(和/英) |
(略称: )
(略称: ) |
第13著者 氏名(和/英/ヨミ) |
/ / |
第13著者 所属(和/英) |
(略称: )
(略称: ) |
第14著者 氏名(和/英/ヨミ) |
/ / |
第14著者 所属(和/英) |
(略称: )
(略称: ) |
第15著者 氏名(和/英/ヨミ) |
/ / |
第15著者 所属(和/英) |
(略称: )
(略称: ) |
第16著者 氏名(和/英/ヨミ) |
/ / |
第16著者 所属(和/英) |
(略称: )
(略称: ) |
第17著者 氏名(和/英/ヨミ) |
/ / |
第17著者 所属(和/英) |
(略称: )
(略称: ) |
第18著者 氏名(和/英/ヨミ) |
/ / |
第18著者 所属(和/英) |
(略称: )
(略称: ) |
第19著者 氏名(和/英/ヨミ) |
/ / |
第19著者 所属(和/英) |
(略称: )
(略称: ) |
第20著者 氏名(和/英/ヨミ) |
/ / |
第20著者 所属(和/英) |
(略称: )
(略称: ) |
講演者 |
第1著者 |
発表日時 |
2010-01-21 10:40:00 |
発表時間 |
30分 |
申込先研究会 |
SP |
資料番号 |
CQ2009-60, PRMU2009-159, SP2009-100, MVE2009-82 |
巻番号(vol) |
vol.109 |
号番号(no) |
no.373(CQ), no.374(PRMU), no.375(SP), no.376(MVE) |
ページ範囲 |
pp.27-32 |
ページ数 |
6 |
発行日 |
2010-01-14 (CQ, PRMU, SP, MVE) |
|