お知らせ 研究会の開催と会場に参加される皆様へのお願い(2020年10月開催~)
電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
[ログイン]
技報アーカイブ
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2010-01-21 10:40
F0量子化と非パラレル学習に基づく声質変換の評価
太田悠平能勢 隆小林隆夫東工大CQ2009-60 PRMU2009-159 SP2009-100 MVE2009-82
抄録 (和) コンテキスト依存HMMに基づく声質変換法の有効性を示すためにGMMに基づく声質変換法との比較を中心に,客観及び主観評価実験を行った結果を報告する.この手法では元話者の入力音声に対して音韻及び韻律の情報を抽出し,これらの情報に基づいてあらかじめ学習した目標話者の音響モデルから音声を生成することで声質変換を実現している.また韻律のうち,ピッチ情報を適切にモデル化するために,従来HMM音声合成で用いられていた手動ラベリングに基づくアクセント情報ではなく,学習データのF0値自体を粗く量子化したシンボルをコンテキストとして利用することで学習データに対する自動ラベリングが可能である.さらに従来提案されているGMMに基づく声質変換法では音素単位や複数の音素にわたる音響的特徴に含まれる話者の個人性を適切に変換することが困難であったのに対し,HMMに基づく手法では音韻・韻律に関わるコンテキスト依存モデルを利用することにより,このようなセグメンタル・スープラセグメンタル特徴も変換することができる.評価の結果,HMMに基づく手法を用いることにより,従来法よりも自然性が大幅に改善され,また話者性の変換においても従来を上回る結果が得られた. 
(英) This paper describes the performance evaluation results of a context-dependent HMM-based voice conversion technique to show its effectiveness by comparing with a GMM-based one. In HMM-based conversion, first we extract the phonetic and prosodic information from input speech of a source speaker. Then, converted synthetic speech is generated from the pre-trained acoustic model of a target speaker. To appropriately model the pitch information, we use a roughly quantized F0 symbol sequence as the prosodic context instead of accent information obtained by manual labeling for training data. By using the phonetically and prosodically context-dependent HMMs, the speaker characteristics appearing in segmental and supra-segmental features can be also converted, which is difficult in conventional GMM-based techniques. Objective and subjective experimental results show that the naturalness and speaker individuality of converted speech are significantly improved by using HMM-based voice conversion.
キーワード (和) 声質変換 / HMM音声合成 / 韻律情報 / F0量子化 / GMM / / /  
(英) voice conversion / HMM-based speech synthesis / prosodic information / F0 quantization / GMM / / /  
文献情報 信学技報, vol. 109, no. 375, SP2009-100, pp. 27-32, 2010年1月.
資料番号 SP2009-100 
発行日 2010-01-14 (CQ, PRMU, SP, MVE) 
ISSN Print edition: ISSN 0913-5685  Online edition: ISSN 2432-6380
著作権に
ついて
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
PDFダウンロード CQ2009-60 PRMU2009-159 SP2009-100 MVE2009-82

研究会情報
研究会 PRMU SP MVE CQ  
開催期間 2010-01-21 - 2010-01-22 
開催地(和) 京大 
開催地(英) Kyoto Univ. 
テーマ(和) クロスモーダル 
テーマ(英)  
講演論文情報の詳細
申込み研究会 SP 
会議コード 2010-01-PRMU-SP-MVE-CQ 
本文の言語 日本語 
タイトル(和) F0量子化と非パラレル学習に基づく声質変換の評価 
サブタイトル(和)  
タイトル(英) Performance evaluation of Voice Conversion Based on F0 Quantization and Non-parallel Training 
サブタイトル(英)  
キーワード(1)(和/英) 声質変換 / voice conversion  
キーワード(2)(和/英) HMM音声合成 / HMM-based speech synthesis  
キーワード(3)(和/英) 韻律情報 / prosodic information  
キーワード(4)(和/英) F0量子化 / F0 quantization  
キーワード(5)(和/英) GMM / GMM  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 太田 悠平 / Yuhei Ota / オオタ ユウヘイ
第1著者 所属(和/英) 東京工業大学 (略称: 東工大)
Tokyo Institute of Technology (略称: Tokyo Inst. of Tech.)
第2著者 氏名(和/英/ヨミ) 能勢 隆 / Takashi Nose / ノセ タカシ
第2著者 所属(和/英) 東京工業大学 (略称: 東工大)
Tokyo Institute of Technology (略称: Tokyo Inst. of Tech.)
第3著者 氏名(和/英/ヨミ) 小林 隆夫 / Takao Kobayashi / コバヤシ タカオ
第3著者 所属(和/英) 東京工業大学 (略称: 東工大)
Tokyo Institute of Technology (略称: Tokyo Inst. of Tech.)
第4著者 氏名(和/英/ヨミ) / /
第4著者 所属(和/英) (略称: )
(略称: )
第5著者 氏名(和/英/ヨミ) / /
第5著者 所属(和/英) (略称: )
(略称: )
第6著者 氏名(和/英/ヨミ) / /
第6著者 所属(和/英) (略称: )
(略称: )
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者
発表日時 2010-01-21 10:40:00 
発表時間 30 
申込先研究会 SP 
資料番号 IEICE-CQ2009-60,IEICE-PRMU2009-159,IEICE-SP2009-100,IEICE-MVE2009-82 
巻番号(vol) IEICE-109 
号番号(no) no.373(CQ), no.374(PRMU), no.375(SP), no.376(MVE) 
ページ範囲 pp.27-32 
ページ数 IEICE-6 
発行日 IEICE-CQ-2010-01-14,IEICE-PRMU-2010-01-14,IEICE-SP-2010-01-14,IEICE-MVE-2010-01-14 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会