お知らせ 2023年度・2024年度 学生員 会費割引キャンペーン実施中です
お知らせ 技術研究報告と和文論文誌Cの同時投稿施策(掲載料1割引き)について
お知らせ 電子情報通信学会における研究会開催について
お知らせ NEW 参加費の返金について
電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
[ログイン]
技報アーカイブ
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2009-01-30 15:30
スペクトル系列の最尤推定に基づく短遅延声質変換法
村松敬司大谷大和戸田智基猿渡 洋鹿野清宏奈良先端大SP2008-141
抄録 (和) 本稿では,スペクトル変換手法,及びスペクトル変換後の後処理について検討し,高品質かつリアルタイムなVC の実現を目指す.混合正規分布モデルに基づく声質変換手法において,代表的な2つのスペクトル変換手法:1)フレーム毎に変換を行う最小平均自乗誤差変換,及び2)一発話の系列を同時に変換する最尤スペクトル系列変換が提案されている.前者はリアルタイム変換が可能であるが,不自然なスペクトル遷移が生じる可能性がある.一方後者はスペクトルの動的特徴量を考慮する事により変換性能が高いが,リアルタイム変換が出来ない.動的特徴量を考慮したリアルタイム変換を実現するため,最尤スペクトル系列変換に対して時間再帰アルゴリズムを適用する.また,統計量に基づくVC では,統計処理によってスペクトルの過剰な平滑化が生じてしまう.これに対してスペクトルの系列内変動(GV)を考慮した最尤特徴量変換法が提案されているが,短遅延変換に適用するのは困難である.本稿では,GV を考慮したポストフィルタを短遅延処理に適用する手法を提案する.実験的評価により,提案手法の有効性を示す. 
(英) In this paper, we aim to achieve high-quality and real-time VC considering spectral conversion method and post-processing of spectral conversion. As typical voice conversion methods, two spectral conversion processes have been proposed: 1) the frame-based conversion that converts spectral parameters frame by frame and 2) the trajectory-based conversion that converts all spectral parameters over an utterance simultaneously. The former process is capable of real-time conversion but it sometimes causes inappropriate spectral movements. On the other hand, the latter process provides the converted spectral parameters exhibiting proper dynamic characteristics but it isn’t capable of real-time conversion. To realize the real-time conversion process considering spectral dynamic characteristics, we propose a time-recursive conversion algorithm based on maximum likelihood estimation of spectral parameter trajectory. And, the converted trajectory is often excessively smoothed due to the statistical processing. Although the maximum likelihood feature conversion method which considers global variance (GV) is proposed, it is complicated to apply to the low-delay conversion. In this paper, we propose a technique using post-filter which considers GV. Experimental results show that the proposed methods are effective.
キーワード (和) 音声合成 / 声質変換 / 混合正規分布モデル / 最尤スペクトル系列変換 / 短遅延処理 / / /  
(英) speech synthesis / voice conversion / Gaussian mixture model / maximum likelihood estimation / low-delay processing / / /  
文献情報 信学技報, vol. 108, no. 422, SP2008-141, pp. 91-96, 2009年1月.
資料番号 SP2008-141 
発行日 2009-01-22 (SP) 
ISSN Print edition: ISSN 0913-5685    Online edition: ISSN 2432-6380
著作権に
ついて
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
PDFダウンロード SP2008-141

研究会情報
研究会 SP  
開催期間 2009-01-29 - 2009-01-30 
開催地(和) 奈良先端大 
開催地(英) NAIST 
テーマ(和) 一般 
テーマ(英)  
講演論文情報の詳細
申込み研究会 SP 
会議コード 2009-01-SP 
本文の言語 日本語 
タイトル(和) スペクトル系列の最尤推定に基づく短遅延声質変換法 
サブタイトル(和)  
タイトル(英) Low-delay voice conversion algorithm based on maximum likelihood estimation of spectral parameter trajectory 
サブタイトル(英)  
キーワード(1)(和/英) 音声合成 / speech synthesis  
キーワード(2)(和/英) 声質変換 / voice conversion  
キーワード(3)(和/英) 混合正規分布モデル / Gaussian mixture model  
キーワード(4)(和/英) 最尤スペクトル系列変換 / maximum likelihood estimation  
キーワード(5)(和/英) 短遅延処理 / low-delay processing  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 村松 敬司 / Takashi Muramatsu / ムラマツ タカシ
第1著者 所属(和/英) 奈良先端科学技術大学院大学 (略称: 奈良先端大)
Nara Institute of Science and Technology (略称: Nara Inst. of Scie and Tech.)
第2著者 氏名(和/英/ヨミ) 大谷 大和 / Yamato Ohtani / オオタニ ヤマト
第2著者 所属(和/英) 奈良先端科学技術大学院大学 (略称: 奈良先端大)
Nara Institute of Science and Technology (略称: Nara Inst. of Scie and Tech.)
第3著者 氏名(和/英/ヨミ) 戸田 智基 / Tomoki Toda / トダ トモキ
第3著者 所属(和/英) 奈良先端科学技術大学院大学 (略称: 奈良先端大)
Nara Institute of Science and Technology (略称: Nara Inst. of Scie and Tech.)
第4著者 氏名(和/英/ヨミ) 猿渡 洋 / Hiroshi Saruwatari / サルワタリ ヒロシ
第4著者 所属(和/英) 奈良先端科学技術大学院大学 (略称: 奈良先端大)
Nara Institute of Science and Technology (略称: Nara Inst. of Scie and Tech.)
第5著者 氏名(和/英/ヨミ) 鹿野 清宏 / Kiyohiro Shikano / シカノ キヨヒロ
第5著者 所属(和/英) 奈良先端科学技術大学院大学 (略称: 奈良先端大)
Nara Institute of Science and Technology (略称: Nara Inst. of Scie and Tech.)
第6著者 氏名(和/英/ヨミ) / /
第6著者 所属(和/英) (略称: )
(略称: )
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者 第1著者 
発表日時 2009-01-30 15:30:00 
発表時間 25分 
申込先研究会 SP 
資料番号 SP2008-141 
巻番号(vol) vol.108 
号番号(no) no.422 
ページ範囲 pp.91-96 
ページ数
発行日 2009-01-22 (SP) 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会