講演名 2016-03-28
[ポスター講演]差分スペクトル補正に基づく歌声声質変換のためのF0変換の評価
小林 和弘(奈良先端大), 戸田 智基(名大/奈良先端大), 中村 哲(奈良先端大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本報告では,入力歌手の声質を目標歌手の声質へと変換する統計的手法に基づく歌声声質変換(SVC: Singing Voice Converesion)において,差分スペクトル補正に基づく異性間のSVCを提案する.SVCは,入力歌手と目標歌手の音響特徴量の対応関係をモデル化する事で,入力歌手から目標歌手への声質変換を実現する.変換された音響特徴量から変換歌声を生成する際に,ボコーダが用いられるが,音源生成処理における分析・合成誤差などにより,変換歌声の自然性は自然歌声に比べて著しく劣化する傾向がある.これに対し,同性間の歌声変換処理においては,多くの場合音高変換を必要としない点に着目し,入力歌声の音源波形を直接用いて変換歌声を生成する差分スペクトル補正に基づくSVC(差分SVC) を提案し,自然性を改善できることを示した.本報告では,音高変換を必要とする異性間の歌声変換に対しても差分SVCを適用するために,残差波形の加工処理に基づく音源波形のF0変換を導入する.評価実験より,提案法は,異性間のSVCにおいて,ボコーダーを用いる従来のSVCと比較し, 同等の個人性変換精度を保ちつつ自然性を改善できる事を示す.
抄録(英) In this report, we propose a technique for cross-gender statistical singing voice conversion (SVC) with direct waveform modification based on spectrum differential (DIFFSVC). SVC makes it possible to convert voice timbre of a source singer into that of a target singer based on a statistical conversion function of acoustic features between these two singers. A traditional SVC framework usually degrades speech quality of the converted singing voice compared to that of a natural singing voice due to waveform generation with vocoder, which causes various errors. To address this issue, the DIFFSVC technique has been proposed as a high quality SVC framework for within-gender conversion by directly using an excitation signal of the input natural singing voice. To make it possible to also apply this SVC framework to cross-gender conversion, in this report, we apply F0 transformation of the excitation signal based on direct waveform modification to DIFFSVC. The experimental results demonstrate that the proposed cross-gender DIFFSVC framework significantly improves speech quality while while preserving the conversion accuracy of singer identity compared to the conventional SVC.
キーワード(和) 歌声声質変換 / 異性間変換 / 波形補正 / 差分スペクトル / F0変換
キーワード(英) statistical singing voice conversion / cross-gender conversion / direct waveform modification / spectral differential / F0 transformation.
資料番号 EA2015-84,SIP2015-133,SP2015-112
発行日 2016-03-21 (EA, SIP, SP)

研究会情報
研究会 EA / SP / SIP
開催期間 2016/3/28(から2日開催)
開催地(和) 別府国際コンベンションセンター B-ConPlaza
開催地(英) Beppu International Convention Center B-ConPlaza
テーマ(和) 応用/電気音響,音声,信号処理,一般
テーマ(英) Engineering/Electro Acoustics, Speech, Signal Processing, and Related Topics
委員長氏名(和) 羽田 陽一(電通大) / 間野 一則(芝浦工大) / 宝珠山 治(NEC)
委員長氏名(英) Yoichi Haneda(Univ. of Electro-Comm.) / Kazunori Mano(Shibaura Inst. of Tech.) / Osamu Houshuyama(NEC)
副委員長氏名(和) 岩谷 幸雄(東北学院大) / 水町 光徳(九工大) / 北岡 教英(徳島大) / 中静 真(千葉工大) / 奥田 正浩(北九州市大)
副委員長氏名(英) Yukio Iwaya(Tohoku Gakuin Univ.) / Mitsunori Mizumachi(Kyushu Inst. of Tech.) / Norihide Kitaoka(Tokushima Univ.) / Makoto Nakashizuka(Chiba Inst. of Tech.) / Masahiro Okuda(Univ. of Kitakyushu)
幹事氏名(和) 島内 末廣(NTT) / 堀内 俊治(KDDI研) / 岩野 公司(東京都市大) / 滝口 哲也(神戸大) / 辻川 剛範(NEC) / 平林 晃(立命館大)
幹事氏名(英) Suehiro Shimauchi(NTT) / Toshiharu Horiuchi(KDDI R&D Labs.) / Koji Iwano(Tokyo City Univ.) / Tetsuya Takiguchi(Kobe Univ.) / Masanori Tsujikawa(NEC) / Akira Hirabayashi(Ritsumeikan Univ.)
幹事補佐氏名(和) 小山 翔一(東大) / 能勢 隆(東北大) / 浅見 太一(NTT) / 宮田 高道(千葉工大)
幹事補佐氏名(英) Shoichi Koyama(Univ. of Tokyo) / Takashi Nose(Tohoku Univ.) / Taichi Asami(NTT) / Takamichi Miyata(Chiba Inst. of Tech.)

講演論文情報詳細
申込み研究会 Technical Committee on Engineering Acoustics / Technical Committee on Speech / Technical Committee on Signal Processing
本文の言語 JPN
タイトル(和) [ポスター講演]差分スペクトル補正に基づく歌声声質変換のためのF0変換の評価
サブタイトル(和)
タイトル(英) [Poster Presentation] An evaluation of F0 transformation for statistical singing voice conversion based on spectral differential filtering
サブタイトル(和)
キーワード(1)(和/英) 歌声声質変換 / statistical singing voice conversion
キーワード(2)(和/英) 異性間変換 / cross-gender conversion
キーワード(3)(和/英) 波形補正 / direct waveform modification
キーワード(4)(和/英) 差分スペクトル / spectral differential
キーワード(5)(和/英) F0変換 / F0 transformation.
第 1 著者 氏名(和/英) 小林 和弘 / Kazuhiro Kobayashi
第 1 著者 所属(和/英) 奈良先端科学技術大学院大学(略称:奈良先端大)
Nara Institute of Science and Technology(略称:NAIST)
第 2 著者 氏名(和/英) 戸田 智基 / Tomoki Toda
第 2 著者 所属(和/英) 名古屋大学/奈良先端科学技術大学院大学(略称:名大/奈良先端大)
Nagoya University/Nara Institute of Science and Technology(略称:Nagoya Univ./NAIST)
第 3 著者 氏名(和/英) 中村 哲 / Satoshi Nakamura
第 3 著者 所属(和/英) 奈良先端科学技術大学院大学(略称:奈良先端大)
Nara Institute of Science and Technology(略称:NAIST)
発表年月日 2016-03-28
資料番号 EA2015-84,SIP2015-133,SP2015-112
巻番号(vol) vol.115
号番号(no) EA-521,SIP-522,SP-523
ページ範囲 pp.105-110(EA), pp.105-110(SIP), pp.105-110(SP),
ページ数 6
発行日 2016-03-21 (EA, SIP, SP)