講演抄録/キーワード |
講演名 |
2019-03-15 13:30
[ポスター講演]波形加工に基づく統計的声質変換の外部雑音に対する頑健性 ○栗田優佑・小林和弘・武田一哉(名大)・戸田智基(名大/JSTさきがけ) EA2018-153 SIP2018-159 SP2018-115 |
抄録 |
(和) |
本報告では,雑音環境下における統計的声質変換(VC: Voice Conversion)の頑健性に関する調査を行う. VC では,入力音声と目標音声の音響特徴量間の対応関係を統計的にモデル化することで,入力音声から目標音声への 変換を実現する.本技術により,発声機能や歌唱機能の拡張といった応用技術の実現が期待されるが,実環境下での利 用時には,環境音や伴奏といった外部雑音の混入に対応する必要がある.本報告では,ボコーダを用いる変換法と波 形加工に基づく差分スペクトル補正を用いる変換法(DIFFVC: VC based on log-spectral differential compensation) による歌声変換に着目し,環境音や伴奏が重畳された入力歌声を変換した際に,外部雑音が変換性能に与える影響を 調査する.主観評価結果より,DIFFVC がボコーダを用いた変換法と比べ,背景音に対し頑健であることを示す.ま た,パワースペクトルの分布の変化量を捉えるカートシス比を用いて,DIFFVC の頑健性を客観的に分析する. |
(英) |
In this report, we investigate the statistical voice conversion (VC) under noisy environments.
VC achieves conversion from input speech to target speech by statistically modeling correspondence between input and target acoustic features.
To develop various VC applications, such as augmented speech production and augmented vocal production, it is necessary to handle noisy input speech because various background sounds, such as external noise and accompaniment, usually exist in a real environment.In this report, we investigate an impact of background sounds on conversion performance in singing voice conversion focusing on a vocoder-based conversion method and a vocoder-free conversion method based on direct waveform modification with log-spectral differential compensation (DIFFVC).Results of subjective evaluation show that DIFFVC is robust against background sounds compared with the vocoder-based conversion method.We also analyze the robustness of DIFFVC using a kurtosis ratio as an objective metric to evaluate distribution changes of power spectral components. |
キーワード |
(和) |
統計的声質変換 / 外部雑音 / ボコーダ / 波形加工 / カートシス比 / / / |
(英) |
Statistical voice conversion / background sounds / vocoder / direct waveform modification / kurtosis ratio / / / |
文献情報 |
信学技報, vol. 118, no. 497, SP2018-115, pp. 317-322, 2019年3月. |
資料番号 |
SP2018-115 |
発行日 |
2019-03-07 (EA, SIP, SP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
EA2018-153 SIP2018-159 SP2018-115 |
|