講演名 2017-01-21
齋藤 佑樹(東大), 高道 慎之介(東大), 猿渡 洋(東大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 統計的パラメトリック音声合成において,生成される合成音声の音質劣化は深刻な問題となる.これまでに我々はテキスト音声合成において,合成音声による声のなりすましを防ぐ技術である anti-spoofing に敵対する音響モデル学習法 (敵対的 DNN 音声合成) を提案し,有効性を示している.本稿では,敵対的 DNN 音声合成の枠組みを音声変換へ適用し,高音質な音声変換を実現するための DNN 音響モデルの学習アルゴリズムを提案する.実験的評価により,(1) Feed-Forward 型ネットワークを用いた特徴量変換に基づく DNN 音声変換,及び,本稿で新たに提案する,(2) highway network を用いた差分スペクトル推定に基づく DNN 音声変換の両方において提案アルゴリズムによる音質改善効果が得られることを示す.
抄録(英) This paper proposes a novel training algorithm for high-quality Deep Neural Network (DNN)-based voice conversion. To improve speech quality in DNN-based text-to-speech synthesis, we have proposed a training algorithm to deceive anti-spoofing verification, called adversarial DNN-based speech synthesis. The anti-spoofing is a discriminator to distinguish natural and synthetic speech. This paper extends this idea to DNN-based voice conversion, and we build the acoustic models that can deceive the anti-spoofing verification. To evaluate the proposed algorithm, we conduct evaluations using two conversion frameworks: speech feature conversion using Feed-Forward neural networks and spectral differentials estimation using highway networks from input to output, which is proposed in this paper. The evaluation results successfully demonstrate the speech-quality improvements for both frameworks.
キーワード(和) DNN音声変換 / anti-spoofing / 敵対的DNN音声合成 / highway network / 差分スペクトル / 過剰な平滑化
キーワード(英) DNN-based voice conversion / anti-spoofing verification / adversarial DNN-based speech synthesis / highway networks / spectral differentials / over-smoothing
資料番号 SP2016-69
発行日 2017-01-14 (SP)

研究会 SP
開催期間 2017/1/21(から1日開催)
開催地(和) 東京大学
開催地(英) The University of Tokyo
テーマ(和) 合成,生成,韻律,音声一般
テーマ(英) Synthesis, Generation, Prosody, etc.
委員長氏名(和) 間野 一則(芝浦工大)
委員長氏名(英) Kazunori Mano(Shibaura Inst. of Tech.)
副委員長氏名(和) 森 大毅(宇都宮大)
副委員長氏名(英) Hiroki Mori(Utsunomiya Univ.)
幹事氏名(和) 滝口 哲也(神戸大) / 西田 昌史(静岡大)
幹事氏名(英) Tetsuya Takiguchi(Kobe Univ.) / Masafumi Nishida(Shizuoka Univ.)
幹事補佐氏名(和) 浅見 太一(NTT) / 橋本 佳(名工大)
幹事補佐氏名(英) Taichi Asami(NTT) / Kei Hashimoto(Nagoya Inst. of Tech.)

申込み研究会 Technical Committee on Speech
本文の言語 JPN
タイトル(和) [ポスター講演]Anti-spoofingに敵対するDNN音声変換の評価
タイトル(英) [Poster Presentation] Evaluation of DNN-Based Voice Conversion Deceiving Anti-spoofing Verification
キーワード(1)(和/英) DNN音声変換 / DNN-based voice conversion
キーワード(2)(和/英) anti-spoofing / anti-spoofing verification
キーワード(3)(和/英) 敵対的DNN音声合成 / adversarial DNN-based speech synthesis
キーワード(4)(和/英) highway network / highway networks
キーワード(5)(和/英) 差分スペクトル / spectral differentials
キーワード(6)(和/英) 過剰な平滑化 / over-smoothing
第 1 著者 氏名(和/英) 齋藤 佑樹 / Yuki Saito
第 1 著者 所属(和/英) 東京大学(略称:東大)
The University of Tokyo(略称:UT)
第 2 著者 氏名(和/英) 高道 慎之介 / Shinnosuke Takamichi
第 2 著者 所属(和/英) 東京大学(略称:東大)
The University of Tokyo(略称:UT)
第 3 著者 氏名(和/英) 猿渡 洋 / Hiroshi Saruwatari
第 3 著者 所属(和/英) 東京大学(略称:東大)
The University of Tokyo(略称:UT)
発表年月日 2017-01-21
資料番号 SP2016-69
巻番号(vol) vol.116
号番号(no) SP-414
ページ範囲 pp.29-34(SP),
ページ数 6
発行日 2017-01-14 (SP)