講演名 2016-10-27
DNNに基づくテキスト音声合成における話者・ジェンダー・年齢コード利用の検討
Hieu Thi Luong(VNU - HCM - University of Science), 高木 信二(NII), SangJin Kim(Naver Labs), 山岸 順一(NII),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本論文ではDNNに基づくテキスト音声合成において,複数話者モデリング,話者適応,合成音声の音響特性操作を行う手法について検討する.ここでは,DNNに基づく音響モデルにおいて,言語特徴量に加えて話者・ジェンダー・年齢コード(入力コードと呼ぶ)を入力として利用する.10代後半から80代までの話者がバランス良く含まれた135名からなる高品質巨大コーパスを用い,以下の3つの実験を行った.1) 入力コードを用いた複数話者モデルの構築,2) 目標話者の少量の適応データを用いた,バックプロパゲーションによる話者コード推定に基づく話者適応,3) 入力コードを操作することによる合成音声の音響特性操作.これら実験を通して入力コードに基づく複数話者モデルの構築,話者適応,音響特性操作の評価を行った.
抄録(英)
キーワード(和) 音声合成 / DNN / 話者適応 / 音声操作 / モーフィング
キーワード(英)
資料番号 SP2016-48
発行日 2016-10-20 (SP)

研究会情報
研究会 SP
開催期間 2016/10/27(から1日開催)
開催地(和) 静岡大学
開催地(英) Shizuoka University.
テーマ(和) 学習,認識,合成,対話,音声一般
テーマ(英) Learning, Recognition, Synthesis, Dialogue, etc.
委員長氏名(和) 間野 一則(芝浦工大)
委員長氏名(英) Kazunori Mano(Shibaura Inst. of Tech.)
副委員長氏名(和) 森 大毅(宇都宮大)
副委員長氏名(英) Hiroki Mori(Utsunomiya Univ.)
幹事氏名(和) 滝口 哲也(神戸大) / 西田 昌史(静岡大)
幹事氏名(英) Tetsuya Takiguchi(Kobe Univ.) / Masafumi Nishida(Shizuoka Univ.)
幹事補佐氏名(和) 浅見 太一(NTT) / 橋本 佳(名工大)
幹事補佐氏名(英) Taichi Asami(NTT) / Kei Hashimoto(Nagoya Inst. of Tech.)

講演論文情報詳細
申込み研究会 Technical Committee on Speech
本文の言語 JPN
タイトル(和) DNNに基づくテキスト音声合成における話者・ジェンダー・年齢コード利用の検討
サブタイトル(和)
タイトル(英) A DNN-based Text-to-Speech Synthesis System using Speaker, Gender and Age Codes
サブタイトル(和)
キーワード(1)(和/英) 音声合成
キーワード(2)(和/英) DNN
キーワード(3)(和/英) 話者適応
キーワード(4)(和/英) 音声操作
キーワード(5)(和/英) モーフィング
第 1 著者 氏名(和/英) Hieu Thi Luong / Hieu Thi Luong
第 1 著者 所属(和/英) VNU - HCM - University of Science(略称:VNU - HCM - University of Science)
VNU - HCM - University of Science(略称:VNU - HCM - University of Science)
第 2 著者 氏名(和/英) 高木 信二 / Shinji Takaki
第 2 著者 所属(和/英) 国立情報学研究所(略称:NII)
National Institute of Informatics(略称:NII)
第 3 著者 氏名(和/英) SangJin Kim / SangJin Kim
第 3 著者 所属(和/英) Naver Labs(略称:Naver Labs)
Naver Labs(略称:Naver Labs)
第 4 著者 氏名(和/英) 山岸 順一 / Junichi Yamagishi
第 4 著者 所属(和/英) 国立情報学研究所(略称:NII)
National Institute of Informatics(略称:NII)
発表年月日 2016-10-27
資料番号 SP2016-48
巻番号(vol) vol.116
号番号(no) SP-279
ページ範囲 pp.37-42(SP),
ページ数 6
発行日 2016-10-20 (SP)