複数のネットワークの出力を考慮したDNNベース声質変換手法

藤岡 拓也; 孫 慶華

講演名	2018-01-20 複数のネットワークの出力を考慮したDNNベース声質変換手法藤岡拓也(日立), 孫慶華(日立),
PDFダウンロードページ	PDFダウンロードページへ
抄録(和)	従来の統計ベース声質変換手法は，ソース話者・ターゲット話者音声パラメータ対の関係を全てのフレームについて単一のモデルによって表現しているものが多い．筆者らは，ソース話者音声のフレームごとの状態によって，複数のDNNモデルを使い分けることにより音声パラメータを変換する手法を試みた．その結果，言語情報などの事前知識を学習時に与えることなく各DNNモデルの役割が分化することが確認され，客観指標を用いた評価実験により提案手法の有効性を示すことができた．
抄録(英)	In many conventional statistical voice conversion methods, the relations of source and target speech on all frames are expressed by using a single model. We proposed a method in which speech parameters are converted by using multiple DNN models. These DNN models are used selectively depending on the state of the source speech in each frame. As a result, the roles of multiple DNN models are differentiated automatically without using prior information (e.g. linguistic features) in the model training phase. Furthermore, the effectiveness of the proposed method was confirmed by the results of an objective evaluation experiment.
キーワード(和)	統計ベース声質変換 / ニューラルネットワーク / 音声状態
キーワード(英)	Statistical voice conversion / Neural networks / State of speech
資料番号	SP2017-68
発行日	2018-01-13 (SP)

研究会情報
研究会	SP / ASJ-H
開催期間	2018/1/20(から2日開催)
開催地（和）	東京大学
開催地（英）	The University of Tokyo
テーマ（和）	音声合成，音声コミュニケーション，聴覚，音声一般
テーマ（英）
委員長氏名（和）	山下洋一(立命館大) / 平原達也(富山県立大)
委員長氏名（英）	Yoichi Yamashita(Ritsumeikan Univ.) / 平原達也(富山県立大)
副委員長氏名（和）	森大毅(宇都宮大) / 中川誠司(千葉大)
副委員長氏名（英）	Hiroki Mori(Utsunomiya Univ.) / 中川誠司(千葉大)
幹事氏名（和）	西田昌史(静岡大) / 坂野秀樹(名城大) / 木谷俊介(北陸大) / 山川仁子(尚絅大) / 饗庭絵里子(電通大)
幹事氏名（英）	Masafumi Nishida(Shizuoka Univ.) / Hideki Banno(Meijo Univ.) / 木谷俊介(北陸大) / 山川仁子(尚絅大) / 饗庭絵里子(電通大)
幹事補佐氏名（和）	橋本佳(名工大) / 小橋川哲(NTT)
幹事補佐氏名（英）	Kei Hashimoto(Nagoya Inst. of Tech.) / Satoshi Kobashikawa(NTT)

講演論文情報詳細
申込み研究会	Technical Committee on Speech / Auditory Research Meeting
本文の言語	JPN
タイトル（和）	複数のネットワークの出力を考慮したDNNベース声質変換手法
サブタイトル（和）
タイトル（英）	DNN Based Voice Conversion Method Considering Outputs of Multiple Networks
サブタイトル（和）
キーワード(1)（和/英）	統計ベース声質変換 / Statistical voice conversion
キーワード(2)（和/英）	ニューラルネットワーク / Neural networks
キーワード(3)（和/英）	音声状態 / State of speech
第 1 著者氏名（和/英）	藤岡拓也 / Takuya Fujioka
第 1 著者所属（和/英）	株式会社日立製作所(略称：日立) Hitachi, Ltd.(略称：Hitachi)
第 2 著者氏名（和/英）	孫慶華 / Sun Qinghua
第 2 著者所属（和/英）	株式会社日立製作所(略称：日立) Hitachi, Ltd.(略称：Hitachi)
発表年月日	2018-01-20
資料番号	SP2017-68
巻番号（vol）	vol.117
号番号（no）	SP-393
ページ範囲	pp.11-15(SP),
ページ数	5
発行日	2018-01-13 (SP)