お知らせ 研究会の開催と会場に参加される皆様へのお願い(2020年10月開催~)
電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
[ログイン]
技報アーカイブ
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2019-06-13 13:30
DNN音声合成におけるスタイル付与モデル学習法の検討
蛭田宜樹東工大)・郡山知樹東大)・太刀岡勇気デンソーアイティーラボラトリ)・小林隆夫東工大SP2019-1
抄録 (和) 本報告では DNN 音声合成におけるスタイル付与手法について検討している.スタイル付与とは,音声を 合成したい話者(目標話者)のモデル学習用音声として読上げ音声のみが与えられた場合に,その話者の表現豊かな 音声を合成する技術である.本報告では目標話者の読上げ音声が少量しか与えられていない状況を想定し,i-vector を DNN の入力として用いる二つのモデルについて評価検討している.提案手法の基本的な枠組みは従来手法と同様, 複数話者の多様な表現を持つ音声を用いて話者性とスタイルを制御可能なモデルを構築することであり,提案法では i-vector を合成音声の話者性を制御するための DNN の入力として用いている.提案モデルの効果を確認するため客観 及び主観評価実験を行い,提案スタイル付与手法と one-hot 表現の話者コードを DNN の入力として用いる従来モデ ルとの比較評価結果を示す. 
(英) This paper investigates style transplantation modeling techniques for DNN-based statistical parametric speech synthesis. The problem treated here is to generate expressive speech of a given target speaker with only using a small amount of his/her reading style speech data. For this purpose, we propose two models, which utilize i-vector as an input to DNN. The basic idea of the proposed modeling framework is to construct an acoustic model which can control voice characteristics and emotional expression and/or speaking style using multi speaker’s expressive speech data. In the proposed framework, the i-vector is used to control voice characteristics of the synthetic speech. Through objective and subjective evaluation experiments we compare the performance of the proposed style trans- plantation modeling techniques with the conventional ones in which a speaker code represented by one-hot vector is used as an input to DNN.
キーワード (和) DNN音声合成 / スタイル付与 / i-vector / / / / /  
(英) DNN-based speech synthesis / style transplant / i-vector / / / / /  
文献情報 信学技報, vol. 119, no. 80, SP2019-1, pp. 1-6, 2019年6月.
資料番号 SP2019-1 
発行日 2019-06-06 (SP) 
ISSN Print edition: ISSN 0913-5685  Online edition: ISSN 2432-6380
著作権に
ついて
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
PDFダウンロード SP2019-1

研究会情報
研究会 SP  
開催期間 2019-06-13 - 2019-06-13 
開催地(和) 東京工業大学(横浜) 
開催地(英) Tokyo Institute of Technology 
テーマ(和) 音声情報処理とその深層学習の他分野応用/ 深層学習・音声情報処理のための大規模データベース、一般 
テーマ(英)  
講演論文情報の詳細
申込み研究会 SP 
会議コード 2019-06-SP 
本文の言語 日本語 
タイトル(和) DNN音声合成におけるスタイル付与モデル学習法の検討 
サブタイトル(和)  
タイトル(英) A study on style transplantation modeling techniques for DNN-based speech synthesis 
サブタイトル(英)  
キーワード(1)(和/英) DNN音声合成 / DNN-based speech synthesis  
キーワード(2)(和/英) スタイル付与 / style transplant  
キーワード(3)(和/英) i-vector / i-vector  
キーワード(4)(和/英) /  
キーワード(5)(和/英) /  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 蛭田 宜樹 / Yoshiki Hiruta / ヒルタ ヨシキ
第1著者 所属(和/英) 東京工業大学 (略称: 東工大)
Tokyo Institute of Technology (略称: Tokyo Tech)
第2著者 氏名(和/英/ヨミ) 郡山 知樹 / Tomoki Koriyama /
第2著者 所属(和/英) 東京大学 (略称: 東大)
The University of Tokyo (略称: The Univ. of Tokyo)
第3著者 氏名(和/英/ヨミ) 太刀岡 勇気 / Yuuki Tachioka / タチオカ ユウキ
第3著者 所属(和/英) デンソーアイティーラボラトリ (略称: デンソーアイティーラボラトリ)
Denso IT Laboratory (略称: Denso IT Lab)
第4著者 氏名(和/英/ヨミ) 小林 隆夫 / Takao Kobayashi / コバヤシ タカオ
第4著者 所属(和/英) 東京工業大学 (略称: 東工大)
Tokyo Institute of Technology (略称: Tokyo Tech)
第5著者 氏名(和/英/ヨミ) / /
第5著者 所属(和/英) (略称: )
(略称: )
第6著者 氏名(和/英/ヨミ) / /
第6著者 所属(和/英) (略称: )
(略称: )
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者
発表日時 2019-06-13 13:30:00 
発表時間 25 
申込先研究会 SP 
資料番号 IEICE-SP2019-1 
巻番号(vol) IEICE-119 
号番号(no) no.80 
ページ範囲 pp.1-6 
ページ数 IEICE-6 
発行日 IEICE-SP-2019-06-06 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会