電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
技報オンライン (ESS/通ソ/ISS)
技報アーカイブ (エレソ)
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2017-03-01 12:40
[ポスター講演]DNN音声合成のためのProsodic Word Embeddingの検討
井島勇祐北条伸克増村 亮浅見太一NTT
技報オンラインサービス実施中
抄録 (和) 本論文では,DNN音声合成のための韻律情報の類似性を考慮したWord Embedding(Prosodic Word Embedding)を提案する.これまで提案されているWord EmbeddingをDNN音声合成に用いる手法では,学習データとしてテキストデータのみを使用しており,得られる単語ベクトルは必ずしも単語間の韻律の類似性とは一致しない.そのため,DNN音声合成のための単語ベクトルとして最適ではないという課題がある.この問題に対し,本論文では,Word Embedding用モデルの学習に音声認識用コーパス等のテキストと音声とが対となった大規模音声コーパスを用いることで,単語とその単語の韻律情報との関係性を学習する.得られた単語ベクトルの比較の結果,提案法により得られた単語ベクトルは,テキストデータのみから得られた単語ベクトルより,類似した韻律情報を持つ単語が類似したベクトルを持つことを示す.また,DNN音声合成における客観評価実験により,テキストデータのみから得られた単語ベクトルと比較し,提案法により得られた単語ベクトルを用いることでF0の生成精度が向上することを示す. 
(英) This paper proposed a novel word embeddings with prosodic information (prosodic word embeddings) for DNN-based speech synthesis. There have been several attempts to use word embeddings for DNN-based speech synthesis. However, their word vectors do not necessarily correspond to prosodic similarity because the training data is a large text corpus. To achieve word embeddings which can take prosodic information into account, we utilize a large speech corpus such as speech corpus for automatic speech recognition. By using the corpus, the proposed technique trains the relationship between words and their prosodic information. We perform objective evaluations to compare the performance of the proposed technique with that of the conventional word embeddings. Objective evaluation results indicate that our proposed word embedding technique can generate F0 more accurately compared to the conventional technique.
キーワード (和) 統計的パラメトリック音声合成 / DNN音声合成 / Word Embedding / / / / /  
(英) Statistical parametric speech synthesis / DNN-based speech synthesis / word embeddings / / / / /  
文献情報 信学技報, vol. 116, no. 477, SP2016-104, pp. 153-158, 2017年3月.
資料番号 SP2016-104 
発行日 2017-02-22 (EA, SIP, SP) 
ISSN Print edition: ISSN 0913-5685  Online edition: ISSN 2432-6380

研究会情報
研究会 SP SIP EA  
開催期間 2017-03-01 - 2017-03-02 
開催地(和) 沖縄産業支援センター 
開催地(英) Okinawa Industry Support Center 
テーマ(和) 音声,応用/電気音響,信号処理,一般 
テーマ(英) Speech, Engineering/Electro Acoustics, Signal Processing, and Related Topics 
講演論文情報の詳細
申込み研究会 SP 
会議コード 2017-03-SP-SIP-EA 
本文の言語 日本語 
タイトル(和) DNN音声合成のためのProsodic Word Embeddingの検討 
サブタイトル(和)  
タイトル(英) Prosodic Word Embeddings for DNN-based speech synthesis 
サブタイトル(英)  
キーワード(1)(和/英) 統計的パラメトリック音声合成 / Statistical parametric speech synthesis  
キーワード(2)(和/英) DNN音声合成 / DNN-based speech synthesis  
キーワード(3)(和/英) Word Embedding / word embeddings  
キーワード(4)(和/英) /  
キーワード(5)(和/英) /  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 井島 勇祐 / Yusuke Ijima / イジマ ユウスケ
第1著者 所属(和/英) 日本電信電話株式会社 (略称: NTT)
Nippon Telegraph and Telephone Corporation (略称: NTT)
第2著者 氏名(和/英/ヨミ) 北条 伸克 / Nobukatsu Hojo / ホウジョウ ノブカツ
第2著者 所属(和/英) 日本電信電話株式会社 (略称: NTT)
Nippon Telegraph and Telephone Corporation (略称: NTT)
第3著者 氏名(和/英/ヨミ) 増村 亮 / Ryo Masumura / マスムラ リョウ
第3著者 所属(和/英) 日本電信電話株式会社 (略称: NTT)
Nippon Telegraph and Telephone Corporation (略称: NTT)
第4著者 氏名(和/英/ヨミ) 浅見 太一 / Taichi Asami / アサミ タイチ
第4著者 所属(和/英) 日本電信電話株式会社 (略称: NTT)
Nippon Telegraph and Telephone Corporation (略称: NTT)
第5著者 氏名(和/英/ヨミ) / /
第5著者 所属(和/英) (略称: )
(略称: )
第6著者 氏名(和/英/ヨミ) / /
第6著者 所属(和/英) (略称: )
(略称: )
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
講演者
発表日時 2017-03-01 12:40:00 
発表時間 90 
申込先研究会 SP 
資料番号 IEICE-EA2016-109,IEICE-SIP2016-164,IEICE-SP2016-104 
巻番号(vol) IEICE-116 
号番号(no) no.475(EA), no.476(SIP), no.477(SP) 
ページ範囲 pp.153-158 
ページ数 IEICE-6 
発行日 IEICE-EA-2017-02-22,IEICE-SIP-2017-02-22,IEICE-SP-2017-02-22 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会