DNN音声合成における差分特徴量のモデル化を利用したF0制御

山田,修平; 能勢,隆; 伊藤,彰則

お知らせ 2023年度・2024年度学生員会費割引キャンペーン実施中です
お知らせ技術研究報告と和文論文誌Ｃの同時投稿施策(掲載料1割引き)について
お知らせ電子情報通信学会における研究会開催について
お知らせ NEW 参加費の返金について

電子情報通信学会研究会発表申込システム
講演論文詳細

技報閲覧サービス
[ログイン]
技報アーカイブ

トップに戻る

前のページに戻る

[Japanese] / [English]

講演抄録／キーワード
講演名		2016-12-20 15:10 ［ポスター講演］DNN音声合成における差分特徴量のモデル化を利用したF0制御 ○山田修平・能勢　隆・伊藤彰則（東北大） SP2016-55
抄録	（和）	我々は，ユーザが自然かつ直観的に合成音声を変更できる枠組みの``テーラーメイド音声合成''の実現に向けた研究を行っている．これまでに，F0コンテキストを使用したDNNに基づく音声合成におけるF0制御手法を提案した．F0コンテキストは学習データのそれぞれのモーラやアクセント句などのセグメントの相対的なF0を表す．この手法ではコンテキストを用いてF0を相対的に変更できるものの，F0を制御せず通常のtext-to-speechとして使用する際に対数F0の再現性が低下してしまう問題点があった．本稿ではこの問題を解決するため，F0コンテキストを含むコンテキストと差分特徴量の関係をDNNでモデル化する．差分特徴量は通常のDNN音声合成による音声特徴量と自然発話音声の音声特徴量の差分を表す．本稿では，実験によって，F0コンテキストを適切に指定した場合に従来法に比べ対数F0の再現性が向上したことを示す．また提案法を利用することで，通常のDNN音声合成を上回る自然性をもつ合成音声を生成でき，かつセグメント単位での柔軟で直観的なF0制御ができることを示す．
	（英）	We have been developing ``tailor-made speech synthesis,'' a framework which enables users to modify synthetic speech naturally and intuitively. Previously, we proposed an F0 control technique by the F0 context in DNN-based speech synthesis. F0 context represents relative log F0 of training data at the segment (e.g. mora or accent phrase) level. The technique allows users to control relatively the log F0 of synthetic speech by the context. However, when users synthesize speech without F0 control, there is a problem that the naturalness of the synthetic speech degrades compared to that with a standard DNN-based synthesis. In this paper, we use another DNN that models the relationship between context including F0 context and differential features. Differential features represent the difference between acoustic features of the natural speech and the synthetic speech. The experiments showed that when we created F0 context appropriately in proposed method, reproductivity of log F0 improved compared to the conventional method. In this paper, we show that proposed technique enables to synthesize speech more naturally than standard DNN-based speech synthesis and to control F0 flexibly and naturally at the segment level.
キーワード	（和）	DNN音声合成 / モデル学習 / F0制御 / F0コンテキスト / 差分特徴量 / / /
	（英）	DNN-based speech synthesis / Model training / F0 control / F0 context / Differential feature / / /
文献情報		信学技報, vol. 116, no. 378, SP2016-55, pp. 37-42, 2016年12月.
資料番号		SP2016-55
発行日		2016-12-13 (SP)
ISSN		Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380
著作権について		技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します．(許諾番号：10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
査読について		本技術報告は査読を経ていない技術報告であり，推敲を加えられていずれかの場に発表されることがあります．
PDFダウンロード		SP2016-55

研究会情報
研究会	SP IPSJ-SLP NLC IPSJ-NL
開催期間	2016-12-20 - 2016-12-22
開催地（和）	NTT武蔵野研究開発センタ
開催地（英）	NTT Musashino R&D
テーマ（和）	第18回音声言語シンポジウム & 第3回自然言語処理シンポジウム
テーマ（英）	The 18th Spoken Language Symposium & The Third Natural Language Processing Symposium
講演論文情報の詳細
申込み研究会	SP
会議コード	2016-12-SP-SLP-NLC-NL
本文の言語	日本語
タイトル（和）	DNN音声合成における差分特徴量のモデル化を利用したF0制御
サブタイトル（和）
タイトル（英）	F0 control by modeling differential features in DNN-based speech synthesis
サブタイトル（英）
キーワード(1)（和/英）	DNN音声合成 / DNN-based speech synthesis
キーワード(2)（和/英）	モデル学習 / Model training
キーワード(3)（和/英）	F0制御 / F0 control
キーワード(4)（和/英）	F0コンテキスト / F0 context
キーワード(5)（和/英）	差分特徴量 / Differential feature
キーワード(6)（和/英）	/
キーワード(7)（和/英）	/
キーワード(8)（和/英）	/
第1著者氏名（和/英/ヨミ）	山田修平 / Shuhei Yamada / ヤマダシュウヘイ
第1著者所属（和/英）	東北大学 (略称：東北大) Tohoku University (略称： Tohoku Univ.)
第2著者氏名（和/英/ヨミ）	能勢隆 / Takashi Nose / ノセタカシ
第2著者所属（和/英）	東北大学 (略称：東北大) Tohoku University (略称： Tohoku Univ.)
第3著者氏名（和/英/ヨミ）	伊藤彰則 / Akinori Ito / イトウアキノリ
第3著者所属（和/英）	東北大学 (略称：東北大) Tohoku University (略称： Tohoku Univ.)
第4著者氏名（和/英/ヨミ）	/ /
第4著者所属（和/英）	(略称： ) (略称： )
第5著者氏名（和/英/ヨミ）	/ /
第5著者所属（和/英）	(略称： ) (略称： )
第6著者氏名（和/英/ヨミ）	/ /
第6著者所属（和/英）	(略称： ) (略称： )
第7著者氏名（和/英/ヨミ）	/ /
第7著者所属（和/英）	(略称： ) (略称： )
第8著者氏名（和/英/ヨミ）	/ /
第8著者所属（和/英）	(略称： ) (略称： )
第9著者氏名（和/英/ヨミ）	/ /
第9著者所属（和/英）	(略称： ) (略称： )
第10著者氏名（和/英/ヨミ）	/ /
第10著者所属（和/英）	(略称： ) (略称： )
第11著者氏名（和/英/ヨミ）	/ /
第11著者所属（和/英）	(略称： ) (略称： )
第12著者氏名（和/英/ヨミ）	/ /
第12著者所属（和/英）	(略称： ) (略称： )
第13著者氏名（和/英/ヨミ）	/ /
第13著者所属（和/英）	(略称： ) (略称： )
第14著者氏名（和/英/ヨミ）	/ /
第14著者所属（和/英）	(略称： ) (略称： )
第15著者氏名（和/英/ヨミ）	/ /
第15著者所属（和/英）	(略称： ) (略称： )
第16著者氏名（和/英/ヨミ）	/ /
第16著者所属（和/英）	(略称： ) (略称： )
第17著者氏名（和/英/ヨミ）	/ /
第17著者所属（和/英）	(略称： ) (略称： )
第18著者氏名（和/英/ヨミ）	/ /
第18著者所属（和/英）	(略称： ) (略称： )
第19著者氏名（和/英/ヨミ）	/ /
第19著者所属（和/英）	(略称： ) (略称： )
第20著者氏名（和/英/ヨミ）	/ /
第20著者所属（和/英）	(略称： ) (略称： )
講演者	第1著者
発表日時	2016-12-20 15:10:00
発表時間	90分
申込先研究会	SP
資料番号	SP2016-55
巻番号（vol）	vol.116
号番号（no）	no.378
ページ範囲	pp.37-42
ページ数	6
発行日	2016-12-13 (SP)

[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]

IEICE / 電子情報通信学会