講演抄録/キーワード |
講演名 |
2021-06-19 15:00
局所的な句構造の情報を用いたニューラル音声合成 ○海木延佳・サクティ サクリアニ・中村 哲(奈良先端大) SP2021-23 |
抄録 |
(和) |
自然な韻律をもつ日本語音声を合成するため、局所的な句構造に基づくフレーズ成分を表す韻律記号をend-to-end音声合成に新たに導入すること提案する.本稿では、フレーズ成分を表現するために、1)句境界に係り受けの深さを表す韻律記号を追加するモデルと、2)韻律生成制御機構に基づき、フレーズ成分とアクセント成分の重畳型モデルを反映させた韻律記号を採用するの2つのモデルを提案する.この2つのモデルを用いた音声合成により,右枝分かれ境界において、1)フレーズ境界を示すポーズが生成されること.2)F0のフレーズ成分の立て直しが生じることが観察された.アクセント成分のみの韻律記号を用いた従来モデルに対し、これら2つの提案モデルの効果を検証するため対比較の聴取実験を行った.この結果、日本語end-to-end音声合成に文の局所的な句境界の情報や、韻律の生成モデルを取り入れることにより、発話者の意図をより正しく反映した自然な韻律を持つ合成音声が生成できることが確認された. |
(英) |
In order to synthesize Japanese speech with natural prosody, we introduce an end-to-end TTS with new prosodic symbol representing phrase components based on local phrase dependency structures to end-to-end text-to-speech synthesis (TTS). In this paper, we propose two TTS models: 1) a model with prosodic symbols that represent the depth at phrase boundaries, and 2) a model with prosodic symbols that reflects a folded model of phrase and accent components based on a prosodic generation control mechanism. In synthesized speech at left-branching boundary using these two models, 1) pause indicating the phrase boundary is generated. 2) the re-rebuilding phrase component of F0 may occur. To verify the effect of these two proposed models on a conventional model using prosodic symbols using only accent components, we conducted a subjective evaluation on the AB test. As a result, it was confirmed that by using local phrase boundary information of sentences and prosodic generation model in Japanese end-to-end text-to-speech synthesis, synthetic speech with more natural prosody that reflects the intention of the utterance could be generated. |
キーワード |
(和) |
ニューラルend-to-endテキスト音声合成 / 局所的な句構造 / 韻律記号 / / / / / |
(英) |
Neural end-to-end text-to-speech speech synthesis / Local phrase dependency structure / Prosodic symbol / / / / / |
文献情報 |
信学技報, vol. 121, no. 66, SP2021-23, pp. 107-112, 2021年6月. |
資料番号 |
SP2021-23 |
発行日 |
2021-06-11 (SP) |
ISSN |
Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
SP2021-23 |