発話系列を扱う会話音声合成

福岡 維新; 岩田 和彦; 小林 哲則

講演名	2017-01-21 発話系列を扱う会話音声合成福岡維新(早大), 岩田和彦(早大), 小林哲則(早大),
PDFダウンロードページ	PDFダウンロードページへ
抄録(和)	ニュース記事に代表される,あるまとまった量の情報を伝える会話システム向け音声合成器の開発を行った.現在の音声合成の大半は発話の単位で合成を行っており,システム音声が複数の発話からなる際の制御を想定していない.本研究では,発話系列における各発話の位置や役割といった談話構造上の特徴を考慮しながら,文章全体の聞きやすさや了解性を向上させる会話用音声合成器を実現することを試みた.段落ごとに内容を伝える音声データの収集,分析を行い,発話の位置や役割が韻律の変化に大きな影響を与えていることを確認した.また,これらの特徴量を DNN の入力に加えたモデルを作成し,評価実験を行い,客観評価,主観評価ともに提案モデルの有効性を確認することができた.
抄録(英)	We proposed a conversational speech synthesis system that takes account of dialogue structure-based features. Conventional studies of speech synthesis didn’t deal with a sequence of utterances, namely they had treated just one utterance or sentence. We collected and analyzed a conversational speech corpus which a professional voice talent read out. As a result, relationships between prosody and dialogue specific features such as a position and role of utterances were clarified. Then, a DNN-based speech synthesis technique is applied to represent these dialogue-structure-dependent prosodic features. Both objective and subjective experiments proved that the proposed method improves the naturalness of system utterances in mass information transmission.
キーワード(和)	会話音声合成 / DNN音声合成 / 発話系列 / 発話分析
キーワード(英)	conversational speech synthesis / DNN-based speech synthesis / speech sequence / utterance analysis
資料番号	SP2016-74
発行日	2017-01-14 (SP)

研究会情報
研究会	SP
開催期間	2017/1/21(から1日開催)
開催地（和）	東京大学
開催地（英）	The University of Tokyo
テーマ（和）	合成，生成，韻律，音声一般
テーマ（英）	Synthesis, Generation, Prosody, etc.
委員長氏名（和）	間野一則(芝浦工大)
委員長氏名（英）	Kazunori Mano(Shibaura Inst. of Tech.)
副委員長氏名（和）	森大毅(宇都宮大)
副委員長氏名（英）	Hiroki Mori(Utsunomiya Univ.)
幹事氏名（和）	滝口哲也(神戸大) / 西田昌史(静岡大)
幹事氏名（英）	Tetsuya Takiguchi(Kobe Univ.) / Masafumi Nishida(Shizuoka Univ.)
幹事補佐氏名（和）	浅見太一(NTT) / 橋本佳(名工大)
幹事補佐氏名（英）	Taichi Asami(NTT) / Kei Hashimoto(Nagoya Inst. of Tech.)

講演論文情報詳細
申込み研究会	Technical Committee on Speech
本文の言語	JPN
タイトル（和）	発話系列を扱う会話音声合成
サブタイトル（和）
タイトル（英）	Conversational Speech Synthesis dealing with Sequence of Sentences
サブタイトル（和）
キーワード(1)（和/英）	会話音声合成 / conversational speech synthesis
キーワード(2)（和/英）	DNN音声合成 / DNN-based speech synthesis
キーワード(3)（和/英）	発話系列 / speech sequence
キーワード(4)（和/英）	発話分析 / utterance analysis
第 1 著者氏名（和/英）	福岡維新 / Ishin Fukuoka
第 1 著者所属（和/英）	早稲田大学(略称：早大) Waseda University(略称：Waseda Univ.)
第 2 著者氏名（和/英）	岩田和彦 / Kazuhiko Iwata
第 2 著者所属（和/英）	早稲田大学(略称：早大) Waseda University(略称：Waseda Univ.)
第 3 著者氏名（和/英）	小林哲則 / Tetsunori Kobayashi
第 3 著者所属（和/英）	早稲田大学(略称：早大) Waseda University(略称：Waseda Univ.)
発表年月日	2017-01-21
資料番号	SP2016-74
巻番号（vol）	vol.116
号番号（no）	SP-414
ページ範囲	pp.59-64(SP),
ページ数	6
発行日	2017-01-14 (SP)