講演名 | 2017-01-21 発話系列を扱う会話音声合成 福岡 維新(早大), 岩田 和彦(早大), 小林 哲則(早大), |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | ニュース記事に代表される,あるまとまった量の情報を伝える会話システム向け音声合成器の開発を行っ た.現在の音声合成の大半は発話の単位で合成を行っており,システム音声が複数の発話からなる際の制御を想定し ていない.本研究では,発話系列における各発話の位置や役割といった談話構造上の特徴を考慮しながら,文章全体 の聞きやすさや了解性を向上させる会話用音声合成器を実現することを試みた.段落ごとに内容を伝える音声データ の収集,分析を行い,発話の位置や役割が韻律の変化に大きな影響を与えていることを確認した.また,これらの特 徴量を DNN の入力に加えたモデルを作成し,評価実験を行い,客観評価,主観評価ともに提案モデルの有効性を確 認することができた. |
抄録(英) | We proposed a conversational speech synthesis system that takes account of dialogue structure-based features. Conventional studies of speech synthesis didn’t deal with a sequence of utterances, namely they had treated just one utterance or sentence. We collected and analyzed a conversational speech corpus which a professional voice talent read out. As a result, relationships between prosody and dialogue specific features such as a position and role of utterances were clarified. Then, a DNN-based speech synthesis technique is applied to represent these dialogue-structure-dependent prosodic features. Both objective and subjective experiments proved that the proposed method improves the naturalness of system utterances in mass information transmission. |
キーワード(和) | 会話音声合成 / DNN音声合成 / 発話系列 / 発話分析 |
キーワード(英) | conversational speech synthesis / DNN-based speech synthesis / speech sequence / utterance analysis |
資料番号 | SP2016-74 |
発行日 | 2017-01-14 (SP) |
研究会情報 | |
研究会 | SP |
---|---|
開催期間 | 2017/1/21(から1日開催) |
開催地(和) | 東京大学 |
開催地(英) | The University of Tokyo |
テーマ(和) | 合成,生成,韻律,音声一般 |
テーマ(英) | Synthesis, Generation, Prosody, etc. |
委員長氏名(和) | 間野 一則(芝浦工大) |
委員長氏名(英) | Kazunori Mano(Shibaura Inst. of Tech.) |
副委員長氏名(和) | 森 大毅(宇都宮大) |
副委員長氏名(英) | Hiroki Mori(Utsunomiya Univ.) |
幹事氏名(和) | 滝口 哲也(神戸大) / 西田 昌史(静岡大) |
幹事氏名(英) | Tetsuya Takiguchi(Kobe Univ.) / Masafumi Nishida(Shizuoka Univ.) |
幹事補佐氏名(和) | 浅見 太一(NTT) / 橋本 佳(名工大) |
幹事補佐氏名(英) | Taichi Asami(NTT) / Kei Hashimoto(Nagoya Inst. of Tech.) |
講演論文情報詳細 | |
申込み研究会 | Technical Committee on Speech |
---|---|
本文の言語 | JPN |
タイトル(和) | 発話系列を扱う会話音声合成 |
サブタイトル(和) | |
タイトル(英) | Conversational Speech Synthesis dealing with Sequence of Sentences |
サブタイトル(和) | |
キーワード(1)(和/英) | 会話音声合成 / conversational speech synthesis |
キーワード(2)(和/英) | DNN音声合成 / DNN-based speech synthesis |
キーワード(3)(和/英) | 発話系列 / speech sequence |
キーワード(4)(和/英) | 発話分析 / utterance analysis |
第 1 著者 氏名(和/英) | 福岡 維新 / Ishin Fukuoka |
第 1 著者 所属(和/英) | 早稲田大学(略称:早大) Waseda University(略称:Waseda Univ.) |
第 2 著者 氏名(和/英) | 岩田 和彦 / Kazuhiko Iwata |
第 2 著者 所属(和/英) | 早稲田大学(略称:早大) Waseda University(略称:Waseda Univ.) |
第 3 著者 氏名(和/英) | 小林 哲則 / Tetsunori Kobayashi |
第 3 著者 所属(和/英) | 早稲田大学(略称:早大) Waseda University(略称:Waseda Univ.) |
発表年月日 | 2017-01-21 |
資料番号 | SP2016-74 |
巻番号(vol) | vol.116 |
号番号(no) | SP-414 |
ページ範囲 | pp.59-64(SP), |
ページ数 | 6 |
発行日 | 2017-01-14 (SP) |