講演名 2007/12/13
波形重畳型音声合成の韻律と音質のためのF0傾きモデルの利用(音声合成・韻律,第9回音声言語シンポジウム)
立花 隆輝, 長野 徹, 西村 雅史,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 波形重畳型や波形接続型の音声合成では、音声素片の接続部分で基本周波数の一貫性が失われることがある。日本語は高低アクセント言語であるため、これは詑りやアクセント型の誤りとして認識される問題となる。特にデータベースサイズが限られているときや、音声コーパス設計時に考慮していた想定ドメイン以外の文章でそのような問題が顕著になりやすい。本論文では、まずF0傾きモデルを用い音声素片のF0の一貫性を向上する。さらにF0傾きモデルも利用したF0修正量探索により、適切な素片が見つからない場合にも一貫性の回復を行う。これにより入力文章の想定ドメイン内外に関わらず、音声素片の音質を活かしつつ軍しい高低アクセントで合成できるようになる。
抄録(英) A problem with concatenative text-to-speech synthesis is that it sometimes fails to preserve the appropriate consistency in the F0 contours at the concatenation points of the speech segments. Since Japanese is a pitch accent language, listeners perceive inconsistency in F0 contours as strange accents or wrong accent nuclei. Such problems occur more frequently when the database size is limited or when synthesizing voices for texts in new application domains. In this paper, we propose an F0 gradient model and F0 adjustment to select consistent speech segments and to restore the consistency by adjusting the F0 values only where necessary. This makes it possible to generate synthetic voices with correct pitch accents while taking advantages of the acoustic quality of the recorded speech segments even in new application domains.
キーワード(和) 波形重畳型音声合成 / 韻律 / 基本周波数 / アクセント
キーワード(英) Concatenative Text-to-Speech Synthesis / Prosody / Fundamental Frequency / Pitch Accent
資料番号 NLC2007-76,SP2007-139
発行日

研究会情報
研究会 NLC
開催期間 2007/12/13(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Natural Language Understanding and Models of Communication (NLC)
本文の言語 ENG
タイトル(和) 波形重畳型音声合成の韻律と音質のためのF0傾きモデルの利用(音声合成・韻律,第9回音声言語シンポジウム)
サブタイトル(和)
タイトル(英) F0 Gradient Model for Acoustic Quality and F0 Consistency of Concatenative TTS
サブタイトル(和)
キーワード(1)(和/英) 波形重畳型音声合成 / Concatenative Text-to-Speech Synthesis
キーワード(2)(和/英) 韻律 / Prosody
キーワード(3)(和/英) 基本周波数 / Fundamental Frequency
キーワード(4)(和/英) アクセント / Pitch Accent
第 1 著者 氏名(和/英) 立花 隆輝 / Ryuki TACHIBANA
第 1 著者 所属(和/英) 日本アイ・ビー・エム東京基礎研究所
Tokyo Research Lab., IBM Japan
第 2 著者 氏名(和/英) 長野 徹 / Tohru NAGANO
第 2 著者 所属(和/英) 日本アイ・ビー・エム東京基礎研究所
Tokyo Research Lab., IBM Japan
第 3 著者 氏名(和/英) 西村 雅史 / Masafumi NISHIMURA
第 3 著者 所属(和/英) 日本アイ・ビー・エム東京基礎研究所
Tokyo Research Lab., IBM Japan
発表年月日 2007/12/13
資料番号 NLC2007-76,SP2007-139
巻番号(vol) vol.107
号番号(no) 405
ページ範囲 pp.-
ページ数 6
発行日