講演名 | 2007/12/13 波形重畳型音声合成の韻律と音質のためのF0傾きモデルの利用(音声合成・韻律,第9回音声言語シンポジウム) 立花 隆輝, 長野 徹, 西村 雅史, |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | 波形重畳型や波形接続型の音声合成では、音声素片の接続部分で基本周波数の一貫性が失われることがある。日本語は高低アクセント言語であるため、これは詑りやアクセント型の誤りとして認識される問題となる。特にデータベースサイズが限られているときや、音声コーパス設計時に考慮していた想定ドメイン以外の文章でそのような問題が顕著になりやすい。本論文では、まずF0傾きモデルを用い音声素片のF0の一貫性を向上する。さらにF0傾きモデルも利用したF0修正量探索により、適切な素片が見つからない場合にも一貫性の回復を行う。これにより入力文章の想定ドメイン内外に関わらず、音声素片の音質を活かしつつ軍しい高低アクセントで合成できるようになる。 |
抄録(英) | A problem with concatenative text-to-speech synthesis is that it sometimes fails to preserve the appropriate consistency in the F0 contours at the concatenation points of the speech segments. Since Japanese is a pitch accent language, listeners perceive inconsistency in F0 contours as strange accents or wrong accent nuclei. Such problems occur more frequently when the database size is limited or when synthesizing voices for texts in new application domains. In this paper, we propose an F0 gradient model and F0 adjustment to select consistent speech segments and to restore the consistency by adjusting the F0 values only where necessary. This makes it possible to generate synthetic voices with correct pitch accents while taking advantages of the acoustic quality of the recorded speech segments even in new application domains. |
キーワード(和) | 波形重畳型音声合成 / 韻律 / 基本周波数 / アクセント |
キーワード(英) | Concatenative Text-to-Speech Synthesis / Prosody / Fundamental Frequency / Pitch Accent |
資料番号 | NLC2007-76,SP2007-139 |
発行日 |
研究会情報 | |
研究会 | NLC |
---|---|
開催期間 | 2007/12/13(から1日開催) |
開催地(和) | |
開催地(英) | |
テーマ(和) | |
テーマ(英) | |
委員長氏名(和) | |
委員長氏名(英) | |
副委員長氏名(和) | |
副委員長氏名(英) | |
幹事氏名(和) | |
幹事氏名(英) | |
幹事補佐氏名(和) | |
幹事補佐氏名(英) |
講演論文情報詳細 | |
申込み研究会 | Natural Language Understanding and Models of Communication (NLC) |
---|---|
本文の言語 | ENG |
タイトル(和) | 波形重畳型音声合成の韻律と音質のためのF0傾きモデルの利用(音声合成・韻律,第9回音声言語シンポジウム) |
サブタイトル(和) | |
タイトル(英) | F0 Gradient Model for Acoustic Quality and F0 Consistency of Concatenative TTS |
サブタイトル(和) | |
キーワード(1)(和/英) | 波形重畳型音声合成 / Concatenative Text-to-Speech Synthesis |
キーワード(2)(和/英) | 韻律 / Prosody |
キーワード(3)(和/英) | 基本周波数 / Fundamental Frequency |
キーワード(4)(和/英) | アクセント / Pitch Accent |
第 1 著者 氏名(和/英) | 立花 隆輝 / Ryuki TACHIBANA |
第 1 著者 所属(和/英) | 日本アイ・ビー・エム東京基礎研究所 Tokyo Research Lab., IBM Japan |
第 2 著者 氏名(和/英) | 長野 徹 / Tohru NAGANO |
第 2 著者 所属(和/英) | 日本アイ・ビー・エム東京基礎研究所 Tokyo Research Lab., IBM Japan |
第 3 著者 氏名(和/英) | 西村 雅史 / Masafumi NISHIMURA |
第 3 著者 所属(和/英) | 日本アイ・ビー・エム東京基礎研究所 Tokyo Research Lab., IBM Japan |
発表年月日 | 2007/12/13 |
資料番号 | NLC2007-76,SP2007-139 |
巻番号(vol) | vol.107 |
号番号(no) | 405 |
ページ範囲 | pp.- |
ページ数 | 6 |
発行日 |