講演名 1998/11/19
韻律を考慮した音声素片を用いる日本語テキスト音声合成
石川 泰, 中島 邦男,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) テキスト音声合成における音韻パラメータの生成方式について述べる。一般に、規則合成の音韻生成では、与えられた音素記号列に対する音韻パラメータの生成が課題とされるが、自然音声では、音韻パラメータの変動要因は多種多様である。そこで、我々は韻律パラメータと音韻パラメータの関係を明確化し、音韻制御に韻律パラメータを利用することを検討している。合成単位として音韻環境のみを考慮した音素パタンを利用する場合と、韻律を考慮したパタンを用いる場合を比較する実験を行った。自然音声の母音および撥音について、同一の音素環境の平均パタンと、ピッチ周期、パワ、継続時間長のそれぞれが閾値以内のデータの平均パタンとのスペクトル歪みを分析したところ、後者を用いた場合、歪みが減少し、特にピッチ周期、パワをパラメータとして合成単位を作成した場合に良好な結果が得られることが確認され、方式の有効性が示された。
抄録(英) In this paper, we describe a method of spectral control in text-to-speech systems for Japanese. In general only phonetic context is considered as a factor of speech generation in TTS systems. However, there are many factors of spectral variation in natural speech. Our basic idea is introducing prosodicfeatures into spectral control. We carried out experiments in order to make relation between prosody and spectral characteristics clear. Spectral distortion between vowel segments in natural speech and synthetic units analyzed. The results show that spectral distortion is reduced when synthetic units considering prosodic parameters are used, and that pitch frequency and power are more effective than duration as a factor of selection of synthetic units. These results strongly suggests that high quality synthetic speech can be generated by TTS systems with synthetic units considering prosodic parameters.
キーワード(和) テキスト音声合成 / 音韻制御 / 音声素片 / 音素モデル / 韻律 / 品質
キーワード(英) text to speech synthesis / spectral control / synthetic unit / phoneme model / prosody / quality of synthetic speach
資料番号 SP98-82
発行日

研究会情報
研究会 SP
開催期間 1998/11/19(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Speech (SP)
本文の言語 JPN
タイトル(和) 韻律を考慮した音声素片を用いる日本語テキスト音声合成
サブタイトル(和)
タイトル(英) Prosody and Synthetic Units for Text-to-Speech Systems for Japanese
サブタイトル(和)
キーワード(1)(和/英) テキスト音声合成 / text to speech synthesis
キーワード(2)(和/英) 音韻制御 / spectral control
キーワード(3)(和/英) 音声素片 / synthetic unit
キーワード(4)(和/英) 音素モデル / phoneme model
キーワード(5)(和/英) 韻律 / prosody
キーワード(6)(和/英) 品質 / quality of synthetic speach
第 1 著者 氏名(和/英) 石川 泰 / Yasushi Ishikawa
第 1 著者 所属(和/英) 三菱電機株式会社 情報技術総合研究所
Information Technology R&D Center, MITSUBISHI Electric Corporation
第 2 著者 氏名(和/英) 中島 邦男 / Kunio Nakajima
第 2 著者 所属(和/英) 三菱電機株式会社 情報技術総合研究所
Information Technology R&D Center, MITSUBISHI Electric Corporation
発表年月日 1998/11/19
資料番号 SP98-82
巻番号(vol) vol.98
号番号(no) 423
ページ範囲 pp.-
ページ数 6
発行日