講演名 1997/3/7
音声合成におけるネットワークモデルによるポーズ位置予測
海老原 充, 石川 泰,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本報告では規則合成における日本文のポーズ位置推定法について述べる。我々はこれまでに文イントネーションの生成を目的に、言語処理と韻律制御を統合したネットワークモデルを提案した。この手法はネットワークの状態が文の言語的韻律的状態を表し、状態遷移時に韻律パラメータを出力するものである。今回は本モデルを発話中のポーズ位置予測に適用することを試みた。本手法では、ポーズの発生確率をネットワークのノード上に表し、文節系列中のポーズの生起確率を決定するものである。提案手法の有効性を確認するため、1名の話者の400文章で学習を行ったところ、推定精度の高いポーズ位置の予測が可能であることが確認された。
抄録(英) In this paper, we describe a method of pause estimation for Japanese text-to-speech synthesis. We have proposed a network model which integrates prosodic control and syntactic analysis. In a network model, each state represents linguistic and prosodic state of sentence, and a prosodic parameter is generated when taking transition. We applied the proposed prosodic control model to pause estimation. In the model, one node reprenets pause, and every node has transition are to pause node with probability. At each node, pause occurring rate is calculated to decide the pause. The prediction results showed our model can predict pauses in a sentence with high accuracy.
キーワード(和) 音声合成 / ポーズ / プロソディー / ピッチ制御
キーワード(英) speech synthesis / pause / prosody / pitch frequency control
資料番号 SP96-133
発行日

研究会情報
研究会 SP
開催期間 1997/3/7(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Speech (SP)
本文の言語 JPN
タイトル(和) 音声合成におけるネットワークモデルによるポーズ位置予測
サブタイトル(和)
タイトル(英) Pause estimation by network model for text-to-speech synthesis
サブタイトル(和)
キーワード(1)(和/英) 音声合成 / speech synthesis
キーワード(2)(和/英) ポーズ / pause
キーワード(3)(和/英) プロソディー / prosody
キーワード(4)(和/英) ピッチ制御 / pitch frequency control
第 1 著者 氏名(和/英) 海老原 充 / Takashi EBIHARA
第 1 著者 所属(和/英) 三菱電機株式会社 情報技術総合研究所
Information Technology RampD Center, MITSUBISHI Electric Corporation
第 2 著者 氏名(和/英) 石川 泰 / Yasushi ISHIKAWA
第 2 著者 所属(和/英) 三菱電機株式会社 情報技術総合研究所
Information Technology RampD Center, MITSUBISHI Electric Corporation
発表年月日 1997/3/7
資料番号 SP96-133
巻番号(vol) vol.96
号番号(no) 566
ページ範囲 pp.-
ページ数 6
発行日