講演名 2004/10/21
調音運動モデルを用いた声道スペクトルの生成(<特集>福祉と音声処理及び一般)
金 智之, 若宮 幸平, 鏑木 時彦,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 人の音声の発話では,調音器官の運動特性に起因したなまけや,音素環境に依存した調音特徴の変動などが生じる.本研究では,このような調音結合に由来した声道スペクトルの変動を陽な仕組みとして表現するため,調音器官の状態を表すパラメータを基とした声道スペクトルの生成モデルの構築をおこなった.本モデルでは,まず,発話内容を表す音素列に対して,調音タイミングの決定と空間的な調音目標の設定とをおこなう.この調音目標は,各音素を調音する上でより本質的な調音的状態とし,なおかつ,調音パラメータの自由度を部分的にのみ拘束する.残された不確定的な自由度は,発話全体の運動軌道の計算において,隣接する音素の調音目標を滑らかに補間する際に解消される.この調音運動モデルによって,音素環境に依存しない固定的な調音目標から,音素環境に起因した調音運動の変動性を表現することができる.最後に,事前に学習を施したニューラルネットワークを用いて,調音運動より声道スペクトルの推定をおこないモデルの出力とする.
抄録(英) This paper presents a model for generating the vocal-tract spectrum based on an explicit model of the coarticulatory phenomena. The model receives a string of phonemic symbols for which the articulatory target is specified both in the spatial and temporal domains. The spatial target represents features of the articulatory state inherent in the articulation of each phoneme. The phonemic target constrains degrees-of-freedom of the articulatory parameters only partly and some freedoms are remained. Then the trajectory formation model of articulatory movements resolves this redundancy by smoothly interpolating the targets of adjacent phonemes. Thus, our model can represent the variability of articulatory movements from fixed target patterns. Finally, the vocal-tract spectrum is estimated using neural networks learned with the articulatory and acoustic data in advance.
キーワード(和) 音素調音目標 / 調音運動 / 調音結合 / 声道スペクトル / 音声合成
キーワード(英) phonemic articulatory target / articulatory movement / coarticiilation / vocal-tract spectrum / speech synthesis
資料番号 SP2004-66,WIT2004-47
発行日

研究会情報
研究会 WIT
開催期間 2004/10/21(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Well-being Information Technology(WIT)
本文の言語 JPN
タイトル(和) 調音運動モデルを用いた声道スペクトルの生成(<特集>福祉と音声処理及び一般)
サブタイトル(和)
タイトル(英) Generation of the vocal-tract spectrum using a dynamic artieulatory model
サブタイトル(和)
キーワード(1)(和/英) 音素調音目標 / phonemic articulatory target
キーワード(2)(和/英) 調音運動 / articulatory movement
キーワード(3)(和/英) 調音結合 / coarticiilation
キーワード(4)(和/英) 声道スペクトル / vocal-tract spectrum
キーワード(5)(和/英) 音声合成 / speech synthesis
第 1 著者 氏名(和/英) 金 智之 / Jiji KIM
第 1 著者 所属(和/英) 九州大学
Kyushu University
第 2 著者 氏名(和/英) 若宮 幸平 / Kohei WAKAMIYA
第 2 著者 所属(和/英) 九州大学
Kyushu University
第 3 著者 氏名(和/英) 鏑木 時彦 / Tokihiko KABURAGI
第 3 著者 所属(和/英) 九州大学
Kyushu University
発表年月日 2004/10/21
資料番号 SP2004-66,WIT2004-47
巻番号(vol) vol.104
号番号(no) 388
ページ範囲 pp.-
ページ数 6
発行日