講演名 2004/10/22
生理学的発話機構モデルを用いてQuantal theoryを考慮した音声から発話状態の推定(<特集>福祉と音声処理及び一般)
錦戸 信和, 党 建武,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 音声から発話状態の逆推定を行う場合、多意性の問題に直面する。3次元の生理学的発話機構モデルを用いる逆推定の手法は、複数の拘束条件が有機的に結合することにより逆推定における多意性を抑えているが、根本的には問題は解決されていない。この多意性に対してわれわれは、複数の発話状態により構成される調音空間内の全域を探索し、推定された発話状態が調音空間内の不安定な領域となることを回避することにより多意性を抑えることが出来ると考える。しかし、調音空間の全探索を行うためには前もって発話状態の分布、及びその発話状態と音声の音響特性との関連を調べる必要があり、その関連を明らかにするために、本稿では発話機構モデルを用いたシミュレーションを行った。その結果、調音空間における調音パラメータの分布について妥当な結果を得たが、F1とF2からなる音響空間においては、一部の母音に対して十分な分布を得る事ができなかった。また、日本語母音/a/の舌の形状の分布と音響パラメータの関係がQuantal theoryを裏付けている事を示した。
抄録(英) Inverse estimation of articulation from speech sounds faces the problem of one-to-many. The method of inverse estimation of articulation from speech sounds with a physiological articulatory model can constrain the one-to-many problem to some extent by combining the spatial, dynamical and physiological constraint, but the problem basically is not solved. However, the one-to-many problem can be further reduced by distinguishing the global optimum and local optimum in articulatory space. To do so, we clarify the distribution of articulation in whole articulatory space and investigate the relation between the articulatory and acoustical characteristics of speech sounds. A reasonable result was obtained for the distribution of articulatory parameter in articulatory space, while the acoustical space is not completely consistent with the observations. Moreover, the relation between the distribution of articulatory point for Japanese vowel /a/ and the distribution of acoustical parameter indicated to support Quantal theory.
キーワード(和) 音声生成 / 調音モデル / 生理学的モデル / 逆推定 / Quantal Theory
キーワード(英) Speech Production / Articulatory Model / Physiological Model / Inverse Estimation / Quantal Theory
資料番号 SP2004-69,WIT2004-50
発行日

研究会情報
研究会 WIT
開催期間 2004/10/22(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Well-being Information Technology(WIT)
本文の言語 JPN
タイトル(和) 生理学的発話機構モデルを用いてQuantal theoryを考慮した音声から発話状態の推定(<特集>福祉と音声処理及び一般)
サブタイトル(和)
タイトル(英) Estimation of articulation from speech sounds considering the Quantal theory via a physiological articulatory model
サブタイトル(和)
キーワード(1)(和/英) 音声生成 / Speech Production
キーワード(2)(和/英) 調音モデル / Articulatory Model
キーワード(3)(和/英) 生理学的モデル / Physiological Model
キーワード(4)(和/英) 逆推定 / Inverse Estimation
キーワード(5)(和/英) Quantal Theory / Quantal Theory
第 1 著者 氏名(和/英) 錦戸 信和 / Akikazu NISHIKIDO
第 1 著者 所属(和/英) 北陸先端科学技術大学院大学情報科学研究科
School of Information Science, Japan Advanced Institute of Science and Technology
第 2 著者 氏名(和/英) 党 建武 / Jianwu DANG
第 2 著者 所属(和/英) ATR人間情報科学研究所
ATR Human Information Science Labs
発表年月日 2004/10/22
資料番号 SP2004-69,WIT2004-50
巻番号(vol) vol.104
号番号(no) 389
ページ範囲 pp.-
ページ数 6
発行日