講演名 2002/7/19
調音データに基づいた調音結合の分析
党 建武, 誉田 雅彰, 本多 清志,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 調音器官間の調音結合は人間の音声生成における自然な現象である。このメカニズムを我々の調音モデルに取り入れるため、本研究では磁気センサーシステムにより計測した3名成人男性話者の調音データに基づいて、連続音声における調音結合の分析を行なった。連続音声から切り出したCVCとVCV音声波に対して調音と音響的な手がかりを用いて各音素の代表的観測点と調音目標(主要な調音点)を決定する。ここで、Vは日本語5母音で、Cは10個の舌尖子音と2個の口蓋子音である。重回帰分析法を用いて先行音素と後続音素の観測点から中心音素の調音目標への影響を分析した。その結果より、中心音素の調音目標は先行音素と後続音素の観測点の線形結合により精度よく表現できることがわかった。母音-舌尖子音-母音の調音運動は、二重母音調音運動と子音の調音運動の二つの独立な成分からなるものとみなすことができる。この観測結果はOhmanの音響分析による結論[2]を支持している。口蓋子音を含む組み合わせを考察したところでは、先行音素の影響は後続音素のそれより若干大きかった。その差は、先行音素を形成する調音器官の運動または変形による残留効果が後続音素への予測の影響より大きいことを示唆している。だたし、この関係は他の組み合わせには確認できなかった。
抄録(英) Coarticulation between the speech organs is a natural phenomenon in human speech. To realize this mechanism in our physiological articulatory model, this study attempts to analyze coarticulation involved in continuous speech based on electromagnetic articulographic (EMA) data recorded from three Japanese male subjects. The representative position in the observations, referred to as target, for each phoneme in CVC and VCV segments out of the sentences is determined using the articulatory and acoustical cues, where V denotes five Japanese vowels, and C represents ten apical and two palatal consonants. A multiple regression analysis was applied to the extracted targets to evaluate "contributions" of the surrounding phonemes to the concerned target. It is found that the target of the central phoneme can be represented by a linear function of the preceding and following phonemes with a high accuracy. The results obtained from the VCV segments with the apicals supports Ohman's conclusion derived from VCV utterances, that is, the articulation can be represented by a basic diphthongal gesture with an independent consonant gesture superimposed on its transitional portion [2]. The result from the segments with palatals suggested that the effects caused by the retention was stronger than that induced by anticipation in the target planning stage, while the relation was not confirmed in the other combinations.
キーワード(和) 音声生成 / 調音運動 / 調音結合 / 音声分析
キーワード(英) speech production / articulatory movement / coarticulation / and speech analysis
資料番号 SP2002-61
発行日

研究会情報
研究会 SP
開催期間 2002/7/19(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Speech (SP)
本文の言語 ENG
タイトル(和) 調音データに基づいた調音結合の分析
サブタイトル(和)
タイトル(英) ANALYSIS OF COARTICULATION BASED ON ELECTROMAGNETIC ARTICULOGRAPHIC DATA
サブタイトル(和)
キーワード(1)(和/英) 音声生成 / speech production
キーワード(2)(和/英) 調音運動 / articulatory movement
キーワード(3)(和/英) 調音結合 / coarticulation
キーワード(4)(和/英) 音声分析 / and speech analysis
第 1 著者 氏名(和/英) 党 建武 / Jianwu DANG
第 1 著者 所属(和/英) 北陸先端科学技術大学院大学:ATR
Japan Advanced Institute of Science and Technology:ATR Human Information Processing Research Labs
第 2 著者 氏名(和/英) 誉田 雅彰 / Masaaki HONDA
第 2 著者 所属(和/英) NTT_CREST
NTT Communication Science Research Labs_CREST
第 3 著者 氏名(和/英) 本多 清志 / Kiyoshi HOND
第 3 著者 所属(和/英) ATR
ATR Human Information Processing Research Labs
発表年月日 2002/7/19
資料番号 SP2002-61
巻番号(vol) vol.102
号番号(no) 248
ページ範囲 pp.-
ページ数 6
発行日