講演名 2004/10/21
音素別ニューラルネットワークを用いた調音-音響マッピング : パラメータ学習法の検討(<特集>福祉と音声処理及び一般)
若宮 幸平, 辻 拓哉, 鏑木 時彦,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本論では,発話内容に関する音素情報と,唇,顎,舌,軟口蓋等の調音器官の運動軌道から,声道スペクトル特性を推定する方法について述べる.本推定法では,音素別に構成されたニューラルネットワークによる調音-音響マッピング関数を用いる.音素環境により選択される音素別ニューラルネットワークに調音位置を入力すると,音素依存スペクトルが出力され,調音次元での距離に基づいて連続する音素間でそれらを補間することで,最終的な声道スペクトル特性が推定される.学習時には,音素依存スペクトルの補間を考慮し,各音素の調音時点のデータに加えて,調音時点間に存在するデータもパラメータの学習に用いる.本推定法によるスペクトル推定実験を行った結果,スペクトル歪は3.15dBとなった.
抄録(英) This paper presents a method for estimating the acoustic property of the vocal tract from the position of the articulatory organs, i.e., the jaw, lips, tongue, and soft palate. Our method transforms input articulatory position to the vocal tract spectrum on the basis of phoneme-dependent neural networks. The obtained phoneme-dependent spectra are then interpolated to estimate the tune course of the vocal tract spectrum for the given phonemic context. In addition, the weight in this spectral interpolation is determined on the basis of the distance in the articulatory domain between the input and phoneme-specific articulator positions. For training of these networks, the articulatory-acoustic data pairs taken for continuous utterances are used by taking the spectral interpolation into account. Experimental results showed that the average spectral error in our estimation method is 3.15 dB.
キーワード(和) 調音運動 / ニューラルネットワーク / 声道スペクトル / 調音-音響マッピング
キーワード(英) articulatory movement / neural network / vocal-tract spectrum / articulatory-to-acoustic mapping
資料番号 SP2004-65,WIT2004-46
発行日

研究会情報
研究会 WIT
開催期間 2004/10/21(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Well-being Information Technology(WIT)
本文の言語 JPN
タイトル(和) 音素別ニューラルネットワークを用いた調音-音響マッピング : パラメータ学習法の検討(<特集>福祉と音声処理及び一般)
サブタイトル(和)
タイトル(英) Articulatory-to-Acoustic Mapping Using Phoneme-Dependent Neural Networks : An Investigation on the Parameter Learning Method
サブタイトル(和)
キーワード(1)(和/英) 調音運動 / articulatory movement
キーワード(2)(和/英) ニューラルネットワーク / neural network
キーワード(3)(和/英) 声道スペクトル / vocal-tract spectrum
キーワード(4)(和/英) 調音-音響マッピング / articulatory-to-acoustic mapping
第 1 著者 氏名(和/英) 若宮 幸平 / Kohei WAKAMIYA
第 1 著者 所属(和/英) 九州大学大学院芸術工学研究院
Faculty of Design, Kyushu University
第 2 著者 氏名(和/英) 辻 拓哉 / Takuya TSUJI
第 2 著者 所属(和/英) パイオニア
Pioneer
第 3 著者 氏名(和/英) 鏑木 時彦 / Tokihiko KABURAGI
第 3 著者 所属(和/英) 九州大学大学院芸術工学研究院
Faculty of Design, Kyushu University
発表年月日 2004/10/21
資料番号 SP2004-65,WIT2004-46
巻番号(vol) vol.104
号番号(no) 388
ページ範囲 pp.-
ページ数 6
発行日