講演名 2003/8/14
セグメンテーション誤差最小規準にもとづく音素セグメンテーション用HMMの識別学習(合成, 韻律, 生成, 一般)
, 河井 恒, 倪 晋富 /,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 従来のHMMベースの音素セグメンテーションにおいては,HMMの学習は最尤規準で行われる。これはセグメンテーションの問題が分布の推定に結び付けられていることを意味しており,HMMは音素境界を検出するのではなく音素を検出するように学習される。こうした,学習と使用の間の不一致のために,セグメンテーション精度が損なわれる。そこで本稿では,識別学習を採用し,MSE(Minimum Segmentation Error)と呼ぶ新しい学習規準を導入する。この手法においては,損失関数はセグメンテーション誤差に直接対応するように定義される。全経験的損失関数をGPD(Generalized Probabilistic Descent)アルゴリズムを用いて最小化することにより,セグメンテーション誤差も同時に最小化される。中国語と日本語の音声データを用いて評価実験を行った結果,平均誤差が0.7ms(中国語の場合)ないし1.6ms(日本語の場合)減少し,本手法の有効性が確認された。さらに,HMMの状態数・混合数等が最適化されていない場合においても,本手法は有効であることが示された。
抄録(英) In the conventional HMM-based segmentation method, the HMM training is based on MLE criteria, which links the segmentation task to the problem of distribution estimation. The HMMs are built to identify the phonetic segments, not to detect the boundary. This kind of inconsistency between training and application limited the performance of segmentation. In this paper, we adopt the discriminative training method and introduce a new criterion, named Minimum Segmentation Error (MSE), for HMM training. In this method, a loss function directly related to the segmentation error is defined. By minimizing the overall empirical loss with the Generalized Probabilistic Descent (GPD) algorithm, the segmentation error is also minimized. From the results on both Chinese and Japanese data, the accuracy of segmentation is improved, where the error average is reduced 0.7 ms on Chinese and 1.6 ms on Japanese. Moreover, this method is robust even when we do not have enough knowledge on HMM modeling, e.g. the number of states is not optimized.
キーワード(和) 最小セグメンテーション誤差 / 一般化確率的降下法 / 自動セグメンテーション
キーワード(英) minimum segmentation error / generalized probabilistic descent / automatic segmentation
資料番号 SP2003-66
発行日

研究会情報
研究会 SP
開催期間 2003/8/14(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Speech (SP)
本文の言語 ENG
タイトル(和) セグメンテーション誤差最小規準にもとづく音素セグメンテーション用HMMの識別学習(合成, 韻律, 生成, 一般)
サブタイトル(和)
タイトル(英) MINIMUM SEGMENTATION ERROR BASED DISCRIMINATIVE TRAINING OF HMM FOR AUTOMATIC PHONETIC SEGMENTATION
サブタイトル(和)
キーワード(1)(和/英) 最小セグメンテーション誤差 / minimum segmentation error
キーワード(2)(和/英) 一般化確率的降下法 / generalized probabilistic descent
キーワード(3)(和/英) 自動セグメンテーション / automatic segmentation
第 1 著者 氏名(和/英) / Yi-Jian Wu
第 1 著者 所属(和/英)
ATR, Spoken Language Translation Laboratories
第 2 著者 氏名(和/英) 河井 恒 / Hisashi Kawai
第 2 著者 所属(和/英)
ATR, Spoken Language Translation Laboratories
第 3 著者 氏名(和/英) 倪 晋富 / / Jinfu Ni
第 3 著者 所属(和/英)
ATR, Spoken Language Translation Laboratories
発表年月日 2003/8/14
資料番号 SP2003-66
巻番号(vol) vol.103
号番号(no) 263
ページ範囲 pp.-
ページ数 6
発行日