講演名 2002/8/23
HMM音素モデルによる自動ラベリングのロバスト性の検討
米澤 朋子, 水野 秀之, 阿部 匡伸,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 我々は音素片接続方式で様々な人の声質や様々な発話様式より音声を合成するため,話者毎/発話様式毎の完全自動による合成単位構築を検討している.本稿では,その第1ステップとしてHMM特定話者モデルによる自動音素ラベリングのロバスト性を検討した.自動音素ラベリングに,メル分割されたフィルタバンクの対数パワーとメルケプストラム係数を用いたHMM音素モデルを用いて比較を行った結果,10チャンネルのメルフィルタバンク係数をパラメータとしたときに,話者性や発話様式によらずロバストなラベリング結果が得られた.また,ラベリング精度が話者性や発話様式の影響を受ける傾向が,音素連鎖によって異なることが明らかになった.
抄録(英) To realize speech synthesis of different speakers and different speech styles, we aim to build a full-automatic phoneme labeling system which sorts out the database of the speech synthesis units including various speakers and speech styles. In Preparation, we experimented automatic labeling with HMM phoneme models from Mel Filter Bank and Mel Cepstrum. First we observed the results with high accuracy of label boundaries from Mel Filter Bank's ten channels. Then we analyzed the results by categorizing them into several chains of phonemes. Second we observed that there are different accuracy among different phoneme chains. Additionally, we observed robust accuracy in some chains depending upon the speakers and speech styles.
キーワード(和) HMM / 音素モデル / 自動ラベリング / メルフィルタバンク / メルケプストラム
キーワード(英) HMM / Phoneme Models / Automatic Labeling / Mel Filter Bank / Mel Cepstrum
資料番号 SP2002-74
発行日

研究会情報
研究会 SP
開催期間 2002/8/23(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Speech (SP)
本文の言語 JPN
タイトル(和) HMM音素モデルによる自動ラベリングのロバスト性の検討
サブタイトル(和)
タイトル(英) Robustness of Automatic Labeling with HMM Phoneme Models
サブタイトル(和)
キーワード(1)(和/英) HMM / HMM
キーワード(2)(和/英) 音素モデル / Phoneme Models
キーワード(3)(和/英) 自動ラベリング / Automatic Labeling
キーワード(4)(和/英) メルフィルタバンク / Mel Filter Bank
キーワード(5)(和/英) メルケプストラム / Mel Cepstrum
第 1 著者 氏名(和/英) 米澤 朋子 / Tomoko YONEZAWA
第 1 著者 所属(和/英) 日本電信電話(株)NTTサイバースペース研究所
NTT Cyber Space Laboratories, NTT Corporation
第 2 著者 氏名(和/英) 水野 秀之 / Hideyuki MIZUNO
第 2 著者 所属(和/英) 日本電信電話(株)NTTサイバースペース研究所
NTT Cyber Space Laboratories, NTT Corporation
第 3 著者 氏名(和/英) 阿部 匡伸 / Masanobu ABE
第 3 著者 所属(和/英) 日本電信電話(株)NTTサイバースペース研究所
NTT Cyber Space Laboratories, NTT Corporation
発表年月日 2002/8/23
資料番号 SP2002-74
巻番号(vol) vol.102
号番号(no) 292
ページ範囲 pp.-
ページ数 6
発行日