講演名 2009-07-18
重回帰HMMに基づく自然発話音声の発話様式識別(発音評価,認識,理解,対話,一般)
能勢 隆, 松原 健, 井島 勇祐, 小林 隆夫,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本論文では重回帰隠れマルコフモデル(重回帰HMM)に基づく自然発話音声の発話様式識別と音声認識について検討する.重回帰HMMではモデルの各分布の平均パラメータをスタイルベクトルと呼ばれる低次元のベクトルの重回帰により表現する.スタイルベクトルの各次元はそれぞれ特定の発話様式の表出・強調度合を表しており,入力音声に対してスタイルベクトルを最尤推定することにより発話様式を識別することができる.また,スタイルベクトルを入力発話毎に推定し,推定されたスタイルベクトルによりモデルを更新することにより音声認識においてオンラインで音響モデルを入力音声の発話様式に適応することができる.日本語話し言葉コーパス(CSJ)による評価の結果,学習用の発話がごく少量の場合でも発話様式の識別率は十分高く,また音素認識実験においてもHMMの場合に比べ良好な結果が得られた.
抄録(英) This paper describes speaking style classification and speech recognition for spontaneous speech based on multiple-regression HMM (MRHMM). In MRHMM, the mean vector of each probability density function is given by multiple regression of a low-dimensional vector, called style vector. Each component of the style vector corresponds to the intensity of expressivity of speaking style variation, and the type of speaking style can be classified by estimating the style vector for input speech based on an ML criterion. Moreover, in spontaneous speech recognition, acoustic models are adapted on-line by updating model parameters using the estimated style vector for each input utterance. The performance evaluation using the Corpus of Spontaneous Japanese (CSJ) shows that a high classification rate is obtained even when the amount of available training data is very limited. The effectiveness of the proposed technique is also shown by a phoneme recognition experiment.
キーワード(和) 自然発話音声 / 発話様式識別 / スタイル推定 / モデル適応 / 重回帰HMM
キーワード(英) spontaneous speech / speaking style classification / style estimation / model adaptation / multiple-regression HMM
資料番号 SP2009-46
発行日

研究会情報
研究会 SP
開催期間 2009/7/10(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Speech (SP)
本文の言語 JPN
タイトル(和) 重回帰HMMに基づく自然発話音声の発話様式識別(発音評価,認識,理解,対話,一般)
サブタイトル(和)
タイトル(英) Speaking Style Classification of Spontaneous Speech Using Multiple-Regression HMM
サブタイトル(和)
キーワード(1)(和/英) 自然発話音声 / spontaneous speech
キーワード(2)(和/英) 発話様式識別 / speaking style classification
キーワード(3)(和/英) スタイル推定 / style estimation
キーワード(4)(和/英) モデル適応 / model adaptation
キーワード(5)(和/英) 重回帰HMM / multiple-regression HMM
第 1 著者 氏名(和/英) 能勢 隆 / Takashi NOSE
第 1 著者 所属(和/英) 東京工業大学大学院総合理工学研究科物理情報システム専攻
Interdisciplinary Graduate School of Science and Engineering, Tokyo Institute of Technology
第 2 著者 氏名(和/英) 松原 健 / Takeshi MATSUBARA
第 2 著者 所属(和/英) 東京工業大学大学院総合理工学研究科物理情報システム専攻
Interdisciplinary Graduate School of Science and Engineering, Tokyo Institute of Technology
第 3 著者 氏名(和/英) 井島 勇祐 / Yusuke IJIMA
第 3 著者 所属(和/英) 東京工業大学大学院総合理工学研究科物理情報システム専攻
Interdisciplinary Graduate School of Science and Engineering, Tokyo Institute of Technology
第 4 著者 氏名(和/英) 小林 隆夫 / Takao KOBAYASHI
第 4 著者 所属(和/英) 東京工業大学大学院総合理工学研究科物理情報システム専攻
Interdisciplinary Graduate School of Science and Engineering, Tokyo Institute of Technology
発表年月日 2009-07-18
資料番号 SP2009-46
巻番号(vol) vol.109
号番号(no) 139
ページ範囲 pp.-
ページ数 6
発行日