講演抄録/キーワード |
講演名 |
2008-07-17 15:40
スタイル推定に基づく音響モデルのオンライン適応手法 ○井島勇祐・橘 誠・能勢 隆・小林隆夫(東工大) SP2008-48 |
抄録 |
(和) |
本論文では,発話様式・感情表現を含んだ音声の認識を行うことを目的に,重回帰HMMに基づく音響モデルの適応手法を提案する.提案法では,重回帰の説明変数として,発話様式・感情表現(スタイル)の表出度合を表す低次元の空間上のベクトル(スタイルベクトル)を使用する.認識時には,まず,入力音声に対しスタイルベクトルを推定する.その後,推定されたスタイルベクトルを用いて,HMMの出力確率分布の新しい平均ベクトルを求めることで,入力音声のスタイルへモデル適応を行う.このスタイルベクトルは発話毎に推定し,各発話に対してモデルのオンライン適応を行う.プロのナレーターが発話した模擬感情音声に対して音素認識実験を行い,スタイル依存モデル,不特定スタイルモデルと認識性能の比較評価を行った.その結果,提案法は不特定スタイルモデルと比較し,11%の誤り削減率が得られた. |
(英) |
We propose a model adaptation technique for emotional speech recognition based on multiple-regression HMM(MR-HMM). We use a low-dimensional vector called style vector which corresponds the degree of expressivity of emotional speech as the explanatory variable of the multiple-regression. First, the value of the style vector for input speech is estimated. Then, using the estimated style vector, new mean vectors of the output probability densities of HMM are adapted to the input style. The style vector is estimated every input utterance, and an on-line adaptation can be done in each utterance. We perform phoneme recognition experiments for professional narrators' acted speech and evaluate the performance by comparing with style-dependent and style-independent models. We show that the proposed technique reduced the error rates by 11% compared with the style-independent model. |
キーワード |
(和) |
音声認識 / 重回帰HMM / 感情音声 / オンライン適応 / スタイル推定 / / / |
(英) |
speech recognition / multiple-regression HMM / emotional speech / on-line adaptation / style estimation / / / |
文献情報 |
信学技報, vol. 108, no. 142, SP2008-48, pp. 31-36, 2008年7月. |
資料番号 |
SP2008-48 |
発行日 |
2008-07-10 (SP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
SP2008-48 |