講演抄録/キーワード |
講演名 |
2014-01-23 16:00
変分ベイズ法による特徴量生成を用いた対数線形モデルに基づく話者認識 ○柘植彬史・橋本 佳・南角吉彦・徳田恵一(名工大) SP2013-98 |
抄録 |
(和) |
近年,話者認識などの識別問題において,識別モデルに基づく手法が数多く提案されている.識別モデルは,統一された枠組みで様々な特徴量を用いることができるため,識別に有用な特徴量を用意することは重要な課題である.識別モデルに入力する特徴量の一つとして,生成モデルから得られる統計量がある.この統計量は,生成モデルの推定精度に依存するため,識別に有用な統計量を用意するには,高い精度で生成モデルを推定しなければならない.従来,生成モデルの推定基準として,尤度最大化基準や事後確率最大化基準が使用されている.しかし,これらの学習基準は,学習データが十分に得られない場合,モデルの推定精度が低下するという問題がある.これに対して,ベイズ基準では学習データが少ない場合においても高い汎化性能が得られることが知られている.そこで本研究では,ベイズ基準によって推定したガウス混合モデルから得られる統計量を用いた,対数線形モデルに基づく話者認識を提案する.話者認識実験の結果から,提案法は,従来法と比べて低い誤認識率を示し,その有効性を示した. |
(英) |
This paper presents a speaker recognition technique based on log-linear models (LLMs) using Bayesian statistics. Since discriminative models can use various features in the unified framework, preparation of features that are useful for classification is an important problem. Statistics obtained from Gaussian Mixture Models (GMMs) trained by the maximum likelihood method or the maximum a posteriori method are recently used as features for speaker recognition. However, these training methods often occur the over-fitting problem. In this paper, the Bayesian approach is applied to train GMMs and statistics of GMMs in the Bayesian approach are used as features of LLMs. Experimental results show that the proposed LLM-based method significantly improved the identification rates from conventional GMM-based methods. |
キーワード |
(和) |
話者認識 / ガウス混合モデル / ベイズ基準 / 対数線形モデル / / / / |
(英) |
speaker recognition / GMM / Bayesian approach / log-linear model / / / / |
文献情報 |
信学技報, vol. 113, no. 404, SP2013-98, pp. 13-18, 2014年1月. |
資料番号 |
SP2013-98 |
発行日 |
2014-01-16 (SP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
SP2013-98 |