講演名 2014-01-23
変分ベイズ法による特徴量生成を用いた対数線形モデルに基づく話者認識(聴覚・話者認識,音声,言語,対話,一般)
柘植 彬史, 橋本 佳, 南角 吉彦, 徳田 恵一,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 近年,話者認識などの識別問題において,識別モデルに基づく手法が数多く提案されている.識別モデルは,統一された枠組みで様々な特徴量を用いることができるため,識別に有用な特徴量を用意することは重要な課題である.識別モデルに入力する特徴量の一つとして,生成モデルから得られる統計量がある.この統計量は,生成モデルの推定精度に依存するため,識別に有用な統計量を用意するには,高い精度で生成モデルを推定しなければならない.従来,生成モデルの推定基準として,尤度最大化基準や事後確率最大化基準が使用されている.しかし,これらの学習基準は,学習データが十分に得られない場合,モデルの推定精度が低下するという問題がある.これに対して,ベイズ基準では学習データが少ない場合においても高い汎化性能が得られることが知られている.そこで本研究では,ベイズ基準によって推定したガウス混合モデルから得られる統計量を用いた,対数線形モデルに基づく話者認識を提案する.話者認識実験の結果から,提案法は,従来法と比べて低い誤認識率を示し,その有効性を示した.
抄録(英) This paper presents a speaker recognition technique based on log-linear models (LLMs) using Bayesian statistics. Since discriminative models can use various features in the unified framework, preparation of features that are useful for classification is an important problem. Statistics obtained from Gaussian Mixture Models (GMMs) trained by the maximum likelihood method or the maximum a posteriori method are recently used as features for speaker recognition. However, these training methods often occur the over-fitting problem. In this paper, the Bayesian approach is applied to train GMMs and statistics of GMMs in the Bayesian approach are used as features of LLMs. Experimental results show that the proposed LLM-based method significantly improved the identification rates from conventional GMM-based methods.
キーワード(和) 話者認識 / ガウス混合モデル / ベイズ基準 / 対数線形モデル
キーワード(英) speaker recognition / GMM / Bayesian approach / log-linear model
資料番号 SP2013-98
発行日

研究会情報
研究会 SP
開催期間 2014/1/16(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Speech (SP)
本文の言語 JPN
タイトル(和) 変分ベイズ法による特徴量生成を用いた対数線形モデルに基づく話者認識(聴覚・話者認識,音声,言語,対話,一般)
サブタイトル(和)
タイトル(英) Speaker recognition based on log-linear models using feature generation by variational Bayesian method
サブタイトル(和)
キーワード(1)(和/英) 話者認識 / speaker recognition
キーワード(2)(和/英) ガウス混合モデル / GMM
キーワード(3)(和/英) ベイズ基準 / Bayesian approach
キーワード(4)(和/英) 対数線形モデル / log-linear model
第 1 著者 氏名(和/英) 柘植 彬史 / Akifumi TSUGE
第 1 著者 所属(和/英) 名古屋工業大学
Department of Computer Science and Engineering, Nagoya Institute of Technology
第 2 著者 氏名(和/英) 橋本 佳 / Kei HASHIMOTO
第 2 著者 所属(和/英) 名古屋工業大学
Department of Computer Science and Engineering, Nagoya Institute of Technology
第 3 著者 氏名(和/英) 南角 吉彦 / Yoshihiko NANKAKU
第 3 著者 所属(和/英) 名古屋工業大学
Department of Computer Science and Engineering, Nagoya Institute of Technology
第 4 著者 氏名(和/英) 徳田 恵一 / Keiichi TOKUDA
第 4 著者 所属(和/英) 名古屋工業大学
Department of Computer Science and Engineering, Nagoya Institute of Technology
発表年月日 2014-01-23
資料番号 SP2013-98
巻番号(vol) vol.113
号番号(no) 404
ページ範囲 pp.-
ページ数 6
発行日