講演抄録/キーワード |
講演名 |
2015-07-16 16:50
回帰木に基づく複数の変換行列を用いた特徴量空間の適応法 ○金川裕紀・太刀岡勇気(三菱電機)・渡部晋治(MERL)・石井 純(三菱電機) SP2015-40 |
抄録 |
(和) |
特徴量空間での話者適応(fMLLR) は,特徴量ベクトル系列に単一の変換行列を乗算することで実現される.
このためfMLLRはデコーディング処理とは独立な,特徴量に関する前処理として実装でき,ガウス混合分布(GMM)と同様にディープ・ニューラルネットワーク(DNN)の音響モデルに対しても適用できる.
一方,モデル空間の適応では回帰木に基づく複数の変換行列を用いることで,単一の変換行列を用いるfMLLRよりも高い精度で適応が可能である.
しかしこの手法はGMMでの適応に特化しており,GMMでないDNNの音響モデルには適用できないという課題があった.
本報では,fMLLRにおける1パスの状態アラインメント情報を用いてフレーム毎に対応する複数の変換行列を対応づけ,それらを用いて事後確率もしくはGMMの混合重みによる重み付け線形和で表現される変換行列で特徴量変換を行う手法を提案する.
実験結果から,提案法は従来の単一の変換行列を用いるfMLLRよりもGMMとDNN双方の音響モデルで単語誤り率を改善し,またモデル適応の場合と同程度の性能を実現できることがわかった. |
(英) |
(Not available yet) |
キーワード |
(和) |
音声認識 / 適応 / 特徴量変換 / ディープ・ニューラルネットワーク / / / / |
(英) |
speech recognition / adaptation / feature-space transformation / deep neural network / / / / |
文献情報 |
信学技報, vol. 115, no. 146, SP2015-40, pp. 25-30, 2015年7月. |
資料番号 |
SP2015-40 |
発行日 |
2015-07-09 (SP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
SP2015-40 |