DNNの低ランク近似と識別学習の組み合わせ法

○太刀岡勇気; 渡部晋治; Jonathan Le Roux; John R. Hershey

大会名称
2017年総合大会
大会コ－ド
2017G
開催年
2017
発行日

セッション番号
D-14
セッション名
音声
講演日
2017/3/24
講演場所(会議室等)
共通講義棟北　N501
講演番号
D-14-3
タイトル
DNNの低ランク近似と識別学習の組み合わせ法
著者名
○太刀岡勇気, 渡部晋治, Jonathan Le Roux, John R. Hershey,
キーワード
音声認識, DNN, パラメータ削減
抄録
深層神経回路網(DNN)音響モデルは従来のガウス混合モデル(GMM)を上回る性能を達成しているが，パラメータ数がGMMより多くなることにより，計算コストがGMMよりも増大する．DNNのモデルサイズを縮減するために，特異値分解(SVD)を用いた重み行列の低ランク近似が提案されている．従来の検討はクリーン音声のみであり，ノイズ環境下ではモデル縮減が難しくなる可能性がある．よってこのSVD手法の有効性を騒音残響下音声認識タスクで検証する．加えて，低ランク近似と系列の識別学習を併用する．系列の識別学習はフレーム毎の識別的基準により構築されたDNNの性能を向上させることが知られている．また低ランク近似と系列の識別学習の適用順の影響を調査した．実験により，低ランク近似は騒音下音声認識に有効であり，低ランク近似を先にモデルに適用し，その後に低ランクモデルに対して識別学習を行うと最も効果的であることが分かった．この低ランク識別学習モデルは，モデル縮減しないモデルを識別学習したモデルの性能を上回った．
本文pdf
PDF download PayPerView