講演名 2015-07-16
低ランクDNNのための識別学習
太刀岡 勇気(三菱電機), 渡部 晋治(MERL), ルルー ジョナトン(MERL), ハーシー ジョン(MERL),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 深層神経回路網(DNN)音響モデルは従来のガウス混合モデル(GMM)を上回る性能を達成しているが,パラメータ数がGMMより多くなることにより,計算コストがGMMよりも増大する.DNNのモデルサイズを縮減するために,特異値分解(SVD)を用いた重み行列の低ランク近似が提案されている.従来の検討はクリーン音声のみであり,ノイズ環境下ではモデル縮減が難しくなる可能性がある.よってこのSVD手法の有効性を騒音残響下音声認識タスクで検証する.加えて,低ランク近似と系列の識別学習を併用する.系列の識別学習はフレーム毎の識別的基準により構築されたDNNの性能を向上させることが知られている.また低ランク近似と系列の識別学習の適用順の影響を調査した.実験により,低ランク近似は騒音下音声認識に有効であり,低ランク近似を先にモデルに適用し,その後に低ランクモデルに対して識別学習を行うと最も効果的であることが分かった.この低ランク識別学習モデルは,モデル縮減しないモデルを識別学習したモデルの性能を上回った.
抄録(英) Deep neural network (DNN) acoustic models outperform conventional Gaussian mixture model (GMM) but the number of parameters tends to be larger, leading to higher computational cost than those of GMM. To reduce the size of a DNN model, low-rank approximations of weight matrices, by using singular value decomposition (SVD), have previously been applied. Previous studies only focused on clean speech, whereas under noisy condition model reduction could be difficult. Thus we investigate the effectiveness of this SVD method on noisy reverberated speech recognition task. Furthermore, we combine the low-rank approximation with sequence discriminative training, which further improved the performance of the DNN, which was constructed using a frame-by-frame discriminative criterion. We also investigated the effect of the order of application of the low-rank and sequence discriminative training. Our experiments show that low rank approximation is effective for noisy speech recognition and the most effective combination of discriminative training with model reduction is to apply the low rank approximation to the base model first and then to perform discriminative training on the low-rank model. This low-rank discriminatively trained model outperformed the full discriminatively trained model.
キーワード(和) 音声認識 / 深層神経回路網 / 特異値分解 / モデルサイズ縮減 / 識別学習
キーワード(英) Automatic speech recognition / Deep neural networks / Singular value decomposition / Model size reduction / Discriminative training
資料番号 SP2015-39
発行日 2015-07-09 (SP)

研究会情報
研究会 SP / IPSJ-SLP
開催期間 2015/7/16(から2日開催)
開催地(和) かたくら諏訪湖ホテル
開催地(英) Katakura Suwako Hotel
テーマ(和) 認識,理解,対話,一般
テーマ(英) Speech recognition and understanding, dialog system, etc.
委員長氏名(和) 間野 一則(芝浦工大) / 篠田 浩一(東工大)
委員長氏名(英) Kazunori Mano(Shibaura Inst. of Tech.) / Koichi Shinoda(Tokyo Inst. of Tech.)
副委員長氏名(和) 北岡 教英(徳島大)
副委員長氏名(英) Norihide Kitaoka(Tokushima Univ.)
幹事氏名(和) 岩野 公司(東京都市大) / 滝口 哲也(神戸大) / 李 晃伸(名工大) / 南條 浩輝(龍谷大) / 篠原 雄介(東芝)
幹事氏名(英) Koji Iwano(Tokyo City Univ.) / Tetsuya Takiguchi(Kobe Univ.) / Akinobu Lee(Nagoya Inst. of Tech.) / Hiroaki Nanjo(Ryukoku Univ.) / Yusuke Shinohara(Toshiba Corp.)
幹事補佐氏名(和) 能勢 隆(東北大) / 浅見 太一(NTT)
幹事補佐氏名(英) Takashi Nose(Tohoku Univ.) / Taichi Asami(NTT)

講演論文情報詳細
申込み研究会 Technical Committee on Speech / Special Interest Group on Spoken Language Processing
本文の言語 JPN
タイトル(和) 低ランクDNNのための識別学習
サブタイトル(和)
タイトル(英) Sequence Discriminative Training for Low-Rank Deep Neural Networks
サブタイトル(和)
キーワード(1)(和/英) 音声認識 / Automatic speech recognition
キーワード(2)(和/英) 深層神経回路網 / Deep neural networks
キーワード(3)(和/英) 特異値分解 / Singular value decomposition
キーワード(4)(和/英) モデルサイズ縮減 / Model size reduction
キーワード(5)(和/英) 識別学習 / Discriminative training
第 1 著者 氏名(和/英) 太刀岡 勇気 / Yuuki Tachioka
第 1 著者 所属(和/英) 三菱電機株式会社(略称:三菱電機)
Mitsubishi Electric Corporation(略称:Mitsubishi Electric)
第 2 著者 氏名(和/英) 渡部 晋治 / Shinji Watanabe
第 2 著者 所属(和/英) Mitsubishi Electric Research Laboratories(略称:MERL)
Mitsubishi Electric Research Laboratories(略称:MERL)
第 3 著者 氏名(和/英) ルルー ジョナトン / Jonathan Le Roux
第 3 著者 所属(和/英) Mitsubishi Electric Research Laboratories(略称:MERL)
Mitsubishi Electric Research Laboratories(略称:MERL)
第 4 著者 氏名(和/英) ハーシー ジョン / John Hershey
第 4 著者 所属(和/英) Mitsubishi Electric Research Laboratories(略称:MERL)
Mitsubishi Electric Research Laboratories(略称:MERL)
発表年月日 2015-07-16
資料番号 SP2015-39
巻番号(vol) vol.115
号番号(no) SP-146
ページ範囲 pp.19-24(SP),
ページ数 6
発行日 2015-07-09 (SP)