講演名 | 2015-07-16 回帰木に基づく複数の変換行列を用いた特徴量空間の適応法 金川 裕紀(三菱電機), 太刀岡 勇気(三菱電機), 渡部 晋治(MERL), 石井 純(三菱電機), |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | 特徴量空間での話者適応(fMLLR) は,特徴量ベクトル系列に単一の変換行列を乗算することで実現される.このためfMLLRはデコーディング処理とは独立な,特徴量に関する前処理として実装でき,ガウス混合分布(GMM)と同様にディープ・ニューラルネットワーク(DNN)の音響モデルに対しても適用できる.一方,モデル空間の適応では回帰木に基づく複数の変換行列を用いることで,単一の変換行列を用いるfMLLRよりも高い精度で適応が可能である.しかしこの手法はGMMでの適応に特化しており,GMMでないDNNの音響モデルには適用できないという課題があった.本報では,fMLLRにおける1パスの状態アラインメント情報を用いてフレーム毎に対応する複数の変換行列を対応づけ,それらを用いて事後確率もしくはGMMの混合重みによる重み付け線形和で表現される変換行列で特徴量変換を行う手法を提案する.実験結果から,提案法は従来の単一の変換行列を用いるfMLLRよりもGMMとDNN双方の音響モデルで単語誤り率を改善し,またモデル適応の場合と同程度の性能を実現できることがわかった. |
抄録(英) | |
キーワード(和) | 音声認識 / 適応 / 特徴量変換 / ディープ・ニューラルネットワーク |
キーワード(英) | speech recognition / adaptation / feature-space transformation / deep neural network |
資料番号 | SP2015-40 |
発行日 | 2015-07-09 (SP) |
研究会情報 | |
研究会 | SP / IPSJ-SLP |
---|---|
開催期間 | 2015/7/16(から2日開催) |
開催地(和) | かたくら諏訪湖ホテル |
開催地(英) | Katakura Suwako Hotel |
テーマ(和) | 認識,理解,対話,一般 |
テーマ(英) | Speech recognition and understanding, dialog system, etc. |
委員長氏名(和) | 間野 一則(芝浦工大) / 篠田 浩一(東工大) |
委員長氏名(英) | Kazunori Mano(Shibaura Inst. of Tech.) / Koichi Shinoda(Tokyo Inst. of Tech.) |
副委員長氏名(和) | 北岡 教英(徳島大) |
副委員長氏名(英) | Norihide Kitaoka(Tokushima Univ.) |
幹事氏名(和) | 岩野 公司(東京都市大) / 滝口 哲也(神戸大) / 李 晃伸(名工大) / 南條 浩輝(龍谷大) / 篠原 雄介(東芝) |
幹事氏名(英) | Koji Iwano(Tokyo City Univ.) / Tetsuya Takiguchi(Kobe Univ.) / Akinobu Lee(Nagoya Inst. of Tech.) / Hiroaki Nanjo(Ryukoku Univ.) / Yusuke Shinohara(Toshiba Corp.) |
幹事補佐氏名(和) | 能勢 隆(東北大) / 浅見 太一(NTT) |
幹事補佐氏名(英) | Takashi Nose(Tohoku Univ.) / Taichi Asami(NTT) |
講演論文情報詳細 | |
申込み研究会 | Technical Committee on Speech / Special Interest Group on Spoken Language Processing |
---|---|
本文の言語 | JPN |
タイトル(和) | 回帰木に基づく複数の変換行列を用いた特徴量空間の適応法 |
サブタイトル(和) | |
タイトル(英) | A Feature-Space Adaptation Technique using Regression Tree-based Multiple Transformation Matrices |
サブタイトル(和) | |
キーワード(1)(和/英) | 音声認識 / speech recognition |
キーワード(2)(和/英) | 適応 / adaptation |
キーワード(3)(和/英) | 特徴量変換 / feature-space transformation |
キーワード(4)(和/英) | ディープ・ニューラルネットワーク / deep neural network |
第 1 著者 氏名(和/英) | 金川 裕紀 / Hiroki Kanagawa |
第 1 著者 所属(和/英) | 三菱電機株式会社(略称:三菱電機) Mitsubishi Electric Corporation(略称:Mitsubishi Electric Corp.) |
第 2 著者 氏名(和/英) | 太刀岡 勇気 / Yuuki Tachioka |
第 2 著者 所属(和/英) | 三菱電機株式会社(略称:三菱電機) Mitsubishi Electric Corporation(略称:Mitsubishi Electric Corp.) |
第 3 著者 氏名(和/英) | 渡部 晋治 / Shinji Watanabe |
第 3 著者 所属(和/英) | Mitsubishi Electric Research Laboratories(略称:MERL) Mitsubishi Electric Research Laboratories(略称:MERL) |
第 4 著者 氏名(和/英) | 石井 純 / Jun Ishii |
第 4 著者 所属(和/英) | 三菱電機株式会社(略称:三菱電機) Mitsubishi Electric Corporation(略称:Mitsubishi Electric Corp.) |
発表年月日 | 2015-07-16 |
資料番号 | SP2015-40 |
巻番号(vol) | vol.115 |
号番号(no) | SP-146 |
ページ範囲 | pp.25-30(SP), |
ページ数 | 6 |
発行日 | 2015-07-09 (SP) |