講演名 2015-07-16
識別的アプローチによる分布間距離推定の検討とその言語識別への応用
柏木 陽佑(東大), 張 聡穎(東大), 齋藤 大輔(東大), 峯松 信明(東大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本稿では,識別的なアプローチによる分布間距離の推定法について提案し,言語識別タスクへの応用を検討する.分布間距離はパターン認識において広く用いられている.分布間距離は確率密度関数に対する汎関数として定義されるため,特徴量の分布形状を仮定して計算するのが一般的である.そのため,仮定した分布形状と真の分布とのミスマッチがある場合,二分布間の正しい分布間距離とは誤差が生じる.提案手法では,ベイズの定理を用いることで,識別モデルを利用して分布間距離を推定する.この際,ニューラルネットワークに代表される,分布の形状を仮定しないモデルを識別モデルとして導入することにより,明示的に分布形状を仮定せずに分布間距離を推定することが可能となる.しかし,分布の形状を仮定しない性質上,特にデータ量が少ない場合,ニューラルネットワークの学習と特徴量空間全体における積分が困難となる.そこで,ニューラルネットワークのモデル適応手法とサンプリングによって観測データの偏りに起因する影響を取り除くことを検討する.観測データ量が少ないことが想定される言語識別タスクへの応用を試み,実験により提案法の有効性を確認した.この推定法を利用して得られた分布間距離を構造的特徴として用いることにより,従来のI-vectorを用いた手法に対して認識率の改善が確認できた.
抄録(英) In this paper, we propose a method for estimating the statistical divergence between probability distributions by a discriminative approach and its use for language identification tasks. Statistical divergence is widely used in pattern recognition. Since statistical divergence is defined as functional of two probability density functions, it has to assume a certain form for these density functions. Then, if there is mismatch between the assumed distribution form and its true distribution, the divergence has to be obtained with errors. In our proposed method, by using Bayes' theorem, we estimate the statistical divergence with a discriminative model. If we use neural network as discriminative model, since it does not require any specific form of distribution, it will be able to estimate the divergence any distribution form. When the amount of data is small, however, it becomes difficult to calculate the integral of a function over all the feature space and to train neural networks. To mitigate this problem, we use a model adaptation method for neural networks and a sampling approach to integrate the function. We apply this approach to language identification tasks, where obtained divergences are used to extract a speech structure. The experimental evaluation results shows our approach can improve the performance compared to the conventional I-vector-based approach.
キーワード(和) ニューラルネットワーク / 分布間距離 / 言語識別 / 音響モデル
キーワード(英) neural networks / divergence between distributions / language identification / acoustic model
資料番号 SP2015-38
発行日 2015-07-09 (SP)

研究会情報
研究会 SP / IPSJ-SLP
開催期間 2015/7/16(から2日開催)
開催地(和) かたくら諏訪湖ホテル
開催地(英) Katakura Suwako Hotel
テーマ(和) 認識,理解,対話,一般
テーマ(英) Speech recognition and understanding, dialog system, etc.
委員長氏名(和) 間野 一則(芝浦工大) / 篠田 浩一(東工大)
委員長氏名(英) Kazunori Mano(Shibaura Inst. of Tech.) / Koichi Shinoda(Tokyo Inst. of Tech.)
副委員長氏名(和) 北岡 教英(徳島大)
副委員長氏名(英) Norihide Kitaoka(Tokushima Univ.)
幹事氏名(和) 岩野 公司(東京都市大) / 滝口 哲也(神戸大) / 李 晃伸(名工大) / 南條 浩輝(龍谷大) / 篠原 雄介(東芝)
幹事氏名(英) Koji Iwano(Tokyo City Univ.) / Tetsuya Takiguchi(Kobe Univ.) / Akinobu Lee(Nagoya Inst. of Tech.) / Hiroaki Nanjo(Ryukoku Univ.) / Yusuke Shinohara(Toshiba Corp.)
幹事補佐氏名(和) 能勢 隆(東北大) / 浅見 太一(NTT)
幹事補佐氏名(英) Takashi Nose(Tohoku Univ.) / Taichi Asami(NTT)

講演論文情報詳細
申込み研究会 Technical Committee on Speech / Special Interest Group on Spoken Language Processing
本文の言語 JPN
タイトル(和) 識別的アプローチによる分布間距離推定の検討とその言語識別への応用
サブタイトル(和)
タイトル(英) A study on discriminative approach for estimation of the divergence between distributions and its application to language identification
サブタイトル(和)
キーワード(1)(和/英) ニューラルネットワーク / neural networks
キーワード(2)(和/英) 分布間距離 / divergence between distributions
キーワード(3)(和/英) 言語識別 / language identification
キーワード(4)(和/英) 音響モデル / acoustic model
第 1 著者 氏名(和/英) 柏木 陽佑 / Yosuke Kashiwagi
第 1 著者 所属(和/英) 東京大学(略称:東大)
The University of Tokyo(略称:Tokyo Univ.)
第 2 著者 氏名(和/英) 張 聡穎 / Congying Zhang
第 2 著者 所属(和/英) 東京大学(略称:東大)
The University of Tokyo(略称:Tokyo Univ.)
第 3 著者 氏名(和/英) 齋藤 大輔 / Daisuke Saito
第 3 著者 所属(和/英) 東京大学(略称:東大)
The University of Tokyo(略称:Tokyo Univ.)
第 4 著者 氏名(和/英) 峯松 信明 / Nobuaki Minematsu
第 4 著者 所属(和/英) 東京大学(略称:東大)
The University of Tokyo(略称:Tokyo Univ.)
発表年月日 2015-07-16
資料番号 SP2015-38
巻番号(vol) vol.115
号番号(no) SP-146
ページ範囲 pp.13-18(SP),
ページ数 6
発行日 2015-07-09 (SP)