音声による感情推定のための仮想敵対的学習によるモデル平滑化

桑原 豊明; 清 雄一; 田原 康之; 大須賀 昭彦

講演名	2018-12-07 音声による感情推定のための仮想敵対的学習によるモデル平滑化桑原豊明(電通大), 清雄一(電通大), 田原康之(電通大), 大須賀昭彦(電通大),
PDFダウンロードページ	PDFダウンロードページへ
抄録(和)	音声による感情推定は深層学習の発展に伴い、より高い精度での推定を可能としている。しかし深層学習を用いた感情推定の多くは教師有学習が用いられており、学習に用いるデータセットを多量に確保することが困難であるといった問題が存在する。また、訓練データの環境と実際のデータの環境が大きく異なる場合、感情推定の精度が大きく低下してしまうことが課題として考えられている。そこで、両課題を解決するためのアプローチとして、本研究では半教師学習である仮想敵対的学習(Virtual adversarial training:VAT)を用いて、生成する感情推定モデルの平滑化を行い、モデルの堅牢性向上を図った。VATは学習において微小かつ意図的なノイズを訓練データに加えて、生成モデルの平滑化を行う手法として、機械学習での注目が高まっている。初めにシングルコーパスによる検証によりVATにおけるハイパーパラメータを設定し、次にクロスコーパスによる評価実験を行うことにより生成したモデルの堅牢性向上を示した。
抄録(英)	The emotion estimation by speech makes it possible to estimate with higher precision with the development of deep learning. However, most of the emotion estimation using deep learning is using supervised learning, and there is a problem that it is difficult to secure a large amount of data set used for learning. In addition, when the training data environment and the actual data environment are significantly different, it is considered as a problem that the accuracy of emotion estimation greatly deteriorates. Therefore, as an approach to solve both problems, in this research, smoothing of the generated emotion estimation model is performed using virtual adversal training (VAT), semi-teacher learning, and the robustness of the model Improvement was aimed. VAT attracts attention in machine learning as a method of smoothing a generation model by adding minute and intentional perturbation to training data in learning. We first showed improvement of robustness of model generated by setting hyperparameter in VAT by verification with single corpus and then performing evaluation experiment with cross corpus.
キーワード(和)	深層学習 / クロスコーパス / 仮想敵対訓練 / 感情認識 / 音声処理
キーワード(英)	Deep Learning / Cross Corpus / Virtual Adversarial Training / Emotion Recognition / Speech Processing
資料番号	AI2018-30
発行日	2018-11-30 (AI)

研究会情報
研究会	AI
開催期間	2018/12/7(から2日開催)
開催地（和）	九州大学伊都キャンパス
開催地（英）
テーマ（和）	「コンテキストを意識した知識の利用」および一般
テーマ（英）
委員長氏名（和）	峯恒憲(九大)
委員長氏名（英）	Tsunenori Mine(Kyushu Univ.)
副委員長氏名（和）	片上大輔(東京工芸大) / 福田直樹(静岡大)
副委員長氏名（英）	Daisuke Katagami(Tokyo Polytechnic Univ.) / Naoki Fukuta(Shizuoka Univ.)
幹事氏名（和）	服部宏充(立命館大) / 清雄一(電通大)
幹事氏名（英）	Hiromitsu Hattori(Ritsumeikan Univ.) / Yuichi Sei(Univ. of Electro-Comm.)
幹事補佐氏名（和）	櫻井祐子(産総研)
幹事補佐氏名（英）	Yuko Sakurai(AIST)

講演論文情報詳細
申込み研究会	Technical Committee on Artificial Intelligence and Knowledge-Based Processing
本文の言語	JPN-ONLY
タイトル（和）	音声による感情推定のための仮想敵対的学習によるモデル平滑化
サブタイトル（和）
タイトル（英）
サブタイトル（和）
キーワード(1)（和/英）	深層学習 / Deep Learning
キーワード(2)（和/英）	クロスコーパス / Cross Corpus
キーワード(3)（和/英）	仮想敵対訓練 / Virtual Adversarial Training
キーワード(4)（和/英）	感情認識 / Emotion Recognition
キーワード(5)（和/英）	音声処理 / Speech Processing
第 1 著者氏名（和/英）	桑原豊明 / Toyoaki Kuwahara
第 1 著者所属（和/英）	電気通信大学(略称：電通大) The University of Electro-Communications(略称：UEC)
第 2 著者氏名（和/英）	清雄一 / Yuichi Sei
第 2 著者所属（和/英）	電気通信大学(略称：電通大) The University of Electro-Communications(略称：UEC)
第 3 著者氏名（和/英）	田原康之 / Yasuyuki Tahara
第 3 著者所属（和/英）	電気通信大学(略称：電通大) The University of Electro-Communications(略称：UEC)
第 4 著者氏名（和/英）	大須賀昭彦 / Akihiko Ohsuga
第 4 著者所属（和/英）	電気通信大学(略称：電通大) The University of Electro-Communications(略称：UEC)
発表年月日	2018-12-07
資料番号	AI2018-30
巻番号（vol）	vol.118
号番号（no）	AI-350
ページ範囲	pp.25-29(AI),
ページ数	5
発行日	2018-11-30 (AI)