講演名 2018-12-07
音声による感情推定のための仮想敵対的学習によるモデル平滑化
桑原 豊明(電通大), 清 雄一(電通大), 田原 康之(電通大), 大須賀 昭彦(電通大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 音声による感情推定は深層学習の発展に伴い、より高い精度での推定を可能としている。しかし深層学習を用いた感情推定の多くは教師有学習が用いられており、学習に用いるデータセットを多量に確保することが困難であるといった問題が存在する。また、訓練データの環境と実際のデータの環境が大きく異なる場合、感情推定の精度が大きく低下してしまうことが課題として考えられている。そこで、両課題を解決するためのアプローチとして、本研究では半教師学習である仮想敵対的学習(Virtual adversarial training:VAT)を用いて、生成する感情推定モデルの平滑化を行い、モデルの堅牢性向上を図った。VATは学習において微小かつ意図的なノイズを訓練データに加えて、生成モデルの平滑化を行う手法として、機械学習での注目が高まっている。初めにシングルコーパスによる検証によりVATにおけるハイパーパラメータを設定し、次にクロスコーパスによる評価実験を行うことにより生成したモデルの堅牢性向上を示した。
抄録(英) The emotion estimation by speech makes it possible to estimate with higher precision with the development of deep learning. However, most of the emotion estimation using deep learning is using supervised learning, and there is a problem that it is difficult to secure a large amount of data set used for learning. In addition, when the training data environment and the actual data environment are significantly different, it is considered as a problem that the accuracy of emotion estimation greatly deteriorates. Therefore, as an approach to solve both problems, in this research, smoothing of the generated emotion estimation model is performed using virtual adversal training (VAT), semi-teacher learning, and the robustness of the model Improvement was aimed. VAT attracts attention in machine learning as a method of smoothing a generation model by adding minute and intentional perturbation to training data in learning. We first showed improvement of robustness of model generated by setting hyperparameter in VAT by verification with single corpus and then performing evaluation experiment with cross corpus.
キーワード(和) 深層学習 / クロスコーパス / 仮想敵対訓練 / 感情認識 / 音声処理
キーワード(英) Deep Learning / Cross Corpus / Virtual Adversarial Training / Emotion Recognition / Speech Processing
資料番号 AI2018-30
発行日 2018-11-30 (AI)

研究会情報
研究会 AI
開催期間 2018/12/7(から2日開催)
開催地(和) 九州大学 伊都キャンパス
開催地(英)
テーマ(和) 「コンテキストを意識した知識の利用」および一般
テーマ(英)
委員長氏名(和) 峯 恒憲(九大)
委員長氏名(英) Tsunenori Mine(Kyushu Univ.)
副委員長氏名(和) 片上 大輔(東京工芸大) / 福田 直樹(静岡大)
副委員長氏名(英) Daisuke Katagami(Tokyo Polytechnic Univ.) / Naoki Fukuta(Shizuoka Univ.)
幹事氏名(和) 服部 宏充(立命館大) / 清 雄一(電通大)
幹事氏名(英) Hiromitsu Hattori(Ritsumeikan Univ.) / Yuichi Sei(Univ. of Electro-Comm.)
幹事補佐氏名(和) 櫻井 祐子(産総研)
幹事補佐氏名(英) Yuko Sakurai(AIST)

講演論文情報詳細
申込み研究会 Technical Committee on Artificial Intelligence and Knowledge-Based Processing
本文の言語 JPN-ONLY
タイトル(和) 音声による感情推定のための仮想敵対的学習によるモデル平滑化
サブタイトル(和)
タイトル(英)
サブタイトル(和)
キーワード(1)(和/英) 深層学習 / Deep Learning
キーワード(2)(和/英) クロスコーパス / Cross Corpus
キーワード(3)(和/英) 仮想敵対訓練 / Virtual Adversarial Training
キーワード(4)(和/英) 感情認識 / Emotion Recognition
キーワード(5)(和/英) 音声処理 / Speech Processing
第 1 著者 氏名(和/英) 桑原 豊明 / Toyoaki Kuwahara
第 1 著者 所属(和/英) 電気通信大学(略称:電通大)
The University of Electro-Communications(略称:UEC)
第 2 著者 氏名(和/英) 清 雄一 / Yuichi Sei
第 2 著者 所属(和/英) 電気通信大学(略称:電通大)
The University of Electro-Communications(略称:UEC)
第 3 著者 氏名(和/英) 田原 康之 / Yasuyuki Tahara
第 3 著者 所属(和/英) 電気通信大学(略称:電通大)
The University of Electro-Communications(略称:UEC)
第 4 著者 氏名(和/英) 大須賀 昭彦 / Akihiko Ohsuga
第 4 著者 所属(和/英) 電気通信大学(略称:電通大)
The University of Electro-Communications(略称:UEC)
発表年月日 2018-12-07
資料番号 AI2018-30
巻番号(vol) vol.118
号番号(no) AI-350
ページ範囲 pp.25-29(AI),
ページ数 5
発行日 2018-11-30 (AI)