講演名 2019-10-26
DNNとRFのスタッキングを用いた感情音声分類
田名網 那由多(明星大), 林 実(明星大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 感情音声分類において,従来はサポートベクターマシン(SVM)を用いることが一般的であったが,最近ではディープニューラルネットワーク(DNN)での分類についての研究もおこなわれてきている.それらは DNN 一つのみで行われていることが多いが,一方で分類問題において複数の識別器を用いてアンサンブル学習を行うことにより精度の向上が見込めることは知られている.そこで,本研究では,DNNとランダムフォレスト(RF)を用いてアンサンブル学習の一つであるスタッキングを行い,SVM,DNN との比較・検討を行った.その結果,DNN と RF をスタッキングさせた手法は SVM と比べて 10.42%,DNN と比べて 3.71%の精度の向上が確認できた.
抄録(英) Conventionally, support vector machine (SVM) has been used for emotional speech classification. Recently, however, research on classification using deep neural network (DNN) has also been conducted. In many cases, they performed only by one DNN, but it is known that accuracy improvement can be expected by performing ensemble learning using a plurality of classifiers in a classification problem. Therefore, in this study, stacking, one of ensemble learning, performed using DNN and random forest (RF) and compared with SVM and DNN. The result of this study indicate that stacking DNN and RF was 10.42% higher than SVM and 3.71% higher than DNN.
キーワード(和) 感情音声 / ディープニューラルネットワーク / ランダムフォレスト
キーワード(英) Emotional Speech / Deep neural network / Random Forest
資料番号 HCS2019-42
発行日 2019-10-19 (HCS)

研究会情報
研究会 HCS
開催期間 2019/10/26(から1日開催)
開催地(和) 日本大学三軒茶屋キャンパス
開催地(英) Nihon Univ.
テーマ(和) 「コミュニケーションと食および一般」
テーマ(英)
委員長氏名(和) 松田 昌史(NTT)
委員長氏名(英) Masafumi Matsuda(NTT)
副委員長氏名(和) 井上 智雄(筑波大) / 林 勇吾(立命館大)
副委員長氏名(英) Tomoo Inoue(Univ. of Tsukuba) / Yugo Hayashi(Ritsumeikan Univ.)
幹事氏名(和) 渡邊 伸行(金沢工大) / 小森 政嗣(阪電通大) / 吉田 悠(NEC)
幹事氏名(英) Nobuyuki Watanabe(Kanazawa Inst. of Tech.) / Masashi Komori(Osaka Electro-Comm. Univ.) / Haruka Yoshida(NEC)
幹事補佐氏名(和) 神田 智子(大阪工業大学) / 高嶋 和毅(東北大) / 藤原 健(阪経済大) / 寺田 和憲(岐阜大) / 木村 敦(日大) / 黄 宏軒(理研)
幹事補佐氏名(英) Tomoko Kanda(Osaka Inst. of Tech.) / Kazuki Takashima(Tohoku Univ.) / Ken Fujiwara(Osaka Univ. of Economic) / Kazunori Terada(Gifu Univ.) / Atsushi Kimura(Nihon Univ.) / HUANG HUNGHSUAN(Riken)

講演論文情報詳細
申込み研究会 Technical Committee on Human Communication Science
本文の言語 JPN
タイトル(和) DNNとRFのスタッキングを用いた感情音声分類
サブタイトル(和)
タイトル(英) Emotional speech classification using DNN and RF stacking
サブタイトル(和)
キーワード(1)(和/英) 感情音声 / Emotional Speech
キーワード(2)(和/英) ディープニューラルネットワーク / Deep neural network
キーワード(3)(和/英) ランダムフォレスト / Random Forest
第 1 著者 氏名(和/英) 田名網 那由多 / Nayuta Tanaami
第 1 著者 所属(和/英) 明星大学(略称:明星大)
Meisei University(略称:Meisei Univ.)
第 2 著者 氏名(和/英) 林 実 / Minoru Hayashi
第 2 著者 所属(和/英) 明星大学(略称:明星大)
Meisei University(略称:Meisei Univ.)
発表年月日 2019-10-26
資料番号 HCS2019-42
巻番号(vol) vol.119
号番号(no) HCS-252
ページ範囲 pp.11-15(HCS),
ページ数 5
発行日 2019-10-19 (HCS)