DNNとRFのスタッキングを用いた感情音声分類

田名網 那由多; 林 実

講演名	2019-10-26 DNNとRFのスタッキングを用いた感情音声分類田名網那由多(明星大), 林実(明星大),
PDFダウンロードページ	PDFダウンロードページへ
抄録(和)	感情音声分類において，従来はサポートベクターマシン（SVM）を用いることが一般的であったが，最近ではディープニューラルネットワーク（DNN）での分類についての研究もおこなわれてきている．それらは DNN 一つのみで行われていることが多いが，一方で分類問題において複数の識別器を用いてアンサンブル学習を行うことにより精度の向上が見込めることは知られている．そこで，本研究では，DNNとランダムフォレスト（RF）を用いてアンサンブル学習の一つであるスタッキングを行い，SVM，DNN との比較・検討を行った．その結果，DNN と RF をスタッキングさせた手法は SVM と比べて 10.42％，DNN と比べて 3.71％の精度の向上が確認できた．
抄録(英)	Conventionally, support vector machine (SVM) has been used for emotional speech classification. Recently, however, research on classification using deep neural network (DNN) has also been conducted. In many cases, they performed only by one DNN, but it is known that accuracy improvement can be expected by performing ensemble learning using a plurality of classifiers in a classification problem. Therefore, in this study, stacking, one of ensemble learning, performed using DNN and random forest (RF) and compared with SVM and DNN. The result of this study indicate that stacking DNN and RF was 10.42% higher than SVM and 3.71% higher than DNN.
キーワード(和)	感情音声 / ディープニューラルネットワーク / ランダムフォレスト
キーワード(英)	Emotional Speech / Deep neural network / Random Forest
資料番号	HCS2019-42
発行日	2019-10-19 (HCS)

研究会情報
研究会	HCS
開催期間	2019/10/26(から1日開催)
開催地（和）	日本大学三軒茶屋キャンパス
開催地（英）	Nihon Univ.
テーマ（和）	「コミュニケーションと食および一般」
テーマ（英）
委員長氏名（和）	松田昌史(NTT)
委員長氏名（英）	Masafumi Matsuda(NTT)
副委員長氏名（和）	井上智雄(筑波大) / 林勇吾(立命館大)
副委員長氏名（英）	Tomoo Inoue(Univ. of Tsukuba) / Yugo Hayashi(Ritsumeikan Univ.)
幹事氏名（和）	渡邊伸行(金沢工大) / 小森政嗣(阪電通大) / 吉田悠(NEC)
幹事氏名（英）	Nobuyuki Watanabe(Kanazawa Inst. of Tech.) / Masashi Komori(Osaka Electro-Comm. Univ.) / Haruka Yoshida(NEC)
幹事補佐氏名（和）	神田智子(大阪工業大学) / 高嶋和毅(東北大) / 藤原健(阪経済大) / 寺田和憲(岐阜大) / 木村敦(日大) / 黄宏軒(理研)
幹事補佐氏名（英）	Tomoko Kanda(Osaka Inst. of Tech.) / Kazuki Takashima(Tohoku Univ.) / Ken Fujiwara(Osaka Univ. of Economic) / Kazunori Terada(Gifu Univ.) / Atsushi Kimura(Nihon Univ.) / HUANG HUNGHSUAN(Riken)

講演論文情報詳細
申込み研究会	Technical Committee on Human Communication Science
本文の言語	JPN
タイトル（和）	DNNとRFのスタッキングを用いた感情音声分類
サブタイトル（和）
タイトル（英）	Emotional speech classification using DNN and RF stacking
サブタイトル（和）
キーワード(1)（和/英）	感情音声 / Emotional Speech
キーワード(2)（和/英）	ディープニューラルネットワーク / Deep neural network
キーワード(3)（和/英）	ランダムフォレスト / Random Forest
第 1 著者氏名（和/英）	田名網那由多 / Nayuta Tanaami
第 1 著者所属（和/英）	明星大学(略称：明星大) Meisei University(略称：Meisei Univ.)
第 2 著者氏名（和/英）	林実 / Minoru Hayashi
第 2 著者所属（和/英）	明星大学(略称：明星大) Meisei University(略称：Meisei Univ.)
発表年月日	2019-10-26
資料番号	HCS2019-42
巻番号（vol）	vol.119
号番号（no）	HCS-252
ページ範囲	pp.11-15(HCS),
ページ数	5
発行日	2019-10-19 (HCS)