講演名 | 2019-10-26 DNNとRFのスタッキングを用いた感情音声分類 田名網 那由多(明星大), 林 実(明星大), |
---|---|
PDFダウンロードページ | ![]() |
抄録(和) | 感情音声分類において,従来はサポートベクターマシン(SVM)を用いることが一般的であったが,最近ではディープニューラルネットワーク(DNN)での分類についての研究もおこなわれてきている.それらは DNN 一つのみで行われていることが多いが,一方で分類問題において複数の識別器を用いてアンサンブル学習を行うことにより精度の向上が見込めることは知られている.そこで,本研究では,DNNとランダムフォレスト(RF)を用いてアンサンブル学習の一つであるスタッキングを行い,SVM,DNN との比較・検討を行った.その結果,DNN と RF をスタッキングさせた手法は SVM と比べて 10.42%,DNN と比べて 3.71%の精度の向上が確認できた. |
抄録(英) | Conventionally, support vector machine (SVM) has been used for emotional speech classification. Recently, however, research on classification using deep neural network (DNN) has also been conducted. In many cases, they performed only by one DNN, but it is known that accuracy improvement can be expected by performing ensemble learning using a plurality of classifiers in a classification problem. Therefore, in this study, stacking, one of ensemble learning, performed using DNN and random forest (RF) and compared with SVM and DNN. The result of this study indicate that stacking DNN and RF was 10.42% higher than SVM and 3.71% higher than DNN. |
キーワード(和) | 感情音声 / ディープニューラルネットワーク / ランダムフォレスト |
キーワード(英) | Emotional Speech / Deep neural network / Random Forest |
資料番号 | HCS2019-42 |
発行日 | 2019-10-19 (HCS) |
研究会情報 | |
研究会 | HCS |
---|---|
開催期間 | 2019/10/26(から1日開催) |
開催地(和) | 日本大学三軒茶屋キャンパス |
開催地(英) | Nihon Univ. |
テーマ(和) | 「コミュニケーションと食および一般」 |
テーマ(英) | |
委員長氏名(和) | 松田 昌史(NTT) |
委員長氏名(英) | Masafumi Matsuda(NTT) |
副委員長氏名(和) | 井上 智雄(筑波大) / 林 勇吾(立命館大) |
副委員長氏名(英) | Tomoo Inoue(Univ. of Tsukuba) / Yugo Hayashi(Ritsumeikan Univ.) |
幹事氏名(和) | 渡邊 伸行(金沢工大) / 小森 政嗣(阪電通大) / 吉田 悠(NEC) |
幹事氏名(英) | Nobuyuki Watanabe(Kanazawa Inst. of Tech.) / Masashi Komori(Osaka Electro-Comm. Univ.) / Haruka Yoshida(NEC) |
幹事補佐氏名(和) | 神田 智子(大阪工業大学) / 高嶋 和毅(東北大) / 藤原 健(阪経済大) / 寺田 和憲(岐阜大) / 木村 敦(日大) / 黄 宏軒(理研) |
幹事補佐氏名(英) | Tomoko Kanda(Osaka Inst. of Tech.) / Kazuki Takashima(Tohoku Univ.) / Ken Fujiwara(Osaka Univ. of Economic) / Kazunori Terada(Gifu Univ.) / Atsushi Kimura(Nihon Univ.) / HUANG HUNGHSUAN(Riken) |
講演論文情報詳細 | |
申込み研究会 | Technical Committee on Human Communication Science |
---|---|
本文の言語 | JPN |
タイトル(和) | DNNとRFのスタッキングを用いた感情音声分類 |
サブタイトル(和) | |
タイトル(英) | Emotional speech classification using DNN and RF stacking |
サブタイトル(和) | |
キーワード(1)(和/英) | 感情音声 / Emotional Speech |
キーワード(2)(和/英) | ディープニューラルネットワーク / Deep neural network |
キーワード(3)(和/英) | ランダムフォレスト / Random Forest |
第 1 著者 氏名(和/英) | 田名網 那由多 / Nayuta Tanaami |
第 1 著者 所属(和/英) | 明星大学(略称:明星大) Meisei University(略称:Meisei Univ.) |
第 2 著者 氏名(和/英) | 林 実 / Minoru Hayashi |
第 2 著者 所属(和/英) | 明星大学(略称:明星大) Meisei University(略称:Meisei Univ.) |
発表年月日 | 2019-10-26 |
資料番号 | HCS2019-42 |
巻番号(vol) | vol.119 |
号番号(no) | HCS-252 |
ページ範囲 | pp.11-15(HCS), |
ページ数 | 5 |
発行日 | 2019-10-19 (HCS) |