大会名称
2022年 総合大会
大会コ-ド
2022G
開催年
2022
発行日
2022-03-01
セッション番号
D-14
セッション名
音声
講演日
2022/3/18
講演場所(会議室等)
Meeting 11
講演番号
D-14-2
タイトル
Russell円環モデルにもとづく日本語音声感情認識システム構築のための深層学習手法
著者名
◎米澤 晴安藤敏彦
キーワード
音声, 感情認識, 深層学習
抄録
本研究では,日本語自然対話データベースを利用したRussell円環モデル採用の音声感情認識システムの構築手法を提案する.OpenSMILEを用いて抽出した特徴ベクトルや人間の可聴音に基づいたスペクトル画像であるメルスペクトログラムを深層学習の入力に利用し,Deep Neural Network(DNN),Convolutional Neural Network(CNN)をRussell円環モデルに基づく2次元感情空間を出力値とする回帰問題に対して適用する.感情の出力値の尺度は1~7であり,実験の結果,openSMILE抽出特徴,時間方向で平均化したメルスペクトログラムをそれぞれ入力したDNN手法における評価関数平均二乗誤差(MSE)の値は双方共に0.6程度となった.一方で可変長の音声データのラウドネスの高い区間を切り出し固定長とした音声から抽出したメルスペクトログラムを入力としたCNN手法における学習結果は0.7程度であった.
本文pdf
PDF download   

PayPerView