大会名称
2023年 総合大会
大会コ-ド
2023G
開催年
2023
発行日
2023-02-28
セッション番号
H-2
セッション名
ヒューマン情報処理
講演日
2023/3/10
講演場所(会議室等)
3号館 3303教室
講演番号
H-2-16
タイトル
時間的推移を考慮した深層学習を用いた音声感情認識
著者名
○三河凱大安藤敏彦
キーワード
音声感情認識, メルスペクトログラム, LSTM
抄録
著者らのグループではRussell円環モデルと呼ばれるValence,Arousalの2要素を次元軸とした2次元空間にもとづく音声感情認識に取り組んでいる.音声情報との関係性が未だ特定困難となっているValenceにおいて,深層学習手法を用いた結果, Valenceは音声のスペクトル特徴の時間的推移を反映している可能性があるという示唆が得られている.このことから,音声のスペクトル特徴であるメルスペクトログラムを入力として深層学習手法の1つであるLSTM(Long short term memory)を用い,Valenceとスペクトル特徴の時間的推移の関係性の調査を行った.結果として,LSTMを用いた手法では他の深層学習手法と比較して,未知のデータに対する出力の誤差が,Valence,Arousal共に一定の数値で収束していたため,スペクトル特徴の時間的推移を捉えることで,未知のデータに対するValence,Arousalの値の予測精度の向上が期待される.
本文pdf
PDF download   

PayPerView