音声特徴とテキスト特徴の協調利用によるマルチモーダル感情認識

永瀬,亮太郎; 福森,隆寛; 山下,洋一

お知らせ 2023年度・2024年度学生員会費割引キャンペーン実施中です
お知らせ技術研究報告と和文論文誌Ｃの同時投稿施策(掲載料1割引き)について
お知らせ電子情報通信学会における研究会開催について
お知らせ NEW 参加費の返金について

電子情報通信学会研究会発表申込システム
講演論文詳細

技報閲覧サービス
[ログイン]
技報アーカイブ

トップに戻る

前のページに戻る

[Japanese] / [English]

講演抄録／キーワード
講演名		2020-12-02 13:50 音声特徴とテキスト特徴の協調利用によるマルチモーダル感情認識 ○永瀬亮太郎・福森隆寛・山下洋一（立命館大） NLC2020-14 SP2020-17
抄録	（和）	感情音声認識では，ニューラルネットワークを応用した研究が盛んに取り組まれており，音声合成や音声認識と同様に年々認識率の向上がみられる．また，音声だけでなく画像情報や言語情報などを統合的に用いたマルチモーダルな感情認識も盛んに研究されている．本研究では，発話単位の音声とテキストを入力として，音響特徴量と埋め込みベクトルによる言語特徴量を協調的に利用した感情音声認識を行う．事前に感情音声認識と感情テキスト認識を学習し，各認識器から得られる特徴量を融合する early-fusion と認識結果を融合する late-fusion を適用することで，単体の感情認識器よりも高い認識率を目指す．
	（英）	In recent years, the advanced techique of deep learning has improved the performance of Speech Emotional Recognition as well as speech synthesis or speech recognition. Moreover, multi-mordal emotion recognition which integrates linguistic or facial image features with acoustic features has outperformed conventional methods as well. In this paper, we propose a method of SER by using acoustic and linguistic features at the utterance level. Firstly, speech and text emotion recognition are trained with Japanese emotional speech corpus. Then, we aim to improve accuracy by using early-fusion which fuses linguistic and acoustic features and late-fusion which fuses predicted values by each model.
キーワード	（和）	感情音声認識 / 感情テキスト認識 / マルチモーダル / early-fusion / late-fusion / / /
	（英）	Speech Emotion Recognition / Text Emotion Recognition / Multi-Modal / early-fusion / late-fusion / / /
文献情報		信学技報, vol. 120, no. 271, SP2020-17, pp. 7-12, 2020年12月.
資料番号		SP2020-17
発行日		2020-11-25 (NLC, SP)
ISSN		Online edition: ISSN 2432-6380
著作権について		技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します．(許諾番号：10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
PDFダウンロード		NLC2020-14 SP2020-17

研究会情報
研究会	NLC IPSJ-NL SP IPSJ-SLP
開催期間	2020-12-02 - 2020-12-03
開催地（和）	オンライン開催
開催地（英）	Online
テーマ（和）	音声言語および自然言語処理シンポジウム
テーマ（英）
講演論文情報の詳細
申込み研究会	SP
会議コード	2020-12-NLC-NL-SP-SLP
本文の言語	日本語
タイトル（和）	音声特徴とテキスト特徴の協調利用によるマルチモーダル感情認識
サブタイトル（和）
タイトル（英）	Multi-Modal Emotion Recognition by Integrating of Acoustic and Linguistic Features
サブタイトル（英）
キーワード(1)（和/英）	感情音声認識 / Speech Emotion Recognition
キーワード(2)（和/英）	感情テキスト認識 / Text Emotion Recognition
キーワード(3)（和/英）	マルチモーダル / Multi-Modal
キーワード(4)（和/英）	early-fusion / early-fusion
キーワード(5)（和/英）	late-fusion / late-fusion
キーワード(6)（和/英）	/
キーワード(7)（和/英）	/
キーワード(8)（和/英）	/
第1著者氏名（和/英/ヨミ）	永瀬亮太郎 / Ryotaro Nagase / ナガセリョウタロウ
第1著者所属（和/英）	立命館大学 (略称：立命館大) Ritsumeikan University (略称： Ritsumeikan Univ.)
第2著者氏名（和/英/ヨミ）	福森隆寛 / Takahiro Fukumori / フクモリタカヒロ
第2著者所属（和/英）	立命館大学 (略称：立命館大) Ritsumeikan University (略称： Ritsumeikan Univ.)
第3著者氏名（和/英/ヨミ）	山下洋一 / Yoichi Yamashita / ヤマシタヨウイチ
第3著者所属（和/英）	立命館大学 (略称：立命館大) Ritsumeikan University (略称： Ritsumeikan Univ.)
第4著者氏名（和/英/ヨミ）	/ /
第4著者所属（和/英）	(略称： ) (略称： )
第5著者氏名（和/英/ヨミ）	/ /
第5著者所属（和/英）	(略称： ) (略称： )
第6著者氏名（和/英/ヨミ）	/ /
第6著者所属（和/英）	(略称： ) (略称： )
第7著者氏名（和/英/ヨミ）	/ /
第7著者所属（和/英）	(略称： ) (略称： )
第8著者氏名（和/英/ヨミ）	/ /
第8著者所属（和/英）	(略称： ) (略称： )
第9著者氏名（和/英/ヨミ）	/ /
第9著者所属（和/英）	(略称： ) (略称： )
第10著者氏名（和/英/ヨミ）	/ /
第10著者所属（和/英）	(略称： ) (略称： )
第11著者氏名（和/英/ヨミ）	/ /
第11著者所属（和/英）	(略称： ) (略称： )
第12著者氏名（和/英/ヨミ）	/ /
第12著者所属（和/英）	(略称： ) (略称： )
第13著者氏名（和/英/ヨミ）	/ /
第13著者所属（和/英）	(略称： ) (略称： )
第14著者氏名（和/英/ヨミ）	/ /
第14著者所属（和/英）	(略称： ) (略称： )
第15著者氏名（和/英/ヨミ）	/ /
第15著者所属（和/英）	(略称： ) (略称： )
第16著者氏名（和/英/ヨミ）	/ /
第16著者所属（和/英）	(略称： ) (略称： )
第17著者氏名（和/英/ヨミ）	/ /
第17著者所属（和/英）	(略称： ) (略称： )
第18著者氏名（和/英/ヨミ）	/ /
第18著者所属（和/英）	(略称： ) (略称： )
第19著者氏名（和/英/ヨミ）	/ /
第19著者所属（和/英）	(略称： ) (略称： )
第20著者氏名（和/英/ヨミ）	/ /
第20著者所属（和/英）	(略称： ) (略称： )
講演者	第1著者
発表日時	2020-12-02 13:50:00
発表時間	20分
申込先研究会	SP
資料番号	NLC2020-14, SP2020-17
巻番号（vol）	vol.120
号番号（no）	no.270(NLC), no.271(SP)
ページ範囲	pp.7-12
ページ数	6
発行日	2020-11-25 (NLC, SP)

[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]

IEICE / 電子情報通信学会