講演名 2022-12-15
[Short Paper] A transformer based feature-level fusion approach for Audiovisual Depression Prediction
藤 世宇(立命館大), 柴 樹榕(立命館大), 劉 家慶(立命館大), 建山 智子(藤田医科大), Xinyin Huang(Soochow Univ.), 陳 延偉(立命館大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) Depression is a prevalent mental ailment that causes many diseases all over the world. Identification of people with mental illness faces a challenge, as there is no difference between mentally ill people and normal people in physiology, and clinicians can only make a subjective diagnosis according to the relevant information of patients. Hence, it has become imperative to develop automated methods for audiovisual depression prediction. In this study, we proposed an intra- and inter-modality transformer-based fusion model to improve the depression level prediction accuracy. We evaluate our approach on the Chinese Soochow University depressive severity dataset and demonstrate that our method outperforms the existing method.
抄録(英) Depression is a prevalent mental ailment that causes many diseases all over the world. Identification of people with mental illness faces a challenge, as there is no difference between mentally ill people and normal people in physiology, and clinicians can only make a subjective diagnosis according to the relevant information of patients. Hence, it has become imperative to develop automated methods for audiovisual depression prediction. In this study, we proposed an intra- and inter-modality transformer-based fusion model to improve the depression level prediction accuracy. We evaluate our approach on the Chinese Soochow University depressive severity dataset and demonstrate that our method outperforms the existing method.
キーワード(和) Depression Prediction / Multi-Modalities / Fusion / Transformer
キーワード(英) Depression Prediction / Multi-Modalities / Fusion / Transformer
資料番号 PRMU2022-42
発行日 2022-12-08 (PRMU)

研究会情報
研究会 PRMU
開催期間 2022/12/15(から2日開催)
開催地(和) 富山国際会議場
開催地(英) Toyama International Conference Center
テーマ(和) 制御のためのCV
テーマ(英)
委員長氏名(和) 内田 誠一(九大)
委員長氏名(英) Seiichi Uchida(Kyushu Univ.)
副委員長氏名(和) 舩冨 卓哉(奈良先端大) / 安倍 満(デンソーアイティーラボラトリ)
副委員長氏名(英) Takuya Funatomi(NAIST) / Mitsuru Anpai(Denso IT Lab.)
幹事氏名(和) 山口 光太(サイバーエージェント) / 松井 勇佑(東大)
幹事氏名(英) Kouta Yamaguchi(CyberAgent) / Yusuke Matsui(Univ. of Tokyo)
幹事補佐氏名(和) 井上 中順(東工大) / 川西 康友(理研)
幹事補佐氏名(英) Nakamasa Inoue(Tokyo Inst. of Tech.) / Yasutomo Kawanishi(Riken)

講演論文情報詳細
申込み研究会 Technical Committee on Pattern Recognition and Media Understanding
本文の言語 ENG
タイトル(和)
サブタイトル(和)
タイトル(英) [Short Paper] A transformer based feature-level fusion approach for Audiovisual Depression Prediction
サブタイトル(和)
キーワード(1)(和/英) Depression Prediction / Depression Prediction
キーワード(2)(和/英) Multi-Modalities / Multi-Modalities
キーワード(3)(和/英) Fusion / Fusion
キーワード(4)(和/英) Transformer / Transformer
第 1 著者 氏名(和/英) 藤 世宇 / Shiyu Teng
第 1 著者 所属(和/英) 立命館大学(略称:立命館大)
Ritsumeikan University(略称:Ritsumeikan Univ.)
第 2 著者 氏名(和/英) 柴 樹榕 / Shurong Chai
第 2 著者 所属(和/英) 立命館大学(略称:立命館大)
Ritsumeikan University(略称:Ritsumeikan Univ.)
第 3 著者 氏名(和/英) 劉 家慶 / Jiaqing Liu
第 3 著者 所属(和/英) 立命館大学(略称:立命館大)
Ritsumeikan University(略称:Ritsumeikan Univ.)
第 4 著者 氏名(和/英) 建山 智子 / Tateyama Tomoko
第 4 著者 所属(和/英) 藤田医科大学(略称:藤田医科大)
Fujita Health University(略称:Fujita Health Univ.)
第 5 著者 氏名(和/英) Xinyin Huang / Xinyin Huang
第 5 著者 所属(和/英) Soochow University(略称:Soochow Univ.)
Soochow University(略称:Soochow Univ.)
第 6 著者 氏名(和/英) 陳 延偉 / Yen-wei Chen
第 6 著者 所属(和/英) 立命館大学(略称:立命館大)
Ritsumeikan University(略称:Ritsumeikan Univ.)
発表年月日 2022-12-15
資料番号 PRMU2022-42
巻番号(vol) vol.122
号番号(no) PRMU-314
ページ範囲 pp.54-56(PRMU),
ページ数 3
発行日 2022-12-08 (PRMU)