半教師あり学習に基づく音響シーンと音響イベントの同時分析

五十嵐 彩美; 椿 竣介; 井本 桂右

講演名	2023-03-01 半教師あり学習に基づく音響シーンと音響イベントの同時分析五十嵐彩美(同志社大), 椿竣介(同志社大), 井本桂右(同志社大),
PDFダウンロードページ	PDFダウンロードページへ
抄録(和)	本稿では音響イベントの強ラベルデータと弱ラベルデータを併用する半教師あり学習に基づく，音響シーンと音響イベントの同時分析手法を提案する．音響イベント検出では，強ラベルデータを用いてモデル学習を行うことで良い性能が得られることが報告されている．しかしながら，環境音に対して音の発生時刻を付与する作業は非常に時間を要することが知られており，大量の学習データを収集することは困難である．一方，音響イベント検出に弱ラベルデータを用いて同時分析する手法も提案されているが，強ラベルデータを用いた場合と比較して，分析性能が低下するという課題がある．そこで本研究では，強ラベルデータと弱ラベルデータを組み合わせてモデル学習を行う半教師あり学習に基づく同時分析手法を提案する．また，環境音分析のオープンデータセットであるTUT Acoustic Scenes 2016/2017およびTUT Sound Events 2016/2017を用いた評価実験により，提案手法の振る舞いについて詳細な分析を行う．
抄録(英)
キーワード(和)	音響シーン分類 / 音響イベント検出 / マルチタスク学習 / 半教師あり学習 / 弱ラベル
キーワード(英)
資料番号	EA2022-103,SIP2022-147,SP2022-67
発行日	2023-02-21 (EA, SIP, SP)

研究会情報
研究会	SP / IPSJ-SLP / EA / SIP
開催期間	2023/2/28(から2日開催)
開催地（和）	沖縄県立博物館・美術館
開催地（英）
テーマ（和）	音声，応用／電気音響, 信号処理，一般
テーマ（英）
委員長氏名（和）	戸田智基(名大) / 戸田智基(名大) / 古家賢一(大分大) / 田中聡久(東京農工大)
委員長氏名（英）	Tomoki Toda(Nagoya Univ.) / Tomoki Toda(Nagoya Univ.) / Kenichi Furuya(Oita Univ.) / Toshihisa Tanaka(Tokyo Univ. Agri.&Tech.)
副委員長氏名（和）	/ / 加古達也(NTT) / 小野順貴(都立大) / 市毛弘一(横浜国大) / 仲地孝之(琉球大学)
副委員長氏名（英）	/ / Tatsuya Kako(NTT) / Junki Ono(Tokyo Metropolitan Univ.) / Koichi Ichige(Yokohama National Univ.) / Takayuki Nakachi(Ryukyu Univ.)
幹事氏名（和）	増村亮(NTT) / 中鹿亘(電通大) / 増村亮(NTT) / 中鹿亘(電通大) / 若山圭吾(NTT) / 西浦敬信(立命館大) / 田中雄一(東京農工大) / 京地清介(北九州市大)
幹事氏名（英）	Ryo Masumura(NTT) / Toru Nakashika(Univ. of Electro-Comm.) / Ryo Masumura(NTT) / Toru Nakashika(Univ. of Electro-Comm.) / Keigo Wakayama(NTT) / Takanobu Nishiura(RitsumeikanUniv.) / Yuichi Tanaka(Tokyo Univ. Agri.&Tech.) / Seisuke Kyochi(Univ. of Kitakyushu)
幹事補佐氏名（和）	相原龍(三菱電機) / 齋藤大輔(東大) / 相原龍(三菱電機) / 齋藤大輔(東大) / 中山雅人(大阪産業大) / 矢田部浩平(東京農工大) / 吉田太一(電通大) / 今泉祥子(千葉大)
幹事補佐氏名（英）	Ryo Aihara(Mitsubishi Electric) / Daisuke Saito(Univ. of Tokyo) / Ryo Aihara(Mitsubishi Electric) / Daisuke Saito(Univ. of Tokyo) / Masato Nakayama(Osaka Sangyo Univ.) / Kouhei Yatabe(Tuat) / Taichi Yoshida(UEC) / Shoko Imaizumi(Chiba Univ.)

講演論文情報詳細
申込み研究会	Technical Committee on Speech / Special Interest Group on Spoken Language Processing / Technical Committee on Engineering Acoustics / Technical Committee on Signal Processing
本文の言語	JPN
タイトル（和）	半教師あり学習に基づく音響シーンと音響イベントの同時分析
サブタイトル（和）
タイトル（英）	Joint analysis of acoustic scenes and sound events based on semi-supervised learning
サブタイトル（和）
キーワード(1)（和/英）	音響シーン分類
キーワード(2)（和/英）	音響イベント検出
キーワード(3)（和/英）	マルチタスク学習
キーワード(4)（和/英）	半教師あり学習
キーワード(5)（和/英）	弱ラベル
第 1 著者氏名（和/英）	五十嵐彩美 / Ami Igarashi
第 1 著者所属（和/英）	同志社大学(略称：同志社大) Doshisha University(略称：DU)
第 2 著者氏名（和/英）	椿竣介 / Shunsuke Tsubaki
第 2 著者所属（和/英）	同志社大学(略称：同志社大) Doshisha University(略称：DU)
第 3 著者氏名（和/英）	井本桂右 / Keisuke Imoto
第 3 著者所属（和/英）	同志社大学(略称：同志社大) Doshisha University(略称：DU)
発表年月日	2023-03-01
資料番号	EA2022-103,SIP2022-147,SP2022-67
巻番号（vol）	vol.122
号番号（no）	EA-387,SIP-388,SP-389
ページ範囲	pp.165-170(EA), pp.165-170(SIP), pp.165-170(SP),
ページ数	6
発行日	2023-02-21 (EA, SIP, SP)