講演名 2023-03-01
半教師あり学習に基づく音響シーンと音響イベントの同時分析
五十嵐 彩美(同志社大), 椿 竣介(同志社大), 井本 桂右(同志社大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本稿では音響イベントの強ラベルデータと弱ラベルデータを併用する半教師あり学習に基づく,音響シーンと音響イベントの同時分析手法を提案する.音響イベント検出では,強ラベルデータを用いてモデル学習を行うことで良い性能が得られることが報告されている.しかしながら,環境音に対して音の発生時刻を付与する作業は非常に時間を要することが知られており,大量の学習データを収集することは困難である.一方,音響イベント検出に弱ラベルデータを用いて同時分析する手法も提案されているが,強ラベルデータを用いた場合と比較して,分析性能が低下するという課題がある.そこで本研究では,強ラベルデータと弱ラベルデータを組み合わせてモデル学習を行う半教師あり学習に基づく同時分析手法を提案する.また,環境音分析のオープンデータセットであるTUT Acoustic Scenes 2016/2017およびTUT Sound Events 2016/2017を用いた評価実験により,提案手法の振る舞いについて詳細な分析を行う.
抄録(英)
キーワード(和) 音響シーン分類 / 音響イベント検出 / マルチタスク学習 / 半教師あり学習 / 弱ラベル
キーワード(英)
資料番号 EA2022-103,SIP2022-147,SP2022-67
発行日 2023-02-21 (EA, SIP, SP)

研究会情報
研究会 SP / IPSJ-SLP / EA / SIP
開催期間 2023/2/28(から2日開催)
開催地(和) 沖縄県立博物館・美術館
開催地(英)
テーマ(和) 音声,応用/電気音響, 信号処理,一般
テーマ(英)
委員長氏名(和) 戸田 智基(名大) / 戸田 智基(名大) / 古家 賢一(大分大) / 田中 聡久(東京農工大)
委員長氏名(英) Tomoki Toda(Nagoya Univ.) / Tomoki Toda(Nagoya Univ.) / Kenichi Furuya(Oita Univ.) / Toshihisa Tanaka(Tokyo Univ. Agri.&Tech.)
副委員長氏名(和) / / 加古 達也(NTT) / 小野 順貴(都立大) / 市毛 弘一(横浜国大) / 仲地 孝之(琉球大学)
副委員長氏名(英) / / Tatsuya Kako(NTT) / Junki Ono(Tokyo Metropolitan Univ.) / Koichi Ichige(Yokohama National Univ.) / Takayuki Nakachi(Ryukyu Univ.)
幹事氏名(和) 増村 亮(NTT) / 中鹿 亘(電通大) / 増村 亮(NTT) / 中鹿 亘(電通大) / 若山 圭吾(NTT) / 西浦 敬信(立命館大) / 田中 雄一(東京農工大) / 京地 清介(北九州市大)
幹事氏名(英) Ryo Masumura(NTT) / Toru Nakashika(Univ. of Electro-Comm.) / Ryo Masumura(NTT) / Toru Nakashika(Univ. of Electro-Comm.) / Keigo Wakayama(NTT) / Takanobu Nishiura(RitsumeikanUniv.) / Yuichi Tanaka(Tokyo Univ. Agri.&Tech.) / Seisuke Kyochi(Univ. of Kitakyushu)
幹事補佐氏名(和) 相原 龍(三菱電機) / 齋藤 大輔(東大) / 相原 龍(三菱電機) / 齋藤 大輔(東大) / 中山 雅人(大阪産業大) / 矢田部 浩平(東京農工大) / 吉田 太一(電通大) / 今泉 祥子(千葉大)
幹事補佐氏名(英) Ryo Aihara(Mitsubishi Electric) / Daisuke Saito(Univ. of Tokyo) / Ryo Aihara(Mitsubishi Electric) / Daisuke Saito(Univ. of Tokyo) / Masato Nakayama(Osaka Sangyo Univ.) / Kouhei Yatabe(Tuat) / Taichi Yoshida(UEC) / Shoko Imaizumi(Chiba Univ.)

講演論文情報詳細
申込み研究会 Technical Committee on Speech / Special Interest Group on Spoken Language Processing / Technical Committee on Engineering Acoustics / Technical Committee on Signal Processing
本文の言語 JPN
タイトル(和) 半教師あり学習に基づく音響シーンと音響イベントの同時分析
サブタイトル(和)
タイトル(英) Joint analysis of acoustic scenes and sound events based on semi-supervised learning
サブタイトル(和)
キーワード(1)(和/英) 音響シーン分類
キーワード(2)(和/英) 音響イベント検出
キーワード(3)(和/英) マルチタスク学習
キーワード(4)(和/英) 半教師あり学習
キーワード(5)(和/英) 弱ラベル
第 1 著者 氏名(和/英) 五十嵐 彩美 / Ami Igarashi
第 1 著者 所属(和/英) 同志社大学(略称:同志社大)
Doshisha University(略称:DU)
第 2 著者 氏名(和/英) 椿 竣介 / Shunsuke Tsubaki
第 2 著者 所属(和/英) 同志社大学(略称:同志社大)
Doshisha University(略称:DU)
第 3 著者 氏名(和/英) 井本 桂右 / Keisuke Imoto
第 3 著者 所属(和/英) 同志社大学(略称:同志社大)
Doshisha University(略称:DU)
発表年月日 2023-03-01
資料番号 EA2022-103,SIP2022-147,SP2022-67
巻番号(vol) vol.122
号番号(no) EA-387,SIP-388,SP-389
ページ範囲 pp.165-170(EA), pp.165-170(SIP), pp.165-170(SP),
ページ数 6
発行日 2023-02-21 (EA, SIP, SP)