講演名 2022-06-18
多クラス分類器とその中間層出力の再構成器を用いた異常音検知の検討
松本 啓汰(筑波大), 山田 武志(筑波大), 牧野 昭二(早大/筑波大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 近年,正常音データのみを用いる教師なし学習によって,未知の異常音を検出する技術が求められている.現在主流となっているのは,正常音データの再構成に基づく手法である.この手法は,オートエンコーダを用いて入力データを再構成し,その再構成誤差を異常スコアとすることで異常検知を行う.また,学習時に仮想的な異常音データを用意することを前提に,正常・異常の二値分類器と潜在空間上の距離学習を組み合わせた手法が提案された.この手法では正常音と仮想的な異常音データを用いて二値分類器を学習するが,潜在空間上における正常,異常それぞれのクラス重心に基づく指標を損失関数と異常スコアに組み込んでいる.本稿では,これらの手法を統合してさらなる性能向上を目指す.具体的には,多クラス分類器,潜在空間上の距離学習,中間層出力の再構成器を組み合わせた手法を提案する.異常音検知のタスクであるDCASE2020 Task2を用いて実験を行った結果,提案手法が有効であることを確認した.
抄録(英) In recent years, there has been a growing demand for techniques to detect unknown anomalous sounds by unsupervised learning using only normal sound data. Currently, the most popular method is based on reconstruction of normal sound data. This method uses an autoencoder to reconstruct the input data, and uses the reconstruction error as the anomalous score for anomalous detection. A method combining a binary classifier for normal/anomaly and distance learning in the latent space was recently proposed, assuming that virtual anomalous sound data is prepared at the time of learning. This method learns a binary classifier using normal and virtual anomalous sound data, and incorporates an index based on the center of gravity of the normal and anomalous classes in the latent space into the loss function and anomalous score. In this paper, we integrate these methods to further improve performance. Specifically, we propose a method that combines a multi-class classifier, distance learning on the latent space, and a reconstructor of the intermediate layer output. Experimental results using DCASE2020 Task 2, a task for anomalous sound detection, confirm the effectiveness of the proposed method.
キーワード(和) 異常音検知 / 多クラス分類器 / 再構成器 / 距離学習
キーワード(英) anomalous sound detection / multiclass classifier / reconstructor / metric learning
資料番号 SP2022-18
発行日 2022-06-10 (SP)

研究会情報
研究会 SP / IPSJ-MUS / IPSJ-SLP
開催期間 2022/6/17(から2日開催)
開催地(和) オンライン開催
開催地(英) Online
テーマ(和) 音学シンポジウム2022
テーマ(英)
委員長氏名(和) 戸田 智基(名大)
委員長氏名(英) Tomoki Toda(Nagoya Univ.)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和) 増村 亮(NTT) / 中鹿 亘(電通大)
幹事氏名(英) Ryo Masumura(NTT) / Toru Nakashika(Univ. of Electro-Comm.)
幹事補佐氏名(和) 相原 龍(三菱電機) / 齋藤 大輔(東大)
幹事補佐氏名(英) Ryo Aihara(Mitsubishi Electric) / Daisuke Saito(Univ. of Tokyo)

講演論文情報詳細
申込み研究会 Technical Committee on Speech / Special Interest Group on Music and Computer / Special Interest Group on Spoken Language Processing
本文の言語 JPN
タイトル(和) 多クラス分類器とその中間層出力の再構成器を用いた異常音検知の検討
サブタイトル(和)
タイトル(英) Anomalous sound detection using multi-class classifier and reconstructor of its intermediate layer output
サブタイトル(和)
キーワード(1)(和/英) 異常音検知 / anomalous sound detection
キーワード(2)(和/英) 多クラス分類器 / multiclass classifier
キーワード(3)(和/英) 再構成器 / reconstructor
キーワード(4)(和/英) 距離学習 / metric learning
第 1 著者 氏名(和/英) 松本 啓汰 / Keita Matsumoto
第 1 著者 所属(和/英) 筑波大学(略称:筑波大)
University of Tsukuba(略称:Univ. of Tsukuba)
第 2 著者 氏名(和/英) 山田 武志 / Takeshi Yamada
第 2 著者 所属(和/英) 筑波大学(略称:筑波大)
University of Tsukuba(略称:Univ. of Tsukuba)
第 3 著者 氏名(和/英) 牧野 昭二 / Shoji Makino
第 3 著者 所属(和/英) 早稲田大学/筑波大学(略称:早大/筑波大)
Waseda University/University of Tsukuba(略称:Waseda Univ./Univ. of Tsukuba)
発表年月日 2022-06-18
資料番号 SP2022-18
巻番号(vol) vol.122
号番号(no) SP-81
ページ範囲 pp.77-81(SP),
ページ数 5
発行日 2022-06-10 (SP)