講演名 | 2023-03-01 位相変動を考慮した複素数値ハイブリッドニューラルネットワークによる異常音検知 西山 翔大(愛知工大), 玉森 聡(愛知工大), |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | 異常音検知とは,入力される対象の機械音を正常か異常かを識別するタスクである.異常音は発生頻度が低く,多様性に富んでるため,正常音のみから異常音を検知する問題として扱われる.多くの異常音検知手法のモデルの入力に用いられる音声特徴量はメルスペクトログラムである.しかし,音声波形をフーリエ変換し得られる複素スペクトログラムからメルスペクトログラムへ変換する際に,位相変動は失われる.本研究では,位相変動の有用性を示すために複素数値ニューラルネットワークと実数値ニューラルネットワークによる異常音検知手法を比較する.比較の結果,位相変動が有用である機械音と有用ではない機械音が存在した.そこで本研究では,位相変動を考慮するために,複素スペクトログラムを入力可能なすべての特徴量抽出演算において,複素数値の構造を保つ複素数値モジュールとメルスペクトログラムを入力とする実数値モジュールを組み合わせた複素数値ハイブリッドニューラルネットワークを提案する.提案手法の有効性は,ToyADMOSデータセットのマルチチャネル音声を対象とした異常音検知実験により検証した.実験の結果,提案手法は,複素数値ニューラルネットワークならびに実数値ニューラルネットワークと比較して,すべての機械音の平均AUCを約3%向上させた. |
抄録(英) | Anomalous sound detection is the task of identifying whether an incoming mechanical sound is normal or anomalous. Since anomalous sounds occur infrequently and are highly diverse, it is treated as a problem of detecting anomalous sounds from normal sounds only. The acoustic features used as input to most anomalous sound detection models are mel-spectrogram. However, the phase variation is lost when the complex-spectrogram obtained by Fourier transforming the sound waveform is converted to the mel-spectrogram. In this study, we compare anomalous sound detection methods using complex-valued neural networks and real-valued neural networks to demonstrate the usefulness of phase variation. As a result of the comparison, there existed machine sounds for which phase variation was valuable and machine sounds for which it was not valuable. In this study, we propose a complex-valued hybrid neural network that combines a complex-valued module that preserves the structure of complex values and a real-valued module that takes mel-spectrogram as input for all feature extraction operations in which complex-spectrogram can be input in order to take phase variation into account. We propose a complex-valued hybrid neural network that combines a complex-valued structure-preserving module and a real-valued module that takes the mel-spectrogram as input for all feature extraction operations. Experiments verified the effectiveness of the proposed method on anomalous sound detection for multi-channel sound in the ToyADMOS dataset. Experimental results showed that the proposed method improved the average AUC of all machine sounds by around 3% compared to both complex-valued and real-valued neural networks. |
キーワード(和) | 異常音検知 / 複素数値ニューラルネットワーク / 位相変動 |
キーワード(英) | Anomalous sound detection / complex-valued neural networks / phase variations |
資料番号 | EA2022-106,SIP2022-150,SP2022-70 |
発行日 | 2023-02-21 (EA, SIP, SP) |
研究会情報 | |
研究会 | SP / IPSJ-SLP / EA / SIP |
---|---|
開催期間 | 2023/2/28(から2日開催) |
開催地(和) | 沖縄県立博物館・美術館 |
開催地(英) | |
テーマ(和) | 音声,応用/電気音響, 信号処理,一般 |
テーマ(英) | |
委員長氏名(和) | 戸田 智基(名大) / 戸田 智基(名大) / 古家 賢一(大分大) / 田中 聡久(東京農工大) |
委員長氏名(英) | Tomoki Toda(Nagoya Univ.) / Tomoki Toda(Nagoya Univ.) / Kenichi Furuya(Oita Univ.) / Toshihisa Tanaka(Tokyo Univ. Agri.&Tech.) |
副委員長氏名(和) | / / 加古 達也(NTT) / 小野 順貴(都立大) / 市毛 弘一(横浜国大) / 仲地 孝之(琉球大学) |
副委員長氏名(英) | / / Tatsuya Kako(NTT) / Junki Ono(Tokyo Metropolitan Univ.) / Koichi Ichige(Yokohama National Univ.) / Takayuki Nakachi(Ryukyu Univ.) |
幹事氏名(和) | 増村 亮(NTT) / 中鹿 亘(電通大) / 増村 亮(NTT) / 中鹿 亘(電通大) / 若山 圭吾(NTT) / 西浦 敬信(立命館大) / 田中 雄一(東京農工大) / 京地 清介(北九州市大) |
幹事氏名(英) | Ryo Masumura(NTT) / Toru Nakashika(Univ. of Electro-Comm.) / Ryo Masumura(NTT) / Toru Nakashika(Univ. of Electro-Comm.) / Keigo Wakayama(NTT) / Takanobu Nishiura(RitsumeikanUniv.) / Yuichi Tanaka(Tokyo Univ. Agri.&Tech.) / Seisuke Kyochi(Univ. of Kitakyushu) |
幹事補佐氏名(和) | 相原 龍(三菱電機) / 齋藤 大輔(東大) / 相原 龍(三菱電機) / 齋藤 大輔(東大) / 中山 雅人(大阪産業大) / 矢田部 浩平(東京農工大) / 吉田 太一(電通大) / 今泉 祥子(千葉大) |
幹事補佐氏名(英) | Ryo Aihara(Mitsubishi Electric) / Daisuke Saito(Univ. of Tokyo) / Ryo Aihara(Mitsubishi Electric) / Daisuke Saito(Univ. of Tokyo) / Masato Nakayama(Osaka Sangyo Univ.) / Kouhei Yatabe(Tuat) / Taichi Yoshida(UEC) / Shoko Imaizumi(Chiba Univ.) |
講演論文情報詳細 | |
申込み研究会 | Technical Committee on Speech / Special Interest Group on Spoken Language Processing / Technical Committee on Engineering Acoustics / Technical Committee on Signal Processing |
---|---|
本文の言語 | JPN |
タイトル(和) | 位相変動を考慮した複素数値ハイブリッドニューラルネットワークによる異常音検知 |
サブタイトル(和) | |
タイトル(英) | Anomalous sound detection with complex-valued hybrid neural networks considering phase variations |
サブタイトル(和) | |
キーワード(1)(和/英) | 異常音検知 / Anomalous sound detection |
キーワード(2)(和/英) | 複素数値ニューラルネットワーク / complex-valued neural networks |
キーワード(3)(和/英) | 位相変動 / phase variations |
第 1 著者 氏名(和/英) | 西山 翔大 / Shota Nishiyama |
第 1 著者 所属(和/英) | 愛知工業大学(略称:愛知工大) Aichi Institute of Technology(略称:AIT) |
第 2 著者 氏名(和/英) | 玉森 聡 / Akira Tamamori |
第 2 著者 所属(和/英) | 愛知工業大学(略称:愛知工大) Aichi Institute of Technology(略称:AIT) |
発表年月日 | 2023-03-01 |
資料番号 | EA2022-106,SIP2022-150,SP2022-70 |
巻番号(vol) | vol.122 |
号番号(no) | EA-387,SIP-388,SP-389 |
ページ範囲 | pp.185-190(EA), pp.185-190(SIP), pp.185-190(SP), |
ページ数 | 6 |
発行日 | 2023-02-21 (EA, SIP, SP) |