講演名 2022-01-20
[ショートペーパー]スペクトログラムを用いた転移学習の適用による室内音環境の推定
佐野 将太(神奈川工科大), 川喜田 佑介(神奈川工科大), 宮崎 剛(神奈川工科大), 田中 博(神奈川工科大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 室内には様々な音源が存在しており,それらの音の識別を行うことで生活状況の見守りなど多様な応用が期待できる.対象とする環境音に含まれる音源を抽出する方法としては,不要な音を雑音として除去する方法が一般的であるが,本検討では取得した室内の環境音をスペクトログラム画像に変換し,転移学習を適用することで音環境全体の推定の可能性を調べた.実際の環境では音源の大きさや距離によって各音の大小が変化するため,複数のSN比を設定して識別モデルを作成し,その条件でも識別精度が確保できることを確認した.また,学習時と異なる条件で作成したスペクトログラム画像に対して識別を行うことで,作成した識別モデルのロバスト性を確認した.
抄録(英) A variety of environmental sounds exist in a room, and the classification of these sounds can be expected to have various applications such as monitoring living conditions. The most common method for extracting environmental sounds is to remove unnecessary sounds as noise. However, in this experiment, the authors considered whether it is possible to estimate the entire sound environment by converting the acquired environmental sounds into spectrogram images and applying transfer learning. In the actual environment, the level of the environmental sound varies depending on the magnitude and distance of the sound source. Therefore, we created a learned model with multiple signal-to-noise ratios, and confirmed that the classification accuracy can be maintained even under these conditions. In addition, we verified the robustness of the learned model by performing classification on spectrogram images created under different conditions from those in the learned model.
キーワード(和) 音源識別 / スペクトログラム / 転移学習 / 室内音環境 / ロバスト性
キーワード(英) Sound classification / Spectrogram / Transfer Learning / Indoor Sound Environment / Robustness
資料番号 SeMI2021-57
発行日 2022-01-13 (SeMI)

研究会情報
研究会 SeMI
開催期間 2022/1/20(から2日開催)
開催地(和) 野沢温泉スパリーナ コンベンションホール (ハイブリッド開催を予定)
開催地(英)
テーマ(和) センシング,モビリティ,モバイル・ユビキタスコンピューティング,センサ・アドホック・モバイルネットワーク,アプリケーション,一般
テーマ(英)
委員長氏名(和) 山本 高至(京大)
委員長氏名(英) Koji Yamamoto(Kyoto Univ.)
副委員長氏名(和) 門田 和也(日立) / 大和田 泰伯(NICT)
副委員長氏名(英) Kazuya Monden(Hitachi) / Yasunori Owada(NICT)
幹事氏名(和) 橋本 匡史(サイバー大) / 金井 謙治(早大) / 内山 彰(阪大)
幹事氏名(英) Masafumi Hashimoto(Cyber Univ.) / Kenji Kanai(Waseda Univ.) / Akira Uchiyama(Osaka Univ.)
幹事補佐氏名(和) 勝間田 優樹(NTTドコモ) / 田谷 昭仁(青学大) / 中山 悠(東京農工大)
幹事補佐氏名(英) Yuki Katsumata(NTT DOCOMO) / Akihito Taya(Aoyama Gakuin Univ.) / Yu Nakayama(Tokyo Univ. of Agri. and Tech.)

講演論文情報詳細
申込み研究会 Technical Committee on Sensor Network and Mobile Intelligence
本文の言語 JPN
タイトル(和) [ショートペーパー]スペクトログラムを用いた転移学習の適用による室内音環境の推定
サブタイトル(和)
タイトル(英) [Short Paper] Estimation of Sound Environment in Room by applying to Transfer Learning using Spectrograms Images
サブタイトル(和)
キーワード(1)(和/英) 音源識別 / Sound classification
キーワード(2)(和/英) スペクトログラム / Spectrogram
キーワード(3)(和/英) 転移学習 / Transfer Learning
キーワード(4)(和/英) 室内音環境 / Indoor Sound Environment
キーワード(5)(和/英) ロバスト性 / Robustness
第 1 著者 氏名(和/英) 佐野 将太 / Shota Sano
第 1 著者 所属(和/英) 神奈川工科大学(略称:神奈川工科大)
Kanagawa Institute of Technology(略称:KAIT)
第 2 著者 氏名(和/英) 川喜田 佑介 / Yuusuke Kawakita
第 2 著者 所属(和/英) 神奈川工科大学(略称:神奈川工科大)
Kanagawa Institute of Technology(略称:KAIT)
第 3 著者 氏名(和/英) 宮崎 剛 / Tsuyoshi Miyazaki
第 3 著者 所属(和/英) 神奈川工科大学(略称:神奈川工科大)
Kanagawa Institute of Technology(略称:KAIT)
第 4 著者 氏名(和/英) 田中 博 / Hiroshi Tanaka
第 4 著者 所属(和/英) 神奈川工科大学(略称:神奈川工科大)
Kanagawa Institute of Technology(略称:KAIT)
発表年月日 2022-01-20
資料番号 SeMI2021-57
巻番号(vol) vol.121
号番号(no) SeMI-333
ページ範囲 pp.22-25(SeMI),
ページ数 4
発行日 2022-01-13 (SeMI)