講演抄録/キーワード |
講演名 |
2017-03-01 12:40
[ポスター講演]高次元特徴量を用いた深層ニューラルネットワークによる室内環境音識別 ○美島咲子・若林佑幸・福森隆寛・中山雅人・西浦敬信(立命館大) EA2016-87 SIP2016-142 SP2016-82 |
抄録 |
(和) |
社会の高齢化に伴い,一人暮らしの高齢者による家庭内事故の増加や孤独死が深刻な問題となっている.そのため,ビデオカメラを用いた高齢者見守りサービスや安否確認システムが提案されているが,暗所や死角における異常事態の検出が困難であるという問題点が存在する.そこで,日常生活で発生する環境音から周囲の状況を特定する環境音識別が注目されている.これまで,音響特徴量としてメル周波数ケプストラム係数(MFCC)を用いた隠れマルコフモデル(HMM)による環境音識別法が提案されていた.しかし,室内で発生した環境音は室内残響の影響により音響的特徴が変化するため,十分な識別性能が得られないという問題があった.このことから,残響に頑健な特徴量を用いて音響モデルを構築することにより,識別性能の改善が期待できる.そこで本研究では,高次元特徴量としてフィルタバンク出力,対数パワースペクトル,時間波形に着目し,高次元特徴量を入力とする深層ニューラルネットワーク(DNN)を用いた室内環境音識別法を提案する.評価実験の結果,フィルタバンク出力を用いたDNN音響モデルによる室内環境音識別性能の向上を確認した. |
(英) |
Surveillance systems with a video camera have been utilized for the safety of people. It is important to identify the indoor-environmental sound in order to monitor the situations in the dark and blind areas. In the past, the acoustic model has been constructed on the basis of hidden Markov model (HMM) with mel frequency cepstrum coefficient (MFCC). However, it is difficult to identify the indoor-environmental sound with high accuracy because the acoustic features of the sound are effected by the reverberation. We propose the method to identify the indoor-environmental sound on the basis of deep neural network (DNN) with higher-dimentional features. In this paper, we investigate filter bank features, log-power spectrum and waveform as higher-dimensional features.From an evaluation experiment, we confirm the effectiveness of the proposed method. |
キーワード |
(和) |
環境音識別 / 高次元特徴量 / 深層ニューラルネットワーク / 音響モデル / / / / |
(英) |
Environmental sound discrimination / Higher-dimentional feature / Deep neural network / Acoustic model / / / / |
文献情報 |
信学技報, vol. 116, no. 475, EA2016-87, pp. 31-36, 2017年3月. |
資料番号 |
EA2016-87 |
発行日 |
2017-02-22 (EA, SIP, SP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
EA2016-87 SIP2016-142 SP2016-82 |
|