講演名 2012/12/13
統計的雑音抑圧法の強調的適用による雑音環境下音声区間検出(音声特徴量)
大淵 康成, 武田 龍, 神田 直之,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 雑音環境下での高精度音声区間検出の実現のため、統計的雑音抑圧手法と音声パワーの閾値処理を組み合わせた方式を提案する。提案手法は、一般的な実装でも十分に高い性能を示すが、さらに雑音抑圧方式の改良により性能を向上させることができる。具体的には、雑音抑圧により得られる音声信号の歪みが、音声区間検出に対しては悪影響を持たないことを利用し、周波数領域での様々な処理の中で、雑音の疑いのある成分を意図的に強く抑圧する。公開データベースであるCENSREC-1-Cを使った評価を行った結果、提案手法は、これまでに知られている多くの方式を上回る性能を示すことが確認された。
抄録(英) In this paper, we propose a new voice activity detection method for noisy environment, which is realized as a combination of statistical noise suppression and thresholding of the sound power. The pro-posed method achieves sufficiently high accuracy even by its simplest implementation, and could be further improved by modifying the noise suppression algorithm. More specifically, we focus on the tolerance of the VAD module to the speech distortion, and apply noise suppression in the frequency domain more aggressively, meaning that all the elements which are suspicious to be noise are strongly suppressed. The evaluation ex-periments using the CENSREC-1-C public database confirmed that the proposed method outperforms many known methods.
キーワード(和) 音声区間検出 / 統計的雑音抑圧 / OM-LSA / CENSREC-1-C
キーワード(英) VAD / Statistical noise suppression / OM-LSA / CENSREC-1-C
資料番号 SLP-94
発行日

研究会情報
研究会 SP
開催期間 2012/12/13(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Speech (SP)
本文の言語 JPN
タイトル(和) 統計的雑音抑圧法の強調的適用による雑音環境下音声区間検出(音声特徴量)
サブタイトル(和)
タイトル(英) Voice activity detection under noisy environment based on augmented execution of statistical noise suppression
サブタイトル(和)
キーワード(1)(和/英) 音声区間検出 / VAD
キーワード(2)(和/英) 統計的雑音抑圧 / Statistical noise suppression
キーワード(3)(和/英) OM-LSA / OM-LSA
キーワード(4)(和/英) CENSREC-1-C / CENSREC-1-C
第 1 著者 氏名(和/英) 大淵 康成 / YASUNARI OBUCHI
第 1 著者 所属(和/英) 日立製作所中央研究所
Central Research Laboratory Hitachi Ltd
第 2 著者 氏名(和/英) 武田 龍 / RYU TAKEDA
第 2 著者 所属(和/英) 日立製作所中央研究所
Central Research Laboratory Hitachi Ltd
第 3 著者 氏名(和/英) 神田 直之 / NAOYUKI KANDA
第 3 著者 所属(和/英) 日立製作所中央研究所
Central Research Laboratory Hitachi Ltd
発表年月日 2012/12/13
資料番号 SLP-94
巻番号(vol) vol.112
号番号(no) 369
ページ範囲 pp.-
ページ数 6
発行日