講演名 | 2006/12/14 3次キュムラントのBispectrumとMFCCの統合による音声区間検出の検討(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム) 松田 博義, 滝口 哲也, 有木 康雄, |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | 雑音下において音声認識を行う際,音声非音声の判定により音声区間検出(VAD: Voice Activity Detection)を行う必要がある.静かな状況ではゼロクロッシング法などにより区間検出を行うことが可能である.しかし雑音下,特に音声の大部分が雑音に埋もれてしまっているような状況においては,従来の手法では十分な結果を得ることができない.本稿では,雑音に対するロバストな音声区間検出の手法として,高次統計量として知られている3次キュムラント(3rd order cumulant)のBispectrumを用いて,PCAによる次元圧縮後,MFCC(Mel Frequency Cepstrum Coefficient)との初期統合を行う方法を提案する.実データを用いた実験により,提案手法の有効性を検証する. |
抄録(英) | The separation of speech and non-speech events is an important problem for speech recognition. In clean conditions, energy or zero-crossing features work well. However, a traditional voice activity detection (VAD) is not robust to noisy conditions, where speech signal is seriously contaminated by noise. A robust VAD algorithm based on the determination of the speech/non-speech bispectra of the third order auto-cumulants has been proposed. In this paper, we investigate the effectiveness of the integration between MFCC and the bispectra of the third order auto-cumulants. Experimental results show the proposed algorithm effective. |
キーワード(和) | キュムラント / 音声区間検出 / VAD / 高次統計量 |
キーワード(英) | cumulant / voice activity detection / VAD / higher order statistics |
資料番号 | NLC2006-44,SP2006-100 |
発行日 |
研究会情報 | |
研究会 | NLC |
---|---|
開催期間 | 2006/12/14(から1日開催) |
開催地(和) | |
開催地(英) | |
テーマ(和) | |
テーマ(英) | |
委員長氏名(和) | |
委員長氏名(英) | |
副委員長氏名(和) | |
副委員長氏名(英) | |
幹事氏名(和) | |
幹事氏名(英) | |
幹事補佐氏名(和) | |
幹事補佐氏名(英) |
講演論文情報詳細 | |
申込み研究会 | Natural Language Understanding and Models of Communication (NLC) |
---|---|
本文の言語 | JPN |
タイトル(和) | 3次キュムラントのBispectrumとMFCCの統合による音声区間検出の検討(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム) |
サブタイトル(和) | |
タイトル(英) | Voice Activity Detection with Integrated Bispectrum of 3rd Order Cumulant and MFCC |
サブタイトル(和) | |
キーワード(1)(和/英) | キュムラント / cumulant |
キーワード(2)(和/英) | 音声区間検出 / voice activity detection |
キーワード(3)(和/英) | VAD / VAD |
キーワード(4)(和/英) | 高次統計量 / higher order statistics |
第 1 著者 氏名(和/英) | 松田 博義 / Hiroyoshi MATSUDA |
第 1 著者 所属(和/英) | 神戸大学自然科学研究科 Graduated School of Science and Technology, Kobe University |
第 2 著者 氏名(和/英) | 滝口 哲也 / Tetsuya TAKIGUCHI |
第 2 著者 所属(和/英) | 神戸大学自然科学研究科 Graduated School of Science and Technology, Kobe University |
第 3 著者 氏名(和/英) | 有木 康雄 / Yasuo ARIKI |
第 3 著者 所属(和/英) | 神戸大学自然科学研究科 Graduated School of Science and Technology, Kobe University |
発表年月日 | 2006/12/14 |
資料番号 | NLC2006-44,SP2006-100 |
巻番号(vol) | vol.106 |
号番号(no) | 441 |
ページ範囲 | pp.- |
ページ数 | 6 |
発行日 |