講演名 | 2004/12/14 非定常信号における雑音パワースペクトル密度のマルチチャンネル推定(ポスターセッション)(第6回音声言語シンポジウム) , 中村 哲 /, |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | 本稿は,非定常な音声や雑音が混ざった信号に対して,広帯域信号の時間.周波数領域におけるスパースネスを利用した雑音パワースペクトラム密度(PSD)推定法を提案する。提案手法は,ビームフォーマとポストフィルタ連結構造を持ち,耐雑音音声認識の面でも有効である。平均SN比が0dBの楽音含み音声信号に対し,4個の小型マイクロフォンアレーの適用実験を行い,所望の音声信号の品質を損なうことなく,またミュージカル雑音も生じさせずに13dB改善できる。さらに,連続数字の単語認識実験を行い,認識性能を改善することも示す。 |
抄録(英) | The proposed paper deals with the estimation of the power spectral density (PSD) of noise for mixtures of non-stationary wideband signals exploiting sparseness in the time-frequency domain. The proposed method is applied to realize a beam former-plus-post filter structure for noise-robust speech recognition. Experiments with a small-scale 4-sensor microphones array show that interfering speech and music can be suppressed by 13 dB for an average signal-to-noise ratio of 0 dB without impairing the quality of the desired speech signal and without introducing 'musical noise'. This noise suppression is reflected by the improvement of the word accuracy of a connected-digit speech recognizer. |
キーワード(和) | 雑音推定 / マイクロフォンアレー / ビームフォーミング / 音声認識 |
キーワード(英) | Noise estimation / microphone arrays / beam forming / speech recognition |
資料番号 | NLC2004-76,SP2004-116 |
発行日 |
研究会情報 | |
研究会 | SP |
---|---|
開催期間 | 2004/12/14(から1日開催) |
開催地(和) | |
開催地(英) | |
テーマ(和) | |
テーマ(英) | |
委員長氏名(和) | |
委員長氏名(英) | |
副委員長氏名(和) | |
副委員長氏名(英) | |
幹事氏名(和) | |
幹事氏名(英) | |
幹事補佐氏名(和) | |
幹事補佐氏名(英) |
講演論文情報詳細 | |
申込み研究会 | Speech (SP) |
---|---|
本文の言語 | ENG |
タイトル(和) | 非定常信号における雑音パワースペクトル密度のマルチチャンネル推定(ポスターセッション)(第6回音声言語シンポジウム) |
サブタイトル(和) | |
タイトル(英) | Multi-Channel Estimation of the Power Spectral Density of Noise for Mixtures of Non-Stationary Signals |
サブタイトル(和) | |
キーワード(1)(和/英) | 雑音推定 / Noise estimation |
キーワード(2)(和/英) | マイクロフォンアレー / microphone arrays |
キーワード(3)(和/英) | ビームフォーミング / beam forming |
キーワード(4)(和/英) | 音声認識 / speech recognition |
第 1 著者 氏名(和/英) | / Wolfgang HERBORDT |
第 1 著者 所属(和/英) | ATR音声言語コミュニケーション研究所 ATR Spoken Language Translation Research Laboratories |
第 2 著者 氏名(和/英) | 中村 哲 / / Satoshi NAKAMURA |
第 2 著者 所属(和/英) | ATR音声言語コミュニケーション研究所 / ATR Spoken Language Translation Research Laboratories |
発表年月日 | 2004/12/14 |
資料番号 | NLC2004-76,SP2004-116 |
巻番号(vol) | vol.104 |
号番号(no) | 542 |
ページ範囲 | pp.- |
ページ数 | 6 |
発行日 |