講演名 2007-05-31
音素PCAを用いた残響下における音声特徴量抽出
朴 玄信, 滝口 哲也, 有木 康雄,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本稿では,PCA (Principal Component Analysis)に基づく新しい固有音素部分空間法を用いた残響にロバストな特徴量抽出法を提案する.雑音にロバストな特徴量抽出手法は多く提案されているが,加法性あるいは乗法性雑音を完璧に抑圧するのは難しい問題として残されている.特に非定常雑音を推定し,抑圧するのは難しい.音声認識分野において最も使われている特徴量はMFCCである.MFCCは対数メル周波数フィルタバンク出力にDCTを適用することにより得られる特徴量である.DCTの代わりにPCAを用いることで,観測データの主な音韻成分は低次特徴設空間へ射影され,加法性あるいは乗法性雑音は高次特徴量空間へ射影される.本論文ではPCA手法と部分空間法をベースに音素PCA手法を提案する.各音素データに対してPCAを行い,得られた各音素部分空間をマージした固有音素部分空間を新しい特微量空間とする手法である.この空間上のベクトルを音素ベクトルとする.評価実験により,提案手法の特微量は従来手法より残響時間が長くなるほど有効であることが確認できた.
抄録(英) In this paper, we propose a novel subspace approach for robust speech feature extraction in reverberant environments using PCA. While much research for robust speech feature extraction has been done, it remains difficult to completely remove additive or convolutional noise. Particularly, it is difficult to estimate and suppress nonstationary noise. The most commonly used speech feature for speech recognition is MFCC that is computed applying DCT to the mel-scale filter bank output. Using PCA instead of DCT, where the main speech element is projected onto low-order features while the additive or convolutional noise is projected onto high-order features, speech recognition is improved. We propose Phoneme-PCA that is applying PCA to specific phoneme data set and merging subspaces representing unique feature in each phoneme. The performance evaluation shows that the proposed method provides a higher noise reduction and speech recognition accuracy compared with conventional methods.
キーワード(和) 主成分分析 / 部分空間法 / 音素ベクトル / 残響抑制 / 単語認識
キーワード(英) PCA / Subspace method / Phoneme vector / Suppression of reverberation / Word recognition
資料番号 SP2007-1
発行日

研究会情報
研究会 SP
開催期間 2007/5/24(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Speech (SP)
本文の言語 JPN
タイトル(和) 音素PCAを用いた残響下における音声特徴量抽出
サブタイトル(和)
タイトル(英) Feature Extraction Using Phoneme PCA for Reverberant Speech Recognition
サブタイトル(和)
キーワード(1)(和/英) 主成分分析 / PCA
キーワード(2)(和/英) 部分空間法 / Subspace method
キーワード(3)(和/英) 音素ベクトル / Phoneme vector
キーワード(4)(和/英) 残響抑制 / Suppression of reverberation
キーワード(5)(和/英) 単語認識 / Word recognition
第 1 著者 氏名(和/英) 朴 玄信 / Hyunsin PARK
第 1 著者 所属(和/英) 神戸大学工学研究科
Graduate School of Engineering, Kobe University
第 2 著者 氏名(和/英) 滝口 哲也 / Tetsuya TAKIGUCHI
第 2 著者 所属(和/英) 神戸大学工学研究科
Graduate School of Engineering, Kobe University
第 3 著者 氏名(和/英) 有木 康雄 / Yasuo ARIKI
第 3 著者 所属(和/英) 神戸大学工学研究科
Graduate School of Engineering, Kobe University
発表年月日 2007-05-31
資料番号 SP2007-1
巻番号(vol) vol.107
号番号(no) 77
ページ範囲 pp.-
ページ数 6
発行日