講演名 2003/6/19
メルケプストラムを用いたロバスト音声区間検出(信号処理,LSI,及び一般)
和田 直哉, 早坂 昇, 宮永 喜一, 畑岡 信夫,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本稿では,MFCC(Mel Frequency Cepstral Coefficients)およびその分析過程におけるフィルタバンク出力に着目した雑音ロバスト音声認識システムのための新しい音声区間検出手法を提案する。MFCCは音声認識のための音声特徴パラメータであり、従来区間検出に用いられる対数エネルギーよりも雑音の影響を受けにくい。またその過程で生成されるフィルタバンク出力は音声の周波数別の特性を表し、これを効果的に利用することで子音情報を補償することができる。区間検出の評価にはMFCCとフィルタバンク出力の組み合わせにより得られる基準量、およびその差分により得られる基準量の2つが用いられ、非音声区間の雑音の影響を低減することができる。実験により本手法を取り入れた音声認識システムは、従来の音声認識システムと比べて高い認識率を示した。
抄録(英) In this report, we proopse a new speech recognition technique which extracts the speech data from noisy speeches. MFCC is used as speech features themselves for speech recognition and is more robust for the speech detection than log energy which is ordinary used as the eveluation value in the speech detection. Filterbank outputs in MFCC mean speech characteristics which changes in response to covered frequency bands. The optimum use of them compensates the consonants data. The combination of MFCC and Filterbank outputs and their fusion are used as the evaluation values in speech detection. It reduces the noise influences in the non-speech periods. The speech recognition system using the proposed speech detection quite improves recognition rates and noise robustness.
キーワード(和) 音声区間検出 / 音声認識 / 雑音ロバスト / MFCC / フィルタバンク
キーワード(英) speech detection / speech recognition / noise robust / MFCC / filterbank output
資料番号 CAS2003-5,VLD2003-15,DSP2003-35
発行日

研究会情報
研究会 VLD
開催期間 2003/6/19(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 VLSI Design Technologies (VLD)
本文の言語 JPN
タイトル(和) メルケプストラムを用いたロバスト音声区間検出(信号処理,LSI,及び一般)
サブタイトル(和)
タイトル(英) A Noise Robust Speech Detection System using MFCC analysis
サブタイトル(和)
キーワード(1)(和/英) 音声区間検出 / speech detection
キーワード(2)(和/英) 音声認識 / speech recognition
キーワード(3)(和/英) 雑音ロバスト / noise robust
キーワード(4)(和/英) MFCC / MFCC
キーワード(5)(和/英) フィルタバンク / filterbank output
第 1 著者 氏名(和/英) 和田 直哉 / Naoya WADA
第 1 著者 所属(和/英) 北海道大学大学院工学研究科通信システム工学分野
Graduate School of Engineering, Hokkaido University
第 2 著者 氏名(和/英) 早坂 昇 / Noboru HAYASAKA
第 2 著者 所属(和/英) 北海道大学大学院工学研究科通信システム工学分野
Graduate School of Engineering, Hokkaido University
第 3 著者 氏名(和/英) 宮永 喜一 / Yaoshikazu MIYANAGA
第 3 著者 所属(和/英) 北海道大学大学院工学研究科通信システム工学分野
Graduate School of Engineering, Hokkaido University
第 4 著者 氏名(和/英) 畑岡 信夫 / Nobuo HATAOKA
第 4 著者 所属(和/英) 日立製作所中央研究所
Central Research Laboratory, Hitachi Ltd.
発表年月日 2003/6/19
資料番号 CAS2003-5,VLD2003-15,DSP2003-35
巻番号(vol) vol.103
号番号(no) 144
ページ範囲 pp.-
ページ数 6
発行日