講演名 2003/11/20
非直線関数を用いたスペクトル規則変形による耐雑音音声認識
吉田 一樹, 秋田 昌憲, 緑川 洋一,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本報告では、雑音環境音声認識のためのスペクトル規則変形法における改善策の一つとして、非直線しきい値関数を用いる方法を提案し、認識実験そのパラメータ評価について示す。雑音環境音声認識への対応法としてスペクトルレベルで考える場合、スペクトルサブトラクション法が一般的に利用されている。当研究室では、これを簡易化し、雑音環境への対応をロバストにするため、スペクトルの規則変形法を提案してきた。これは、重畳雑音の影響で欠落する、母音性音素の谷に当たる部分を規則で補正するものであるが、雑音の条件などによって、高周波数領域で谷が誤付加される現象が見られた。ここでは、その谷の誤付加の解消と、その前段階の簡易スペクトルサブトラクションの改良を目的として、複数の曲線形しきい値関数を提案している。このしきい値関数と、従来型谷付加規則の改良法を組み合わせることによって、特に低周波数部分に雑音成分が集中する環境上での認識に関して、その性能改善が見られることを示している。
抄録(英) This report shows the spectral modification method for speech signals polluted with noise. In this case, the spectral subtraction method is usually used. Instead of the spectral subtraction method, the spectral features of noisy signals are modified using some suitable rules in our laboratory and effectiveness of the methods has already been shown. However, irregular modifications occur in case the background environment is polluted with colored noise. In this paper, improved modification rules for adding valleys to the spectral envelopes of signals under the noise environment is presented. Three types of the non-linear threshold functions are presented and the stability of the intersection point between threshold functions and original spectral envelopes improved. The improvement of the spectral shape after this modification is shown and experimental results of pattern recognition using Japanese digits are also shown for evaluating presented threshold functions.
キーワード(和) 音声認識 / 雑音環境 / スペクトルサブトラクション / メルケプストラム / 有色雑音
キーワード(英) Speech recognition / Noisy environment / Spectral subtraction / Mel-cepstrum / Colored noise
資料番号 EA2003-102
発行日

研究会情報
研究会 EA
開催期間 2003/11/20(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Engineering Acoustics (EA)
本文の言語 JPN
タイトル(和) 非直線関数を用いたスペクトル規則変形による耐雑音音声認識
サブタイトル(和)
タイトル(英) Speech Recognition under the Noisy Environment using Modification of Spectral Envelopes by Rules and Non-linear Threshold Functions
サブタイトル(和)
キーワード(1)(和/英) 音声認識 / Speech recognition
キーワード(2)(和/英) 雑音環境 / Noisy environment
キーワード(3)(和/英) スペクトルサブトラクション / Spectral subtraction
キーワード(4)(和/英) メルケプストラム / Mel-cepstrum
キーワード(5)(和/英) 有色雑音 / Colored noise
第 1 著者 氏名(和/英) 吉田 一樹 / Kazuki YOSHIDA
第 1 著者 所属(和/英) 大分大学工学部
Faculty of Engineering, Oita University
第 2 著者 氏名(和/英) 秋田 昌憲 / Masanori AKITA
第 2 著者 所属(和/英) 大分大学工学部
Faculty of Engineering, Oita University
第 3 著者 氏名(和/英) 緑川 洋一 / Yoichi MIDORIKAWA
第 3 著者 所属(和/英) 大分大学工学部
Faculty of Engineering, Oita University
発表年月日 2003/11/20
資料番号 EA2003-102
巻番号(vol) vol.103
号番号(no) 471
ページ範囲 pp.-
ページ数 6
発行日