講演名 1993/10/14
CF^<-1>の整数倍での自己相関係数を考慮したSBCORスペクトル
梶田 将司, 板倉 文忠,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 音声の特徴抽出の目標は、音声波から音韻情報の損失ができるだけ少ないようにその特徴を抽出することである。その1つのアプローチとして、音声の特徴抽出システムとしてすでに存在する実際の聴覚系に学び、そこで行なわれている処理を聴覚生理・聴覚心理の観点から模擬することによって有効な特徴抽出を行なう方法が考えられる。これがいわゆる聴覚モデルである。その1つとして提案されたSeneffのモデルについて、「帯域を分割し、各チャネル信号の中心周波数の逆数の自己相関を検出する」ことのみに着目した処理法として、我々は帯域分割自己相関分析法(SBCOR分析法)を提案し、音声認識・音声分析への適用を検討している。本報告では、聴神経発火に見られるringing現象に基づき、自己相関検出時に中心周波数(Center Frequency or Characteristic Frequency:CF)の逆数の自己相関係数だけでなく、その整数倍の自己相関係数との重み付け和(Multi-Delay Weighting:MDW処理)からSBCORスペクトルを求める方法を提案し、音素列の類似のため認識誤りを生じ易い日本都市名単語68対を用いたDTW音声認識により評価した。その結果、リファレンスパタンはSN比に応じてMDW処理を施したものを用意し、認識時はMDW処理を施さずに抽出したSBCORスペクトルを用いることにより、雑音に対するロバスト性が向上することが分かった。
抄録(英) The target of extracting speech features from speech signals is to extract them without phonetic information loss.One approach to do so is to use an auditory model.We have proposed the ″Subband-Au tocorrelation Analysis(SBCOR Analysis)″,which simplified Seneff′s model,and investigated how to apply it to speech analysis and speech recognition.In this paper,SBCOR spectrum is calculated from the weighted sum of autocorrelation coefficients at multiples of CF^-1>(Multi-Delay Weighting:MDW).This is based on the ringing phenomenon in firing patterns of an auditory nerve fiber.The evaluation is performed by a DTW word recognition system that contains phonetically very similar 68 Japanese city-name pairs.The results indicate that SBCOR spectrum with MDW is more robust against noise than conventional SBCOR spectrum for the case of recognition using SBCOR spectrum with MDW as reference patterns.
キーワード(和) 聴覚モデル / フィルタバンク / Bark スケール / 自己相関係数 / DPマッチング / 平 滑化群遅延スペクトル
キーワード(英) auditory model / filterbank / Bark scale / autocorrelation coefficients / DP matching / smoothed group delay spectrum
資料番号 SP93-64,DSP93-65
発行日

研究会情報
研究会 SP
開催期間 1993/10/14(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Speech (SP)
本文の言語 JPN
タイトル(和) CF^<-1>の整数倍での自己相関係数を考慮したSBCORスペクトル
サブタイトル(和)
タイトル(英) SBCOR Spectrum Taking Autocorrelation Coefficients at Integer Multiples of CF^-1> into Account
サブタイトル(和)
キーワード(1)(和/英) 聴覚モデル / auditory model
キーワード(2)(和/英) フィルタバンク / filterbank
キーワード(3)(和/英) Bark スケール / Bark scale
キーワード(4)(和/英) 自己相関係数 / autocorrelation coefficients
キーワード(5)(和/英) DPマッチング / DP matching
キーワード(6)(和/英) 平 滑化群遅延スペクトル / smoothed group delay spectrum
第 1 著者 氏名(和/英) 梶田 将司 / Shoji Kajita
第 1 著者 所属(和/英) 名古屋大学工学部情報工学科
Department of Information Engineering,School of Engineering,Nagoya University
第 2 著者 氏名(和/英) 板倉 文忠 / Fumitada Itakura
第 2 著者 所属(和/英) 名古屋大学工学部電子情報学科
Department of Electronics Information,School of Engineering,Nagoya University
発表年月日 1993/10/14
資料番号 SP93-64,DSP93-65
巻番号(vol) vol.93
号番号(no) 266
ページ範囲 pp.-
ページ数 8
発行日