講演抄録/キーワード |
講演名 |
単語音声認識における時間変化を表現する特徴量の耐雑音性について ○船田哲男・梅野 恵・野村英之(金沢大) SP2007-33 |
抄録 |
(和) |
音声認識のための特徴量として,著者らは以前の報告で周波数軸方向のスペクトル傾斜を3値化した値に基づく特徴量FTTSS(Fourier Transform of Ternarized Spectral Slope)を提案した.一般的にHMM を用いた音声認識においては,HMM が原理的に区分的に定常な信号を表現する能力しか持たないため,特徴量の時間軸上の変動を加えることで性能の向上を図ることができる.特徴量FTTSS についても,それを抽出した後で時間差分ΔFTTSS を
とって認識に利用し,認識率の向上を図った.Δ量の計算にあたっては,フレームごとにスペクトルを表現するパラメータを求め,5フレーム程度の平均的な傾きを利用している.しかし,聴覚系では蝸牛管での周波数分析に始まり,下丘では周波数増減を検知するニューロンが存在することを考慮すると,スペクトルをパラメータ表現する前に,特定の周波数におけるスペクトルの時間的変動を直接抽出してからパラメータ表現する方法も考えられる.そこで本研究ではΔFTTSS に代わる特徴量として,短時間パワースペクトルの時間軸方向の傾斜に基づく特徴量FTTTS (Fourier Transform of Ternarized Temporal Slope)を提案する.FTTTSは傾斜値を3値化,時間平滑後周波数方向でフーリエ変換して得られる低次項で定義される特徴量である.雑音環境下における単語認識でΔFTTSS との比較によりその効果を実験的に検証する. |
(英) |
In previous paper, we proposed a feature FTTSS (Fourier Transform of Ternarized Spectral Slope) based on power spectral derivatives with regard to frequency to develop a robust word recognition system under noisy environments. Generally, word recognition using HMM is improved by adding features that express temporal variations, such as MFCC or FTTSS, because HMM can deal with only piecewise stationary signals. Actually, we have examined effectiveness of using FTTSS in word recognition. In computing Δ-quantity, average temporal slope of the parameter in several frames is used after transform- ing spectral pattern to spectral parameter. On the other hand, considering the frequency analysis in cochlear and existence of neurons fired by detecting peak frequency of spectrum going up or down in auditory inferior colliculus, it is supposed that fea- tures showing raw temporal variations of power spectrum are effective in speech recognition. In this research, we propose a new feature FTTTS (Fourier Transform of Ternarized Temporal Slope) instead of ΔFTTSS. The FTTTS is defined by Fourier Transform along frequency of smoothed ternarized temporal variations. Experimentally, we have confirmed noise robustness of the proposed feature FTTTS as compared with FTTSS. |
キーワード |
(和) |
音声認識 / 耐雑音性 / 時間変化特徴量 / / / / / |
(英) |
Speech Recognition / Noise Robustness / Temporal Feature / / / / / |
文献情報 |
信学技報, vol. 107, no. 165, SP2007-33, pp. 55-60, 2007年7月. |
資料番号 |
SP2007-33 |
発行日 |
|
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
SP2007-33 |
研究会情報 |
研究会 |
SP |
開催期間 |
2007-07-26 - 2007-07-27 |
開催地(和) |
富山県立大 |
開催地(英) |
Toyama Prefectural University |
テーマ(和) |
音声生成,知覚,聴覚・音声,一般 |
テーマ(英) |
Speech Production, Speech Perception, Hearing and Speech, etc. |
講演論文情報の詳細 |
申込み研究会 |
SP |
会議コード |
2007-07-SP |
本文の言語 |
日本語 |
タイトル(和) |
単語音声認識における時間変化を表現する特徴量の耐雑音性について |
サブタイトル(和) |
|
タイトル(英) |
On Noise Robustness of Feature Expressing Temporal Variation for Word Speech Recognition |
サブタイトル(英) |
|
キーワード(1)(和/英) |
音声認識 / Speech Recognition |
キーワード(2)(和/英) |
耐雑音性 / Noise Robustness |
キーワード(3)(和/英) |
時間変化特徴量 / Temporal Feature |
キーワード(4)(和/英) |
/ |
キーワード(5)(和/英) |
/ |
キーワード(6)(和/英) |
/ |
キーワード(7)(和/英) |
/ |
キーワード(8)(和/英) |
/ |
第1著者 氏名(和/英/ヨミ) |
船田 哲男 / Tetsuo Funada / フナダ テツオ |
第1著者 所属(和/英) |
金沢大学 (略称: 金沢大)
Kanazawa University (略称: Kanazawa Univ.) |
第2著者 氏名(和/英/ヨミ) |
梅野 恵 / Megumi Umeno / ウメノ メグミ |
第2著者 所属(和/英) |
金沢大学 (略称: 金沢大)
Kanazawa University (略称: Kanazawa Univ.) |
第3著者 氏名(和/英/ヨミ) |
野村 英之 / Hideyuki Nomura / ノムラ ヒデユキ |
第3著者 所属(和/英) |
金沢大学 (略称: 金沢大)
Kanazawa University (略称: Kanazawa Univ.) |
第4著者 氏名(和/英/ヨミ) |
/ / |
第4著者 所属(和/英) |
(略称: )
(略称: ) |
第5著者 氏名(和/英/ヨミ) |
/ / |
第5著者 所属(和/英) |
(略称: )
(略称: ) |
第6著者 氏名(和/英/ヨミ) |
/ / |
第6著者 所属(和/英) |
(略称: )
(略称: ) |
第7著者 氏名(和/英/ヨミ) |
/ / |
第7著者 所属(和/英) |
(略称: )
(略称: ) |
第8著者 氏名(和/英/ヨミ) |
/ / |
第8著者 所属(和/英) |
(略称: )
(略称: ) |
第9著者 氏名(和/英/ヨミ) |
/ / |
第9著者 所属(和/英) |
(略称: )
(略称: ) |
第10著者 氏名(和/英/ヨミ) |
/ / |
第10著者 所属(和/英) |
(略称: )
(略称: ) |
第11著者 氏名(和/英/ヨミ) |
/ / |
第11著者 所属(和/英) |
(略称: )
(略称: ) |
第12著者 氏名(和/英/ヨミ) |
/ / |
第12著者 所属(和/英) |
(略称: )
(略称: ) |
第13著者 氏名(和/英/ヨミ) |
/ / |
第13著者 所属(和/英) |
(略称: )
(略称: ) |
第14著者 氏名(和/英/ヨミ) |
/ / |
第14著者 所属(和/英) |
(略称: )
(略称: ) |
第15著者 氏名(和/英/ヨミ) |
/ / |
第15著者 所属(和/英) |
(略称: )
(略称: ) |
第16著者 氏名(和/英/ヨミ) |
/ / |
第16著者 所属(和/英) |
(略称: )
(略称: ) |
第17著者 氏名(和/英/ヨミ) |
/ / |
第17著者 所属(和/英) |
(略称: )
(略称: ) |
第18著者 氏名(和/英/ヨミ) |
/ / |
第18著者 所属(和/英) |
(略称: )
(略称: ) |
第19著者 氏名(和/英/ヨミ) |
/ / |
第19著者 所属(和/英) |
(略称: )
(略称: ) |
第20著者 氏名(和/英/ヨミ) |
/ / |
第20著者 所属(和/英) |
(略称: )
(略称: ) |
講演者 |
第1著者 |
発表日時 |
|
発表時間 |
分 |
申込先研究会 |
SP |
資料番号 |
SP2007-33 |
巻番号(vol) |
vol.107 |
号番号(no) |
no.165 |
ページ範囲 |
pp.55-60 |
ページ数 |
6 |
発行日 |
|
|