お知らせ 2023年度・2024年度 学生員 会費割引キャンペーン実施中です
お知らせ 技術研究報告と和文論文誌Cの同時投稿施策(掲載料1割引き)について
お知らせ 電子情報通信学会における研究会開催について
お知らせ NEW 参加費の返金について
電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
[ログイン]
技報アーカイブ
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名
単語音声認識における時間変化を表現する特徴量の耐雑音性について
船田哲男梅野 恵野村英之金沢大SP2007-33
抄録 (和) 音声認識のための特徴量として,著者らは以前の報告で周波数軸方向のスペクトル傾斜を3値化した値に基づく特徴量FTTSS(Fourier Transform of Ternarized Spectral Slope)を提案した.一般的にHMM を用いた音声認識においては,HMM が原理的に区分的に定常な信号を表現する能力しか持たないため,特徴量の時間軸上の変動を加えることで性能の向上を図ることができる.特徴量FTTSS についても,それを抽出した後で時間差分ΔFTTSS を
とって認識に利用し,認識率の向上を図った.Δ量の計算にあたっては,フレームごとにスペクトルを表現するパラメータを求め,5フレーム程度の平均的な傾きを利用している.しかし,聴覚系では蝸牛管での周波数分析に始まり,下丘では周波数増減を検知するニューロンが存在することを考慮すると,スペクトルをパラメータ表現する前に,特定の周波数におけるスペクトルの時間的変動を直接抽出してからパラメータ表現する方法も考えられる.そこで本研究ではΔFTTSS に代わる特徴量として,短時間パワースペクトルの時間軸方向の傾斜に基づく特徴量FTTTS (Fourier Transform of Ternarized Temporal Slope)を提案する.FTTTSは傾斜値を3値化,時間平滑後周波数方向でフーリエ変換して得られる低次項で定義される特徴量である.雑音環境下における単語認識でΔFTTSS との比較によりその効果を実験的に検証する. 
(英) In previous paper, we proposed a feature FTTSS (Fourier Transform of Ternarized Spectral Slope) based on power spectral derivatives with regard to frequency to develop a robust word recognition system under noisy environments. Generally, word recognition using HMM is improved by adding features that express temporal variations, such as MFCC or FTTSS, because HMM can deal with only piecewise stationary signals. Actually, we have examined effectiveness of using FTTSS in word recognition. In computing Δ-quantity, average temporal slope of the parameter in several frames is used after transform- ing spectral pattern to spectral parameter. On the other hand, considering the frequency analysis in cochlear and existence of neurons fired by detecting peak frequency of spectrum going up or down in auditory inferior colliculus, it is supposed that fea- tures showing raw temporal variations of power spectrum are effective in speech recognition. In this research, we propose a new feature FTTTS (Fourier Transform of Ternarized Temporal Slope) instead of ΔFTTSS. The FTTTS is defined by Fourier Transform along frequency of smoothed ternarized temporal variations. Experimentally, we have confirmed noise robustness of the proposed feature FTTTS as compared with FTTSS.
キーワード (和) 音声認識 / 耐雑音性 / 時間変化特徴量 / / / / /  
(英) Speech Recognition / Noise Robustness / Temporal Feature / / / / /  
文献情報 信学技報, vol. 107, no. 165, SP2007-33, pp. 55-60, 2007年7月.
資料番号 SP2007-33 
発行日  
ISSN Print edition: ISSN 0913-5685    Online edition: ISSN 2432-6380
著作権に
ついて
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
PDFダウンロード SP2007-33

研究会情報
研究会 SP  
開催期間 2007-07-26 - 2007-07-27 
開催地(和) 富山県立大 
開催地(英) Toyama Prefectural University 
テーマ(和) 音声生成,知覚,聴覚・音声,一般 
テーマ(英) Speech Production, Speech Perception, Hearing and Speech, etc. 
講演論文情報の詳細
申込み研究会 SP 
会議コード 2007-07-SP 
本文の言語 日本語 
タイトル(和) 単語音声認識における時間変化を表現する特徴量の耐雑音性について 
サブタイトル(和)  
タイトル(英) On Noise Robustness of Feature Expressing Temporal Variation for Word Speech Recognition 
サブタイトル(英)  
キーワード(1)(和/英) 音声認識 / Speech Recognition  
キーワード(2)(和/英) 耐雑音性 / Noise Robustness  
キーワード(3)(和/英) 時間変化特徴量 / Temporal Feature  
キーワード(4)(和/英) /  
キーワード(5)(和/英) /  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 船田 哲男 / Tetsuo Funada / フナダ テツオ
第1著者 所属(和/英) 金沢大学 (略称: 金沢大)
Kanazawa University (略称: Kanazawa Univ.)
第2著者 氏名(和/英/ヨミ) 梅野 恵 / Megumi Umeno / ウメノ メグミ
第2著者 所属(和/英) 金沢大学 (略称: 金沢大)
Kanazawa University (略称: Kanazawa Univ.)
第3著者 氏名(和/英/ヨミ) 野村 英之 / Hideyuki Nomura / ノムラ ヒデユキ
第3著者 所属(和/英) 金沢大学 (略称: 金沢大)
Kanazawa University (略称: Kanazawa Univ.)
第4著者 氏名(和/英/ヨミ) / /
第4著者 所属(和/英) (略称: )
(略称: )
第5著者 氏名(和/英/ヨミ) / /
第5著者 所属(和/英) (略称: )
(略称: )
第6著者 氏名(和/英/ヨミ) / /
第6著者 所属(和/英) (略称: )
(略称: )
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者 第1著者 
発表日時  
発表時間 分 
申込先研究会 SP 
資料番号 SP2007-33 
巻番号(vol) vol.107 
号番号(no) no.165 
ページ範囲 pp.55-60 
ページ数
発行日  


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会