お知らせ 2023年度・2024年度 学生員 会費割引キャンペーン実施中です
お知らせ 技術研究報告と和文論文誌Cの同時投稿施策(掲載料1割引き)について
お知らせ 電子情報通信学会における研究会開催について
お知らせ NEW 参加費の返金について
電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
[ログイン]
技報アーカイブ
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2015-03-03 10:45
[ポスター講演]局所特徴,群遅延スペクトル,MFCC及びこれらの組み合わせの音素認識における有効性の検討
小泉理紗高木一幸電通大EA2014-108 SIP2014-149 SP2014-171
抄録 (和) 現在の音声処理技術では音響特徴量として,振幅スペクトルから得られるMFCC (Mel-Frequency Cepstrum Coefficients)や,その時間方向の変化特徴である$Delta$MFCCが一般に用いられている.しかし,これらの特徴量は振幅スペクトルの周波数方向の変化や,音声波形の位相情報は考慮していない.このような情報を表す特徴量としては局所特徴,群遅延スペクトルがあり,音声処理技術に有用であるという研究例がある.そこで,これらの特徴量の音声認識における有効性を検討する.局所特徴,群遅延スペクトル,MFCCを特徴量として学習した特定話者 (男性10名,女性10名)の音素HMMを用いて,特定話者,同性異話者,異性話者の条件で音素認識性能の評価を行った.その結果,局所特徴を用いた場合に最も高い認識率が得られたが,各特徴量に他の特徴量よりも精度良く認識できる音素があった.各特徴量の音素HMMの尤度を結合した尤度に基づいて行った音素認識では,各HMMを単独で用いた場合よりも高い認識率が得られた.このことから,局所特徴,群遅延スペクトル,MFCCを適切に組み合わせて用いることにより,話者性による認識率の低下を抑え,音声認識の性能を向上させられる可能性があることがわかった. 
(英) In most of current speech processing techniques, MFCC (Mel-Frequency Cepstrum Coefficients) obtained from amplitude spectrum and $Delta$MFCC calculated as time derivative of MFCC are widely used as acoustic features. However, these features consider neither frequency derivative of amplitude spectrum nor phase information of speech waveform. Local feature and group delay spectrum are among the features claimed by previous works to possess such information useful for speech processing. We therefore examine their effectiveness on speech recognition performance. We conducted phoneme recognition experiments using speaker-dependent (10 males, 10 females) phoneme HMMs trained with local feature, group delay spectrum, and MFCC in same speaker, same gender, and different gender conditions. We obtained highest recognition rate by local feature, while the other features showed better performance for some phonemes. Likelihood combination of local feature, group delay spectrum, and MFCC HMMs yielded better phoneme recognition rate than the case in which each HMM was used solely. Results show that it is promising that recognition performance degradation can be alleviated by a combination of local feature, group delay spectrum, and MFCC.
キーワード (和) 局所特徴 / 群遅延スペクトル / MFCC / 尤度結合 / 音素認識 / / /  
(英) local feature / group delay spectrum / MFCC / likelihood combination / phoneme recognition / / /  
文献情報 信学技報, vol. 114, no. 475, SP2014-171, pp. 197-200, 2015年3月.
資料番号 SP2014-171 
発行日 2015-02-23 (EA, SIP, SP) 
ISSN Print edition: ISSN 0913-5685    Online edition: ISSN 2432-6380
著作権に
ついて
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
PDFダウンロード EA2014-108 SIP2014-149 SP2014-171

研究会情報
研究会 SIP EA SP  
開催期間 2015-03-02 - 2015-03-03 
開催地(和) ホテルミヤヒラ(石垣島) 
開催地(英)  
テーマ(和) 電気音響,音声,信号処理一般 
テーマ(英)  
講演論文情報の詳細
申込み研究会 SP 
会議コード 2015-03-SIP-EA-SP 
本文の言語 日本語 
タイトル(和) 局所特徴,群遅延スペクトル,MFCC及びこれらの組み合わせの音素認識における有効性の検討 
サブタイトル(和)  
タイトル(英) Effectiveness of Local Feature, Group Delay Spectrum, MFCC and Their Combination on Phoneme Recognition Performance 
サブタイトル(英)  
キーワード(1)(和/英) 局所特徴 / local feature  
キーワード(2)(和/英) 群遅延スペクトル / group delay spectrum  
キーワード(3)(和/英) MFCC / MFCC  
キーワード(4)(和/英) 尤度結合 / likelihood combination  
キーワード(5)(和/英) 音素認識 / phoneme recognition  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 小泉 理紗 / Risa Koizumi / コイズミ リサ
第1著者 所属(和/英) 電気通信大学 (略称: 電通大)
The University of Electro-Communications (略称: UEC)
第2著者 氏名(和/英/ヨミ) 高木 一幸 / Kazuyuki Takagi / タカギ カズユキ
第2著者 所属(和/英) 電気通信大学 (略称: 電通大)
The University of Electro-Communications (略称: UEC)
第3著者 氏名(和/英/ヨミ) / /
第3著者 所属(和/英) (略称: )
(略称: )
第4著者 氏名(和/英/ヨミ) / /
第4著者 所属(和/英) (略称: )
(略称: )
第5著者 氏名(和/英/ヨミ) / /
第5著者 所属(和/英) (略称: )
(略称: )
第6著者 氏名(和/英/ヨミ) / /
第6著者 所属(和/英) (略称: )
(略称: )
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者 第1著者 
発表日時 2015-03-03 10:45:00 
発表時間 90分 
申込先研究会 SP 
資料番号 EA2014-108, SIP2014-149, SP2014-171 
巻番号(vol) vol.114 
号番号(no) no.473(EA), no.474(SIP), no.475(SP) 
ページ範囲 pp.197-200 
ページ数
発行日 2015-02-23 (EA, SIP, SP) 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会