講演抄録/キーワード |
講演名 |
2014-03-06 11:20
雑音環境下における音響的類似単語の認識について ○宮崎善行・荒金康人(レイトロン)・宮永喜一(北大) SIS2013-57 |
抄録 |
(和) |
本論文では,発音が似ていて認識が難しい単語の音声認識精度を改善する手法を提案する.子音が異なるだけで母音配列が同じ場合,雑音が少ない場合においても,子音に関するSNRが高くならないために,認識精度が悪くなる.そこで,HMMに基づく従来の雑音ロバスト音声認識を行った後に,発音が似ている単語ペアの音響的に差異のある区間を抽出し,特徴抽出をさらに詳細に行って,再度雑音ロバスト音声認識を行う.これにより,雑音環境下において発音が似ていて認識が難しい単語の平均認識率は,すべての場合で従来手法の認識率以上に改善することができた. |
(英) |
In this paper, we propose the method which improves the speech recognition accuracy of acoustically similar words. For example when there is a different consonant in two acoustically similar words where the sequences of their vowels are same, it is difficult to recognize them correctly under noise circumstances. In our propose system, after a conventional HMM based speech recognition is applied, acoustically difference in these words is estimated and then noise robust speech recognition is again applied for their precise speech features. As a result, it is shown that the recognition accuracy can be improved under any environments. |
キーワード |
(和) |
音声認識 / 音響的類似単語 / 雑音ロバスト / 隠れマルコフモデル / ビタビアライメント / / / |
(英) |
Speech recognition / similar words / Noise robust / Hidden Markov model / Viterbi alignment / / / |
文献情報 |
信学技報, vol. 113, no. 467, SIS2013-57, pp. 11-16, 2014年3月. |
資料番号 |
SIS2013-57 |
発行日 |
2014-02-27 (SIS) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
SIS2013-57 |
|