講演抄録/キーワード |
講演名 |
2012-12-13 14:45
雑音環境下における破裂音に対するロバスト音声認識 ○橋本祐介・高橋 亘・宮永喜一(北大) SIS2012-37 |
抄録 |
(和) |
本論文は,破裂音に対してロバストな音声認識手法を提案する.
破裂音の特徴は,クリーン音声においても表れにくく,雑音音声では雑音の影響を受け波形が歪むため,さらに検出が難しい.
それ故に,破裂音を含む単語の認識は困難である.
本手法では,初めに破裂音の音声区間を検出し,次に破裂音の特徴を捉えるため,フレーム幅を短くして特徴量を計算し,HMMによる単語認識を行う.
結果,雑音環境下において,認識率を7$\%$改善した.
また,バブルノイズを含む音声に対しては認識率を約15$\%$改善した. |
(英) |
In this papar, we propose robust speech recognition for plosive sounds under noisy environment.
The proposed method employs a simple algorithm and causes a good effect for the improvement of recognition rate among plosive sounds.
The proposed method first detects all small parts including plosive sounds automatically and recognizes them by using a short time frame speech features.
As a result, the proposed method improves the recognition rate 7$\%$ under noisy speech.
In addition, the recognition rate is improved about 15$\%$ for sounds added with babble noise.
These experiments indicate that the proposed method is effective for speech under noisy environments. |
キーワード |
(和) |
音声認識 / 単語認識 / 破裂音 / 隠れマルコフモデル / 音声区間検出 / / / |
(英) |
Speech Recognition / Word Recognition / Plosive Sound / Hidden Markov Model / Voice Activity Detection / / / |
文献情報 |
信学技報, vol. 112, no. 348, SIS2012-37, pp. 39-43, 2012年12月. |
資料番号 |
SIS2012-37 |
発行日 |
2012-12-06 (SIS) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
SIS2012-37 |