講演抄録/キーワード |
講演名 |
2011-09-22 13:40
孤立単語音声認識を用いた雑音ロバストキーワードスポッティング ○高橋 亘・宮永喜一(北大) SIS2011-37 |
抄録 |
(和) |
本研究では,雑音環境下での連続音声からキーワードスポッティングを行った.
提案手法は雑音ロバスト孤立単語音声認識を連続音声に適用することでキーワー
ドを抽出する.この手法ではハードウェアの構成法である超並列処理を用いるこ
とで実時間での処理を目指している.本研究ではこの手法を超並列音声認識と呼
ぶ.連続音声を複数の区間に分割し,それぞれの区間に単語音声認識を処理する
ことでキーワードの区間を推定することができる.また,キーワードスポッティ
ングを行う際,キーワード以外の音声や非音声を認識結果としては認識精度が下
がる.よって,それらの結果を棄却する処理が必要となる.棄却処理には認識処
理で得られる尤度を用いて棄却するかを判定する.超並列音声認識を行うことで
複数の認識結果が得られるため,これらの情報を総合しすることで棄却処理の信
頼性を向上させることができる.超並列音声認識によるキーワードスポッティン
グを行った結果,雑音環境下でも高い認識率を得ることができた. |
(英) |
In this report, we performed a keyword spotting from cotinuous speech under noisy environments. The proposed algorithm is based on the robust isolated word recognition and it is applied for the continuous speech. Super parallel calculation mechanism is embedded into the proposed method. We can realize real time processing using its parallel structure in a hardware system.
This paper calls super-parallel automatic speech recognition (SP-ASR).
The method can estimate the section of the keywords and recognize it from continuous speech. If a speech except the keywords and non-speech are given during this recognition, the recognition accuracy is degraded.
Therefore, the new processing which rejects the unsuitable results is necessary.By using the likelihoods into speech recognition, the new rejection algorism is
implemented.
Some recognition results are computed by SP-ASR and the reliability of the recognition and the rejection can be improved.
We finally show a result that high recognition ratio could be obtained by
performing keyword spotting in SP-ASR from continuous speech under noisy environments. |
キーワード |
(和) |
キーワードスポッティング / 音声認識 / 雑音ロバスト / 棄却 / / / / |
(英) |
keyword spotting / speech recognition / noise robust / rejection / / / / |
文献情報 |
信学技報, vol. 111, no. 210, SIS2011-37, pp. 105-109, 2011年9月. |
資料番号 |
SIS2011-37 |
発行日 |
2011-09-14 (SIS) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
SIS2011-37 |