講演抄録/キーワード |
講演名 |
2008-07-17 14:00
確率モデルに基づく音声区間検出と雑音抑圧の統合法の評価と考察 ○藤本雅清・石塚健太郎・中谷智広(NTT) SP2008-45 |
抄録 |
(和) |
本研究では,雑音下音声認識における頑健なフロントエンド処理について述べる.
通常,雑音下音声認識のフロントエンド処理としては,音声区間検出(VAD: Voice Activity Detection)と雑音抑圧が用いられるが,多くの場合,これら二つの技術を単純に繋ぎ合わせるだけに留まっていた.しかし,それぞれの技術が出力する情報は,それぞれを改善するのに有益な情報が多い.従って,高性能なフロントエンド処理を実現するためには,技術の単純なつなぎ合わせではなく,相互に情報のやり取りが行える処理機構が必要となる.よって本研究では,VADと雑音抑圧を統合的に扱うフロントエンド処理について検討を行う.
また,VADにおける尤度の結合方法,音響分析条件とVAD,音声認識性能の関係について調査を行う. |
(英) |
This paper addresses robust front-end processing for automatic speech recognition (ASR) in noisy environments.
Usually, noise suppression (NS) is used for the front-end processing of ASR in noise.
VAD and NS are typically combined as series processing. However, VAD and NS should not be assumed to be a separate technique, because the output information of these methods be mutually beneficial. Thus, we investigate the integrated front-end processing of VAD and NS, which can utilize each others' input-output information.
In addition, we examine the method of likelihood combination for VAD and relation between acoustical analisys condition and VAD through the experiments. |
キーワード |
(和) |
確率モデル / 音声区間検出 / 雑音抑圧 / 統合的フロントエンド処理 / 音声認識 / / / |
(英) |
statistical model / voice activity detection / noise suppression / integrated front-end processing / speech recognition / / / |
文献情報 |
信学技報, vol. 108, no. 142, SP2008-45, pp. 13-18, 2008年7月. |
資料番号 |
SP2008-45 |
発行日 |
2008-07-10 (SP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
SP2008-45 |