講演抄録/キーワード |
講演名 |
2009-01-29 14:45
耐雑音音声認識のためのハフ変換による基本周波数情報抽出の高速化 ○安井英己・篠田浩一・古井貞煕(東工大)・岩野公司(武蔵工大) SP2008-129 |
抄録 |
(和) |
ハフ変換により得られる基本周波数($F_0$)情報を利用することで雑音環境下での音声認識性能の向上が確認されている. しかし, ハフ変換による$F_0$抽出に膨大な計算量を必要とするため, リアルタイムでの動作が困難である. 本稿では, ハフ変換による$F_0$抽出の高速化を提案する. 前フレームにおいて$F_0$を抽出する際に用いた$m$-$c$平面の投票値を再利用することで, 計算量を削減することができる. 新聞記事読み上げ音声コーパスと電子協騒音データベースを用いた評価実験を行った. スペクトルサブトラクション法を併用した場合, $F_0$情報利用による単語正解精度の改善は平均1.5ポイントであった. また, 従来手法に比べ$F_0$抽出の計算量が44.7\%削減された. |
(英) |
While $F_0$ information obtained by Hough transform has been shown to be effective in speech recognition in noisy environment, it is difficult to use in real time applications because the computational costs for Hough transform is relatively high. This paper proposes an efficient $F_0$ extraction method using Hough transform. The number of frames perfoming Hough transform is reduced by reusing the voting values on the $m$-$c$ plane calculated in the previous frames. We performed the evaluation experiments using the Japanese Newspaper Article Sentences and the JEIDA-NOISE database. Improvement of word accuracy on average over all the noise conditions was 1.5 points. In comparison with our previous study, computational costs for $F_0$ extraction was reduced by 44.7\%. |
キーワード |
(和) |
ハフ変換 / 基本周波数情報 / 高速化 / スペクトルサブトラクション / 雑音環境下音声認識 / / / |
(英) |
Hough transform / fundamental frequency information / speeding up / spectral subtraction / noise robust speech recognition / / / |
文献情報 |
信学技報, vol. 108, no. 422, SP2008-129, pp. 19-24, 2009年1月. |
資料番号 |
SP2008-129 |
発行日 |
2009-01-22 (SP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
SP2008-129 |