講演抄録/キーワード |
講演名 |
2013-01-29 16:45
音声認識システムにおける音素前処理回路 ○岡本佳太・荻島祐一・田向 権・関根優年(東京農工大) CAS2012-92 |
抄録 |
(和) |
人間の聴覚は雑音環境下であっても音声認識や音源の方向推定を即座に行うことができる.これを可能としているのは聴覚前処理部である蝸牛と呼ばれる器官の働きが大きいと考えられている.そこで本研究では蝸牛内のリンパ液による音波の減衰を離散Wavelet変換による多重解像度解析により模擬する.先行研究において,母音認識と子音認識が行われており,蝸牛内での複雑な処理の模擬をハードウェア化し,FPGAを用いて実装した.今回はこれらを音素認識回路として1つに統合し,その際必要となる処理を加えたうえで,その回路規模がどの程度のものになるか検証するとともに,システム全体の認識における有用性の評価も行った. |
(英) |
The human audition can quickly estimate direction of sound and realize speech recognition under the noisy environment. It is thought that an auditory preprocessing organ called cochlea has the function. Therefore, this study mimics an attenuation of sound by lymph fluid in the cochlea using a multiresolution analysis by discrete wavelet transform. In our previous study, a vowel and consonant recognition systems have been developed.In these systems, circuit implemented in FPGA mimics the complex processing of the cochlea. In this study, we integrated them as a phoneme recognition circuit, and we also added process required at that time. In order to show its effectiveness, we verified the circuit size and recognition rate of the proposed system. |
キーワード |
(和) |
母音認識 / 子音認識 / 音声認識 / FPGA / 多重解像度解析 / テンプレートマッチング / / |
(英) |
Vowel Recognition / Consonant Recognition / Speech Recognition / FPGA / Multiresolution analysisi / Template Matching / / |
文献情報 |
信学技報, vol. 112, no. 418, CAS2012-92, pp. 143-148, 2013年1月. |
資料番号 |
CAS2012-92 |
発行日 |
2013-01-21 (CAS) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
CAS2012-92 |