講演抄録/キーワード |
講演名 |
2010-12-21 11:30
連続マッチング回路を用いた子音の特徴抽出による音声認識方法 ○野中 淳・岡本佳太・田向 権・関根優年(東京農工大) NLC2010-22 SP2010-95 |
抄録 |
(和) |
人間の聴覚は二つの耳から流入した音に対し, 頑健性のある前処理を施すことで, 音の特徴量や発生位置などを即座に抽出する. このとき,聴覚では周波数弁別が行われている.蝸牛処理回路による日本語母音判別は報告済みである.本報告では,聴覚前処理での子音判別方法として連続マッチング回路を提案する.本方式は実時間処理かつ子音テンプレート長に非依存であり,連続認識へも適用可能である.FPGAに本方式の回路を実装し,多重解像度化したテンプレートマッチングがほぼ実時間で動作した.また,連続マッチングにより得られた結果と周波数情報による分類とで子音認識を行ったところ、子音の認識率は高確率であった.提案手法の有用性を確認することが出来た. |
(英) |
The human audition extracts voice characteristics from the sounds flowing into two ears. The recognition circuit of the vowel sound in Japanese has been reported by using a cochlea modeled. In this report, we propose a consonant recognition method inspired by the preprocessing circuits for human audition. In the proposed method, we also propose a pipelined consecutive matching circuits for the consonant recognition. The proposed circuit worked in success as a real-time processing circuit for the voice recognition, because it is independent from the length of consonant templates. In order to realize the proposed system, we implemented the circuit with FPGA board. As expected, the circuit achieved real-time template matching with the multiresolution analysis. In addition, the result shows that the circuit can classify the consonant almost completely. |
キーワード |
(和) |
子音認識 / テンプレート・マッチング / 多重解像度解析 / FPGA / 音声認識 / / / |
(英) |
Consonant Recognition / Template Matching / Multiresolution / FPGA / Speech Recognition / / / |
文献情報 |
信学技報, vol. 110, no. 357, SP2010-95, pp. 83-88, 2010年12月. |
資料番号 |
SP2010-95 |
発行日 |
2010-12-13 (NLC, SP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
NLC2010-22 SP2010-95 |
|