講演名 2010-01-22
連続マッチング回路を用いた子音認識方法(一般セッション,クロスモーダル)
野中 淳, 小瀧 浩, 田向 権, 関根 優年,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 人間の聴覚は二つの耳から流入した音に対し,頑健性のある前処理を施すことで,音の特徴量や発生位置などを即座に抽出することができる.このとき,聴覚では周波数弁別が行われ,多重解像度により処理が行われている.蝸牛の処理を模擬するモデルの回路により,日本語の母音においては母音の判別が可能であり,有用性が確認されている.本研究では,聴覚前処理による子音判別が可能であるかの検証を目的とする.今回,聴覚前処理を子音に適用したときの判別方法として,連続マッチング回路を提案する.本アルゴリズムは音声認識の実時間性を考慮し,さらに入力テンプレート長に依存しないため,連続認識へも適用可能である.検証のため,本研究室で開発したhwModuleV2に実装を行った.その結果,多重解像度によるテンプレートマッチングがほぼ実時間で実現できた.また,子音の分類が可能であるという結果を得た.
抄録(英) The human audition can extract amount of characteristic and the source of sound which flow into two ears. Then frequency discrimination is performed by audition, and the processing is performed with the multiresolution. The recognition of the vowel sound in Japanese is possible by using a cochlea modeled circuit. We identified that the recognition of the vowel sound in Japanese is possible by using a cochlea modeled circuit and its utility. In this study, we propose a consonant recognition method inspired by the preprocessing of human audition. In the proposed method, we also propose a pipelined matching circuits for the consonant recognition. The proposed circuit considers real-time processing for the voice recognition, and it can be applied to consecutive recognition because of independence of an input template length. In order to realize the proposed system, we implemented the circuit into hwModuleV2 which we developed in our laboratory. As a result, the circuit achieved real-time template matching with the multiresolution. In addition, the result shows that the circuit can classify the consonant.
キーワード(和) 子音認識 / テンプレート・マッチング / 多重解像度解析 / FPGA / 音声認識
キーワード(英) Consonant Recognition / Template Matching / Multiresolution / FPGA / Speech Recognition
資料番号 CQ2009-99,PRMU2009-198,SP2009-139,MVE2009-121
発行日

研究会情報
研究会 PRMU
開催期間 2010/1/14(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Pattern Recognition and Media Understanding (PRMU)
本文の言語 JPN
タイトル(和) 連続マッチング回路を用いた子音認識方法(一般セッション,クロスモーダル)
サブタイトル(和)
タイトル(英) Consonant recognition method based on pipelined matching circuit
サブタイトル(和)
キーワード(1)(和/英) 子音認識 / Consonant Recognition
キーワード(2)(和/英) テンプレート・マッチング / Template Matching
キーワード(3)(和/英) 多重解像度解析 / Multiresolution
キーワード(4)(和/英) FPGA / FPGA
キーワード(5)(和/英) 音声認識 / Speech Recognition
第 1 著者 氏名(和/英) 野中 淳 / Jun NONAKA
第 1 著者 所属(和/英) 東京農工大学工学府
Faculty of Engineering, Tokyo University of Agriculture and Technology
第 2 著者 氏名(和/英) 小瀧 浩 / Hiroshi KOTAKI
第 2 著者 所属(和/英) 東京農工大学工学府
Faculty of Engineering, Tokyo University of Agriculture and Technology
第 3 著者 氏名(和/英) 田向 権 / Hakaru TAMUKOH
第 3 著者 所属(和/英) 東京農工大学工学府
Faculty of Engineering, Tokyo University of Agriculture and Technology
第 4 著者 氏名(和/英) 関根 優年 / Masatoshi SEKINE
第 4 著者 所属(和/英) 東京農工大学工学府
Faculty of Engineering, Tokyo University of Agriculture and Technology
発表年月日 2010-01-22
資料番号 CQ2009-99,PRMU2009-198,SP2009-139,MVE2009-121
巻番号(vol) vol.109
号番号(no) 374
ページ範囲 pp.-
ページ数 6
発行日