講演名 2010-12-10
瞬時処理・瞬時認識のためのハードウェア音声認識システム
中山 仁史, 重川 直紀, 横内 孝史,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本研究ではFPGA(Field-Programmable Gate Array)上で実装するハードウェア音声認識システムを提案する.一般的に,音声認識システムは計算機上におけるソフトウェアまた組込みシステム上におけるミドルウェアとして構築されている.このように,計算機上で実装されていた音声認識システムがソフトウェアからハードウェアに近いレベルで実現されてきている.このような現状から,本研究ではフレーム単位で瞬時処理・瞬時認識が可能なハードウェア音声認識システムを提案し,ハードウェア実装可能なシミュレータ上でシステム構築を行った.このシステムは音声区間検出及び音声信号処理を行う音声処理部と音声認識部で実現される.そして,雑音環境下でも有効な2次自己相関関数の差分絶対値の和を用いた音声区間検出(Voice Activity Detection)と周波数帯域パワー及びスペクトル距離を用いた母音認識の有効性を確認した.
抄録(英) In this paper, we are proposed the hardware speech recognition system using FPGA (Field-Programmable Gate Array). Generally, conventional speech recognition systems are often constructed on computers and microcomputers as software and middleware. We thought that speech recognition systems will be constructed on hardware in future because developments of speech recognition systems change software to software. For these backgrounds, we are proposed]constructed the hardware speech recognition system with speech processing for the treatments which has speech signal processing part and speech recognition part. And, we confirmed the effectiveness of the system that the system is composed of the VAD (Voice Activity Detection) detector using summation of absolute difference between each signal in 2^ autocorrelation and 2-pass vowel speech recognition decoder using outputs of frequency band power and spectral distances. 2^ autocorrelation is calculated from 1^ autocorrelation with autocorrelation, and the decoder estimates the candidate using the frequency band power like filter bank and band-pass filter.
キーワード(和) FPGA / 音声認識 / 音声区間検出 / 雑音環境 / 自己相関関数
キーワード(英) FPGA / speech recognition / voice activity detection / noise environment / autocorrelation
資料番号 EA2010-99
発行日

研究会情報
研究会 EA
開催期間 2010/12/3(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Engineering Acoustics (EA)
本文の言語 JPN
タイトル(和) 瞬時処理・瞬時認識のためのハードウェア音声認識システム
サブタイトル(和)
タイトル(英) Hardware speech recognition system for processing and recognition at moment
サブタイトル(和)
キーワード(1)(和/英) FPGA / FPGA
キーワード(2)(和/英) 音声認識 / speech recognition
キーワード(3)(和/英) 音声区間検出 / voice activity detection
キーワード(4)(和/英) 雑音環境 / noise environment
キーワード(5)(和/英) 自己相関関数 / autocorrelation
第 1 著者 氏名(和/英) 中山 仁史 / Masashi NAKAYAMA
第 1 著者 所属(和/英) 香川高等専門学校電気情報工学科
Department of Electrical and Computer Engineering, Kagawa National College of Technology
第 2 著者 氏名(和/英) 重川 直紀 / Naoki SHIGEKAWA
第 2 著者 所属(和/英) 福井大学工学部
Faculty of Engineering, University of Fukui
第 3 著者 氏名(和/英) 横内 孝史 / Takashi YOKOUCHI
第 3 著者 所属(和/英) 香川高等専門学校電気情報工学科
Department of Electrical and Computer Engineering, Kagawa National College of Technology
発表年月日 2010-12-10
資料番号 EA2010-99
巻番号(vol) vol.110
号番号(no) 331
ページ範囲 pp.-
ページ数 6
発行日