No |
23846 |
標題(和) |
2次元メルケプストラムとニュ-ラルネットを用いた単語音声認識 |
標題(英) |
Word Recognition using A Two-Dimensional Mel-cepstrum and Neural Networks |
研究会名(和) |
回路とシステム; 通信方式; ディジタル信号処理 |
研究会名(英) |
Circuits and Systems; Communication Systems; Digital Signal Processing |
開催年月日 |
1990-03-26 |
終了年月日 |
1990-03-27 |
会議種別コード |
2 |
共催団体名(和) |
電気学会 |
資料番号 |
CAS89-141 // CS89-101 // DSP89-40 |
抄録(和) |
本論文では2次元メルケプストラムをニュ-ラルネットワ-クの入力に用いた単語音声確認について述べる。2次メルケプストラムは周波数をメル尺度で表したメル対数スペクトルの周波数と時間の2次元フ-リェ変換で定義される。ニュ-ラルネットワ-クとは生物の神経細胞をモデル化したものであり、学習の機能を持つ男性話者10名の不特定話者10数字音声確認実験については99.5%以上、男性話者3名の特定話者100単語音声認識実験では99.0%程度の認識率が得られた。 |
抄録(英) |
This paper describes a word recognition using a two-dimensional mel-cepstrum as input of neural networks.Two-eimensional mel-cepstrum is defined as the two-demensional Fourier transform of mel-frequency scaled log spectra in the frequency and time domains.The neural networks simulate biological neural cells,and can learn.Speaker-independent word recognition experiments using 10 Japanese digits uttered by ten male speakers indicate that recognition rates more than 99.5% can be obtained.And speaker-dependent word recognition experiments using 100 Japanese words uttered by three male speakers indicate abuot 99.0% |
収録資料名(和) |
電子情報通信学会技術研究報告 |
収録資料の巻号 |
Vol.89 No.474,475 Vol.85 No.476,477 Vol.89 No.478,479 |
ページ開始 |
9 |
ページ終了 |
16 |
キーワード(和) |
メル対数スペクトル |
キーワード(英) |
mel-frequency scaled log spectra |
本文の言語 |
JPN |
著者(和) |
早原悦朗 |
著者(ヨミ) |
ハヤハラエツロウ |
著者(英) |
Hayahara Etsuro |
所属機関(和) |
名古屋工業大学 |
所属機関(英) |
Nagoya Institute of Technology |
著者(和) |
北村正 |
著者(ヨミ) |
キタムラタダシ |
著者(英) |
Kitamura Tadashi |
所属機関(和) |
名古屋工業大学 |
所属機関(英) |
Nagoya Institute of Technology |
著者(和) |
伊藤朝信 |
著者(ヨミ) |
イトウアサノブ |
著者(英) |
Ito Asanobu |
所属機関(和) |
名古屋工業大学 |
所属機関(英) |
Nagoya Institute of Technology |