講演名 1999/12/21
スカラ量子化を利用したクライアント・サーバ型音声認識の実現とサーバ部の高速化の検討
小坂 哲夫, 植山 輝彦, 櫛田 晃弘, 山田 雅章, 小森 康弘,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) スカラ量子化による音声認識用音声符号化,および符号化データを利用したサーバ部の高速化という特徴を持つ,クライアント・サーバ型音声認識システムを実現した.クライアント部ではパラメータをスカラ量子化することにより10kbpsまたは5.2kbpsの符号化を行なう.サーバ部ではスカラ量子化データを直接参照し,table-100kupにより粗い尤度計算を行ない.さらに復号化したデータを用いて,尤度の高い部分の再計算を行ない,尤度計算全体の高速化を図る.粗い尤度計算には混合分布の次元独立演算法(IDMM)を用いる.以上の提案法を評価するため,符号化による圧縮を行なわない80kbpsシステム(baseline)と10kbps,5.2kbpsシステムの比較実験を行なった.この結果認識率の低下なしに圧縮が行なえることを確認した.
抄録(英) Thispaperproposesaclaient-serverbasedspeechrecognitionsystem,whichischaracterizedbyspeechcodingforspeechrecognitionusingscalarquantizationandafastrecognitionalgorithmattheserversideusingthecodeddata.Atthec11entside,speechparametersarecodedinto10kbpsor5.2kbpsbyusingscalarquantizat10nmethod.Attheserverside,rough11ke11hoodcalculationiscarriedoutbyreferencetoscalarquantizeddatafirst.Afterthatlike11h00dre-calculat10niscarriedoutbyusingdecodeddata.Inthisstep,stateswhichhavethehigheroutputprobab11itiesareselectedandre-calculated.Thistwo-stepalgotirhmcansavethetotalcostofthe11ke11h00dcalculat10n.Incomparativerecognitionexperimentsbetween80kbps(base11ne),10kbpsand5.2kpbssystems,theresultsshowedthattheproposedalgorithmcouldcomplessspeechpararneterswithoutdegradationoftherecognitionrate.
キーワード(和)
キーワード(英)
資料番号
発行日

研究会情報
研究会 NLC
開催期間 1999/12/21(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Natural Language Understanding and Models of Communication (NLC)
本文の言語 JPN
タイトル(和) スカラ量子化を利用したクライアント・サーバ型音声認識の実現とサーバ部の高速化の検討
サブタイトル(和)
タイトル(英) Client-serverbasedspeechrecognitionanditsfastrecognitionaIgorithmusingscalarquantization
サブタイトル(和)
キーワード(1)(和/英)
第 1 著者 氏名(和/英) 小坂 哲夫
第 1 著者 所属(和/英)
第 2 著者 氏名(和/英) 植山 輝彦
第 2 著者 所属(和/英)
第 3 著者 氏名(和/英) 櫛田 晃弘
第 3 著者 所属(和/英)
第 4 著者 氏名(和/英) 山田 雅章
第 4 著者 所属(和/英)
第 5 著者 氏名(和/英) 小森 康弘
第 5 著者 所属(和/英)
発表年月日 1999/12/21
資料番号
巻番号(vol) vol.99
号番号(no) 524
ページ範囲 pp.-
ページ数 6
発行日