講演名 1997/1/16
KL展開と一般化確率降下法によるセグメント量子化の高速化
新田 恒雄, 河村 聡典, 正井 康之, 中山 昭,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 任意大語認識システムに高い性能を示すSMQ/HMM方式は、セグメント量子化 (SMQ) 部の演算量が大きい欠点がある。本報告では、セグメント量子化部をKL圧縮に基づく特徴抽出器と音声セグメント分類器の二段から構成すると共に、双方にMCE/GPDに基づく競合学習を適用する方式を提案する。評価実験はdiphoneを単位とするsub-word HMMを接続して、従来のSMQと比較する。この結果、セグメント量子化部の演算量とメモリ量を、認識性能を維持したまま1/30乃至1/40に低減できることを示す。
抄録(英) The hybrid algorithm of SMQ (Statistical Matrix Quantization) and HMM shows high performance in vocabulary-unspecific, speaker-independent speech recognition, however, it needs lots of computation and memory at a segment quantizer of SMQ. In this paper, we propose a newly developed, two-stage segment quantizer with a feature extractor based on KL-expansion and a classifier, both are traind by using competitive training of MCE/GPD. Result of experiments shows 1/30 1/40 reduction in both computation time and a memory size with the same perfomance that the old version of SMQ shows.
キーワード(和) パターン認識 / 音声認識 / HMM / セグメント量子化 / 競合学習 / KL展開 / GPD
キーワード(英) Speech Recognition / HMM / Segment Quantization / Competitive Training / KL-expansion / GPD
資料番号 SP96-94
発行日

研究会情報
研究会 SP
開催期間 1997/1/16(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Speech (SP)
本文の言語 JPN
タイトル(和) KL展開と一般化確率降下法によるセグメント量子化の高速化
サブタイトル(和)
タイトル(英) High-speed Segment Quantization Based on KL-expansion and Generalized Probabilistic Descent Method
サブタイトル(和)
キーワード(1)(和/英) パターン認識 / Speech Recognition
キーワード(2)(和/英) 音声認識 / HMM
キーワード(3)(和/英) HMM / Segment Quantization
キーワード(4)(和/英) セグメント量子化 / Competitive Training
キーワード(5)(和/英) 競合学習 / KL-expansion
キーワード(6)(和/英) KL展開 / GPD
キーワード(7)(和/英) GPD
第 1 著者 氏名(和/英) 新田 恒雄 / Tsuneo NITTA
第 1 著者 所属(和/英) (株)東芝マルチメディア技術研究所
Toshiba Multimedia Eng. Lab.
第 2 著者 氏名(和/英) 河村 聡典 / Akinori KAWAMURA
第 2 著者 所属(和/英) (株)東芝マルチメディア技術研究所
Toshiba Multimedia Eng. Lab.
第 3 著者 氏名(和/英) 正井 康之 / Yasuyuki MASAI
第 3 著者 所属(和/英) (株)東芝マルチメディア技術研究所
Toshiba Multimedia Eng. Lab.
第 4 著者 氏名(和/英) 中山 昭 / Akira NAKAYAMA
第 4 著者 所属(和/英) 東芝コンピュータエンジニアリング(株)
Toshiba Multimedia Eng. Lab.
発表年月日 1997/1/16
資料番号 SP96-94
巻番号(vol) vol.96
号番号(no) 448
ページ範囲 pp.-
ページ数 8
発行日