講演名 | 1997/1/16 KL展開と一般化確率降下法によるセグメント量子化の高速化 新田 恒雄, 河村 聡典, 正井 康之, 中山 昭, |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | 任意大語認識システムに高い性能を示すSMQ/HMM方式は、セグメント量子化 (SMQ) 部の演算量が大きい欠点がある。本報告では、セグメント量子化部をKL圧縮に基づく特徴抽出器と音声セグメント分類器の二段から構成すると共に、双方にMCE/GPDに基づく競合学習を適用する方式を提案する。評価実験はdiphoneを単位とするsub-word HMMを接続して、従来のSMQと比較する。この結果、セグメント量子化部の演算量とメモリ量を、認識性能を維持したまま1/30乃至1/40に低減できることを示す。 |
抄録(英) | The hybrid algorithm of SMQ (Statistical Matrix Quantization) and HMM shows high performance in vocabulary-unspecific, speaker-independent speech recognition, however, it needs lots of computation and memory at a segment quantizer of SMQ. In this paper, we propose a newly developed, two-stage segment quantizer with a feature extractor based on KL-expansion and a classifier, both are traind by using competitive training of MCE/GPD. Result of experiments shows 1/30 1/40 reduction in both computation time and a memory size with the same perfomance that the old version of SMQ shows. |
キーワード(和) | パターン認識 / 音声認識 / HMM / セグメント量子化 / 競合学習 / KL展開 / GPD |
キーワード(英) | Speech Recognition / HMM / Segment Quantization / Competitive Training / KL-expansion / GPD |
資料番号 | SP96-94 |
発行日 |
研究会情報 | |
研究会 | SP |
---|---|
開催期間 | 1997/1/16(から1日開催) |
開催地(和) | |
開催地(英) | |
テーマ(和) | |
テーマ(英) | |
委員長氏名(和) | |
委員長氏名(英) | |
副委員長氏名(和) | |
副委員長氏名(英) | |
幹事氏名(和) | |
幹事氏名(英) | |
幹事補佐氏名(和) | |
幹事補佐氏名(英) |
講演論文情報詳細 | |
申込み研究会 | Speech (SP) |
---|---|
本文の言語 | JPN |
タイトル(和) | KL展開と一般化確率降下法によるセグメント量子化の高速化 |
サブタイトル(和) | |
タイトル(英) | High-speed Segment Quantization Based on KL-expansion and Generalized Probabilistic Descent Method |
サブタイトル(和) | |
キーワード(1)(和/英) | パターン認識 / Speech Recognition |
キーワード(2)(和/英) | 音声認識 / HMM |
キーワード(3)(和/英) | HMM / Segment Quantization |
キーワード(4)(和/英) | セグメント量子化 / Competitive Training |
キーワード(5)(和/英) | 競合学習 / KL-expansion |
キーワード(6)(和/英) | KL展開 / GPD |
キーワード(7)(和/英) | GPD |
第 1 著者 氏名(和/英) | 新田 恒雄 / Tsuneo NITTA |
第 1 著者 所属(和/英) | (株)東芝マルチメディア技術研究所 Toshiba Multimedia Eng. Lab. |
第 2 著者 氏名(和/英) | 河村 聡典 / Akinori KAWAMURA |
第 2 著者 所属(和/英) | (株)東芝マルチメディア技術研究所 Toshiba Multimedia Eng. Lab. |
第 3 著者 氏名(和/英) | 正井 康之 / Yasuyuki MASAI |
第 3 著者 所属(和/英) | (株)東芝マルチメディア技術研究所 Toshiba Multimedia Eng. Lab. |
第 4 著者 氏名(和/英) | 中山 昭 / Akira NAKAYAMA |
第 4 著者 所属(和/英) | 東芝コンピュータエンジニアリング(株) Toshiba Multimedia Eng. Lab. |
発表年月日 | 1997/1/16 |
資料番号 | SP96-94 |
巻番号(vol) | vol.96 |
号番号(no) | 448 |
ページ範囲 | pp.- |
ページ数 | 8 |
発行日 |