講演名 1997/12/11
状態クラスタリングによるHM-Netの構造決定法の検討
堀 貴明, 加藤 正治, 伊藤 彰則, 好田 正紀,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 隠れマルコフ網(HM-Net)は, 音素環境依存HMMの状態共有関係をネットワークとして表現する手法であり, 高精度かつ頑健な音声認識を実現する音響モデルとして有効であることが示されている. HM-Netを生成する方法として, これまで逐次状態分割法(Successive State Splitting:SSS)やその改良が提案されているが, これらの手法は学習サンプルを用いて状態分割とパラメータ推定を繰り返す手法であるため, 大量の学習サンプルを利用する場合には計算量が膨大になるという問題がある. 通常, HM-Netは少量のサンプルによって構造決定され, 各状態の分布のみが多量のサンプルによって再推定される. しかし, 少量のサンプルでは大語彙連続音声認識などに用いる大規模なHM-Netの構造が得られない. 本報告では大語彙連続音声認識のための高精度なHM-Netを作成する手法として, 状態クラスタリングに基づく高速なHM-Netの構造決定法を提案する. 同じ学習サンプルセットを用いた場合に, 本手法が高速かつ従来と同等のHM-Netを生成可能であることを連続音素認識実験により示す.
抄録(英) A Hidden Markov Network (HM-Net) is a highly accurate and robust acoustic model which represents a tied-state structure of context dependent Hidden Markov Models as a network. A Successive State Splitting (SSS) method and its improved ones have been already proposed to generate HM-Nets. However, there is a common problem in these algorithms. The problem is that much amount of computation is required when large amount of training data is used, because state splitting and parameter estimation are repeated using the training data. Although topologies of HM-Nets are usually designed with a part of training data and then only their output density distributions are estimated with all of the data, HM-Nets with large-scale topologies for large vocabulary continuous speech recognition (LVCSR) cannot be derived. In this paper, we propose a state clustering-based rapid topology design method to generate high accuracy HM-Nets for LVCSR. In continuous phoneme recognition experiments, it is shown that the proposed method is a fast algorithm and can generate HM-Nets equivalent to ones designed by conventional methods when the same training data is used.
キーワード(和) 音声認識 / 隠れマルコフモデル / 音素環境依存モデル / 隠れマルコフ網 / 状態クラスタリング
キーワード(英) speech recognition / Hidden Markov Model / context dependent model / Hidden Markov Network / state clustering
資料番号 SP97-75
発行日

研究会情報
研究会 SP
開催期間 1997/12/11(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Speech (SP)
本文の言語 JPN
タイトル(和) 状態クラスタリングによるHM-Netの構造決定法の検討
サブタイトル(和)
タイトル(英) A Study on A State Clustering-Based Topology Design Method for HM-Nets
サブタイトル(和)
キーワード(1)(和/英) 音声認識 / speech recognition
キーワード(2)(和/英) 隠れマルコフモデル / Hidden Markov Model
キーワード(3)(和/英) 音素環境依存モデル / context dependent model
キーワード(4)(和/英) 隠れマルコフ網 / Hidden Markov Network
キーワード(5)(和/英) 状態クラスタリング / state clustering
第 1 著者 氏名(和/英) 堀 貴明 / Takaaki HORI
第 1 著者 所属(和/英) 山形大学工学部
Faculty of Engineering, Yamagata University
第 2 著者 氏名(和/英) 加藤 正治 / Masaharu KATOH
第 2 著者 所属(和/英) 山形大学工学部
Faculty of Engineering, Yamagata University
第 3 著者 氏名(和/英) 伊藤 彰則 / Akinori ITO
第 3 著者 所属(和/英) 山形大学工学部
Faculty of Engineering, Yamagata University
第 4 著者 氏名(和/英) 好田 正紀 / Masaki KOHDA
第 4 著者 所属(和/英) 山形大学工学部
Faculty of Engineering, Yamagata University
発表年月日 1997/12/11
資料番号 SP97-75
巻番号(vol) vol.97
号番号(no) 441
ページ範囲 pp.-
ページ数 6
発行日