講演名 2005/6/16
識別的基準と遺伝的アルゴリズムに基づく部分隠れマルコフモデルの構造の最適化(多言語, CSJ, 認識・理解・対話・一般)
小川 哲司, 小林 哲則,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 複雑な特徴量の時間変化を音響モデルによって扱うことを目的として, 部分隠れマルコフモデル(PHMM)を提案し, 新聞読み上げ音声を対象とした連続音声認識においてその有効性を確認してきた.PHMMは出力確率と遷移確率双方に前出力依存性を有した確率モデルであるが, これまでの枠組みでは, その構造は全てのカテゴリで共通なものを用いてきた.そこで本稿では, 重みつき尤度比最大基準に基づき, PHMMにおける状態と出力間の依存構造を, カテゴリ毎に最適に選択することを試みる.重みつき尤度比最大化基準は識別的な評価尺度であるため, この基準によって推定されたモデル構造は, 結果として正解カテゴリと不正解カテゴリに対して高い識別能力を有する.ここでは, 全てのカテゴリに対して取り得るモデル構造の組み合わせの中から, 最大の重みつき尤度比を与える構造の組み合わせを最適なモデル構造と定義し, 探索の最適な近似として遺伝的アルゴリズムを適用することを試みる.また, 学会講演音声を対象とした連続音声認識実験によって, 提案するモデル構造選択手法の有効性を評価したところ, HMMや, 構造を全てのカテゴリで共通としたPHMMの誤りを削減した.
抄録(英) A structure of Partly-Hidden Markov Model (PHMM) is optimized. PHMM was proposed in our previous work to deal with the complicated temporal changes of acoustic features. It can realize the observation dependent behaviors in both observations and state transitions. In the formulation of previous PHMM, we used a common structure in all model categories. However, it is well known that the optimal structure which gives best performance differes from category to category. In this paper, we designed a new structure optimization method in which the state-observation dependences in PHMM are optimally defined with respect to each category using Weighted Likelihood-Ratio Maximization (WLRM) criterion. WLRM criterion induces sparse and discriminative structures, and therefore gives the resulting structurally discriminative models. We define the model structure combination which gives maximum weighted likelihood-ratio for any possible structure patterns as the optimal structures, and Genetic Algorithm is applied to an optimal approximation of search. As the result of continuous speech recognition aiming at lecture talk, the effectiveness of the proposed structure optimization is shown: it reduced the word errors compared to HMM and PHMM with common structure for all categories.
キーワード(和) 音響モデル / 重みつき尤度比最大化基準 / 講演音声認識
キーワード(英) Acoustic Model / HMM / PHMM / Weighted Likelihood-Ratio Maximization Criterion / Lecture Talk Speech Recognition
資料番号 SP2005-26
発行日

研究会情報
研究会 SP
開催期間 2005/6/16(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Speech (SP)
本文の言語 JPN
タイトル(和) 識別的基準と遺伝的アルゴリズムに基づく部分隠れマルコフモデルの構造の最適化(多言語, CSJ, 認識・理解・対話・一般)
サブタイトル(和)
タイトル(英) Optimizing the Structure of Partly Hidden Markov Models Using Classification Measure and Genetic Algorithm
サブタイトル(和)
キーワード(1)(和/英) 音響モデル / Acoustic Model
キーワード(2)(和/英) 重みつき尤度比最大化基準 / HMM
キーワード(3)(和/英) 講演音声認識 / PHMM
第 1 著者 氏名(和/英) 小川 哲司 / Tetsuji OGAWA
第 1 著者 所属(和/英) 早稲田大学理工学部
School of Science and Engineering, Waseda University
第 2 著者 氏名(和/英) 小林 哲則 / Tetsunori KOBAYASHI
第 2 著者 所属(和/英) 早稲田大学理工学部
School of Science and Engineering, Waseda University
発表年月日 2005/6/16
資料番号 SP2005-26
巻番号(vol) vol.105
号番号(no) 132
ページ範囲 pp.-
ページ数 6
発行日