講演名 | 1996/12/13 効率的な仮説のマージ機能を持つLRパーザ制御による音声認識 山田 智一, 松永 昭一, 嵯峨山 茂樹, |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | 文脈自由文法(CFG)による言語制約下で、環境依存音素モデルを用いる連続音声認識アルゴリズムを提案する。一般化LRパーザを用いて、パスのマージを考慮して、有限状態ネットワーク(FSN)をCFGから動的に生成し、時間同期に処理を行う。音響モデルは、単語間、単語内の環境依存性を考慮する。本稿では、アルゴリズムと処理機構について述べ、さらに音素同期に処理を行うHMM-LR法との比較実験結果について述べる。HMM-LR法と比べると、本手法は、認識率を落とさずに処理時間を削減することができた。 |
抄録(英) | This paper describes a Viterbi search algorithm for continuous speech recognition using context-dependent phone models under the constraint defined by a context-free grammar (CFG). It is based on a frame synchronous LR parser which dynamically generates a finite state network (FSN) from the CFG with an efficient path merging mechanism. Full context-dependency (intra- and inter-word context) is taken into account. This paper first describes the algorithm and the processing mechanism, then compares the experimental results of our algorithm and the conventional tree-based HMM-LR speech recognition algorithm which uses HMMs and an LR parser in phone-synchronous processing. The experiments show that our algorithm runs faster than the HMM-LR algorithm with an equivalent recognition accuracy. |
キーワード(和) | 音声認識 / HMM / LRパーザ / one-passサーチ / 有限状態オートマトン |
キーワード(英) | Speech Recognition / HMM / LR Parser / One-pass Search / Finite State Automaton |
資料番号 | NLC96-54,SP96-85 |
発行日 |
研究会情報 | |
研究会 | NLC |
---|---|
開催期間 | 1996/12/13(から1日開催) |
開催地(和) | |
開催地(英) | |
テーマ(和) | |
テーマ(英) | |
委員長氏名(和) | |
委員長氏名(英) | |
副委員長氏名(和) | |
副委員長氏名(英) | |
幹事氏名(和) | |
幹事氏名(英) | |
幹事補佐氏名(和) | |
幹事補佐氏名(英) |
講演論文情報詳細 | |
申込み研究会 | Natural Language Understanding and Models of Communication (NLC) |
---|---|
本文の言語 | JPN |
タイトル(和) | 効率的な仮説のマージ機能を持つLRパーザ制御による音声認識 |
サブタイトル(和) | |
タイトル(英) | Continuous Speech Recognition Using LR Parsing With Effective Hypotheses Merging Mechanism |
サブタイトル(和) | |
キーワード(1)(和/英) | 音声認識 / Speech Recognition |
キーワード(2)(和/英) | HMM / HMM |
キーワード(3)(和/英) | LRパーザ / LR Parser |
キーワード(4)(和/英) | one-passサーチ / One-pass Search |
キーワード(5)(和/英) | 有限状態オートマトン / Finite State Automaton |
第 1 著者 氏名(和/英) | 山田 智一 / Tomokazu YAMADA |
第 1 著者 所属(和/英) | NTTヒューマンインタフェース研究所 NTT Human Interface Labolatories |
第 2 著者 氏名(和/英) | 松永 昭一 / Shoichi MATSUNAGA |
第 2 著者 所属(和/英) | NTTヒューマンインタフェース研究所 NTT Human Interface Labolatories |
第 3 著者 氏名(和/英) | 嵯峨山 茂樹 / Shigeki SAGAYAMA |
第 3 著者 所属(和/英) | NTTヒューマンインタフェース研究所 NTT Human Interface Labolatories |
発表年月日 | 1996/12/13 |
資料番号 | NLC96-54,SP96-85 |
巻番号(vol) | vol.96 |
号番号(no) | 420 |
ページ範囲 | pp.- |
ページ数 | 6 |
発行日 |