講演名 1998/12/11
文法カテゴリ対制約を用いたA^*探索に基づく大語彙連続音声認識パーザ
李 晃伸, 河原 達也, 堂下 修司,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 大語彙の文法ベースの連続音声認識では, 探索時に仮説の単語ネットワークが爆発する, また文法による単語の絞り込みも不十分である.これに対して(1)元の文法から抽出した単語(カテゴリ)対制約によってネットワークの大きさを抑え, かつ(2)文法カテゴリごとに単語辞書を木構造化することで, 効率的に強力なヒューリスティック計算を行なう.さらに(3)この第1パスの結果をインデックス化しそれを元に展開単語を絞り込むことで, 大語彙で効率の良いA^*探索を実現する.認識実験の結果, 提案手法を用いた汎用連続音声認識パーザJulianは, 標準的な1パスビーム探索に比べて計算量がはるかに少なくて済み, また複雑なネットワークに対しても安定して動作することが示された.最終的な性能は, 800語のタスクでほぼ実時間で97.1%, 5,000語のタスクでは実時間の2倍強で91.2%の単語認識精度を達成した.
抄録(英) In grammar-based LVCSR, the expanded word hypothesis network grows enormously and the grammar only is not enough for word prediction. We propose an efficient two-pass search algorithm by(1)using word(category)-pair constraint as heuristics and(2)tree-organizing the word lexicon for each grammar category, both to represent the whole network in a compact loop structure. Futhermore, (3)the survived words on the first pass are indexed to eliminate candidates to be accessed on the second pass. Experimental results show that our depeloped portable FSA-based parser, named Julian, shows greater performance in cost sand stability than a typical one-pass beam decoder. Finally, our parser archieved a word accuracy of 97.1% with almost real time processing on a 800-word task, and 91.2% with 2.5 times the real time on a 5000-word task.
キーワード(和) 大語彙 / 連続音声認識 / パーザ / 有限状態文法 / A^*探索
キーワード(英) large vocabulary / CSR / parser / FSA / A^* search
資料番号 NLC98-46,SP98-110
発行日

研究会情報
研究会 NLC
開催期間 1998/12/11(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Natural Language Understanding and Models of Communication (NLC)
本文の言語 JPN
タイトル(和) 文法カテゴリ対制約を用いたA^*探索に基づく大語彙連続音声認識パーザ
サブタイトル(和)
タイトル(英) Large Vocabulary Continuous Speech Recognition Parser based on A^* Search using Grammar Category-Pair Constraint
サブタイトル(和)
キーワード(1)(和/英) 大語彙 / large vocabulary
キーワード(2)(和/英) 連続音声認識 / CSR
キーワード(3)(和/英) パーザ / parser
キーワード(4)(和/英) 有限状態文法 / FSA
キーワード(5)(和/英) A^*探索 / A^* search
第 1 著者 氏名(和/英) 李 晃伸 / Akinobu Lee
第 1 著者 所属(和/英) 京都大学大学院情報学研究科知能情報学専攻
Graduate School of Informatics Kyoto University
第 2 著者 氏名(和/英) 河原 達也 / Tatsuya Kawahara
第 2 著者 所属(和/英) 京都大学大学院情報学研究科知能情報学専攻
Graduate School of Informatics Kyoto University
第 3 著者 氏名(和/英) 堂下 修司 / Shuji Doshita
第 3 著者 所属(和/英) 京都大学大学院工情報学研究科知能情報学専攻
Graduate School of Informatics Kyoto University
発表年月日 1998/12/11
資料番号 NLC98-46,SP98-110
巻番号(vol) vol.98
号番号(no) 461
ページ範囲 pp.-
ページ数 8
発行日