講演名 | 1998/12/11 文法カテゴリ対制約を用いたA^*探索に基づく大語彙連続音声認識パーザ 李 晃伸, 河原 達也, 堂下 修司, |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | 大語彙の文法ベースの連続音声認識では, 探索時に仮説の単語ネットワークが爆発する, また文法による単語の絞り込みも不十分である.これに対して(1)元の文法から抽出した単語(カテゴリ)対制約によってネットワークの大きさを抑え, かつ(2)文法カテゴリごとに単語辞書を木構造化することで, 効率的に強力なヒューリスティック計算を行なう.さらに(3)この第1パスの結果をインデックス化しそれを元に展開単語を絞り込むことで, 大語彙で効率の良いA^*探索を実現する.認識実験の結果, 提案手法を用いた汎用連続音声認識パーザJulianは, 標準的な1パスビーム探索に比べて計算量がはるかに少なくて済み, また複雑なネットワークに対しても安定して動作することが示された.最終的な性能は, 800語のタスクでほぼ実時間で97.1%, 5,000語のタスクでは実時間の2倍強で91.2%の単語認識精度を達成した. |
抄録(英) | In grammar-based LVCSR, the expanded word hypothesis network grows enormously and the grammar only is not enough for word prediction. We propose an efficient two-pass search algorithm by(1)using word(category)-pair constraint as heuristics and(2)tree-organizing the word lexicon for each grammar category, both to represent the whole network in a compact loop structure. Futhermore, (3)the survived words on the first pass are indexed to eliminate candidates to be accessed on the second pass. Experimental results show that our depeloped portable FSA-based parser, named Julian, shows greater performance in cost sand stability than a typical one-pass beam decoder. Finally, our parser archieved a word accuracy of 97.1% with almost real time processing on a 800-word task, and 91.2% with 2.5 times the real time on a 5000-word task. |
キーワード(和) | 大語彙 / 連続音声認識 / パーザ / 有限状態文法 / A^*探索 |
キーワード(英) | large vocabulary / CSR / parser / FSA / A^* search |
資料番号 | NLC98-46,SP98-110 |
発行日 |
研究会情報 | |
研究会 | NLC |
---|---|
開催期間 | 1998/12/11(から1日開催) |
開催地(和) | |
開催地(英) | |
テーマ(和) | |
テーマ(英) | |
委員長氏名(和) | |
委員長氏名(英) | |
副委員長氏名(和) | |
副委員長氏名(英) | |
幹事氏名(和) | |
幹事氏名(英) | |
幹事補佐氏名(和) | |
幹事補佐氏名(英) |
講演論文情報詳細 | |
申込み研究会 | Natural Language Understanding and Models of Communication (NLC) |
---|---|
本文の言語 | JPN |
タイトル(和) | 文法カテゴリ対制約を用いたA^*探索に基づく大語彙連続音声認識パーザ |
サブタイトル(和) | |
タイトル(英) | Large Vocabulary Continuous Speech Recognition Parser based on A^* Search using Grammar Category-Pair Constraint |
サブタイトル(和) | |
キーワード(1)(和/英) | 大語彙 / large vocabulary |
キーワード(2)(和/英) | 連続音声認識 / CSR |
キーワード(3)(和/英) | パーザ / parser |
キーワード(4)(和/英) | 有限状態文法 / FSA |
キーワード(5)(和/英) | A^*探索 / A^* search |
第 1 著者 氏名(和/英) | 李 晃伸 / Akinobu Lee |
第 1 著者 所属(和/英) | 京都大学大学院情報学研究科知能情報学専攻 Graduate School of Informatics Kyoto University |
第 2 著者 氏名(和/英) | 河原 達也 / Tatsuya Kawahara |
第 2 著者 所属(和/英) | 京都大学大学院情報学研究科知能情報学専攻 Graduate School of Informatics Kyoto University |
第 3 著者 氏名(和/英) | 堂下 修司 / Shuji Doshita |
第 3 著者 所属(和/英) | 京都大学大学院工情報学研究科知能情報学専攻 Graduate School of Informatics Kyoto University |
発表年月日 | 1998/12/11 |
資料番号 | NLC98-46,SP98-110 |
巻番号(vol) | vol.98 |
号番号(no) | 461 |
ページ範囲 | pp.- |
ページ数 | 8 |
発行日 |