講演名 1997/10/17
係り受け文法による確率文脈自由文法を用いた言語モデルの検討
柳沼 正宣, 加藤 正治, 伊藤 彰則, 好田 正紀,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 確率文脈自由文法 (SCFG) を用いて音声認識のための言語モデルを構築する。SCFGの学習にはIn side-Outside (I/O) アルゴリズムが用いられるが、本研究では係り受け文法を適用させるためにそれを改良した。それは, テキスト (EDRコーパス) 中の単語を機能語 (助詞, 助動詞など) と実質語 (機能語以外) に分けて適用する。比較対象としては、オリジナルのI/Oアルゴリズムを用いてSCFGを学習したモデル (Normal SCFG)、N-gram (bigram、trigram) である。提案法を用いることで計算コストをO(N^3) からO(N^2) のオーダに削減でき、また性能面 (Perplexity評価) においてもはるかに改善され、非終端記号数を12以上にすることによりtrigramを上回った。さらに、計算時間短縮、性能向上を目指すため初期値の検討を行った。
抄録(英) In this paper, we propose a language model using stochastic context free grammar (SCFG) for speech recognition. To train an SCFG, inside-outside (I/O) algorithm is used. We modified I/O algorithm to treat with dependency grammar. To express dependency grammar, two categories of word are introduced : functional words (particle, auxiliary, suffix, etc.) and content words (noun, verb, adjective, etc.). Using dependency grammar, training time is reduced from the cube of number of nonterminal symbols to the square of it. We carried out an experiment to compare the proposed method with two conventional methods : the trigram model and the original SCFG model. We obtained significant reduction of training time compared with the original SCFG. The perplexity of the proposed model was smaller than other two models. Furthermore, we researched initial values to reduce training time andimprove performance.
キーワード(和) 言語モデル / 確率文脈自由文法 / 係り受け文法 / Inside-Outsideアルゴリズム
キーワード(英) language model / stochastic contextfree grammar / dependency grammar / inside-outside algorithm
資料番号 NLC97-33
発行日

研究会情報
研究会 NLC
開催期間 1997/10/17(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Natural Language Understanding and Models of Communication (NLC)
本文の言語 JPN
タイトル(和) 係り受け文法による確率文脈自由文法を用いた言語モデルの検討
サブタイトル(和)
タイトル(英) A Study of Language Modeling using Stochastic Context Free Grammar with "Dependency Grammar"
サブタイトル(和)
キーワード(1)(和/英) 言語モデル / language model
キーワード(2)(和/英) 確率文脈自由文法 / stochastic contextfree grammar
キーワード(3)(和/英) 係り受け文法 / dependency grammar
キーワード(4)(和/英) Inside-Outsideアルゴリズム / inside-outside algorithm
第 1 著者 氏名(和/英) 柳沼 正宣 / Masanobu YAGINUMA
第 1 著者 所属(和/英) 山形大学工学部
Faculty of Engineering, Yamagata University
第 2 著者 氏名(和/英) 加藤 正治 / Masaharu KATOH
第 2 著者 所属(和/英) 山形大学工学部
Faculty of Engineering, Yamagata University
第 3 著者 氏名(和/英) 伊藤 彰則 / Akinori ITO
第 3 著者 所属(和/英) 山形大学工学部
Faculty of Engineering, Yamagata University
第 4 著者 氏名(和/英) 好田 正紀 / Masaki KOHDA
第 4 著者 所属(和/英) 山形大学工学部
Faculty of Engineering, Yamagata University
発表年月日 1997/10/17
資料番号 NLC97-33
巻番号(vol) vol.97
号番号(no) 330
ページ範囲 pp.-
ページ数 8
発行日