講演名 1995/12/15
テキストコーパスを用いた音声理解のための言語モデル自動獲得
松岡 達雄, Hasson Robert, Barlow Michael, 古井 貞煕,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本報告では音声理解システムにおいて、音声認識結果である自然言語をシステムを駆動する意味言語に変換するための言語モデルを、コーパスから自動的に獲得する方法について述べる。音声理解の問題は自然言語から意味言語ヘ翻訳する問題ととらえることができる。機械翻訳の研究分野では、二カ国語が一対となった並行テキストからなるコーパスを用いて、翻訳のための言語モデルを統計的に推定する方法が提案されている。本報告ではこれを音声理解における翻訳言語モデルに適用し、スパースデータからの推定の問題を回避するため、統計的手法により文脈自由文法を生成し、有限状態オートマトンで表現された文法ネットワークの状態数を削減することにより、翻訳言語モデルの推定精度を向上する方法を提案する。米国ARPAの音声理解評価タスクである航空旅行情報システム(Air Travel Information System: ATIS)を対象として評価を行い、提案法の有効性を示す。
抄録(英) Speech understanding can be viewed as a translation problem from natural language into semantic language. This paper describes automatic acquisition of a language model by using a text corpus, which translates natural language into semantic language for speech understanding. A stochastic method for language modeling is proposed for machine translation using a parallel text corpus. This method can be used in speech understanding, but input and output languages should be modeled concisely in order to estimate a reliable translation language model. This paper proposes a method for reducing the number of grammar rules while maintaining the original coverage. This method was shown to be effective by experiments using the ARPA ATIS task.
キーワード(和) 音声理解 / 翻訳 / 言語モデル / 自然言語 / 意味言語
キーワード(英) Speech understanding / Translation / Language modeling / Natural language / Semantic language
資料番号 NLC95-59,SP95-94
発行日

研究会情報
研究会 NLC
開催期間 1995/12/15(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Natural Language Understanding and Models of Communication (NLC)
本文の言語 JPN
タイトル(和) テキストコーパスを用いた音声理解のための言語モデル自動獲得
サブタイトル(和)
タイトル(英) Language model acquisition from a text corpus for speech understanding
サブタイトル(和)
キーワード(1)(和/英) 音声理解 / Speech understanding
キーワード(2)(和/英) 翻訳 / Translation
キーワード(3)(和/英) 言語モデル / Language modeling
キーワード(4)(和/英) 自然言語 / Natural language
キーワード(5)(和/英) 意味言語 / Semantic language
第 1 著者 氏名(和/英) 松岡 達雄 / Tatsuo Matsuoka
第 1 著者 所属(和/英) NTTヒューマンインタフェース研究所
NTT Human Interface Laboratories
第 2 著者 氏名(和/英) Hasson Robert / Robert Hasson
第 2 著者 所属(和/英) NTTヒューマンインタフェース研究所
NTT Human Interface Laboratories
第 3 著者 氏名(和/英) Barlow Michael / Michael Barlow
第 3 著者 所属(和/英) NTTヒューマンインタフェース研究所
NTT Human Interface Laboratories
第 4 著者 氏名(和/英) 古井 貞煕 / Sadaoki Furui
第 4 著者 所属(和/英) NTTヒューマンインタフェース研究所
NTT Human Interface Laboratories
発表年月日 1995/12/15
資料番号 NLC95-59,SP95-94
巻番号(vol) vol.95
号番号(no) 429
ページ範囲 pp.-
ページ数 6
発行日