講演名 | 2004/12/14 異種コーパスの組合せによるトリガー言語モデルの構築(言語モデル)(第6回音声言語シンポジウム) トロンコーソ カルロス, 河原 達也, 山本 博史, 菊井 玄一郎, |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | 大語彙連続音声認識において,n-gramモデルより長距離の単語共起をモデル化するトリガー言語モデルについて検討する.一般に言語モデルの構築においては,タスクにマッチした学習コーパスのサイズは小さいため,統計量の学習が十分に行えず,逆に,大規模なコーパスでは一般的過ぎて,タスク依存性がなくなるという問題がある.本研究では,タスクにマッチしたコーパスからトリガーペアを抽出し,大規模なテキストコーパスからトリガーペアの生起確率を推定するアプローチを提案する.ATRの旅行会話コーパス(BTEC),及び日本語話し言葉コーパス(CSJ)の模擬講演において評価を行った結果を報告する. |
抄録(英) | We study the trigger-based language model (LM) for large vocabulary continuous speech recognition (LVCSR), which can model dependencies between words longer than those modeled by the n-gram LM. In general, in language modeling for LVCSR, when the training corpus matches the target task, its size is typically small, and therefore insufficient for providing us with reliable probability estimates. On the other hand, large corpora are often too general to capture task dependency. The proposed approach tries to overcome this generality-sparseness trade-off problem by constructing a trigger-based LM in which task-dependent trigger pairs are first extracted from the corpus that matches the task, and then the occurrence probabilities of the pairs are estimated from a huge text corpus. We report evaluation results in ATR's Basic Travel Expression Corpus (BTEC) as well as in the Corpus of Spontaneous Japanese (CSJ). |
キーワード(和) | 言語モデル / 音声認識 / トリガー言語モデル / テキストコーパス |
キーワード(英) | Language Model / Speech Recognition / Trigger-Based Language Model / Text Corpus |
資料番号 | NLC2004-60,SP2004-100 |
発行日 |
研究会情報 | |
研究会 | SP |
---|---|
開催期間 | 2004/12/14(から1日開催) |
開催地(和) | |
開催地(英) | |
テーマ(和) | |
テーマ(英) | |
委員長氏名(和) | |
委員長氏名(英) | |
副委員長氏名(和) | |
副委員長氏名(英) | |
幹事氏名(和) | |
幹事氏名(英) | |
幹事補佐氏名(和) | |
幹事補佐氏名(英) |
講演論文情報詳細 | |
申込み研究会 | Speech (SP) |
---|---|
本文の言語 | ENG |
タイトル(和) | 異種コーパスの組合せによるトリガー言語モデルの構築(言語モデル)(第6回音声言語シンポジウム) |
サブタイトル(和) | |
タイトル(英) | Trigger-Based Language Model Construction by Combining Different Corpora |
サブタイトル(和) | |
キーワード(1)(和/英) | 言語モデル / Language Model |
キーワード(2)(和/英) | 音声認識 / Speech Recognition |
キーワード(3)(和/英) | トリガー言語モデル / Trigger-Based Language Model |
キーワード(4)(和/英) | テキストコーパス / Text Corpus |
第 1 著者 氏名(和/英) | トロンコーソ カルロス / Carlos TRONCOSO |
第 1 著者 所属(和/英) | 京都大学情報学研究科 School of Informatics, Kyoto University |
第 2 著者 氏名(和/英) | 河原 達也 / Tatsuya KAWAHARA |
第 2 著者 所属(和/英) | 京都大学情報学研究科 School of Informatics, Kyoto University |
第 3 著者 氏名(和/英) | 山本 博史 / Hirofiimi YAMAMOTO |
第 3 著者 所属(和/英) | ATR音声言語コミュニケーション研究所 Spoken Language Translation Research Laboratories, ATR |
第 4 著者 氏名(和/英) | 菊井 玄一郎 / Genichiro KIKUI |
第 4 著者 所属(和/英) | ATR音声言語コミュニケーション研究所 Spoken Language Translation Research Laboratories, ATR |
発表年月日 | 2004/12/14 |
資料番号 | NLC2004-60,SP2004-100 |
巻番号(vol) | vol.104 |
号番号(no) | 542 |
ページ範囲 | pp.- |
ページ数 | 6 |
発行日 |