講演名 | 1996/12/13 単語trigramを用いた大語彙連続音声認識 吉田 航太郎, 松岡 達雄, 大附 克年, 古井 貞熙, |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | 大語彙連続音声認識システムの性能は、音響モデルだけではなく、使用する言語モデルの性能にも大きく依存する。本研究では、言語モデルとして日本語で初めて、マルチパスアプローチによって単語 trigram を適用した。語彙を7000語に限定した上で、日経新聞約5年分のテキストから言語モデルを学習し、不特定話者の音声を用いた新聞文章の読み上げタスクによって評価を行った結果、従来の単語 bigram 言語モデルを用いた場合より誤り率が44%削減され、単語正解精度で約90%の性能を得ることが出来た。 |
抄録(英) | Accuracy of Large-Vocabulary Continuous Speech Recognition(LVCSR) systems depend not only on the performance of its acoustic models but also on the performance of the language models. We successfully incorporated word trigram language models to a LVCSR system for the first time in Japanese speech recognition. For a 7000-word vocabulary speaker-independent recognition task, trigram language models were trained using texts from a CD-ROM compilation of a Japanese news paper(Nikkei 1990-1994). Evaluation tests show that 44% reduction in word error rate from our previous word bigram system was achieved resulting in 90% word accuracy. |
キーワード(和) | 連続音声認識 / 大語彙 / 言語モデル / 単語trigram |
キーワード(英) | large vocabulary continuous speech recognition / word trigram / language models |
資料番号 | NLC96-51,SP96-82 |
発行日 |
研究会情報 | |
研究会 | NLC |
---|---|
開催期間 | 1996/12/13(から1日開催) |
開催地(和) | |
開催地(英) | |
テーマ(和) | |
テーマ(英) | |
委員長氏名(和) | |
委員長氏名(英) | |
副委員長氏名(和) | |
副委員長氏名(英) | |
幹事氏名(和) | |
幹事氏名(英) | |
幹事補佐氏名(和) | |
幹事補佐氏名(英) |
講演論文情報詳細 | |
申込み研究会 | Natural Language Understanding and Models of Communication (NLC) |
---|---|
本文の言語 | JPN |
タイトル(和) | 単語trigramを用いた大語彙連続音声認識 |
サブタイトル(和) | |
タイトル(英) | Large-Vocabulary Continuous Speech Recognition Using Word Trigrams |
サブタイトル(和) | |
キーワード(1)(和/英) | 連続音声認識 / large vocabulary continuous speech recognition |
キーワード(2)(和/英) | 大語彙 / word trigram |
キーワード(3)(和/英) | 言語モデル / language models |
キーワード(4)(和/英) | 単語trigram |
第 1 著者 氏名(和/英) | 吉田 航太郎 / Kotaro Yoshida |
第 1 著者 所属(和/英) | 東京工業大学情報理工学研究科 Tokyo Institute of Technology |
第 2 著者 氏名(和/英) | 松岡 達雄 / Tatsuo Matsuoka |
第 2 著者 所属(和/英) | NTTヒューマンインターフェース研究所 NTT Human Interface Laboratories |
第 3 著者 氏名(和/英) | 大附 克年 / Katsutoshi Ohtsuki |
第 3 著者 所属(和/英) | NTTヒューマンインターフェース研究所 NTT Human Interface Laboratories |
第 4 著者 氏名(和/英) | 古井 貞熙 / Sadaoki Furui |
第 4 著者 所属(和/英) | 東京工業大学情報理工学研究科 : NTTヒューマンインターフェース研究所 Tokyo Institute of Technology : NTT Human Interface Laboratories |
発表年月日 | 1996/12/13 |
資料番号 | NLC96-51,SP96-82 |
巻番号(vol) | vol.96 |
号番号(no) | 420 |
ページ範囲 | pp.- |
ページ数 | 6 |
発行日 |