講演名 2002/12/13
言語モデルのバッチ型教師なし適応化法
横山 忠介, 篠崎 隆宏, 岩野 公司, 古井 貞煕,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本稿では話し言葉音声認識の性能向上を目的とした,クラスモデルを用いた言語モデルのバッチ型教師なし適応化法を提案する。対象としているタスクは日本語講演音声認識である.提案手法では,複数の講演から構築される話題非依存の単語 n-gram を用いて一つの講演音声を全て認識し,その認識仮説から講演ごとの話題依存クラス言語モデルを学習する.得られた話題依存クラス言語モデルを話題非依存言語モデルと線形補間する事により講演ごとに言語モデル適応を行い,その適応モデルを用いて講演音声を再認識する.提案する手法を用いた評価実験を行った結果,評価セット中の全ての講演について適応による単語正解精度の向上を確認した.適応化における最適なクラス数は100程度であり,そのときの単語正解精度の改善は絶対値で2.3%であった.さらに,音響モデルの教師なし適応を併用した場合についても言語モデルの適応化の効果を評価する実験を行ったところ,同様の認識性能の改善が得られ,最終的な講演音声認識性能は,単語正解精度で約71.8%に達した.
抄録(英) This paper proposes an unsupervised, batch-type, class-based language model adaptation method for spontaneous speech recognition. The word classes are automatically determined by maximizing the bigram likelihood using a training set. A class-based language model is built based on recognition hypotheses obtained using a general word-based language model, and linearly interpolated with the general language model. All the input utterances are re-recognized using the adapted language model. The proposed method was applied to the recognition of spontaneous presentations and was found to be effective in improving the recognition accuracy for all the presentations. The best condition was found to be using 100 word classes, and in this condition 2.3% of the absolute value improvement in the word accuracy averaged over all the speakers was achieved, using speaker independent acoustic models. It was also found that effectiveness of the proposed method is additive to that of the acoustic model adaptation. Consequently, 71.8% word recognition accuracy was achieved for spontaneous presentations after adapting both acoustic and language models.
キーワード(和) 教師なし言語モデル適応 / バッチ型適応 / クラス言語モデル
キーワード(英) Unsupervised language model adaptation / batch-type adaptation / class-based language model
資料番号 NLC2002-74
発行日

研究会情報
研究会 NLC
開催期間 2002/12/13(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Natural Language Understanding and Models of Communication (NLC)
本文の言語 JPN
タイトル(和) 言語モデルのバッチ型教師なし適応化法
サブタイトル(和)
タイトル(英) Unsupervised batch-type adaptation method for language models
サブタイトル(和)
キーワード(1)(和/英) 教師なし言語モデル適応 / Unsupervised language model adaptation
キーワード(2)(和/英) バッチ型適応 / batch-type adaptation
キーワード(3)(和/英) クラス言語モデル / class-based language model
第 1 著者 氏名(和/英) 横山 忠介 / Tadasuke YOKOYAMA
第 1 著者 所属(和/英) 東京工業大学大学院 情報理工学研究科 計算工学専攻
Department of Computer Science, Tokyo Institute of Technology
第 2 著者 氏名(和/英) 篠崎 隆宏 / Takahiro SHINOZAKI
第 2 著者 所属(和/英) 東京工業大学大学院 情報理工学研究科 計算工学専攻
Department of Computer Science, Tokyo Institute of Technology
第 3 著者 氏名(和/英) 岩野 公司 / Koji IWANO
第 3 著者 所属(和/英) 東京工業大学大学院 情報理工学研究科 計算工学専攻
Department of Computer Science, Tokyo Institute of Technology
第 4 著者 氏名(和/英) 古井 貞煕 / Sadaoki FURUI
第 4 著者 所属(和/英) 東京工業大学大学院 情報理工学研究科 計算工学専攻
Department of Computer Science, Tokyo Institute of Technology
発表年月日 2002/12/13
資料番号 NLC2002-74
巻番号(vol) vol.102
号番号(no) 528
ページ範囲 pp.-
ページ数 6
発行日