講演名 2004/12/14
複数の信頼度尺度を統合した音声認識(ポスターセッション)(第6回音声言語シンポジウム)
小林 彰夫, 尾上 和穂, 佐藤 庄衛, 今井 亨,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 複数の信頼度尺度を統合した音声認識について報告する.信頼度尺度は,一般に音声認識システムが出力する単語仮説の正誤の識別に利用されている.信頼度尺度が仮説の識別に対して高い精度を持つのであれば,システムの単語誤り率の改善に寄与すると考えられる.そこで,システムの出力する単語仮説の識別精度を向上羊せるために,複数の倍頼度尺度を統合して新たな信頼度尺度を構成する.信頼度尺度の統合は,最大エントロピー(ME)法に基づいた統計的手法を用いる.さらに,統合した信頼度尺度を用いて単語仮説の音響・言語スコアを補正し,単語誤り率の改善を試みるリスコアリング手法を提案する.提案手法をサポートベクターマシン(SVM)に基づく統合手法と比較したところ,MEに基づく手法の方が識別誤り率,単語誤り率の改善の両者で改善効果が大きかった.
抄録(英) This paper describes speech recognition using integration of confidence measures. Confidence measures are widely used in classifying word hypotehses into correct or incorrect classes. The measures will make a large contribution to the improvement of the word error rates (WERs) when they give high classification performances. In this paper we design an integrated confidence measure by maximum entropy (ME) modeling for the classifier. We propose an n-best rescoring method using output scores of the classifier to improve the WERs of the. system by correcting the acoustic and language scores. Our proposed method was compared with the classifier based on support vector machines (SVMs), which also integrates the confidence measures. The results of classification and n-best rescoring showed the ME-based classifier performed better than the SVM-based classifier.
キーワード(和) 信頼度尺度 / 最大エントロピー法 / サポートベクターマシン / n-bestリスコアリング
キーワード(英) words confidence measure / maximum entropy models / support vector machines / n-best rescoring
資料番号 NLC2004-72,SP2004-112
発行日

研究会情報
研究会 SP
開催期間 2004/12/14(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Speech (SP)
本文の言語 JPN
タイトル(和) 複数の信頼度尺度を統合した音声認識(ポスターセッション)(第6回音声言語シンポジウム)
サブタイトル(和)
タイトル(英) Speech Recognition with Integration of Confidence Measures
サブタイトル(和)
キーワード(1)(和/英) 信頼度尺度 / words confidence measure
キーワード(2)(和/英) 最大エントロピー法 / maximum entropy models
キーワード(3)(和/英) サポートベクターマシン / support vector machines
キーワード(4)(和/英) n-bestリスコアリング / n-best rescoring
第 1 著者 氏名(和/英) 小林 彰夫 / Akio KOBAYASHI
第 1 著者 所属(和/英) NHK放送技術研究所
NHK Science & Technical Research Laboratories
第 2 著者 氏名(和/英) 尾上 和穂 / Kazuo ONOE
第 2 著者 所属(和/英) NHK放送技術研究所
NHK Science & Technical Research Laboratories
第 3 著者 氏名(和/英) 佐藤 庄衛 / Shoe SATO
第 3 著者 所属(和/英) NHK放送技術研究所
NHK Science & Technical Research Laboratories
第 4 著者 氏名(和/英) 今井 亨 / Toru IMAI
第 4 著者 所属(和/英) NHK放送技術研究所
NHK Science & Technical Research Laboratories
発表年月日 2004/12/14
資料番号 NLC2004-72,SP2004-112
巻番号(vol) vol.104
号番号(no) 542
ページ範囲 pp.-
ページ数 6
発行日