講演名 2002/12/13
文クラスタリングによる複数言語モデルを用いた誤認識文の推定
藤永 勝久, 小窪 浩明, 山本 博史, 菊井 玄一郎, 下平 博,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本稿では,音声認識結果の発話単位の正解判定法について提案する.近年,誤認識単語の推定の方法として複数の認識システムの出力結果の共通部分を用いる方法が提案されている.この方法は,複数のシステムが同じ単語を出力している部分は正解である可能性が高いというROVER法の考え方に基づくものであり,その単語を認識結果のうち信頼性の高い部分として出力するものである.本稿では,これを認識結果全体の信頼性を得るための方法に応用することとする.ROVER法では複数の認識システムを用意しておき,それらを並列に実行させなければならないが,(1)認識システムを複数用意することが困難,(2)計算コストがシステム数に応じて増加,という問題点がある.本稿では最初の問題に対しては,コーパスの自動クラスタリングにより任意の数の言語モデルを生成し,2番目の問題に対しては,リスコアリングを用いる.本手法に対し,大語彙連続認識実験の認識結果の正解判定による評価を行った.その結果,正解判定を行わない場合と比較して,認識結果に含まれる正解文を10%捨てることで18ポイント,20%捨てることで24ポイント高い適合率が得られた.また,クラスタ数などの条件の違いに対する評価も行った.
抄録(英) In this paper, we propose a new method that detects mis-recognized utterances, based on voting scheme like ROVER. ROVER has two serious problems, 1) it is difficult to construct multiple speech recognition systems (SRSs), 2) calculation cost increases according to the number of SRSs. In contrast to the conventional ROVER, the proposed method uses multiple language models (LMs), general LM and sub LMs generated by clustered sentence, instead of different SRSs. Speech recognition with sub LMs is proceeded by rescoring, instead of parallel decoding. Through experiments, the proposed method resulted in 18-point higher precision with 10% loss of recall from baseline, and 22-point higher precision with 20% loss of recall.
キーワード(和) ROVER / 文クラスタリング / 信頼度尺度 / 誤認識文検出
キーワード(英) ROVER / sentence clustering / confidence measure / mis-recognized utterance detection
資料番号 NLC2002-72
発行日

研究会情報
研究会 NLC
開催期間 2002/12/13(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Natural Language Understanding and Models of Communication (NLC)
本文の言語 JPN
タイトル(和) 文クラスタリングによる複数言語モデルを用いた誤認識文の推定
サブタイトル(和)
タイトル(英) Mis-recognized Utterance Detection Using Multiple Language Models Generated by Clustered Sentences
サブタイトル(和)
キーワード(1)(和/英) ROVER / ROVER
キーワード(2)(和/英) 文クラスタリング / sentence clustering
キーワード(3)(和/英) 信頼度尺度 / confidence measure
キーワード(4)(和/英) 誤認識文検出 / mis-recognized utterance detection
第 1 著者 氏名(和/英) 藤永 勝久 / Katsuhisa FUJINAGA
第 1 著者 所属(和/英) ATR音声言語コミュニケーション研究所:北陸先端科学技術大学院大学 情報科学研究科
ATR Spoken Language Translation Research Laboratories:School of Information Science, Japan Advanced Institute of Science and Technology
第 2 著者 氏名(和/英) 小窪 浩明 / Hiroaki KOKUBO
第 2 著者 所属(和/英) ATR音声言語コミュニケーション研究所
ATR Spoken Language Translation Research Laboratories
第 3 著者 氏名(和/英) 山本 博史 / Hirofumi YAMAMOTO
第 3 著者 所属(和/英) ATR音声言語コミュニケーション研究所
ATR Spoken Language Translation Research Laboratories
第 4 著者 氏名(和/英) 菊井 玄一郎 / Genichiro KIKUI
第 4 著者 所属(和/英) ATR音声言語コミュニケーション研究所
ATR Spoken Language Translation Research Laboratories
第 5 著者 氏名(和/英) 下平 博 / Hiroshi SHIMODAIRA
第 5 著者 所属(和/英) 北陸先端科学技術大学院大学 情報科学研究科
School of Information Science, Japan Advanced Institute of Science and Technology
発表年月日 2002/12/13
資料番号 NLC2002-72
巻番号(vol) vol.102
号番号(no) 528
ページ範囲 pp.-
ページ数 6
発行日