講演名 2000/6/16
SP2000-26 単語グラフ生成の言語重み・挿入ペナルティ最適化の検討
斎院 俊典, 加藤 正治, 伊藤 彰則, 好田 正紀,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 単語グラフを中間表現とするマルチパスによる大語彙連続音声認識において, 単語グラフ生成のパラメータの良否はシステムの性能に大きく影響する.本報告では, 初期単語グラフのbigramによるリスコアリングに基づく, 単語グラフ生成のための言語重み・挿入ペナルティの最適化を検討する.本手法は, 第一パスWERが最小になるようなパラメータ設定法であり, 第二パスWERの改善に繋がるが検討項目となる.従来の処理量の大きな単語グラフ生成を繰り返したパラメータ設定に比べて, 処理量の小さなリスコアリングを利用することで短時間でパラメータの最適化ができる.新聞記事読み上げ文に対する認識実験の結果, 本手法によって得られたパラメータは多くの場合で第二パスWERの改善に繋がっており, さらには従来のパラメータ設定による認識結果に比較し同等かそれ以上の性能を示すことに成功した.
抄録(英) Language model weight and insertion penalty greatly affects the recognition performance of LVCSR system. In the multi-pass LVCSR system that uses word graph as an intermediate data structure, these decoder parameters should be optimized in order to generate a good word graph. In this paper, a new method to optimize these parameter is proposed. This method uses rescoring of the word graph using bigram LM instead of generating many word graphs for each parameter setting. As the rescoring is much faster than the re-generation of a word graph, the optimization time of the proposed method is much shorter than that of re-generation based one. However, as the method minimizes the first-pass WER, improvement of the second-pass WER is not garanteed. From the experimental result for the newspaper task, it is found that the proposed method doesn't only improve the first-pass WER but also improves the second-pass WER in most case.
キーワード(和) 大語彙連続音声認識 / 単語グラフ / リスコアリング / 言語重み / 挿入ペナルティ
キーワード(英) LVCSR / word graph / rescoring / language model weight / insertion penalty
資料番号 SP2000-26
発行日

研究会情報
研究会 SP
開催期間 2000/6/16(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Speech (SP)
本文の言語 JPN
タイトル(和) SP2000-26 単語グラフ生成の言語重み・挿入ペナルティ最適化の検討
サブタイトル(和)
タイトル(英) SP2000-26 Optimization of language model weight and insertion penalty for word graph generation
サブタイトル(和)
キーワード(1)(和/英) 大語彙連続音声認識 / LVCSR
キーワード(2)(和/英) 単語グラフ / word graph
キーワード(3)(和/英) リスコアリング / rescoring
キーワード(4)(和/英) 言語重み / language model weight
キーワード(5)(和/英) 挿入ペナルティ / insertion penalty
第 1 著者 氏名(和/英) 斎院 俊典 / Toshinori SAIIN
第 1 著者 所属(和/英) 山形大学工学部
Faculty of Engineering, Yamagata University
第 2 著者 氏名(和/英) 加藤 正治 / Masaharu KATOH
第 2 著者 所属(和/英) 山形大学工学部
Faculty of Engineering, Yamagata University
第 3 著者 氏名(和/英) 伊藤 彰則 / Akinori ITO
第 3 著者 所属(和/英) 山形大学工学部
Faculty of Engineering, Yamagata University
第 4 著者 氏名(和/英) 好田 正紀 / Masaki KOHDA
第 4 著者 所属(和/英) 山形大学工学部
Faculty of Engineering, Yamagata University
発表年月日 2000/6/16
資料番号 SP2000-26
巻番号(vol) vol.100
号番号(no) 137
ページ範囲 pp.-
ページ数 8
発行日