講演名 2005/12/14
単語の重要度を考慮したベイズリスク最小化音声認識とそれに基づく情報検索(Session-2 情報検索, 第7回音声言語シンポジウム)
南條 浩輝, 翠 輝久, 河原 達也,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 情報検索システムのフロントエンドとしての音声認識を目的とした音声認識の新しい評価尺度とそれに基づく認識戦略について述べる.これまで, 音声認識の一般的な評価尺度として, 全ての単語を一様に扱う「単語誤り率(word error rate : WER)」が用いられてきた.これに対して, 情報検索の観点から各単語の重要度を考慮した「重みつき単語誤り率(weighted word error rate : WWER)」を提案する.その上で, ベイズリスク最小化(Minimum Bayes-Risk : MBR)の枠組みに基づいて, 重みつき単語誤り率の最小化を行う音声認識を実現する.文書検索システム「音声版ダイアログナビ」を用いて, 提案する認識手法が重みつき単語誤り率及び情報検索精度の改善に効果があることを示す.
抄録(英) The paper addresses a new evaluation measure of automatic speech recognition (ASR) and a decoding strategy oriented for speech-based information retrieval (IR). Although word error rate (WER), which treats all words in a uniform manner, has been widely used as an evaluation measure of ASR, significance of words are different in speech understanding or IR. In this paper, we define a new ASR evaluation measure, namely, weighted word error rate (WWER) that gives a weight on errors from a viewpoint of IR. Then, we formulate a decoding method to minimize WWER based on Minimum Bayes-Risk (MBR) framework, and show that the decoding method improves WWER and IR accuracy.
キーワード(和) 音声認識 / ベイズリスク最小化デコーディング / 情報検索 / 文書検索
キーワード(英) speech recognition / Minimum Bayes-Risk decoding / information retrieval / document retrieval
資料番号 NLC2005-66,SP2005-99
発行日

研究会情報
研究会 NLC
開催期間 2005/12/14(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Natural Language Understanding and Models of Communication (NLC)
本文の言語 JPN
タイトル(和) 単語の重要度を考慮したベイズリスク最小化音声認識とそれに基づく情報検索(Session-2 情報検索, 第7回音声言語シンポジウム)
サブタイトル(和)
タイトル(英) Information Retrieval based on Minimum Bayes-Risk Decoding considering Word Significance
サブタイトル(和)
キーワード(1)(和/英) 音声認識 / speech recognition
キーワード(2)(和/英) ベイズリスク最小化デコーディング / Minimum Bayes-Risk decoding
キーワード(3)(和/英) 情報検索 / information retrieval
キーワード(4)(和/英) 文書検索 / document retrieval
第 1 著者 氏名(和/英) 南條 浩輝 / Hiroaki NANJO
第 1 著者 所属(和/英) 龍谷大学理工学部情報メディア学科
Faculty of Science and Technology, Ryukoku University
第 2 著者 氏名(和/英) 翠 輝久 / Teruhisa MISU
第 2 著者 所属(和/英) 京都大学情報学研究科知能情報学専攻
Graduate School of Informatics, Kyoto University
第 3 著者 氏名(和/英) 河原 達也 / Tatsuya KAWAHARA
第 3 著者 所属(和/英) 京都大学情報学研究科知能情報学専攻
Graduate School of Informatics, Kyoto University
発表年月日 2005/12/14
資料番号 NLC2005-66,SP2005-99
巻番号(vol) vol.105
号番号(no) 493
ページ範囲 pp.-
ページ数 6
発行日