講演名 | 2004/12/15 音声理解のための音声認識評価尺度とベイズリスク最小化デコーディング(大語彙音声認識)(第6回音声言語シンポジウム) 南條 浩輝, 河原 達也, |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | ドメインを限定しない自然な話し言葉の音声理解を目的とした音声認識の評価尺度とそれに基づくデコーディング手法を提案する.従来,音声認識の一般的な評価尺度として,全ての単語を一様に扱う「単語誤り率(word error rate: WER)」が用いられてきた.これに対して,情報検索の観点から各単語の重要度を考慮した「重みつきキーワード誤り率(weighted keyword error rate: WKER)」を提案する.講演音声からの重要文抽出のタスクにおいて,重みつきキーワード誤り率が重要文抽出の精度と相関が高いことを示す.その上で,ベイズリスク最小化(Minimura Bayes-Risk: MBR)の枠組みに基づいて,重みつきキーワード誤り率の最小化を行う音声認識を実現する.CSJの学会講演17講演を用いて評価を行い,提案する認識手法が重みつきキーワード誤り率及び重要文抽出精度の改善に効果があることを示す. |
抄録(英) | A new evaluation measure of speech recognition and a decoding strategy for keyword-based open-domain speech understanding are presented. Conventionally, WER (word error rate) has been widely used as an evaluation measure of speech recognition, which treats all words in a uniform manner. In this paper, we define a weighted keyword error rate (WKER) which gives a weight on errors from a viewpoint of information retrieval. We first demonstrate that this measure is more appropriate for predicting the performance of key sentence indexing of oral presentations. Then, we formulate a decoding method to minimize WKER.based on Minimum Bayes-Risk (MBR) framework, and show that the decoding method works reasonably for improving WKER and key sentence indexing. |
キーワード(和) | 音声認識 / 音声理解 / 重要文抽出 / ベイズリスタ最小化デコーディング |
キーワード(英) | speech recognition / speech understanding / key sentence extraction / Minimum Bayes-Risk decoding |
資料番号 | NLC2004-82,SP2004-122 |
発行日 |
研究会情報 | |
研究会 | NLC |
---|---|
開催期間 | 2004/12/15(から1日開催) |
開催地(和) | |
開催地(英) | |
テーマ(和) | |
テーマ(英) | |
委員長氏名(和) | |
委員長氏名(英) | |
副委員長氏名(和) | |
副委員長氏名(英) | |
幹事氏名(和) | |
幹事氏名(英) | |
幹事補佐氏名(和) | |
幹事補佐氏名(英) |
講演論文情報詳細 | |
申込み研究会 | Natural Language Understanding and Models of Communication (NLC) |
---|---|
本文の言語 | JPN |
タイトル(和) | 音声理解のための音声認識評価尺度とベイズリスク最小化デコーディング(大語彙音声認識)(第6回音声言語シンポジウム) |
サブタイトル(和) | |
タイトル(英) | ASR Evaluation Measure and Minimum Bayes-Risk Decoding for Open-domain Speech Understanding |
サブタイトル(和) | |
キーワード(1)(和/英) | 音声認識 / speech recognition |
キーワード(2)(和/英) | 音声理解 / speech understanding |
キーワード(3)(和/英) | 重要文抽出 / key sentence extraction |
キーワード(4)(和/英) | ベイズリスタ最小化デコーディング / Minimum Bayes-Risk decoding |
第 1 著者 氏名(和/英) | 南條 浩輝 / Hiroaki NANJO |
第 1 著者 所属(和/英) | 龍谷大学理工学部情報メディア学科 Faculty of Science and Technology, Ryukoku University |
第 2 著者 氏名(和/英) | 河原 達也 / Tatsuya KAWAHARA |
第 2 著者 所属(和/英) | 京都大学学術情報メディアセンター Academic Center for Computing and Media Studies, Kyoto University |
発表年月日 | 2004/12/15 |
資料番号 | NLC2004-82,SP2004-122 |
巻番号(vol) | vol.104 |
号番号(no) | 540 |
ページ範囲 | pp.- |
ページ数 | 6 |
発行日 |