講演名 2000/12/15
話し言葉音声認識の概観
河原 達也,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 読上げ音声の認識は数万語彙でもかなりの認識精度を達成しているのに対して、自然な話し言葉の音声については、タスクドメインを限定した場合でないと十分な性能が得られていないのが現状である。本稿では、話し言葉音声認識の困難さについて分析を行った上で、音響モデル・発音モデル・言語モデルなどのアプローチについて概観する。
抄録(英) While large vocabulary continuous speech recognition systems achieve high accuracy in read speech as in dictation systems, recognition performance on the spontaneous and conversational speech is still poor unless the task domain is limited. In this review, the problems and approaches in acoustic, pronunciation and language models are addressed.
キーワード(和) 音声認識 / 話し言葉 / 音響モデル / 発音モデル / 言語モデル
キーワード(英) speech recognition / spontaneous speech / conversational speech / acoustic model / language model
資料番号 NLC2000-47,SP2000-95
発行日

研究会情報
研究会 NLC
開催期間 2000/12/15(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Natural Language Understanding and Models of Communication (NLC)
本文の言語 JPN
タイトル(和) 話し言葉音声認識の概観
サブタイトル(和)
タイトル(英) Toward Spontaneous and Conversational Speech Recognition
サブタイトル(和)
キーワード(1)(和/英) 音声認識 / speech recognition
キーワード(2)(和/英) 話し言葉 / spontaneous speech
キーワード(3)(和/英) 音響モデル / conversational speech
キーワード(4)(和/英) 発音モデル / acoustic model
キーワード(5)(和/英) 言語モデル / language model
第 1 著者 氏名(和/英) 河原 達也 / Tatsuya Kawahara
第 1 著者 所属(和/英) 京都大学情報学研究科
School of Informatics, Kyoto University
発表年月日 2000/12/15
資料番号 NLC2000-47,SP2000-95
巻番号(vol) vol.100
号番号(no) 521
ページ範囲 pp.-
ページ数 5
発行日