講演名 | 2001/12/13 DARPA SPINEタスクのためのATR音声認識システム マルコフ コンスタンチン, 松井 知子, グルーン ライナー, チョウ キンソン, 中村 哲, |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | 本稿では、DARPA SPINE2タスク用に構築した、ATR音声認識システムについて述べる。このタスクでは、実環境における雑音や伝送歪みを含む音声データを対象とする。本システムでは、それらのデータを頑健に認識するために、周波数差分スペクトルに基づくメルスケール・ケプストラム特徴量、オンラインMLLR適応化、単語単位の仮説統合などのいくつかの技術を効果的に組み入れている。 |
抄録(英) | This paper presents the ATR speech recognition system designed for the DARPA SPINE2 evaluation task. The system is capable of dealing with speech from highly variable, real world noisy conditions and communication channels. A number of robust techniques were implemented, such as differential spectrum mel-scale cepstrum features, on-line MLLR adaptation and word level hypothesis combination, which led to significant reduction of the word error rate. |
キーワード(和) | 耐雑音性 / オンライン適応化 / 仮説統合 / 頑健な特徴量 |
キーワード(英) | noise robustness / online adaptation / hypothesis combination / robust features |
資料番号 | NLC2001-55,SP2001-90 |
発行日 |
研究会情報 | |
研究会 | SP |
---|---|
開催期間 | 2001/12/13(から1日開催) |
開催地(和) | |
開催地(英) | |
テーマ(和) | |
テーマ(英) | |
委員長氏名(和) | |
委員長氏名(英) | |
副委員長氏名(和) | |
副委員長氏名(英) | |
幹事氏名(和) | |
幹事氏名(英) | |
幹事補佐氏名(和) | |
幹事補佐氏名(英) |
講演論文情報詳細 | |
申込み研究会 | Speech (SP) |
---|---|
本文の言語 | ENG |
タイトル(和) | DARPA SPINEタスクのためのATR音声認識システム |
サブタイトル(和) | |
タイトル(英) | ATR System for Robust Speech Recognition in Real World Noisy and Channel Environments Evaluation on DAPRA SPINE2 Task |
サブタイトル(和) | |
キーワード(1)(和/英) | 耐雑音性 / noise robustness |
キーワード(2)(和/英) | オンライン適応化 / online adaptation |
キーワード(3)(和/英) | 仮説統合 / hypothesis combination |
キーワード(4)(和/英) | 頑健な特徴量 / robust features |
第 1 著者 氏名(和/英) | マルコフ コンスタンチン / Konstantin MARKOV |
第 1 著者 所属(和/英) | ATR音声言語コミュニケーション研究所 ATR Spoken Language Translation Research Labs. |
第 2 著者 氏名(和/英) | 松井 知子 / Tomoko MATSUI |
第 2 著者 所属(和/英) | ATR音声言語コミュニケーション研究所 ATR Spoken Language Translation Research Labs. |
第 3 著者 氏名(和/英) | グルーン ライナー / Rainer GRUHN |
第 3 著者 所属(和/英) | ATR音声言語コミュニケーション研究所 ATR Spoken Language Translation Research Labs. |
第 4 著者 氏名(和/英) | チョウ キンソン / Jinsong ZHANG |
第 4 著者 所属(和/英) | ATR音声言語コミュニケーション研究所 ATR Spoken Language Translation Research Labs. |
第 5 著者 氏名(和/英) | 中村 哲 / Satoshi NAKAMURA |
第 5 著者 所属(和/英) | ATR音声言語コミュニケーション研究所 ATR Spoken Language Translation Research Labs. |
発表年月日 | 2001/12/13 |
資料番号 | NLC2001-55,SP2001-90 |
巻番号(vol) | vol.101 |
号番号(no) | 522 |
ページ範囲 | pp.- |
ページ数 | 7 |
発行日 |