講演名 2006/12/15
音声認識システムSOLONの日本語話し言葉コーパスによる評価(2006年版)(Session-7 システム,第8回音声言語シンポジウム)
中村 篤, 大庭 隆伸, 渡部 晋治, 石塚 健太郎, 藤本 雅清, 堀 貴明, マクダーモット エリック, 南 泰浩,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) NTTコミュニケーション科学基礎研究所では実環境での自然な話し言葉を対象とした音声認識の研究を進めている.本報告では,そのテストベッドとして開発中の音声認識ソフトウェア'SOLON'の,日本語話し言葉コーパス(CSJ: Corpus of Spontaneous Japanese)を用いたベンチマーク評価結果を報告する.音声区間の事前検出,発話速度依存音声分析,言語モデルの誤り訂正学習,全共分散型モデルの識別学習,教師なし話者適応,及びそれらの組み合わせによる効果を実験により示す.
抄録(英) This article describes results from the latest benchmark tests of our speech recognition system 'SOLON' using the Corpus of Spontaneous Japanese (CSJ). The improvement in recognition accuracy using several techniques, including prior voice-activity detection, speaking-rate dependent analysis, corrective language modeling, discriminative training of full-covariance parameters, unsupervised model adaptation, and their combinations, are reported.
キーワード(和) 重み付き有限状態トランスデューサ / 発話区間検出 / 発話速度依存分析 / 誤り訂正学習 / 識別学習 / 教師なし話者適応
キーワード(英) WFST / Voice Activity Detection / Speaking-rate Dependent Analysis / Corrective Training / Discriminative Training / Unsupervised Adaptation
資料番号 NLC2006-71,SP2006-127
発行日

研究会情報
研究会 NLC
開催期間 2006/12/15(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Natural Language Understanding and Models of Communication (NLC)
本文の言語 JPN
タイトル(和) 音声認識システムSOLONの日本語話し言葉コーパスによる評価(2006年版)(Session-7 システム,第8回音声言語シンポジウム)
サブタイトル(和)
タイトル(英) Evaluation of the SOLON Speech Recognition System : 2006 Benchmark using the Corpus of Spontaneous Japanese
サブタイトル(和)
キーワード(1)(和/英) 重み付き有限状態トランスデューサ / WFST
キーワード(2)(和/英) 発話区間検出 / Voice Activity Detection
キーワード(3)(和/英) 発話速度依存分析 / Speaking-rate Dependent Analysis
キーワード(4)(和/英) 誤り訂正学習 / Corrective Training
キーワード(5)(和/英) 識別学習 / Discriminative Training
キーワード(6)(和/英) 教師なし話者適応 / Unsupervised Adaptation
第 1 著者 氏名(和/英) 中村 篤 / Atsushi Nakamura
第 1 著者 所属(和/英) 日本電信電話株式会社:NTTコミュニケーション科学基礎研究所 メディア情報研究部 信号処理研究グループ
NTT Communication Science Laboratories:NTT Corporation
第 2 著者 氏名(和/英) 大庭 隆伸 / Takanobu Oba
第 2 著者 所属(和/英) 日本電信電話株式会社:NTTコミュニケーション科学基礎研究所 メディア情報研究部 信号処理研究グループ
NTT Communication Science Laboratories:NTT Corporation
第 3 著者 氏名(和/英) 渡部 晋治 / Shinji Watanabe
第 3 著者 所属(和/英) 日本電信電話株式会社:NTTコミュニケーション科学基礎研究所 メディア情報研究部 信号処理研究グループ
NTT Communication Science Laboratories:NTT Corporation
第 4 著者 氏名(和/英) 石塚 健太郎 / Kentaro Ishizuka
第 4 著者 所属(和/英) 日本電信電話株式会社:NTTコミュニケーション科学基礎研究所 メディア情報研究部 信号処理研究グループ
NTT Communication Science Laboratories:NTT Corporation
第 5 著者 氏名(和/英) 藤本 雅清 / Masakiyo Fujimoto
第 5 著者 所属(和/英) 日本電信電話株式会社:NTTコミュニケーション科学基礎研究所 メディア情報研究部 信号処理研究グループ
NTT Communication Science Laboratories:NTT Corporation
第 6 著者 氏名(和/英) 堀 貴明 / Takaaki Hori
第 6 著者 所属(和/英) 日本電信電話株式会社:NTTコミュニケーション科学基礎研究所 メディア情報研究部 信号処理研究グループ
NTT Communication Science Laboratories:NTT Corporation
第 7 著者 氏名(和/英) マクダーモット エリック / Erik McDermott
第 7 著者 所属(和/英) 日本電信電話株式会社:NTTコミュニケーション科学基礎研究所 メディア情報研究部 信号処理研究グループ
NTT Communication Science Laboratories:NTT Corporation
第 8 著者 氏名(和/英) 南 泰浩 / Yasuhiro Minami
第 8 著者 所属(和/英) 日本電信電話株式会社:NTTコミュニケーション科学基礎研究所 メディア情報研究部 信号処理研究グループ
NTT Communication Science Laboratories:NTT Corporation
発表年月日 2006/12/15
資料番号 NLC2006-71,SP2006-127
巻番号(vol) vol.106
号番号(no) 442
ページ範囲 pp.-
ページ数 6
発行日