講演名 2003/12/12
連続音声認識コンソーシアムの活動報告及び最終版ソフトウエアの概要(第5回音声言語シンポジウム : プロジェクト紹介(2))
河原 達也, 武田 一哉, 伊藤 克亘, 李 晃伸, 鹿野 清宏, 山田 篤,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 連続音声認識コンソーシアム(CSRC)は、IPAプロジェクトで開発された「日本語ディクテーション基本ソフトウェア」の維持・発展をめざして、情報処理学会音声言語情報処理研究会のもとで2000年度から2002年度まで(2003年9月まで)活動を行ってきた。本稿では、この活動の報告を行うとともに、このたび編集した最終版ソフトウェアの概要を述べる。本プロジェクトでは、大語彙連続音声認識エンジンJuliusの機能拡張とWindows SAPI対応を行うとともに、非常に大規模なデータベースを用いた高精度な音響モデル・言語モデルの構築を行った。また音響モデルについては、多様な話者層(高齢者・小児)や入力環境(電話・車内環境など)に対応したモデルを整備した。
抄録(英) Continuous Speech Recognition Consortium (CSRC) was founded under IPSJ SIG-SLP for further enhancement of Japanese Dictation Toolkit that had been developed by the IPA project. An overview of its activities and final version of the developed software is given in this report. The LVCSR (large vocabulary continuous speech recognition) engine Julius has been improved both in functionality and stability, and ported to Windows in compliance with SAPI (Speech API). A set of acoustic and language models are trained using very large-scale databases. We also set up a variety of acoustic models to cover wider user generations and speech-input environments.
キーワード(和) 連続音声認識 / コンソーシアム / ソフトウェア
キーワード(英)
資料番号 NLC2003-106
発行日

研究会情報
研究会 NLC
開催期間 2003/12/12(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Natural Language Understanding and Models of Communication (NLC)
本文の言語 JPN
タイトル(和) 連続音声認識コンソーシアムの活動報告及び最終版ソフトウエアの概要(第5回音声言語シンポジウム : プロジェクト紹介(2))
サブタイトル(和)
タイトル(英) Overview of Activities and Software of Continuous Speech Recognition Consortium
サブタイトル(和)
キーワード(1)(和/英) 連続音声認識
キーワード(2)(和/英) コンソーシアム
キーワード(3)(和/英) ソフトウェア
第 1 著者 氏名(和/英) 河原 達也 / Tatsuya KAWAHARA
第 1 著者 所属(和/英) 京都大学学術情報メディアセンター
Kyoto University, School of Informatics
第 2 著者 氏名(和/英) 武田 一哉 / Kazuya TAKEDA
第 2 著者 所属(和/英) 名古屋大学情報科学研究科
Nagoya University, School of Information Science
第 3 著者 氏名(和/英) 伊藤 克亘 / Katsunobu ITOU
第 3 著者 所属(和/英) 名古屋大学情報科学研究科
Nagoya University, School of Information Science
第 4 著者 氏名(和/英) 李 晃伸 / Akinobu LEE
第 4 著者 所属(和/英) 奈良先端科学技術大学院大学情報科学研究科
Nara Institute of Science and Technology, School of Information Science
第 5 著者 氏名(和/英) 鹿野 清宏 / Kiyohiro SHIKANO
第 5 著者 所属(和/英) 奈良先端科学技術大学院大学情報科学研究科
Nara Institute of Science and Technology, School of Information Science
第 6 著者 氏名(和/英) 山田 篤 / Atsushi YAMADA
第 6 著者 所属(和/英) (財)京都高度技術研究所
ASTEM, Kyoto
発表年月日 2003/12/12
資料番号 NLC2003-106
巻番号(vol) vol.103
号番号(no) 518
ページ範囲 pp.-
ページ数 6
発行日