講演名 2005/12/15
複数音声コーパスの俯瞰的分析(Session-6 スペシャルセッション: 共通コーパスを利用した耐雑音技術評価, 第7回音声言語シンポジウム)
庄境 誠,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 市場からの要請を受けて, 認識性能保証の方法論を確立することは, 音声認識ベンダーとして重要な技術課題の1つである.認識性能保証ができることは, 音声認識アプリケーションの仕様に対して, 認識性能分布を予め予測できるベンチマーク技術を有することを意味する.そのためには, 実環境における様々な日本語音声の変動要因を把握することが出発点である.筆者らは, 音声コーパスから学習された統計モデル間の距離尺度と多次元尺度法を組み合わせて, コーパス空間の俯瞰的分析手法の研究を進めている.既に, 公開されている日本語の複数音声コーパスを本手法により分析した予備的検討結果を紹介し, ベンチマーク方法論確立に向けた今後の技術課題について述べる.
抄録(英) We are now carrying researches of comprehensive analysis method of corpus space by combining a distance measure among statistical models trained from speech corpora and a multidimensional scaling technique. Some preliminary results obtained from the analysis of open Japanese speech corpora by the method are shown. Technical issues to be solved in near future to establish the benchmarking methodology are discussed.
キーワード(和) 音声 / コーパス / 隠れマルコフモデル / 多次元尺度法
キーワード(英) Speech / Corpus / HMM / Multidimensional Scaling
資料番号 NLC2005-79,SP2005-112
発行日

研究会情報
研究会 NLC
開催期間 2005/12/15(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Natural Language Understanding and Models of Communication (NLC)
本文の言語 JPN
タイトル(和) 複数音声コーパスの俯瞰的分析(Session-6 スペシャルセッション: 共通コーパスを利用した耐雑音技術評価, 第7回音声言語シンポジウム)
サブタイトル(和)
タイトル(英) Comprehensive Analysis of Multiple Speech Corpora
サブタイトル(和)
キーワード(1)(和/英) 音声 / Speech
キーワード(2)(和/英) コーパス / Corpus
キーワード(3)(和/英) 隠れマルコフモデル / HMM
キーワード(4)(和/英) 多次元尺度法 / Multidimensional Scaling
第 1 著者 氏名(和/英) 庄境 誠 / Makoto SHOZAKAI
第 1 著者 所属(和/英) 旭化成株式会社情報技術研究所
Information Technology Laboratory, Asahi Kasei Corporation
発表年月日 2005/12/15
資料番号 NLC2005-79,SP2005-112
巻番号(vol) vol.105
号番号(no) 494
ページ範囲 pp.-
ページ数 6
発行日