講演名 1994/5/19
不特定話者認識
松岡 達雄,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 電話網におけるサービスなどに音声認識を適用する場合には不特定多数のユーザに対して高い認識精度が得られなければならない。不特定話者音声認識では、話者による音声のスペクトル特徴の変動をいかに吸収して高い認識精度を達成するかが重要な問題である。本稿では、話者による変動に対応して不特定話者音声認識で高い認識精度を得るための手法についてHMMにもとづく方法を中心に述べる。話者による変動に対処する方法には、話者によらず音韻性を表現する特徴パラメータを用いる方法、モデルを話者クラスタに分けて蓄えておき入力音声の話者にもっとも適合するクラスタのモデルにより認識を行なう方法、音韻ごとの特徴パラメータの分布に重なりをなくしその分離をよくするようにモデルを学習する方法、認識対象とする話者の少量の音声を用いてモデルパラメータをその話者に適応化する方法などがある。
抄録(英) In order to apply speech recognition to practical applications such as telephone network services,recognizers should attain high recognition performance for number of unknown speakers(users).For speaker-independent speech recognition,the main issue is how to attain high recognition coping with variation of spectral characteristics which is due to the large number of speakers.In this paper,some methods for coping with speaker variation are described,in particular the methods using HMMs.The methods include the dynamic spectral feature parameter,the multiple-template method,the speaker cluster method,discriminative training,and speaker adaptation.
キーワード(和) HMM / マルチテンプレート / パラメータ推定法 / 音響モデル / 音声データベース
キーワード(英) HMM / Maltiple-template / Parameter Estimation / Acoustic model / Speech database
資料番号 SP94-4
発行日

研究会情報
研究会 SP
開催期間 1994/5/19(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Speech (SP)
本文の言語 JPN
タイトル(和) 不特定話者認識
サブタイトル(和)
タイトル(英) Speaker-Independent Speech Recoguition
サブタイトル(和)
キーワード(1)(和/英) HMM / HMM
キーワード(2)(和/英) マルチテンプレート / Maltiple-template
キーワード(3)(和/英) パラメータ推定法 / Parameter Estimation
キーワード(4)(和/英) 音響モデル / Acoustic model
キーワード(5)(和/英) 音声データベース / Speech database
第 1 著者 氏名(和/英) 松岡 達雄 / Tatsuo Matsuoka
第 1 著者 所属(和/英) NTTヒューマンインタフェース研究所
NTT Human Interface Laboratories
発表年月日 1994/5/19
資料番号 SP94-4
巻番号(vol) vol.94
号番号(no) 42
ページ範囲 pp.-
ページ数 8
発行日