講演名 2007/12/13
マルチストリームHMMを用いた特徴量の次元別重み付き話者照合の検討(音声認識・識別,第9回音声言語シンポジウム)
小島 慎也, 岩野 公司, 古井 貞煕,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本稿では,音響特徴量の各次元を個別のストリームとしたマルチストリームHMMを用いた話者照合の耐雑音性について検討する.各ストリームの重みは線形判別分析(LDA)を基づく手法により推定し,教師なしの条件でストリーム重みを推定した場合や,評価データと異なる雑音条件のデータを重み推定用データとして利用し,評価データの雑音条件に依存しない重みを教師ありで推定した場合について性能の評価を行った.特徴量には,ケプストラム特徴量(MFCC)とスペクトル特徴量(SPEC)を用いた.様々な種類の雑音・SN比条件の日本語4桁連続数字音声による話者照合実験を行った結果,どちらの特徴量を用いても,教師なし条件での推定法によって,SN比20,15dBでは全ての雑音で誤り率が削減されることが分かった.また,雑音条件に依存しない推定方法によって全ての雑音条件で耐雑音性が向上することが確認された.
抄録(英) This paper describes a noise-robust speaker verification method using multi-stream HMMs. In this framework, each dimension of acoustic feature vectors is treated as an individual stream and then each stream is automatically weighted by a Linear Discriminant Analysis (LDA) based technique so as to emphasize noise-robust dimensions. This paper proposes two types of weight estimation using the LDA-based technique: unsupervised estimation and supervised noise-independent-weight estimation. In the latter estimation, the LDA is applied to development data contaminated with various noises different from the noise in testing data. Experiments were conducted using Japanese four-connected-digit utterances in various kinds of noise and SNR conditions. Two kinds of acoustic features, cepstrum domain features (MFCC) and spectrum domain features (SPEC), were used for the experiments. For both features, experimental results show that the unsupervised estimation reduces the equal error rates (EERs) in relatively high-SNR (15-20dB) conditions and the noise-independent-weight estimation improves the noise robustness in all noise conditions.
キーワード(和) 話者照合 / 耐雑音 / マルチストリームHMM / 線形判別分析(LDA) / スペクトル特徴量
キーワード(英) speaker verification / noise robustness / multi-stream HMM / linear discriminant analysis (LDA) / spectral domain feature
資料番号 NLC2007-40,SP2007-103
発行日

研究会情報
研究会 SP
開催期間 2007/12/13(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Speech (SP)
本文の言語 JPN
タイトル(和) マルチストリームHMMを用いた特徴量の次元別重み付き話者照合の検討(音声認識・識別,第9回音声言語シンポジウム)
サブタイトル(和)
タイトル(英) Speaker verification using multi-stream HMMs with dimensionally weighted feature vectors
サブタイトル(和)
キーワード(1)(和/英) 話者照合 / speaker verification
キーワード(2)(和/英) 耐雑音 / noise robustness
キーワード(3)(和/英) マルチストリームHMM / multi-stream HMM
キーワード(4)(和/英) 線形判別分析(LDA) / linear discriminant analysis (LDA)
キーワード(5)(和/英) スペクトル特徴量 / spectral domain feature
第 1 著者 氏名(和/英) 小島 慎也 / Shinya KOJIMA
第 1 著者 所属(和/英) 東京工業大学大学院情報理工学研究科計算工学専攻
Department of Computer Science, Tokyo Institute of Technology
第 2 著者 氏名(和/英) 岩野 公司 / Koji IWANO
第 2 著者 所属(和/英) 東京工業大学大学院情報理工学研究科計算工学専攻
Department of Computer Science, Tokyo Institute of Technology
第 3 著者 氏名(和/英) 古井 貞煕 / Sadaoki FURUI
第 3 著者 所属(和/英) 東京工業大学大学院情報理工学研究科計算工学専攻
Department of Computer Science, Tokyo Institute of Technology
発表年月日 2007/12/13
資料番号 NLC2007-40,SP2007-103
巻番号(vol) vol.107
号番号(no) 406
ページ範囲 pp.-
ページ数 5
発行日