講演名 | 2004/12/14 背景雑音を対象とした特徴パラメータ正準化法(ポスターセッション)(第6回音声言語シンポジウム) 福田 隆, 新田 恒雄, |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | 確率的分類器(HMM)に基づく認識システムは,性別,話速,音響環境等に起因するHMMの隠れ変数のバイアスにより性能が低下する.隠れ変数の影響を特徴抽出の段階で吸収することができれば,より頑健な認識システムを構成できると考えられる.本報告では,雑音強度と男女の声質を対象とした特徴パラメータ正準化方式について述べる.正準化は音響特徴空間と音響モデルの間に,中間表現である音素弁別特徴(DPF)空間を導入することにより実現する.正準化器は,音響的変動要因に対応させた複数のDPF抽出器と一つのDPF選択器から成る.DPF抽出法として,(A)雑音強度および声質の双方を表現するDPF抽出器から直接抽出する方法,および(B)声質に応じて設計したDPF抽出器から二つのDPFを抽出した後,雑音を抑圧する方式の二通りを比較する.DPF選択器は8種類のDPFベクトルのうち,音響モデルに最も適合するDPFベクトルを正準化DPFベクトルとして抽出する.評価実験では,単一のHMM分類器に正準化DPFベクトルを入力する方式と,隠れ変数に対応させた複数のHMM分類器に従来の音響特徴パラメータ(MFCC)を入力する方式とを比較する.提案方式は,少ない演算量にもかかわらず良好な性能が得られることを示す. |
抄録(英) | Acoustic models (AMs) of an HMM-based classifier include various types of hidden variables such as gender type, speaking rate, and acoustic environment. If there exists a canonicalization process that reduces the influence of the hidden variables from AMs, a robust automatic speech recognition (ASR) system can be realized, hi this paper, we describe the configuration of a canonicalization process targeting gender type and noise intensity as hidden variables. The proposed canonicalization process is composed of multiple distinctive phonetic feature (DPF) extractors corresponding to the hidden variables and a DPF selector which selects a desirable DPF from multiple DPFs. hi a DPF extraction stage, two approaches, namely (A) extracting DPFs directly from each DPF extractor which represents both gender type and noise intensity, and (B) dividing the DPF extraction stage into a DPF extraction part of gender type and a noise suppression part of different S/N-ratio type, are investigated. Experiments are carried out by comparing the combination of the canonicalized DPF and a single HMM classifier, and also the combination of a single acoustic feature (MFCC) and multiple HMM classifiers. The result shows that the proposed canonicalization method outperformed both of the conventional ASR with MFCC and a single HMM, and the ASR with multiple HMMs |
キーワード(和) | 音声認識 / 特徴抽出 / 正準化 / 音素弁別特徴 / 雑音抑圧器 |
キーワード(英) | automatic speech recognition / feature extraction / canonicalization / distinctive phonetic feature / noise suppressor |
資料番号 | NLC2004-78,SP2004-118 |
発行日 |
研究会情報 | |
研究会 | SP |
---|---|
開催期間 | 2004/12/14(から1日開催) |
開催地(和) | |
開催地(英) | |
テーマ(和) | |
テーマ(英) | |
委員長氏名(和) | |
委員長氏名(英) | |
副委員長氏名(和) | |
副委員長氏名(英) | |
幹事氏名(和) | |
幹事氏名(英) | |
幹事補佐氏名(和) | |
幹事補佐氏名(英) |
講演論文情報詳細 | |
申込み研究会 | Speech (SP) |
---|---|
本文の言語 | JPN |
タイトル(和) | 背景雑音を対象とした特徴パラメータ正準化法(ポスターセッション)(第6回音声言語シンポジウム) |
サブタイトル(和) | |
タイトル(英) | Canonicalization of Feature Parameters targeting Background Noise |
サブタイトル(和) | |
キーワード(1)(和/英) | 音声認識 / automatic speech recognition |
キーワード(2)(和/英) | 特徴抽出 / feature extraction |
キーワード(3)(和/英) | 正準化 / canonicalization |
キーワード(4)(和/英) | 音素弁別特徴 / distinctive phonetic feature |
キーワード(5)(和/英) | 雑音抑圧器 / noise suppressor |
第 1 著者 氏名(和/英) | 福田 隆 / Takashi FUKUDA |
第 1 著者 所属(和/英) | 豊橋技術科学大学大学院工学研究科 Graduate School of Engineering, Toyohashi University of Technology |
第 2 著者 氏名(和/英) | 新田 恒雄 / Tsuneo NITTA |
第 2 著者 所属(和/英) | 豊橋技術科学大学大学院工学研究科 Graduate School of Engineering, Toyohashi University of Technology |
発表年月日 | 2004/12/14 |
資料番号 | NLC2004-78,SP2004-118 |
巻番号(vol) | vol.104 |
号番号(no) | 542 |
ページ範囲 | pp.- |
ページ数 | 6 |
発行日 |