講演名 2007/12/13
複数の音声区間検出法の適応的統合の検討と考察(雑音・VAD,第9回音声言語シンポジウム)
藤本 雅清, 石塚 健太郎, 中谷 智広,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本研究では,複数の音声区間検出法の適応的統合の検討を行う.本研究にて採用する音声区間検出法は,音声の周期性・非周期性成分比とSwitchingカルマンフィルタに基づく手法であり,各手法の統合はそれぞれが出力する尤度をフレーム単位で重み付け加算することにより行う.提案手法の評価はCENSREC-1-Cを用いて行い,雑音環境下において高い音声区間検出性能が得られることを示す.また,提案手法における尤度の重み付け加算方法などについて,実験を伴った考察を行う.
抄録(英) The VAD method proposed in this paper integrates multiple speech features and a signal decision scheme, namely the speech periodic to aperiodic component ratio and a switching Kalman filter. The integration is carried out by using the weighted sum of likelihoods outputted from each VAD (stream). The stream weight is decided adaptively each short time frame. The evaluation is carried out by using a VAD evaluation framework, CENSREC-1-C. The evaluation results revealed that the proposed method significantly outperforms the baseline results of CENSREC-1-C as regards VAD accuracy in real environments. In addition, we examine the method of likelihoods weighting through the experiments.
キーワード(和) 音声区間検出 / 周期性/非周期性成分比 / Switching Kalman filter / 適応的統合
キーワード(英) voice activity detection / periodic to aperiodic component ratio / switching Kalman filter / adaptive integration
資料番号 NLC2007-34,SP2007-97
発行日

研究会情報
研究会 SP
開催期間 2007/12/13(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Speech (SP)
本文の言語 JPN
タイトル(和) 複数の音声区間検出法の適応的統合の検討と考察(雑音・VAD,第9回音声言語シンポジウム)
サブタイトル(和)
タイトル(英) A study and an examination on adaptive integration of multiple voice activity detection
サブタイトル(和)
キーワード(1)(和/英) 音声区間検出 / voice activity detection
キーワード(2)(和/英) 周期性/非周期性成分比 / periodic to aperiodic component ratio
キーワード(3)(和/英) Switching Kalman filter / switching Kalman filter
キーワード(4)(和/英) 適応的統合 / adaptive integration
第 1 著者 氏名(和/英) 藤本 雅清 / Masakiyo FUJIMOTO
第 1 著者 所属(和/英) 日本電信電話株式会社NTTコミュニケーション科学基礎研究所
NTT Communicaition Science Laboratories, NTT Corp.
第 2 著者 氏名(和/英) 石塚 健太郎 / Kentaro ISHIZUKA
第 2 著者 所属(和/英) 日本電信電話株式会社NTTコミュニケーション科学基礎研究所
NTT Communicaition Science Laboratories, NTT Corp.
第 3 著者 氏名(和/英) 中谷 智広 / Tomohiro NAKATANI
第 3 著者 所属(和/英) 日本電信電話株式会社NTTコミュニケーション科学基礎研究所
NTT Communicaition Science Laboratories, NTT Corp.
発表年月日 2007/12/13
資料番号 NLC2007-34,SP2007-97
巻番号(vol) vol.107
号番号(no) 406
ページ範囲 pp.-
ページ数 6
発行日