講演名 2008-12-10
位相情報を利用した話者識別・照合法の評価(ポスターセッション,第10回音声言語シンポジウム)
王 龍標, 南 和江, 山本 一公, 中川 聖一,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 従来のMFCCに基づく話者認識手法は、位相情報が有効に利用されていない。本稿では、話者識別・照合のための切り出し位置による位相のずれを一致させる位相の利用法とその改善法を提案し、従来のMFCCと組み合わせる。男性22名、女性13名が5時期に、普通、遅い、早いスピードで発声したNTTデータベースを使って提案法を評価した。学習には最初の1時期の普通速度で発声された5文(約20秒)を用いた。クリーン音声、雑音重畳音声による評価実験を行い、提案する位相情報は単独ではMFCCに劣るが、話者認識の能力をもつことが分かった。MFCCと組み合わせることで、より高い話者識別・照合率を得ることができた。改善した位相情報が従来の位相情報よりも有効であることが分かった。
抄録(英) In conventional speaker recognition methods based on MFCC, phase information has been ignored. In this paper, we propose original phase information and a modified feature parameter obtained from the original phase information, and integrate the phase information with MFCC on a speaker identification/verification method. The speaker identification/verification experiments were performed using NTT database which consists of sentences uttered by 35 Japanese speakers (22 males and 13 females) with normal, fast and slow speaking modes on five sessions. Each speaker uttered only 5 utterances at a normal speaking mode (about 20 seconds in total) for training data. Although the phase information based method worked worse than MFCC based method, it had some ability of speaker identification. By integrating the phase information with the MFCC, the speaker identification error rate was remarkably reduced for all speaking rates in comparison with a standard MFCC-based method. The proposed modified phase information was more robust than the proposed original phase information for all speaking modes.
キーワード(和) 話者識別 / 話者照合 / 位相情報 / MFCC / 組み合わせ手法
キーワード(英) speaker identification / speaker verification / MFCC / phase information / GMM
資料番号 NLC2008-53,SP2008-108
発行日

研究会情報
研究会 NLC
開催期間 2008/12/2(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Natural Language Understanding and Models of Communication (NLC)
本文の言語 JPN
タイトル(和) 位相情報を利用した話者識別・照合法の評価(ポスターセッション,第10回音声言語シンポジウム)
サブタイトル(和)
タイトル(英) Evaluation of speaker identification/verification method using phase information
サブタイトル(和)
キーワード(1)(和/英) 話者識別 / speaker identification
キーワード(2)(和/英) 話者照合 / speaker verification
キーワード(3)(和/英) 位相情報 / MFCC
キーワード(4)(和/英) MFCC / phase information
キーワード(5)(和/英) 組み合わせ手法 / GMM
第 1 著者 氏名(和/英) 王 龍標 / Longbiao WANG
第 1 著者 所属(和/英) 静岡大学システム工学科
Department of System Engineering, Shizuoka University
第 2 著者 氏名(和/英) 南 和江 / Kazue MINAMI
第 2 著者 所属(和/英) 豊橋技術科学大学情報工学系
Department of Information and computer Sciences, Toyohashi University of Technology
第 3 著者 氏名(和/英) 山本 一公 / Kazumasa YAMAMOTO
第 3 著者 所属(和/英) 豊橋技術科学大学情報工学系
Department of Information and computer Sciences, Toyohashi University of Technology
第 4 著者 氏名(和/英) 中川 聖一 / Seiichi NAKAGAWA
第 4 著者 所属(和/英) 豊橋技術科学大学情報工学系
Department of Information and computer Sciences, Toyohashi University of Technology
発表年月日 2008-12-10
資料番号 NLC2008-53,SP2008-108
巻番号(vol) vol.108
号番号(no) 337
ページ範囲 pp.-
ページ数 6
発行日