講演名 2005/12/8
母音による話者認識における特徴量変換(「感性情報処理の基礎と応用」及びヒューマン情報処理一般)
長内 隆, 尾関 和彦,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本報告では, 単独発声母音を用いた話者照合率の向上をはかるために, 母音の特徴量分布に着目した特徴量変換法を提案する.特徴量変換は, 特徴量の平均値, 標準偏差を用いて標準化した後, 各特徴量ベクトルのノルムを1に正規化するといった2段階で行うものである.話者照合に広く用いられているメル周波数ケプストラム係数, LPCケプストラム係数を用いた話者照合実験の結果, いずれの特徴量においても, 5母音の平均話者照合率は3ポイント程度の向上が認められた.また, 提案する特徴量変換は, 極座標変換と密接に関連している.そこで, 特徴量を径方向成分と周方向成分に分離して, 成分ごとに話者照合実験を行った.その結果, 母音中の個人性情報は周方向成分により多く含まれていることがわかった.更に, 本特徴量変換法を適用することによって, 母音のスペクトル包絡は話者性を強調した特徴量に変換されることを確認した.
抄録(英) In this report, we propose a feature parameter transformation method using the distribution of vowel features in order to improve the accuracy of speaker verification using vowels uttered in isolation. The transformation is performed in two stages. In the first stage, we standardize a parameter by subtracting the average, and then dividing by the standard deviation. In the second stage, we normalize the parameter by the norm of each feature vector. We conducted speaker verification experiments using mel-frequency cepstral coefficients and LPC cepstral coefficients, which are widely used for speaker verification. The result of the experiments showed about 3% improvement of the average speaker verification rate by applying the transformation in both cases. The transformation is closely related to polar-coordinates transformation. Therefore, we decomposed a parameter into the radius component and the circumference component, and conducted speaker verification experiments using each component. As a result, it became clear that speaker individuality information is contained in the circumference component more than in the radius component. It was also confir med that speaker individuality is emphasized in the spectral envelope by applying the proposed transformation.
キーワード(和) 話者認識 / 母音 / 標準化 / 正規化 / 方向余弦
キーワード(英) Speaker Recognition / Vowel / Standardization / Normalization / Direction Cosine
資料番号 HIP2005-96
発行日

研究会情報
研究会 HIP
開催期間 2005/12/8(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Human Information Processing (HIP)
本文の言語 JPN
タイトル(和) 母音による話者認識における特徴量変換(「感性情報処理の基礎と応用」及びヒューマン情報処理一般)
サブタイトル(和)
タイトル(英) Features Parameter Transformation in Speaker Recognition Using Vowels
サブタイトル(和)
キーワード(1)(和/英) 話者認識 / Speaker Recognition
キーワード(2)(和/英) 母音 / Vowel
キーワード(3)(和/英) 標準化 / Standardization
キーワード(4)(和/英) 正規化 / Normalization
キーワード(5)(和/英) 方向余弦 / Direction Cosine
第 1 著者 氏名(和/英) 長内 隆 / Takashi OSANAI
第 1 著者 所属(和/英) 科学警察研究所法科学第四部情報科学第三研究室:電気通信大学電気通信学部情報通信工学科
Third Information Science Section, Department of Fourth Forensic Science, National Research Institute of Police Science:Department of Information and Communication Engineering, Faculty of Electro-Communications, University of Electro-Communications
第 2 著者 氏名(和/英) 尾関 和彦 / Kazuhiko OZEKI
第 2 著者 所属(和/英) 電気通信大学電気通信学部情報通信工学科
Department of Information and Communication Engineering, Faculty of Electro-Communications, University of Electro-Communications
発表年月日 2005/12/8
資料番号 HIP2005-96
巻番号(vol) vol.105
号番号(no) 479
ページ範囲 pp.-
ページ数 6
発行日