講演抄録/キーワード |
講演名 |
2008-11-20 16:30
音声時間波形の狭帯域包絡線間相関を用いた話者識別システム ○末廣一美・高山泰典・波々伯部龍人・青木岳志(日本文理大)・西村一行(千葉工大)・福島 学(日本文理大)・柳川博文(千葉工大)・黒岩和治(日本文理大) EA2008-90 |
抄録 |
(和) |
著者等は,音声時間波形を1/4オクターブバンドの狭帯域に分割した信号の包絡線から狭帯域包絡線間相関係数を求め,それを特徴パラメータとする話者識別システムの提案を行っている.本稿では,1)音声時間波形を収集する際のサンプリング周波数,2)特徴抽出に必要な情報量,3)識別に有用な要因,について検討する.ここでは,試行回数と識別対象が本人と判断された回数から得られる正解率を評価値として検討を行う.その結果,1)音声時間波形を扱うのに良く使われるサンプリング周波数8kHzでは約10%の識別劣化を生じるが14kHz以上であれば識別率に顕著な劣化が生じない,2)約20秒の音声データで識別に必要な特徴量が抽出可能である,3)登録語および識別語として語群指定のように使用する音素を指定できる場合は鼻音と母音を多く含む語が適しており,会話中の逐次認証の様に識別語を指定出来ない場合は登録語として母音を多く含む語が適している,がわかった. |
(英) |
In this paper, 1) sampling frequency for recording voice wave form, 2) required time length for registration, 3) important physical factor for talker identification, are investigated. The talker identification system, that the authors proposed, use the narrow banded voice wave form. The band width is 1/4 octave, and the correct judgement ratio is used for evaluation in each investigation. As a result followings are found, 1) the sampling frequency is required to be over 14kHz, and the ratio decrease about 10% with sampling frequency 8kHz, 2) the required time length for aquire the characteristics is 20 second (without silence), 3) the words that includes nasal and vowel is suitable for registration and recognition, and the the words that includes vowel is suitable for registration when the words should be picked up from free talking voice. |
キーワード |
(和) |
音声時間波形 / 狭帯域 / 包絡線 / 話者識別 / 識別率 / / / |
(英) |
voice wave form / narrow band / envelope / talker identification / correct judgement ratio / / / |
文献情報 |
信学技報, vol. 108, no. 306, EA2008-90, pp. 35-40, 2008年11月. |
資料番号 |
EA2008-90 |
発行日 |
2008-11-13 (EA) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
EA2008-90 |