講演抄録/キーワード |
講演名 |
2008-01-25 09:55
残響環境下におけるロバストで正確なF0推定法の比較評価 ○鵜木祐史・細呂木谷敏弘(北陸先端大)・石本祐一(東京工科大) TL2007-73 SP2007-168 WIT2007-73 |
抄録 |
(和) |
本稿では,人工的な残響環境下ならびに実際の残響環境下での大規模な音声データセットに対して,9個の代表的な基本周波数(F_0)推定法と,前報にて提案したF_0推定法の比較評価の結果を報告する.代表的な推定法として,ケプストラム法,AMDF法,LPC法,自己相関法といった従来法の他,TEMPO,YIN,PHIA法といった最近の手法も利用した.提案法は,複素ケプストラム分析上の変調伝達関数と音源フィルタモデルを利用して,音源情報の周期性・調波性から$F_0$を推定するものである.大規模な比較評価実験の結果から,代表的な手法すべてによるF_0の推定精度が,残響時間の増加とともに著しく低下したのに対し,提案法により推定されたF_0が,比較的ロバストで正確であることがわかった.また,比較評価の結果から,凖同形処理と音源フィルタモデルの概念がF_0推定に効果があることも分かった.これらの結果は,ロバスト性に関して提案法が,従来法よりも優れていることと,人工的な残響環境下ならびに実際の残響環境下で正確なF_0推定を可能としていることを示している. |
(英) |
This paper reports comparative evaluations of the method we previously proposed of estimating fundamental frequency (F_0) based on complex cepstrum analysis with nine typical methods over huge speech-sound datasets in both artificial and realistic reverberant environments (in room acoustics). They involve several classic algorithms (Cepstrum, AMDF, LPC, and modified autocorrelation) and a few modern algorithms (TEMPO, YIN, and PHIA). The comparative results revealed that the percentage correct rates of the estimated F_0s using them were drastically reduced as the reverberation time increased while F_0 estimated with the proposed method was completely robust and accurate. They also demonstrated that homomorphic analysis and the concept of a source-filter model were relatively effective for estimating F_0. The results also demonstrated that it was much better than the previously reported methods in terms of robustness and providing accurate F_0 estimates in both artificial and realistic reverberant environments. |
キーワード |
(和) |
F0推定 / 残響音声 / 複素ケプストラム分析 / MTF / 音源フィルタモデル / / / |
(英) |
F0 estimation / reverberant speech / complex cepstrum analysis / MTF concept / source-filter model / / / |
文献情報 |
信学技報, vol. 107, no. 435, SP2007-168, pp. 7-12, 2008年1月. |
資料番号 |
SP2007-168 |
発行日 |
2008-01-18 (TL, SP, WIT) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
TL2007-73 SP2007-168 WIT2007-73 |
|