講演名 | 2008-01-25 残響環境下でのロバストで正確なF0推定法の比較評価(福祉と知能・情動・認知障害,福祉と音声処理,一般) 鵜木 祐史, 細呂木谷 敏弘, 石本 祐一, |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | 本稿では,人工的な残響環境下ならびに実際の残響環境下での大規模な音声データセットに対して,9個の代表的な基本周波数(F_0)推定法と,前報にて提案したF_0推定法の比較評価の結果を報告する.代表的な推定法として,ケプストラム法,AMDF法,LPC法,自己相開法といった従来法の他,TEMPO,YIN,PHIA法といった最近の手法も利用した.提案法は,複素ケプストラム分析上の変調伝達関数と音源フィルタモデルを利用して,音源情報の周期性・周波性からF_0を推定するものである.大規模な比較評価実験の結果から,代表的な手法すべてによるF_0の推定精度が,残響時間の増加とともに著しく低下したのに対し,提案法により推定されたF_0か,比較的ロバストで正確であることがわかった.また,比較評価の結果から,準同形処理と音源フィルタモデルの概念がF_0推定に効果があることも分かった.これらの結果は,ロバスト性に関して提案法が,従来法よりも優れていることと,人工的な残響環境下ならびに実際の残響環境下で正確なF_0推定を可能としていることを示している. |
抄録(英) | This paper reports comparative evaluations of the method we previously proposed of estimating fundamental frequency (F_0) based on complex cepstrum analysis with nine typical methods over huge speech-sound datasets in both artificial and realistic reverberant environments (in room acoustics). They involve several classical gorithms (Cepstrum, AMDF, LPC, and modified autocorrelation) and a few modern algorithms (TEMPO, YIN, and PHIA). The comparative results revealed that the percentage correct rates of the estimated F_0s using them were drastically reduced as the reverberation time increased while F_0 estimated with the proposed method was completely robust and accurate. They also demonstrated that homomorphic analysis and the concept of a source-filter model were relatively effective for estimating F_0. The results also demonstrated that it was much better thanthe previously reported methods in terms of robustness and providing accurate F_0 estimates in both artificial andrealistic reverberant environments. |
キーワード(和) | F0推定 / 残響音声 / 複素ケプストラム分析 / MTF / 音源フィルタモデル |
キーワード(英) | F0 estimation / reverberant speech / complex cepstrum analysis / MTF concept / source-filter model |
資料番号 | TL2007-73,SP2007-168,WIT2007-73 |
発行日 |
研究会情報 | |
研究会 | SP |
---|---|
開催期間 | 2008/1/18(から1日開催) |
開催地(和) | |
開催地(英) | |
テーマ(和) | |
テーマ(英) | |
委員長氏名(和) | |
委員長氏名(英) | |
副委員長氏名(和) | |
副委員長氏名(英) | |
幹事氏名(和) | |
幹事氏名(英) | |
幹事補佐氏名(和) | |
幹事補佐氏名(英) |
講演論文情報詳細 | |
申込み研究会 | Speech (SP) |
---|---|
本文の言語 | JPN |
タイトル(和) | 残響環境下でのロバストで正確なF0推定法の比較評価(福祉と知能・情動・認知障害,福祉と音声処理,一般) |
サブタイトル(和) | |
タイトル(英) | Comparative evaluations of robust and accurate F0 estimates in reverberant environments |
サブタイトル(和) | |
キーワード(1)(和/英) | F0推定 / F0 estimation |
キーワード(2)(和/英) | 残響音声 / reverberant speech |
キーワード(3)(和/英) | 複素ケプストラム分析 / complex cepstrum analysis |
キーワード(4)(和/英) | MTF / MTF concept |
キーワード(5)(和/英) | 音源フィルタモデル / source-filter model |
第 1 著者 氏名(和/英) | 鵜木 祐史 / Masashi UNOKI |
第 1 著者 所属(和/英) | 北陸先端科学技術大学院大学情報科学研究科 School of Information Science, Japan Advanced Institute of Science and Technology |
第 2 著者 氏名(和/英) | 細呂木谷 敏弘 / Toshihiro HOSOROGIYA |
第 2 著者 所属(和/英) | 北陸先端科学技術大学院大学情報科学研究科 School of Information Science, Japan Advanced Institute of Science and Technology |
第 3 著者 氏名(和/英) | 石本 祐一 / Yuichi ISHIMOTO |
第 3 著者 所属(和/英) | 東京工科大学メディア学部 School of Media Science, Tokyo University of Technology |
発表年月日 | 2008-01-25 |
資料番号 | TL2007-73,SP2007-168,WIT2007-73 |
巻番号(vol) | vol.107 |
号番号(no) | 435 |
ページ範囲 | pp.- |
ページ数 | 6 |
発行日 |