講演名 2008-06-26
ロバスト時変複素音声分析に基づくF_0軌跡推定に関する一考察(音声・適応信号処理,信号処理,LSI,及び一般)
舟木 慶一,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 解析信号をターゲットとする複素音声分析に基づくロバストなF_0推定アルゴリズムの研究を行っている。音声の解析信号に対して、フレーム毎に複素音声分析を行い、逆フィルタリングにより複素残差信号を算出後、その自己相関とAMDFの比のピーク探索によりフレーム毎にF_0を推定する、フレームベース方式を既に提案した。解析信号は正領域のスペクトルしか有しないために、低周波数領域でのスペクトル推定精度が向上する。その性質により、残差信号に含まれるフォルマント成分が低減されるため、F_0推定精度が向上する。しかし、この方式では、きわめて雑音レベルが高い場合か、電話音声のように低域にHPF特性を有する音声である程度以上の雑音レベルの場合しか、良好な推定精度が得られない。また、フレームベースのためF_0の時間変化に追従できない問題がある。そこで、サンプルベースのF_0軌跡推定方式の検討を既に行った。これは、時変複素音声分析で推定されるスペクトルのピーク推定により、フォルマントとともにF_0の時間軌跡を推定する方式である。既に、MMSE基準分析によるF_0軌跡推定の実験を行い、実数分析に比べ、はるかに正確な推定が実現できることを確認した。本稿では、ELS基準ロバスト分析ならびに前向き後向き予測基準分析を導入し、GPEとFPEによる客観評価を行う。
抄録(英) We have already proposed robust F_0 estimation algorithm based on complex AR speech analysis for analytic speech signal. In the F_0 estimation, complex-valued residual is calculated by using complex AR speech analysis for analytic speech signal and the weighted autocorrelation function with a reciprocal of the AMDF is calculated and then the peak sample is searched in order to estimate F_0 value for each frame. We have already reported that the proposed F_0 estimation can estimate more robust F_0 estimation than conventional ones for IRS filtered speech since the complex-valued residual contains less components of first formant (F_1) due to the nature of the analytic speech. Moreover, we have already proposed F_0 contour estimation algorithm based on time-varying complex AR (TV-CAR) speech analysis method, in which F_0 contour is estimated by peak-picking of the estimated time-varying speech spectrum with formant estimation manner. In this paper, robust ELS-based or Forward and Backward LP based TV-CAR speech analysis is employed to estimate more accurate F_0 contour.
キーワード(和) F_0軌跡推定 / 解析信号 / 複素音声分析 / 時変分析 / フォルマント推定
キーワード(英) F_0 contour estimation / analytic signal / complex speech analysis / time-varying analysis / formant estimation
資料番号 CAS2008-2,VLD2008-15,SIP2008-36
発行日

研究会情報
研究会 VLD
開催期間 2008/6/19(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 VLSI Design Technologies (VLD)
本文の言語 JPN
タイトル(和) ロバスト時変複素音声分析に基づくF_0軌跡推定に関する一考察(音声・適応信号処理,信号処理,LSI,及び一般)
サブタイトル(和)
タイトル(英) On F_0 Contour Estimation Based On Robust Time-Varying Complex Speech Analysis
サブタイトル(和)
キーワード(1)(和/英) F_0軌跡推定 / F_0 contour estimation
キーワード(2)(和/英) 解析信号 / analytic signal
キーワード(3)(和/英) 複素音声分析 / complex speech analysis
キーワード(4)(和/英) 時変分析 / time-varying analysis
キーワード(5)(和/英) フォルマント推定 / formant estimation
第 1 著者 氏名(和/英) 舟木 慶一 / Keiichi FUNAKI
第 1 著者 所属(和/英) 琉球大学総合情報処理センター
Computing & Networking Center University of the Ryukyus
発表年月日 2008-06-26
資料番号 CAS2008-2,VLD2008-15,SIP2008-36
巻番号(vol) vol.108
号番号(no) 106
ページ範囲 pp.-
ページ数 6
発行日