講演名 2007-06-22
前向き後向き線形予測複素音声分析に基づく音声のロバストF0推定(信号処理,LSI,及び一般)
舟木 慶一, 金城 竜彦,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) LPC残差を用いた自己相関関数やAMDFによりF0推定を実現すると、F0の推定精度が向上することが知られているが、基本周波数と第1フォルマントが隣接している場合、両者を分離できず推定精度は劣化する。解析信号は正領域のスペクトルしか有しないため、解析信号を入力とする複素音声分析では低周波数領域でのスペクトル推定精度が向上する。複素音声分析により推定される複素残差信号に対する、自己相関関数やAMDFを用いて、F0推定を実現すれば、推定精度の向上が期待される。島村らが提案した自己相関関数とAMDFの比による評価尺度を採用し、複素残差信号を用いたF0推定方式の提案を行い、音声信号、解析信号、LPC残差信号を用いた従来方式と比較した結果を既に報告した。今回、電話の特性を模擬したIRSフィルタを通した音声信号に対し、前向き後向き線形予測基準MMSE分析ならびにELS分析を適用した実験を行ったので、報告する。
抄録(英) This paper proposes novel robust fundamental frequency (F0) estimation algorithm based on complex-valued speech analysis for an analytic speech signal. Since analytic signal provides spectrum only over positive frequencies, spectrum can be accurately estimated in low frequencies. Consequently, it is considered that F0 estimation using the residual signal extracted by complex-valued speech analysis can perform better in F0 estimation than that for the residual signal extracted by conventional real-valued LPC analysis. We have already proposed an F0 estimation algorithm based on complex speech analysis, in which the autocorrelation function (AUTOC) weighted by a reciprocal of the AMDF proposed by Prof. Shimamura, has been also adopted for F0 estimation criterion and the proposed F0 estimation algorithm has been evaluated by using three criteria, AUTOC, AMDF, and the weighted AUTOC, with complex-valued residual. We have also compared the proposed method with that for three signals; speech signal, analytic speech signal, and LPC residual. In this report, the IRS filtered speech data are used to evaluate the proposed F0 estimation by means of forward and backward Linear Prediction based MMSE and ELS robust TV-CAR speech analysis.
キーワード(和) F0推定 / 自己相関関数 / AMDF / 解析信号 / 複素音声分析 / IRS特性 / ELS法 / 前向き後向き線形予測
キーワード(英) F0 estimation / autocorrelation function / AMDF / analytic signal / complex speech analysis / IRS filtered speech / ELS algorithm / Forward and Backward Linear Prediction
資料番号 CAS2007-32,VLD2007-48,SIP2007-62
発行日

研究会情報
研究会 VLD
開催期間 2007/6/15(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 VLSI Design Technologies (VLD)
本文の言語 JPN
タイトル(和) 前向き後向き線形予測複素音声分析に基づく音声のロバストF0推定(信号処理,LSI,及び一般)
サブタイトル(和)
タイトル(英) Robust F0 Estimation using Forward and Backward LP based Complex Speech Analysis
サブタイトル(和)
キーワード(1)(和/英) F0推定 / F0 estimation
キーワード(2)(和/英) 自己相関関数 / autocorrelation function
キーワード(3)(和/英) AMDF / AMDF
キーワード(4)(和/英) 解析信号 / analytic signal
キーワード(5)(和/英) 複素音声分析 / complex speech analysis
キーワード(6)(和/英) IRS特性 / IRS filtered speech
キーワード(7)(和/英) ELS法 / ELS algorithm
キーワード(8)(和/英) 前向き後向き線形予測 / Forward and Backward Linear Prediction
第 1 著者 氏名(和/英) 舟木 慶一 / Keiichi FUNAKI
第 1 著者 所属(和/英) 琉球大学総合情報処理センター
Computing & Networking Center, University of the RYUKYUS
第 2 著者 氏名(和/英) 金城 竜彦 / Tatsuhiko KINJO
第 2 著者 所属(和/英) トヨタコミュニケーションシステム(株)
TOYOTA COMMUNICATION SYSTEMS CO., LTD.
発表年月日 2007-06-22
資料番号 CAS2007-32,VLD2007-48,SIP2007-62
巻番号(vol) vol.107
号番号(no) 103
ページ範囲 pp.-
ページ数 6
発行日