講演名 | 2008-06-26 ロバスト時変複素音声分析に基づくF_0軌跡推定に関する一考察(音声・適応信号処理,信号処理,LSI,及び一般) 舟木 慶一, |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | 解析信号をターゲットとする複素音声分析に基づくロバストなF_0推定アルゴリズムの研究を行っている。音声の解析信号に対して、フレーム毎に複素音声分析を行い、逆フィルタリングにより複素残差信号を算出後、その自己相関とAMDFの比のピーク探索によりフレーム毎にF_0を推定する、フレームベース方式を既に提案した。解析信号は正領域のスペクトルしか有しないために、低周波数領域でのスペクトル推定精度が向上する。その性質により、残差信号に含まれるフォルマント成分が低減されるため、F_0推定精度が向上する。しかし、この方式では、きわめて雑音レベルが高い場合か、電話音声のように低域にHPF特性を有する音声である程度以上の雑音レベルの場合しか、良好な推定精度が得られない。また、フレームベースのためF_0の時間変化に追従できない問題がある。そこで、サンプルベースのF_0軌跡推定方式の検討を既に行った。これは、時変複素音声分析で推定されるスペクトルのピーク推定により、フォルマントとともにF_0の時間軌跡を推定する方式である。既に、MMSE基準分析によるF_0軌跡推定の実験を行い、実数分析に比べ、はるかに正確な推定が実現できることを確認した。本稿では、ELS基準ロバスト分析ならびに前向き後向き予測基準分析を導入し、GPEとFPEによる客観評価を行う。 |
抄録(英) | We have already proposed robust F_0 estimation algorithm based on complex AR speech analysis for analytic speech signal. In the F_0 estimation, complex-valued residual is calculated by using complex AR speech analysis for analytic speech signal and the weighted autocorrelation function with a reciprocal of the AMDF is calculated and then the peak sample is searched in order to estimate F_0 value for each frame. We have already reported that the proposed F_0 estimation can estimate more robust F_0 estimation than conventional ones for IRS filtered speech since the complex-valued residual contains less components of first formant (F_1) due to the nature of the analytic speech. Moreover, we have already proposed F_0 contour estimation algorithm based on time-varying complex AR (TV-CAR) speech analysis method, in which F_0 contour is estimated by peak-picking of the estimated time-varying speech spectrum with formant estimation manner. In this paper, robust ELS-based or Forward and Backward LP based TV-CAR speech analysis is employed to estimate more accurate F_0 contour. |
キーワード(和) | F_0軌跡推定 / 解析信号 / 複素音声分析 / 時変分析 / フォルマント推定 |
キーワード(英) | F_0 contour estimation / analytic signal / complex speech analysis / time-varying analysis / formant estimation |
資料番号 | CAS2008-2,VLD2008-15,SIP2008-36 |
発行日 |
研究会情報 | |
研究会 | VLD |
---|---|
開催期間 | 2008/6/19(から1日開催) |
開催地(和) | |
開催地(英) | |
テーマ(和) | |
テーマ(英) | |
委員長氏名(和) | |
委員長氏名(英) | |
副委員長氏名(和) | |
副委員長氏名(英) | |
幹事氏名(和) | |
幹事氏名(英) | |
幹事補佐氏名(和) | |
幹事補佐氏名(英) |
講演論文情報詳細 | |
申込み研究会 | VLSI Design Technologies (VLD) |
---|---|
本文の言語 | JPN |
タイトル(和) | ロバスト時変複素音声分析に基づくF_0軌跡推定に関する一考察(音声・適応信号処理,信号処理,LSI,及び一般) |
サブタイトル(和) | |
タイトル(英) | On F_0 Contour Estimation Based On Robust Time-Varying Complex Speech Analysis |
サブタイトル(和) | |
キーワード(1)(和/英) | F_0軌跡推定 / F_0 contour estimation |
キーワード(2)(和/英) | 解析信号 / analytic signal |
キーワード(3)(和/英) | 複素音声分析 / complex speech analysis |
キーワード(4)(和/英) | 時変分析 / time-varying analysis |
キーワード(5)(和/英) | フォルマント推定 / formant estimation |
第 1 著者 氏名(和/英) | 舟木 慶一 / Keiichi FUNAKI |
第 1 著者 所属(和/英) | 琉球大学総合情報処理センター Computing & Networking Center University of the Ryukyus |
発表年月日 | 2008-06-26 |
資料番号 | CAS2008-2,VLD2008-15,SIP2008-36 |
巻番号(vol) | vol.108 |
号番号(no) | 106 |
ページ範囲 | pp.- |
ページ数 | 6 |
発行日 |