TANDEM-STRAIGHTによるスペクトル包絡の近似精度の改善について : 基本周波数により定まるNyquist周波数以上の空間周波数成分の復元について(音声生成・知覚,聴覚心理,音声学・音韻論,一般)

河原 英紀; 森勢 将雅; 高橋 徹; 坂野 秀樹; 西村 竜一; 入野 俊夫

講演名	2008/6/20 TANDEM-STRAIGHTによるスペクトル包絡の近似精度の改善について : 基本周波数により定まるNyquist周波数以上の空間周波数成分の復元について(音声生成・知覚,聴覚心理,音声学・音韻論,一般) 河原英紀, 森勢将雅, 高橋徹, 坂野秀樹, 西村竜一, 入野俊夫,
PDFダウンロードページ	PDFダウンロードページへ
抄録(和)	TANDEM-STRAIGHTにおける品質劣化要因であるスペクトルピーク周辺での包絡形状の近似誤差を、consistent samplingの考え方に基づいて、減少させる方法を提案する。スペクトル包絡のピーク付近には、標本化定理と基本周波数により定まる限界を超えた、高い空間周波数成分が存在している。TANDEM-STRAIGHTでは、consistent samplingの考え方を利用することにより包絡を復元している。consistent samplingの考え方は、標本化定理により定まる限界を超えた高い空間周波数成分を復元するための根拠を与える。ここでは、TANDEM-STRAIGHTにより求められた包絡をARモデルを用いて近似しTANDEM-STRAIGHTでの処理により失われる成分を補償することにより、ピーク周辺における高い空間周波数成分を復元する方法を提案する。
抄録(英)	A simple new method to recover details in a spectral envelope is proposed based on a speech analysis, modification and resynthesis framework called TANDEM-STRAIGHT. Spectral envelope recovery of voiced sounds is a discrete-to-analog conversion in the frequency domain. However, there is a fundamental problem because the spatial frequency contents of vocal tract functions generally exceed the Nyquist limit of the equivalent sampling rate determined by the fundamental frequency. TANDEM-STRAIGHT yields a method to recover a spectral envelope based on the consistent sampling theory and provides base information for exceeding this limit. At the final stage, the AR spectral envelope estimated from the TANDEM-STRAIGHT spectrum is divided by the F0 adaptively smoothed version of itself to supply the missing high-spatial-frequency details of the envelope.
キーワード(和)	音声分析 / 標本化定理 / 音声変換
キーワード(英)	speech analysis / sampling theory / speech modification
資料番号	SP2008-23
発行日

研究会情報
研究会	SP
開催期間	2008/6/20(から1日開催)
開催地（和）
開催地（英）
テーマ（和）
テーマ（英）
委員長氏名（和）
委員長氏名（英）
副委員長氏名（和）
副委員長氏名（英）
幹事氏名（和）
幹事氏名（英）
幹事補佐氏名（和）
幹事補佐氏名（英）

講演論文情報詳細
申込み研究会	Speech (SP)
本文の言語	JPN
タイトル（和）	TANDEM-STRAIGHTによるスペクトル包絡の近似精度の改善について : 基本周波数により定まるNyquist周波数以上の空間周波数成分の復元について(音声生成・知覚,聴覚心理,音声学・音韻論,一般)
サブタイトル（和）
タイトル（英）	Improving accuracy in spectral envelope estimation based on TANDEM-STRAIGHT : Recovery of higher spatial frequency components exceeding Nyquist limit posed by the fundamental frequency
サブタイトル（和）
キーワード(1)（和/英）	音声分析 / speech analysis
キーワード(2)（和/英）	標本化定理 / sampling theory
キーワード(3)（和/英）	音声変換 / speech modification
第 1 著者氏名（和/英）	河原英紀 / Hideki KAWAHARA
第 1 著者所属（和/英）	和歌山大学システム工学部 Faculty of Systems Engineering, Wakayama University
第 2 著者氏名（和/英）	森勢将雅 / Masanori MORISE
第 2 著者所属（和/英）	関西学院大学理工学部 Department of Informatics, Kwansei Gakuin University
第 3 著者氏名（和/英）	高橋徹 / Toru TAKAHASHI
第 3 著者所属（和/英）	京都大学大学院情報学研究科 Graduate School of Informatics, Kyoto University
第 4 著者氏名（和/英）	坂野秀樹 / Hideki BANNO
第 4 著者所属（和/英）	名城大学理工学部 Department of Information Engineering, Meijo University
第 5 著者氏名（和/英）	西村竜一 / Ryuichi NISIMURA
第 5 著者所属（和/英）	和歌山大学システム工学部 Faculty of Systems Engineering, Wakayama University
第 6 著者氏名（和/英）	入野俊夫 / Toshio IRINO
第 6 著者所属（和/英）	和歌山大学システム工学部 Faculty of Systems Engineering, Wakayama University
発表年月日	2008/6/20
資料番号	SP2008-23
巻番号（vol）	vol.108
号番号（no）	116
ページ範囲	pp.-
ページ数	6
発行日