講演名 | 2008/6/20 TANDEM-STRAIGHTによるスペクトル包絡の近似精度の改善について : 基本周波数により定まるNyquist周波数以上の空間周波数成分の復元について(音声生成・知覚,聴覚心理,音声学・音韻論,一般) 河原 英紀, 森勢 将雅, 高橋 徹, 坂野 秀樹, 西村 竜一, 入野 俊夫, |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | TANDEM-STRAIGHTにおける品質劣化要因であるスペクトルピーク周辺での包絡形状の近似誤差を、consistent samplingの考え方に基づいて、減少させる方法を提案する。スペクトル包絡のピーク付近には、標本化定理と基本周波数により定まる限界を超えた、高い空間周波数成分が存在している。TANDEM-STRAIGHTでは、consistent samplingの考え方を利用することにより包絡を復元している。consistent samplingの考え方は、標本化定理により定まる限界を超えた高い空間周波数成分を復元するための根拠を与える。ここでは、TANDEM-STRAIGHTにより求められた包絡をARモデルを用いて近似しTANDEM-STRAIGHTでの処理により失われる成分を補償することにより、ピーク周辺における高い空間周波数成分を復元する方法を提案する。 |
抄録(英) | A simple new method to recover details in a spectral envelope is proposed based on a speech analysis, modification and resynthesis framework called TANDEM-STRAIGHT. Spectral envelope recovery of voiced sounds is a discrete-to-analog conversion in the frequency domain. However, there is a fundamental problem because the spatial frequency contents of vocal tract functions generally exceed the Nyquist limit of the equivalent sampling rate determined by the fundamental frequency. TANDEM-STRAIGHT yields a method to recover a spectral envelope based on the consistent sampling theory and provides base information for exceeding this limit. At the final stage, the AR spectral envelope estimated from the TANDEM-STRAIGHT spectrum is divided by the F0 adaptively smoothed version of itself to supply the missing high-spatial-frequency details of the envelope. |
キーワード(和) | 音声分析 / 標本化定理 / 音声変換 |
キーワード(英) | speech analysis / sampling theory / speech modification |
資料番号 | SP2008-23 |
発行日 |
研究会情報 | |
研究会 | SP |
---|---|
開催期間 | 2008/6/20(から1日開催) |
開催地(和) | |
開催地(英) | |
テーマ(和) | |
テーマ(英) | |
委員長氏名(和) | |
委員長氏名(英) | |
副委員長氏名(和) | |
副委員長氏名(英) | |
幹事氏名(和) | |
幹事氏名(英) | |
幹事補佐氏名(和) | |
幹事補佐氏名(英) |
講演論文情報詳細 | |
申込み研究会 | Speech (SP) |
---|---|
本文の言語 | JPN |
タイトル(和) | TANDEM-STRAIGHTによるスペクトル包絡の近似精度の改善について : 基本周波数により定まるNyquist周波数以上の空間周波数成分の復元について(音声生成・知覚,聴覚心理,音声学・音韻論,一般) |
サブタイトル(和) | |
タイトル(英) | Improving accuracy in spectral envelope estimation based on TANDEM-STRAIGHT : Recovery of higher spatial frequency components exceeding Nyquist limit posed by the fundamental frequency |
サブタイトル(和) | |
キーワード(1)(和/英) | 音声分析 / speech analysis |
キーワード(2)(和/英) | 標本化定理 / sampling theory |
キーワード(3)(和/英) | 音声変換 / speech modification |
第 1 著者 氏名(和/英) | 河原 英紀 / Hideki KAWAHARA |
第 1 著者 所属(和/英) | 和歌山大学システム工学部 Faculty of Systems Engineering, Wakayama University |
第 2 著者 氏名(和/英) | 森勢 将雅 / Masanori MORISE |
第 2 著者 所属(和/英) | 関西学院大学理工学部 Department of Informatics, Kwansei Gakuin University |
第 3 著者 氏名(和/英) | 高橋 徹 / Toru TAKAHASHI |
第 3 著者 所属(和/英) | 京都大学大学院情報学研究科 Graduate School of Informatics, Kyoto University |
第 4 著者 氏名(和/英) | 坂野 秀樹 / Hideki BANNO |
第 4 著者 所属(和/英) | 名城大学理工学部 Department of Information Engineering, Meijo University |
第 5 著者 氏名(和/英) | 西村 竜一 / Ryuichi NISIMURA |
第 5 著者 所属(和/英) | 和歌山大学システム工学部 Faculty of Systems Engineering, Wakayama University |
第 6 著者 氏名(和/英) | 入野 俊夫 / Toshio IRINO |
第 6 著者 所属(和/英) | 和歌山大学システム工学部 Faculty of Systems Engineering, Wakayama University |
発表年月日 | 2008/6/20 |
資料番号 | SP2008-23 |
巻番号(vol) | vol.108 |
号番号(no) | 116 |
ページ範囲 | pp.- |
ページ数 | 6 |
発行日 |