講演名 2008-12-10
TANDEM-STRAIGHTに基づく基本周波数抽出法の最適化に関する一検討(ポスターセッション,第10回音声言語シンポジウム)
板垣 英恵, 森勢 将雅, 西村 竜一, 入野 俊夫, 河原 英紀,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 分析位置に依存しない周期信号のパワースペクトル推定法であるTANDEMと、それに基づくスペクトル包絡の推定法STRAIGHTとを組み合わせた、基本周波数抽出法が提案されている。本資料では、このTANDEM-STRAIGHTに基づく基本周波数抽出法に含まれている設計パラメタの役割と抽出器の性能との関係を調べ、それらの最適化を試みた。取上げた設計パラメタは、周波数軸上での周期性の評価に用いる調波の個数と、それぞれ異なった基本周波数に特化した複数の基本周波数抽出器を統合する際の、それぞれの抽出器の守備範囲を定める重み関数の幅である。まず、それぞれのパラメタがどのように抽出性能に影響するかを説明した後、EGG信号を同時記録した音声データベースを用いて、パラメタの値と抽出器の性能との関係を定量的に評価した。その結果、Gross errorを評価指標とした場合の最適値として、調波の個数は3、重み関数の幅は、特化した基本周波数の1/1.2が採用された。これらの最適値を用いた場合の性能は、これまでのSTRAIGHTの基本周波数抽出器、および広く引用されているYINと比較しても、遜色ないことが確認された。
抄録(英) A fundamental frequency extractor based on a temporally stable power spectral representation for periodic signals (TANDEM spectrum) and a spectral envelope derived from the representation (STRAIGHT spectrum) is proposed. This article describes roles of system parameters of the proposed method and their effects on system performance and reports results of preliminary optimization of them. System parameters investigated are; number of harmonic component for detecting hypothesized periodicity peak and weighting width on the log-lag domain for integrating specialized individual F0 detectors. Detailed descriptions of these parameters and their impact on F0 extraction performance are presented and they were further investigated using a database consisting of simultaneous recording of speech and EGG (electroglottogram) signals. Test results indicated that the proposed method has comparable performance with F0 extractors used in STRAIGHT and other popular F0 extractors such as YIN, when three harmonic components are used and weighting with a width of 1/√<2> of the center lag is used.
キーワード(和) 周期信号 / 基本周波数 / TANDEM / STRAIGHT / 基本周期
キーワード(英) periodic signal / fundamental frequency / STRAIGHT / TANDEM
資料番号 NLC2008-50,SP2008-105
発行日

研究会情報
研究会 NLC
開催期間 2008/12/2(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Natural Language Understanding and Models of Communication (NLC)
本文の言語 JPN
タイトル(和) TANDEM-STRAIGHTに基づく基本周波数抽出法の最適化に関する一検討(ポスターセッション,第10回音声言語シンポジウム)
サブタイトル(和)
タイトル(英) Parameter optimization for a fundamental frequency extractor based on TANDEM-STRAIGHT
サブタイトル(和)
キーワード(1)(和/英) 周期信号 / periodic signal
キーワード(2)(和/英) 基本周波数 / fundamental frequency
キーワード(3)(和/英) TANDEM / STRAIGHT
キーワード(4)(和/英) STRAIGHT / TANDEM
キーワード(5)(和/英) 基本周期
第 1 著者 氏名(和/英) 板垣 英恵 / Hanae ITAGAKI
第 1 著者 所属(和/英) 和歌山大学システム工学部
Wakayama University
第 2 著者 氏名(和/英) 森勢 将雅 / Masanori MORISE
第 2 著者 所属(和/英) 関西学院大学理工学部
Kwansei Gakuin University
第 3 著者 氏名(和/英) 西村 竜一 / Ryuichi NISHIMURA
第 3 著者 所属(和/英) 和歌山大学システム工学部
Wakayama University
第 4 著者 氏名(和/英) 入野 俊夫 / Toshio IRINO
第 4 著者 所属(和/英) 和歌山大学システム工学部
Wakayama University
第 5 著者 氏名(和/英) 河原 英紀 / Hideki KAWAHARA
第 5 著者 所属(和/英) 和歌山大学システム工学部
Wakayama University
発表年月日 2008-12-10
資料番号 NLC2008-50,SP2008-105
巻番号(vol) vol.108
号番号(no) 337
ページ範囲 pp.-
ページ数 6
発行日