講演名 2007/10/18
ポップス系歌唱音声のSTRAIGHTによる分析とスペクトル変動の統計的性質について(合成,生成,韻律,一般)
吉田 有里, 森勢 将雅, 高橋 徹, 河原 英紀,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 数分にわたる曲全体を一括して分析することのできる新しく開発されたTANDEM-STRAIGHTを用い、プロ歌手によるポップス系歌唱を分析して得られた歌唱音声中の母音スペクトルの統計的性質を調べた。分析には、男女各一名による歌唱音声が用いられた。STRAIGHTスペクトルから求められたMel帯域フィルタ出力とMFCCの主成分分析の結果は、いずれも第5主成分までに全分散の90%以上が含まれることを示した。また、求められた固有ベクトルとMFCCの基底関数の張る空間が類似する傾向が認められた。歌唱音声は、話声と比較して、基本周波数、発声のパワー、歌唱法などによるスペクトル変動が大きく、各母音の分布は元のパラメタ空間においても、低次の主成分で張られる空間においても、大きく重なっている。これらの結果が、母音情報に基づく音声変換法においてどのような意味を持っかについて議論する。
抄録(英) A new implementation of STRAIGHT spectral estimation based on so-called TANDEM windowing was applied to investigate statistical properties of vowel spectral variations in POP-song singing. The implementation enabled analysis of real world data as a whole. STRAIGHT spectra of singing voice were converted into MFCC filter outputs and MFCC parameters prior to statistical analyses. Principal component analysis of MFCC converted whole data including vowels, consonants and pauses indicated that more than 90.0% of total variation was resided within the first 5 principal components. It was also found that the space spanned by eigenvectors and that by the MFCC basis functions have similar structure. Relatively large overlap of intra-class distance distributions and interclass distance distributions was observed indicating larger spectral variations of singing voice caused by wider range of variability in pitch, loudness, effort and other timbre related attributes. Implications of these results on adopting a vowel based speech conversion method to singing voice conversion are also discussed.
キーワード(和) STRAIGHT / 歌唱音声 / スペクトル概形 / MFCC / 主成分分析
キーワード(英) STRAIGHT / singing voice / spectral envelope / MFCC / principal component analysis
資料番号 SP2007-76
発行日

研究会情報
研究会 SP
開催期間 2007/10/18(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Speech (SP)
本文の言語 JPN
タイトル(和) ポップス系歌唱音声のSTRAIGHTによる分析とスペクトル変動の統計的性質について(合成,生成,韻律,一般)
サブタイトル(和)
タイトル(英) Statistical properties of STRAIGHT spectral variations in POP-song singing
サブタイトル(和)
キーワード(1)(和/英) STRAIGHT / STRAIGHT
キーワード(2)(和/英) 歌唱音声 / singing voice
キーワード(3)(和/英) スペクトル概形 / spectral envelope
キーワード(4)(和/英) MFCC / MFCC
キーワード(5)(和/英) 主成分分析 / principal component analysis
第 1 著者 氏名(和/英) 吉田 有里 / Yuri YOSHIDA
第 1 著者 所属(和/英) 和歌山大学システム工学部
Faculty of System Engineering, Wakayama University
第 2 著者 氏名(和/英) 森勢 将雅 / Masanori MORISE
第 2 著者 所属(和/英) 和歌山大学システム工学部
Faculty of System Engineering, Wakayama University
第 3 著者 氏名(和/英) 高橋 徹 / Toru TAKAHASHI
第 3 著者 所属(和/英) 和歌山大学システム工学部
Faculty of System Engineering, Wakayama University
第 4 著者 氏名(和/英) 河原 英紀 / Hideki KAWAHARA
第 4 著者 所属(和/英) 和歌山大学システム工学部
Faculty of System Engineering, Wakayama University
発表年月日 2007/10/18
資料番号 SP2007-76
巻番号(vol) vol.107
号番号(no) 282
ページ範囲 pp.-
ページ数 6
発行日