講演抄録/キーワード |
講演名 |
2011-08-10 14:00
言葉の明瞭度と楽器等の音色を保持したクロス合成法の検討 ○西 大輝・西村竜一・入野俊夫・河原英紀(和歌山大) EA2011-64 |
抄録 |
(和) |
音声と,楽器音や動物の鳴声などの2つの音源の特徴を混合して合成音を作るクロス合成VOCODERに,F0に適応したスペクトル包絡抽出法であるTANDEM-STRAIGHTを適用した.時変フィルタをFIRフィルタにより実装した検討では,STRAIGHTスペクトルを用いることにより,合成音の明瞭度が向上することが示された.しかし,同時に楽器等の音色の特徴が失われるという問題が明らかとなった.この問題を解決するため,音声の変位スペクトルと最小位相応答を用いた時変フィルタによる新たなクロス合成法を提案する.予備的な検討では,提案手法により,言葉の明瞭度を維持しながら,楽器音の特徴を保存できる可能性が示された. |
(英) |
TANDEM-STRAIGHT, an F0-adaptive spectral envelope extraction procedure was applied to cross synthesis VOCODER,
which synthesizes sounds by mixing features of two input sounds, such as speech and musical instruments or animal voices.
A set of tests with FIR implementation of time-varying filter illustrated potential improvements of intelligibility by using
STRAIGHT spectrum of speech sounds, but at the same time, introduced deterioration of instruments' characteristic timbre.
A new cross synthesis framework using deviation spectrum of speech sounds and minimum phase implementation of
time varying filter was proposed to solve this problem.
Preliminary tests suggested that the proposed method reduces this deterioration while preserving intelligibility. |
キーワード |
(和) |
楽器音 / 動物の鳴声 / クロス合成 / TANDEM-STRAIGHT / VOCODER / 明瞭度 / / |
(英) |
musical instruments / animal voice / cross synthesis / TANDEM-STRAIGHT / VOCODER / intelligibility / / |
文献情報 |
信学技報, vol. 111, no. 175, EA2011-64, pp. 87-92, 2011年8月. |
資料番号 |
EA2011-64 |
発行日 |
2011-08-02 (EA) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
EA2011-64 |