講演抄録/キーワード |
講演名 |
2009-06-25 10:45
再合成音声の品質に対する音声スペクトル包絡推定法の影響について ○赤桐隼人・大西壮登(和歌山大)・森勢将雅(立命館大)・西村竜一・入野俊夫・河原英紀(和歌山大) SP2009-34 |
抄録 |
(和) |
著者らが検討を進めている音声分析変換合成法TANDEM-STRAIGHTでは、有声音などの周期性に起因する影響を取り除いた
パワースペクトルの推定を目的として、(1) 分析位置に依存しない周期信号のパワースペクトル推定法TANDEMと、(2) consistent samplingに基づくF0適応型スペクトル平滑化を用いている。
この(2) の実装では、平滑化関数として矩形関数を用い、本来は無限個の係数を必要とする補償項を1項で打ち切り、かつ、$|x| \ll 1$の場合には、$\log(1+x) \simeq x$で近似できることを利用し、スペクトルの正値性を保証している。
本資料では、これらの実装での近似による影響を、従来のSTRAIGHTを比較対象とし、有声音を用いた再合成音声の主観評価実験と、スペクトル距離の客観評価実験により調べた結果について報告する。
主観評価実験の結果は、両STRAIGHTによる再合成音声が、MNRUのQ値40~50に相当する高い品質を有するものであることを示すとともに、従来のSTRAIGHTによる再合成音声がTANDEM-STRAIGHTによるものよりも、やや高く評価される傾向を示した。
これらの結果は、周波数重みを加えたピーク重み付きスペクトル距離尺度による客観評価結果とも整合しており、TANDEM-STRAIGHTによる再合成音声の品質を向上させるための手がかりを与える。 |
(英) |
A speech analysis, modification and synthesis method TANDEM-STRAIGHT consists of two key components;
a) temporally independent power spectral estimation for periodic signals: TAMDEM and
b) F0 adaptive spectral smoothing based on consistent sampling theory.
The second component employes two approximations for implementing its function.
The first approximation is truncation of theoretically infinite number of compensating digital filter coefficients.
The second approximation is to use $\log(1+x)$ instead of using $x$, because they are virtually similar provided $|x| \ll 1$ holds.
This assures positivity of spectral envelope.
This report investigates effects of these approximations by using subjective tests of resynthesized voiced sounds as well as objective tests based on spectral distance measure.
The tests indicated that the resynthesized sounds by both method %legacy-STRAIGHT and TANDEM-STRAIGHT have equivalent quality of 40 to 50 Q value of MNRU, that is reasonably high.
The test also indicated that the resynthesized sounds by legacy-STRAIGHT tend to have higher sound quality than those by TANDEM-STRAIGHT.
These subjective results are consistent with the objective results based on the peak weighted spectral distance measure with frequency weighting, suggesting that there exists a room for further quality improvement of TANDEM-STRAIGHT. |
キーワード |
(和) |
スペクトル包絡 / TANDEM-STRAIGHT / 音声分析 / / / / / |
(英) |
Spectrum envelope / TANDEM-STRAIGHT / Speech analysis / / / / / |
文献情報 |
信学技報, vol. 109, no. 99, SP2009-34, pp. 63-68, 2009年6月. |
資料番号 |
SP2009-34 |
発行日 |
2009-06-17 (SP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
SP2009-34 |