講演抄録/キーワード |
講演名 |
2014-05-25 11:30
[研究紹介]サブバンド基底スペクトルモデルを利用した統計的帯域拡張法 ○大谷大和・田村正統・森田眞弘・赤嶺政巳(東芝) SP2014-27 |
抄録 |
(和) |
本稿では混合正規分布モデル(GMM)とサブバンド基底スペクトルモデル(SBM)に基づく統計的帯域拡張法について述べる.
従来のGMMに基づく統計的帯域拡張では,ある決まった帯域幅を持つ狭帯域特徴量から広帯域特徴量への帯域拡張を行うため,狭帯域信号の帯域幅ごとにGMMを用意する必要がある.
本提案法では,SBMの上記の特性に着目し,SBMパラメータを用いることで,任意の帯域幅を持つ狭帯域信号を広帯域信号への帯域拡張を実現する.
SBMの各次元の成分は周波数領域上の特定の周波数を持つ音響空間を表現するパラメータであるため,周波数領域での信号処理が容易に実行できる.
そこで,本提案法では広帯域のSBMパラメータのみを用いてGMMを事前に学習し,
このGMMを用いて,入力された狭帯域信号から得られるSBMの低域成分からSBMパラメータの高域成分の推定を行い,入力音声のスペクトルに付与することで帯域拡張を実現する.
評価実験により,提案手法が様々な入力帯域において頑健に帯域拡張が実現できることをと示す. |
(英) |
This paper describes a novel statistical bandwidth extension (BWE) method based on a Gaussian mixture model (GMM) and a sub-band basis spectrum model (SBM).
Each dimensional component of SBM represents a specific acoustic space in the frequency domain.
While the conventional GMM-based methods perform the conversion from a fixed narrowband data,
the proposed method can extend a speech data with an arbitrary bandwidth to that with the target bandwidth.
In the proposed method, a GMM is trained with SBM parameters extracted from wideband spectra in advance.
An input signal with a narrow bandwidth is converted into a target wideband signal by converting low-band SBM components of the input signal into high-band SBM components.
The results of objective and subjective evaluations indicate that the proposed method aheive BWE robustly. |
キーワード |
(和) |
音声合成 / 声質変換 / 帯域拡張 / サブバンド基底スペクトルモデル / 混合正規分布モデル / 非パラレルデータ / / |
(英) |
speech synthesis / voice conversion / bandwidth extension / sub-band basis spectrum model / Gaussian mixture model / non-parallel data / / |
文献情報 |
信学技報, vol. 114, no. 52, SP2014-27, pp. 303-308, 2014年5月. |
資料番号 |
SP2014-27 |
発行日 |
2014-05-17 (SP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
SP2014-27 |