講演抄録/キーワード |
講演名 |
2009-01-30 10:00
肉伝導音声変換のための音響特性補正法 ○宮本大輔・中村圭吾・戸田智基・猿渡 洋・鹿野清宏(奈良先端大) SP2008-132 |
抄録 |
(和) |
統計的声質変換はNon-Audible Murmur (NAM)マイクロフォンで収録される肉伝導音声の音質向上に効果的である.この手法は,肉伝導音声から空気伝導音声へ変換するための確率モデルを事前に学習しておく.
肉伝導音声の音響特性はNAMマイクロフォンの圧着位置などの収録環境に敏感であり,実際の使用においては学習時と変換時の音響特性の不一致により,変換音質が大きく劣化する.この問題を解決するため,我々は肉伝導音声変換のための教師無しの音響特性補正法を提案する.
実験結果から,提案手法が音響特性の不一致に起因する変換音質の劣化を劇的に改善することを示す. |
(英) |
Statistical voice conversion is very effective for enhancing body transmitted speech recorded with Non-Audible Murmur (NAM) microphone. In this method, a probabilistic model to convert body transmitted speech into natural speech is trained previously. Because acoustic characteristics of body transmitted speech is sensitive to recording conditions such as a location of NAM microphone, significant degradation of the conversion performance is often caused in practical situations by acoustic mismatches between the training and the conversion processes. To alleviate this problem, we propose unsupervised acoustic compensation methods for body transmitted voice conversion. Experimental results demonstrate that the proposed methods dramatically reduce the quality degradation of converted speech caused by the acoustic mismatches. |
キーワード |
(和) |
肉伝導音声変換 / 音響特性補正 / CMS / CMLLR / CSMAPLR / / / |
(英) |
Body transmitted voice conversion / Acoustic compensation / CMS / CMLLR / CSMAPLR / / / |
文献情報 |
信学技報, vol. 108, no. 422, SP2008-132, pp. 37-42, 2009年1月. |
資料番号 |
SP2008-132 |
発行日 |
2009-01-22 (SP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
SP2008-132 |