講演名 2010-12-21
音源の個人性を考慮した声質変換(一般(ポスターセッション),第12回音声言語シンポジウム:情報アクセス,音声・言語処理一般)
上村 明仁, 外山 淳,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 声質変換において,戸田らは時系列単位の最尤推定に基づく声質変換を提案しているものの,声道特性のみに着目している.一方,北村らは音声の個人性が知覚される際に音源特性が重要であることを実験により示している.また,特徴空間内における声道特性と音源特性の関係は非線形になり,声質変換を行う際は音源特性を考慮しないと質の高い合成音を得ることはできないと考えられる.そこで,本研究では,LPC分析による残差波形を音源波として扱い,変換音声に用いることを提案する.音源波は学習時に目的話者のものを保存し,変換した基本周波数に基づき選択を行う.変換音声はスペクトル距離を用いて客観的に評価される.
抄録(英) In this paper, we describe a novel source conversion method for voice conversion. Toda et al. proposed voice conversion based on maximum likelihood estimation of spectral parameter trajectory. This method uses only vocal tract related parameters and dose not use source features. We treat the residuals of linear predictive coding as source signal to represent a target speaker individuality. Objective experimental results indicate that the power spectrum of the speech converted by our method is similar to a target speaker's one.
キーワード(和) 声質変換 / 音源特性 / 線形予測誤差
キーワード(英) voice conversion / source features / linear predictive coding error
資料番号 NLC2010-26,SP2010-99
発行日

研究会情報
研究会 SP
開催期間 2010/12/13(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Speech (SP)
本文の言語 JPN
タイトル(和) 音源の個人性を考慮した声質変換(一般(ポスターセッション),第12回音声言語シンポジウム:情報アクセス,音声・言語処理一般)
サブタイトル(和)
タイトル(英) A Voice Conversion Method Using Individuality of Sound Source
サブタイトル(和)
キーワード(1)(和/英) 声質変換 / voice conversion
キーワード(2)(和/英) 音源特性 / source features
キーワード(3)(和/英) 線形予測誤差 / linear predictive coding error
第 1 著者 氏名(和/英) 上村 明仁 / Akihito UEMURA
第 1 著者 所属(和/英) 北海道大学情報科学研究科
Graduate School of Information Science and Technology, Hokkaido University
第 2 著者 氏名(和/英) 外山 淳 / Jun TOYAMA
第 2 著者 所属(和/英) 北海道大学情報科学研究科
Graduate School of Information Science and Technology, Hokkaido University
発表年月日 2010-12-21
資料番号 NLC2010-26,SP2010-99
巻番号(vol) vol.110
号番号(no) 357
ページ範囲 pp.-
ページ数 5
発行日