講演名 2006/8/23
統計的声質変換法による肉伝導小声の音質改善(合成,生成,韻律,一般)
関本 英彦, 戸田 智基, 猿渡 洋, 鹿野 清宏,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 携帯電話が普及するにつれて,「いつでも」「どこでも」コミュニケーションができるようになった.携帯電話を使うことがとても便利である反面,外部雑音の影響により,正しい内容を受聴できない問題がある.例えば,人ごみの中といった騒音による影響のため,小声でプライベートな会話ができない.本稿では,外部雑音に頑健な非可聴つぶやき(Non-Audible Murmur: NAM)マイクを用いた小声(Small Body Transmitted Ordinary Speech: SBTOS)によるコミュニケーションを考える.NAMマイクで収録された音声(肉伝導音声)は外部雑音に頑健である反面,こもった音声になり,聞き取りが困難である.そのため,混合正規分布モデル(Gaussian Mixture Model: GMM)を用いた声質変換技術により音質改善を行う.その際に,SBTOSから通常音声へと変換(SBTOS-to-SP),また小声へと変換(SBTOS-to-SSP)を検討する.入出力間における有声無声の一致率を調べたところ,SBTOS-to-SSPはSBTOS-to-SPよりも一致していることがわかった.客観,及び主観評価実験の結果,SBTOS-to-SSPはSBTOS-to-SPより優れていることがわかった.
抄録(英) The explosive spread of cellular phones enables us to communicate with each other at any time or place. Although cellular phones are convenient, there are still some problems. For example, it is difficult to send intelligible speech under noisy conditions, which is a fatal problem especially when talking privately using small speech in crowds. To improve the quality of small speech under such situations, we propose a new speech communication style using a Non-Audible Murmur (NAM) microphone. The NAM microphone is robust to eternal noise, although body transmission causes quality degradation. To improve the sound quality of Small Body Transmitted Ordinary Speech (SBTOS), which is small speech recorded with a NAM microphone, we propose two conversion methods that reflect a statistical voice conversion method based on Gaussian Mixture Model (GMM). One conversion method is from SBTOS to ordinary speech (SBTOS-to-SP), and the other is from SBTOS to small speech (SBTOS-to-SSP). SBTOS-to-SSP has more consistent correspondence of voiced/unvoiced segments between input and output speech than SBTOS-to-SP. The results of objective and subjective evaluations show that SBTOS-to-SSP outperforms SBTOS-to-SP.
キーワード(和) NAMマイク / 声質変換 / 肉伝導小声 / 音質改善 / 有声無声
キーワード(英) NAM microphone / voice conversion / small body transmitted ordinary speech / quality improvements / voiced/unvoiced segments
資料番号 SP2006-41
発行日

研究会情報
研究会 SP
開催期間 2006/8/23(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Speech (SP)
本文の言語 JPN
タイトル(和) 統計的声質変換法による肉伝導小声の音質改善(合成,生成,韻律,一般)
サブタイトル(和)
タイトル(英) Quality Improvements of Small Body Transmitted Ordinary Speech with Statistical Voice Conversion
サブタイトル(和)
キーワード(1)(和/英) NAMマイク / NAM microphone
キーワード(2)(和/英) 声質変換 / voice conversion
キーワード(3)(和/英) 肉伝導小声 / small body transmitted ordinary speech
キーワード(4)(和/英) 音質改善 / quality improvements
キーワード(5)(和/英) 有声無声 / voiced/unvoiced segments
第 1 著者 氏名(和/英) 関本 英彦 / Hidehiko SEKIMOTO
第 1 著者 所属(和/英) 奈良先端科学技術大学院大学 情報科学研究科
Graduate School of Information Science, Nara Institute of Science and Technology
第 2 著者 氏名(和/英) 戸田 智基 / Tomoki TODA
第 2 著者 所属(和/英) 奈良先端科学技術大学院大学 情報科学研究科
Graduate School of Information Science, Nara Institute of Science and Technology
第 3 著者 氏名(和/英) 猿渡 洋 / Hiroshi SARUWATARI
第 3 著者 所属(和/英) 奈良先端科学技術大学院大学 情報科学研究科
Graduate School of Information Science, Nara Institute of Science and Technology
第 4 著者 氏名(和/英) 鹿野 清宏 / Kiyohiro SHIKANO
第 4 著者 所属(和/英) 奈良先端科学技術大学院大学 情報科学研究科
Graduate School of Information Science, Nara Institute of Science and Technology
発表年月日 2006/8/23
資料番号 SP2006-41
巻番号(vol) vol.106
号番号(no) 221
ページ範囲 pp.-
ページ数 6
発行日