講演名 2013-06-13
スペクトル補正及び統計的音源生成に基づくハイブリッド電気音声強調(障碍者支援システム,音声/福祉/ディジタル信号処理/聴覚一般)
田中 宏, 戸田 智基, ニュービッグ グラム, サクティ サクリアニ, 中村 哲,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 喉頭摘出者のための代用発声法の一つとして,電気式人工喉頭を用いた発声法がある.外部から機械的に生成される音源信号を用いて発声を行う方法であり,習得が容易で,かつ,比較的聞き取りやすい音声(電気音声)を生成できるという利点がある.一方で,自然な音源信号を機械的に生成するのは困難であり,特に発話内容に応じた自然な基本周波数パターンを生成するのは本質的に極めて困難な処理となる.結果として,電気音声の自然性は大きく劣化する.また,電気式人工喉頭から生成される音源信号自体が外部に漏れるため,雑音として電気音声に混入し,その品質を劣化させる.これらの問題に対処するため,本稿では,電気音声の聞き取りやすさを保持しながら自然性を大幅に改善する音声強調法として,従来の強調法である雑音抑圧に基づくスペクトル補正処理と統計的声質変換に基づく音源特徴量生成処理を組み合わせたハイブリッド法を提案する.提案法では,統計的手法によるスペクトルおよび有声無声情報への変換処理を回避することで,変換誤差により聞き取りやすさが劣化する事態を回避する.また,統計的手法により,通常音声の基本周波数パターンを予測することで,自然性を大幅に改善する.実験的評価結果から,本手法の有効性を示す.
抄録(英) We present a hybrid approach to improving naturalness of electrolaryngeal (EL) speech while minimizing degradation in listenability. An electrolarynx is a device that artificially generates excitation sounds to enable laryngectomees to produce EL speech. Although proficient laryngectomees can produce quite intelligible EL speech, it sounds very unnatural due to the mechanical excitation produced by the device. Moreover, the excitation sounds produced by the device often leak outside, adding noise to EL speech. To address these issues, we propose a hybrid method using the noise reduction method for enhancing spectral parameters and voice conversion method for predicting excitation parameters. The experimental results demonstrate the proposed method yields significant improvements in naturalness compared with EL speech while keeping listenability high enough.
キーワード(和) 発声障害 / 電気音声 / スペクトル減算 / 統計的声質変換 / ハイブリッド法
キーワード(英) speaking-aid / electrolaryngeal speech / spectral subtraction / voice conversion / hybrid approach
資料番号 SP2013-37,WIT2013-7
発行日

研究会情報
研究会 WIT
開催期間 2013/6/6(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Well-being Information Technology(WIT)
本文の言語 JPN
タイトル(和) スペクトル補正及び統計的音源生成に基づくハイブリッド電気音声強調(障碍者支援システム,音声/福祉/ディジタル信号処理/聴覚一般)
サブタイトル(和)
タイトル(英) A Hybrid Approach to Electrolaryngeal Speech Enhancement Based on Spectral Compensation and Statistical Source Excitation Generation
サブタイトル(和)
キーワード(1)(和/英) 発声障害 / speaking-aid
キーワード(2)(和/英) 電気音声 / electrolaryngeal speech
キーワード(3)(和/英) スペクトル減算 / spectral subtraction
キーワード(4)(和/英) 統計的声質変換 / voice conversion
キーワード(5)(和/英) ハイブリッド法 / hybrid approach
第 1 著者 氏名(和/英) 田中 宏 / Kou TANAKA
第 1 著者 所属(和/英) 奈良先端科学技術大学院大学情報科学研究科
Graduate School of Information Science, Nara Institute of Science and Technology
第 2 著者 氏名(和/英) 戸田 智基 / Tomoki TODA
第 2 著者 所属(和/英) 奈良先端科学技術大学院大学情報科学研究科
Graduate School of Information Science, Nara Institute of Science and Technology
第 3 著者 氏名(和/英) ニュービッグ グラム / Graham NEUBIG
第 3 著者 所属(和/英) 奈良先端科学技術大学院大学情報科学研究科
Graduate School of Information Science, Nara Institute of Science and Technology
第 4 著者 氏名(和/英) サクティ サクリアニ / Sakriani SAKTI
第 4 著者 所属(和/英) 奈良先端科学技術大学院大学情報科学研究科
Graduate School of Information Science, Nara Institute of Science and Technology
第 5 著者 氏名(和/英) 中村 哲 / Satoshi NAKAMURA
第 5 著者 所属(和/英) 奈良先端科学技術大学院大学情報科学研究科
Graduate School of Information Science, Nara Institute of Science and Technology
発表年月日 2013-06-13
資料番号 SP2013-37,WIT2013-7
巻番号(vol) vol.113
号番号(no) 77
ページ範囲 pp.-
ページ数 6
発行日