講演名 2008/6/20
線形予測分析に基づいた骨導音声ブラインド回復法の総合的評価(音声生成・知覚,聴覚心理,音声学・音韻論,一般)
鵜木 祐史, ルー シュガン, タット ヴ タング, 衣笠 光太, 赤木 正人,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 高騒音環境下での安心で安全な音声会話・音声認識を実現するために,雑音の影響を受け易い気導音声の代わりに骨導音声を利用することは,非常に有効な手段の一つである.しかし,骨導音声は,雑音の影響を受けない変わりに,その音質や明瞭度が著しく低下する.そのため,骨導音声の音質や明瞭度をブラインド的に回復する手法が必要とされる.著者らは,この課題に対する解決策として,線形予測分析に基づいたブラインド回復法を提案し,その有効性を示してきた.しかし,提案法の評価が静音環境下に限定されていたため,Lombard効果の影響について議論されていなかった.本稿では,現実的な利用を考慮し,静音環境下だけでなく,雑音環境下における日本語単語了解度試験ならびに特定・不特定話者の単語音声認識実験を行い,提案法を総合的に評価した.その結果,Lombard効果による影響はほとんどみられず,雑音環境下でも提案法が十分機能することを確認した.
抄録(英) Bone-conducted (BC) speech can be used instead of air-conducted (AC) speech for speech communication and speech recognition systems in an extremely noisy environment. However, it has very poor sound quality and its intelligibility is degraded when transmitted through bone conduction. Therefore, blindly improving quality and intelligibility of BC speech is a challenging topic. In previous study, we proposed a linear prediction (LP) based blind-restoration model to improve voice quality and intelligibility of BC speech and we showed usefulness of the proposed method in clean condition. In this paper, as realistic applications, we therefore comprehensively evaluated the proposed model in comparison with other models to find out whether the model could adequately improve the BC speech or not, via Japanese word intelligibility and word recognition tests in both clean and noisy environments. As results, it was found that the method can be available in high noisy environemnts, without Lombard effects.
キーワード(和) 骨導音声 / 線形予測分析 / Lombard効果 / 了解度試験 / 骨導音声認識
キーワード(英) Bone-conducted speech / Linear prediction / Lombard effect / Speech intelligibility test / Bone-conducted speech recognition
資料番号 SP2008-24
発行日

研究会情報
研究会 SP
開催期間 2008/6/20(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Speech (SP)
本文の言語 JPN
タイトル(和) 線形予測分析に基づいた骨導音声ブラインド回復法の総合的評価(音声生成・知覚,聴覚心理,音声学・音韻論,一般)
サブタイトル(和)
タイトル(英) Comprehensive evaluations of BC speech restoration method based on linear prediction
サブタイトル(和)
キーワード(1)(和/英) 骨導音声 / Bone-conducted speech
キーワード(2)(和/英) 線形予測分析 / Linear prediction
キーワード(3)(和/英) Lombard効果 / Lombard effect
キーワード(4)(和/英) 了解度試験 / Speech intelligibility test
キーワード(5)(和/英) 骨導音声認識 / Bone-conducted speech recognition
第 1 著者 氏名(和/英) 鵜木 祐史 / Masashi UNOKI
第 1 著者 所属(和/英) 北陸先端科学技術大学院大学情報科学研究科
School of Information Science, Japan Advanced Institute of Science and Technology
第 2 著者 氏名(和/英) ルー シュガン / Xugang LU
第 2 著者 所属(和/英) 北陸先端科学技術大学院大学情報科学研究科
School of Information Science, Japan Advanced Institute of Science and Technology
第 3 著者 氏名(和/英) タット ヴ タング / VU Thang TAT
第 3 著者 所属(和/英) 北陸先端科学技術大学院大学情報科学研究科
School of Information Science, Japan Advanced Institute of Science and Technology
第 4 著者 氏名(和/英) 衣笠 光太 / Kota KINUGASA
第 4 著者 所属(和/英) 北陸先端科学技術大学院大学情報科学研究科
School of Information Science, Japan Advanced Institute of Science and Technology
第 5 著者 氏名(和/英) 赤木 正人 / Masato AKAGI
第 5 著者 所属(和/英) 北陸先端科学技術大学院大学情報科学研究科
School of Information Science, Japan Advanced Institute of Science and Technology
発表年月日 2008/6/20
資料番号 SP2008-24
巻番号(vol) vol.108
号番号(no) 116
ページ範囲 pp.-
ページ数 6
発行日