講演名 2018-03-20
Speech Dereverberation Based on Recursive Weighted Prediction Error
籠嶋 岳彦(東芝), 金 宜鉉(東芝), 赤嶺 政巳(東芝),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) This paper proposes a speech dereverberation method based on recursive wighted prediction error (RWPE) for a moving average (MA) model of reverberation observed by a single distant microphone. We estimate an infinite impulse response (IIR) filter for inverse filtering based on a maximum likelihood criterion on a time-varying Gaussian speech model. To make the IIR filter stable, we propose an iterative process of avoiding recursive filtering at the current processing time. We compared the proposed RWPE method with a dereverberation method based on weighted prediction error (WPE) in an application to an in-house automatic speech recognition (ASR) system. The WPE method is known to be an effective method when using multi-channel microphones. However, it mismatches the MA observation model when using a single-channel microphone. Experimental results using simulated reverberant speech reveal that the proposed method achieves a better performance than the WPE method in terms of the accuracy of speech recognition.
抄録(英) This paper proposes a speech dereverberation method based on recursive wighted prediction error (RWPE) for a moving average (MA) model of reverberation observed by a single distant microphone. We estimate an infinite impulse response (IIR) filter for inverse filtering based on a maximum likelihood criterion on a time-varying Gaussian speech model. To make the IIR filter stable, we propose an iterative process of avoiding recursive filtering at the current processing time. We compared the proposed RWPE method with a dereverberation method based on weighted prediction error (WPE) in an application to an in-house automatic speech recognition (ASR) system. The WPE method is known to be an effective method when using multi-channel microphones. However, it mismatches the MA observation model when using a single-channel microphone. Experimental results using simulated reverberant speech reveal that the proposed method achieves a better performance than the WPE method in terms of the accuracy of speech recognition.
キーワード(和) 残響抑圧 / 音声認識 / 逆フィルタ / 音声強調
キーワード(英) Dereverberation / speech recognition / inverse filtering / speech enhancement
資料番号 EA2017-169,SIP2017-178,SP2017-152
発行日 2018-03-12 (EA, SIP, SP)

研究会情報
研究会 SIP / EA / SP / MI
開催期間 2018/3/19(から2日開催)
開催地(和) 石垣島 ホテルミヤヒラ
開催地(英)
テーマ(和) 音声,応用/電気音響,信号処理,一般 [SIP,EA,SP]/ 医用画像工学一般 [MI]
テーマ(英) Speech, Engineering/Electro Acoustics, Signal Processing, and Related Topics [SIP, EA, SP]/ Medical Image Engineering, Analysis, Recognition, etc. [MI]
委員長氏名(和) 奥田 正浩(北九州市大) / 島内 末廣(NTT) / 山下 洋一(立命館大) / 森 健策(名大)
委員長氏名(英) Masahiro Okuda(Univ. of Kitakyushu) / Suehiro Shimauchi(NTT) / Yoichi Yamashita(Ritsumeikan Univ.) / Kensaku Mori(Nagoya Univ.)
副委員長氏名(和) 村松 正吾(新潟大) / 相川 直幸(東京理科大) / 水町 光徳(九州工業大) / 森 大毅(宇都宮大) / 河田 佳樹(徳島大) / 木村 裕一(近畿大)
副委員長氏名(英) Shogo Muramatsu(Niigata Univ.) / Naoyuki Aikawa(TUS) / Mitsunori Mizumachi(Kyutech) / Hiroki Mori(Utsunomiya Univ.) / Yoshiki Kawata(Tokushima Univ.) / Yuichi Kimura(Kinki Univ.)
幹事氏名(和) 宮田 高道(千葉工大) / 渡邊 修(拓殖大) / 渡邉 貫治(秋田県立大) / 武岡 成人(静岡理工科大) / 西田 昌史(静岡大) / 坂野 秀樹(名城大) / 北坂 孝幸(愛知工大) / 本谷 秀堅(名工大)
幹事氏名(英) Takamichi Miyata(Chiba Inst. of Tech.) / Osamu Watanabe(Takushoku Univ.) / Kanji Watanabe(Akita Pref. Univ.) / Shigeto Takeoka(Shizuoka Inst. of Science and Tech.) / Masafumi Nishida(Shizuoka Univ.) / Hideki Banno(Meijo Univ.) / Takayuki Kitasaka(Aichi Inst. of Tech.) / Hidekata Hontani(Nagoya Inst. of Tech.)
幹事補佐氏名(和) 中本 昌由(広島大) / TREVINO Jorge(東北大) / 伊藤 信貴(NTT) / 橋本 佳(名工大) / 小橋川 哲(NTT) / 原口 亮(兵庫県立大) / 平野 靖(山口大)
幹事補佐氏名(英) Masayoshi Nakamoto(Hiroshima Univ.ひろ) / TREVINO Jorge(Tohoku Univ.) / Nobutaka Ito(NTT) / Kei Hashimoto(Nagoya Inst. of Tech.) / Satoshi Kobashikawa(NTT) / Ryo Haraguchi(Univ. of Hyogo) / Yasushi Hirano(Yamaguchi Univ.)

講演論文情報詳細
申込み研究会 Technical Committee on Signal Processing / Technical Committee on Engineering Acoustics / Technical Committee on Speech / Technical Committee on Medical Imaging
本文の言語 ENG
タイトル(和)
サブタイトル(和)
タイトル(英) Speech Dereverberation Based on Recursive Weighted Prediction Error
サブタイトル(和)
キーワード(1)(和/英) 残響抑圧 / Dereverberation
キーワード(2)(和/英) 音声認識 / speech recognition
キーワード(3)(和/英) 逆フィルタ / inverse filtering
キーワード(4)(和/英) 音声強調 / speech enhancement
第 1 著者 氏名(和/英) 籠嶋 岳彦 / Takehiko Kagoshima
第 1 著者 所属(和/英) 株式会社 東芝(略称:東芝)
Toshiba Corporation(略称:Toshiba)
第 2 著者 氏名(和/英) 金 宜鉉 / Ui-Hyun Kim
第 2 著者 所属(和/英) 株式会社 東芝(略称:東芝)
Toshiba Corporation(略称:Toshiba)
第 3 著者 氏名(和/英) 赤嶺 政巳 / Masami Akamine
第 3 著者 所属(和/英) 株式会社 東芝(略称:東芝)
Toshiba Corporation(略称:Toshiba)
発表年月日 2018-03-20
資料番号 EA2017-169,SIP2017-178,SP2017-152
巻番号(vol) vol.117
号番号(no) EA-515,SIP-516,SP-517
ページ範囲 pp.367-372(EA), pp.367-372(SIP), pp.367-372(SP),
ページ数 6
発行日 2018-03-12 (EA, SIP, SP)