講演名 2019-08-09
Study on Robust Method for Blindly Estimating Speech Transmission Index using Convolutional Neural Network with Temporal Amplitude Envelope
Doungpummet Suradej(北陸先端大), Karnjana Jessada(NASDA), Kongprawechnon Waree(SIIT), 鵜木 祐史(北陸先端大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和)
抄録(英) We have developed a robust scheme for blindly estimating speech transmission index (STI) in noisy reverberant environments based on a convolutional neural network (CNN) with temporal amplitude envelope feature. A method for estimating STI from an observed speech signal is required to predict the speech intelligibility in a sound field where people cannot be excluded. However, there is a significant accuracy reduction of an existing method based on the modulation transfer function due to the mismatch between the models and some real environments. To maintain an appropriate accuracy in general conditions, the robust scheme that the CNN is trained from entire temporal amplitude envelopes of speech signals with multiple noise types and reverberation conditions along withtheir associated STIs has been introduced. Simulations were carried out to evaluate the proposed scheme under realistic noisy reverberant conditions. The results showed that the proposed scheme provides high accuracy (i.e., the average root-mean-square error of 0.12 and the correlation of 0.86) under various noise and reverberation conditions. These results suggest that the proposed scheme can robustly estimate STIs in real noisy reverberant environments.
キーワード(和)
キーワード(英) Speech transmission indexroom impulse responsemodulation transfer functiontemporal amplitude envelopeconvolutional neural network
資料番号 EA2019-30
発行日 2019-08-01 (EA)

研究会情報
研究会 EA / ASJ-H
開催期間 2019/8/8(から2日開催)
開催地(和) 東北大学
開催地(英) Tohoku Univ.
テーマ(和) 応用/電気音響, 聴覚, 一般
テーマ(英) Engineering/Electro Acoustics, Psychological and Physiological Acoustics, and Related Topics
委員長氏名(和) 古家 賢一(大分大) / 小澤 賢司(山梨大)
委員長氏名(英) Kenichi Furuya(Oita Univ.) / 小澤 賢司(山梨大)
副委員長氏名(和) 島内 末廣(金沢工大) / 武岡 成人(静岡理工科大) / 鵜木 祐史(北陸先端大)
副委員長氏名(英) Suehiro Shimauchi(Kanazawa Inst. of Tech.) / Shigeto Takeoka(Shizuoka Inst. of Science and Tech.) / 鵜木 祐史(北陸先端大)
幹事氏名(和) 松井 健太郎(NHK) / 小山 翔一(東大) / 木谷 俊介(北陸先端大) / 大塚 翔(千葉大) / 寺島 裕貴(NTT)
幹事氏名(英) Kentaro Matsui(NHK) / Shoichi Koyama(Univ. of Tokyo) / 木谷 俊介(北陸先端大) / 大塚 翔(千葉大) / 寺島 裕貴(NTT)
幹事補佐氏名(和) 井本 桂右(立命館大) / 森川 大輔(富山県立大)
幹事補佐氏名(英) Keisuke Imoto(Ritsumeikan Univ.) / Daisuke Morikawa(Toyama Pref Univ.)

講演論文情報詳細
申込み研究会 Technical Committee on Engineering Acoustics / Auditory Research Meeting
本文の言語 ENG
タイトル(和)
サブタイトル(和)
タイトル(英) Study on Robust Method for Blindly Estimating Speech Transmission Index using Convolutional Neural Network with Temporal Amplitude Envelope
サブタイトル(和)
キーワード(1)(和/英) / Speech transmission indexroom impulse responsemodulation transfer functiontemporal amplitude envelopeconvolutional neural network
第 1 著者 氏名(和/英) Doungpummet Suradej / Suradej Doungpummet
第 1 著者 所属(和/英) 北陸先端科学技術大学院大学(略称:北陸先端大)
Japan Advanced Institute of Science and Technology(略称:JAIST)
第 2 著者 氏名(和/英) Karnjana Jessada / Jessada Karunjana
第 2 著者 所属(和/英) National Science and Technology Development Agency(略称:NASDA)
National Science and Technology Development Agency(略称:NASDA)
第 3 著者 氏名(和/英) Kongprawechnon Waree / Waree Kongprawechnon
第 3 著者 所属(和/英) Sirindhorn International Institute of Technology(略称:SIIT)
Sirindhorn International Institute of Technology(略称:SIIT)
第 4 著者 氏名(和/英) 鵜木 祐史 / Masashi Unoki
第 4 著者 所属(和/英) 北陸先端科学技術大学院大学(略称:北陸先端大)
Japan Advanced Institute of Science and Technology(略称:JAIST)
発表年月日 2019-08-09
資料番号 EA2019-30
巻番号(vol) vol.119
号番号(no) EA-163
ページ範囲 pp.47-52(EA),
ページ数 6
発行日 2019-08-01 (EA)