講演名 2019-12-13
STOI型客観了解度指標を用いた屋外拡声音の聴き取りにくさ予測モデルの評価
野口 啓太(室蘭工大), 小林 洋介(室蘭工大), 岸上 順一(室蘭工大), 栗栖 清浩(TOA),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 屋外拡声システムは日常生活での放送で利用されるだけでなく,緊急時に避難の呼びかけをする重要なシステムである。本稿では,屋外での拡声器のインパルス応答を畳み込んだ音声を主観品質指標である Listening difficulty rating (LDR) で評価した。次に,3 種の STOI 型客観了解度指標でモデル化した。その結果,主観評価値と STOI 型指標値の相関係数で 0.973?0.981 と高精度なモデルが作成できた。しかし,STOI 型指標の計算には原音が必要であり,騒音計のように実際の屋外拡声音声のみで予測する事に適さない。そこで,屋外拡声音から音響特徴量としてメルケプスラム係数 MFCC とそのデルタパラメータを求め,STOI 型指標値を予測する機械学習モデルを作成した。機械学習手法には,深層学習である DNN (Deep neural network),決定木のアンサンブルである Random forests およびスパースモデリングの手法である Elastic net を比較した。その結果,SNR 別の RMSE(Root mean squared error) は学習手法ごとに大きく傾向が異なったが,平均すると DNN で STOI を予測した際に RMSE が 0.159 と最小であった。
抄録(英) An outdoor public address (PA) system is indispensable for emergency broadcasting during the occurrence of disasters, and its quality of speech is therefore a very important aspect. In this study, the impulse response (IR) of a PA loudspeaker was measured, and the subjective quality of the IR convoluted speech was evaluated by employing listening difficulty rating (LDR). The LDR fitting model was subsequently developed by applying three type short-time objective intelligibility (STOI) type indexes. Obtained results indicate that the correlation coefficient between the subjective evaluation value and three STOI-type index values ranges from 0.973 to 0.981. However, calculation of the STOI-type intelligibility index requires the reference speech signal, which is not appropriate for actual outdoor PA system evaluation. Hence, an alternative evaluation system is proposed that is based on machine learning and incorporates the observation speech signal as a sound-level meter. In the proposed system, Mel-frequency cepstral coefficients and the delta parameters are trained as acoustic features for predicting STOI-type index values. In this study, three learning methods were compared. Upon averaging the obtained results, the smallest root mean square error is found to be 0.159 in the case of STOI predicted by employing deep neural networks.
キーワード(和) 屋外拡声音 / 聴き取りにくさ / STOI / SIMI / ESTOI / 機械学習
キーワード(英) Outdoor public address speech / Listening difficulty rating / STOI / SIMI / ESTOI / Machine learning
資料番号 EA2019-76
発行日 2019-12-05 (EA)

研究会情報
研究会 EA
開催期間 2019/12/12(から2日開催)
開催地(和) 九州工業大学戸畑キャンパス(北九州市)
開催地(英) Kyushu Inst. Tech.
テーマ(和) 応用/電気音響,一般
テーマ(英) Engineering/Electro Acoustics, and Related Topics
委員長氏名(和) 古家 賢一(大分大)
委員長氏名(英) Kenichi Furuya(Oita Univ.)
副委員長氏名(和) 島内 末廣(金沢工大) / 武岡 成人(静岡理工科大)
副委員長氏名(英) Suehiro Shimauchi(Kanazawa Inst. of Tech.) / Shigeto Takeoka(Shizuoka Inst. of Science and Tech.)
幹事氏名(和) 松井 健太郎(NHK) / 小山 翔一(東大)
幹事氏名(英) Kentaro Matsui(NHK) / Shoichi Koyama(Univ. of Tokyo)
幹事補佐氏名(和) 井本 桂右(立命館大) / 森川 大輔(富山県立大)
幹事補佐氏名(英) Keisuke Imoto(Ritsumeikan Univ.) / Daisuke Morikawa(Toyama Pref Univ.)

講演論文情報詳細
申込み研究会 Technical Committee on Engineering Acoustics
本文の言語 JPN
タイトル(和) STOI型客観了解度指標を用いた屋外拡声音の聴き取りにくさ予測モデルの評価
サブタイトル(和)
タイトル(英) Listening difficulty rating prediction model using STOI-type objective intelligibility index for outdoor public address speech
サブタイトル(和)
キーワード(1)(和/英) 屋外拡声音 / Outdoor public address speech
キーワード(2)(和/英) 聴き取りにくさ / Listening difficulty rating
キーワード(3)(和/英) STOI / STOI
キーワード(4)(和/英) SIMI / SIMI
キーワード(5)(和/英) ESTOI / ESTOI
キーワード(6)(和/英) 機械学習 / Machine learning
第 1 著者 氏名(和/英) 野口 啓太 / Keita Noguchi
第 1 著者 所属(和/英) 室蘭工業大学(略称:室蘭工大)
Muroran Institute of Technology(略称:Muroran-IT)
第 2 著者 氏名(和/英) 小林 洋介 / Yosuke Kobayashi
第 2 著者 所属(和/英) 室蘭工業大学(略称:室蘭工大)
Muroran Institute of Technology(略称:Muroran-IT)
第 3 著者 氏名(和/英) 岸上 順一 / Jay Kishigami
第 3 著者 所属(和/英) 室蘭工業大学(略称:室蘭工大)
Muroran Institute of Technology(略称:Muroran-IT)
第 4 著者 氏名(和/英) 栗栖 清浩 / Kiyohiro Kurisu
第 4 著者 所属(和/英) TOA株式会社(略称:TOA)
TOA Corporation(略称:TOA)
発表年月日 2019-12-13
資料番号 EA2019-76
巻番号(vol) vol.119
号番号(no) EA-334
ページ範囲 pp.71-78(EA),
ページ数 8
発行日 2019-12-05 (EA)