講演抄録/キーワード |
講演名 |
2019-12-13 11:20
STOI型客観了解度指標を用いた屋外拡声音の聴き取りにくさ予測モデルの評価 ○野口啓太・小林洋介・岸上順一(室蘭工大)・栗栖清浩(TOA) EA2019-76 |
抄録 |
(和) |
屋外拡声システムは日常生活での放送で利用されるだけでなく,緊急時に避難の呼びかけをする重要なシステムである。本稿では,屋外での拡声器のインパルス応答を畳み込んだ音声を主観品質指標である Listening difficulty rating (LDR) で評価した。次に,3 種の STOI 型客観了解度指標でモデル化した。その結果,主観評価値と STOI 型指標値の相関係数で 0.973∼0.981 と高精度なモデルが作成できた。しかし,STOI 型指標の計算には原音が必要であり,騒音計のように実際の屋外拡声音声のみで予測する事に適さない。そこで,屋外拡声音から音響特徴量としてメルケプスラム係数 MFCC とそのデルタパラメータを求め,STOI 型指標値を予測する機械学習モデルを作成した。機械学習手法には,深層学習である DNN (Deep neural network),決定木のアンサンブルである Random forests およびスパースモデリングの手法である Elastic net を比較した。その結果,SNR 別の RMSE(Root mean squared error) は学習手法ごとに大きく傾向が異なったが,平均すると DNN で STOI を予測した際に RMSE が 0.159 と最小であった。 |
(英) |
An outdoor public address (PA) system is indispensable for emergency broadcasting during the occurrence of disasters, and its quality of speech is therefore a very important aspect. In this study, the impulse response (IR) of a PA loudspeaker was measured, and the subjective quality of the IR convoluted speech was evaluated by employing listening difficulty rating (LDR). The LDR fitting model was subsequently developed by applying three type short-time objective intelligibility (STOI) type indexes. Obtained results indicate that the correlation coefficient between the subjective evaluation value and three STOI-type index values ranges from 0.973 to 0.981. However, calculation of the STOI-type intelligibility index requires the reference speech signal, which is not appropriate for actual outdoor PA system evaluation. Hence, an alternative evaluation system is proposed that is based on machine learning and incorporates the observation speech signal as a sound-level meter.
In the proposed system, Mel-frequency cepstral coefficients and the delta parameters are trained as acoustic features for predicting STOI-type index values. In this study, three learning methods were compared. Upon averaging the obtained results, the smallest root mean square error is found to be 0.159 in the case of STOI predicted by employing deep neural networks. |
キーワード |
(和) |
屋外拡声音 / 聴き取りにくさ / STOI / SIMI / ESTOI / 機械学習 / / |
(英) |
Outdoor public address speech / Listening difficulty rating / STOI / SIMI / ESTOI / Machine learning / / |
文献情報 |
信学技報, vol. 119, no. 334, EA2019-76, pp. 71-78, 2019年12月. |
資料番号 |
EA2019-76 |
発行日 |
2019-12-05 (EA) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
EA2019-76 |