お知らせ 研究会の開催と会場に参加される皆様へのお願い(2020年7月開催)
電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
[ログイン]
技報アーカイブ
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2018-08-24 14:40
拡声音声への環境情報フィードバックシステムの基礎検討
小林洋介野口啓太室蘭工大)・栗栖清浩TOA
抄録 (和) 本研究では,屋外拡声装置の放送品質を改善するために,拡声フィールドからの品質予測値のフィードバックを提案する。フィードバックに用いるのは,放送音声の聴き取りにくさ指標であるListening Difficulty Rating(LDR)の推定値である。LDR の推定には,Taal et al. が提案しているShort-Time Objective Intelligibility(STOI) を用いる。STOI によるLDR 推定モデルの性能は決定係数0.93 で,平均二乗誤差が0.102 と高精度なモデルを構築できた。一方で,STOI はリファレンス信号が必要であり,リアルタイムフィードバックに適さない。そこで,フィールドで録音した音源からメルケプストラム係数を求め,STOI を用いた推定LDR を求める機械学習モデルを構築した。この提案モデルをフィールドで録音した音源でテストしたところ,拡声器の直線上にあるスピーカほど聴き取りやすいことが予測できた。 
(英) In this research, we propose the feedback of the estimated listening difficulty rating (LDR) values from any single-board computer including microphone-installed field to improve the broadcast quality of the outdoor public address systems. We estimate the LDR from short-time objective intelligibility (STOI) proposed by Taal et al. The STOI is a highly correlated objective speech intelligibility index, and it is widely used in recent years. The result of estimating the LDR using STOI was a highly accurate prediction model with a Pearson correlation coefficient of 0.93 and RMSE of 0.102. On the other hand, the STOI measure requires a reference clean speech signal, which is not suitable for real-time feedback. Therefore, we propose a machine learning model that estimated the LDR by obtaining mel-cepstral coefficient from the recorded signals in the real field. To generate this model, we used many speech signals with known STOI values. When we tested the sensing using this proposed model with a real-field sound source, we found that devices closer to the loudspeaker are easier to hear.
キーワード (和) / / / / / / /  
(英) / / / / / / /  
文献情報 信学技報, vol. 118, no. 190, EA2018-49, pp. 133-138, 2018年8月.
資料番号  
発行日 2018-08-16 (EA) 
ISSN Print edition: ISSN 0913-5685  Online edition: ISSN 2432-6380
PDFダウンロード

研究会情報
研究会 EA ASJ-H  
開催期間 2018-08-23 - 2018-08-24 
開催地(和) 東北学院大学 
開催地(英) Tohoku Gakuin Univ. 
テーマ(和) 応用/電気音響, 聴覚, 一般 
テーマ(英) Engineering/Electro Acoustics, Psychological and Physiological Acoustics, and Related Topics 
講演論文情報の詳細
申込み研究会 ASJ-H 
会議コード 2018-08-EA-H 
本文の言語 日本語 
タイトル(和) 拡声音声への環境情報フィードバックシステムの基礎検討 
サブタイトル(和)  
タイトル(英) A basic study on environment information feedback for outdoor PA systems 
サブタイトル(英)  
キーワード(1)(和/英) /  
キーワード(2)(和/英) /  
キーワード(3)(和/英) /  
キーワード(4)(和/英) /  
キーワード(5)(和/英) /  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 小林 洋介 / Yosuke kobayashi /
第1著者 所属(和/英) 室蘭工業大学 (略称: 室蘭工大)
Muroran Institute of Technology (略称: MIT)
第2著者 氏名(和/英/ヨミ) 野口 啓太 / Keita Noguchi /
第2著者 所属(和/英) 室蘭工業大学 (略称: 室蘭工大)
Muroran Institute of Technology (略称: MIT)
第3著者 氏名(和/英/ヨミ) 栗栖 清浩 / Kiyohiro Kurisu /
第3著者 所属(和/英) TOA株式会社 (略称: TOA)
TOA Corporation (略称: TOA)
第4著者 氏名(和/英/ヨミ) / /
第4著者 所属(和/英) (略称: )
(略称: )
第5著者 氏名(和/英/ヨミ) / /
第5著者 所属(和/英) (略称: )
(略称: )
第6著者 氏名(和/英/ヨミ) / /
第6著者 所属(和/英) (略称: )
(略称: )
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者
発表日時 2018-08-24 14:40:00 
発表時間 25 
申込先研究会 ASJ-H 
資料番号 IEICE-EA2018-49 
巻番号(vol) IEICE-118 
号番号(no) no.190 
ページ範囲 pp.133-138 
ページ数 IEICE-6 
発行日 IEICE-EA-2018-08-16 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会