講演名 2016-08-09
客観尺度を単語候補間で比較する二者択一型了解度推定方法の検討
近藤 和弘(山形大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 二者択一選択型の音声了解度試験において,単語候補間から一方の単語を選択する評価様式を模擬して了解度の推定を行う了解度客観推定法について検討した.客観尺度としては周波数重み付けセグメンタルSNR (fwSNRseg)を用いた.この尺度を明瞭度指数(AI) 標準で用いられているものと同じ帯域に分けて用いた.この帯域別に,劣化のある試験単語と,2 つの候補単語間のテンプレートデータ間で距離尺度を計算した.この時,正答単語の距離尺度(SNRseg)が近い帯域の比率を試験単語と正答単語の一致度を測る尺度として用いた.なお,比率の算出においては,各帯域の貢献を聴覚感度に応じた重みを与えることで調整した.この帯域比率と了解度の関係を既知雑音を混入した学習セットを用いてロジスティック回帰関数を学習した.この後,この回帰関数を用いて,未知雑音を混入した音声の正答帯域比率よりその了解度を推定した.未知雑音に対する推定了解度と実際の了解度間の推定2 乗誤差,並びに相関値は各々0.10 と0.97 となった.これは被験者を用いて実際了解度評価を行う条件を絞り込む,いわゆるスクリーニングに用いるには十分の性能である.
抄録(英) We proposed an estimation method for forced pairwise selection speech intelligibility test that takes into account the forced selection manner of the test. The distance measure used was based on the frequency-weighted segmental SNR (fwSNRseg) in sub-bands defined in the Articulation Index (AI) standard. We compared the distance between the degraded test word, and the clean templates for the two candidate words in the word pair, in each of the AI bands. The ratio of sub-bands with higher SNRseg for the correct word vs. the total number of bands, with weighting defined in the AI standard to account for the sensitivity of the human auditory system, is calculated to quantify the match between the test and the correct word characteristics. A logistic mapping function from this ratio to intelligibility using speech mixed with known noise was trained, and then used to estimate the intelligibility of speech mixed with unknown noise. The correlation and Root Mean Square Error (RMSE) between subjective and estimated intelligibility were about 0.97 and 0.10, respectively. This level of estimation accuracy should enable screening of subjective intelligibility testing conditions, minimizing the need for actual test using human subjects.
キーワード(和) 音声了解度 / 客観尺度 / 二者択一 / DRT / 音質推定
キーワード(英) speech intelligibility / objective measures / two-to-one forced selection / DRT / speech quality estimation
資料番号 EA2016-20
発行日 2016-08-02 (EA)

研究会情報
研究会 EA / ASJ-H
開催期間 2016/8/9(から2日開催)
開催地(和) 東北学院大学 多賀城キャンパス
開催地(英) Tohoku Gakuin Univ., Tagajo Campus
テーマ(和) 超臨場感音響,応用/電気音響,聴覚,一般
テーマ(英) Ultra-Realistic Acoustics, Engineering/Electro Acoustics, Psychological and Physiological Acoustics, and Related Topics
委員長氏名(和) 水町 光徳(九工大) / 平原 達也(富山県立大)
委員長氏名(英) Mitsunori Mizumachi(Kyushu Inst. of Tech.) / Tatsuya Hirahara(富山県立大)
副委員長氏名(和) 羽田 陽一(電通大) / 島内 末廣(NTT) / 古川 茂人(NTT)
副委員長氏名(英) Yoichi Haneda(Univ. of Electro-Comm.) / Suehiro Shimauchi(NTT) / Shigeto Furukawa(NTT)
幹事氏名(和) 堀内 俊治(KDDI研) / 渡邉 貫治(秋田県立大) / 森本 隆司(リオン) / 饗庭 絵里子(電通大) / 山川 仁子(尚絅大)
幹事氏名(英) Toshiharu Horiuchi(KDDI R&D Labs.) / Kanji Watanabe(Akita Pref. Univ.) / Takashi Morimoto(リオン) / Eriko Aiba(電通大) / Kimiko Yamakawa(尚絅大)
幹事補佐氏名(和) 武岡 成人(静岡理工科大) / TREVINO Jorge(東北大)
幹事補佐氏名(英) Shigeto Takeoka(Shizuoka Inst. of Science and Tech.) / TREVINO Jorge(Tohoku Univ.)

講演論文情報詳細
申込み研究会 Technical Committee on Engineering Acoustics / Auditory Research Meeting
本文の言語 JPN
タイトル(和) 客観尺度を単語候補間で比較する二者択一型了解度推定方法の検討
サブタイトル(和)
タイトル(英) Estimation of forced-selection speech intelligibility by comparing objective measures between candidate words
サブタイトル(和)
キーワード(1)(和/英) 音声了解度 / speech intelligibility
キーワード(2)(和/英) 客観尺度 / objective measures
キーワード(3)(和/英) 二者択一 / two-to-one forced selection
キーワード(4)(和/英) DRT / DRT
キーワード(5)(和/英) 音質推定 / speech quality estimation
第 1 著者 氏名(和/英) 近藤 和弘 / Kazuhiro Kondo
第 1 著者 所属(和/英) 山形大学(略称:山形大)
Yamagata University(略称:Yamagata Univ.)
発表年月日 2016-08-09
資料番号 EA2016-20
巻番号(vol) vol.116
号番号(no) EA-179
ページ範囲 pp.1-6(EA),
ページ数 6
発行日 2016-08-02 (EA)