講演名 2010-06-10
EA2010-23 ステレオ符号化が仮想3次元空間音声の音声了解度へ与える影響
小林 洋介, 近藤 和弘, 中川 清司,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 頭部伝達関数を用いて話者分離を行う音声システムにおいて,定位音声を符号化した場合の日本語音声了解度について日本語版DRTを用いて評価した.評価音源は24kbpsでHBAAC符号化を行い,ジョイントステレオ方式とパラメトリックステレオ方式の両方式及び符号化前の原音と比較した.仮想空間における各音像は聴取者を中心とする水平面であり,聴取者の正面に正規化距離αに発話者を定位し,話者までの距離の1/4の距離(0.25のに妨害音を15度毎に定位した.その結果,正面Odeg.近傍の+15deg.から-15degにおける方式間差は小さかったが,ジョイントステレオ方式は符号化を行わない場合に近い傾向を示したが了解度は符号化をしない場合より8%低下した.また,パラメトリックステレオ方式はノイズ方位角の影響は小さかったが全体として了解度の低下は大きく符号化をしない場合に比べて12%低下した.また,本実験系における理想的なSNRを算出し,評価結果と比較したところ,被験者の正面および後方の正中面を含む狭い範囲を除いて高い相関が得られることが分かった.
抄録(英) In this paper, we investigated the influence of stereo coding on the 3D audio for Japanese. We encoded localized test samples using joint stereo and parametric stereo of the HE-AAC encoder at identical coding rates. at 24 kbps. The Japanese word intelligibility test employed was the Japanese Diagnostic Rhyme Tests (JDRT). First, we localized the speaker in front of the listener at an arbitrary distance a (1.00a). Next, we compared the effect of noise located at a distance of 0.25a from the listener at one of the angles 15 degrees apart on the horizontal plane. The result showed that the target speech cannot be separated from the noise for any stereo coding when the noise was in front of speaker between azimuths of +15 deg. to -15 deg. The joint stereo was close in noise azimuth declination in reference. However, as for the intelligibility, 8% fell than reference. In addition, as for the parametric stereo, the influence of the noise azimuth declination was small. However, as a whole, the 12% intelligibility deteriorated in comparison with the reference. Moreover, when the ideal SNR in this experiment system was computed and having been compared with the evaluation result, it turned out that high correlation is acquired except for the narrow range containing a subject's front and back median plane.
キーワード(和) 頭部伝達関数 / 音声了解度 / ステレオ符号化 / ジョイントステレオ / パラメトリックステレオ
キーワード(英) Head-Related Transfer Functions / Speech Intelligibility / Stereo coding / Joint stereo / Parametric stereo
資料番号 EA2010-23
発行日

研究会情報
研究会 EA
開催期間 2010/6/3(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Engineering Acoustics (EA)
本文の言語 JPN
タイトル(和) EA2010-23 ステレオ符号化が仮想3次元空間音声の音声了解度へ与える影響
サブタイトル(和)
タイトル(英) EA2010-23 Influence of Stereo Coding on Japanese Speech Intelligibility in 3D Audio Space
サブタイトル(和)
キーワード(1)(和/英) 頭部伝達関数 / Head-Related Transfer Functions
キーワード(2)(和/英) 音声了解度 / Speech Intelligibility
キーワード(3)(和/英) ステレオ符号化 / Stereo coding
キーワード(4)(和/英) ジョイントステレオ / Joint stereo
キーワード(5)(和/英) パラメトリックステレオ / Parametric stereo
第 1 著者 氏名(和/英) 小林 洋介 / Yosuke Kobayashi
第 1 著者 所属(和/英) 山形大学大学院理工学研究科
Graduate School of Science and Engineering, Yamagata University
第 2 著者 氏名(和/英) 近藤 和弘 / Kazuhiro Kondo
第 2 著者 所属(和/英) 山形大学大学院理工学研究科
Graduate School of Science and Engineering, Yamagata University
第 3 著者 氏名(和/英) 中川 清司 / Kiyoshi Nakagawa
第 3 著者 所属(和/英) 山形大学大学院理工学研究科
Graduate School of Science and Engineering, Yamagata University
発表年月日 2010-06-10
資料番号 EA2010-23
巻番号(vol) vol.110
号番号(no) 71
ページ範囲 pp.-
ページ数 6
発行日