講演名 2010-07-09
CQ2010-36 通話サービスにおける話者識別精度定量化手法の提案(一般,映像配信・コミュニケーションを支える品質技術,一般)
恵木 則次, 林 孝典, 高橋 玲,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本稿では,広帯域音声の品質要因の一つとして話者の声質再現に着目し,通話環境の違いによる話者識別精度の変動を定量化する手法を提案する.通話サービスにおいて評価者が話者の声質の違いを捉えることができるかという点に焦点を置き,話者識別精度を定量化するために,以下の要求条件を考慮した.具体的には,1)時間経過による評価者の話者識別精度変動を軽減する,2)多数の話者を用いた試験が可能である,3)声質以外の要因(話速やアクセントなど)が話者識別精度に与える影響を軽減する,4)通話サービスにて音声処理が施される前の話者識別精度を考慮する.の4点とした.次に,提案した定量化手法を用いて低域および高域の再生周波数帯域制限が人間の話者識別精度に与える影響を定量化した.結果から,高域周波数帯域については7kHz以下の帯域制限が,低周波数帯域については100Hz以上の帯域制限が,それぞれ話者識別精度の低下につながることを示した.
抄録(英) We propose a method for quantizing speaker identification accuracy for speech communication services. We focused on a voice quality of speech as one of the quality factors of wideband speech and considered the following four points; 1) reducing fluctuation in speaker identification accuracy over time, 2) using many speakers in a speaker identification test, 3) reducing the effects of factors unrelated to the voice quality, 4) considering speaker identification accuracy for speech that is not executed speech processing in communication service. Finally, we quantized the effects of low/high bandwidth limiting on speaker identification accuracy using our method. The results show that limiting high bandwidth to less than 7 kHz and limiting low bandwidth to more than 100 Hz degrades speaker identification accuracy.
キーワード(和) 話者識別 / 帯域制限 / 広帯域音声
キーワード(英) Speaker identification / Bandwidth limiting / Wideband speech
資料番号 CQ2010-36
発行日

研究会情報
研究会 CQ
開催期間 2010/7/1(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Communication Quality (CQ)
本文の言語 JPN
タイトル(和) CQ2010-36 通話サービスにおける話者識別精度定量化手法の提案(一般,映像配信・コミュニケーションを支える品質技術,一般)
サブタイトル(和)
タイトル(英) CQ2010-36 The proposal for quantization method of speaker identification accuracy for speech communication service
サブタイトル(和)
キーワード(1)(和/英) 話者識別 / Speaker identification
キーワード(2)(和/英) 帯域制限 / Bandwidth limiting
キーワード(3)(和/英) 広帯域音声 / Wideband speech
第 1 著者 氏名(和/英) 恵木 則次 / Noritsugu EGI
第 1 著者 所属(和/英) 日本電信電話株式会社NTTサービスインテグレーション基盤研究所
NTT Service Integration Laboratories, NTT Corporation
第 2 著者 氏名(和/英) 林 孝典 / Takanori HAYASHI
第 2 著者 所属(和/英) 日本電信電話株式会社NTTサービスインテグレーション基盤研究所
NTT Service Integration Laboratories, NTT Corporation
第 3 著者 氏名(和/英) 高橋 玲 / Akira TAKAHASHI
第 3 著者 所属(和/英) 日本電信電話株式会社NTTサービスインテグレーション基盤研究所
NTT Service Integration Laboratories, NTT Corporation
発表年月日 2010-07-09
資料番号 CQ2010-36
巻番号(vol) vol.110
号番号(no) 118
ページ範囲 pp.-
ページ数 4
発行日