講演名 2016-11-18
主観・客観評価値を用いたスピーチマスキングシステムの品質推定
小林 洋介(室蘭工大), 近藤 和弘(山形大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) スピーチプライバシー保護のために,本人の音声から合成した聴取妨害音(マスカー)は妨害効果が高いことが示されている。本研究では,以前提案した少数の取得音声サンプルから効率よくマスカーを合成するBoot strap(BS)型マスカー及び単純加算によるAdditional(AD)型マスカーの違いを音声了解度と聴き取りにくさ及びわずらわしさの印象について主観評価を行なった。その結果BS型が4 dB程度他のマスカーよりもスピーチプライバシー保護効果が高かった。さらに,その評価音源をLPCケプストラム距離による客観評価を行うことで,本人の音声から合成したBS型やAD型のマスカーであれば,性能予測がある程度可能であることが明らかとなった。
抄録(英) Currently, speech masking systems make use of pre-recorded speech signals to generate maskers. Our previous report, we proposed masker using the bootstrap method in machine learning techniques from a small amount of speech samples. In this paper, we compared subjective quality on the bootstrap type masker (BS), the addition type masker (AD) and speech-like noise maskers using the speech intelligibility, the listening difficulty and the annoyance. Speech intelligibility of BS masker was found to be significantly higher than others, especially at the Target to Masker Ratio (TMR) of more 4 dB. Next, we computed the objective quality assessment using the LPC cepstrum distance. As a result, BS and AD type masker have different values even the same TMR performance estimation for the masker generator.
キーワード(和) スピーチプライバシー / マスカー / 聴き取りにくさ / わずらわしさ / 了解度 / LPCケプストラム距離
キーワード(英) speech privacy / masker / listening difficulty / annoyance / intelligibility / LPC cepstrum distance
資料番号 EA2016-59,EMM2016-65
発行日 2016-11-10 (EA, EMM)

研究会情報
研究会 EA / EMM
開催期間 2016/11/17(から2日開催)
開催地(和) コンパルホール (大分)
開催地(英) Compal Hall (Oita)
テーマ(和) 異種メディア融合,コンテンツ処理,メディア検索,電子透かし,一般
テーマ(英) Multimedia Fusion, Content Processing, Multimedia Retrieval, Digital Watermarking, and Related Topics
委員長氏名(和) 水町 光徳(九工大) / 伊藤 彰則(東北大)
委員長氏名(英) Mitsunori Mizumachi(Kyushu Inst. of Tech.) / Akinori Ito(Tohoku Univ.)
副委員長氏名(和) 羽田 陽一(電通大) / 島内 末廣(NTT) / 川村 正樹(山口大) / 日置 尋久(京大)
副委員長氏名(英) Yoichi Haneda(Univ. of Electro-Comm.) / Suehiro Shimauchi(NTT) / Masaki Kawamura(Yamaguchi Univ.) / Hirohisa Hioki(Kyoto Univ.)
幹事氏名(和) 堀内 俊治(KDDI研) / 渡邉 貫治(秋田県立大) / 薗田 光太郎(長崎大) / 岩田 基(阪府大)
幹事氏名(英) Toshiharu Horiuchi(KDDI R&D Labs.) / Kanji Watanabe(Akita Pref. Univ.) / Kotaro Sonoda(Nagasaki Univ.) / Motoi Iwata(Osaka Pref. Univ.)
幹事補佐氏名(和) 武岡 成人(静岡理工科大) / TREVINO Jorge(東北大) / 生源寺 類(静岡大) / 藤吉 正明(首都大東京)
幹事補佐氏名(英) Shigeto Takeoka(Shizuoka Inst. of Science and Tech.) / TREVINO Jorge(Tohoku Univ.) / Rui Shogenji(Shizuoka Univ.) / Masaaki Fujiyoshi(Tokyo Metropolitan Univ.)

講演論文情報詳細
申込み研究会 Technical Committee on Engineering Acoustics / Technical Committee on Enriched MultiMedia
本文の言語 JPN
タイトル(和) 主観・客観評価値を用いたスピーチマスキングシステムの品質推定
サブタイトル(和)
タイトル(英) Quality estimation of speech masking system using subjective and objective evaluation scores.
サブタイトル(和)
キーワード(1)(和/英) スピーチプライバシー / speech privacy
キーワード(2)(和/英) マスカー / masker
キーワード(3)(和/英) 聴き取りにくさ / listening difficulty
キーワード(4)(和/英) わずらわしさ / annoyance
キーワード(5)(和/英) 了解度 / intelligibility
キーワード(6)(和/英) LPCケプストラム距離 / LPC cepstrum distance
第 1 著者 氏名(和/英) 小林 洋介 / Yosuke Kobayashi
第 1 著者 所属(和/英) 室蘭工業大学(略称:室蘭工大)
Muroran Institute of Technology(略称:Muroran Inst. of Tech.)
第 2 著者 氏名(和/英) 近藤 和弘 / Kazuhiro Kondo
第 2 著者 所属(和/英) 山形大学(略称:山形大)
Yamagata University(略称:Yamagata Univ.)
発表年月日 2016-11-18
資料番号 EA2016-59,EMM2016-65
巻番号(vol) vol.116
号番号(no) EA-302,EMM-303
ページ範囲 pp.67-72(EA), pp.67-72(EMM),
ページ数 6
発行日 2016-11-10 (EA, EMM)