高周波帯域への信号埋め込みによる対話システム発話の抑圧

佐賀 俊介; 伊藤 彰則

講演名	2020-01-27 高周波帯域への信号埋め込みによる対話システム発話の抑圧佐賀俊介(東北大), 伊藤彰則(東北大),
PDFダウンロードページ	PDFダウンロードページへ
抄録(和)	音声対話システムが一般に普及してきており，特にスマートスピーカーなどは家庭環境で使用されている． 2つ以上のスマートスピーカーが同じ環境にある場合，音声対話システムが他の対話システムの音声をユーザの音声として誤検出する問題が発生する．本論文では，音声認識器が機械によって発話された音声を認識しないように，合成音声をミュートする方法を提案する．提案法では，合成音声を再生するときに，それが機械の音声であることを示すた信号を透かしとして埋め込む．音声認識機は，観測音声に透かしが含まれている場合，収録音声を無音に変換する．透かしは高周波帯域に埋め込まれるため，透かしは人間に知覚されず，また容易に抽出できる．実験結果から，提案法は，雑音下でも頑健な抽出が可能であることがわかった．
抄録(英)	Spoken dialog systems have become popular and are used in a home environment, such as smart speakers. A problem will occur when two or more smart speakers are in the same environment, in which a dialog system misdetects the other dialog system’s voice as a user’s voice. In this paper, a method to mute synthesized speech is proposed to prevent a speech recognizer from recognizing speech uttered by a machine. The audio watermark technique is used to indicate that a machine utters the speech, and the speech recognizer attenuates the observed speech if it contains the watermark. The watermark is embedded in high frequency so that the watermark is not perceived by humans and is robustly extracted. From the experimental result, it was found that the proposed method robustly determine the existence of the watermark.
キーワード(和)	音声認識 / 音声対話システム / 電子透かし
キーワード(英)	speech recognition / spoken dialog system / audio watarmarking
資料番号	EMM2019-94
発行日	2020-01-20 (EMM)

研究会情報
研究会	EMM
開催期間	2020/1/27(から1日開催)
開催地（和）	東北大学青葉山キャンパス
開催地（英）	Tohoku Univ.
テーマ（和）	臨場感生成，ユニバーサルメディア，ディジタルエンタテインメント，一般
テーマ（英）	Sense of Presence, Universal Media, Digital Entertainment, etc.
委員長氏名（和）	川村正樹(山口大)
委員長氏名（英）	Masaki Kawamura(Yamaguchi Univ.)
副委員長氏名（和）	岩田基(阪府大) / 小嶋徹也(東京高専)
副委員長氏名（英）	Motoi Iwata(Osaka Prefecture Univ.) / Tetsuya Kojima(NIT,Tokyo College)
幹事氏名（和）	秋山寛子(長野高専) / 金田北洋(長瀬産業)
幹事氏名（英）	Hiroko Akiyama(NIT, Nagano College) / Kitahiro Kaneda(Nagase)
幹事補佐氏名（和）	稲村勝樹(東京電機大) / 河野和宏(関西大)
幹事補佐氏名（英）	Masaki Inamura(Tokyo Denki Univ.) / Kazuhiro Kono(Kansai Univ.)

講演論文情報詳細
申込み研究会	Technical Committee on Enriched MultiMedia
本文の言語	JPN
タイトル（和）	高周波帯域への信号埋め込みによる対話システム発話の抑圧
サブタイトル（和）
タイトル（英）	Suppression of Dialog System Speech by Embedding Marker Signal into High Frequency Band
サブタイトル（和）
キーワード(1)（和/英）	音声認識 / speech recognition
キーワード(2)（和/英）	音声対話システム / spoken dialog system
キーワード(3)（和/英）	電子透かし / audio watarmarking
第 1 著者氏名（和/英）	佐賀俊介 / Shunsuke Saga
第 1 著者所属（和/英）	東北大学(略称：東北大) Tohoku University(略称：Tohoku Univ.)
第 2 著者氏名（和/英）	伊藤彰則 / Akinori Ito
第 2 著者所属（和/英）	東北大学(略称：東北大) Tohoku University(略称：Tohoku Univ.)
発表年月日	2020-01-27
資料番号	EMM2019-94
巻番号（vol）	vol.119
号番号（no）	EMM-396
ページ範囲	pp.1-6(EMM),
ページ数	6
発行日	2020-01-20 (EMM)