高周波帯域への信号埋め込みによる対話システム発話の抑圧

佐賀,俊介; 伊藤,彰則

お知らせ 2023年度・2024年度学生員会費割引キャンペーン実施中です
お知らせ技術研究報告と和文論文誌Ｃの同時投稿施策(掲載料1割引き)について
お知らせ電子情報通信学会における研究会開催について
お知らせ NEW 参加費の返金について

電子情報通信学会研究会発表申込システム
講演論文詳細

技報閲覧サービス
[ログイン]
技報アーカイブ

トップに戻る

前のページに戻る

[Japanese] / [English]

講演抄録／キーワード
講演名		2020-01-27 13:00 高周波帯域への信号埋め込みによる対話システム発話の抑圧佐賀俊介・○伊藤彰則（東北大） EMM2019-94
抄録	（和）	音声対話システムが一般に普及してきており，特にスマートスピーカーなどは家庭環境で使用されている． 2つ以上のスマートスピーカーが同じ環境にある場合，音声対話システムが他の対話システムの音声をユーザの音声として誤検出する問題が発生する．本論文では，音声認識器が機械によって発話された音声を認識しないように，合成音声をミュートする方法を提案する．提案法では，合成音声を再生するときに，それが機械の音声であることを示すた信号を透かしとして埋め込む．音声認識機は，観測音声に透かしが含まれている場合，収録音声を無音に変換する．透かしは高周波帯域に埋め込まれるため，透かしは人間に知覚されず，また容易に抽出できる．実験結果から，提案法は，雑音下でも頑健な抽出が可能であることがわかった．
	（英）	Spoken dialog systems have become popular and are used in a home environment, such as smart speakers. A problem will occur when two or more smart speakers are in the same environment, in which a dialog system misdetects the other dialog system’s voice as a user’s voice. In this paper, a method to mute synthesized speech is proposed to prevent a speech recognizer from recognizing speech uttered by a machine. The audio watermark technique is used to indicate that a machine utters the speech, and the speech recognizer attenuates the observed speech if it contains the watermark. The watermark is embedded in high frequency so that the watermark is not perceived by humans and is robustly extracted. From the experimental result, it was found that the proposed method robustly determine the existence of the watermark.
キーワード	（和）	音声認識 / 音声対話システム / 電子透かし / / / / /
	（英）	speech recognition / spoken dialog system / audio watarmarking / / / / /
文献情報		信学技報, vol. 119, no. 396, EMM2019-94, pp. 1-6, 2020年1月.
資料番号		EMM2019-94
発行日		2020-01-20 (EMM)
ISSN		Online edition: ISSN 2432-6380
著作権について		技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します．(許諾番号：10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
PDFダウンロード		EMM2019-94

研究会情報
研究会	EMM
開催期間	2020-01-27 - 2020-01-27
開催地（和）	東北大学青葉山キャンパス
開催地（英）	Tohoku Univ.
テーマ（和）	臨場感生成，ユニバーサルメディア，ディジタルエンタテインメント，一般
テーマ（英）	Sense of Presence, Universal Media, Digital Entertainment, etc.
講演論文情報の詳細
申込み研究会	EMM
会議コード	2020-01-EMM
本文の言語	日本語
タイトル（和）	高周波帯域への信号埋め込みによる対話システム発話の抑圧
サブタイトル（和）
タイトル（英）	Suppression of Dialog System Speech by Embedding Marker Signal into High Frequency Band
サブタイトル（英）
キーワード(1)（和/英）	音声認識 / speech recognition
キーワード(2)（和/英）	音声対話システム / spoken dialog system
キーワード(3)（和/英）	電子透かし / audio watarmarking
キーワード(4)（和/英）	/
キーワード(5)（和/英）	/
キーワード(6)（和/英）	/
キーワード(7)（和/英）	/
キーワード(8)（和/英）	/
第1著者氏名（和/英/ヨミ）	佐賀俊介 / Shunsuke Saga / サガシュンスケ
第1著者所属（和/英）	東北大学 (略称：東北大) Tohoku University (略称： Tohoku Univ.)
第2著者氏名（和/英/ヨミ）	伊藤彰則 / Akinori Ito /
第2著者所属（和/英）	東北大学 (略称：東北大) Tohoku University (略称： Tohoku Univ.)
第3著者氏名（和/英/ヨミ）	/ /
第3著者所属（和/英）	(略称： ) (略称： )
第4著者氏名（和/英/ヨミ）	/ /
第4著者所属（和/英）	(略称： ) (略称： )
第5著者氏名（和/英/ヨミ）	/ /
第5著者所属（和/英）	(略称： ) (略称： )
第6著者氏名（和/英/ヨミ）	/ /
第6著者所属（和/英）	(略称： ) (略称： )
第7著者氏名（和/英/ヨミ）	/ /
第7著者所属（和/英）	(略称： ) (略称： )
第8著者氏名（和/英/ヨミ）	/ /
第8著者所属（和/英）	(略称： ) (略称： )
第9著者氏名（和/英/ヨミ）	/ /
第9著者所属（和/英）	(略称： ) (略称： )
第10著者氏名（和/英/ヨミ）	/ /
第10著者所属（和/英）	(略称： ) (略称： )
第11著者氏名（和/英/ヨミ）	/ /
第11著者所属（和/英）	(略称： ) (略称： )
第12著者氏名（和/英/ヨミ）	/ /
第12著者所属（和/英）	(略称： ) (略称： )
第13著者氏名（和/英/ヨミ）	/ /
第13著者所属（和/英）	(略称： ) (略称： )
第14著者氏名（和/英/ヨミ）	/ /
第14著者所属（和/英）	(略称： ) (略称： )
第15著者氏名（和/英/ヨミ）	/ /
第15著者所属（和/英）	(略称： ) (略称： )
第16著者氏名（和/英/ヨミ）	/ /
第16著者所属（和/英）	(略称： ) (略称： )
第17著者氏名（和/英/ヨミ）	/ /
第17著者所属（和/英）	(略称： ) (略称： )
第18著者氏名（和/英/ヨミ）	/ /
第18著者所属（和/英）	(略称： ) (略称： )
第19著者氏名（和/英/ヨミ）	/ /
第19著者所属（和/英）	(略称： ) (略称： )
第20著者氏名（和/英/ヨミ）	/ /
第20著者所属（和/英）	(略称： ) (略称： )
講演者	第2著者
発表日時	2020-01-27 13:00:00
発表時間	25分
申込先研究会	EMM
資料番号	EMM2019-94
巻番号（vol）	vol.119
号番号（no）	no.396
ページ範囲	pp.1-6
ページ数	6
発行日	2020-01-20 (EMM)

[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]

IEICE / 電子情報通信学会