講演名 2015-07-17
話者照合におけるポップノイズの有効性に関する検討
仲野 詩織(首都大東京), 中西 亮介(首都大東京), 塩田 さやか(首都大東京), 貴家 仁志(首都大東京),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本稿では,人間の呼気によって無意識に発生させてしまうポップノイズが話者照合にどのような影響を与えるのかを調査し報告する.近年,生体認証のなりすまし問題が重要な問題として取り扱われている.話者照合においても合成音声やスピーカー再生によるなりすましの問題は深刻であり,抜本的な解決策が求められている.そこで,声の生体検知という入力音声が実際に人から発せられたものか再生されたものかを識別する枠組みが提案された.声の生体検知では発話内にポップノイズが含まれるか否かを検出する方法を用いている.そこで,本稿では従来雑音として除くようにされてきたポップノイズが実際に話者照合に与える影響を調査し,報告する.話者照合実験では,ポップノイズを含むデータとポップノイズを取り除いたデータを用いてそれぞれ特定話者モデルの学習を行い,EERの比較を行った.実験結果より,ポップノイズは収録する環境によって学習時にモデル精度に影響を与えるが,従来考えられてきたようなただのノイズとは異なり,ある程度の話者性を含むことがわかった.
抄録(英) This paper investigates an effectiveness of pop noise, which is unconsciously caused by human breath, for automatic speaker verification (ASV). Recently, spoofing techniques against biometric systems have also progressed drastically. Experimentation using advanced speech synthesis and voice conversion techniques has showed unacceptable false acceptance rates and several new countermeasure algorithms have been explored to detect spoofing materials accurately. However, the countermeasures proposed so far are based on the acoustic differences between natural speech signals and artificial speech signals, expected to become gradually smaller in the near future. Therefore, voice liveness detection has been proposed for ASV. The aim of voice liveness detection validates whether the presented speech signals originated from a live human. To realize this framework, pop noise detection algorithms are also proposed. This paper focuses that the pop noise, which has been treated as addictive noise, is able to affect to ASV system or not. In the ASV experiments, speaker dependent (SD) model which is estimated by speech data with pop noise is compared with SD model which is estimated by speech data without pop noise. Experimental results show that pop noise is positively affecting the model accuracy when it is recorded under an adequate recording condition.
キーワード(和) 話者照合 / ポップノイズ / UBM-GMM / 生体検知
キーワード(英) automatic speaker verification / pop noise / UBM-GMM / liveness detection
資料番号 SP2015-47
発行日 2015-07-09 (SP)

研究会情報
研究会 SP / IPSJ-SLP
開催期間 2015/7/16(から2日開催)
開催地(和) かたくら諏訪湖ホテル
開催地(英) Katakura Suwako Hotel
テーマ(和) 認識,理解,対話,一般
テーマ(英) Speech recognition and understanding, dialog system, etc.
委員長氏名(和) 間野 一則(芝浦工大) / 篠田 浩一(東工大)
委員長氏名(英) Kazunori Mano(Shibaura Inst. of Tech.) / Koichi Shinoda(Tokyo Inst. of Tech.)
副委員長氏名(和) 北岡 教英(徳島大)
副委員長氏名(英) Norihide Kitaoka(Tokushima Univ.)
幹事氏名(和) 岩野 公司(東京都市大) / 滝口 哲也(神戸大) / 李 晃伸(名工大) / 南條 浩輝(龍谷大) / 篠原 雄介(東芝)
幹事氏名(英) Koji Iwano(Tokyo City Univ.) / Tetsuya Takiguchi(Kobe Univ.) / Akinobu Lee(Nagoya Inst. of Tech.) / Hiroaki Nanjo(Ryukoku Univ.) / Yusuke Shinohara(Toshiba Corp.)
幹事補佐氏名(和) 能勢 隆(東北大) / 浅見 太一(NTT)
幹事補佐氏名(英) Takashi Nose(Tohoku Univ.) / Taichi Asami(NTT)

講演論文情報詳細
申込み研究会 Technical Committee on Speech / Special Interest Group on Spoken Language Processing
本文の言語 JPN
タイトル(和) 話者照合におけるポップノイズの有効性に関する検討
サブタイトル(和)
タイトル(英) A study on effectiveness of pop noise for speaker verification
サブタイトル(和)
キーワード(1)(和/英) 話者照合 / automatic speaker verification
キーワード(2)(和/英) ポップノイズ / pop noise
キーワード(3)(和/英) UBM-GMM / UBM-GMM
キーワード(4)(和/英) 生体検知 / liveness detection
第 1 著者 氏名(和/英) 仲野 詩織 / Shiori Nakano
第 1 著者 所属(和/英) 首都大学東京(略称:首都大東京)
Tokyo Metropolitan University(略称:Tokyo Metro Univ.)
第 2 著者 氏名(和/英) 中西 亮介 / Ryosuke Nakanishi
第 2 著者 所属(和/英) 首都大学東京(略称:首都大東京)
Tokyo Metropolitan University(略称:Tokyo Metro Univ.)
第 3 著者 氏名(和/英) 塩田 さやか / Sayaka Shiota
第 3 著者 所属(和/英) 首都大学東京(略称:首都大東京)
Tokyo Metropolitan University(略称:Tokyo Metro Univ.)
第 4 著者 氏名(和/英) 貴家 仁志 / Hitoshi Kiya
第 4 著者 所属(和/英) 首都大学東京(略称:首都大東京)
Tokyo Metropolitan University(略称:Tokyo Metro Univ.)
発表年月日 2015-07-17
資料番号 SP2015-47
巻番号(vol) vol.115
号番号(no) SP-146
ページ範囲 pp.67-72(SP),
ページ数 6
発行日 2015-07-09 (SP)