講演名 2017-07-15
Investigation of spikegram-based signal representation for speech fingerprints
Dung Kim Tran(北陸先端大), 鵜木 祐史(北陸先端大),
PDFダウンロードページ PDFダウンロードページへ
抄録(英) This paper investigates the ability of spikegrams in representing the speech content and voice identications of speech signals that can be used for improving the quality of speech ngerprints. Although spectrogram is the most commonly used model for representing speech signals, the main drawback of this block-based coding method is that a speaker generates different speech signals for the same speech content. As a result, different spectrograms are created by frame-wise processing the speech signals, and subsequently, different ngerprints are extracted for the same speech content by the same speaker. For this reason, a representation model that can adapt to the variations of speech plays a signi cant role in achieving better accuracy and reliability of speech ngerprints. It has been reported that over-complete representation model { known as spikegram { outperforms spectrogram in representing speech signals as it is able to capture the structures of speech signals. This data-driven approach can be created by utilizing a matching pursuit algorithm and Gammatone dictionary to derive a better substitute for spectrogram.
キーワード(英) speech fingerprintspikegrammatching pursuit algorithmGammatone filterbanknon-negative metrix factorization
資料番号 ISEC2017-32,SITE2017-24,ICSS2017-31,EMM2017-35
発行日 2017-07-07 (ISEC, SITE, ICSS, EMM)

開催期間 2017/7/14(から2日開催)
開催地(和) 内田洋行東京本社ショールーム
テーマ(和) セキュリティ、一般
委員長氏名(和) 岡田 仁志(NII) / 岩村 惠市(東京理科大) / 小川 一人(NHK) / 白石 善明(神戸大)
委員長氏名(英) Hitoshi Okada(NII) / Keiichi Iwamura(TUC) / Kazuto Ogawa(NHK) / Yoshiaki Shiraishi(Kobe Univ.)
副委員長氏名(和) 森住 哲也(神奈川大) / 小川 賢(神戸学院大) / 日置 尋久(京大) / 栗林 稔(岡山大) / 藤岡 淳(神奈川大) / 盛合 志帆(NICT) / 植田 武(三菱電機) / 高倉 弘喜(NII)
副委員長氏名(英) Tetsuya Morizumi(Kanagawa Univ.) / Masaru Ogawa(Kobe Gakuin Univ.) / Hirohisa Hioki(Kyoto Univ.) / Minoru Kuribayashi(Okayama Univ.) / Atsushi Fujioka(Kanagawa Univ.) / Shiho Moriai(NICT) / Takeshi Ueda(Mitsubishi Electric) / Hiroki Takakura(NII)
幹事氏名(和) 芳賀 高洋(岐阜聖徳学園大) / 川口 嘉奈子(東京藝術大) / 生源寺 類(静岡大) / 藤吉 正明(首都大東京) / 水木 敬明(東北大) / 大東 俊博(東海大) / 吉岡 克成(横浜国大) / 神谷 和憲(NTT)
幹事氏名(英) Takahiro Haga(Gifu Shotoku Gakuen Univ.) / Kanako Kawaguchi(Tokyo Univ. of the Arts) / Rui Shogenji(Shizuoka Univ.) / Masaaki Fujiyoshi(Tokyo Metropolitan Univ.) / Takaaki Mizuki(Tohoku Univ.) / Toshihiro Ohigashi(Tokai Univ.) / Katsunari Yoshioka(Yokohama National Univ.) / Kazunori Kamiya(NTT)
幹事補佐氏名(和) 壁谷 彰慶(千葉大) / 加藤 尚徳(KDDI) / 姜 玄浩(東京高専) / 村田 晴美(中京大) / 江村 恵太(NICT) / 駒野 雄一(東芝) / 須賀 祐治(インターネットイニシアティブ) / 笠間 貴弘(NICT) / 山田 明(KDDI labs.)
幹事補佐氏名(英) Akiyoshi Kabeya(Chiba Univ.) / Hisanori Kato(KDDI) / Kan Hyonho(NIT, Tokyo) / Harumi Murata(Tyukyo Univ.) / Keita Emura(NICT) / Yuichi Komano(TOSHIBA) / Yuuji Suga(IIJ) / Takahiro Kasama(NICT) / Akira Yamada(KDDI labs.)

申込み研究会 Technical Committee on Social Implications of Technology and Information Ethics / Technical Committee on Enriched MultiMedia / Technical Committee on Information Security / Technical Committee on Information and Communication System Security / Special Interest Group on Computer Security / Special Interest Group on Security Psychology and Trust
本文の言語 ENG
タイトル(英) Investigation of spikegram-based signal representation for speech fingerprints
キーワード(1)(和/英) / speech fingerprintspikegrammatching pursuit algorithmGammatone filterbanknon-negative metrix factorization
第 1 著者 氏名(和/英) Dung Kim Tran / Dung Kim Tran
第 1 著者 所属(和/英) 北陸先端科学技術大学院大学(略称:北陸先端大)
Japan Advanced Institute of Science and Technology(略称:JAIST)
第 2 著者 氏名(和/英) 鵜木 祐史 / Masashi Unoki
第 2 著者 所属(和/英) 北陸先端科学技術大学院大学(略称:北陸先端大)
Japan Advanced Institute of Science and Technology(略称:JAIST)
発表年月日 2017-07-15
資料番号 ISEC2017-32,SITE2017-24,ICSS2017-31,EMM2017-35
巻番号(vol) vol.117
号番号(no) ISEC-125,SITE-126,ICSS-127,EMM-128
ページ範囲 pp.241-246(ISEC), pp.241-246(SITE), pp.241-246(ICSS), pp.241-246(EMM),
ページ数 6
発行日 2017-07-07 (ISEC, SITE, ICSS, EMM)