講演名 2017-03-02
[ポスター講演]DNN特徴量抽出器とテンプレートマッチングによるハードウェア音声センサーの検討
劉 溢(東工大), 銭 博宇(東工大), 王 健(東工大), 篠崎 隆宏(東工大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 環境中にユビキタスに配置された音声センサーにより高精度なキーワード検出や話者認識、環境音認識などが可能になれば、単独での動作やセンサーネットワークとの連携などにより、これまでにない様々なアプリケーションが可能になると期待される。キーワード検出や話者認識を行おうとする場合、ユーザーがいつでも容易にキーワードや話者を登録できることが望まれる。しかし、音声センサー上のハードウエアはごく限られるため、計算量の大きな学習を行うことは不可能である。また同時に、音声センサーは耐雑音性や低消費電力性にも優れる必要がある。そこで、あらかじめ学習した耐雑音性に優れるDNN特徴量抽出器と、テンプレートマッチングによるキーワード検出や話者認識を組み合わせる方法について検討を行う。
抄録(英) We explore the possibility of combination of a DNN-based feature extractor and template based matching for keyword detection and speaker recognition embedded in a low power consumption speech sensor. For this task, we can train DNN using a high-performance computer using a large amount of data as we want. However, once it is integrated in the speech sensor hardware, the detection must be performed on an extremely resource-limited condition, and the re-training of the network is prohibited. Therefore, we investigate the use of fixed pre-trained feature extraction DNN and a template-based pattern matching. We evaluate this approach using the CSJ database and FPGA-based implementation.
キーワード(和) DNN特徴量抽出器 / 音声センサー / テンプレートマッチング / キーワード検出 / 話者認識
キーワード(英) DNN feature extractor / Speech sensor / Template Matching / Keyword detection / Speaker recognition
資料番号 EA2016-135,SIP2016-190,SP2016-130
発行日 2017-02-22 (EA, SIP, SP)

研究会情報
研究会 SP / SIP / EA
開催期間 2017/3/1(から2日開催)
開催地(和) 沖縄産業支援センター
開催地(英) Okinawa Industry Support Center
テーマ(和) 音声,応用/電気音響,信号処理,一般
テーマ(英) Speech, Engineering/Electro Acoustics, Signal Processing, and Related Topics
委員長氏名(和) 間野 一則(芝浦工大) / 中静 真(千葉工大) / 水町 光徳(九工大)
委員長氏名(英) Kazunori Mano(Shibaura Inst. of Tech.) / Makoto Nakashizuka(Chiba Inst. of Tech.) / Mitsunori Mizumachi(Kyushu Inst. of Tech.)
副委員長氏名(和) 森 大毅(宇都宮大) / 奥田 正浩(北九州市大) / 村松 正吾(新潟大) / 羽田 陽一(電通大) / 島内 末廣(NTT)
副委員長氏名(英) Hiroki Mori(Utsunomiya Univ.) / Masahiro Okuda(Univ. of Kitakyushu) / Shogo Muramatsu(Niigata Univ.) / Yoichi Haneda(Univ. of Electro-Comm.) / Suehiro Shimauchi(NTT)
幹事氏名(和) 滝口 哲也(神戸大) / 西田 昌史(静岡大) / 平林 晃(立命館大) / 宮田 高道(千葉工大) / 堀内 俊治(KDDI研) / 渡邉 貫治(秋田県立大)
幹事氏名(英) Tetsuya Takiguchi(Kobe Univ.) / Masafumi Nishida(Shizuoka Univ.) / Akira Hirabayashi(Ritsumeikan Univ.) / Takamichi Miyata(Chiba Inst. of Tech.) / Toshiharu Horiuchi(KDDI R&D Labs.) / Kanji Watanabe(Akita Pref. Univ.)
幹事補佐氏名(和) 浅見 太一(NTT) / 橋本 佳(名工大) / 渡邊 修(拓殖大) / 武岡 成人(静岡理工科大) / TREVINO Jorge(東北大)
幹事補佐氏名(英) Taichi Asami(NTT) / Kei Hashimoto(Nagoya Inst. of Tech.) / Osamu Watanabe(Takushoku Univ.) / Shigeto Takeoka(Shizuoka Inst. of Science and Tech.) / TREVINO Jorge(Tohoku Univ.)

講演論文情報詳細
申込み研究会 Technical Committee on Speech / Technical Committee on Signal Processing / Technical Committee on Engineering Acoustics
本文の言語 ENG-JTITLE
タイトル(和) [ポスター講演]DNN特徴量抽出器とテンプレートマッチングによるハードウェア音声センサーの検討
サブタイトル(和)
タイトル(英) [Poster Presentation] Hardware Speech Sensor Based on Deep Neural Network Feature Extractor and Template Matching
サブタイトル(和)
キーワード(1)(和/英) DNN特徴量抽出器 / DNN feature extractor
キーワード(2)(和/英) 音声センサー / Speech sensor
キーワード(3)(和/英) テンプレートマッチング / Template Matching
キーワード(4)(和/英) キーワード検出 / Keyword detection
キーワード(5)(和/英) 話者認識 / Speaker recognition
第 1 著者 氏名(和/英) 劉 溢 / Yi Liu
第 1 著者 所属(和/英) 東京工業大学(略称:東工大)
Tokyo Institute of Technology(略称:Titech)
第 2 著者 氏名(和/英) 銭 博宇 / Boyu Qian
第 2 著者 所属(和/英) 東京工業大学(略称:東工大)
Tokyo Institute of Technology(略称:Titech)
第 3 著者 氏名(和/英) 王 健 / Jian Wang
第 3 著者 所属(和/英) 東京工業大学(略称:東工大)
Tokyo Institute of Technology(略称:Titech)
第 4 著者 氏名(和/英) 篠崎 隆宏 / Takahiro Shinozaki
第 4 著者 所属(和/英) 東京工業大学(略称:東工大)
Tokyo Institute of Technology(略称:Titech)
発表年月日 2017-03-02
資料番号 EA2016-135,SIP2016-190,SP2016-130
巻番号(vol) vol.116
号番号(no) EA-475,SIP-476,SP-477
ページ範囲 pp.297-300(EA), pp.297-300(SIP), pp.297-300(SP),
ページ数 4
発行日 2017-02-22 (EA, SIP, SP)