講演名 | 2017-03-02 [ポスター講演]DNN特徴量抽出器とテンプレートマッチングによるハードウェア音声センサーの検討 劉 溢(東工大), 銭 博宇(東工大), 王 健(東工大), 篠崎 隆宏(東工大), |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | 環境中にユビキタスに配置された音声センサーにより高精度なキーワード検出や話者認識、環境音認識などが可能になれば、単独での動作やセンサーネットワークとの連携などにより、これまでにない様々なアプリケーションが可能になると期待される。キーワード検出や話者認識を行おうとする場合、ユーザーがいつでも容易にキーワードや話者を登録できることが望まれる。しかし、音声センサー上のハードウエアはごく限られるため、計算量の大きな学習を行うことは不可能である。また同時に、音声センサーは耐雑音性や低消費電力性にも優れる必要がある。そこで、あらかじめ学習した耐雑音性に優れるDNN特徴量抽出器と、テンプレートマッチングによるキーワード検出や話者認識を組み合わせる方法について検討を行う。 |
抄録(英) | We explore the possibility of combination of a DNN-based feature extractor and template based matching for keyword detection and speaker recognition embedded in a low power consumption speech sensor. For this task, we can train DNN using a high-performance computer using a large amount of data as we want. However, once it is integrated in the speech sensor hardware, the detection must be performed on an extremely resource-limited condition, and the re-training of the network is prohibited. Therefore, we investigate the use of fixed pre-trained feature extraction DNN and a template-based pattern matching. We evaluate this approach using the CSJ database and FPGA-based implementation. |
キーワード(和) | DNN特徴量抽出器 / 音声センサー / テンプレートマッチング / キーワード検出 / 話者認識 |
キーワード(英) | DNN feature extractor / Speech sensor / Template Matching / Keyword detection / Speaker recognition |
資料番号 | EA2016-135,SIP2016-190,SP2016-130 |
発行日 | 2017-02-22 (EA, SIP, SP) |
研究会情報 | |
研究会 | SP / SIP / EA |
---|---|
開催期間 | 2017/3/1(から2日開催) |
開催地(和) | 沖縄産業支援センター |
開催地(英) | Okinawa Industry Support Center |
テーマ(和) | 音声,応用/電気音響,信号処理,一般 |
テーマ(英) | Speech, Engineering/Electro Acoustics, Signal Processing, and Related Topics |
委員長氏名(和) | 間野 一則(芝浦工大) / 中静 真(千葉工大) / 水町 光徳(九工大) |
委員長氏名(英) | Kazunori Mano(Shibaura Inst. of Tech.) / Makoto Nakashizuka(Chiba Inst. of Tech.) / Mitsunori Mizumachi(Kyushu Inst. of Tech.) |
副委員長氏名(和) | 森 大毅(宇都宮大) / 奥田 正浩(北九州市大) / 村松 正吾(新潟大) / 羽田 陽一(電通大) / 島内 末廣(NTT) |
副委員長氏名(英) | Hiroki Mori(Utsunomiya Univ.) / Masahiro Okuda(Univ. of Kitakyushu) / Shogo Muramatsu(Niigata Univ.) / Yoichi Haneda(Univ. of Electro-Comm.) / Suehiro Shimauchi(NTT) |
幹事氏名(和) | 滝口 哲也(神戸大) / 西田 昌史(静岡大) / 平林 晃(立命館大) / 宮田 高道(千葉工大) / 堀内 俊治(KDDI研) / 渡邉 貫治(秋田県立大) |
幹事氏名(英) | Tetsuya Takiguchi(Kobe Univ.) / Masafumi Nishida(Shizuoka Univ.) / Akira Hirabayashi(Ritsumeikan Univ.) / Takamichi Miyata(Chiba Inst. of Tech.) / Toshiharu Horiuchi(KDDI R&D Labs.) / Kanji Watanabe(Akita Pref. Univ.) |
幹事補佐氏名(和) | 浅見 太一(NTT) / 橋本 佳(名工大) / 渡邊 修(拓殖大) / 武岡 成人(静岡理工科大) / TREVINO Jorge(東北大) |
幹事補佐氏名(英) | Taichi Asami(NTT) / Kei Hashimoto(Nagoya Inst. of Tech.) / Osamu Watanabe(Takushoku Univ.) / Shigeto Takeoka(Shizuoka Inst. of Science and Tech.) / TREVINO Jorge(Tohoku Univ.) |
講演論文情報詳細 | |
申込み研究会 | Technical Committee on Speech / Technical Committee on Signal Processing / Technical Committee on Engineering Acoustics |
---|---|
本文の言語 | ENG-JTITLE |
タイトル(和) | [ポスター講演]DNN特徴量抽出器とテンプレートマッチングによるハードウェア音声センサーの検討 |
サブタイトル(和) | |
タイトル(英) | [Poster Presentation] Hardware Speech Sensor Based on Deep Neural Network Feature Extractor and Template Matching |
サブタイトル(和) | |
キーワード(1)(和/英) | DNN特徴量抽出器 / DNN feature extractor |
キーワード(2)(和/英) | 音声センサー / Speech sensor |
キーワード(3)(和/英) | テンプレートマッチング / Template Matching |
キーワード(4)(和/英) | キーワード検出 / Keyword detection |
キーワード(5)(和/英) | 話者認識 / Speaker recognition |
第 1 著者 氏名(和/英) | 劉 溢 / Yi Liu |
第 1 著者 所属(和/英) | 東京工業大学(略称:東工大) Tokyo Institute of Technology(略称:Titech) |
第 2 著者 氏名(和/英) | 銭 博宇 / Boyu Qian |
第 2 著者 所属(和/英) | 東京工業大学(略称:東工大) Tokyo Institute of Technology(略称:Titech) |
第 3 著者 氏名(和/英) | 王 健 / Jian Wang |
第 3 著者 所属(和/英) | 東京工業大学(略称:東工大) Tokyo Institute of Technology(略称:Titech) |
第 4 著者 氏名(和/英) | 篠崎 隆宏 / Takahiro Shinozaki |
第 4 著者 所属(和/英) | 東京工業大学(略称:東工大) Tokyo Institute of Technology(略称:Titech) |
発表年月日 | 2017-03-02 |
資料番号 | EA2016-135,SIP2016-190,SP2016-130 |
巻番号(vol) | vol.116 |
号番号(no) | EA-475,SIP-476,SP-477 |
ページ範囲 | pp.297-300(EA), pp.297-300(SIP), pp.297-300(SP), |
ページ数 | 4 |
発行日 | 2017-02-22 (EA, SIP, SP) |