講演抄録/キーワード |
講演名 |
2019-03-15 13:30
[ポスター講演]小規模デバイス向け日本語キーワード検出と検出キーワードを用いた話者識別方法の提案 ○藤村浩司(東芝) EA2018-157 SIP2018-163 SP2018-119 |
抄録 |
(和) |
本報告では,家電やスマートスピーカ上の小規模デバイスで動作するキーワード検出と検出キーワードを用いた話者識別方法を提案する.近年では家電などの小規模デバイス上で,音声キーワードにより機器に指示を行うアプリケーションが増加している.例えば,エアコンに向かって「エアコンつけて」と発話し,音声での操作を行うものなどがある.このとき,このキーワード発声の音声を使って登録話者の識別をし,話者に応じた対応ができると,ユーザに様々な利益をもたらすことができる.エアコンの場合,あらかじめ設定してある発話者好みの温度に設定するなどである.しかし,多くの話者識別手法は発話区間2s以上がターゲットであり,あらかじめデータが用意されていない短いキーワード音声に対する話者識別はあまり検討されていない.また,現状では音声キーワードの検出,認識は低リソースの組み込みチップ上に搭載されることが多く,あまり大きな計算量を割くことができない.そこで,今回,短いキーワード発話に対して,演算量の少ない,音声キーワード検出と話者識別方式を提案し,従来手法であるi-vectorとの性能比較を行う.その結果,10キーワードに対する50名の話者識別で74.8%から88.9%に性能が向上した. |
(英) |
We propose a novel method of simultaneous keyword detection and speaker recognition for low resource devices in this study. Some applications controlled by voice commands for home appliances and smart speakers increase gradually. For example, an air conditioner turns on when you say "Turn on air-con" to the air conditioner. If a speaker is specified from the voice command, the range of the application will increase. It can adjust the setting of temperature to the speaker after the air conditioner turns on. However, much calculation cost is not allowed for devices of home appliances. Furthermore, a target of many speaker recognition methods is for utterances that have more than 2 seconds. Therefore, we propose a low-cost method of simultaneous keyword detection and speaker recognition for short keyword-voices without keyword-voice database for training. We compared the proposed method with the i-vector method. The result when using a conventional i-vector method is 74.2% for 10 keywords that uttered by 50 speakers. In contrast, the result by the proposed method is 88.9%. |
キーワード |
(和) |
キーワード検出 / 小計算量 / 話者識別 / / / / / |
(英) |
keyword detection / low resource / speaker identification / speaker recognition / / / / |
文献情報 |
信学技報, vol. 118, no. 497, SP2018-119, pp. 341-346, 2019年3月. |
資料番号 |
SP2018-119 |
発行日 |
2019-03-07 (EA, SIP, SP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
EA2018-157 SIP2018-163 SP2018-119 |
研究会情報 |
研究会 |
EA SIP SP |
開催期間 |
2019-03-14 - 2019-03-15 |
開催地(和) |
アイランド ナガサキ(長崎市) |
開催地(英) |
i+Land nagasaki (Nagasaki-shi) |
テーマ(和) |
応用/電気音響,信号処理,音声,一般 |
テーマ(英) |
Engineering/Electro Acoustics, Signal Processing, Speech, and Related Topics |
講演論文情報の詳細 |
申込み研究会 |
SP |
会議コード |
2019-03-EA-SIP-SP |
本文の言語 |
日本語 |
タイトル(和) |
小規模デバイス向け日本語キーワード検出と検出キーワードを用いた話者識別方法の提案 |
サブタイトル(和) |
|
タイトル(英) |
Simultaneous Japanese Flexible-Keyword Detection and Speaker Recognition for Low-Resource Devices |
サブタイトル(英) |
|
キーワード(1)(和/英) |
キーワード検出 / keyword detection |
キーワード(2)(和/英) |
小計算量 / low resource |
キーワード(3)(和/英) |
話者識別 / speaker identification |
キーワード(4)(和/英) |
/ speaker recognition |
キーワード(5)(和/英) |
/ |
キーワード(6)(和/英) |
/ |
キーワード(7)(和/英) |
/ |
キーワード(8)(和/英) |
/ |
第1著者 氏名(和/英/ヨミ) |
藤村 浩司 / Hiroshi Fujimura / フジムラ ヒロシ |
第1著者 所属(和/英) |
株式会社 東芝 (略称: 東芝)
TOSHIBA (略称: TOSHIBA) |
第2著者 氏名(和/英/ヨミ) |
/ / |
第2著者 所属(和/英) |
(略称: )
(略称: ) |
第3著者 氏名(和/英/ヨミ) |
/ / |
第3著者 所属(和/英) |
(略称: )
(略称: ) |
第4著者 氏名(和/英/ヨミ) |
/ / |
第4著者 所属(和/英) |
(略称: )
(略称: ) |
第5著者 氏名(和/英/ヨミ) |
/ / |
第5著者 所属(和/英) |
(略称: )
(略称: ) |
第6著者 氏名(和/英/ヨミ) |
/ / |
第6著者 所属(和/英) |
(略称: )
(略称: ) |
第7著者 氏名(和/英/ヨミ) |
/ / |
第7著者 所属(和/英) |
(略称: )
(略称: ) |
第8著者 氏名(和/英/ヨミ) |
/ / |
第8著者 所属(和/英) |
(略称: )
(略称: ) |
第9著者 氏名(和/英/ヨミ) |
/ / |
第9著者 所属(和/英) |
(略称: )
(略称: ) |
第10著者 氏名(和/英/ヨミ) |
/ / |
第10著者 所属(和/英) |
(略称: )
(略称: ) |
第11著者 氏名(和/英/ヨミ) |
/ / |
第11著者 所属(和/英) |
(略称: )
(略称: ) |
第12著者 氏名(和/英/ヨミ) |
/ / |
第12著者 所属(和/英) |
(略称: )
(略称: ) |
第13著者 氏名(和/英/ヨミ) |
/ / |
第13著者 所属(和/英) |
(略称: )
(略称: ) |
第14著者 氏名(和/英/ヨミ) |
/ / |
第14著者 所属(和/英) |
(略称: )
(略称: ) |
第15著者 氏名(和/英/ヨミ) |
/ / |
第15著者 所属(和/英) |
(略称: )
(略称: ) |
第16著者 氏名(和/英/ヨミ) |
/ / |
第16著者 所属(和/英) |
(略称: )
(略称: ) |
第17著者 氏名(和/英/ヨミ) |
/ / |
第17著者 所属(和/英) |
(略称: )
(略称: ) |
第18著者 氏名(和/英/ヨミ) |
/ / |
第18著者 所属(和/英) |
(略称: )
(略称: ) |
第19著者 氏名(和/英/ヨミ) |
/ / |
第19著者 所属(和/英) |
(略称: )
(略称: ) |
第20著者 氏名(和/英/ヨミ) |
/ / |
第20著者 所属(和/英) |
(略称: )
(略称: ) |
講演者 |
第1著者 |
発表日時 |
2019-03-15 13:30:00 |
発表時間 |
90分 |
申込先研究会 |
SP |
資料番号 |
EA2018-157, SIP2018-163, SP2018-119 |
巻番号(vol) |
vol.118 |
号番号(no) |
no.495(EA), no.496(SIP), no.497(SP) |
ページ範囲 |
pp.341-346 |
ページ数 |
6 |
発行日 |
2019-03-07 (EA, SIP, SP) |
|