講演抄録/キーワード |
講演名 |
2018-10-25 15:40
[チュートリアル講演]ユーザーフレンドリーな機器操作向け音声インターフェースの開発とその応用 ○早坂 昇(阪電通大) SIS2018-15 |
抄録 |
(和) |
スマートスピーカーやスマートフォンにおける音声認識は,ネットワーク接続が必要となり,データ通信量が増大することやネットワークに関する知識が要求されることなどユーザーへの負担が大きい.また,高い認識性能を実現するためには,莫大なコストが要求され,新規参入の障壁となっている.それらの問題に対処するため,筆者は単語単位の音響モデルによる機器操作向け音声インターフェースを開発した.本インターフェースでは,スタンドアロン型で実現することでネットワークに関する負担を軽減し,正面顔検出を併用することによりユーザビリティを大幅に改善した.さらに,本インターフェースの利用場面を考慮し,劣悪な雑音環境でも高い認識性能を実現するため,特徴量正規化,マルチコンディション学習を導入した.本稿では,開発したインターフェースの流れを詳細に説明し,雑音ロバスト処理に関する実環境を想定した認識実験結果を示し,最後に本インターフェースの応用例である音声操作電動ベッドについて紹介する. |
(英) |
A speech recognition framework in smart speakers and smart phones require a network connection, which increases the burden on the user, such as an increase in the amount of data communication and knowledge of the network. Also, in order to realize high recognition accuracy, it is necessary to properly construct acoustic models and language models. However, they require a huge cost and hamper new entry. In order to deal with these problems, I have developed a voice user interface for device operation with a standalone word recognition method. This interface reduces the burden on the network by implementing it as a standalone type, and greatly improves usability by frontal face detection. Furthermore, in consideration of the application scene of this interface, feature normalization and multi-condition training were introduced in order to realize high recognition performance in noisy environments. In this paper, we describe the flow of the developed interface in detail, show the experiment results under noisy environments, and finally introduce the adjustable bed with this voice user interface. |
キーワード |
(和) |
孤立単語音声認識 / 機器操作向け音声インターフェース / / / / / / |
(英) |
Isolated word recognition / Voice user interface for device operation / / / / / / |
文献情報 |
信学技報, vol. 118, no. 264, SIS2018-15, pp. 57-62, 2018年10月. |
資料番号 |
SIS2018-15 |
発行日 |
2018-10-18 (SIS) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
SIS2018-15 |
研究会情報 |
研究会 |
SIS ITE-BCT |
開催期間 |
2018-10-25 - 2018-10-26 |
開催地(和) |
京都大学 百周年時計台記念館 |
開催地(英) |
Kyoto University Clock Tower Centennial Hall |
テーマ(和) |
システム実現技術, 近距離通信応用システム, 知的マルチメディア処理システム,放送技術および一般 |
テーマ(英) |
System Implementation Technology, Short Range Wireless Systems, Smart Multimedia Systems, Broadcasting Technology, etc. |
講演論文情報の詳細 |
申込み研究会 |
SIS |
会議コード |
2018-10-SIS-BCT |
本文の言語 |
日本語 |
タイトル(和) |
ユーザーフレンドリーな機器操作向け音声インターフェースの開発とその応用 |
サブタイトル(和) |
|
タイトル(英) |
Development and Application of Voice User Interface for Device Operation with High Usability |
サブタイトル(英) |
|
キーワード(1)(和/英) |
孤立単語音声認識 / Isolated word recognition |
キーワード(2)(和/英) |
機器操作向け音声インターフェース / Voice user interface for device operation |
キーワード(3)(和/英) |
/ |
キーワード(4)(和/英) |
/ |
キーワード(5)(和/英) |
/ |
キーワード(6)(和/英) |
/ |
キーワード(7)(和/英) |
/ |
キーワード(8)(和/英) |
/ |
第1著者 氏名(和/英/ヨミ) |
早坂 昇 / Noboru Hayasaka / ハヤサカ ノボル |
第1著者 所属(和/英) |
大阪電気通信大学 (略称: 阪電通大)
Osaka Electro-Communication University (略称: OECU) |
第2著者 氏名(和/英/ヨミ) |
/ / |
第2著者 所属(和/英) |
(略称: )
(略称: ) |
第3著者 氏名(和/英/ヨミ) |
/ / |
第3著者 所属(和/英) |
(略称: )
(略称: ) |
第4著者 氏名(和/英/ヨミ) |
/ / |
第4著者 所属(和/英) |
(略称: )
(略称: ) |
第5著者 氏名(和/英/ヨミ) |
/ / |
第5著者 所属(和/英) |
(略称: )
(略称: ) |
第6著者 氏名(和/英/ヨミ) |
/ / |
第6著者 所属(和/英) |
(略称: )
(略称: ) |
第7著者 氏名(和/英/ヨミ) |
/ / |
第7著者 所属(和/英) |
(略称: )
(略称: ) |
第8著者 氏名(和/英/ヨミ) |
/ / |
第8著者 所属(和/英) |
(略称: )
(略称: ) |
第9著者 氏名(和/英/ヨミ) |
/ / |
第9著者 所属(和/英) |
(略称: )
(略称: ) |
第10著者 氏名(和/英/ヨミ) |
/ / |
第10著者 所属(和/英) |
(略称: )
(略称: ) |
第11著者 氏名(和/英/ヨミ) |
/ / |
第11著者 所属(和/英) |
(略称: )
(略称: ) |
第12著者 氏名(和/英/ヨミ) |
/ / |
第12著者 所属(和/英) |
(略称: )
(略称: ) |
第13著者 氏名(和/英/ヨミ) |
/ / |
第13著者 所属(和/英) |
(略称: )
(略称: ) |
第14著者 氏名(和/英/ヨミ) |
/ / |
第14著者 所属(和/英) |
(略称: )
(略称: ) |
第15著者 氏名(和/英/ヨミ) |
/ / |
第15著者 所属(和/英) |
(略称: )
(略称: ) |
第16著者 氏名(和/英/ヨミ) |
/ / |
第16著者 所属(和/英) |
(略称: )
(略称: ) |
第17著者 氏名(和/英/ヨミ) |
/ / |
第17著者 所属(和/英) |
(略称: )
(略称: ) |
第18著者 氏名(和/英/ヨミ) |
/ / |
第18著者 所属(和/英) |
(略称: )
(略称: ) |
第19著者 氏名(和/英/ヨミ) |
/ / |
第19著者 所属(和/英) |
(略称: )
(略称: ) |
第20著者 氏名(和/英/ヨミ) |
/ / |
第20著者 所属(和/英) |
(略称: )
(略称: ) |
講演者 |
第1著者 |
発表日時 |
2018-10-25 15:40:00 |
発表時間 |
40分 |
申込先研究会 |
SIS |
資料番号 |
SIS2018-15 |
巻番号(vol) |
vol.118 |
号番号(no) |
no.264 |
ページ範囲 |
pp.57-62 |
ページ数 |
6 |
発行日 |
2018-10-18 (SIS) |
|