講演抄録/キーワード |
講演名 |
2021-06-18 17:10
[招待講演]アンドロイドERICAの音声対話システム ~ マルチモーダルチューリングテストへの挑戦 ~ ○井上昂治(京大) SP2021-7 |
抄録 |
(和) |
人間のように会話ができる機械(ロボット)の実現は人工知能研究の大きな目標の一つである.深層学習の登場により音声言語処理技術が格段に進歩し,音声対話システムが様々な場面で実用化され,日常的なものになりつつある.ただし,現状のシステムでは一問一答の機械的かつ簡単なやりとりがほとんどであり,「人間レベルの深い会話」を実現しているとは言い難い.本講演では,自律型アンドロイドERICAの研究において,これまでに構築してきた音声対話システムについて紹介する.本研究における究極の目標は,人間と遜色のない音声対話を実現することである.はじめに、人間レベルの対話を実現するための要素技術として、相槌やターンテイキングなどの予測モデルについて紹介する.次に,具体的な対話タスクとして傾聴,就職面接,研究室紹介を挙げ,これらの音声対話システムの実装や対話実験について述べる.特に傾聴では,人間による傾聴(Wizard-of-Oz)との比較(マルチモーダルチューリングテスト)を実施した.その結果,人間と同等のレベルを達成できた点や現状では人間に及ばない点が明らかになった.最後に,これまでの取り組みから得られた課題を振り返りつつ,今後の音声対話システムの研究開発が目指すべき点について提案する. |
(英) |
One of the major goals for artificial intelligence research is to realize machines (or robots) that can talk like human beings. Applying deep learning to spoken language processing has advanced its technology dramatically, with spoken dialogue systems being put to practical use in various situations and becoming more commonplace. However, since current dialogue systems are still rather mechanical and simple such as question and answering, it is hard to say that the systems have achieved "human-level deep conversation". In this talk, I introduce a research project involving autonomous android ERICA and its spoken dialogue system. The ultimate goal of this research project is to realize spoken dialogue comparable to that done by human beings. Firstly, I explain basic prediction models of backchannels and turn-taking to improve human-level dialogue. Then I describe the implementation and dialogue experiments for three specific spoken dialogue tasks: attentive listening, job interview, and laboratory guide. For attentive listening, a multimodal Turing test was conducted to compare the system with human listeners (Wizard-of-Oz). The results showed that the system achieved the same level of performance as humans in some basic aspects of attentive listening but currently is not at the level of deeper conversation. Finally, reviewing the challenges found in this project, future directions for research on spoken dialogue systems are proposed. |
キーワード |
(和) |
音声対話システム / アンドロイド / チューリングテスト / / / / / |
(英) |
Spoken dialogue system / Android / Turing test / / / / / |
文献情報 |
信学技報, vol. 121, no. 66, SP2021-7, pp. 37-37, 2021年6月. |
資料番号 |
SP2021-7 |
発行日 |
2021-06-11 (SP) |
ISSN |
Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
SP2021-7 |