講演抄録/キーワード |
講演名 |
2013-09-19 11:15
局所区間のマルチモーダル情報を用いたユーザ状態の推定に関する検討 ○千葉祐弥(東北大)・伊藤 仁(東北工大)・伊藤彰則(東北大) SP2013-69 |
抄録 |
(和) |
従来の音声対話システムの研究では,ユーザ発話の音声認識結果を処理することによって応答を決定するという対話システムの性質上,言語的情報の処理に重点が置かれることが多かった.しかしながら,実環境下においては,そもそも入力が観測できないという状況が度々起こるため,言語的情報のみに依存した対話制御では不十分である.このような状況でユーザに対して適切な応答を行うためには,従来の音声対話システムでは無視されていた「発話を行う前のユーザ状態」を考慮する必要がある.我々は,発話前のユーザ状態を 2 種類定義し,その推定手法について研究を行ってきた.ここまでの分析結果から,マルチモーダルな情報を用いることで対象とするユーザの状態をある程度推定できることが示唆されている.この結果を踏まえ,本報告では動画像と音声から得られる情報を統合し,ユーザの状態を推定する手法について検討を行う.ここでは,新たにマルチモーダルな特徴系列をクラスタリングして Bag-of-Words 的に扱う方法を提案する.提案手法では,2 つのユーザ状態を 70% 以上の精度で識別できることが確認できた. |
(英) |
Most conventional researches of spoken dialog system have focused on natural language processing because the dialog system decide the response by processing the speech recognition result of the user's utterance. However, the user sometimes upset by the system's interface and cannot make any input utterance under the actual environment. The system should consider the user's state before his/her input utterance ignored by conventional researches to help these users appropriately. To solve this problem, we have decided the two user's states and studied the method to estimate them. The previous experimental analysis of human evaluation suggested these user's internal states can be estimated by observing some user's non-verbal behavior. From this results, we proposed the estimation method by using multi-modal features in this report. The proposed method clusters the feature sequences and uses them as Bag-of-Words. We confirmed the proposed method obtains over 70.0 % accuracy. |
キーワード |
(和) |
音声対話システム / マルチモーダル情報処理 / ユーザモデル / / / / / |
(英) |
spoken dialog system / multi-modal information processing / user modeling / / / / / |
文献情報 |
信学技報, vol. 113, no. 220, SP2013-69, pp. 27-32, 2013年9月. |
資料番号 |
SP2013-69 |
発行日 |
2013-09-11 (SP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
SP2013-69 |
研究会情報 |
研究会 |
SP JSAI-SLUD |
開催期間 |
2013-09-18 - 2013-09-19 |
開催地(和) |
千葉大学 |
開催地(英) |
Chiba Univ. |
テーマ(和) |
音声・言語・対話,一般 |
テーマ(英) |
|
講演論文情報の詳細 |
申込み研究会 |
SP |
会議コード |
2013-09-SP-SLUD |
本文の言語 |
日本語 |
タイトル(和) |
局所区間のマルチモーダル情報を用いたユーザ状態の推定に関する検討 |
サブタイトル(和) |
|
タイトル(英) |
A study of the user's state's estimation by using multi-modal information of the local segment |
サブタイトル(英) |
|
キーワード(1)(和/英) |
音声対話システム / spoken dialog system |
キーワード(2)(和/英) |
マルチモーダル情報処理 / multi-modal information processing |
キーワード(3)(和/英) |
ユーザモデル / user modeling |
キーワード(4)(和/英) |
/ |
キーワード(5)(和/英) |
/ |
キーワード(6)(和/英) |
/ |
キーワード(7)(和/英) |
/ |
キーワード(8)(和/英) |
/ |
第1著者 氏名(和/英/ヨミ) |
千葉 祐弥 / Yuya Chiba / チバ ユウヤ |
第1著者 所属(和/英) |
東北大学 (略称: 東北大)
Tohoku University (略称: Tohoku Univ.) |
第2著者 氏名(和/英/ヨミ) |
伊藤 仁 / Masashi Ito / イトウ マサシ |
第2著者 所属(和/英) |
東北工業大学 (略称: 東北工大)
Tohoku Institute of Technology (略称: Tohoku Inst. of Tech.) |
第3著者 氏名(和/英/ヨミ) |
伊藤 彰則 / Akinori Ito / イトウ アキノリ |
第3著者 所属(和/英) |
東北大学 (略称: 東北大)
Tohoku University (略称: Tohoku Univ.) |
第4著者 氏名(和/英/ヨミ) |
/ / |
第4著者 所属(和/英) |
(略称: )
(略称: ) |
第5著者 氏名(和/英/ヨミ) |
/ / |
第5著者 所属(和/英) |
(略称: )
(略称: ) |
第6著者 氏名(和/英/ヨミ) |
/ / |
第6著者 所属(和/英) |
(略称: )
(略称: ) |
第7著者 氏名(和/英/ヨミ) |
/ / |
第7著者 所属(和/英) |
(略称: )
(略称: ) |
第8著者 氏名(和/英/ヨミ) |
/ / |
第8著者 所属(和/英) |
(略称: )
(略称: ) |
第9著者 氏名(和/英/ヨミ) |
/ / |
第9著者 所属(和/英) |
(略称: )
(略称: ) |
第10著者 氏名(和/英/ヨミ) |
/ / |
第10著者 所属(和/英) |
(略称: )
(略称: ) |
第11著者 氏名(和/英/ヨミ) |
/ / |
第11著者 所属(和/英) |
(略称: )
(略称: ) |
第12著者 氏名(和/英/ヨミ) |
/ / |
第12著者 所属(和/英) |
(略称: )
(略称: ) |
第13著者 氏名(和/英/ヨミ) |
/ / |
第13著者 所属(和/英) |
(略称: )
(略称: ) |
第14著者 氏名(和/英/ヨミ) |
/ / |
第14著者 所属(和/英) |
(略称: )
(略称: ) |
第15著者 氏名(和/英/ヨミ) |
/ / |
第15著者 所属(和/英) |
(略称: )
(略称: ) |
第16著者 氏名(和/英/ヨミ) |
/ / |
第16著者 所属(和/英) |
(略称: )
(略称: ) |
第17著者 氏名(和/英/ヨミ) |
/ / |
第17著者 所属(和/英) |
(略称: )
(略称: ) |
第18著者 氏名(和/英/ヨミ) |
/ / |
第18著者 所属(和/英) |
(略称: )
(略称: ) |
第19著者 氏名(和/英/ヨミ) |
/ / |
第19著者 所属(和/英) |
(略称: )
(略称: ) |
第20著者 氏名(和/英/ヨミ) |
/ / |
第20著者 所属(和/英) |
(略称: )
(略称: ) |
講演者 |
第1著者 |
発表日時 |
2013-09-19 11:15:00 |
発表時間 |
25分 |
申込先研究会 |
SP |
資料番号 |
SP2013-69 |
巻番号(vol) |
vol.113 |
号番号(no) |
no.220 |
ページ範囲 |
pp.27-32 |
ページ数 |
6 |
発行日 |
2013-09-11 (SP) |