音声・画像情報の融合処理を目指して(オーガナイズドセッション)

講演名	2012-12-20 音声・画像情報の融合処理を目指して(オーガナイズドセッション) 有木康雄,
PDFダウンロードページ	PDFダウンロードページへ
抄録(和)	文書、画像、映像、音声を対象としたマルチメディアの処理研究と、視覚、聴覚といったモダリティを統合するマルチモーダル処理研究に関して、筆者の研究内容の概要を述べる。次に、複数のメディアやモダリティから得られるデータ・情報を基に、場の状況認識や人の意図認識を行う研究について述べる。最後に、音声と画像間で、同じ手法を用いることから得られる新たな処理内容についても述べる。
抄録(英)	In this paper, multimodal processing done by the author is described using and integrating vision and speech, as well as multimedia processing for documents, images, videos and speech. Next, situation or event recognition and intention recognition are described based on multiple media and modalities. Finally new processing is described by using same method between speech and image.
キーワード(和)	マルチモーダル処理 / マルチメディア処理 / 状況認識 / 意図認識
キーワード(英)	Multimodal processing / Multimedia processing / Situation recognition / Intention recognition
資料番号	SP2012-86
発行日

講演論文情報詳細
申込み研究会	Speech (SP)
本文の言語	JPN
タイトル（和）	音声・画像情報の融合処理を目指して(オーガナイズドセッション)
サブタイトル（和）
タイトル（英）	Towards Integrated Processing of Speech and Image Information
サブタイトル（和）
キーワード(1)（和/英）	マルチモーダル処理 / Multimodal processing
キーワード(2)（和/英）	マルチメディア処理 / Multimedia processing
キーワード(3)（和/英）	状況認識 / Situation recognition
キーワード(4)（和/英）	意図認識 / Intention recognition
第 1 著者氏名（和/英）	有木康雄 / Yasuo ARIKI
第 1 著者所属（和/英）	神戸大学システム情報学研究 Graduate School of System Informatics, Kobe University
発表年月日	2012-12-20
資料番号	SP2012-86
巻番号（vol）	vol.112
号番号（no）	369
ページ範囲	pp.-
ページ数	6
発行日