講演名 2012-12-20
音声・画像情報の融合処理を目指して(オーガナイズドセッション)
有木 康雄,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 文書、画像、映像、音声を対象としたマルチメディアの処理研究と、視覚、聴覚といったモダリティを統合するマルチモーダル処理研究に関して、筆者の研究内容の概要を述べる。次に、複数のメディアやモダリティから得られるデータ・情報を基に、場の状況認識や人の意図認識を行う研究について述べる。最後に、音声と画像間で、同じ手法を用いることから得られる新たな処理内容についても述べる。
抄録(英) In this paper, multimodal processing done by the author is described using and integrating vision and speech, as well as multimedia processing for documents, images, videos and speech. Next, situation or event recognition and intention recognition are described based on multiple media and modalities. Finally new processing is described by using same method between speech and image.
キーワード(和) マルチモーダル処理 / マルチメディア処理 / 状況認識 / 意図認識
キーワード(英) Multimodal processing / Multimedia processing / Situation recognition / Intention recognition
資料番号 SP2012-86
発行日

研究会情報
研究会 SP
開催期間 2012/12/13(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Speech (SP)
本文の言語 JPN
タイトル(和) 音声・画像情報の融合処理を目指して(オーガナイズドセッション)
サブタイトル(和)
タイトル(英) Towards Integrated Processing of Speech and Image Information
サブタイトル(和)
キーワード(1)(和/英) マルチモーダル処理 / Multimodal processing
キーワード(2)(和/英) マルチメディア処理 / Multimedia processing
キーワード(3)(和/英) 状況認識 / Situation recognition
キーワード(4)(和/英) 意図認識 / Intention recognition
第 1 著者 氏名(和/英) 有木 康雄 / Yasuo ARIKI
第 1 著者 所属(和/英) 神戸大学システム情報学研究
Graduate School of System Informatics, Kobe University
発表年月日 2012-12-20
資料番号 SP2012-86
巻番号(vol) vol.112
号番号(no) 369
ページ範囲 pp.-
ページ数 6
発行日