講演名 | 2020-01-23 [招待講演]マルチモーダル情報処理と知能 長井 隆行(阪大), |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | マルチモーダル情報の処理は、古くから研究されてきた。実際、音声認識や画像認識などパターン認識の分野では、識別のための情報が増えることによって、多くの場合認識精度が向上する。しかしマルチモーダル処理の重要性は、情報を増やすという側面だけではない。その意義は、むしろモダリティ間の予測にある。例えばある物体を見ると、それがどれくらい重く、どれくらい硬いのかを予測することができる。その予測によって、どれくらいの力でつかむべきかを事前に計画可能となる。言語の理解も、こうした予測の基に成立していると考えることができる。「コップ」という音韻列を聞いて、その見た目や重さ、さらには機能を予測することがその言葉の意味理解である。さらにこれは、アフォーダンスとも関係する。こうしたマルチモーダル情報処理は、マルチモーダル生成モデルを用いた教師なし学習で実現することができる。つまり、ロボットが経験によって得るマルチモーダル情報を使って学習することで、予測モデルを発達させ、概念や行動、言語を学習することができる。我々は、こうした人間の知能の基盤としてのマルチモーダル情報の処理(学習)を、マルチモーダルカテゴリゼーションと呼び、そのアルゴリズムやロボットへの応用を進めてきた。本講演では、マルチモーダルカテゴリゼーションを足がかりに、これを発展させた深層生成モデルや、モデルベース強化学習、ワールドモデルといった 最近の学習モデルへの展開、自由エネルギー原理との関係性などについて議論することで、知能の本質に迫りたい。 |
抄録(英) | |
キーワード(和) | マルチモーダルカテゴリゼーション / マルチモーダル生成モデル / 予測 / モデルベース強化学習 / ワールドモデル |
キーワード(英) | multimodal categorization / multimodal generative models / prediction / model-base reinforcement learning / world models |
資料番号 | MVE2019-31 |
発行日 | 2020-01-16 (MVE) |
研究会情報 | |
研究会 | MVE / IPSJ-CVIM |
---|---|
開催期間 | 2020/1/23(から2日開催) |
開催地(和) | 奈良先端大学 |
開催地(英) | |
テーマ(和) | クロス/マルチモーダルとメディアエクスペリエンスおよび一般(VR学会SIG‐MR連催) |
テーマ(英) | |
委員長氏名(和) | 間瀬 健二(名大) |
委員長氏名(英) | Kenji Mase(Nagoya Univ.) |
副委員長氏名(和) | 井原 雅行(NTT) |
副委員長氏名(英) | Masayuki Ihara(NTT) |
幹事氏名(和) | 平山 高嗣(名大) / 青木 良輔(NTT) |
幹事氏名(英) | Takatsugu Hirayama(Nagoya Univ.) / Ryosuke Aoki(NTT) |
幹事補佐氏名(和) | 西口 敏司(阪工大) / 横山 正典(NTT) / 福嶋 政期(東大) |
幹事補佐氏名(英) | Satoshi Nishiguchi(Oosaka Inst. of Tech.) / Masanori Yokoyama(NTT) / Shogo Fukushima(Univ. of ToKyo) |
講演論文情報詳細 | |
申込み研究会 | Technical Committee on Media Experience and Virtual Environment / Special Interest Group on Computer Vision and Image Media |
---|---|
本文の言語 | JPN |
タイトル(和) | [招待講演]マルチモーダル情報処理と知能 |
サブタイトル(和) | マルチモーダルカテゴリゼーション再訪 |
タイトル(英) | [Invited Talk] Multimodal Information Processing and Intelligence |
サブタイトル(和) | Multimodal Categorization Revisited |
キーワード(1)(和/英) | マルチモーダルカテゴリゼーション / multimodal categorization |
キーワード(2)(和/英) | マルチモーダル生成モデル / multimodal generative models |
キーワード(3)(和/英) | 予測 / prediction |
キーワード(4)(和/英) | モデルベース強化学習 / model-base reinforcement learning |
キーワード(5)(和/英) | ワールドモデル / world models |
第 1 著者 氏名(和/英) | 長井 隆行 / Takayuki Nagai |
第 1 著者 所属(和/英) | 大阪大学(略称:阪大) Osaka University(略称:Osaka Univ.) |
発表年月日 | 2020-01-23 |
資料番号 | MVE2019-31 |
巻番号(vol) | vol.119 |
号番号(no) | MVE-386 |
ページ範囲 | pp.81-81(MVE), |
ページ数 | 1 |
発行日 | 2020-01-16 (MVE) |