講演名 2018-03-20
[招待講演]クロスモーダル情景分析の展開
柏野 邦夫(NTT),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 情景分析とは,センサ情報に基づいて,周囲に存在する様々な事物,及びその時空間的な配置や動向を把握することを意味し,心理学,生物学,工学といった複数の学問分野において60年以上の長きにわたり主要な研究テーマの一つとなってきた。工学的には,コンピュータビジョンや聴覚的情景分析といった言葉にも象徴されるように,センサ情報のモダリティ毎に問題を定義し,数理的もしくは発見的に解法を追求するアプローチが主流となってきたほか,複数種類のセンサ情報の並列的な利用,即ちマルチモーダルなアプローチも数多く検討されてきた。しかし,例えば我々の日常生活において人間と同等に情景分析を行う機能を工学的に実現することは未だ困難な課題であり,その実現には新たなブレイクスルーが必要と思われる。ところが近年,深層学習技術の発展も背景として,モダリティ横断的なアプローチが試みられるようになった。本講演ではこのような新たな研究動向をクロスモーダル情景分析と呼び,研究事例を概観しながら,今後の発展の可能性を展望する。
抄録(英) The problem of scene analysis means to understand, or describe, various external objects or events associated with spatial and temporal information based on sensory input. It has been a major research topic over the past decades in multiple fields. In the engineering context, as symbolically shown in the terms such as computer vision and computational auditory scene analysis, a major approach has been defining the problem within a single modality and seeking its solutions by mathematical or heuristic means, and many multimodal approaches that use multiple types of sensory input in parallel have also been reported. However, it is still a hard problem when we consider, for example, understanding the scene as well as we humans do in the natural environment in our daily life, and it is likely that a breakthrough is needed to solve it. Against this background, another type of approach taking advantages of multiple modalities has emerged in recent years, supported by the rapid progress of deep learning technologies. In this talk, we call it cross-modal scene analysis. We review some of such works, and discuss potential implications and possibilities of this new research direction.
キーワード(和) 情景分析 / ハッシング / マルチモダリティ / クロスモダリティ / 深層学習
キーワード(英) scene analysis / hashing / multi-modality / cross-modality / deep learning
資料番号 EA2017-166,SIP2017-175,SP2017-149
発行日 2018-03-12 (EA, SIP, SP)

研究会情報
研究会 SIP / EA / SP / MI
開催期間 2018/3/19(から2日開催)
開催地(和) 石垣島 ホテルミヤヒラ
開催地(英)
テーマ(和) 音声,応用/電気音響,信号処理,一般 [SIP,EA,SP]/ 医用画像工学一般 [MI]
テーマ(英) Speech, Engineering/Electro Acoustics, Signal Processing, and Related Topics [SIP, EA, SP]/ Medical Image Engineering, Analysis, Recognition, etc. [MI]
委員長氏名(和) 奥田 正浩(北九州市大) / 島内 末廣(NTT) / 山下 洋一(立命館大) / 森 健策(名大)
委員長氏名(英) Masahiro Okuda(Univ. of Kitakyushu) / Suehiro Shimauchi(NTT) / Yoichi Yamashita(Ritsumeikan Univ.) / Kensaku Mori(Nagoya Univ.)
副委員長氏名(和) 村松 正吾(新潟大) / 相川 直幸(東京理科大) / 水町 光徳(九州工業大) / 森 大毅(宇都宮大) / 河田 佳樹(徳島大) / 木村 裕一(近畿大)
副委員長氏名(英) Shogo Muramatsu(Niigata Univ.) / Naoyuki Aikawa(TUS) / Mitsunori Mizumachi(Kyutech) / Hiroki Mori(Utsunomiya Univ.) / Yoshiki Kawata(Tokushima Univ.) / Yuichi Kimura(Kinki Univ.)
幹事氏名(和) 宮田 高道(千葉工大) / 渡邊 修(拓殖大) / 渡邉 貫治(秋田県立大) / 武岡 成人(静岡理工科大) / 西田 昌史(静岡大) / 坂野 秀樹(名城大) / 北坂 孝幸(愛知工大) / 本谷 秀堅(名工大)
幹事氏名(英) Takamichi Miyata(Chiba Inst. of Tech.) / Osamu Watanabe(Takushoku Univ.) / Kanji Watanabe(Akita Pref. Univ.) / Shigeto Takeoka(Shizuoka Inst. of Science and Tech.) / Masafumi Nishida(Shizuoka Univ.) / Hideki Banno(Meijo Univ.) / Takayuki Kitasaka(Aichi Inst. of Tech.) / Hidekata Hontani(Nagoya Inst. of Tech.)
幹事補佐氏名(和) 中本 昌由(広島大) / TREVINO Jorge(東北大) / 伊藤 信貴(NTT) / 橋本 佳(名工大) / 小橋川 哲(NTT) / 原口 亮(兵庫県立大) / 平野 靖(山口大)
幹事補佐氏名(英) Masayoshi Nakamoto(Hiroshima Univ.ひろ) / TREVINO Jorge(Tohoku Univ.) / Nobutaka Ito(NTT) / Kei Hashimoto(Nagoya Inst. of Tech.) / Satoshi Kobashikawa(NTT) / Ryo Haraguchi(Univ. of Hyogo) / Yasushi Hirano(Yamaguchi Univ.)

講演論文情報詳細
申込み研究会 Technical Committee on Signal Processing / Technical Committee on Engineering Acoustics / Technical Committee on Speech / Technical Committee on Medical Imaging
本文の言語 JPN
タイトル(和) [招待講演]クロスモーダル情景分析の展開
サブタイトル(和)
タイトル(英) [Invited Talk] Progress of Research on Cross-modal Scene Analysis
サブタイトル(和)
キーワード(1)(和/英) 情景分析 / scene analysis
キーワード(2)(和/英) ハッシング / hashing
キーワード(3)(和/英) マルチモダリティ / multi-modality
キーワード(4)(和/英) クロスモダリティ / cross-modality
キーワード(5)(和/英) 深層学習 / deep learning
第 1 著者 氏名(和/英) 柏野 邦夫 / Kunio Kashino
第 1 著者 所属(和/英) 日本電信電話株式会社(略称:NTT)
Nippon Telegraph and Telephone Corporation(略称:NTT)
発表年月日 2018-03-20
資料番号 EA2017-166,SIP2017-175,SP2017-149
巻番号(vol) vol.117
号番号(no) EA-515,SIP-516,SP-517
ページ範囲 pp.353-353(EA), pp.353-353(SIP), pp.353-353(SP),
ページ数 1
発行日 2018-03-12 (EA, SIP, SP)