講演名 2017-03-21
動物体検出のためのLSTMネットワークによる静止画と動き情報の統合
チン トゥアントゥー(東大), 吉橋 亮太(東大), 川上 玲(東大), 尤 少迪(Data61-CSIRO, ANU), 飯田 誠(東大), 苗村 健(東大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 深層学習の一つである畳み込みニューラルネットワーク(CNN)は特徴量をデータから学習できるため,静止画ベースの検出や分類などのタスクにおいて,人手で既定した特徴量よりも識別性能が飛躍的に向上する.一方で,検出や分類の対象となる物体が低解像度である場合,静止画ベースでは人間にもハードネガティブと見分けがつかないが,動画を見れば簡単に判別できることがある.現に動き情報を検出に取り入れ,性能を向上させた研究例がいくつか見られる.しかし,それらは主に背景を除去し動物体の輪郭を抽出することを目的とし,特徴量は人手で設計されていた.低解像度の動画ではそもそも輪郭が不鮮明である場合が多く,また動きの特徴量をどのように深層学習で学習させれば良いかは不明で現在も議論がなされている.本稿ではCNNとLong Short-term Memory (LSTM) ネットワークを組み合わせ,静止画情報と動き情報を同時に学習させる手法を提案する.候補領域から複数フレームに渡って追跡器で追跡を行い,これらをCNNにより特徴量抽出する.抽出された時系列の特徴量における長期間の依存関係をLSTMにより学習させる.また対象物の軌跡の情報も学習に取り入れる.提案手法を低解像度の鳥の飛行動画に適用し,LSTMが動き情報の学習及び検出に有効であることを確認した.
抄録(英) Recently, Convolutional Neural Networks (CNNs) have shown impressive results in still image data for the reason that they can extract more data-driven features compared to traditional manually designed features. However, in real-life problems, objects may have very low resolution and hardly recognized or distinguished from hard-negatives by human eyes. In fact, target object could be easily detected if motion is considered, especially when detecting very small objects in large scene. Several studies have followed the idea and shown that detection performance can be improved by combining motion features with static ones. However, how to utilize motion appropriately to achieve the best performance in detection is still in debate. Most of previous studies incorporate motion only through handcrafted features and the main ideas are removing background and keeping contour of moving objects. However, it is difficult to design feature that can represent motion in data-sets where objects are captured in very low-resolution. In this study, we proposed a pipeline combining CNNs and LSTM which are capable of learning long-term dependencies from continuous information for object detection, exploiting as much information as possible from low-resolution input.
キーワード(和) 深層学習 / CNN / LSTM / 動き / 検出 / 動物体 / 低解像度
キーワード(英) Deep learning / CNN / LSTM / Motion / Detection / Moving object / Low resolution
資料番号 BioX2016-70,PRMU2016-233
発行日 2017-03-13 (BioX, PRMU)

研究会情報
研究会 PRMU / BioX
開催期間 2017/3/20(から2日開催)
開催地(和) 名城大
開催地(英)
テーマ(和) 安心安全と社会
テーマ(英)
委員長氏名(和) 前田 英作(NTT) / 西垣 正勝(静岡大)
委員長氏名(英) Eisaku Maeda(NTT) / Masakatsu Nishigaki(Shizuoka Univ.)
副委員長氏名(和) 内田 誠一(九大) / 藤吉 弘亘(中部大) / 大塚 玲(産総研) / 高野 博史(富山県立大)
副委員長氏名(英) Seiichi Uchida(Kyushu Univ.) / Hironobu Fujiyoshi(Chubu Univ.) / Akira Otsuka(AIST) / Hiroshi Takano(Toyama Pref. Univ.)
幹事氏名(和) 近藤 一晃(京大) / 木村 昭悟(NTT) / 今岡 仁(NEC) / 大木 哲史(産総研)
幹事氏名(英) Kazuaki Kondo(Kyoto Univ.) / Akisato Kimura(NTT) / Hitoshi Imaoka(NEC) / Tetsushi Ohki(AIST)
幹事補佐氏名(和) 大西 正輝(産総研) / 舩冨 卓哉(奈良先端大) / 市野 将嗣(電通大) / 高田 直幸(セコム) / 青木 隆浩(富士通研)
幹事補佐氏名(英) Masaki Oonishi(AIST) / Takuya Funatomi(NAIST) / Masatsugu Ichino(Univ. of Electro-Comm.) / Naoyuki Takada(Secom) / Takahiro Aoki(Fujitsu Labs.)

講演論文情報詳細
申込み研究会 Technical Committee on Pattern Recognition and Media Understanding / Technical Committee on Biometrics
本文の言語 JPN
タイトル(和) 動物体検出のためのLSTMネットワークによる静止画と動き情報の統合
サブタイトル(和)
タイトル(英) Aggregating Appearance and Motion Information using LSTM for Moving Object Detection
サブタイトル(和)
キーワード(1)(和/英) 深層学習 / Deep learning
キーワード(2)(和/英) CNN / CNN
キーワード(3)(和/英) LSTM / LSTM
キーワード(4)(和/英) 動き / Motion
キーワード(5)(和/英) 検出 / Detection
キーワード(6)(和/英) 動物体 / Moving object
キーワード(7)(和/英) 低解像度 / Low resolution
第 1 著者 氏名(和/英) チン トゥアントゥー / Tuan Tu Trinh
第 1 著者 所属(和/英) 東京大学(略称:東大)
The University of Tokyo(略称:Todai)
第 2 著者 氏名(和/英) 吉橋 亮太 / Ryota Yoshihashi
第 2 著者 所属(和/英) 東京大学(略称:東大)
The University of Tokyo(略称:Todai)
第 3 著者 氏名(和/英) 川上 玲 / Rei Kawakami
第 3 著者 所属(和/英) 東京大学(略称:東大)
The University of Tokyo(略称:Todai)
第 4 著者 氏名(和/英) 尤 少迪 / Shaodi You
第 4 著者 所属(和/英) Data61-CSIRO,オーストラリア国立大学(略称:Data61-CSIRO, ANU)
Data61-CSIRO, Australian National University(略称:Data61-CSIRO, ANU)
第 5 著者 氏名(和/英) 飯田 誠 / Makoto Iida
第 5 著者 所属(和/英) 東京大学(略称:東大)
The University of Tokyo(略称:Todai)
第 6 著者 氏名(和/英) 苗村 健 / Takeshi Naemura
第 6 著者 所属(和/英) 東京大学(略称:東大)
The University of Tokyo(略称:Todai)
発表年月日 2017-03-21
資料番号 BioX2016-70,PRMU2016-233
巻番号(vol) vol.116
号番号(no) BioX-527,PRMU-528
ページ範囲 pp.221-226(BioX), pp.221-226(PRMU),
ページ数 6
発行日 2017-03-13 (BioX, PRMU)