電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
技報オンライン
‥‥ (ESS/通ソ/エレソ/ISS)
技報アーカイブ
‥‥ (エレソ/通ソ)
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2017-03-21 15:25
動物体検出のためのLSTMネットワークによる静止画と動き情報の統合
チン トゥアントゥー吉橋亮太川上 玲東大)・尤 少迪Data61-CSIRO, ANU)・飯田 誠苗村 健東大
技報オンラインサービス実施中
抄録 (和) 深層学習の一つである畳み込みニューラルネットワーク(CNN)は特徴量をデータから学習できるため,静止画ベースの検出や分類などのタスクにおいて,人手で既定した特徴量よりも識別性能が飛躍的に向上する.一方で,検出や分類の対象となる物体が低解像度である場合,静止画ベースでは人間にもハードネガティブと見分けがつかないが,動画を見れば簡単に判別できることがある.現に動き情報を検出に取り入れ,性能を向上させた研究例がいくつか見られる.しかし,それらは主に背景を除去し動物体の輪郭を抽出することを目的とし,特徴量は人手で設計されていた.低解像度の動画ではそもそも輪郭が不鮮明である場合が多く,また動きの特徴量をどのように深層学習で学習させれば良いかは不明で現在も議論がなされている.本稿ではCNNとLong Short-term Memory (LSTM) ネットワークを組み合わせ,静止画情報と動き情報を同時に学習させる手法を提案する.候補領域から複数フレームに渡って追跡器で追跡を行い,これらをCNNにより特徴量抽出する.抽出された時系列の特徴量における長期間の依存関係をLSTMにより学習させる.また対象物の軌跡の情報も学習に取り入れる.提案手法を低解像度の鳥の飛行動画に適用し,LSTMが動き情報の学習及び検出に有効であることを確認した. 
(英) Recently, Convolutional Neural Networks (CNNs) have shown impressive results in still image data for the reason that they can extract more data-driven features compared to traditional manually designed features. However, in real-life problems, objects may have very low resolution and hardly recognized or distinguished from hard-negatives by human eyes. In fact, target object could be easily detected if motion is considered, especially when detecting very small objects in large scene. Several studies have followed the idea and shown that detection performance can be improved by combining motion features with static ones. However, how to utilize motion appropriately to achieve the best performance in detection is still in debate. Most of previous studies incorporate motion only through handcrafted features and the main ideas are removing background and keeping contour of moving objects. However, it is difficult to design feature that can represent motion in data-sets where objects are captured in very low-resolution. In this study, we proposed a pipeline combining CNNs and LSTM which are capable of learning long-term dependencies from continuous information for object detection, exploiting as much information as possible from low-resolution input.
キーワード (和) 深層学習 / CNN / LSTM / 動き / 検出 / 動物体 / 低解像度 /  
(英) Deep learning / CNN / LSTM / Motion / Detection / Moving object / Low resolution /  
文献情報 信学技報, vol. 116, no. 528, PRMU2016-233, pp. 221-226, 2017年3月.
資料番号 PRMU2016-233 
発行日 2017-03-13 (BioX, PRMU) 
ISSN Print edition: ISSN 0913-5685  Online edition: ISSN 2432-6380

研究会情報
研究会 PRMU BioX  
開催期間 2017-03-20 - 2017-03-21 
開催地(和) 名城大 
開催地(英)  
テーマ(和) 安心安全と社会 
テーマ(英)  
講演論文情報の詳細
申込み研究会 PRMU 
会議コード 2017-03-PRMU-BioX 
本文の言語 日本語 
タイトル(和) 動物体検出のためのLSTMネットワークによる静止画と動き情報の統合 
サブタイトル(和)  
タイトル(英) Aggregating Appearance and Motion Information using LSTM for Moving Object Detection 
サブタイトル(英)  
キーワード(1)(和/英) 深層学習 / Deep learning  
キーワード(2)(和/英) CNN / CNN  
キーワード(3)(和/英) LSTM / LSTM  
キーワード(4)(和/英) 動き / Motion  
キーワード(5)(和/英) 検出 / Detection  
キーワード(6)(和/英) 動物体 / Moving object  
キーワード(7)(和/英) 低解像度 / Low resolution  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) チン トゥアントゥー / Tuan Tu Trinh / チン トゥアントゥー
第1著者 所属(和/英) 東京大学 (略称: 東大)
The University of Tokyo (略称: Todai)
第2著者 氏名(和/英/ヨミ) 吉橋 亮太 / Ryota Yoshihashi / ヨシハシ リョウタ
第2著者 所属(和/英) 東京大学 (略称: 東大)
The University of Tokyo (略称: Todai)
第3著者 氏名(和/英/ヨミ) 川上 玲 / Rei Kawakami / カワカミ レイ
第3著者 所属(和/英) 東京大学 (略称: 東大)
The University of Tokyo (略称: Todai)
第4著者 氏名(和/英/ヨミ) 尤 少迪 / Shaodi You / ユウ シャオディ
第4著者 所属(和/英) Data61-CSIRO,オーストラリア国立大学 (略称: Data61-CSIRO, ANU)
Data61-CSIRO, Australian National University (略称: Data61-CSIRO, ANU)
第5著者 氏名(和/英/ヨミ) 飯田 誠 / Makoto Iida / イイダ マコト
第5著者 所属(和/英) 東京大学 (略称: 東大)
The University of Tokyo (略称: Todai)
第6著者 氏名(和/英/ヨミ) 苗村 健 / Takeshi Naemura / ナエムラ タケシ
第6著者 所属(和/英) 東京大学 (略称: 東大)
The University of Tokyo (略称: Todai)
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者
発表日時 2017-03-21 15:25:00 
発表時間 25 
申込先研究会 PRMU 
資料番号 IEICE-BioX2016-70,IEICE-PRMU2016-233 
巻番号(vol) IEICE-116 
号番号(no) no.527(BioX), no.528(PRMU) 
ページ範囲 pp.221-226 
ページ数 IEICE-6 
発行日 IEICE-BioX-2017-03-13,IEICE-PRMU-2017-03-13 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会