イベント駆動カメラを用いた物体検出システムのFPGA実装に関して

下田 将之; 佐藤 真平; 中原 啓貴

講演名	2018-05-25 イベント駆動カメラを用いた物体検出システムのFPGA実装に関して下田将之(東工大), 佐藤真平(東工大), 中原啓貴(東工大),
PDFダウンロードページ	PDFダウンロードページへ
抄録(和)	本稿では, ソフトウェア模擬によるイベント駆動カメラを用いた物体検出システムを FPGA 上に実装する. イベント駆動カメラは撮影映像に動きがあった場合のみ差分画像(通常は 2 値)を出力する. フレーム毎に物体検出する必要がないため, システム全体の電力効率を大幅に改善できる. 加えて, イベント駆動カメラの出力は 2 値画像であるため, 後段の物体識別器の計算速度, 回路面積を削減できる. Caltech Pedestrian Detection datasetに対する認識精度の比較と, 提案システムを GPU と FPGA へ実装し性能を調査した. その結果, RGB 画像を入力とするフレーム駆動の物体検出システムと比較し, 提案システムの認識精度は 6 ポイント低下するものの, 1 枚の画像全体にかかる計算時間が 74.8 倍となった. 加えて, GPU~(NVIDIA Jetson TX2) によって実現した提案システムと比較して, FPGA~(xilinx zcu102) で実現した提案システムの frames per second~(FPS) は 4.3 倍になり, 電力効率は 54.2 倍優れていた. 以上の結果から, イベント駆動カメラと FPGA を用いた物体検出システムは, リアルタイム処理が求められる組み込みシステムにより適していると考える.
抄録(英)	We propose an object detection system using a sliding window method for an event-driven camera which outputs a subtracted frame~(usually binary value) when changes are detected in captured images. Since it skips unchanged frames, it operates faster with lower power consumption compared with a straightforward sliding window approach. Since the event-driven camera output is binary precision frames, an all binarized convolutional neural network~(ABCNN) can be available. Although the realization of all binarization decreases the classification accuracy, it allows all binarized convolutional layers to share the same circuit, thus reducing the area requirement. We implemented our proposed method on a zcu102 FPGA evaluation board and then evaluated it using the Caltech Pedestrian Detection Benchmark. The results show that even though our proposed method reduced a recognition accuracy by 6 points, the computation time for an entire frame was 74.8 times faster than the that of the conventional BCNN without an event-driven camera. Compared with the object detector on the mobile GPU~(NVIDIA Jetson TX2), frames per second~(FPS) of the FPGA system was 4.3 times faster, and the performance per power efficiency was approximately 54.2 times higher.
キーワード(和)	イベント駆動カメラ / 物体検出 / 深層学習 / 畳み込みニューラルネットワーク / 2 値化ニューラルネットワーク
キーワード(英)	Event-Driven Camera / Object Detection / CNN / Binarized CNN
資料番号	RECONF2018-17
発行日	2018-05-17 (RECONF)

研究会情報
研究会	RECONF
開催期間	2018/5/24(から2日開催)
開催地（和）	ゲートシティ大崎 B1ルームD
開催地（英）	GATE CITY OHSAKI
テーマ（和）	ディープラーニングおよびリコンフィギャラブルシステム，一般
テーマ（英）	Deep Learning, Reconfigurable Systems, etc.
委員長氏名（和）	本村真人(北大)
委員長氏名（英）	Masato Motomura(Hokkaido Univ.)
副委員長氏名（和）	柴田裕一郎(長崎大) / 佐野健太郎(東北大)
副委員長氏名（英）	Yuichiro Shibata(Nagasaki Univ.) / Kentaro Sano(Tohoku Univ.)
幹事氏名（和）	谷川一哉(広島市大) / 三好健文(イーツリーズ・ジャパン)
幹事氏名（英）	Kazuya Tanigawa(Hiroshima City Univ.) / Takefumi Miyoshi(e-trees.Japan)
幹事補佐氏名（和）	小林悠記(NEC) / 中原啓貴(東工大)
幹事補佐氏名（英）	Yuuki Kobayashi(NEC) / Hiroki Nakahara(Tokyo Inst. of Tech.)

講演論文情報詳細
申込み研究会	Technical Committee on Reconfigurable Systems
本文の言語	JPN
タイトル（和）	イベント駆動カメラを用いた物体検出システムのFPGA実装に関して
サブタイトル（和）
タイトル（英）	Efficient Object Detection with Event-Driven camera and its implementation on an FPGA
サブタイトル（和）
キーワード(1)（和/英）	イベント駆動カメラ / Event-Driven Camera
キーワード(2)（和/英）	物体検出 / Object Detection
キーワード(3)（和/英）	深層学習 / CNN
キーワード(4)（和/英）	畳み込みニューラルネットワーク / Binarized CNN
キーワード(5)（和/英）	2 値化ニューラルネットワーク
第 1 著者氏名（和/英）	下田将之 / Masayuki Shimoda
第 1 著者所属（和/英）	東京工業大学(略称：東工大) Tokyo Institute of Technology(略称：titech)
第 2 著者氏名（和/英）	佐藤真平 / Shimpei Sato
第 2 著者所属（和/英）	東京工業大学(略称：東工大) Tokyo Institute of Technology(略称：titech)
第 3 著者氏名（和/英）	中原啓貴 / Hiroki Nakahara
第 3 著者所属（和/英）	東京工業大学(略称：東工大) Tokyo Institute of Technology(略称：titech)
発表年月日	2018-05-25
資料番号	RECONF2018-17
巻番号（vol）	vol.118
号番号（no）	RECONF-63
ページ範囲	pp.81-86(RECONF),
ページ数	6
発行日	2018-05-17 (RECONF)