Nested RNSを用いた深層畳込みニューラルネットワークに関して

中原 啓貴; 笹尾 勤

講演名	2015-06-20 Nested RNSを用いた深層畳込みニューラルネットワークに関して中原啓貴(愛媛大), 笹尾勤(明大),
PDFダウンロードページ	PDFダウンロードページへ
抄録(和)	画像識別等の組込み機器では学習済み深層畳み込みニューラルネットワーク~(DCNN: Deep Convolutional Neural Network)の識別高速化が求められている. DCNNの演算の90%以上は2次元畳み込みであり, 主に積和(MAC: Multiply-Accumulation)演算が行われている. 現行のFPGAはMAC演算用のDSPブロック~(Xilinx社FPGAではDSP48Eブロック)を搭載しているが, 大規模なDCNNを実現する際, 大量のDSPブロックが必要である. $n$ビットの乗算は$O(ncdot 2^{2n})$の面積を必要とするため, 入力数$n$を分解すれば面積を削減できる. 本論文では剰余数系~(RNS: Residue Number System)を改良したNested RNSを新たに提案する. Nested RNSはRNSで分割された数を更にRNSで分割することを繰り返す. Nested RNSでは乗算器の入力数を削減できるので, 積和演算回路をコンパクトに実現できる. 入力数$n$が分割されるため, コンパクトな回路で並列処理でき, かつ動作周波数が上がる. Nested RNSを適用したDCNNの一種であるImageNetをVirtex~7 VC707評価ボードに実装した. 単位Slice当りの演算回数効率に関して, 最も優れた既存手法と比較して5.81倍優れていた.
抄録(英)	A pre-trained deep convolutional neural network~(DCNN) is the feedforward computation perspective which is widely used for the embedded systems. In the DCNN, a 2D convolutional operation occupies more than 90% of the computation time. Since the 2D convolutional operation consumes many multiply-accumulation~(MAC) units, conventional realizations could not realize a fully parallel DCNN. In this paper, we propose the nested residue number system~(nested RNS). It is a new type of RNS which decomposes the MAC units. In this paper, 48bit MAC units are decomposed into parallel 4bit ones realized by look-up tables on the FPGA. Also, we show the binary to nested RNS converter realized by on-chip BRAMs, while the nested RNS to binary one realized by DSP blocks and BRAMs. Since our architecture uses most of the FPGA resources, the resource utilization efficiency is very high. We implemented the ImageNet DCNN using the nested RNS on a Xilinx Virtex VC707 evaluation board. As for the performance per area measure~(GOPS~(Giga operations per second) per a slice), the proposed one is 5.81 times better than the existing best realization.
キーワード(和)	FPGA / Convolutional Neural Network / Deep Neural Network / Residue Number System / Nested RNS
キーワード(英)	FPGA / Convolutional Neural Netowrk / Deep Neural Network / Residue Number System / Nested RNS
資料番号	RECONF2015-17
発行日	2015-06-12 (RECONF)

研究会情報
研究会	RECONF
開催期間	2015/6/19(から2日開催)
開催地（和）	京都大学
開催地（英）	Kyoto University
テーマ（和）	「十周年記念研究会」リコンフィギャラブルシステム、一般
テーマ（英）	the 10th anniversary celebration of RECONF: Reconfigurable Systems, etc.
委員長氏名（和）	渡邊実(静岡大)
委員長氏名（英）	Minoru Watanabe(Shizuoka Univ.)
副委員長氏名（和）	本村真人(北大) / 柴田裕一郎(長崎大)
副委員長氏名（英）	Masato Motomura(Hokkaido Univ.) / Yuichiro Shibata(Nagasaki Univ.)
幹事氏名（和）	山田裕(東芝) / 山口佳樹(筑波大)
幹事氏名（英）	Yutaka Yamada(Toshiba) / Yoshiki Yamaguchi(Univ. of Tsukuba)
幹事補佐氏名（和）	谷川一哉(広島市大) / 三好健文(イーツリーズ・ジャパン)
幹事補佐氏名（英）	Kazuya Tanikagawa(Hiroshima City Univ.) / Takefumi Miyoshi(e-trees.Japan)

講演論文情報詳細
申込み研究会	Technical Committee on Reconfigurable Systems
本文の言語	JPN
タイトル（和）	Nested RNSを用いた深層畳込みニューラルネットワークに関して
サブタイトル（和）
タイトル（英）	A Deep Convolutional Neural Network Based on Nested Residue Number System
サブタイトル（和）
キーワード(1)（和/英）	FPGA / FPGA
キーワード(2)（和/英）	Convolutional Neural Network / Convolutional Neural Netowrk
キーワード(3)（和/英）	Deep Neural Network / Deep Neural Network
キーワード(4)（和/英）	Residue Number System / Residue Number System
キーワード(5)（和/英）	Nested RNS / Nested RNS
第 1 著者氏名（和/英）	中原啓貴 / Hiroki Nakahara
第 1 著者所属（和/英）	愛媛大学(略称：愛媛大) Ehime University(略称：Ehime Univ.)
第 2 著者氏名（和/英）	笹尾勤 / Tsutomu Sasao
第 2 著者所属（和/英）	明治大学(略称：明大) Meiji Univeristy(略称：Meiji Univ.)
発表年月日	2015-06-20
資料番号	RECONF2015-17
巻番号（vol）	vol.115
号番号（no）	RECONF-109
ページ範囲	pp.91-96(RECONF),
ページ数	6
発行日	2015-06-12 (RECONF)