2値化畳込みニューラルネットワークのニューロン刈りによるメモリ量削減とFPGA実現について

藤井智也; 佐藤真平; 中原啓貴

大会名称
2017年情報科学技術フォーラム(FIT)
大会コ－ド
F
開催年
2017
発行日
2017-09-05
セッション番号
1B
セッション名
ハードウェア・アーキテクチャ
講演日
2017/09/12
講演場所(会議室等)
2号館2階 222号講義室
講演番号
CC-002
タイトル
2値化畳込みニューラルネットワークのニューロン刈りによるメモリ量削減とFPGA実現について
著者名
藤井智也, 佐藤真平, 中原啓貴,
キーワード
FPGA, ニューラルネットワーク, Pruning
抄録
画像識別等の組込み機器では学習済み深層畳み込みニューラルネットワーク(CNN: Deep Convolutional Neural Network) の識別高速化と低消費電力化が求められている. 一般的なCNN は前半部が畳込み層, 後半部がフル結合層で構成されている. 先行研究より, 畳込み層では積和演算部がボトルネックであり, フル結合層ではメモリアクセスがボトルネックである. 本論文では, フル結合層ではニューロンを刈ることで, 重みを格納したメモリを削減し, フル結合層のメモリアクセスを高速化する. 従って, FPGAのオンチップメモリ上にフル結合層の重みを全て格納でき,メモリアクセス問題を解決できる. また, 本論文ではFPGAのオンチップメモリと組み合わせた高速なフル結合層回路を提案する. 提案する閾値ニューロン刈りにより, 元の認識精度に対して99%同等な場合はVGG-11におけるフル結合層のニューロンを87.4%削減できた. 加えて, 本論文ではCNNの入力値と重みを2値(-1/+1) に制限した2値化CNNに対して閾値ニューロン刈りを適用し、フル結合層のニューロンを60.2%削減できた.
本文pdf
PDF download (1.1MB)