電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
技報オンライン
‥‥ (ESS/通ソ/エレソ/ISS)
技報アーカイブ
‥‥ (エレソ/通ソ)
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2014-11-28 10:30
メモリネットワークベースアクセラレータを用いた畳み込みニューラルネットワーク処理
田ノ元正和高前田(山崎) 伸也姚 駿中島康彦奈良先端大CPSY2014-82
抄録 (和) 近年画像認識の分野において,畳込みニューラルネットワーク(CNN)が高い注目を集めている.CNNは畳込み演算によって計算量が大きくなるため,一般にGPU を用いて高速化される.しかし,GPU においては行列積前後に挿入される処理や入力行列サイズの問題からハードウェアの持つ性能を十分に引き出せない.一方我々が提案するメモリネットワークベースアクセラレータEMAX では,GPU における入力画像を行列に展開する前処理を不要とし,またCNN の畳込み演算がもつデータの再利用部分を利用しメモリ転送量と演算量をバランスさせた効率的な実行が可能となる.また電力あたり性能をGPUと学習チャネル数のパラメタを変えて比較し,GPUでcuDNNライブラリを用いた場合に対し2.20倍から4.20倍の電力あたり性能を達成する見込みとなった. 
(英) Recently, Convolutional Neural Network (CNN) is widely used for image recognition. GPU is generally preferred to accelerate CNN cause of its computation amounts. However, CNN contains pre- and post-processing matrix multiplication Kernel on GPU, and it's Matrix size is inefficient to reach HW peak performance. In this work, we proposed an accelerator based on distributed many-memory network, named“EMAX”, to execute CNN effectively by removing pre-processing and optimizing data reuse. Also We estimate power performance. EMAX is 2.20x to 4.20x greater than GPU performance using cuDNN library.
キーワード (和) 畳込み型ニューラルネットワーク / 画像認識 / CGRA / アクセラレータ / / / /  
(英) Convolutional Neural Networks / Image Recognition / CGRA / Accelerator / / / /  
文献情報 信学技報, vol. 114, no. 330, CPSY2014-82, pp. 57-62, 2014年11月.
資料番号 CPSY2014-82 
発行日 2014-11-19 (CPSY) 
ISSN Print edition: ISSN 0913-5685  Online edition: ISSN 2432-6380
著作権に
ついて
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
PDFダウンロード CPSY2014-82

研究会情報
研究会 VLD DC IPSJ-SLDM CPSY RECONF ICD CPM  
開催期間 2014-11-26 - 2014-11-28 
開催地(和) ビーコンプラザ(別府国際コンベンションセンター) 
開催地(英) B-ConPlaza 
テーマ(和) デザインガイア2014 -VLSI設計の新しい大地- 
テーマ(英) Design Gaia 2014 -New Field of VLSI Design- 
講演論文情報の詳細
申込み研究会 CPSY 
会議コード 2014-11-VLD-DC-SLDM-CPSY-RECONF-ICD-CPM 
本文の言語 日本語 
タイトル(和) メモリネットワークベースアクセラレータを用いた畳み込みニューラルネットワーク処理 
サブタイトル(和)  
タイトル(英) Convolutional Neural Network Processing on An Accelerator based on Manymemory Network 
サブタイトル(英)  
キーワード(1)(和/英) 畳込み型ニューラルネットワーク / Convolutional Neural Networks  
キーワード(2)(和/英) 画像認識 / Image Recognition  
キーワード(3)(和/英) CGRA / CGRA  
キーワード(4)(和/英) アクセラレータ / Accelerator  
キーワード(5)(和/英) /  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 田ノ元 正和 / Masakazu Tanomoto / タノモト マサカズ
第1著者 所属(和/英) 奈良先端科学技術大学院大学 (略称: 奈良先端大)
NARA Institute of Science and Technology (略称: NAIST)
第2著者 氏名(和/英/ヨミ) 高前田(山崎) 伸也 / Shinya Takamaeda-Yamazaki / タカマエダ(ヤマザキ) シンヤ
第2著者 所属(和/英) 奈良先端科学技術大学院大学 (略称: 奈良先端大)
NARA Institute of Science and Technology (略称: NAIST)
第3著者 氏名(和/英/ヨミ) 姚 駿 / Jun Yao / ヤオ ジュン
第3著者 所属(和/英) 奈良先端科学技術大学院大学 (略称: 奈良先端大)
NARA Institute of Science and Technology (略称: NAIST)
第4著者 氏名(和/英/ヨミ) 中島 康彦 / Yasuhiko Nakashima / ナカシマ ヤスヒコ
第4著者 所属(和/英) 奈良先端科学技術大学院大学 (略称: 奈良先端大)
NARA Institute of Science and Technology (略称: NAIST)
第5著者 氏名(和/英/ヨミ) / /
第5著者 所属(和/英) (略称: )
(略称: )
第6著者 氏名(和/英/ヨミ) / /
第6著者 所属(和/英) (略称: )
(略称: )
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者
発表日時 2014-11-28 10:30:00 
発表時間 25 
申込先研究会 CPSY 
資料番号 IEICE-CPSY2014-82 
巻番号(vol) IEICE-114 
号番号(no) no.330 
ページ範囲 pp.57-62 
ページ数 IEICE-6 
発行日 IEICE-CPSY-2014-11-19 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会