講演抄録/キーワード |
講演名 |
2022-06-08 09:45
ハードウェアとソフトウェアの協調動作によるAI推論処理の高速化の検討 ○川上智也・中西知嘉子(阪工大) RECONF2022-14 |
抄録 |
(和) |
AI推論処理をソフトウェアとハードウェアで協調処理させる際、Python言語ではネットワーク構造の解析が困難なため、協調処理させることができない。そこで、学習済みモデルのネットワーク情報を抜き出し、C++言語で実行させることで、SoCFPGAボードでの協調動作を実現し高速化を図る。対象ネットワークとしてEfficientNetB0を選択し、CPUでの処理時間の約9割を占める畳み込み層(Conv2D層)について、汎用性のある並列高速処理が可能な回路を設計する。 |
(英) |
When cooperative processing of AI inference processing between software and hardware, it is difficult to analyze network structures in the Python language, so cooperative processing is not possible. Therefore, we extracted the network information from the learned model and executed it in the C++ language to achieve cooperative operation on a SoCFPGA board and speed up the process. EfficientNetB0 was selected as the target network, and a circuit that enables general-purpose parallel high-speed processing was designed for the convolutional layer (Conv2D layer), which accounts for approximately 90% of the processing time on the CPU. |
キーワード |
(和) |
SoC FPGA / 高位合成 / EfficientNet / 畳み込み演算 / Ultra96-V2 / / / |
(英) |
SoC FPGA / higher synthesis / EfficientNet / convolutional operation / Ultra96-V2 / / / |
文献情報 |
信学技報, vol. 122, no. 60, RECONF2022-14, pp. 57-62, 2022年6月. |
資料番号 |
RECONF2022-14 |
発行日 |
2022-05-31 (RECONF) |
ISSN |
Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
査読に ついて |
本技術報告は査読を経ていない技術報告であり,推敲を加えられていずれかの場に発表されることがあります. |
PDFダウンロード |
RECONF2022-14 |