講演抄録/キーワード |
講演名 |
2017-09-15 10:30
[ショートペーパー]正則化による深層学習の重み量子化手法の検討 ○大屋 優・井田安俊・藤原靖宏・岩村相哲(NTT) PRMU2017-45 IBISML2017-17 |
抄録 |
(和) |
ディープニューラルネットワーク(DNN)は画像や音声認識をはじめ様々な分野で用いられるモデルである.一般に,DNNは多層構造をとるため重みと呼ばれるパラメータを多く有する.そのため,近年ではパラメータのメモリ使用量を確実に減らす量子化が注目されている.DNNを量子化する既存手法として,ステップ関数を用いて強制的にパラメータの値を目的のビット幅に格納できる個数に離散化する手法が提案されている.しかし,ステップ関数の導関数はほとんどが0をとるため,確率的勾配降下法をベースとした誤差逆伝播法が使えない問題がある.そこで,本稿では,連続関数のみで構成されたDNNからパラメータを量子化する手法を提案する.まず,パラメータを任意の連続関数で射影することで値域を制約する.次に,量子化に向け,パラメータ更新時に三角関数による正則化項を設けることで,目的の値でないパラメータに罰則を与える.これにより,本提案手法は学習が進むに連れ徐々にパラメータを量子化することが期待できる.その検証実験として連続関数や正則化項のハイパーパラメータ次第で様々なメモリ幅の量子化が可能であることを確認した. |
(英) |
(Not available yet) |
キーワード |
(和) |
ディープニューラルネットワーク / 量子化 / 正則化 / / / / / |
(英) |
/ / / / / / / |
文献情報 |
信学技報, vol. 117, no. 211, IBISML2017-17, pp. 51-52, 2017年9月. |
資料番号 |
IBISML2017-17 |
発行日 |
2017-09-08 (PRMU, IBISML) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
PRMU2017-45 IBISML2017-17 |