講演名 2019-03-06
Batch-normalizationがResNetのフィッシャー情報行列に与える影響の理論解析
古庄 泰隆(奈良先端大), 池田 和司(奈良先端大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) ResNetを学習する際に様々なテクニックが使われている. Batch-normalization(BN)はその1つであり,ResNetの勾配降下法による学習の収束速度を向上することが実験的に知られている. 本研究ではこのメカニズムを解明するために,BNがランダムな重みを持つResNetの損失関数の形状,特にフィッシャー情報行列(FIM)にどのような影響を与えるのかを解析し,次の結果を発見した. ResNetのFIMの固有値は層の数に指数的に増加するため,勾配降下法に利用する学習率は小さく設定する必要がある. BNはこの固有値の増加をsub-linearに抑え大きな学習率を利用でき学習の収束速度を向上する.
抄録(英) ResNet have intensively been studied and many techniques have been used for better performance. Batch-normalization (BN) is one of these techniques, which accelerates convergence of training ResNet. To clear its acceleration mechanism, we analyzed how BN affects the loss landscape, in particular, the eigenvalues of the Fisher information matrix of ResNet. Our results show that the ResNet has eigenvalues that grow exponentially with its depth, and that the ResNet with BN has eigenvalues that grow sub-linear with its depth. These imply that BN allows the ResNet to use larger learning rate and hence converges faster than the vanilla ResNet.
キーワード(和) ニューラルネットワーク / ResNet / Batch-normalization / フィッシャー情報行列
キーワード(英) Neural networks / ResNet / Batch-normalization / Fisher information matrix
資料番号 IBISML2018-110
発行日 2019-02-26 (IBISML)

研究会情報
研究会 IBISML
開催期間 2019/3/5(から2日開催)
開催地(和) 理研AIP
開催地(英) RIKEN AIP
テーマ(和) 機械学習一般
テーマ(英) Machine learning, etc.
委員長氏名(和) 鹿島 久嗣(京大)
委員長氏名(英) Hisashi Kashima(Kyoto Univ.)
副委員長氏名(和) 杉山 将(東大) / 津田 宏治(東大)
副委員長氏名(英) Masashi Sugiyama(Univ. of Tokyo) / Koji Tsuda(Univ. of Tokyo)
幹事氏名(和) 竹内 一郎(名工大) / 神嶌 敏弘(産総研)
幹事氏名(英) Ichiro Takeuchi(Nagoya Inst. of Tech.) / Toshihiro Kamishima(AIST)
幹事補佐氏名(和) 岩田 具治(NTT) / 大羽 成征(京大)
幹事補佐氏名(英) Tomoharu Iwata(NTT) / Shigeyuki Oba(Kyoto Univ.)

講演論文情報詳細
申込み研究会 Technical Committee on Infomation-Based Induction Sciences and Machine Learning
本文の言語 JPN
タイトル(和) Batch-normalizationがResNetのフィッシャー情報行列に与える影響の理論解析
サブタイトル(和)
タイトル(英) Effects of Batch-normalization on Fisher Information Matrix of ResNet
サブタイトル(和)
キーワード(1)(和/英) ニューラルネットワーク / Neural networks
キーワード(2)(和/英) ResNet / ResNet
キーワード(3)(和/英) Batch-normalization / Batch-normalization
キーワード(4)(和/英) フィッシャー情報行列 / Fisher information matrix
第 1 著者 氏名(和/英) 古庄 泰隆 / Yasutaka Furusho
第 1 著者 所属(和/英) 奈良先端科学技術大学院大学(略称:奈良先端大)
Nara Institute of Science and Technology(略称:NAIST)
第 2 著者 氏名(和/英) 池田 和司 / Kazushi Ikeda
第 2 著者 所属(和/英) 奈良先端科学技術大学院大学(略称:奈良先端大)
Nara Institute of Science and Technology(略称:NAIST)
発表年月日 2019-03-06
資料番号 IBISML2018-110
巻番号(vol) vol.118
号番号(no) IBISML-472
ページ範囲 pp.39-44(IBISML),
ページ数 6
発行日 2019-02-26 (IBISML)