講演名 | 2019-03-06 Batch-normalizationがResNetのフィッシャー情報行列に与える影響の理論解析 古庄 泰隆(奈良先端大), 池田 和司(奈良先端大), |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | ResNetを学習する際に様々なテクニックが使われている. Batch-normalization(BN)はその1つであり,ResNetの勾配降下法による学習の収束速度を向上することが実験的に知られている. 本研究ではこのメカニズムを解明するために,BNがランダムな重みを持つResNetの損失関数の形状,特にフィッシャー情報行列(FIM)にどのような影響を与えるのかを解析し,次の結果を発見した. ResNetのFIMの固有値は層の数に指数的に増加するため,勾配降下法に利用する学習率は小さく設定する必要がある. BNはこの固有値の増加をsub-linearに抑え大きな学習率を利用でき学習の収束速度を向上する. |
抄録(英) | ResNet have intensively been studied and many techniques have been used for better performance. Batch-normalization (BN) is one of these techniques, which accelerates convergence of training ResNet. To clear its acceleration mechanism, we analyzed how BN affects the loss landscape, in particular, the eigenvalues of the Fisher information matrix of ResNet. Our results show that the ResNet has eigenvalues that grow exponentially with its depth, and that the ResNet with BN has eigenvalues that grow sub-linear with its depth. These imply that BN allows the ResNet to use larger learning rate and hence converges faster than the vanilla ResNet. |
キーワード(和) | ニューラルネットワーク / ResNet / Batch-normalization / フィッシャー情報行列 |
キーワード(英) | Neural networks / ResNet / Batch-normalization / Fisher information matrix |
資料番号 | IBISML2018-110 |
発行日 | 2019-02-26 (IBISML) |
研究会情報 | |
研究会 | IBISML |
---|---|
開催期間 | 2019/3/5(から2日開催) |
開催地(和) | 理研AIP |
開催地(英) | RIKEN AIP |
テーマ(和) | 機械学習一般 |
テーマ(英) | Machine learning, etc. |
委員長氏名(和) | 鹿島 久嗣(京大) |
委員長氏名(英) | Hisashi Kashima(Kyoto Univ.) |
副委員長氏名(和) | 杉山 将(東大) / 津田 宏治(東大) |
副委員長氏名(英) | Masashi Sugiyama(Univ. of Tokyo) / Koji Tsuda(Univ. of Tokyo) |
幹事氏名(和) | 竹内 一郎(名工大) / 神嶌 敏弘(産総研) |
幹事氏名(英) | Ichiro Takeuchi(Nagoya Inst. of Tech.) / Toshihiro Kamishima(AIST) |
幹事補佐氏名(和) | 岩田 具治(NTT) / 大羽 成征(京大) |
幹事補佐氏名(英) | Tomoharu Iwata(NTT) / Shigeyuki Oba(Kyoto Univ.) |
講演論文情報詳細 | |
申込み研究会 | Technical Committee on Infomation-Based Induction Sciences and Machine Learning |
---|---|
本文の言語 | JPN |
タイトル(和) | Batch-normalizationがResNetのフィッシャー情報行列に与える影響の理論解析 |
サブタイトル(和) | |
タイトル(英) | Effects of Batch-normalization on Fisher Information Matrix of ResNet |
サブタイトル(和) | |
キーワード(1)(和/英) | ニューラルネットワーク / Neural networks |
キーワード(2)(和/英) | ResNet / ResNet |
キーワード(3)(和/英) | Batch-normalization / Batch-normalization |
キーワード(4)(和/英) | フィッシャー情報行列 / Fisher information matrix |
第 1 著者 氏名(和/英) | 古庄 泰隆 / Yasutaka Furusho |
第 1 著者 所属(和/英) | 奈良先端科学技術大学院大学(略称:奈良先端大) Nara Institute of Science and Technology(略称:NAIST) |
第 2 著者 氏名(和/英) | 池田 和司 / Kazushi Ikeda |
第 2 著者 所属(和/英) | 奈良先端科学技術大学院大学(略称:奈良先端大) Nara Institute of Science and Technology(略称:NAIST) |
発表年月日 | 2019-03-06 |
資料番号 | IBISML2018-110 |
巻番号(vol) | vol.118 |
号番号(no) | IBISML-472 |
ページ範囲 | pp.39-44(IBISML), |
ページ数 | 6 |
発行日 | 2019-02-26 (IBISML) |