講演名 2020-01-09
Swish関数を用いた階層型神経回路網の実対数閾値
田中 来輝(東工大), 渡辺 澄夫(東工大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) ニューラルネットワークの学習において,活性化関数の選択は学習挙動や精度に大きく影響を与える.広く利用されている活性化関数にReLU関数があるが,近年,Google Brainのチームにより,強化学習ベースの探索と全数探索の組み合わせによって,新しい活性化関数であるSwish関数が発見された.Swish関数を用いたディープネットワークを画像分類や機械翻訳などに用いたところ,ReLU関数より良い性能を示すことが実験的に示されている.本論文では,これまで未解明であったSwish活性化関数を用いた三層ニューラルネットワークの実対数閾値を代数幾何的な方法で導出し,ベイズ推測における汎化誤差や自由エネルギーの漸近挙動を解明する.
抄録(英) In neural network learning, it is known that selection of activation function effects generalization performance. Although a ReLU function is often employed in many applications, a new Swish function was found by reinforcement learning by Google Brain team. It is experimentally shown that neural newtorks using Swith function have better performance than other activation functions in image recognition and machine translation. However, the theoretical property of Swith function has not yet been studied. In this paper, we derive the real log canonical threshold of Swith function using algebraic geomeric method, and clafiy the generalization error and the free energy in Bayesian estimation.
キーワード(和) ベイズ学習 / ニューラルネットワーク / 実対数閾値 / ベイズ汎化誤差 / 自由エネルギー
キーワード(英) Bayesian Learning / Neural Network / Real Log Canonical Threshold / Bayesian Generalization Error / Free Energy
資料番号 IBISML2019-19
発行日 2020-01-02 (IBISML)

研究会情報
研究会 IBISML
開催期間 2020/1/9(から2日開催)
開催地(和) 統計数理研究所
開催地(英) ISM
テーマ(和) 機械学習一般
テーマ(英) Machine learning, etc.
委員長氏名(和) 鹿島 久嗣(京大)
委員長氏名(英) Hisashi Kashima(Kyoto Univ.)
副委員長氏名(和) 杉山 将(東大) / 津田 宏治(東大)
副委員長氏名(英) Masashi Sugiyama(Univ. of Tokyo) / Koji Tsuda(Univ. of Tokyo)
幹事氏名(和) 竹内 一郎(名工大) / 神嶌 敏弘(産総研)
幹事氏名(英) Ichiro Takeuchi(Nagoya Inst. of Tech.) / Toshihiro Kamishima(AIST)
幹事補佐氏名(和) 岩田 具治(NTT) / 大羽 成征(京大)
幹事補佐氏名(英) Tomoharu Iwata(NTT) / Shigeyuki Oba(Kyoto Univ.)

講演論文情報詳細
申込み研究会 Technical Committee on Infomation-Based Induction Sciences and Machine Learning
本文の言語 JPN
タイトル(和) Swish関数を用いた階層型神経回路網の実対数閾値
サブタイトル(和)
タイトル(英) Real Log Canonical Threshold of Three Layered Neural Network with Swish Activation Function
サブタイトル(和)
キーワード(1)(和/英) ベイズ学習 / Bayesian Learning
キーワード(2)(和/英) ニューラルネットワーク / Neural Network
キーワード(3)(和/英) 実対数閾値 / Real Log Canonical Threshold
キーワード(4)(和/英) ベイズ汎化誤差 / Bayesian Generalization Error
キーワード(5)(和/英) 自由エネルギー / Free Energy
第 1 著者 氏名(和/英) 田中 来輝 / Raiki Tanaka
第 1 著者 所属(和/英) 東京工業大学(略称:東工大)
Tokyo Institute of Technology(略称:Tokyo Tech)
第 2 著者 氏名(和/英) 渡辺 澄夫 / Sumio Watanabe
第 2 著者 所属(和/英) 東京工業大学(略称:東工大)
Tokyo Institute of Technology(略称:Tokyo Tech)
発表年月日 2020-01-09
資料番号 IBISML2019-19
巻番号(vol) vol.119
号番号(no) IBISML-360
ページ範囲 pp.9-15(IBISML),
ページ数 7
発行日 2020-01-02 (IBISML)