講演名 2009-03-11
平均場近似を用いたHelmholtz Machineの学習
青木 佑紀, 前田 新一, 石井 信,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 高次元データから特徴抽出を行って低次元データや二値化するなどコンパクトな表現に置き換えることがしばしば行われる。コンパクトな特徴表現は、データの圧縮や視覚化や学習を行う際の過学習の回避や、学習の高速化に有用である。HintonとSalakhutdinov[8]は、数百万のパラメータをもつ階層型restricted Boltzmann machine(RBM)の学習にcontrastive divergence(CD)に基づく初期学習を適用することで、主成分分析よりも優れた圧縮性能を実現する特徴抽出法を提案した。CDを用いた学習では、素早い学習を実現する一方、コスト関数が不明なため、パラメータ更新時に適当なステップサイズを使わざるを得ないという問題があり、改善の余地があると考えられる。本報告では、Helmholtz Machine(HM)に対して平均場近似を用いた学習アルゴリズムを導出し、コスト関数とそのパラメータ勾配の両方を評価可能な学習則を提案する。また、この学習則が特定の条件の下でRBMのCDによる学習則に一致することを示す。
抄録(英) It is often required to extract a compact feature of an original high-dimensional datum. Such a compact feature is useful to visualize the original data, or to avoid the over-fitting in the learning which usually requires parameters in proportion to the dimensionality of the data. Recently, Hinton and Salakhutdinov [8] proposed a new dimensionality reduction method, which shows a superior performance to the PCA in their demonstration. They used a hierarchical Boltzmann Machine with millions of parameters. It is well known that the learning of such a nonlinear function approximator is difficult because of local minima and overfitting; neverthless, it seems that they had avoided such possible problems by adopting a Contrastive Divergence (CD) learning in the pretraining. Although the CD learning provides a parameter update rule which realizes efficient learning, several potential disadvantages remain: there are no theoretically justified choice for the step-size in updating the parameters because the cost function of CD learning is unknown. In this report, we derive a learning algorithm of Helmholtz Machine using a mean field approximation, which allows analytical evaluations of both of the cost function and its derivatives with respect to the parameters. Also, it is shown that the learning of the Helmholtz Machine is comparative to the CD learning of the Boltzmann machine under certain conditions.
キーワード(和) 特徴抽出 / 平均場近似
キーワード(英) Restricted Boltzmann Machine / Helmholtz Machine / Contrastive Divergence / Feature Extraction / Mean Field Approximation
資料番号 NC2008-113
発行日

研究会情報
研究会 NC
開催期間 2009/3/4(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Neurocomputing (NC)
本文の言語 JPN
タイトル(和) 平均場近似を用いたHelmholtz Machineの学習
サブタイトル(和)
タイトル(英) A Learning Algorithm of Helmholtz Machine with Mean Field Approximation
サブタイトル(和)
キーワード(1)(和/英) 特徴抽出 / Restricted Boltzmann Machine
キーワード(2)(和/英) 平均場近似 / Helmholtz Machine
第 1 著者 氏名(和/英) 青木 佑紀 / Yuki AOKI
第 1 著者 所属(和/英) 奈良先端科学技術大学院大学
Nara Institute of Science and Technology
第 2 著者 氏名(和/英) 前田 新一 / Shin-ichi MAEDA
第 2 著者 所属(和/英) 京都大学
Graduate School of Informatics, Kyoto University
第 3 著者 氏名(和/英) 石井 信 / Shin ISHII
第 3 著者 所属(和/英) 京都大学
Graduate School of Informatics, Kyoto University
発表年月日 2009-03-11
資料番号 NC2008-113
巻番号(vol) vol.108
号番号(no) 480
ページ範囲 pp.-
ページ数 6
発行日