EMアルゴリズムによるオセロの評価関数の学習

講演名	1998/7/27 EMアルゴリズムによるオセロの評価関数の学習吉岡琢, 石井信,
PDFダウンロードページ	PDFダウンロードページへ
抄録(和)	本報告では、正規化ガウス関数ネットワーク(Normalized Gaussian Network, NGnet)にオセロゲームの盤面に対する評価関数を学習させる方法について述べる。NGnetに対する学習法としては、従来の我々の研究により収束が速いことが判っているオンラインEMアルゴリズムを用いる。結果として、NGnetにより学習した評価関数を用いたコンピュータプレイヤーは、ヒューリスティックな戦略を持つプレイヤーに73%の割合で勝つことができるようになった。
抄録(英)	In this report, we discuss a learning method of Normalized Gaussian Network(NGnet)that evaluates states of the game Othello. In order to train the NGnet, we employ on-line EM algorithm, whose convergence was shown to be rapid in our previous studies. Consequently, the computer player employing the trained evaluation function becomes to beat a heuristic-based player with the winning rate of 73%.
キーワード(和)	オセロ / EMアルゴリズム / 正規化ガウス関数ネットワーク / 動径基底関数 / 評価関数 / 強化学習
キーワード(英)	Othello / EM algorithm / Normalized Gaussian Network / Radial Basis Functions / Evaluation function / Reinforcement learning
資料番号	NC98-41
発行日

講演論文情報詳細
申込み研究会	Neurocomputing (NC)
本文の言語	JPN
タイトル（和）	EMアルゴリズムによるオセロの評価関数の学習
サブタイトル（和）
タイトル（英）	Learning of an evaluation function of the game Othello by EM algorithm
サブタイトル（和）
キーワード(1)（和/英）	オセロ / Othello
キーワード(2)（和/英）	EMアルゴリズム / EM algorithm
キーワード(3)（和/英）	正規化ガウス関数ネットワーク / Normalized Gaussian Network
キーワード(4)（和/英）	動径基底関数 / Radial Basis Functions
キーワード(5)（和/英）	評価関数 / Evaluation function
キーワード(6)（和/英）	強化学習 / Reinforcement learning
第 1 著者氏名（和/英）	吉岡琢 / Taku Yoshioka
第 1 著者所属（和/英）	奈良先端科学技術大学院大学情報科学研究科 Nara Institute of Science and Technology
第 2 著者氏名（和/英）	石井信 / Shin Ishii
第 2 著者所属（和/英）	奈良先端科学技術大学院大学情報科学研究科 Nara Institute of Science and Technology
発表年月日	1998/7/27
資料番号	NC98-41
巻番号（vol）	vol.98
号番号（no）	219
ページ範囲	pp.-
ページ数	8
発行日