講演名 1998/7/27
EMアルゴリズムによるオセロの評価関数の学習
吉岡 琢, 石井 信,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本報告では、正規化ガウス関数ネットワーク(Normalized Gaussian Network, NGnet)にオセロゲームの盤面に対する評価関数を学習させる方法について述べる。NGnetに対する学習法としては、従来の我々の研究により収束が速いことが判っているオンラインEMアルゴリズムを用いる。結果として、NGnetにより学習した評価関数を用いたコンピュータプレイヤーは、ヒューリスティックな戦略を持つプレイヤーに73%の割合で勝つことができるようになった。
抄録(英) In this report, we discuss a learning method of Normalized Gaussian Network(NGnet)that evaluates states of the game Othello. In order to train the NGnet, we employ on-line EM algorithm, whose convergence was shown to be rapid in our previous studies. Consequently, the computer player employing the trained evaluation function becomes to beat a heuristic-based player with the winning rate of 73%.
キーワード(和) オセロ / EMアルゴリズム / 正規化ガウス関数ネットワーク / 動径基底関数 / 評価関数 / 強化学習
キーワード(英) Othello / EM algorithm / Normalized Gaussian Network / Radial Basis Functions / Evaluation function / Reinforcement learning
資料番号 NC98-41
発行日

研究会情報
研究会 NC
開催期間 1998/7/27(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Neurocomputing (NC)
本文の言語 JPN
タイトル(和) EMアルゴリズムによるオセロの評価関数の学習
サブタイトル(和)
タイトル(英) Learning of an evaluation function of the game Othello by EM algorithm
サブタイトル(和)
キーワード(1)(和/英) オセロ / Othello
キーワード(2)(和/英) EMアルゴリズム / EM algorithm
キーワード(3)(和/英) 正規化ガウス関数ネットワーク / Normalized Gaussian Network
キーワード(4)(和/英) 動径基底関数 / Radial Basis Functions
キーワード(5)(和/英) 評価関数 / Evaluation function
キーワード(6)(和/英) 強化学習 / Reinforcement learning
第 1 著者 氏名(和/英) 吉岡 琢 / Taku Yoshioka
第 1 著者 所属(和/英) 奈良先端科学技術大学院大学情報科学研究科
Nara Institute of Science and Technology
第 2 著者 氏名(和/英) 石井 信 / Shin Ishii
第 2 著者 所属(和/英) 奈良先端科学技術大学院大学情報科学研究科
Nara Institute of Science and Technology
発表年月日 1998/7/27
資料番号 NC98-41
巻番号(vol) vol.98
号番号(no) 219
ページ範囲 pp.-
ページ数 8
発行日