講演名 | 1998/7/27 EMアルゴリズムによるオセロの評価関数の学習 吉岡 琢, 石井 信, |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | 本報告では、正規化ガウス関数ネットワーク(Normalized Gaussian Network, NGnet)にオセロゲームの盤面に対する評価関数を学習させる方法について述べる。NGnetに対する学習法としては、従来の我々の研究により収束が速いことが判っているオンラインEMアルゴリズムを用いる。結果として、NGnetにより学習した評価関数を用いたコンピュータプレイヤーは、ヒューリスティックな戦略を持つプレイヤーに73%の割合で勝つことができるようになった。 |
抄録(英) | In this report, we discuss a learning method of Normalized Gaussian Network(NGnet)that evaluates states of the game Othello. In order to train the NGnet, we employ on-line EM algorithm, whose convergence was shown to be rapid in our previous studies. Consequently, the computer player employing the trained evaluation function becomes to beat a heuristic-based player with the winning rate of 73%. |
キーワード(和) | オセロ / EMアルゴリズム / 正規化ガウス関数ネットワーク / 動径基底関数 / 評価関数 / 強化学習 |
キーワード(英) | Othello / EM algorithm / Normalized Gaussian Network / Radial Basis Functions / Evaluation function / Reinforcement learning |
資料番号 | NC98-41 |
発行日 |
研究会情報 | |
研究会 | NC |
---|---|
開催期間 | 1998/7/27(から1日開催) |
開催地(和) | |
開催地(英) | |
テーマ(和) | |
テーマ(英) | |
委員長氏名(和) | |
委員長氏名(英) | |
副委員長氏名(和) | |
副委員長氏名(英) | |
幹事氏名(和) | |
幹事氏名(英) | |
幹事補佐氏名(和) | |
幹事補佐氏名(英) |
講演論文情報詳細 | |
申込み研究会 | Neurocomputing (NC) |
---|---|
本文の言語 | JPN |
タイトル(和) | EMアルゴリズムによるオセロの評価関数の学習 |
サブタイトル(和) | |
タイトル(英) | Learning of an evaluation function of the game Othello by EM algorithm |
サブタイトル(和) | |
キーワード(1)(和/英) | オセロ / Othello |
キーワード(2)(和/英) | EMアルゴリズム / EM algorithm |
キーワード(3)(和/英) | 正規化ガウス関数ネットワーク / Normalized Gaussian Network |
キーワード(4)(和/英) | 動径基底関数 / Radial Basis Functions |
キーワード(5)(和/英) | 評価関数 / Evaluation function |
キーワード(6)(和/英) | 強化学習 / Reinforcement learning |
第 1 著者 氏名(和/英) | 吉岡 琢 / Taku Yoshioka |
第 1 著者 所属(和/英) | 奈良先端科学技術大学院大学情報科学研究科 Nara Institute of Science and Technology |
第 2 著者 氏名(和/英) | 石井 信 / Shin Ishii |
第 2 著者 所属(和/英) | 奈良先端科学技術大学院大学情報科学研究科 Nara Institute of Science and Technology |
発表年月日 | 1998/7/27 |
資料番号 | NC98-41 |
巻番号(vol) | vol.98 |
号番号(no) | 219 |
ページ範囲 | pp.- |
ページ数 | 8 |
発行日 |