講演名 2015-09-18
機械学習された評価関数をもつTraxソルバ
中道 拓也(熊本大), 園田 勇介(熊本大), 松崎 貴之(熊本大), 尼崎 太樹(熊本大), 飯田 全広(熊本大), 久我 守弘(熊本大), 末吉 敏則(熊本大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本研究では,ボードゲームTrax のソルバを開発する.基本戦略は,一般的なゲーム木探索アルゴリズムであるアルファ・ベータ法で最善手を探索する.ゲーム木の探索には評価関数が必要となるが,本研究では機械学習によって評価関数を作成する.一般に機械学習はエキスパートの棋譜データを基に行うが,Trax では公開されている棋譜データが少ないためそれができない.そこで,モンテカルロ木探索による勝率を基に評価関数の機械学習を行う.また,ゲーム木の探索処理は,ソフトウェアのみでは探索できるノード数が少ないので,部分的にFPGA(FieldProgrammable Gate Array)に実装する.開発したソルバは,ソフトウェアのみのソルバと比較して約10 倍以上高速になった.
抄録(英) We develop a solver of board game Trax. Our basic strategy is a common game tree search algorithm. We explore the best move by the alpha-beta pruning. The game tree search is required evaluation function of some sort. we create it by machine learning. Usually this function is made by machine learning based on game record data of expert, but in this game, there is not enough game record data. Therefore, we make the evaluation function by machine learning based on the winning percentage by the Monte Carlo tree search. The search possible number of nodes is small in software-only solver. So we implement a partial of it on FPGA(Field Programmable Gate Array) for acceleration. The solver was about 10 times faster than a software-only solver.
キーワード(和) アクセラレータ / 機械学習 / モンテカルロ木探索 / Trax / FPGA
キーワード(英) Accelerator / Machine learning / Monte Carlo tree search / Trax / FPGA
資料番号 RECONF2015-33
発行日 2015-09-11 (RECONF)

研究会情報
研究会 RECONF
開催期間 2015/9/18(から2日開催)
開催地(和) 愛媛大学
開催地(英) Ehime University
テーマ(和) リコンフィギャラブルシステム、一般
テーマ(英) Reconfigurable Systems, etc.
委員長氏名(和) 渡邊 実(静岡大)
委員長氏名(英) Minoru Watanabe(Shizuoka Univ.)
副委員長氏名(和) 本村 真人(北大) / 柴田 裕一郎(長崎大)
副委員長氏名(英) Masato Motomura(Hokkaido Univ.) / Yuichiro Shibata(Nagasaki Univ.)
幹事氏名(和) 山田 裕(東芝) / 山口 佳樹(筑波大)
幹事氏名(英) Yutaka Yamada(Toshiba) / Yoshiki Yamaguchi(Univ. of Tsukuba)
幹事補佐氏名(和) 谷川 一哉(広島市大) / 三好 健文(イーツリーズ・ジャパン)
幹事補佐氏名(英) Kazuya Tanikagawa(Hiroshima City Univ.) / Takefumi Miyoshi(e-trees.Japan)

講演論文情報詳細
申込み研究会 Technical Committee on Reconfigurable Systems
本文の言語 JPN
タイトル(和) 機械学習された評価関数をもつTraxソルバ
サブタイトル(和)
タイトル(英) Trax solver based on machine-learned evaluation function
サブタイトル(和)
キーワード(1)(和/英) アクセラレータ / Accelerator
キーワード(2)(和/英) 機械学習 / Machine learning
キーワード(3)(和/英) モンテカルロ木探索 / Monte Carlo tree search
キーワード(4)(和/英) Trax / Trax
キーワード(5)(和/英) FPGA / FPGA
第 1 著者 氏名(和/英) 中道 拓也 / Takuya Nakamichi
第 1 著者 所属(和/英) 熊本大学(略称:熊本大)
Kumamoto University(略称:Kumamoto Univ.)
第 2 著者 氏名(和/英) 園田 勇介 / Yusuke Sonoda
第 2 著者 所属(和/英) 熊本大学(略称:熊本大)
Kumamoto University(略称:Kumamoto Univ.)
第 3 著者 氏名(和/英) 松崎 貴之 / Takayuki Matsuzaki
第 3 著者 所属(和/英) 熊本大学(略称:熊本大)
Kumamoto University(略称:Kumamoto Univ.)
第 4 著者 氏名(和/英) 尼崎 太樹 / Motoki Amagasaki
第 4 著者 所属(和/英) 熊本大学(略称:熊本大)
Kumamoto University(略称:Kumamoto Univ.)
第 5 著者 氏名(和/英) 飯田 全広 / Masahiro Iida
第 5 著者 所属(和/英) 熊本大学(略称:熊本大)
Kumamoto University(略称:Kumamoto Univ.)
第 6 著者 氏名(和/英) 久我 守弘 / Morihiro Kuga
第 6 著者 所属(和/英) 熊本大学(略称:熊本大)
Kumamoto University(略称:Kumamoto Univ.)
第 7 著者 氏名(和/英) 末吉 敏則 / Toshinori Sueyoshi
第 7 著者 所属(和/英) 熊本大学(略称:熊本大)
Kumamoto University(略称:Kumamoto Univ.)
発表年月日 2015-09-18
資料番号 RECONF2015-33
巻番号(vol) vol.115
号番号(no) RECONF-228
ページ範囲 pp.7-12(RECONF),
ページ数 6
発行日 2015-09-11 (RECONF)