講演名 2019-03-06
囲碁プログラムにおけるRAVEを用いたLGRFの評価
清水 達哉(千葉工大), 葉山 雄太(千葉工大), 中村 あすか(千葉工大), 前川 仁孝(千葉工大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本研究では,囲碁プログラムの棋力を向上するために,モンテカルロ木探索を改良することを目標とする.モンテカルロ木探索を用いた囲碁プログラムは,プレイアウトと呼ばれる操作を繰り返し行うことで着手を評価する.プレイアウトのランダムシミュレーションの精度を向上する手法の一つとしてLGRFが知られている.LGRFは前回までのプレイアウト中の応手を現在のプレイアウトに用いるため,ランダムシミュレーションから得られた応手が良い手とは限らない.この問題を解決するには,有望な応手を保存することが考えられる.提案手法ではRAVEを用いて,探索木中の評価の高いノードを応手として保存するLGRFを提案する.計測の結果,提案手法を実装したFuegoは,従来のLGRFを実装したFuegoに対して約55%の勝率が得られることを確認した.
抄録(英) This paper proposes an improving method of Monte Carlo tree search to improve the winning rate of the Go program. The program using MCT evaluates the move by repeating random simulations called playout. LGRF is known as one of the techniques for improving the precision of random simulation of playout. LGRF stores response in the table and uses the response in playout. Thus, the Go program becomes strong by storing good responses in the table of LGRF. On the other hand, LGRF may store no good responses in the table of LGRF because it stores the responses in the table from already finished playouts. Therefore, the proposed method stores the responses picked up on the search tree of UCT using RAVE. Performance evaluation shows the proposed method has about 55% winning percentage against Fuego which implemented LGRF.
キーワード(和) 囲碁プログラム / UCT / RAVE / LGRF
キーワード(英) Go program / UCT / RAVE / LGRF
資料番号 IBISML2018-116
発行日 2019-02-26 (IBISML)

研究会情報
研究会 IBISML
開催期間 2019/3/5(から2日開催)
開催地(和) 理研AIP
開催地(英) RIKEN AIP
テーマ(和) 機械学習一般
テーマ(英) Machine learning, etc.
委員長氏名(和) 鹿島 久嗣(京大)
委員長氏名(英) Hisashi Kashima(Kyoto Univ.)
副委員長氏名(和) 杉山 将(東大) / 津田 宏治(東大)
副委員長氏名(英) Masashi Sugiyama(Univ. of Tokyo) / Koji Tsuda(Univ. of Tokyo)
幹事氏名(和) 竹内 一郎(名工大) / 神嶌 敏弘(産総研)
幹事氏名(英) Ichiro Takeuchi(Nagoya Inst. of Tech.) / Toshihiro Kamishima(AIST)
幹事補佐氏名(和) 岩田 具治(NTT) / 大羽 成征(京大)
幹事補佐氏名(英) Tomoharu Iwata(NTT) / Shigeyuki Oba(Kyoto Univ.)

講演論文情報詳細
申込み研究会 Technical Committee on Infomation-Based Induction Sciences and Machine Learning
本文の言語 JPN
タイトル(和) 囲碁プログラムにおけるRAVEを用いたLGRFの評価
サブタイトル(和)
タイトル(英) Evaluation of LGRF using RAVE in Go program
サブタイトル(和)
キーワード(1)(和/英) 囲碁プログラム / Go program
キーワード(2)(和/英) UCT / UCT
キーワード(3)(和/英) RAVE / RAVE
キーワード(4)(和/英) LGRF / LGRF
第 1 著者 氏名(和/英) 清水 達哉 / Tatsuya Shimizu
第 1 著者 所属(和/英) 千葉工業大学(略称:千葉工大)
Chiba Institute of Technology(略称:CIT)
第 2 著者 氏名(和/英) 葉山 雄太 / Yuta Hayama
第 2 著者 所属(和/英) 千葉工業大学(略称:千葉工大)
Chiba Institute of Technology(略称:CIT)
第 3 著者 氏名(和/英) 中村 あすか / Asuka Nakamura
第 3 著者 所属(和/英) 千葉工業大学(略称:千葉工大)
Chiba Institute of Technology(略称:CIT)
第 4 著者 氏名(和/英) 前川 仁孝 / Yoshitaka Maekawa
第 4 著者 所属(和/英) 千葉工業大学(略称:千葉工大)
Chiba Institute of Technology(略称:CIT)
発表年月日 2019-03-06
資料番号 IBISML2018-116
巻番号(vol) vol.118
号番号(no) IBISML-472
ページ範囲 pp.81-85(IBISML),
ページ数 5
発行日 2019-02-26 (IBISML)