講演名 2021-02-22
深層強化学習によるぷよぷよAI
高田 宗一郎(電通大), 清 雄一(電通大), 田原 康之(電通大), 大須賀 昭彦(電通大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) ニューラルネットワークと、それを用いたモンテカルロ木探索により、囲碁や将棋、チェスにおいて超人的なパフォーマンスを 獲得したAlphaZeroのアプローチを用いて、スコアアタック形式の一人ゲームであるぷよぷよにおいて、 大きな連鎖を組むことのできるAIの作成を目指した。ぷよぷよのゲーム性から、局面の価値を「今後発火可能になる最大の連鎖数」 と定め、シミュレーションと、それにより得られたデータによるネットワークの学習を交互に行い、self-playのみからのAIの学習を行った。 通常のぷよぷよに比べ、フィールドのサイズや色数を縮小させたぷよぷよで、 シミュレーションを繰り返し行い、それにより得られるデータによりニューラルネットワークを学習するというサイクルを繰り返すことで、連鎖数の向上がみられた。
抄録(英)
キーワード(和) 深層強化学習 / AlphaZero / ぷよぷよ / ディープラーニング
キーワード(英)
資料番号 AI2020-49
発行日 2021-02-15 (AI)

研究会情報
研究会 AI
開催期間 2021/2/22(から1日開催)
開催地(和) オンライン開催
開催地(英) Online
テーマ(和) 「Web/IoTインテリジェンス」および一般
テーマ(英) Web/IoT Intelligence, etc.
委員長氏名(和) 福田 直樹(静岡大)
委員長氏名(英) Naoki Fukuta(Shizuoka Univ.)
副委員長氏名(和) 清 雄一(電通大) / 櫻井 祐子(産総研)
副委員長氏名(英) Yuichi Sei(Univ. of Electro-Comm.) / Yuko Sakurai(AIST)
幹事氏名(和) 大囿 忠親(名工大) / 藤田 桂英(東京農工大)
幹事氏名(英) Tadachika Ozono(Nagoya Inst. of Tech.) / Katsuhide Fujita(Tokyo Univ. of Agriculture and Technology)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Technical Committee on Artificial Intelligence and Knowledge-Based Processing
本文の言語 JPN-ONLY
タイトル(和) 深層強化学習によるぷよぷよAI
サブタイトル(和)
タイトル(英)
サブタイトル(和)
キーワード(1)(和/英) 深層強化学習
キーワード(2)(和/英) AlphaZero
キーワード(3)(和/英) ぷよぷよ
キーワード(4)(和/英) ディープラーニング
第 1 著者 氏名(和/英) 高田 宗一郎
第 1 著者 所属(和/英) 電気通信大学(略称:電通大)
第 2 著者 氏名(和/英) 清 雄一
第 2 著者 所属(和/英) 電気通信大学(略称:電通大)
第 3 著者 氏名(和/英) 田原 康之
第 3 著者 所属(和/英) 電気通信大学(略称:電通大)
第 4 著者 氏名(和/英) 大須賀 昭彦
第 4 著者 所属(和/英) 電気通信大学(略称:電通大)
発表年月日 2021-02-22
資料番号 AI2020-49
巻番号(vol) vol.120
号番号(no) AI-379
ページ範囲 pp.59-64(AI),
ページ数 6
発行日 2021-02-15 (AI)