講演名 | 2021-02-22 深層強化学習によるぷよぷよAI 高田 宗一郎(電通大), 清 雄一(電通大), 田原 康之(電通大), 大須賀 昭彦(電通大), |
---|---|
PDFダウンロードページ | ![]() |
抄録(和) | ニューラルネットワークと、それを用いたモンテカルロ木探索により、囲碁や将棋、チェスにおいて超人的なパフォーマンスを 獲得したAlphaZeroのアプローチを用いて、スコアアタック形式の一人ゲームであるぷよぷよにおいて、 大きな連鎖を組むことのできるAIの作成を目指した。ぷよぷよのゲーム性から、局面の価値を「今後発火可能になる最大の連鎖数」 と定め、シミュレーションと、それにより得られたデータによるネットワークの学習を交互に行い、self-playのみからのAIの学習を行った。 通常のぷよぷよに比べ、フィールドのサイズや色数を縮小させたぷよぷよで、 シミュレーションを繰り返し行い、それにより得られるデータによりニューラルネットワークを学習するというサイクルを繰り返すことで、連鎖数の向上がみられた。 |
抄録(英) | |
キーワード(和) | 深層強化学習 / AlphaZero / ぷよぷよ / ディープラーニング |
キーワード(英) | |
資料番号 | AI2020-49 |
発行日 | 2021-02-15 (AI) |
研究会情報 | |
研究会 | AI |
---|---|
開催期間 | 2021/2/22(から1日開催) |
開催地(和) | オンライン開催 |
開催地(英) | Online |
テーマ(和) | 「Web/IoTインテリジェンス」および一般 |
テーマ(英) | Web/IoT Intelligence, etc. |
委員長氏名(和) | 福田 直樹(静岡大) |
委員長氏名(英) | Naoki Fukuta(Shizuoka Univ.) |
副委員長氏名(和) | 清 雄一(電通大) / 櫻井 祐子(産総研) |
副委員長氏名(英) | Yuichi Sei(Univ. of Electro-Comm.) / Yuko Sakurai(AIST) |
幹事氏名(和) | 大囿 忠親(名工大) / 藤田 桂英(東京農工大) |
幹事氏名(英) | Tadachika Ozono(Nagoya Inst. of Tech.) / Katsuhide Fujita(Tokyo Univ. of Agriculture and Technology) |
幹事補佐氏名(和) | |
幹事補佐氏名(英) |
講演論文情報詳細 | |
申込み研究会 | Technical Committee on Artificial Intelligence and Knowledge-Based Processing |
---|---|
本文の言語 | JPN-ONLY |
タイトル(和) | 深層強化学習によるぷよぷよAI |
サブタイトル(和) | |
タイトル(英) | |
サブタイトル(和) | |
キーワード(1)(和/英) | 深層強化学習 |
キーワード(2)(和/英) | AlphaZero |
キーワード(3)(和/英) | ぷよぷよ |
キーワード(4)(和/英) | ディープラーニング |
第 1 著者 氏名(和/英) | 高田 宗一郎 |
第 1 著者 所属(和/英) | 電気通信大学(略称:電通大) |
第 2 著者 氏名(和/英) | 清 雄一 |
第 2 著者 所属(和/英) | 電気通信大学(略称:電通大) |
第 3 著者 氏名(和/英) | 田原 康之 |
第 3 著者 所属(和/英) | 電気通信大学(略称:電通大) |
第 4 著者 氏名(和/英) | 大須賀 昭彦 |
第 4 著者 所属(和/英) | 電気通信大学(略称:電通大) |
発表年月日 | 2021-02-22 |
資料番号 | AI2020-49 |
巻番号(vol) | vol.120 |
号番号(no) | AI-379 |
ページ範囲 | pp.59-64(AI), |
ページ数 | 6 |
発行日 | 2021-02-15 (AI) |