講演名 2022-02-28
深層強化学習を用いたサッカータスクにおける組織的な守備の獲得
酒井 佑旗(電通大), 清 雄一(電通大), 田原 康之(電通大), 大須賀 昭彦(電通大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本研究では深層強化学習を用いてサッカータスクのディフェンスにおける協調行動の獲得を目指す.その 中で特にカリキュラム学習を利用する.カリキュラム学習は段階的に学習を行う手法であり,難しいタスクの学習に 利用される.カリキュラムの設計によって協調行動が獲得できると考え協調行動に対する直接的な報酬は与えずに獲 得を試みた.最終的にオフェンス 1 体,ディフェンス 2 体の環境で実験を行い,カリキュラム学習を用いた場合が用 いなかった場合よりも高い報酬を獲得し,効率的に学習が進んだ.しかし協調行動の獲得は進まなかった.このこと からカリキュラム学習がサッカータスクのディフェンスの効率的な学習には有効であるが,協調行動の獲得には協調 行動に対する直接的な報酬が必要であることがわかった.
抄録(英)
キーワード(和) 深層学習 / マルチエージェント強化学習 / カリキュラム学習 / サッカータスク
キーワード(英)
資料番号 AI2021-24
発行日 2022-02-21 (AI)

研究会情報
研究会 AI
開催期間 2022/2/28(から1日開催)
開催地(和) ユースホステルサンフラワー宮崎 会議室
開催地(英) Youth Hostel Sunflower MIYAZAKI
テーマ(和) 学生・若手研究会
テーマ(英)
委員長氏名(和) 清 雄一(電通大)
委員長氏名(英) Yuichi Sei(Univ. of Electro-Comm.)
副委員長氏名(和) 櫻井 祐子(産総研) / 大囿 忠親(名工大)
副委員長氏名(英) Yuko Sakurai(AIST) / Tadachika Ozono(Nagoya Inst. of Tech.)
幹事氏名(和) 藤田 桂英(東京農工大) / 中島 悠(東邦大)
幹事氏名(英) Katsuhide Fujita(Tokyo Univ. of Agriculture and Technology) / Yuu Nakajima(Toho Univ.)
幹事補佐氏名(和) 松崎 和賢(中大)
幹事補佐氏名(英) Kazutaka Matsuzaki(Chuo Univ.)

講演論文情報詳細
申込み研究会 Technical Committee on Artificial Intelligence and Knowledge-Based Processing
本文の言語 JPN-ONLY
タイトル(和) 深層強化学習を用いたサッカータスクにおける組織的な守備の獲得
サブタイトル(和)
タイトル(英)
サブタイトル(和)
キーワード(1)(和/英) 深層学習
キーワード(2)(和/英) マルチエージェント強化学習
キーワード(3)(和/英) カリキュラム学習
キーワード(4)(和/英) サッカータスク
第 1 著者 氏名(和/英) 酒井 佑旗 / Yuki Sakai
第 1 著者 所属(和/英) 電気通信大学(略称:電通大)
The University of Electro-Communications(略称:UEC)
第 2 著者 氏名(和/英) 清 雄一 / Yuichi Sei
第 2 著者 所属(和/英) 電気通信大学(略称:電通大)
The University of Electro-Communications(略称:UEC)
第 3 著者 氏名(和/英) 田原 康之 / Yasuyuki Tahara
第 3 著者 所属(和/英) 電気通信大学(略称:電通大)
The University of Electro-Communications(略称:UEC)
第 4 著者 氏名(和/英) 大須賀 昭彦 / Akihiko Ohsuga
第 4 著者 所属(和/英) 電気通信大学(略称:電通大)
The University of Electro-Communications(略称:UEC)
発表年月日 2022-02-28
資料番号 AI2021-24
巻番号(vol) vol.121
号番号(no) AI-382
ページ範囲 pp.71-76(AI),
ページ数 6
発行日 2022-02-21 (AI)