講演名 2021-02-12
サッカータスクの協調行動獲得におけるカリキュラム学習を用いた強化学習
阿部 宇志(電通大), 折原 良平(電通大), 清 雄一(電通大), 田原 康之(電通大), 大須賀 昭彦(電通大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本研究では, サッカータスクでの協調行動を促すため, カリキュラム学習を用いた強化学習の研究を行った.サッカータスクは報酬がスパースなタスクであるため, どんな行動が報酬や罰につながるかを明確にすることが難しく, 状態の多さや行動の複雑さから学習が困難になる. そのため, 内発的動機付けのような学習を促すアプローチの研究が多く行われている. 本研究では, 簡単なタスクから学習を始め, 徐々に難しいタスクを学習させる, カリキュラム学習を強化学習と組み合わせることで協調行動獲得の学習の効率化を目指した. これまでのサッカータスクにおけるカリキュラム学習は協調行動の獲得に関して研究が行われてこなかった. カリキュラム学習で協調行動を学習させるために, 本稿では人が行うサッカーの練習に似せて, コーンのような障害物を敵に見立てることや段階的に敵のエージェントを増やすことで, タスクを難しくしてカリキュラム学習を行った. 実験ではシュートチャンスでの2 体のエージェントの協調行動を試みた学習を行い, カリキュラム学習をした場合がカリキュラム学習をしなかった場合に比べて, 目標達成率を上回ることを示した.
抄録(英)
キーワード(和) サッカー / マルチエージェント強化学習 / カリキュラム学習 / MuJoCo
キーワード(英)
資料番号 AI2020-37
発行日 2021-02-05 (AI)

研究会情報
研究会 AI
開催期間 2021/2/12(から1日開催)
開催地(和) オンライン開催
開催地(英) Online
テーマ(和) 「データ市場特集VII:生活防災とコミュニティ・デザイン」および一般
テーマ(英)
委員長氏名(和) 福田 直樹(静岡大)
委員長氏名(英) Naoki Fukuta(Shizuoka Univ.)
副委員長氏名(和) 清 雄一(電通大) / 櫻井 祐子(産総研)
副委員長氏名(英) Yuichi Sei(Univ. of Electro-Comm.) / Yuko Sakurai(AIST)
幹事氏名(和) 大囿 忠親(名工大) / 藤田 桂英(東京農工大)
幹事氏名(英) Tadachika Ozono(Nagoya Inst. of Tech.) / Katsuhide Fujita(Tokyo Univ. of Agriculture and Technology)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Technical Committee on Artificial Intelligence and Knowledge-Based Processing
本文の言語 JPN-ONLY
タイトル(和) サッカータスクの協調行動獲得におけるカリキュラム学習を用いた強化学習
サブタイトル(和)
タイトル(英)
サブタイトル(和)
キーワード(1)(和/英) サッカー
キーワード(2)(和/英) マルチエージェント強化学習
キーワード(3)(和/英) カリキュラム学習
キーワード(4)(和/英) MuJoCo
第 1 著者 氏名(和/英) 阿部 宇志 / Takashi Abe
第 1 著者 所属(和/英) 電気通信大学(略称:電通大)
The University of Electro-Communications(略称:UEC)
第 2 著者 氏名(和/英) 折原 良平 / Ryohei Orihara
第 2 著者 所属(和/英) 電気通信大学(略称:電通大)
The University of Electro-Communications(略称:UEC)
第 3 著者 氏名(和/英) 清 雄一 / Yuichi Sei
第 3 著者 所属(和/英) 電気通信大学(略称:電通大)
The University of Electro-Communications(略称:UEC)
第 4 著者 氏名(和/英) 田原 康之 / Yasuyuki Tahara
第 4 著者 所属(和/英) 電気通信大学(略称:電通大)
The University of Electro-Communications(略称:UEC)
第 5 著者 氏名(和/英) 大須賀 昭彦 / Akihiko Ohsuga
第 5 著者 所属(和/英) 電気通信大学(略称:電通大)
The University of Electro-Communications(略称:UEC)
発表年月日 2021-02-12
資料番号 AI2020-37
巻番号(vol) vol.120
号番号(no) AI-362
ページ範囲 pp.79-84(AI),
ページ数 6
発行日 2021-02-05 (AI)