講演名 2021-02-22
深層強化学習におけるカリキュラム学習の適用に関する一考察
小高 郁実(千葉工大), 齊藤 史哲(千葉工大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 近年,深層強化学習は従来の強化学習と比較して,より高次元の環境に適用することが可能となり注目を集めている.しかし,特に高次元かつ報酬が疎なタスクにおいては行動獲得において試行数が増加することが課題となる.そこで本研究では学習速度の向上を目的とし,タスクの難易度を段階的に変更することで学習性能を向上させるカリキュラム学習をシューティングゲームAIの行動獲得において適用し,実験を行なった.カリキュラム学習の適用の有無における学習性能の比較を行い,実験的な評価を通じてシューティングゲームAIの行動獲得の高速化を確認した.また,その他のタスクへの発展やカリキュラム自動生成のアルゴリズムについての検討,考察を行なった.
抄録(英) Deep reinforcement learning is attracting attention because it can be applied to higher-dimensional environments compared to conventional reinforcement learning. However, an important issue is to increase the number of trials required for action acquisition, particularly in high-dimensional and sparsely rewarded tasks. Therefore, in this study, we applied curriculum learning, which improves learning performance by gradually changing the difficulty level of tasks, in the action acquisition in a shooting game AI. Through experimental evaluation, we verified the speeding up of action acquisition and considered the transition of difficulty and its efficiency.
キーワード(和) 深層強化学習 / カリキュラム学習 / Deep Q-Network / ゲームAI
キーワード(英) Deep Reinforcement Learning / Curriculum Learning / Deep Q-Network / Game AI
資料番号 AI2020-47
発行日 2021-02-15 (AI)

研究会情報
研究会 AI
開催期間 2021/2/22(から1日開催)
開催地(和) オンライン開催
開催地(英) Online
テーマ(和) 「Web/IoTインテリジェンス」および一般
テーマ(英) Web/IoT Intelligence, etc.
委員長氏名(和) 福田 直樹(静岡大)
委員長氏名(英) Naoki Fukuta(Shizuoka Univ.)
副委員長氏名(和) 清 雄一(電通大) / 櫻井 祐子(産総研)
副委員長氏名(英) Yuichi Sei(Univ. of Electro-Comm.) / Yuko Sakurai(AIST)
幹事氏名(和) 大囿 忠親(名工大) / 藤田 桂英(東京農工大)
幹事氏名(英) Tadachika Ozono(Nagoya Inst. of Tech.) / Katsuhide Fujita(Tokyo Univ. of Agriculture and Technology)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Technical Committee on Artificial Intelligence and Knowledge-Based Processing
本文の言語 JPN
タイトル(和) 深層強化学習におけるカリキュラム学習の適用に関する一考察
サブタイトル(和) シューティングゲームAIを例に
タイトル(英) A Study on the Application of Curriculum Learning in Deep Reinforcement Learning
サブタイトル(和) action acquisition in shooting game AI as an example
キーワード(1)(和/英) 深層強化学習 / Deep Reinforcement Learning
キーワード(2)(和/英) カリキュラム学習 / Curriculum Learning
キーワード(3)(和/英) Deep Q-Network / Deep Q-Network
キーワード(4)(和/英) ゲームAI / Game AI
第 1 著者 氏名(和/英) 小高 郁実 / Ikumi Kodaka
第 1 著者 所属(和/英) 千葉工業大学大学院(略称:千葉工大)
Chiba Institute of Technology(略称:CIT)
第 2 著者 氏名(和/英) 齊藤 史哲 / Fumiaki Saito
第 2 著者 所属(和/英) 千葉工業大学(略称:千葉工大)
Chiba Institute of Technology(略称:CIT)
発表年月日 2021-02-22
資料番号 AI2020-47
巻番号(vol) vol.120
号番号(no) AI-379
ページ範囲 pp.47-52(AI),
ページ数 6
発行日 2021-02-15 (AI)