講演名 2023-12-26
転移学習エージェントにおける局所方策の選択的再利用法の提案
濱田 大也(千葉工大), 齊藤 史哲(千葉工大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 近年AIの行動獲得に対して強化学習が注目されている.強化学習にはタスクの複雑化に伴い試行数が増加する問題がある.これを回避するため,事前に学習した知識を再利用し,試行数を減らす転移学習が注目されている.転移学習の方法の一つに適用可能な知識をランダム選択するεTグリーディがある.しかし,転移する知識の選択において再利用するべき知識とそうでない知識を同等に扱ってしまい,余分な行動選択が増えるという課題がある.そこで,本研究では選択するべき知識に価値を付与し,選択確率に比例させる方法を提案する.
抄録(英) In recent years, reinforcement learning has gained attention for its application in acquiring AI behaviors. One challenge associated with reinforcement learning is the increase in the number of trials as tasks become more complex. To address this issue, transfer learning, which involves leveraging pre-learned knowledge to reduce the number of trials, has become a focus of interest. One method within transfer learning is εT-greedy, where applicable knowledge is randomly selected.However, a challenge arises in the selection of knowledge to transfer, as εT-greedy treats reusable and non-reusable knowledge equally, leading to an increase in unnecessary action selections. Therefore, this study proposes a method that assigns value to the knowledge to be selected and scales the selection probability accordingly.
キーワード(和) 強化学習 / 転移学習 / εT-greedy / 知識の干渉
キーワード(英) Reinforcement learning / transfer learning / εT-greedy / knowledge interference
資料番号 DE2023-29
発行日 2023-12-19 (DE)

研究会情報
研究会 DE / IPSJ-DBS
開催期間 2023/12/26(から1日開催)
開催地(和) 東京大学生産技術研究所
開催地(英) Institute of Industrial Science, The University of Tokyo
テーマ(和) データ工学・データベースシステムとエンターテイメントおよび一般
テーマ(英)
委員長氏名(和) 豊田 正史(東大) / 天笠 俊之(筑波大学)
委員長氏名(英) Masashi Toyoda(Univ. of Tokyo) / 天笠 俊之(筑波大学)
副委員長氏名(和) 鷹野 孝典(神奈川工科大) / 渡辺 知恵美(お茶の水女子大)
副委員長氏名(英) Kosuke Takano(Kanagawa Inst. of Tech.) / Chiemi Watanabe(Ochanomizu Univ.)
幹事氏名(和) 本多 賢(駒澤大) / 塩川 浩昭(筑波大) / 佐々木 勇和(大阪大学) / 小林 亜樹(工学院大学) / 清水 敏之(九州大学) / 莊司 慶行(青山学院大学) / 杉浦 健人(名古屋大学) / 中島 伸介(京都産業大学)
幹事氏名(英) Ken Honda(Komazawa Univ.) / Hiroaki Shiokawa(Univ. of Tsukuba) / 佐々木 勇和(大阪大学) / 小林 亜樹(工学院大学) / 清水 敏之(九州大学) / 莊司 慶行(青山学院大学) / 杉浦 健人(名古屋大学) / 中島 伸介(京都産業大学)
幹事補佐氏名(和) 駒水 孝裕(名大) / Le Hieu Hanh(お茶の水女子大学)
幹事補佐氏名(英) Takahiro Komamizu(Nagoya Univ.) / Le Hieu Hanh(お茶の水女子大学)

講演論文情報詳細
申込み研究会 Technical Committee on Data Engineering / Special Interest Group on Database System
本文の言語 JPN
タイトル(和) 転移学習エージェントにおける局所方策の選択的再利用法の提案
サブタイトル(和)
タイトル(英) A study on selective reuse of local policies in transfer learning agents
サブタイトル(和)
キーワード(1)(和/英) 強化学習 / Reinforcement learning
キーワード(2)(和/英) 転移学習 / transfer learning
キーワード(3)(和/英) εT-greedy / εT-greedy
キーワード(4)(和/英) 知識の干渉 / knowledge interference
第 1 著者 氏名(和/英) 濱田 大也 / Hiroya Hamada
第 1 著者 所属(和/英) 千葉工業大学大学院(略称:千葉工大)
Chiba Institute of Technology(略称:CIT)
第 2 著者 氏名(和/英) 齊藤 史哲 / Fumiaki Saitoh
第 2 著者 所属(和/英) 千葉工業大学(略称:千葉工大)
Chiba Institute of Technology(略称:CIT)
発表年月日 2023-12-26
資料番号 DE2023-29
巻番号(vol) vol.123
号番号(no) DE-327
ページ範囲 pp.7-11(DE),
ページ数 5
発行日 2023-12-19 (DE)