講演番号 | 題目/著者 |
---|---|
G-039 | 経験による知識を用いた経路探索方法の学習 土肥 寛基, 六沢 一昭, |
G-040 | 対称性を考慮した強化学習 宇田 健吾, ムレイティ W.ジュキ, |
G-041 | 強化学習におけるマクロルールを用いた内部状態表現法 金澤 勇樹, 栗原 正仁, |
G-042 | マルチタスク学習効率化のためのサブゴール発見法 近藤 賢治, 山内 康一郎, 大森 隆司, |
G-043 | 強化学習における学習の進行度を考慮した政策決定器の一検討 有福 直也, 衣川 大輔, 梶川 嘉延, 野村 康雄, |
LG-004 | Profit Sharingを改良したより効率的な強化学習手法(1) -行動選択確率による報酬割引率決定手法- 長谷川 雄吾, 高田 沙都子, 宮内 新, 荒井 秀一, |
LG-005 | Profit Sharingを改良したより効率的な強化学習手法(2) -Dymnamic Profit Sharingでの合理性の検討- 高田 沙都子, 長谷川 雄吾, 宮内 新, 荒井 秀一, |