2003年 情報科学技術フォーラム(FIT)

講演番号 題目/著者
G-039経験による知識を用いた経路探索方法の学習

土肥 寛基,  六沢 一昭,  

G-040対称性を考慮した強化学習

宇田 健吾,  ムレイティ W.ジュキ,  

G-041強化学習におけるマクロルールを用いた内部状態表現法

金澤 勇樹,  栗原 正仁,  

G-042マルチタスク学習効率化のためのサブゴール発見法

近藤 賢治,  山内 康一郎,  大森 隆司,  

G-043強化学習における学習の進行度を考慮した政策決定器の一検討

有福 直也,  衣川 大輔,  梶川 嘉延,  野村 康雄,  

LG-004Profit Sharingを改良したより効率的な強化学習手法(1) -行動選択確率による報酬割引率決定手法-

長谷川 雄吾,  高田 沙都子,  宮内 新,  荒井 秀一,  

LG-005Profit Sharingを改良したより効率的な強化学習手法(2) -Dymnamic Profit Sharingでの合理性の検討-

高田 沙都子,  長谷川 雄吾,  宮内 新,  荒井 秀一,