2007年 情報科学技術フォーラム(FIT)

講演番号 題目/著者
F-001複素強化学習において行動価値を多重化する効果について

澁谷 長史,  島田 慎吾,  濱上 知樹,  

F-003PS-GTRを用いたマルチエージェント強化学習システムにおけるロバスト性

中畑 一宏,  延澤 志保,  太原 育夫,  

LF-001Profit Sharingの学習の合理性に関する理論的考察

北川 哲,  田村 直之,  

LF-002価値関数族の区間推定を用いた多目的強化学習法

吉田 学,  平岡 和幸,  三島 健稔,