大会名称 |
---|
2010年 情報科学技術フォーラム(FIT) |
大会コ-ド |
F |
開催年 |
2010 |
発行日 |
2010/8/20 |
セッション番号 |
2N |
セッション名 |
エージェント |
講演日 |
2010/09/07 |
講演場所(会議室等) |
N会場(ウエスト2号館3F 大講義室) |
講演番号 |
F-012 |
タイトル |
粗視化を用いないProfit Sharingによる強化学習の効率化 |
著者名 |
細井 健輔, 松井 丈弥, 能登 正人, |
キーワード |
強化学習, Profit Sharing, エージェント |
抄録 |
強化学習の代表的な手法の一つとしてProfit Sharingがある.Profit Sharingは状態数が大きい場合には学習が困難となり,学習の効率が著しく低下するため,状態数が大きくなりやすい実問題への適用は難しい.この問題を解決するために,観測情報の一部を同じ状態であるとみなすことにより,状態数の削減を図る「粗視化」がよく用いられている.しかし状態数の削減を大幅に行うことは,試行錯誤の意義やエージェント間の協調性を失いかねない. 本研究では,粗視化を用いず蓄積された報酬を有効に活用し,割引率に工夫を加えることで学習を高速化,効率化する手法を提案し追跡問題で評価を行う. |
本文pdf |
PDF download (246.6KB) |