大会名称
2010年 情報科学技術フォーラム(FIT)
大会コ-ド
F
開催年
2010
発行日
2010/8/20
セッション番号
2N
セッション名
エージェント
講演日
2010/09/07
講演場所(会議室等)
N会場(ウエスト2号館3F 大講義室)
講演番号
F-012
タイトル
粗視化を用いないProfit Sharingによる強化学習の効率化
著者名
細井 健輔松井 丈弥能登 正人
キーワード
強化学習, Profit Sharing, エージェント
抄録
強化学習の代表的な手法の一つとしてProfit Sharingがある.Profit Sharingは状態数が大きい場合には学習が困難となり,学習の効率が著しく低下するため,状態数が大きくなりやすい実問題への適用は難しい.この問題を解決するために,観測情報の一部を同じ状態であるとみなすことにより,状態数の削減を図る「粗視化」がよく用いられている.しかし状態数の削減を大幅に行うことは,試行錯誤の意義やエージェント間の協調性を失いかねない.
本研究では,粗視化を用いず蓄積された報酬を有効に活用し,割引率に工夫を加えることで学習を高速化,効率化する手法を提案し追跡問題で評価を行う.
本文pdf
PDF download (246.6KB)