講演名 2004/10/12
BN混合モデルを用いたオンライン型方策改善システムの動的環境への適応(<特集>ベイジアンネット2 : ポスターセッション)
北越 大輔, 塩谷 浩之, 中野 良平,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 我々は,ベイジアンネット(Bayesian Network:BN)混合モデルを用いた強化学習エージェントの方策改善システムを提案した.BN混合モデルは,エージェントの存在する環境に対応する確率的知識表現と見なされる.本稿では,自律的に環境変化の認識とモデルの混合率学習を行う機構を上述のシステムに付加した,オンライン型方策改善システムを紹介する.エージェントナビゲーション問題を適用例として計算機実験を行い,複数環境に対応するBNを混合して方策改善に利用することで,未知環境を含む環境変化にエージェントが適応可能となることを示す.加えて,混合モデルを利用した方策改善法の特性について議論する.
抄録(英) We have proposed a system improving reinforcement learning agents' policies by using a mixture model of Bayesian Networks (BNs). Each BN in the mixture model corresponds to a stochastic knowledge of an environment. In this paper, we introduce autonomous mechanisms for recognizing changes of environments, and for learning mixing rates of BNs in the mixture model, to the above system. Computer simulations in the agent navigation problem are carried out in order to discuss the adaptability of our online policy-improving system to dynamic environments and properties of the policy-improving procedure.
キーワード(和) ベイジアンネット混合モデル / 確率的知識 / 方策改善システム / 利益共有法
キーワード(英) Mixture model of Bayesian Networks / Stochastic knowledge / Policy-improving system / Profit sharing
資料番号 NC2004-71
発行日

研究会情報
研究会 NC
開催期間 2004/10/12(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Neurocomputing (NC)
本文の言語 JPN
タイトル(和) BN混合モデルを用いたオンライン型方策改善システムの動的環境への適応(<特集>ベイジアンネット2 : ポスターセッション)
サブタイトル(和)
タイトル(英) Adaptation of the Online Policy-Improving System by using a Mixture Model of Bayesian Networks to Dynamic Environments
サブタイトル(和)
キーワード(1)(和/英) ベイジアンネット混合モデル / Mixture model of Bayesian Networks
キーワード(2)(和/英) 確率的知識 / Stochastic knowledge
キーワード(3)(和/英) 方策改善システム / Policy-improving system
キーワード(4)(和/英) 利益共有法 / Profit sharing
第 1 著者 氏名(和/英) 北越 大輔 / Daisuke KITAKOSHI
第 1 著者 所属(和/英) 名古屋工業大学大学院工学研究科
Graduate School of Engineering, Nagoya Institute of Technology
第 2 著者 氏名(和/英) 塩谷 浩之 / Hiroyuki SHIOYA
第 2 著者 所属(和/英) 室蘭工業大学工学部
Faculty of Engineering, Muroran Institute of Technology
第 3 著者 氏名(和/英) 中野 良平 / Ryohei NAKANO
第 3 著者 所属(和/英) 名古屋工業大学大学院工学研究科
Graduate School of Engineering, Nagoya Institute of Technology
発表年月日 2004/10/12
資料番号 NC2004-71
巻番号(vol) vol.104
号番号(no) 349
ページ範囲 pp.-
ページ数 6
発行日