講演名 2007-01-25
クラスタリングを用いた強化学習システムIPMBNの環境変化への適応について(ニューラルネットワーク画像復元及び一般)
北越 大輔, 山口 晃昌, 塩谷 浩之, 中野 良平,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 我々は,複数のベイジアンネット(Bayesian Network: BN)からなる混合モデルを用いた,動的環境におけるエージェントの適応的学習システムIPMBNについて研究を進めてきた.混合モデルを構成するBNは,各環境におけるエージェントの方策を表す確率的知識と見なされる.ネットワーク数増加に伴い情報表現能力の向上が予測される反面,環境変化への適応に要する計算量も増大するため,多様な環境情報を少数のBNで表現可能となることが望ましい.本稿では,クラスタリング技術を用いて多数のBNから混合モデルの適切な構成要素を抽出する手法を導入し,混合モデルの情報表現能力,システムの適応能力等について評価する.
抄録(英) We have proposed an adaptive learning system IPMBN using a mixture of Bayesian networks for agents, and also have investigated its adjustability to dynamic environments. Each component of the mixture (i.e. a Bayesian network) can be regarded as a stochastic knowledge representation corresponding to a policy in environment. The performance to represent the environmental information is considered to increase with the number of BNs incorporated into the mixture; however, greater computational cost is required to constitute the mixture. It is thus disirable that our system can render the environmental information with as less BNs as possible. In this paper, we introduce a clustering algorithm into IPMBN to extract BNs, which are applicable for representing a variety of policies, out of a quantity of BNs, and then discuss the performance of the system.
キーワード(和) ベイジアンネット混合モデル / 利益共有法 / Hellinger Distance / クラスタリング
キーワード(英) Mixture of Bayesian Networks / Profit Sharing / Hellinger Distance / Clustering
資料番号 NC2006-99
発行日

研究会情報
研究会 NC
開催期間 2007/1/18(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Neurocomputing (NC)
本文の言語 JPN
タイトル(和) クラスタリングを用いた強化学習システムIPMBNの環境変化への適応について(ニューラルネットワーク画像復元及び一般)
サブタイトル(和)
タイトル(英) Adaptation of a Reinforcement Learning System IP MBN Using a Clustering Algorithm to Environmental Changes
サブタイトル(和)
キーワード(1)(和/英) ベイジアンネット混合モデル / Mixture of Bayesian Networks
キーワード(2)(和/英) 利益共有法 / Profit Sharing
キーワード(3)(和/英) Hellinger Distance / Hellinger Distance
キーワード(4)(和/英) クラスタリング / Clustering
第 1 著者 氏名(和/英) 北越 大輔 / Daisuke KITAKOSHI
第 1 著者 所属(和/英) 名古屋工業大学大学院工学研究科
Graduate School of Engineering, Nagoya Institute of Technology
第 2 著者 氏名(和/英) 山口 晃昌 / Terumasa YAMAGUCHI
第 2 著者 所属(和/英) 室蘭工業大学工学部
Faculty of Engineering, Muroran Institute of Technology
第 3 著者 氏名(和/英) 塩谷 浩之 / Hiroyuki SHIOYA
第 3 著者 所属(和/英) 室蘭工業大学工学部
Faculty of Engineering, Muroran Institute of Technology
第 4 著者 氏名(和/英) 中野 良平 / Ryohei NAKANO
第 4 著者 所属(和/英) 名古屋工業大学大学院工学研究科
Graduate School of Engineering, Nagoya Institute of Technology
発表年月日 2007-01-25
資料番号 NC2006-99
巻番号(vol) vol.106
号番号(no) 500
ページ範囲 pp.-
ページ数 6
発行日