講演名 2012-06-19
情報理論的観点からのソフトマックス行動選択における変数設定の改良(機械学習一般とその応用)
岩田 一貴,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 強化学習における行動選択の政策を表す際に最もよく使われるソフトマックス行動選択に焦点を当てる.様々な文献で提案されているような複雑な行動選択方法に比べて,ソフトマックス行動選択は実装が容易で,調整が必要なパラメータが本質的にただ一つのみで扱いやすいという利点がある.にもかかわらず,環境に合わせてそのパラメータを適当に調整すれば,実際には十分に機能する.そこで,本論文では,そのパラメータ調整にかかるコストを軽減させるため,最良パラメータ周辺の帯域幅が広がるようにソフトマックス行動選択の変数設定方法を改良する.様々なタイプのタスクを用いて,その変数設定方法が最良パラメータ周辺の帯域幅を広げるのに有効であることを示す.
抄録(英) We focus on softmax selection which is the most popular description of the policy for action selection in reinforcement learning. Compared with other sophisticated methods in the literature, it is easy to implement and simple because there is essentially only one parameter that needs to be tuned. Moreover, it is often adequate in practice when the parameter is set appropriately for the environment. In this paper, we improve its variable setting to extend the bandwidth around the best parameter so that we can save time and cost in the implementation and parameter-tuning. Using various types of tasks, we show that our setting is effective in extending the bandwidth.
キーワード(和) 強化学習 / ソフトマックス行動選択 / 情報理論
キーワード(英) reinforcement learning / softmax selection / information theory
資料番号 IBISML2012-4
発行日

研究会情報
研究会 IBISML
開催期間 2012/6/12(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Information-Based Induction Sciences and Machine Learning (IBISML)
本文の言語 ENG
タイトル(和) 情報理論的観点からのソフトマックス行動選択における変数設定の改良(機械学習一般とその応用)
サブタイトル(和)
タイトル(英) Improving the Variable Setting of Softmax Selection From an Information-Theoretic Viewpoint
サブタイトル(和)
キーワード(1)(和/英) 強化学習 / reinforcement learning
キーワード(2)(和/英) ソフトマックス行動選択 / softmax selection
キーワード(3)(和/英) 情報理論 / information theory
第 1 著者 氏名(和/英) 岩田 一貴 / Kazunori IWATA
第 1 著者 所属(和/英) 広島市立大学大学院情報科学研究科
Graduate School of Information Sciences, Hiroshima City University
発表年月日 2012-06-19
資料番号 IBISML2012-4
巻番号(vol) vol.112
号番号(no) 83
ページ範囲 pp.-
ページ数 8
発行日