講演名 2001/1/4
強化学習型情報処理における人間の行動決定について
藤崎 恵美子, 松本 健一, 井上 克郎,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本研究では, 強化学習研究における探索(exploration)と搾取(exploitation)のトレードオフ状況において, 人間がどのように行動決定を行っているか, そして行動決定に関わる学習要因は何かを探るため実験を行った.その結果, 個人により行動方略の違いがあること, また, 個人内に「これだけは確保しておきたい」という報酬の最低量の基準の存在が示唆された.学習者は自身の持つ「最低基準量」に現在までの報酬が達しているかどうかを確認しながら, 残り行動数を見て方略を決定していると考えられる.
抄録(英) Trade-off between "exploration"and "exploitation"is one of the unsolved problems in the reinforcement learning.In this paper, we experiment on nine subjects with reinforcement learning task to specify the factors with which lerners deside their strategy.As the result of the experiment, strategies of learners can be classified into five groups.In addition, we found three major factors in deciding their action ; "the target rewards of the task", "the residual number of actions in the task", and "the current rewards of the task".
キーワード(和) 探索(exploration)と搾取(exploitation)のトレードオフ / 行動方略 / 報酬の最低基準量
キーワード(英) trade-off between "exploration"and "exploitation" / action strategy / target rewards
資料番号 AI2000-64
発行日

研究会情報
研究会 AI
開催期間 2001/1/4(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Artificial Intelligence and Knowledge-Based Processing (AI)
本文の言語 JPN
タイトル(和) 強化学習型情報処理における人間の行動決定について
サブタイトル(和)
タイトル(英) Decision-Making of Human Information Processing on Reinforcement Learning Task
サブタイトル(和)
キーワード(1)(和/英) 探索(exploration)と搾取(exploitation)のトレードオフ / trade-off between "exploration"and "exploitation"
キーワード(2)(和/英) 行動方略 / action strategy
キーワード(3)(和/英) 報酬の最低基準量 / target rewards
第 1 著者 氏名(和/英) 藤崎 恵美子 / Emiko Fujisaki
第 1 著者 所属(和/英) 奈良先端科学技術大学院大学 情報科学研究科
Graduate School of Information Science Nara Institute of Science and Technology
第 2 著者 氏名(和/英) 松本 健一 / Ken-ichi Matsumoto
第 2 著者 所属(和/英) 奈良先端科学技術大学院大学 情報科学研究科
Graduate School of Information Science Nara Institute of Science and Technology
第 3 著者 氏名(和/英) 井上 克郎 / Katsuro Inoue
第 3 著者 所属(和/英) 大阪大学 大学院基礎工学研究科
Graduate School of Engineering Science, Osaka University
発表年月日 2001/1/4
資料番号 AI2000-64
巻番号(vol) vol.100
号番号(no) 530
ページ範囲 pp.-
ページ数 6
発行日