講演名 2007/3/8
二重ジレンマ状態での協調行動の誘発に関する意思決定手法の検討(セッション5:マルチエージェントと複雑系(1),社会システムと知能)
和田 志保美, 鈴木 恵二,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 囚人のジレンマでは、パレート効率的な結果を導き出す協調行動ではなく、ナッシュ均衡をもたらす裏切り行動が確認されることが良く知られている。本論文では、囚人のジレンマをプレーするかしないかという問題自体が囚人のジレンマとしての要素を持つ「二重囚人のジレンマ・ゲーム」を用いてヒトと強化学習エージェントの実験結果を比較する。実験結果から、最終的に協調を選択する場合はヒトも強化学習エージェントもどのようなゲームをプレーするかに関する選好を示さなかった。一方、最終的に裏切りを選択する場合は、どのようなゲームをプレーするかに関する選好を強化学習エージェントが示さなかったのに対し、ヒトでは通常の囚人のジレンマをプレーすることを好んだ。このことから、適切な設計を行うことによってマシンエージェントが協調を選択し、パレート効率的な結果に到達しやすくなることが示唆される。
抄録(英) In this paper, we compare the experimental results of human agent with that of programmed agent using double-bind prisoner's dilemma game, which ordinary prisoner's dilemma game is nested into another dilemma, that is, a player has to decide firstly if s/he will play prisoner's dilemma or not. We find that when cooperation is chosen in the second stage, both human and programmed agents show any preference in what kind of 2x2 game they play. On the other hand, human agents are willing to play ordinary prisoner's dilemma game when they choose defection in the second stage, though programmed agents show any preference in the first stage. This suggests that programmed agents may be cooperators and get close to the Pareto optimal equilibrium in an appropriate setting.
キーワード(和) 二重囚人のジレンマ / 囚人のジレンマ / 強化学習 / 選好
キーワード(英) double-bind prisoner's dilemma game / prisoner's dilemma game / reinforcement learning / preference
資料番号 AI2006-42
発行日

研究会情報
研究会 AI
開催期間 2007/3/8(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Artificial Intelligence and Knowledge-Based Processing (AI)
本文の言語 JPN
タイトル(和) 二重ジレンマ状態での協調行動の誘発に関する意思決定手法の検討(セッション5:マルチエージェントと複雑系(1),社会システムと知能)
サブタイトル(和)
タイトル(英) An examination of emerging cooparation under double-bind dilemma
サブタイトル(和)
キーワード(1)(和/英) 二重囚人のジレンマ / double-bind prisoner's dilemma game
キーワード(2)(和/英) 囚人のジレンマ / prisoner's dilemma game
キーワード(3)(和/英) 強化学習 / reinforcement learning
キーワード(4)(和/英) 選好 / preference
第 1 著者 氏名(和/英) 和田 志保美 / Shihomi WADA
第 1 著者 所属(和/英) 公立はこだて未来大学大学院システム情報科学研究科
Graduate School of Future University-Hakodate, System Information Science
第 2 著者 氏名(和/英) 鈴木 恵二 / Keiji SUZUKI
第 2 著者 所属(和/英) 公立はこだて未来大学システム情報科学部
Future University-Hakodate, Departmemt of System Information Science
発表年月日 2007/3/8
資料番号 AI2006-42
巻番号(vol) vol.106
号番号(no) 586
ページ範囲 pp.-
ページ数 8
発行日