文摘
另一个纳什均衡(NE)提出了二人,在标准形式一次性说明性的游戏,结果是由仲裁者。东北是根本的解决方案的概念在非合作的博弈理论。它是基于假设球员是完全自私的。然而,NEs往往不是在实践中,所以我们现在合作的双重概念作为一种替代解决方案的仲裁者可以分配玩家的行动。在这种双重平衡(DE),每个球员在对方的最大利益。我们正式定义的游戏和德,然后总结了二元性的NE和德两名球员之间的关系。我们还应用DE一些说明性的游戏,比较其他的结果。
1。介绍
博弈论是研究战略代理叫玩家之间的交互。最终它涉及一个解决方案的概念来描述,预测,或开这些玩家的选择1]。现代游戏理论(2,3)主要是合作的,假定任何球员的共同理性的行动必须是一个纳什均衡(NE) [1- - - - - -5]。换句话说,理性的球员在他们的个人利益。每个玩家的行动最大化回报其他玩家的行动。结果是,没有球员可以提高他的预期收益单方面改变自己的策略。的各种细化NE (2,3)已经提出,但是玩家可以经常做的更好合作。社会困境如囚徒困境、吹雪和最后通牒游戏(6- - - - - -9)说明,自私的行为可能与群体利益冲突。
为了解决这些问题,我们认为这只有一次的,两人的游戏在标准形式,结果是由仲裁者。在本文中,我们提供一个替代方法的仲裁者分配玩家的行动。我们的框架是说明性的,因为非合作的游戏往往不满足的假设在实践中,因为结果往往是受到外力的影响。仲裁者可以分配合理的行动,双方球员将杜绝自私的球员自己选择的策略。纯策略强调。混合策略有些问题解释(1,10)非合作的游戏,但对于只有一次的博弈更当仲裁者为每个球员必须指定一个行动。
节2我们定义的游戏,每个玩家的双重平衡(DE)在对方的最大利益。节3我们描述如何获得纯DEs和现在的一些例子。节4我们总结DE和NE之间的对偶关系,不延伸到一次性的游戏超过两名球员。节5我们认为零和游戏的特殊情况。节6我们目前的结论和讨论未来的工作。
2。双平衡
让表示两人,一次性的游戏范式,是支付矩阵冯Neumann-Morgenstern (VNM)公用事业的球员我当玩家扮演纯策略和球员II纯策略。同样的,是支付矩阵玩家二世。规范的机制是一个仲裁者,他对球员们赋予一个唯一的行动为自己的一次机会。仲裁者可以一个人或一组人。例如,它可能是一个授权的专利许可协议。仲裁者选择也可以一个人在正式的法律规则仲裁。可能是计算机算法实时决策在一个网站上球员已经同意其条款和条件,以及政策由政府机构在某些部分的人口。摘要仲裁者将纯德策略分配给这两名球员。因此,仲裁者甚至可以两名球员之间的默契基于社会压力,要求球员们应该无私地合作。在这种情况下,基于社会压力的共同理性的概念纳入DE。当是隐式的,因为在这样一个协议,只是被称为游戏吗。如果有多个纯DEs,我们假设仲裁者选择一个独特的一个。无论如何,一个策略交办是一个平衡的球员不能改变规定的行为。
一个NE和德下一个定义的混合策略。让是我和混合策略集的球员第二组混合策略的球员。
定义1 (NE)。混合策略对是一个不当且仅当
定义2(反)。混合策略对是一个德当且仅当
定义1和2描述之间的二元性的一个方面不德,这是球员的反对行为。在(1)每个玩家自私对其他球员的东北战略,以自己的期望效用最大化。在(2)每个玩家无私地回应德战略的其他玩家,其他玩家的期望效用最大化。换句话说,在一个不能没有球员可以提高他的回报单方面改变策略。在德单方面改变玩家的策略不能改善其他玩家的收益。德是一种mutual-max结果用于(11,1282页)在定义一个公平的平衡。联合均衡(我),既是NE和德,包含了自私和无私的结果。它是一个特例的拉宾公平均衡。
3所示。计算纯DEs
纯NEs和DEs的概念很容易获得比赛的遗憾和失望。后悔函数转换球员VNM公用事业的纯策略的损失函数。对于一个固定的纯策略第二的球员,球员使用纯策略的我的后悔后悔函数值吗。玩家二世,。的bimatrix因此可以变成了遗憾bimatrix吗有相同的NEs [5]随着bimatrix。特别是,一双纯策略是一个当且仅当相应的条目在吗。同样,bimatrix可以转化为失望矩阵,失望的球员可能会是后悔的其他球员。对于一个固定的纯策略的球员,球员我失望的球员二世的使用纯策略我是球员的失望函数值吗,而玩家二世。命题的证明3下面是类似于(5]表明NEs一样吗。
命题3。 DEs一样吗,一双纯策略是当且仅当相应的条目在吗。
示例4(囚徒困境博弈)。表1给出了矩阵,,从左到右的“囚徒困境”游戏(6),这两名球员因犯罪被捕,关押在单独的房间。合作意味着否认球员有任何参与犯罪。缺陷意味着发誓,其他球员犯了罪。对于每个策略对,VNM效用表示年在监狱中度过。在一个规定的游戏版本,仲裁者可能是一个律师代表球员和审问时告诉他们如何应对。有一个纯NE(缺陷、缺陷)的回报主要是(12)的回报纯德(合作,合作)。极大极小的结果(2),每个玩家的行动最大化他的最低回报造成其他玩家的行动,是NE(缺陷、缺陷)。
示例5(雪堆博弈)。表2给了,,的雪堆博弈涉及两个司机被困的两侧雪堆阻塞道路。每个人都有选择呆在他的车或铲雪清理路径。雪堆博弈已经表示,更实际地反映社会情况下,人类面临比囚徒困境7]。在一个规范的版本的游戏,两个司机可能是邻居,仲裁者可能是社会压力和保持好的合作将在球员的未来互动的邻居。纯NEs(铲、拒绝)和(拒绝,铲子)。纯德(铲,铲)。极大极小的结果是德(铲,铲),与此形成鲜明对比的是东北的例子4。还有一个混合NE和德。
例子6(我)。考虑到矩阵,,的表3。该策略对是我,但是呢为由德与回报所以不是帕累托最优(12]。然而,这是一个拉宾公平均衡。仲裁者处方纯德将分配的球员。任何结果或行表3是一个极大极小的结果。这包括但不是我。
4所示。二元性的关系
现在我们总结的NE和德之间的对偶关系存在两人游戏。下面的命题遵循立即从定义。
定义7。二人游戏玩家我像列第二行球员和球员球员的双重游戏与球员我也行球员和球员第二列的球员。
8号提案。双重的双重游戏的游戏是。
定义9。为bimatrix,它的交换矩阵定义为。表示的交换矩阵和通过和,分别。
命题10。 和。因此,DEs的集合NEs的设置吗,NEs的集合DEs的设置吗。
在定义的双重游戏7球员们为彼此玩耍。命题10意味着任何计算方法和存在属性为双人DEs双人的NEs也有效。特别是,找到一个NE的计算方法因此可以用来找到德。此外,存在因为一个不存在的(2]。游戏超过两名球员,但是不要表现出这样的二元性。
5。零和游戏
找到DEs的零和游戏我们只需要考虑的矩阵的球员我为零和NEs而言。命题11国家标准的东北版的极小极大定理(13]的零和游戏(3与德)下面比较版本规定(4)。的证明(4从()之前,立即3)和命题10。
命题11。考虑到零和游戏。然后有一个值这样不 此外,存在一个价值w,德,
命题11断言一个纯德获得零和游戏当行球员我的极大极小值等于二列的极大极小值的球员。这种情况是完全相反的标准方法寻找纯零和NEs,也称为鞍点。应该注意的是,值在(3)可能更大,小,或等于价值在(4)。此外,它遵循从命题10线性程序寻找混合策略和y零和博弈的是相同的线性程序(2)寻找混合策略和y分别的双重游戏。换句话说,在线性程序所取代。
示例12。考虑到矩阵的零和游戏是在表4。没有纯粹的东北。单一混合NE和的预期收益4球员。另一方面,单一DE发生在从下面讨论的命题11。在我是6的极小极大回报玩家,玩家的极大极小回报II因此6。在这个例子中,纯为球员二世德似乎不那么好球员i仲裁者从德可能会分配一些结果不同。
6。结论
在本文中,我们定义了两人,一次性的游戏,以及合作双纳什均衡。说明性的游戏允许其他因素比球员本身的影响结果,也让nonselfish行为被看作是理性的。特别是德有时会让球员们更好的回报比NE和仲裁者可能因此成为一个更好的选择纯策略分配给玩家。不幸的可能,没有纯粹的德或没有一个令人满意的仲裁者。未来的研究应该解决这些问题。一种可能性是一个标量均衡为(14]给出了一个合理的结果在纯策略。此外,德应该研究了n人游戏。
利益冲突
作者宣称没有利益冲突有关的出版。