共同进化的人工代理使用进化计算的讨价还价的游戏

文摘

讨价还价的博弈分析使用进化计算领域的博弈论问题至关重要。探讨异质人工代理之间的交互和共同进化过程使用进化计算(EC)的讨价还价的游戏。特别是,游戏性能对回报的互动和共同进化剂进行了研究。我们提出三种基于电子商务代理(EC-agent)参与讨价还价的游戏:遗传算法(GA),粒子群优化(PSO)和差分进化(DE)。代理的性能对于改变条件进行比较。从仿真结果发现PSO-agent优于其他代理。

1。介绍

当前讨价还价的游戏的研究建立了理论模型的基础上斯特尔(1和鲁宾斯坦2]。博弈论、经济学家、心理学家和计算机科学家已经开始分析底层讨价还价的现象可以应用在电子商务应用程序3],谈判问题[4),和争端解决5),等等。这个游戏似乎非常简单,但结果是模糊的和有争议的。

在过去的几年中,相当数量的研究一直在进行建模的讨价还价的游戏使用人工代理交互在同类人群中。然而,很少的尝试一直在研究异质种群之间的相互作用。Matwin等人设计了一个谈判支持系统(NSS),解决了多个问题通过的规则(分类),学会了通过GA从而支持党讨价还价的游戏(6]。同时,利用进化策略、页面等人提出了一个广义自适应动态框架,可以处理游戏的回报不是可微的7]。van Bragt和La Poutre制定谈判策略有限自动机协同进化遗传算法来区分不同的对手没有任何信息的身份或偏好(同行8]。Takadama等人提出三种学习讨价还价模型基于进化策略(ES)、学习分类器系统(LCS),强化学习(RL)的策略。他们在研究评估异质群体交互(9]。钟山等人试图表明,人工代理与RL战略可以演变对固定规则和旋转规则与更好的性能(10]。库珀等人进一步利用RL策略的观察学习的支持者和受访者的相对速度(11]。Grosskopf研究RL的综合效应和定向学习(DL)策略为了比较的结果只有一次的讨价还价的游戏支持和不同受访者和表明,该策略可以共同进化12]。

上面的研究都集中在人工代理模型的有效性和比较同质性互动的结果。然而,这些研究在同质性互动是保守的方法由于现实世界的讨价还价的游戏的原因,旨在分析交易中存在许多与多元化的倾向和行为倾向,描述各种各样的代理。

在本文中,我们继续学习交互的代理异构人口。我们实验中三种基于进化计算的代理讨价还价的游戏了。从实验我们确定有哪些主要参数和他们如何影响结果的讨价还价的游戏。同样的行动模式的人工代理根据他们的策略进行了分析。特别是,EC-agents之间的讨价还价的游戏进行了观察和共同进化的交互。

本文的组织结构如下:部分2简要回顾了连续的讨价还价的游戏。接下来的部分概述了人工代理的设计考虑。节4EC-agents之间的共同进化模型。仿真结果中演示了一节5。最后,本文结尾部分的一些言论6。

2。连续的讨价还价的游戏

连续的讨价还价的游戏是游戏一个部门两名球员之间的一个固定的金额。存在无数的纳什均衡根据博弈论讨价还价的游戏现在完美的平衡,最后使提案的支持者ε非零的最低数量,对应和被申请人总是接受任何以来最小的方案ε比一个空的需求。但实验证据与这种策略是因为总统的支持者倾向于提供比非合作的博弈理论预测,和受访者拒绝提供。提供较低的拒绝被申请人可以被视为惩罚。受访页面等人,“一些60 ~ 80%的支持者提供分数在0.4和0.5之间,而只有3%小于0.2。他们建议做这的确,约50%的受访者反对任何分裂为他们提供不到三分之一的总和”7,13- - - - - -15]。似乎差异博弈论和实验数据结果公平的概念和理性的缺乏常识16- - - - - -18]。最近,大量的研究已经进行讨价还价的游戏的分析通过使用人工代理(19- - - - - -21]。

简要回顾,在这方面,遵循。然而,在这之前我们喜欢回顾以下条款清晰。(我)回报:从游戏代理收到奖励。(2)控制参数:EC-agents因素可以影响代理游戏的性能。(3)顺序游戏:由多个回合的比赛。

3所示。人工代理模型

在本节中,我们将讨论潜在的讨价还价的游戏现象相对于仿真模型。游戏开始随机的,也就是说,以同样的概率,决定支持和被调查者。支持选择一个建议0到10之间的一个实数,支持者能够支付金额是圆的。被申请人选择一个最小可接受的需求,这也是一个实数0和10之间。如果这个提议是超过需求,也就是说,如果,那么赢得支持者,被申请人的收入。如果提案不被接受,也就是说,如果交换,然后两名球员的状态和设置在圆的。最后如果两个玩家之间的交易是失败的在最后一轮,也就是说,在我们的实验中,然后每个玩家赚null。

我们介绍三种人工代理发展策略使用遗传算法(GA),粒子群优化(PSO)和差分进化(DE)。这些ECs基于任意初始化人口试验解决方案,通过每个电子商务运营商发展走向更好的解决方案。

图1显示了一个EC-agent叫做解决方案,策略,向量,和位置。讨价还价的游戏中,重要的是是否玩家开始第一个事务或被作为一个支持者,因此每种策略由两个向量。第一个向量代表一个策略来把一个EC-agent在第一位置和第二个支持者被第一个位置。当代理是第一个支持者,第一行作为其战略,否则,第二行。

(一)1日支持者

(b)第一被申请人

3.1。GA-Agent模型

遗传算法(GA)是一种搜索算法基于自然系统的机制,也就是说,适者生存的法则(22]。GA运营商包括选择、交叉和变异。健身价值的个体解决方案是衡量回报GA-agent挣的讨价还价的游戏。

在GA-agent,我们使用一个锦标赛选择、算术交叉和变异,遗传算法操作符。锦标赛选择是一个选择的方法,拿起两个解随机从当前人口和他们之间选择一个赢家(23]。算术交叉是一个交叉的方法,每个基因的后代的平均价值两个父母的基因。至于突变,我们使用初始化基因的方法。图2显示了GA-agent的演化过程。

3.2。PSO-Agent模型

粒子群优化(PSO)是一种metaheuristic迭代方法,优化问题,努力改善候选解决方案通过移动粒子,候选解决方案,在搜索空间中根据简单的数学公式,关心的是粒子的位置和速度更新更新(24]。每个粒子的运动是受当地最有名的位置,但也引导向最好的已知位置的搜索空间,由其他粒子更新更好的职位。

PSO算法初始化随机个体的人口被放置在最优解的搜索空间和搜索通过更新个人代。在每个迭代中,每个粒子的速度和位置更新根据先前的最佳位置()和粒子的最佳位置发现的邻居()。粒子的速度和位置更新公式如下: 在哪里是粒子群的指数,在粒子位置的索引,代表了迭代数,的速度矢量是吗th粒子,是位置向量。请注意,和是积极加速常数,和是在0和1之间均匀分布随机数,然后呢是惯性权重。

在[25),结果表明,一个好的收敛可以确保通过两个常数加速度和惯性。这可以证明他们使用一个中间参数之间的关系。考虑以下: 在PSO-agent,我们使用PSO和中间参数的原始版本。图3显示了PSO-agent的演化过程。

3.3。DE-Agent模型

微分进化(DE)是一个metaheuristic迭代方法,优化问题,努力改善候选解决方案对于一个给定的测量质量。德,首先,初始解向量组应该是随机生成的。生成解决方案向量进行更新替换三个过程,使审判向量,和交叉。替代是一个过程,如果一个候选人的解决方案由交叉比当前的解决方案,目前的解决方案是由候选解决方案更新。试验向量是一个向量由以下公式结合现有的向量从人口26]。考虑以下: 在哪里,,当前的人口和随机选择的解决方案吗是一个真正的积极的系数。

在DE-agent,我们使用一个标准版本的德与一个统一的交叉。图4显示了PSO-agent的演化过程。一个候选向量与随机选择的解决方案是由均匀交叉操作吗在当前人口和试验向量如下: 在哪里意味着一个随机数在0和1之间是交叉的概率。

4所示。共同进化模型

之间的共同进化模型两个EC-agents讨价还价的游戏呈现在图5。两种解决方案组后EC-agents是随机生成的,每个小组评估和一步一步进化而来。当一组解决方案评估,整个解决方案的另一组用于同行讨价还价的游戏。和玩家开始讨价还价的游戏被支持或反对每一个的两倍。最后,解决方案是计算平均所有的健身价值收入总额的游戏。例如,当整个解决方案的数量是30,两轮每个对应的讨价还价的游戏进行了(开始作为一个支持者,开始作为一个被调查者)获得60个不同的收入。值除以60来确定解决方案的适应性。

5。实验结果

本节给出实验结果基于自适应EC-agents。EC-agents有尤其参数对性能的影响。GA-agent,参数的交叉和变异概率;PSO-agent,他们是一个中间参数和最大速度;DE-agent,他们是一个系数和交叉的概率。我们检查了上述参数的变化的影响实验结果。

为了观察之间的共同进化EC-agents在讨价还价的游戏中,三个实验GA-agent与PSO-agent GA-agent与DE-agent PSO-agent和DE-agent进行。

5.1。实验环境

为了创建一个实验环境,我们设置仿真参数如下:(我)人口规模:30;(2)最大迭代:10000;(3)最大的一轮讨价还价的游戏:5;(iv)许多同行:30(人口)。

5.2。实验单EC-Agent

在这个实验中,测试每个EC-agent讨价还价的游戏与固定组对应的解决方案,以确定每个EC-agent的最优控制参数。

5.2.1。GA-Agent

GA-agent控制参数的交叉率和变异率。如图6的最佳性能GA-agent讨价还价的游戏被观察到在0.9的交叉率和变异率为0.05。

(一)交叉率(突变率= 0)

(b)突变速率(交叉率= 0.9)

5.2.2。PSO-Agent

PSO-agent中间参数的控制参数和最大速度。如图7,最好的PSO-agent在讨价还价的游戏被观察到的性能和=搜索空间/ 5。在这里,搜索空间(SS)是10;因此,。

(一)

(b)

5.2.3。DE-Agent

DE-agent是系数的控制参数和交叉率CF,如图8,很少有不同的性能DE-agent讨价还价的游戏中关于两个控制参数。因此,我们采用和这通常使用。

(一)

(b)

5.3。实验的两个EC-Agents之间的共同进化

5.3.1。GA-Agent与PSO-Agent

讨价还价的结果之间的共同进化游戏通过GA-agent PSO-agent如图9。GA-agent被设定最优环境决定的部分5.2。1和PSO-agent节5.2。2。正如您可以看到的,PSO-agent优越的GA-agent coevolution-based讨价还价的游戏。

5.3.2。GA-Agent与DE-Agent

讨价还价的结果之间的共同进化游戏通过GA-agent DE-agent如图10。GA-agent被设定最优环境决定的部分5.2。1和DE-agent节5.2。3。正如您可以看到的,GA-agent优越的DE-agent coevolution-based讨价还价的游戏。

5.3.3。PSO-Agent与DE-Agent

讨价还价的结果之间的共同进化游戏通过PSO-agent DE-agent如图11。PSO-agent被设定最优环境决定的部分5.2。2和DE-agent节5.2。3。正如您可以看到的,PSO-agent优越的DE-agent coevolution-based讨价还价的游戏。

5.4。讨论

首先,性能测量中EC-agents对回报是通过改变控制参数。仿真结果表明以下影响。GA-agent和PSO-agent拥有更多的控制参数影响的性能比德:GA-agent的交叉和变异概率和中间参数的值和最大速度PSO-agent性能有影响但DE-agent的交叉和系数的概率几乎没有对性能的影响。

其次,共同进化的过程中三种EC-agents GA-agent, PSO-agent, DE-agent测试观察EC-agent显示最佳性能的讨价还价的游戏。仿真结果表明,PSO-agent胜于GA-agent和DE-agent, GA-agent胜过DE-agent关于共同进化的讨价还价的游戏。

为了理解为什么PSO-agent是最好的三种EC-agents中讨价还价的游戏中,我们观察到的策略EC-agents完成后的游戏。图12显示了策略GA-agent和PSO-agent完成后的游戏。PSO-agent支持时,他建议少量的属性的对手,但当他是一个被调查者,他想要一个大的数量。相比之下,当GA-agent支持者,他认为大量的对手,但当他是一个被调查者,他想要少量。之间的讨价还价的游戏PSO-agent和DE-agent DE-agent的策略类似于GA-agent图。这表明PSO-agent发展方向的战略来获得尽可能多的获得没有财产的风险失败的事务,而GA-agent和DE-agent发展战略的方向来完成事务不管数量。

(一)GA-agent策略

(b) PSO-agent策略

6。结论

之间的相互作用和共同进化过程研究了异构EC-agents观察性能的讨价还价的游戏。探讨交互的本质和共同进化过程为了理解行动的模式三种EC-agents并确定主要参数影响代理的性能。仿真结果表明,控制参数的GA-agent和PSO-agent更有影响的性能比德。此外,仿真结果还表明,PSO-agent胜于GA-agent和DE-agent关于共同进化的讨价还价的游戏。我们预计分析人工代理的特点,以帮助研究人员研究博弈论使用人工代理。

利益冲突

作者宣称没有利益冲突有关的出版。

引用

斯特尔,讨价还价理论斯德哥尔摩经济学院,斯德哥尔摩,瑞典,1971。
a·鲁宾斯坦“完美的平衡在讨价还价模型,”费雪,50卷,不。1,第109 - 97页,1982。视图:出版商的网站|谷歌学术搜索|MathSciNet
t . Omoto、k .小林和m .馆“建设争端解决的讨价还价模型,”《IEEE国际会议系统,人与控制论7卷,第7 - 12页,2002年10月。视图:出版商的网站|谷歌学术搜索
s . Berninghaus w·古思,r . Lechler周宏儒。公羊”,分散与集体bargaining-an实验研究”,国际期刊的游戏理论,30卷,不。3、437 - 448年,2002页。视图:出版商的网站|谷歌学术搜索
m . Nakayama”电子商务和食品营销渠道:公司议价能力转变的批发商的结构化文档交换。”信息技术杂志,15卷,不。3、195 - 210年,2000页。视图:出版商的网站|谷歌学术搜索
s . Matwin t Szapiro和k·黑格,“谈判支持系统遗传算法方法。”IEEE系统,人与控制论,21卷,不。1,第114 - 102页,1991。视图:出版商的网站|谷歌学术搜索
k . m .页面中,m·a·诺瓦克和k·西格蒙德,“空间最后通牒游戏”《皇家学会学报B:生物科学,卷267,不。1458年,第2182 - 2177页,2000年。视图:出版商的网站|谷歌学术搜索
d·d·b·范·Bragt和j . a La Poutre“共赢自动机与不同的谈判对手,”美国国会对进化计算(CEC 02),卷2,页1426 - 1431,檀香山,夏威夷,美国,2002年5月。视图:出版商的网站|谷歌学术搜索
k . Takadama y l . Suematsu n .杉n . e .那霸和k . Shimohara”向multiagent-based系统和模拟验证和确认:分析不同的学习讨价还价的代理人,”程序基于多智能主体的第四届研讨会上模拟,2003年,页18 32。视图:谷歌学术搜索
f .钟,s . o .金布罗,d . j .吴”合作代理系统:人工代理最后通牒游戏”学报》第35届夏威夷国际会议系统科学,第2177 - 2169页,2002年。视图:谷歌学术搜索
d·j·库珀:Feltovich, a·e·罗斯和r·茨威格,“相对和绝对速度调整战略环境:应答行为在最后通牒游戏中,“实验经济学》第六卷,没有。2、181 - 207年,2003页。视图:出版商的网站|谷歌学术搜索
b . Grosskopf”,强化与应答器和定向学习在最后通牒游戏中竞争:实验经济学,”实验经济学》第六卷,没有。2、141 - 158年,2003页。视图:出版商的网站|谷歌学术搜索
a·e·罗斯和i Erev学习扩展形式游戏:实验数据和简单的动态模型从中期来看,“游戏和经济行为,8卷,不。1,第212 - 164页,1995。视图:出版商的网站|谷歌学术搜索|MathSciNet
j . h . Kagel c . Kim和d•莫泽“公平与不对称信息和不对称的回报在最后通牒游戏中,“游戏和经济行为,13卷,不。1,第110 - 100页,1996。视图:出版商的网站|谷歌学术搜索|Zentralblatt数学|MathSciNet
l . s . j . Burnell埃文斯,s .姚明,“最后通牒游戏:最优策略没有公平,”游戏和经济行为,26卷,不。2、221 - 252年,1999页。视图:出版商的网站|谷歌学术搜索|MathSciNet
t·d·斯坦利和美国Tran经济学学生不必贪婪:公平和最后通牒游戏,”《科学版,27卷,不。6,657 - 664年,1998页。视图:出版商的网站|谷歌学术搜索
r·h·泰勒“异常:最后通牒游戏,”《经济视角,2卷,第206 - 195页,1988年。视图:谷歌学术搜索
r·苏莱曼,“期望和公平的修改最后通牒游戏”,经济心理学杂志,17卷,不。5,531 - 554年,1996页。视图:出版商的网站|谷歌学术搜索
研究所。张,我。Yun, js。李,S.-U。李,N.-P。马哈里克,B.-H。安”,分析发展人工代理的参数顺序讨价还价的游戏,“IEICE交易信息和系统,卷88,不。9日,第2101 - 2098页,2005年。视图:出版商的网站|谷歌学术搜索
m·h·Seong郑胜耀李,“讨价还价的游戏设计使用人工代理之间的共同进化分析,“先进的科学和技术的信件,46卷,10 - 14,2014页。视图:谷歌学术搜索
M.-H。Seong S.-Y。李,“讨价还价的游戏使用人工代理基于遗传算法和粒子群优化,“国际软件工程及其应用》杂志上,8卷,不。5,205 - 218年,2014页。视图:出版商的网站|谷歌学术搜索
j . h .荷兰,适应在自然和人工系统,密歇根大学出版社,安阿伯市,密歇根州,美国,1975年。
d·e·戈德堡和k . h . KlAosener”比较分析遗传算法中使用的选择方案,”遗传算法的基础g·罗林斯,艾德,页69 - 93,摩根考夫曼,圣马特奥市加州,美国,1991年。视图:谷歌学术搜索
进行r·c·埃伯哈特和j·肯尼迪,“一个新的优化器使用粒子群的理论,”学报第六届微机器和人类科学国际研讨会(95年肉类”),页39-43,IEEE服务中心,名古屋,日本,1995年10月。视图:出版商的网站|谷歌学术搜索
m·莱克和j·肯尼迪,“粒子swarm-explosion、稳定性和收敛在一个多维的复杂空间中,“IEEE进化计算》第六卷,没有。1,58 - 73、2002页。视图:出版商的网站|谷歌学术搜索
r . Storn和k .价格“微分进化简单和高效的启发式全局优化的连续空间,”杂志的全局优化,11卷,不。4、341 - 359年,1997页。视图:出版商的网站|谷歌学术搜索|MathSciNet

多媒体的发展

先进的问题话题检测、跟踪和社会多媒体的趋势分析

文摘