雷区映射使用合作Multirobot系统

文摘

本文提出一种合作multirobot team-theoretic方法系统。个人行为的机器人控制的Belief-Desire-Intention模型赋予机器人技术故意需要执行这些操作。异构机器人之间的合作行为是由Team-Log理论赋予所有机器人的团队know-how-to-cooperate并确定团队成员的相互承诺,尽管他们的不同类型,属性,和目标。该方法测试的有效性的现实生活问题雷区映射。不同的雷区全面策略研究控制移动的移动清洁工在雷区为了最大化区域范围,提高编译multirobot系统的能力。

1。介绍

开发一个健壮的和合作的团队的机器人能够解决复杂的任务是一个有趣的研究领域,吸引了许多研究人员现在。各种系统组件之间实现健壮的和富有成效的合作是灵感来自不同的领域,如生物、人工生命、心理学和认知科学为了建立人工合作智能系统。合作是定义在[1)代理的立意积极干预,进一步实现一个共同的目标或目标与自己的兼容。实现这一有效合作multirobot系统(夫人),机器人必须有技术为解决在一个自治的方式和一个简单的问题know-how-to-cooperate代理可以有共同利益和相互合作来解决复杂问题。

近年来,科学界已经大量的研究工作,致力于合作multirobot系统和他们的应用程序在不同的搜索和救援等领域(2,3)、分布式监控(4),通信传送(5),农业(6),排序(7),紧急服务(8),和地雷检测(9]。雷区侦察和映射的一个最有前途的应用合作multirobot系统。

在人道主义排雷,合作multirobot系统可以有利于排雷人员,平民,和政府。一个精确的传感器的设计可能会减少所需的时间来确定是否存在一个地雷,但不增加德民的安全。因为安全问题消灭过程中带来了巨大的关注,廉价和简单的使用和集成移动清洁工合作multirobot系统可以提供一个有前途的解决方案。合作multirobot系统可以取代人工排雷人员提供一个更安全、更准确的为我的映射。考虑到地雷是无差别的杀手,平民目标冲突已经结束很长时间之后,精确的地图由合作multirobot系统可以用来删除或停用发现矿山推广开垦的土地上的平民的安全访问。此外,矿山的主要效应是拒绝访问丰富的土地,和他们的资源。除此之外,医疗,社会、经济和环境后果是巨大的。合作multirobot系统可以在解决这个问题中起关键作用的地雷促进安全获得土地开发新项目,对一个国家的发展作出贡献。

摘要合作multirobot team-theoretic方法系统提出了雷区映射。异构机器人之间的合作行为是旨在帮助人道主义排雷任务。对于这个任务,multirobot系统包含一系列传感代理(我的清洁工来检测矿)和代理代理(矿山排雷人员的删除或停用)。Belief-Desire-Intention模型用于控制机器人的行动和团队成员之间的关系由Team-Log形式,决定了团队成员的相互承诺。multirobot系统输出集群矿井地图使用遗传算法。那么这个集群映射传递给一些排雷人员成功删除或禁用地雷。

本文的其余部分组织如下:部分2介绍合作multirobot系统上下文中的人道主义排雷突出各自的特点,讨论了这些系统的合作方面。部分3描述了技术和know-how-to-cooperatemultirobot系统。拟议中的team-theoretic方法提出了部分4其次是描述其申请雷区映射部分5。最后的结论和未来的工作进行了总结7。

2。合作在人道主义排雷Multirobot系统上下文

地雷的问题被认为是一个严重的问题在世界上许多国家面临很多战争在过去的世纪。最近的研究表明,埃及就有超过百万地雷分布在20 - 23日总表面积的22%从而使它污染最严重的国家之一,在整个世界10]。这些地雷让污染面积几乎无法使用,几乎不可能从中受益,直到清除地雷。而且随着年月流逝清除地雷变得越来越困难由于积累的障碍,因为天气的变化。除了清除地雷对人类通常是危险的过程中,会消耗大量的时间和资源11]。在这种情况下,合作multirobot制度可以作为解决这一问题。

Multirobot系统(夫人)是一组机器人的设计旨在执行一些集体行为。夫人正在极大的兴趣,因为下面的原因(12]。(我)解决任务的复杂性:一些任务可能非常复杂,一个机器人做甚至不可能如盒子推或跨越鸿沟。其他任务本质上是分布式如分布式监视、侦察和监视。(2)增加系统性能:使用并行多个机器人可以更快地解决问题。这可能导致最大化对象、区域或无线电空间/时间覆盖率和最小化任务完成时间。(3)可靠性:增加了系统的可靠性,因为只有一个机器人可以作为整个系统的瓶颈在关键时期尤其如此。然而当使用多个机器人完成任务,一个失败,其他机器人仍然可以做这项工作。因此,引入多个机器人通过冗余增加鲁棒性。(iv)简单的设计:建筑几个resource-bounded机器人要容易得多,有时比建立一个强大的机器人更经济。

使用在人道主义排雷夫人的优点可以总结如下13]。(我)雷区是危险的人类;机器人解决方案允许操作员身体远离危险区域。(2)使用多个廉价使自动化搜索元素最小化损失由于意外爆炸的地雷和允许剩下的任务由剩下的元素。(3)各种矿山必须处理;许多机器人的使用允许将矿山追求并行,而不是一次一个。(iv)大量的传感器开发的相关信息可以地雷的存在与否。这些传感器的不过是足够的,因此必须使用这些传感器的一些组合。

为了有效demine,机器人应该表现出以下技能。(我)按照定义的搜索模式。(2)谈判困难的地形。(3)记录和报告的位置在整个任务。(iv)工作不够快是划算的。(v)避免相互干扰。(vi)有效地覆盖地形。(七)共享工作负载。(八)互相帮助提供互补的信息通过不同的传感器。(第九)能够动态分配的工作负载的机器人故障。

multirobot导航策略要求机器人能够至少一些基本的行为,如避免障碍,寻找地雷,遵循一个特定的路径,并保持形成。在[13),三个基本行为(避免障碍,实现一个目标,维持在一个特定的位置形成和维护机器人方向)来创建更复杂的行为是我用于检测如随机运动,继电器集群、植绒、聚集,形成维护和梳子运动。另一个社会觅食理论基础的方法提出了(14]。在这个系统中机器人代表觅食和矿山的猎物。觅食(机器人)合作将扫描所有的雷区为了定位猎物(矿)。

代理非常适合使用在应用程序涉及到分布式计算或组件之间的合作这是multirobot系统作为系统的情况下试图将全球任务分解成子组件,建立合作机制,这些子组件可以有效地一起工作,synergically和和谐。代理将感知周围的环境和执行某些操作,直到最终状态。这些自治代理,而作用于当地知识和拥有有限的能力,还是有能力制定所需的全球行为(15]。夫人,合作是代理的立意积极干预,进一步实现一个共同的目标或目标兼容自己(1]。他们的合作形式可以体现在这些系统中,即扩大的,综合,debative [10,16]。(我)扩大的合作。代理有一个类似的诀窍,但是代理必须增加执行任务无法执行的唯一代理。这个任务然后共享到相似的子任务。在雷区映射,移动清洁工具有类似合作技术我创建一个地图是扩大的合作。(2)一体化合作。代理有不同的和互补的技术和有必要整合他们的贡献达到一个预先定义的目标。此外代理类型和物理性质可能不同,因此每一种类型的代理负责一个任务可能不同于其他代理在同一个团队。在人道主义deminiingg传感代理(移动清洁工)和代理之间的合作代理为一体合作(排雷人员)就是一个例子。(3)Debative合作。当代理有一个类似的技术又面临着一个独特的任务,这一次他们被迫比较他们的结果获取每个代理的所有解决方案的最佳解决方案。代理商必须意识到他们要的适应度函数选择最佳的解决方案对其的理解这个函数。在雷区映射,传感代理可以商榷合作为了选择最合适的代理来代替失败的代理。

这个多重代理系统范式引入了许多新的设计/发展问题相比,更为传统的系统开发方法。然而,挑战方面必须加以解决。(我)如何使代理能够分解自己的目标和任务,将子目标和子任务分配给其他代理和合成部分结果和解决方案(17]。(2)如何启用代理沟通。用什么通信语言和协议(17]。(3)如何有效地平衡本地计算和通信(18]。(iv)如何启用代理代表和理性行动,计划,和知识的其他代理为了适当地与它们进行交互(17]。(v)如何启用代理代表和思考他们的交互过程。如何使他们确定他们的协调努力,取得了进步,如何使他们提高他们的行动协调和一致,(17]。(vi)如何启用代理识别和协调不同的观点和利益冲突。如何综合的观点和结果(17]。(七)如何启用代理和合同谈判。他们使用什么谈判和合同协议(19]。(八)如何正式描述多重代理系统和代理之间的交互。如何确保他们正确地指定[19]。(第九)如何实现“智能”过程,如解决问题、规划决策、和学习的环境。如何启用代理共同实施这些过程在一个连贯的方式(19]。

因此,新的分析和设计方法和工具都需要创建一个有效的multirobot系统使用可替换主体模式。上下文中的人道主义排雷,合作multirobot系统将包含大量的空间分布式代理,当管理得当,可以集体,不断扫描一个雷区,我建立一个地图。这些代理被赋予技术自主解决问题的能力和方法know-how-to-cooperate能力的代理可以分享共同利益和相互作用。每个分区将被移动扫扫描。以下部分描述的细节技术和know-how-to-cooperate的代理。

3所示。技术和Know-How-to-Cooperate

3.1。技术

在人道主义排雷的背景下,机器人或代理人必须意识到它是如何实现其目标和完成任务。完成目标任务被划分成更小的行动。这意味着代理必须知道这些小的行为是什么?他们准备什么时候执行?他们是如何执行?。这些问题的答案技术的代理必须自主解决问题。的技术给一个代理的个体活动的典范。代理人不能保证如果它缺乏成功的意图技术实现这些目标(20.]。

人工代理建立他们技术通过执行四个主要活动,即:信息收集/精化、诊断、干预决策和行动21]。Belief-Desire-Intention (BDI)模型可以用于实现代理的技术。BDI代理都有它自己的信仰,其他代理,其环境的欲望(即对未来状态。,对自己的未来、目标)和意图的行为(即。,计划)。这个模型的人类实践推理最初是由[结束22作为一个方法来解释指示未来的意图。当使用一个软件模型开发一个智能代理,它实现了代理的信念,欲望,和意图和实际使用这些概念来解决一个特定问题在代理编程。从本质上讲,它作用于选择合适的计划应用基于当前信仰和渴望独立于当前活动的计划。因此,BDI代理能够平衡所花费的时间选择执行哪些计划和实际执行这些计划。

Georgeff等人采用这个模型并把它转化为正式的理论和软件代理的执行模型,基于信仰的概念,目标,计划(23]。BDI模型的概念和它是如何工作的将在本节。BDI模型抽象概念。(我)信仰。代理代理拥有信仰代表了当前信息,换句话说的理解周围环境(包括自身和其他代理)。信仰捕获信息态度(24]。他们对世界的命题考虑基于他们的看法25]。信仰还可以包括推理规则,允许正向链接到新的信仰基于旧的信仰代理。信仰这个词是用来代替知识暗示什么代理目前认为可能不是事实或常数,但由于新的更新之后可能会改变。(2)的欲望。欲望代表动机态度(24]。他们对世界的命题,他们希望是真实的25]。他们代表目标代理想完成或达到。欲望的例子可能是,最小的扫描时间,最大覆盖,或最小数量的传感器。(3)的目标。被选中的目标是希望达成的代理。术语含义的目标增加了更多的限制,这样的积极愿望必须是一致的。例如,一个不应该的两个目标覆盖率最大化和最小化的传感器在同一时间;然而,从代理随时可能是可取的。(iv)意图。意图是代理的协商的态度(24]。意图是欲望的经纪人在某种程度上它自己。在实现系统中,这意味着代理已经开始执行计划(25]。(v)计划。计划的小行为,代理必须执行序列来实现一个或更多的意图。他们有代理需要知道的所有细节能够成功地实现自己的意图。计划可能包括其他计划:我的计划可能包括一个计划去探测地雷扫描感兴趣的特定区域。这意味着在结束的模型中,计划最初只是部分构想,详细填写他们的进步。(vi)事件。这些是触发的代理去做些什么。事件可能会更新信念,触发计划或修改目标。事件可以是外部产生和接收到传感器或可以内部触发生成解耦的更新或计划的活动。

3.2。Know-How-to-Cooperate

的know-how-to-cooperate允许代理管理他们的目标之间的冲突,资源等等,允许代理执行自己的活动考虑到活动的其他代理21]。每个代理依靠其他代理的知识和领域实现高度的效率实现本地和全球的目标。这种交互的特点是共同利益,只有部分的知识的推理步骤的其他代理和环境。目标可能会或可能不知道代理明确,取决于他们是否目标定向。目标导向剂也可能改变他们的目标以适应其他代理的需求,以确保凝聚力和协调。提出了不同的模型来实现的know-how-to-cooperative如共同责任模式26),联合意图(27],Satisfaction-Altruism模型[28],飙升模型[29日),和TeamLog模型(30.]。在本节中TeamLog理论(30.用于实现know-how-to-cooperate在一个团队中异构的代理。

3.2.1之上。信仰的团体

是按照标准使用的语言系统代理是解释31日,32]。(我)一般的信念。这个公式名为“信念”是指每一个代理在G组认为。也就是说, 当且仅当这对应于公理1: 。(2)共同的信念。传统的多智能体系统的升级方式单一代理概念是通过使用常见的信念在小组成员之间。如果每个人都被认为是正确的相信,每个人都在相信其他人也相信。这是一个更强的操作符,而不是一般的信念,即使不需要是真实的。相应的公理公理2所示: 。

3.2.2。集体意图

意图形成一个相当特殊的目标一致的子集,也就是说,它被看作是选择目标;提供灵感来源更具体个案的社会承诺和计划共同承诺在组的情况下(22,33]。有几个讨论意图从不同的观点;总结为一个共同的协议(我)意图驱动means-end-reasoning(如何实现一个目标),(2)意图限制未来的考虑,(3)意图持续足够长的时间,根据复议的策略,(iv)意图影响未来实际推理的基础是信仰。

虽然集团意向性背后的机制可能仍然是神秘的从心理的角度来看,逻辑建模值得允许团队代理合作顺利的34,35]。(我)语言目标和意图:如果是一个公式,和,那么下面的公式:,。(2)共同和集体的意图:什么促使一群特工结合他们的努力来实现一个共同的目标吗?

第一层被称为将军的意图,每个人个人计划,表示为相互递归地意味着每个人都计划,每个人都打算打算,表示为集体意图是一个更强大的概念,这意味着每个人都有共同的目的,每个人都相信共同目的的存在,并表示为:

3.2.3。集体的承诺

假设我们有一个团队与集体意图来实现一个目标。它是不够的团队开始合作行动朝着这一目标。我们需要一座桥,连接着意图和具体行动。共同承诺在一群代理的目的是来启动一个特定的团队行动,也就是说,协调执行代理的个人行为根据选定的社会计划。

团队合作的意义涵盖不同层次的一个团队,从松散耦合的团队如一个研究小组,组织严密的团队。调优的想法承诺的本质直观的吸引力,因为代理的情况下都是表演,他们的组织结构不断动态变化。

组织承诺是由以下三个方面。(1)组:通常,代理商的合作团队是一个集体的基础上形成的意图。(2)计划:一个社会计划,详细说明了如何实现组织的目标需要创建。(3)分配职责:一组双向社会承诺向社会的行动计划反映了特工在团队行动的责任。(1)社会计划:集体承诺是基于计划:定义对于一个给定的社会计划。个人行为,组合成集团行为的社会计划表达式。社会计划导致实现一定目标的成功实现。(2)社会的承诺:通过双向承诺向集体承诺实现的行为。对于一个简单的情况,两个代理之间的合作涉及一定的不对称角色划分:第一个代理想要执行一个动作,一个代理决定,它可以执行所需的行动。当愿意就作为一个辅助和监督的成就目标,他们认识到他们的合作潜力。这一认识反映在承诺来。因此,一个社会的承诺是双边激励的态度对应于这样一个承诺。

4所示。Team-Theoretic方法

team-theoretic方法提出了开发合作行为multirobot系统。基于这种方法,每个机器人将配备BDI-based技术解决问题的能力和TeamLog-based自治方式know-how-to-cooperate能力的机器人可以分享共同利益和相互作用。

提出的系统是基于多层架构,代理在概念上安排在一个树状结构。在此结构中,代理高树上有更多比下面的全局视图。在其严格的解释,交互不发生在树上,但是只有连接实体之间(36]。数据通常由较低级别的代理在一个层次结构向上传播提供一个更广泛的观点,而控制流向下如下这些更高层次的代理提供方向(17)如图1。

体系结构分为三个层次:传感代理和代理代理,细节和macromanager。每个代理都有自己的信仰,欲望,和意图。让w传感代理的总数,米代理代理的总数,n多的细节k传感代理分配给部门经理。

这种多级架构后,提出了系统包含以下空间分布式代理。(我)传感代理。传感代理部署在环境和负责检测和记录特定对象/事件在这个环境中。他们装备了技术需要完成的主要任务执行微小的行动。这些基本操作的例子,搬到,旋转,避免障碍并报告事件/对象。(2)代理代理。代理代理是专业代理负责操纵环境传感代理完成扫描任务之后,他们也装备与技术去实际操作环境的环境中达到理想的状态。(3)细节型。细节型传感代理的直接经理;他们配备了技术报告macromanager以及当地的地图know-how-to-cooperate能够管理他们的感应代理通过代表团还与macromanager通信。(iv)Macromanager。Macromanagers细节型的管理者。他们还配备了技术结合当地的地图为全球地图感兴趣的领域和know-how-to-cooperate协调不同的细节和代理之间的代理通过代表团。用户提出的系统将与这个macromanager接口。

4.1。BDI-Based技术

在前一节中描述的BDI模型已经被用来实现代理技术,允许传感代理以一个自治的方式来解决问题。(我)信仰和知识。传感代理描述它的信仰立场的知识,感兴趣的领域(AOI),个别地图以及其相应的事必躬亲。的信仰什么都包括地位、传感代理、感兴趣的区域(ROI),当地地图和macromanager。macromanager包括整个环境的信念,所有的细节,全面代理,所有代理代理,和全球地图之前和之后的集群。(2)愿望和目标。提出系统的全球主要的欲望是扫描和创建一个映射为整个环境将它分成更小的地区利益和分配每个ROI各自事必躬亲。后来macromanager创建集群全球地图的另一个愿望。细节将其ROI的欲望成更小的感兴趣的领域(AOI)和macromanager报告当地的地图。传感代理是扫描的欲望葵和报告部门经理如果找到一个特定的对象当然避免任何障碍。(3)意图和计划。全球计划是如何macromanager将实现全球扫描环境的欲望无视小细节传感代理。全球计划的细节有自己的投影称为社会计划如何扫描他们的ROI,随后感应代理有他们自己的投影社会计划扫描他们的苍老师的个人计划。

算法1描述的BDI macromanager显示主程序和欲望的顺序:输入到macromanager代理细节,他们的数量n和代理代理的数量我。

信仰细节,n,我
执行把环境
micromanager_ROI 环境÷n
而环境扫描做
执行扫描环境
更新信仰
结束时
执行地图生成全局对象/事件
执行集群全球地图,我

算法2描述细节的BDI:输入什么都是其全球macromanager定义的ID,其分配ROI进行扫描,检测代理,他们的号码k。

信仰ID、ROI传感代理,k
初始化当地的地图
而ROI没有扫描做
执行除ROI
代理_
如果代理发现对象/事件然后
更新本地对象/事件映射
如果
更新信仰
结束时

算法3描述每个传感代理的BDI模型与短暂的计划:信息输入的当前位置是代理在网格上,惟一的ID,分配的,部门经理负责这个代理,最后从其传感器读数。

信仰我的_posID,事必躬亲,苍老师
而苍老师没有扫描做
执行scan_AOI

如果next_pos=对象/事件然后
执行避免next_pos
执行报告对象/事件事必躬亲
其他的
执行搬到next_pos
如果
更新信仰
结束时

4.2。TeamLog-Based Know-How-to-Cooperate

(我)全球计划:为了控制交互的数量,减少所需的时间建立的信仰,接受团队模型是分层。macromanager视图一个团队作为一个传感代理,即使细节使用很多传感代理来执行他们的工作。(2)社会计划:macromanager的社会计划和细节设计负责对特定的环境。这是一个while循环,观察与治疗现状是交叉进行。的社会计划细节是如何扫描ROI鉴于目前数量的传感代理每事必躬亲。(3)集体的意愿:细节型集团有一个集体的意图分裂和报告/事件的检测对象。这个表达式用,在那里代理和集团吗是预期的意图。群传感代理也有一个集体的意图扫描和报告/事件的检测对象。(iv)共同承诺:(分类的24)所使用的共同承诺的类型是团队的承诺,因为每个子团队的成员意识到的目标,但不知道其他团队目标和承诺。(v)Agent-to-Agent承诺:传感机构致力于他们的部门经理完成扫描和报告一个单独的对象映射,此外,什么代理致力于macromanager报告一个本地对象/事件映射为每个事必躬亲。最后macromanager编译全局对象/事件映射基于许多当地地图收到不同的细节则致力于代理代理操作对象/事件macromanager的要求。

4.3。流动模型

两种类型的流动模型实现的。两种类型取决于分治算法在一定的传感代理只分配给一个小葵和忽视其他地区。每个传感代理知道苍老师的边界,但不同之处是它将如何被扫描(37- - - - - -39]。

(我)完全协调的运动
如图2,感应移动代理完成扫描的葵逐行水平。它开始从左上角的葵和移动直到它到达正确的边界开始,然后向下移动一步,然后它开始移动了,直到它到达左边界等等,直到整个葵扫描。如果一个对象/事件检测、传感代理必须记录其位置然后遵循一定的路径,以避免它。图2显示了一个示例的两个清洁工扫描他们的苍老师按照逐行扫描模式,绿色区域是清洁工的苍老师,第一个蓝点是清洁工的当前位置,蓝点是最近访问了职位。有一些缺点,防止完全协调运动策略被广泛实践(40]。(1)苍老师可能无法的地区,或很难,同样的分歧。(2)执行完美的扫描计划需要雇佣一个非常准确的导航系统。导航错误由于传感器和致动器的宽容导致覆盖系统的差距,和丢失的目标检测结果。(3)该算法不适应系统/环境变化和失败不健壮的元素。环境变化、添加或删除节点将触发系统的重新配置。

(2)完全随机运动
在这个流动模型中,传感代理全面也从左上角开始,但它不会在一个固定方向移动;相反,它选择一个随机的位置移动。此外它还记得之前访问过的位置,防止自己从这些头寸直到某些愿望标准是满足。在我们的例子中,等待大约5秒然后删除之前访问过的位置。通过这种方式传感代理可以被迫探索更多的环境,同时被阻止陷入位置都是包围与之前访问过的位置,从而增加勘探和减少剥削。

图3显示了一个示例的随机运动两个传感代理10×10的环境。绿色区域是指定的代理,和蓝色圆点的最近访问了位置删除后一定时间的流逝。

这种策略有三个主要的优势(40]。(1)这个流动模型很容易实现导致应用程序部署大量的低成本简单传感代理。系统级别的特定于任务的功能和性能需求可通过高节点冗余。(2)这个流动模型固有的适应动态环境中先验知识感兴趣的地区不可用。(3)由于传感代理路径是不可预测的,所以传感代理不能利用其观测或知识来预测它的路径,从而逃避检测。这个扫描模式的缺点是没有办法确定整个苍老师已经扫描,所以停止标准必须与时间有关,传感代理从葵后一定时间的流逝。

4.4。聚类

全球地图是由macromanager之后,很多代理代理需要操作检测对象/事件。使用检测到的对象的数量/事件的数量高于代理代理。这就提出了一个需要集群对象/事件在全球地图,并将每个代理代理分配给一组对象/事件。遗传算法(GA)用于集群全球地图所示算法4。色散(disp)作为相似性度量聚类技术。色散是代理和代理之间的距离/事件分配给它的对象(越接近物体/事件代理代理,分散的价值越小,反之亦然)。总色散的总和所有代理代理之间的距离和对象/事件分配给它。

输入我,
创建人口




而数20做
parent1 适者(rand)
(兰德)
孩子们交叉(parent1, parent2)
最糟糕的(人口)适者(孩子们)

_disperion
如果然后

其他的

如果
结束时

在这个以人群为基础的metaheuristic技术,有很多代理代理我、位置的对象(x,y),和对象的数量米。这些输入参数可以表示为一个数组,在那里x和y检测对象的坐标。检测对象的聚类算法输出一组/事件在全球地图与相应的代理代理,如图4。

5。雷区映射为例

该方法测试的有效性的现实生活问题雷区映射,因为它需要合作不同的机器人扫描和清除雷区的地雷。

5.1。仿真设置

开发环境有不同的功能和不同水平的复杂性可用于multirobot系统(1]。该系统已经使用Jadex实现,BDI推理引擎,允许在XML和Java编程智能软件代理。(我)环境。在拟议的系统中,模拟雷区的环境是JADEX平台与四种类型的代理上创建定制我们的扫雷系统的特殊情况。大小可以控制和10×10 100×100环境大小进行了测试。(2)传感代理。自动扫雷机器人配备了一定数量的内感受器的(内心状态)和外部(outer-state)传感器。内感受器的传感器包括全球定位系统(GPS)用于定位机器人在雷区。感受外界刺激的传感器附近矿井矿井检测器用于检测。有三个人:一个在前面,一个在每一方的机器人。还机器人配备了无线模块成功地与相应的部门经理发送个人我的地图创建的清洁工。清洁工有四个关于环境和信仰系统。它也有两个目标扫描葵和报告对象/事件最后两个计划执行这些目标。(3)传感器模型。所使用的传感器是清洁工检测矿山环境中。两种类型的传感器模型。(1)理想的传感器:所有的清扫器检测到我的出现。没有概率的忽视和意想不到的发现。(2)嘈杂的传感器:增加模拟的真实感,并使其尽可能全面的真实的生活情况。高斯随机噪声被添加到我理想的传感器和某个值(灵敏度)是用来控制是否传感器将检测矿井。如果随机数大于预设的灵敏度值,传感器会检测到我的。但如果随机数小于敏感性,该矿不会被发现,可能会导致爆炸的清洁工。(iv)什么都管。这个代理可以是运行在基站没有身体或可以是无人机(UAV)的监测环境,同时可以安全危险的雷区。在这两种情况下它还必须配备与无线通信模块与其他代理进行通信来接收个人我的地图从清洁工和发送我结合当地地图的特定macromanager ROI。什么都有三个信念系统。它也有两个目标:把ROI分成小葵和报告对象/事件映射,最后它有两个计划执行这些目标。(v)Macromanager。基站上运行是一个代理,它可以与细节和接收本地通信我的全球地图从他们和编译我的地图然后根据集群代理代理或排雷人员可用的数量。macromanager有三个观念和系统。它也有三个目标:将环境划分为较小的ROI,报告全球对象/事件映射到用户和集群最终地图,最后,它有三个计划执行这些目标。(vi)代理代理。排雷人员,将被用来破坏或停用发现地雷。这些代理代理,但不限于,自动化/遥控喇叭裤/辊/犁或失活机器人或任何其他机器人能够摧毁/某个目标在一个给定的地图才会安静下来。(七)矿山。在我们的模拟地雷的数量控制和三个案例提出了分布环境中。(1)随机分布的地雷。矿山的位置是固定的,创建随机仿真开始时没有任何模式。代表这种情况,用户没有最初计划矿山是如何分布的雷区。(2)基于矿山模式。矿山的位置也是固定的,但根据预定义的模式创建一次。这是最实际的情况因为战争和冲突后以前的扫雷过程中特定的模式分布的注意。举个例子,一个典型的越南保护雷区(柬埔寨在1979 - 1989年)中使用杀伤人员地雷可能包含两行,间距1米每一个我,和我的行间距1米11]。(3)动态地雷。地雷被创建在正在进行的模拟代表最初当地雷埋和察觉但现在检测由于天气条件的变化。这个模型可以与其他两个模型同时使用。矿山出现表面上的速度可以控制,它被称为命令。但是这个模型比其他的更加困难,因为许多矿山和完成时间将相关。

5.2。评价指标

测量的有效性(MOE)扫描系统可以通过以下两种方法来收集。一种方法是用客观与部署相关报道(41- - - - - -43]。另一种方法是与目标相关的图片编译(1,44]。

5.2.1。归一化累积区域范围

累积区域范围是瞬时的积累任何两个时间之间的区域范围情况下,和累积区域范围的移动扫描系统覆盖的地理区域的分数至少一个清洁工在一定的时间间隔内至少有一次,表示交流()。规范化区域范围的比例是累积总环境区域范围大小被扫描,因此最优值应该在100%的范围内。

5.2.2。测量图编译

当每个传感器的传感模型,注入目标(对象或事件)是一个现实的方法来评估性能和整个扫描系统的工作状态。目标检测的结果不仅可以从一个终端用户的角度评估系统性能,而且地址系统特点和突出为进一步改善算法的缺点。以下各种指标帮助分析扫描系统的不同方面44,45]。

目标探测领域的和不完美的传感器,性能评估使用这些措施:精度、灵敏度测量(45,46]。

为了解释这些测量的定义,考虑一个十字应变矩阵表1显示两个类别的检测结果(积极的和消极的类别)。TP的数量目标的正确检测。错过了FP是目标的数量。TN是假警报的数量。FN对象的数量,不属于目标和不正确检测到。


实际状况	积极的	负

真正的	真阳性(TP)	真阴性(TN)
假	假阳性(FP)	假阴性(FN)

公式(4)和(5)给的定义根据条款表精度和灵敏度1。精确定义是正确地检测到积极的对象的数量的比例相比,检测(TP + TN)的总数,而灵敏度的定义是正确的数量的百分比发现积极的对象的数量相比,所有地面实况积极的对象(TP + FP)。的是一个调和平均数中定义的精度和灵敏度公式(6):

5.2.3。完成时间

完成扫描过程所需的时间也比较不同类型的流动模型和记录每个完成所需的时间。

彻底的开始之间的时间测量第一个清洁工,直到彻底的扫过去,因此,采取的时间不仅是一个清洁工,而是欧盟所有的时间,所有的清洁工见下面的公式:

5.3。实验设置

几个实验JADEX平台不同环境大小和不同数量的清洁工和细节。从1开始清扫器和1什么10×10地区50 100×100年清洁工和10个细节型区域。

实验主要集中在三双模型。(1)流动模型通过测试协调和随机运动。(2)我分布模型通过测试我随机分布和基于模式的分布。(3)传感器模型通过改变我的敏感性检测传感器。

对于流动模型,停止准则的协调运动是扫描整个环境和执行时间被记录。然而随机运动的停止条件是这个数字所需的执行时间清洁工在这个区域大小的协调运动完成扫描。这种方式可以保证这两种情况下扫描环境有相同的机会。此外,这意味着完成时间不能作为测量比较,因为它在这两种情况下具有相同的值。模拟都是使用随机分布执行矿山模型和噪声传感器模型。

关于煤矿分布模型、协调运动是用来扫描每个环境两次,第一次为随机分布的矿山模型和基于模式的第二个矿山模型。

这个模拟中使用的模式类似于使用的一个德国军队在艾尔阿拉曼战役中所发现的盟军(47]。模式使用等距的矿山和等距的排矿,但每一行与下一个细胞转变。图5显示了模式20×20;之间的间距矿山是6和每一行之间的距离,另一个是2。

当这个雷区从鸟瞰图,它将被视为diagonal-like线平行。最后一个随机的我是故意不部署根据模式来模拟在矿山部署模式中的任何可能的错误。

关于传感器模型,建模的传感器是曾经是一种理想的传感器,检测所有出现的地雷。另一种情况下,传感器被建模为一个嘈杂的传感器,这样一些事件可能不会被探测到的清洁工。我随机分布模型是用于两个模型。

每个模拟执行至少三次,所需的时间完成扫地、总面积扫描精度,灵敏度和记录在每个仿真,然后平均三个模拟进行了研究。

6。结果与讨论

6.1。流动模型

协调运动和随机运动的结果相互比较来获得更好的理解系统是如何工作的,当清洁工的面积大小和数量增加。

归一化累积区域范围
图6显示每个数字的归一化累积面积覆盖率结果清洁工每个区域的大小取决于类型的运动协调和随机的。归一化累积区域范围测量并不是绝对的,这意味着如果扫扫描两次相同的位置,这是算作两个独立的区域。

(我)完全协调的运动
归一化累积面积覆盖率增加清洁工的数量增加。然而必须指出如果累计覆盖面积比需要扫描的总面积大,这意味着一个清洁工的爆炸,另一个清洁工一次扫描了苍老师也因此增加了完成时间。

(2)随机运动
图显示了随机模型未能有效扫描环境,甚至随面积大小的增加而减小。这是因为当面积大小增加,矿山数量的增加从而清洁工失败由于未被发现的概率增加。此外,结果表明,区域范围增加清洁工使用数量的增加,但这是有效的只有小面积的大小。的解释是,大面积和许多清洁工设在划分在清洁工的数量因此长度和宽度之间的分配比例葵变得非常小。这减少的概率让清洁工探索新的职位设在如果它需要解决这个问题通过增加概率的扫描设在运动并不会真正完全随机的。这个问题更好的解决方案是将环境划分为正方形或矩形length-to-width比例合理,然而,实际执行过程中可能面临的问题。

F测量
图7显示结果取决于类型的运动协调和随机的。

充分协调运动
在图8,测量代表误差灵敏度的传感器的数量在所有的清洁工,因此如果清洁工足够大的数量来弥补损失的一个或多个清洁工,F测量将会增加。但如果清洁工是一个小数量的数量,清洁工的损失就会极大地影响系统性能的情况下所示50×50区。

随机运动
另一方面,测量环境规模和数量的增长而增加的清洁工小面积大小,但对大区域的大小,因为大大减少测量面临着同样的问题的探索方向类似于区域范围。因此,措施减少清洁工的环境规模和数量增加的情况下所示50×50和100×100区域。

完成时间
不需要比较获得的完成时间需要因为同样的价值观的协调运动中使用了随机运动。

正如预期的结果表明,完成时间成反比清洁工用于扫描的数量。然而这个关系不是线性的,因为对于小数量的清洁工苍老师分配给每一个相对较大,如果任何清扫车爆炸,分配给每一个清洁工的AOI变得更大,又开始从一开始。因此建议平衡清洁工的数量相对于环境的大小。

6.2。我的分布模型

结果从我的两种类型分布模型相互比较研究效果增加面积大小和数量的系统上的清洁工。

归一化累积区域范围
图9显示了每个数字的结果清洁工每个区域的大小取决于煤矿分布的类型。

归一化累积区域范围观察是增加更多的基于模式的分布随着清洁工的数量增加,但对大面积区域范围总面积增加超出了被扫描从而发生重复的工作由于清洁工失败。因为现在很多矿山位于同一行,这是一个高在一定行但失败的几率低的机会在其他行。当故障发生时,环境再重新扫描了剩下的清洁工。

F测量
图10显示了结果取决于煤矿分布的类型。作为区域范围,解释衡量的增加会增加数量的清洁工,因为环境是重新扫描,确保没有跳过矿山由于失败。

完成时间
图11显示了结果取决于煤矿分布的类型。图表显示,在很多情况下所需的时间小于基于模式分布的随机分布。基于模式的原因是因为雷区的矿山是等距的,转移行有很小的概率两个清洁工报告相同的同时汇报。这就给了什么更多的时间来处理每个报告单独而不是同时处理许多报道从而节约时间在整个过程。在所有的情况下,它被注意到,当清洁工的数量分配给每个部门经理大,系统的效率的完成时间和测量大大减少。

6.3。传感器模型

结果从两种类型的传感器模型相互比较研究效果增加面积大小和数量的系统上的清洁工。

归一化累积区域范围
图12显示了每个数字的结果清洁工每个区域的大小取决于所使用的传感器类型。

归一化累积区域范围的准确的传感器是观察不到的嘈杂的传感器。这是预期,因为没有清洁工失败的概率和重复扫描。所以所有的实验值仍然几乎不变。

F测量
图13显示了结果取决于所使用的传感器类型。的测量的理想传感器几乎总是大于噪声传感器和一个常数1表明没有发现矿山或意想不到的结果。除了高扫什么都比(100×100)50个清洁工,因为什么都无法同时处理所有的报告。

完成时间
图14显示了结果取决于所使用的传感器类型。理想的传感器的结果表明,时间总是小于噪声传感器的再次因为没有清洁工失败会发生和每一个清洁工被指定到一个更小的。因此理想的传感器区域范围的最优结果,F测量,和时间。

6.4。讨论

具有挑战性的问题实现不同种类的代理之间的协调,因为每个代理都有自己的信仰,欲望,和意图和一些代理人的行为是依赖于信仰不同类型的其他代理。

另一个具有挑战性的问题是不同的移动模型的实现需要处理所有可能的情况下我的位置相对于清洁工清扫器和决定如何能够避免环境的我,继续扫描。另一个问题是如何重新分配环境对剩下的清洁工扫一次处理的情况下失败。

解释结果表明,使用温和的协调运动的清洁工相对于环境扫描的大小是最有效的方法;然而,如果协调运动的缺点(前面描述)无法避免,那么可以使用随机运动但有限数量的清洁工和考虑的影响每个机器人的苍老师的宽度比长度。

是观察到扫描的基于模式的矿山将花费更少的时间虽然在某些情况下它可能包括重复扫描,将增加测量。也使用准确和精确的传感器来检测矿山将节省的机器人爆炸从而防止重复扫描和减少完成时间并给出最优结果。所有模型的结果为最坏的情况也就是100×100面积如表所示2,3,4。最好的情况在每种情况下以粗体突出显示。


100×100区	流动模型(协调/随机)
不。的清洁工	面积%	F测量	时间(秒)

5	104 /115.7	0.97 /0.62	361年
10	120.5/130.3	0.989/0.64	277.5
25	110.1/72.6	0.984/0.29	198.5
50	99.3/ 20.3	0.994/ 0.2	129.5


100×100区	我的分布(随机/模式)
不。的清洁工	面积%	F测量	时间(秒)

5	104/107	0.97/0.97	361/242.7
10	120.5 /103.5	0.989/0.95	277.5/189.25
25	110.1/105.4	0.984/0.989	198.5/132.3
50	99.3/ 110	0.994/0.994	129.5/94.3


100×100区	传感器模型(嘈杂的/理想)
不。的清洁工	面积%	F测量	时间(秒)

5	104/99.1	0.97/1	361/259
10	120.5/99.4	0.989/1	277.5/168
25	110.1/99.8	0.984 /1	198.5/116
50	99.3/99.79	0.994/ 0.989	129.5/103.5

7所示。结论

提出了一种合作multirobot系统内置技术和know-how-to-cooperate使用BDI模型来控制机器人的行动和TeamLog理论来控制各种机器人和之间的交互系统中信息的流动。这些模型被选中是因为他们的灵活性和与人类决策过程的相似性。该方法测试的实际案例研究人道主义排雷,因为它被认为是一个严重的问题在许多发展中国家。结果显示系统的灵活性,环境中的错误像传感器的不准确。结果还显示系统的可伸缩性在控制许多代理商60 100×100年环境以稳健的方式。

未来方面的研究包括研究其他类型的移动模型尤其是紧急流动性模型没有正式的清洁工之间的协调运动。每一个清洁工观察其他邻近清洁工移动和移动基于集体运动达到某个目的地。这种方法将减少清洁工和细节之间的沟通从而减少所需的计算能力在这两个代理。

此外,该方法有望应用于真实的机器人在全国机器人竞赛“扫雷:向Landmine-free埃及”10],是社会组织的IEEE机器人与自动化(RAS)在开罗埃及章,由德国大学合作执行秘书处的排雷和开发西北海岸,埃及外交部国际合作。

引用

h . Irandoust a Benaskeur,哈米斯,”合作在分布式监测:概念、理论模型和技术,”技术。代表,Valcartier, 2010年。视图:谷歌学术搜索
l·帕克,“多个移动机器人系统”手册的Roboitcs施普林格,页921 - 941年,2008年。视图:谷歌学术搜索
d . Floreano和c . Mattiussi人工智能仿生学研究:理论、方法和技术,麻省理工学院出版社,2008年。
哈米斯,“传感器和演员合作网络分布式监视上下文”学报第十届国际会议上实际应用代理和多重代理系统(PAAM的12),2012年西班牙。视图:谷歌学术搜索
Witkowski, m . El-Habbal s Herbrechtsmeier et al .,“自组网通信基础设施在灾难场景中,多机器人系统”学报EURON / IARP国际研讨会上机器人对风险干预和监测环境2008年1月,Benicassim,西班牙,。视图:谷歌学术搜索
j . Conesa-Munoz A·里贝罗,g . Pajares“基于遗传算法的多路径规划方法对于机器人舰队在耕地,工作”诉讼葡萄牙人工智能会议(EPIA的11),2011年。视图:谷歌学术搜索
s . Verret”multirobot系统当前状态的艺术,“技术。众议员DRDC美迪辛哈TM 2005 - 241,技术备忘录,2005。视图:谷歌学术搜索
p·多尔蒂和f . Heintz”,基于合作机器人框架合作代理信息,2007年。视图:谷歌学术搜索
r·卡西尼·g·比安科、a . Cavagi和w·Ransenigo“地雷检测方法使用成群的简单机器人”学报第六届国际会议上聪明的自治系统,第218 - 212页,2000年。视图:谷歌学术搜索
哈米斯,“扫雷:向landmine-free埃及,”《华尔街日报》一并和我的行动,没有。17.1,2013。视图:谷歌学术搜索
r·基利”理解地雷,地雷行动”,6月3日2012年http://mit.edu/demining/assignments/understanding-landmines.pdf。视图:谷歌学术搜索
哈米斯,“16374 -合作多机器人系统,”硕士课程,马德里卡洛斯三世大学的,2011 - 2012。视图:谷歌学术搜索
l . Giraldeau和t . Caraco社会觅食理论,行为和生态的专著》,普林斯顿大学出版社,2000年。
h . Najjaran和a·a·戈登伯格“地雷检测使用一个自治terrain-scanning机器人,”工业机器人,32卷,不。3、240 - 247年,2005页。视图:出版商的网站|谷歌学术搜索
j·维达尔,可替换主体系统原理与NetLogo例子,2010年。
a . Benaskeur a·哈米斯和h . Irandoust”扩大的合作在分布式监测系统密集地区,”国际智能防御支持系统杂志》上,4卷,不。1,20至49,2011页。视图:谷歌学术搜索
答:债券和l .夸夸其谈的人数据在分布式人工智能,1988年摩根考夫曼。
n·r·詹宁斯k Sycara, m·里奇“代理研究和发展的路线图,”自治代理和多主体系统,1卷,不。1,7-38,1998页。视图:谷歌学术搜索
g .韦斯多重代理系统:现代分布式人工智能的方法,麻省理工学院出版社,1999年。
m·辛格Intetions的理论框架,技术和沟通施普林格,1994年。
m . p . Pacaux-Lemoine和s . Debernard“共同工作空间人机合作在空中交通管制中,“控制工程实践,10卷,不。5,571 - 576年,2002页。视图:出版商的网站|谷歌学术搜索
m .,结束目的、计划和实际的原因,1999年CSLI出版物。
m . Georgeff p·b·佩尔·m·波拉克m . Tambe和m·里奇“belief-desire-intention模型机构”《智能代理的国际研讨会,1998年。视图:谷歌学术搜索
m .,结束”的意图是什么?“在意图沟通p。1532年,麻省理工学院出版社,剑桥,质量,美国,1990年。视图:谷歌学术搜索
Bruecjner和h . v . d . Parunak”对手的不是行为,推断”敌对的推理:阅读对手的计算方法已被敌军布上了地雷,2008年。视图:谷歌学术搜索
n .詹宁斯“走向合作协作解决问题,知识水平”人工智能程序第十届欧洲会议,第228 - 224页,维也纳,奥地利,1992年。视图:谷歌学术搜索
f .火盆、c·彼特和j . Treur基于联合意图合作模型的形式化在人工智能课堂讲稿,施普林格,1997年。
诉莱尔•o . Simonin A Koukam, j·费伯,”一个正式的方法来设计和重用代理和多重代理模型,”软件工程学报》第五届国际研讨会Agent-Oriented V (AOSE ' 04)2004年7月,页142 - 157。视图:谷歌学术搜索
j .雷曼j . Laird, p .罗,“温柔的介绍飙升:人类认知架构,”邀请认知科学,麻省理工学院出版社,1996年。视图:谷歌学术搜索
b . Dunin-Keplicz和r . Verbrugge多智能体系统:团队合作在一个正式的方法威利,2010。
r .教唆犯,j . Halpern y摩西,和m .瓦迪,推理关于知识,麻省理工学院出版社,1995年。
J.-C。迈耶和w·范德隐谷,认知逻辑,人工智能和理论计算机科学英国剑桥,剑桥大学出版社,1995年。
p·r·科恩和h . j .几何”,目的是选择与承诺,“人工智能,42卷,不。2 - 3、213 - 261年,1990页。视图:谷歌学术搜索
b . Dunin-Kȩplicz和r . Verbrugge集体意图。”Fundamenta Informaticae,51卷,不。3、271 - 295年,2002页。视图:谷歌学术搜索
e . Graedel”模态逻辑为何如此强劲可决定的?”《欧洲协会理论计算机科学卷,68年,第103 - 90页,1999年。视图:谷歌学术搜索
b . Horling和诉较小,多智能体组织模式的调查,“知识工程评审,19卷,不。4、281 - 316年,2004页。视图:出版商的网站|谷歌学术搜索
d .计“many-robot命令控制系统”学报第19届水下机器人技术研讨会,22 - 24,1992页。视图:谷歌学术搜索
d .计”,与不完美的传感器、随机搜索策略”移动机器人八世卷,2058学报学报,第279 - 270页,1993年。视图:谷歌学术搜索
y .问:苗族,a·哈米斯和m . Kamel”协调运动控制的移动传感器在监测系统中,”学报》第三届国际会议上信号,电路与系统(SCS 09年),2009年11月。视图:出版商的网站|谷歌学术搜索
m . Yun-Qian流动模型的研究在移动监测系统(硕士论文)滑铁卢大学,2010。
m . Cardei和j .吴在无线传感器网络覆盖,CRC出版社,2004年。
s . Meguerdichian f .高级m . Potkonjak m·b·斯利瓦斯塔瓦,“特别的无线传感器网络覆盖问题,”学报的第20届联席会议IEEE计算机和通信的社会2001年4月,页1380 - 1387。视图:谷歌学术搜索
p . b . Liu黄铜,o . Dousse, p .将近城门,d . Towsley,“流动性提高传感器网络的报道,”学报第六届ACM国际研讨会上移动Ad Hoc网络和计算(MOBIHOC ' 05)2005年5月,页300 - 308。视图:谷歌学术搜索
刘b和d . Towsley”大规模无线传感器网络的覆盖和检测能力,”程序的建模和优化在移动,特别和无线网络会议,2003年。视图:谷歌学术搜索
a . t . Nghiem f . Bremond m . Thonnat诉瓦伦汀,”ETISEO,绩效评估为视频监控系统”《IEEE视频和基于信号的监测(AVSS ' 07)2007年9月,页476 - 481。视图:出版商的网站|谷歌学术搜索
r·杜达·哈特和d .鹳,模式分类,2000年Wiley-Interscience。
w·d·o .的首席工程师,在阿拉曼1943年,德国的雷区http://cgsc.cdmhost.com/cdm/singleitem/collection/p4013coll8/id/1336/rec/14。

机器人杂志

文摘