复杂性

在这一页上

文摘介绍讨论和分析分析结论数据可用性的利益冲突确认引用版权相关文章

特殊的问题

理论和应用的复杂Cyber-Physical交互

把这个特殊的问题

研究文章|开放获取

体积2020年| 文章的ID9207324| https://doi.org/10.1155/2020/9207324

一个双层的概率为多个机器人运动路径规划算法的不确定性

Jingchuan王 ,¹ Ruochen大 ,² 和(徐 ¹

客座编辑: 宁王

收到了 2020年4月18日

接受 2020年5月15

发表 05年6月2020年

文摘

为提高系统效率,在仓库环境的机器人运动的不确定性,提出了一种双层的概率路径规划算法。在该算法中,地图划分为多个相互关联的地区和算法的体系结构由拓扑级别和路线生成从上面地图:拓扑中的水平,通过地区的顺序计划结合地区抚慰民众,实现地区平衡,减少机器人在运动的不确定性的影响。和路线,MDP方法结合运动的概率不确定性提出了规划路径时,所有的机器人在每个区分开。同时,为每个步骤的数量规划是依赖于概率降低的数量规划。证明了避免冲突,讨论和优化算法。仿真结果表明,该算法实现了提高系统效率,也可接受的实时性能。

1。介绍

在仓库、多个机器人的运行运动不确定性发生不可避免地存在一些禁用组件以来机器人,网络不稳定,干扰人行走。在这种情况下,机器人不会遵循设计路径和时间之间的耦合关系和空间域路径坏了。毫无疑问,其他机器人是被那些运动不确定性发生。最后,整个multirobot系统将影响,这带来了混乱甚至崩溃的整个系统。可以看出,这构成了巨大的挑战在仓库多机器人的路径规划。因此,考虑到运动的不确定性在多个机器人的路径规划是值得关注和研究的问题。

作为一种方法考虑到运动的不确定性的离散映射,马等。1]设计了路径规划算法,包含相关的限制原则,代理人不能进入的顶点被其他代理在最后时间步。仍然可以发生冲突,这将导致击穿multirobot系统的仓库。另一种方法可以处理由运动引起的不确定性的问题需要重新计划多个机器人的采样机器人的路径包含异常信息。李等人。2)提出了一个两阶段的轨迹规划方案与成本变量在一个有向图建立连接和可变成本取决于可达性,碰撞的风险,和不同约束状态。Gombolay et al。3)提供了一个集中式算法处理严格intercoupled时间和空间约束和尺度与大量的机器人环境,旨在提高效率第一。然而,上述方法不能保证实时性能。在[4),作者提出了一种混合架构相结合与分布式集中协调的行动自由达到一个适当的相互作用。建筑需要的新采样机器人在每个时间步的状态,和路径规划算法将采用抽样时协调多个机器人的路径包含运动信息的不确定性。然而,无法保证实时性能和整个系统的效率降低是由于过于频繁的计划。中介绍的算法(5,6)基于广义概率路线图(GPRM)也坐标下多个机器人运动路径的不确定性通过使用反馈信息。算法,介绍了被动规划策略多旅行商问题(MTSP)解决方案方法。然而,系统效率低,无法保证算法的可伸缩性,因为更需要采样点。一个新颖的方法(7)基于抽样考虑运动的不确定性会传播延迟。机器人的路径需要重新计划采用帕累托最优计划修复方案。不过,关注系统效率下降的问题仍然没有解决。

作为一个经典的方法用于解决不确定性问题,介绍了马尔可夫决策过程(MDP)领域的多个代理。相应的可替换主体mdp (MMDPs)设计为多个代理的计划。在[8),介绍了近似方法结合MMDPs路径规划问题的一组均匀microair车辆(小牛)对一组目标。该算法可以保证没有冲突。马等。9)提出了使用健壮的计划执行的政策来控制每个机器人收益如何沿其路径2级MDP解算器,生成有效的计划。优化解决方案,小说最优解算程序设计(10)中不确定性问题的运动transition-independent MMDPs。在[11),一个平衡的政策提出了MMDPs。基于macroactions的概念,路径规划问题是转移到分散的部分可观测马尔可夫决策过程(Dec-POMDPs) (12,13]。可替换主体强化学习(泥灰岩)[14- - - - - -20.)在“多代理系统”解决了学习任务(质量)。然而,推理代理会处理学习任务生长指数根据代理商的数量。因此,这些方法的计算复杂度很高,基于mdp实时可伸缩性性能无法保证。

最近,已经提出的规划方法基于同伦类解决运动问题的不确定性。在[21,22),建立了协调的空间,这是后来的路径规划的基础。通过选择同伦类无碰撞的路径,一个集中控制器是专为运动不确定性下的路径规划问题。而且,基于优先级的编码,这被称为优先级图,介绍了为等位的解决方案来解决协调问题(23]。对于[21- - - - - -23基于homotrophy类),规划方法可以证明没有冲突的协调路径和确保所有机器人最终将达到目的地,即使一些机器人被延迟扰动暂时停止。然而,解决方案的质量在很大程度上减少由于这种方法只考虑下一步的动作,所有的机器人将按照先前的计划路径。

虽然上面的方法确保冲突可以避免多个代理下运动的规划中不确定性,问题仍然存在。multirobot系统的效率不能保证运动的不确定性。因此,本文的第一个目标是设计一个算法,可以对多个机器人即使计划无冲突路径运动发生的不确定性。和另一个目标是提高系统效率,包括整个系统的时间和数量的计划。

为了达到这些目标,在这篇文章中,地图被划分到多个地区,我们提出一个双层的规划架构,由拓扑级别和路线从上面生成的地图。

拓扑中的水平,通过地区的订单计划是基于路径的重量在拓扑地图。在这个过程中,机器人的重量变化动态地根据分布;拓扑中规划水平的目的是达到平衡,从而反过来降低机器人在运动的影响的不确定性和提高系统效率。在路线,MDP-based概率统计方法提出了规划路径时,所有的机器人在每个区分开。MDP结合运动的概率的不确定性,提高效率。和步骤的数量为每个计划依赖于概率减少计划。我们证明了算法设计的无冲突。我们也验证了系统效率改进的算法设计和仿真优化讨论。

本文的其余部分组织如下。部分2提供问题的陈述。节3,介绍了多机器人路径规划算法。部分4证明了该算法是无冲突,探讨了优化。仿真验证结果报告部分5。部分6总结我们的研究。

2。问题公式化

本文试图解决的问题是多个自主移动小车的路径规划与运动的不确定性在仓库。在这个问题上,仓库环境是离散和简化图的顶点对应位置的边缘对应位置之间的转换。图1显示了离散映射。

让是一组机器人。时间是离散成时间的步骤。正式描述一个计划,一个机器人的路径是一个地图这意味着位置的在每个时间步属于顶点。一个机器人可以保持静止或移动到一个相邻的顶点。机器人可以同时移动但限制在同一边缘在相反方向移动或移动在同一顶点的同时,确保不存在多个机器人之间的冲突。图2给这些限制条件的插图。

(一)

(b)

让是一组的任务是不断生成的。每个机器人被分配一项任务,它有一个起始位置(小点)和目标位置(存储)。和所有任务的时间。机器人的运行期间,运动不确定性,这意味着机器人必须立即停止,随时可能发生。和不确定性的概率是。

本文假定以下关于多个agv调度的仓库:(我)可行的路线都是双向双向街道,这意味着两个机器人可以并排驱动器和机器人可以在两个方向上每一个可行的途径。(2)仓库的货架和可行的方式,如图所示1(不限于此场景)。(3)所有机器人的位置是已知的。(iv)不确定性的概率。(v)机器人的延迟将恢复正常。在经济复苏后,这些机器人将仓库系统投入运营。(vi)任务分配不考虑。

本文的下标字母不在括号用于识别。字母或数字的下标的括号用于索引。

因此,问题研究中可以制定以下方程fd1:

3所示。双层的路径规划算法对多个机器人

在本节中,介绍了双层的路径规划算法。这种结构的目的是这地区平衡会考虑拓扑中水平减少机器人在运动的影响的不确定性和分布式路径规划在每个地区可以提高系统的效率即使运动不确定性发生的路线。算法的结构如图3。它分为两个水平从地图上生成分区:拓扑级别和路线。在拓扑级别,该算法计划通过地区的顺序。路线的水平,该算法计划路径机器人分别在每一个地区,考虑到运动的不确定性。和地图的引入分区如下。

3.1。地图分区

摘要离散映射图1被划分到多个地区吗如图3。拓扑层次的拓扑地图的生成列出如下:(1)每个顶点吗对应的地方 ;(2)每条边代表的地区和是相关的。让水平和垂直边缘的边缘和。路线的水平,各地的所有可行的方法离散映射图1所示路线地图。

3.2。拓扑级别

拓扑中,第一步的规划问题中引入部分3是为机器人规划地区的传递订单已被分配的任务。在每个时间步,可能有多个任务分配给机器人。这些任务的数量以及这些任务相对应的机器人。根据任务已分配给机器人吗 ,的地区包含的开始位置和目标位置是和 ,分别(这里和代表相应的地区)的索引。正式描述计划的结果,经过的地区对于机器人的顺序是一个地图。

在这篇文章中, 被定义为宏观的时间,独立拓扑中离散变量的水平。的增加 ,机器人将从一开始目标地区。不同于离散的时间步,宏观的时间表示时态拓扑空间和对应地区的水平。因此,的变化代表机器人拓扑中水平的转移。如果地区和机器人是不同的,那么相应的边缘将图中定义如下fd2:

在这个配方,优势代表的过渡来 ,机器人的运动方向是什么。的机器人已分配的任务,有相应的宏观时间吗和当达到启动区和目标地区 ,分别。然后,规划问题关注的地区可以制定如下:

在这个配方的优化目标,边的长度吗 ,这是对应的两个地区的中心之间的距离。由于不同长度的边缘图 ,过往论文边的时间是不同的。在我们的问题中,长度的水平边缘垂直边缘的两倍。因此,通过时间的两倍水平边缘垂直边缘。对于其他环境地图有不同的布局,原理是一样的。根据这一原则,通过机器人应满足以下几点:

基于这一原则,方程(2)可以写成

在方程的优化目标(3),代表边的抚慰宏观的时候(这里我们假设和是不同的)。它的定义如下: 在哪里和地区的规范化抚慰和 ,分别。和各地的抚慰表示为 ,代表机器人的数量在每个地区在宏观的时间。它可以通过获得的订单每个机器人。此外,机器人正在以来这些值是动态变化的。然后,可以采用归一化计算的方法和。

此外,由于运动的不确定性机器人,机器人不会到达区精确地计划。因此,eachmacroscopic时候,有多个机器人分配新的任务和需要新的路径规划在当前仓库环境计划,规范化方程(拥挤现象6)应该根据分布和传递订单重新计算所有机器人的拓扑。具体而言,假设一个机器人位于区并将搬到区当有新的任务和宏观的规划需要时间 ,如果对应的边缘之间的过渡和属于 ,然后这个机器人仍将留在这条边在下次在方程(6)。如果属于边缘 ,这个机器人会移动到下一个在宏观时间优势。

因此,优化目标方程(3)考虑边缘的长度,机器人将通过和拥挤现象相关的地区,其目的是确保机器人的路径不会太久了,这个地区已计划在这些机器人不会太拥挤。这个设计可以保证不同地区间的平衡和整个仓储系统的效率。

中列出的约束方程(3)确保算法规划路径机器人从起始位置到目标位置的拓扑结构水平。

在方程(解决优化问题3),K最短路径规划算法(24)采用为每个机器人获得多个最短路径需要计划。根据计划路径,通过命令可以生成使用方程(4)和(5)。优化目标可以根据上面介绍的规则,计算和最优解可以选择所有的组合,其中包含的信息关心机器人的传递顺序分配新任务的拓扑结构水平。

图4显示了一个示例拓扑规划结果的水平。可以看到,规划结果遵循上面的分析;拓扑的算法水平倾向于选择的路径更短和更少的拥挤,因为这可以最小化优化目标中提到的方程(3)。

3.3。路线水平

在双层的架构中,当拓扑层面的规划已经完成,根据机器人的分布,每个地区将进行的规划机器人在该地区分布。

在路线,路线地图是由每个地区的所有可行的方法。和当地的路线计划是计划中的所有机器人的行动计划。

在各地的规划,考虑机器人的运动不确定性和概率 ,规划的步骤应该直观地介绍了有关吗(不仅指的是计划在每个步计划,还指的是时间间隔每两个策划方案)。这个想法的目的是,可以动态地调整基于规划步骤和一些多余的规划(11,12将不需要了。在这里,我们定义计划的步骤为:

从这个定义可以看出,有一个逆规划步骤之间的关系和运动不确定性的概率。当变大,这意味着有更高的概率,机器人不会按照先前的计划路径、规划步骤变得更小,算法将计划路径机器人更为保守。第一个运动不确定性的概率计算的目的是保证规划路线的实时性能以来传统的重新规划所有路径从当前位置到目标位置。然而,计划的步骤是依赖于运动的不确定性的概率。这是规划的步骤的另一个目的是基于调整 ,可以防止这种情况频繁的重新规划可能摧毁计划优化的路径。

在规划路线,各地可以制定如下优化问题:

配方的优化目标,代表一个政策和有政策是。每个策略包含关心的信息行为的机器人在每个时间步。每个策略, 在哪里表明政策第一次一步所有的机器人区在计划之中。和在哪里表明政策为机器人在时间的第一步和是机器人的数量位于区在计划之中。和代表了一步的政策。

表示期望的奖励MDP的相似。设计目标函数的目的是这可以获得运动以来的概率最优解存在的不确定性机器人。是折扣的因素。有关系方程(9)。的目标方程(9)是基于当折扣因子可以动态调整高;长期奖励不再是可靠的和基于MDP的路径规划的优化总短期的奖励。

代表国家在当前从一开始时间步区需要计划的时间步时间步骤开始后一步。和 ,它包含所有的机器人的状态区,这意味着。国家表示机器人的状态后的行动。定义了每个州的奖励基于机器人在相应地区的分布。

因此,根据马尔可夫决策过程(8),优化目标方程(8)暗示的回报的期望开始时间步后的状态时间的步骤。它可以改写如下: 在哪里表示动作后的可能的状态在国家吗因为有机器人的运动不确定性,代表了奖励机器人在该地区的国家 ,和的概率是机器人的状态在这个地区会当行动在国家吗。概率可以计算如下: 在哪里机器人的状态吗后的行动在状态和的概率是机器人的状态吗将会改变成后的行动在状态。和这个概率依赖于运动的不确定性和可以表示如下:

的奖励的政策 ,它是拥挤的地区及相关地区的机器人之间的距离,可以定义如下: 在哪里的规范化热闹区计划当政策。和抚慰地区的计划可以计算如下: 在哪里之间的距离是和在国家。然后,抚慰需要规范化使用的原则将softmax按照下列公式:

在方程(13),表明该机器人的价值在国家。它被定义为机器人之间的距离和下一个地区前往以来通过订单已计划在拓扑级别。计算规则这个距离是基于曼哈顿距离。

为了避免在多个机器人之间的冲突,因素介绍了。和在方程(13)定义如下:

它可以看到从方程(16),会有一个机器人之间的冲突和 , 设置为∞。当一个机器人会搬到另一个机器人的位置在下次一步呆在现在,然后被设置在。否则,设置为1。

根据方程(13)(16),这个设计的首要目标是防止各地将会挤满了人,因为这将导致协调空间过小,这意味着一旦发生一些机器人运动的不确定性,很难对该算法找到的解决方案和系统效率会下降。另一个目标的集合是为了防止冲突和确保一个机器人不会选择的行动可能会导致它旁边另一个。这是有益的运动协调机器人自运动的不确定性会导致它仍然呆在前面的位置,从而增加冲突的概率。因此,这个设置可以减少这样的情况的概率。

在方程(解决优化问题8),策略集需要生成区和最低目标的政策将被选为解决方案。和候选人的原则行动组的政策是,机器人不会远离下一个地区后采取这个行动。为这一原则有两个好处。首先,越远的距离下一个区,更大的目标函数方程(8)。其次,由于这一原则的引入,候选人的行为将减少,进而降低计算复杂度。根据以上原理,有两种候选操作集各地当机器人在不同的位置:(1)当机器人在任何位置的地区,而不是进入边界,候选人行动的机器人是集表示。这个动作意味着机器人驱动双向的另一边在下次一步,意味着机器人是当前的街道,和意味着机器人仍然停留在下次的步骤。例如,在图5,机器人和在进入边界地区,而不是下一个时间步。因此,他们的候选人行动集包含 , ,和橙色箭头显示。,如图5,两个地区之间的边界被定义为一个区域组成的四个网格,和一个边界的一半属于一个地区和其他属于邻近地区。考虑到路径规划路线水平进行分别在每一个地方,机器人应该只沿着一个方向(驱动)在遍历的过程中相邻的边界地区,避免冲突。(2)当机器人的边界地区或进入边界,候选人行动的机器人是集表示或根据机器人的规则应该只开车向右在遍历的过程中边界。例如,机器人在图5在下个时间步是进入边界及其候选人操作集是什么这意味着它需要双向首先的右边。和在边界和他们的候选人的行动是什么。

根据上述候选人操作集,生成过程的机器人和政策如图6。为每一个机器人,它可以获得多个政策。然后,可以生成每个机器人的多种政策组合。

图6

代的政策为在每一个地区。假设在每个地区包括候选人的行为 , ,和 ,政策的一代对机器人此图所示。在这棵树结构中,不同水平的分支对应于不同的步骤。每个圆代表了行动在该地区相应的时间步。例如,行动意味着所有机器人留在该地区应该离开了。一个完整的政策从时间的第一步α蓝色的框中说明了时间步。可以生成多个政策每个机器人从这个树结构。

4所示。讨论和分析

4.1。避免冲突

在本文中,我们提出一个双层的路径规划算法。该方法的体系结构分为拓扑级别和路线。在拓扑级别,地区的传递顺序是机器人的计划。在拓扑级别,因为没有冲突地区可以遍历多个机器人在同一时间。因此,冲突避免算法的主要取决于是否可以在路线计划无冲突的路径。我们试图证明它在以下的命题。

命题1。路径规划的路线水平可以计划无冲突的路径时,所有的机器人。

证明。在路线提出的方法中,机器人路径的地区是许多时间和计划在每一次与MDP的步骤。因此,我们尝试用数学归纳法证明无冲突的路径可以通过该方法总是计划在该地区。我们首先描述一些符号的一些变量促进证据的表达。
对于任何区与米机器人,线路图可以表示为。和机器人在区可以表示为。代表了在每个区域路径规划。在th规划:时间步是表示的开始 ,和规划步骤。MDP的解决方案和计划的道路对于任何一个机器人是。详细证明如下:(一)首先,当 ,证明了路径规划是无冲突:第一次的路径规划,机器人离开每个地区的边界。这些机器人的各地前往不同方向和位于不同侧面的双向映射。因此,总是存在一个解确保所有机器人继续他们目前的双行道时间的步骤,没有机器人从相反的方向运行在相同的双行道。和机器人的规划路径满足方程(17)。它可以得出的结论是,上述奖励解决方案根据方程(16)将不会和可以优化目标的可行解,从而证明该方法可以计划无冲突的路径时,所有的机器人吗。 (b)第二,当 ,假设计划的路径th规划是无冲突和证明计划的路径 th规划也无冲突:考虑到路径规划规划是无冲突,结束位置计划路径对于任何机器人满足方程(17),这意味着不存在方向冲突的情况和位置。另一方面,结束位置的路径规划等价于一开始的位置的路径规划。如果存在在哪里代表未来从上升的作用和位置代表下一个位置剩下的行动,方程(18)可以得出结论。这意味着每一个机器人可以与其他机器人向左或没有冲突。因此,它可以建立一个候选方案让机器人去同一个方向运行在相同的边的双向街道路径的步骤。当机器人前往不同方向运行在相同的双行道,计划与其他机器人路径不会有冲突。因此,它可以证明计划的路径规划是无冲突。当机器人去边界在最后一次规划,考虑到机器人始终遵循一个方向当他们进入边界或穿越边界,district-distributed方式路线方法的水平不会有来自不同地区的机器人之间的冲突。
总的来说,总是会有冲突的解决路径规划的路线与该方法。

4.2。优化

multirobot系统与每个机器人主题的不确定性,直接计算最优解是非常困难的,必须在机器人的运行多次验算。因此,很难直接证明优化或接近优化。在本节中,我们将讨论该方法的优化。考虑到本文提出方法的体系结构分为两个水平和路径分别计划,我们讨论提出的优化方法从以下两部分:(1)路径规划的拓扑层:在拓扑层面,最优区域的订单可以获得所有的机器人的原因如下。首先,K最短路径规划算法(24)采用获得每个机器人通过地区的多个订单。和订单的组合通过地区之间可以生成机器人。当K是足够大,所有可能的组合的订单可以获得通过的地区。其次,方程(3)拓扑中忍受水平,旨在减少相应的两个地区的中心之间的距离和总拥挤地区之间在所有机器人分配新的任务。以上优化目标可以根据订单的所有可能的组合计算通过机器人的地区。(2)路径规划的路线水平:该方法需要的所有机器人路径规划各地多次和计划的路径机器人在每个时间的步骤,直到所有的机器人离开该地区。所以,很难直接证明优化。在这一部分,我们比较以上方法与现有的方法(8讨论了该方法的优化。类似于方法,现有的方法还需要在每个地区多次路径规划。所不同的是,在每一个时间规划,现有的方法计划静态的路径先和MDP方法和执行步骤步骤。优化目标方程所示(19)。可以确保目标计划的路径是机器人离开从当前的位置区。在现有的方法(8),也是凭直觉有关吗在方程(7)。现有的方法(8证明了优化。

讨论了该方法的优化,我们尝试讨论第一的相似性α解决方案的步骤在每一次计划与现有的方法相比8在以下两种情况:(一)当运动确定性概率很低 :在这种情况下,接近根据(7)。很明显,第一个解决方案的步骤方法和现有的方法(6接近相同。例如,图7显示了一个情况三个机器人位于不同的国家,和表1显示了不同解决方案的路径规划的情况在图7使用以上两种方法是不同的(现有的方法设置为10 (8])。如表所示1,当是0.1或0.2,第一该方法的步骤是一样的现有的方法(6]。(b)当运动确定性概率高( ):在这种情况下,认为该方法与现有的方法(8)选择MDP折现系数方法存在于优化目标和关系根据方程(9)。因此,当高,在(19)会降低。这意味着过去步骤的解决方案对方程计算(几乎没有影响19)。在这种情况下,第一个该方法的步骤接近现有的方法(6]。例如,在表中1,当接近根据(19),很明显,该方法的解决方案是首先接近α从现有的方法步骤的解决方案8]。图7显示了一个情况三个机器人位于不同的国家,和表1显示了以上两种方法的不同的解决方案是不同的。如表所示1在图的例子7,当是0.4或0.5,尽管解决上面两个方法不是完全相同的,提出的解决方法是先接近吗从现有的方法步骤的解决方案8]。

5。仿真结果和分析

为了评估该方法,模拟实现了Matlab环境下与英特尔的3.60 GHz酷睿i7 - 4790 u CPU和8 g RAM。仓库是如图的地图1。

运动的不确定性范围从0到模拟不同运动模式下的情况。机器人的数量设置为10、20、30、40、50。任务的数量是1000。

考,数量的规划步骤,计算时间与那些现有的方法(21,22)在不同数量的机器人。和现有的方法21,22),相对应的概率扰动强度在接下来的第二个机器人是否会阻止将移动和下界代表最好的旅行时间将最短的距离为每个机器人从开始到结束。平均20多次模拟表所示2- - - - - -4。之前已经生成模拟的任务。

5.1。考

表2仿真结果显示现有的方法,该方法的平均时间。标准差也表所示2。减少的比例极小化(最后一列在表中2根据以下公式计算: 在哪里和代表现有的极小化方法(21,22分别),该方法。考的图形仿真结果总结在图所示8。

5.1.1。平均时间

相比于现有的方法(21,22),可以看出,本文提出的方法有效地降低了考。当机器人的数量相对较小,减少比例很低,因为机器人是稀疏位于仓库环境和机器人的运动不确定性不会影响太多其他正常的机器人,这意味着大多数的正常机器人仍然可以按照之前计划的路径。随着机器人数量的增加,降低最大完工时间的比例大大提高,因为影响机器人的数量将进一步增加,这意味着该方法将重新计划找到更多的基于概率最优路径更多的机器人避免机器人在运动的不确定性。在这种情况下,通过结合MDP,冗余等的方法21,22是没有必要的。时的值增加时,该方法仍然可以提高系统效率和有一个较小的方差比现有的方法(21,22]。可以减少高达27.9%的比例当机器人的数量是50是0.5。

5.1.2中。方差

相比于现有的方法(21,22),该方法的方差更小。此外,与机器人的数量的增加,该方法的结果的方差小于增加现有的方法(21,22]。比较该方法的结果与现有的方法(21,22]意味着该方法更少的随机性和更稳定。原因是本文方法将优化路径的所有机器人根据概率。

在该方法中,与现有的方法(21,22),解决运动问题的不确定性通过等待策略,该方法协调路径下的机器人运动的不确定性采用重新规划新战略路径选择概率最优解。因此,运动不确定性情况发生时,所有正常的机器人将遵循的路径可能达到目的地尽快从全局视图,而不是采用未来战略和等待。因此,相比于现有的方法(21,22),效率的下降运动引发的不确定性可能会降低。这样,整个系统的效率可以改善运动不确定性发生时采用该方法。与现有的方法相比,可以增加效率,有利于整个系统的运行。

5.2。数量的规划步骤

比例的计划(列在表中2根据以下公式计算: 在哪里和代表的数量规划和相应的极小化方法,分别。表中给出了每种方法的时间2。图形仿真结果总结计划百分比图所示9。从表可以看出3计划的百分比的方法比这小得多的方法21,22]。它计划在每个时间步方法以来,(21,22]是一种被动的方法。因此,这个比例是100%。相反,该方法路线水平只会计划当机器人完成的道路规划步骤或运动时发生的不确定性。因此,计划将减少的百分比,与现有方法相比在21,22]。

(一)

(b)

(c)

(d)

(e)

另一个结论我们可以从表中3是,当概率小,减少比例方法相比(21,22)当的概率更大增加,减少比例变得越来越小。这样做的原因是,当很小,不会有太多的时间步骤运动不确定性发生,这意味着不会有太多的时间步骤计划是必要的。因此,计划的比例相对较少,导致减少更大的百分比。当变得更大,当运动不确定性发生更加的时间步骤,这导致更多的计划。因此,计划的比例增加,这将导致减少比例小。然而,值得注意的是即使计划变得更大的比例的比例增加时,该方法仍然是不足的方法(21,22]。

5.3。计算时间

表4显示了平均计算时间不同。表中的数据表明,该方法能够满足实时性的要求。的原因,该方法比现有的方法(21,22)是,现有的方法只计划下一个时间步,而该方法需要计划整个路径的目的地。因此,该方法的计算将比现有的方法。然而,如图10,计算时间的趋势更接近线性关系的方法,增加速度将减少慢慢随着机器人数量增加。另一方面,即使计算时间略大一些,该方法仍能计划无冲突对所有机器人实时路径,可以申请终身调度在仓库。

(一)

(b)

(c)

(d)

(e)

双层的概率路径规划算法的实时性能的多个机器人运动的不确定性是由双层的保证每个地区规划体系结构和分布式规划。拓扑层面将计划通过地区的订单分配任务和路径规划是机器人在每个区进行路线的水平。计划在每个地区只需要当前地区的行动计划要考虑进去。因此,规划的数量取决于 ,这意味着计算调整。

6。结论

为提高系统效率,在仓库环境的机器人运动的不确定性,提出了一种双层的概率路径规划算法。在该算法中,地图划分为多个相互关联的地区和算法的体系结构由拓扑级别和路线生成从上面地图:拓扑中的水平,区热闹的传递订单考虑优化区,实现地区平衡;路线的层面上,路径规划是在各地MDP-based概率方法,进行计划的步骤是有关运动的概率不确定性提高效率和保证实时性能。此外,冲突避免算法证明和优化设计进行了探讨。仿真结果验证了设计的算法可以提高系统效率和比例可达到27.9%设计仓库的环境,这也符合优化的讨论。也可以看出计划的数量已经在很大程度上减少。

我们未来的工作将包括进一步优化路径,考虑到不同地区之间的流动之间的相互作用自行动只在各地得到分布式规划。另一个方面是,真正需要实验来验证该方法的有效性。

数据可用性

该方法的源代码和仿真数据和比较方法(18,19)可从相应的作者。他们也可以找到https://github.com/SourceCode2020/Bi-level_Probabilistic_Path_Planning_Algorithm。

的利益冲突

作者宣称没有利益冲突有关的出版。

确认

这项研究得到了国家自然科学基金批准号下的中国61773261。

引用

h·马、t . k . s . Kumar和s . Koenig“多智能路径发现与延迟概率,”美国31日AAAI会议上人工智能,页3605 - 3612年,旧金山,美国,2017年2月。
视图: 谷歌学术搜索
h·p·g . Li Hildre, h·张,“向时间最优轨迹规划自治船舶操纵的近距离接触,”IEEE海洋工程》杂志上,硕士论文,2019页。
视图: 谷歌学术搜索
m . Gombolay r·威尔科克斯和j·沙阿,”与temporospatial约束、多机器人团队的快速调度”机器人的程序:科学和系统会议,柏林,德国,2013年6月。
视图: 谷歌学术搜索
h . Kowshik、d .他和p·r·库马尔”可证明的系统安全智能路口,“IEEE车辆技术,60卷,不。3、804 - 818年,2011页。
视图: 出版商的网站 | 谷歌学术搜索
Chakravorty和s . Kumar“广义sampling-based运动计划,”IEEE系统,人,Cybernetics-Part B,45卷,不。4、647 - 662年,2015页。
视图: 谷歌学术搜索
Kumar和s . Chakravorty“多智能广义概率路线图:MAGPRM”学报2012年IEEE / RSJ智能机器人和系统国际会议Vilamoura,页3747 - 3753年,葡萄牙,2012年10月。
视图: 谷歌学术搜索
a . w .死亡后,“无冲突路线规划在动态环境中,”学报2011年IEEE / RSJ智能机器人和系统国际会议,页2166 - 2171年,旧金山,美国,2011年9月。
视图: 谷歌学术搜索
l . Liu和n .迈克尔,“MDP-based近似方法目标约束multi-MAV计划在行动的不确定性,”诉讼的IEEE机器人与自动化国际会议上)举行(“国际机器人与自动化会议”,页56 - 62,斯德哥尔摩,瑞典,2006年5月。
视图: 谷歌学术搜索
h·马、t . k . s . Kumar和s . Koenig“多智能路径发现与延迟概率,”美国31日AAAI会议上人工智能美国,旧金山,CA, 2017年2月。
视图: 谷歌学术搜索
j . Scharpff d . m . Roijers f . a . Oliehoek m . t . j .跨度打和m . m . de Weerdt“用稀疏的交互,解决多智能体mdp transition-independent”Proc。30日AAAI相依Artif。智能。(AAAI)。,第3180 - 3174页,2016年。
视图: 谷歌学术搜索
高y, y, b,“可替换主体与非共享的价值功能,强化学习”IEEE控制论,45卷,不。4、647 - 662年,2015页。
视图: 出版商的网站 | 谷歌学术搜索
c、g . Konidaris a .安德斯·g·克鲁斯,j . p .如何和l . p . Kaelbling“政策寻找多机器人协调在不确定性下,”国际机器人研究杂志》上,35卷,不。14日,第1778 - 1760页,2016年。
视图: 出版商的网站 | 谷歌学术搜索
c·阿马托g . Konidaris g·克鲁斯,c . a .像,还有j.p.如何和l . p . Kaelbling”规划分散控制下的多个机器人的不确定性,”诉讼的IEEE机器人与自动化国际会议上,第1248 - 1241页,西雅图,佤邦,2015年5月。美国。
视图: 谷歌学术搜索
f·l·达席尔瓦,r . Glatt和a·h·r·科斯塔”MOO-MDP:强化学习面向对象的表示合作,”IEEE控制论卷,49号2、567 - 579年,2019页。
视图: 出版商的网站 | 谷歌学术搜索
l . Bu、r先生和德舒特,“强化学习的全面调查,”IEEE系统,人,控制论,一部分C(应用程序和评论),38卷,不。2、156 - 172年,2008页。
视图: 谷歌学术搜索
m . l .甲贺诉Freire, a·h·r·科斯塔“随机抽象策略:概括知识提高强化学习,”IEEE控制论,45卷,不。1,第88 - 77页,2015。
视图: 出版商的网站 | 谷歌学术搜索
f·l·席尔瓦,r . Glatt和a·h·r·科斯塔”同时学习和强化学习的建议,”第十六届国际研讨会论文集Antonomous代理和多重代理系统,页1100 - 1108,圣保罗,巴西,2017年5月。
视图: 谷歌学术搜索
g·沙尼、j . Pineau和r . Kaplow解决积分POMDP的调查,“自治代理和多主体系统,27卷,不。1,1-51,2012页。
视图: 出版商的网站 | 谷歌学术搜索
m .感性和o . Pietquin算法参数值函数逼近的调查。”IEEE神经网络和学习系统,24卷,不。6,845 - 867年,2013页。
视图: 出版商的网站 | 谷歌学术搜索
f·l·席尔瓦和a·h·r·科斯塔“加速可替换主体通过转移学习,强化学习”美国31日人工Intelligenc AAAI会议,页5034 - 5035年,旧金山,美国,2017年2月。
视图: 出版商的网站 | 谷歌学术搜索
m .帽,j·格雷戈勒,大肠Frazzoli”证明地安全deadlock-free执行延迟扰动下的多机器人计划,”学报2016年IEEE / RSJ智能机器人和系统国际会议大田,页5113 - 5118年,韩国,2016年10月。
视图: 出版商的网站 | 谷歌学术搜索
j·格雷戈勒、m .Čap和e . Frazzoli“局部最优延迟使用同伦扰动条件下的多机器人导航,”自主机器人,42卷,不。4、895 - 907年,2018页。
视图: 出版商的网站 | 谷歌学术搜索
j·格雷戈勒”,基于优先级的移动机器人协调”,2014年,http://arxiv.org/abs/1410.0879。
视图: 谷歌学术搜索
j .有m . Maxel,苏瑞,“找到最短k简单的路径:一个新的算法及其实现,”ACM算法交易,3卷,不。4,p。2007。
视图: 出版商的网站 | 谷歌学术搜索

版权

PDF 下载引用

下载其他格式

订单打印副本

的观点

505年

下载

918年

引用