raybet雷竞app|雷竞技官网下载|雷电竞下载苹果

复杂性gydF4y2Ba

1099 - 0526gydF4y2Ba 1076 - 2787gydF4y2Ba

HindawigydF4y2Ba

10.1155 / 2018/7692042gydF4y2Ba

7692042gydF4y2Ba

研究文章gydF4y2Ba

演变为可变形的轮移动机器人控制器gydF4y2Ba

http://orcid.org/0000 - 0001 - 8196 - 8889gydF4y2Ba

克拉克gydF4y2Ba

安东尼J。gydF4y2Ba

^1gydF4y2Ba 西塞尔gydF4y2Ba

基思。gydF4y2Ba

^1gydF4y2Ba

http://orcid.org/0000 - 0002 - 2046 - 5943gydF4y2Ba

摩尔gydF4y2Ba

贾里德·M。gydF4y2Ba

^2gydF4y2Ba 刘gydF4y2Ba

现任gydF4y2Ba

^1gydF4y2Ba

密苏里州立大学gydF4y2Ba

斯普林菲尔德gydF4y2Ba

密苏里州gydF4y2Ba

美国gydF4y2Ba

missouristate.edugydF4y2Ba

^2gydF4y2Ba

伟谷州立大学gydF4y2Ba

艾伦代尔gydF4y2Ba

密歇根gydF4y2Ba

美国gydF4y2Ba

gvsu.edugydF4y2Ba

2018年gydF4y2Ba

16gydF4y2Ba 12gydF4y2Ba 2018年gydF4y2Ba

2018年gydF4y2Ba 17gydF4y2Ba 08年gydF4y2Ba 2018年gydF4y2Ba 12gydF4y2Ba 11gydF4y2Ba 2018年gydF4y2Ba 21gydF4y2Ba 11gydF4y2Ba 2018年gydF4y2Ba 16gydF4y2Ba 12gydF4y2Ba 2018年gydF4y2Ba

2018年gydF4y2Ba

这是一个开放的文章在知识共享归属许可下发布的,它允许无限制的使用,分布和繁殖在任何媒介,提供最初的工作是正确的引用。gydF4y2Ba

无人地面车辆(作出)适合的任务太危险或过于单调的人。例如,作出可以遍历艰苦地形的灾民。然而,很难设计这些系统,这样他们在各种不同的环境中表现良好。在这项研究中,我们发展作出的控制器和物理特性可变形的轮子在模拟环境中改善其流动性。作出的使命是访问一个坐标序列而自动处理不同大小的障碍通过扩展struts轮径向向外的每个轮子的中心。进化有限状态机(FSMs)和人工神经网络(ann)进行比较,和一组控制器设计原则是来自分析这些实验。结果表明FSM和安控制器之间类似的性能,但不同的策略。最后,我们表明,作出的控制器和物理特性可以有效地选择通过检查从进化的优化结果。gydF4y2Ba

国家科学基金会gydF4y2Ba

phy - 9723972gydF4y2Ba

1。介绍gydF4y2Ba

自主无人地面车辆(作出)提供优秀的解决方案的任务需要搜索和监测在环境被认为过于偏远的或危险的人类。考虑gydF4y2Ba 搜索和救援gydF4y2Ba:自然灾害后可以使用作出应急人员帮助找到受害者不稳定和危险的地方。作出长期的操作时间,可以携带沉重的有效载荷(如传感器),和可以搜索在狭窄和覆盖的地方,如森林和洞穴。gydF4y2Ba

确保作出可以处理许多不同类型的地形是一个持续的挑战。研究人员已经发明了几种不同的方法来解决流动性问题的多种多样的地形。具体来说,机器人设计与车轮前行,追踪,腿gydF4y2Ba 1gydF4y2Ba),legged-wheels(无框的车轮,车轮辐条与地面接触)(gydF4y2Ba 2gydF4y2Ba- - - - - -gydF4y2Ba 5gydF4y2Ba结束],wheeled-legs(车轮腿和悬浮液可以驱动)(gydF4y2Ba 6gydF4y2Ba- - - - - -gydF4y2Ba 8gydF4y2Ba),和可变形的轮子gydF4y2Ba 9gydF4y2Ba- - - - - -gydF4y2Ba 12gydF4y2Ba]。虽然这些系统提供了一个优势传统轮式机器人,优化并不是表现在绝大多数这些研究。此外,正如被Mintchev和FloreanogydF4y2Ba 13gydF4y2Ba),大多数研究人员在该地区的可变形的轮子目前专注于机械设计,控制和未来工作的决策。例如,大多数机器人与可变形的轮子(远程遥控gydF4y2Ba 11gydF4y2Ba,gydF4y2Ba 14gydF4y2Ba),和金等。gydF4y2Ba 9gydF4y2Ba)设计了一个被动触发机制,不需要任何控制器的输入。gydF4y2Ba

设备在这项研究中,gydF4y2Ba AdabotgydF4y2Ba(见图gydF4y2Ba 1gydF4y2Ba),包括可变形的轮子,可以顺利被转换从一个圆轮子,轮子和轮胎gydF4y2Ba 钉gydF4y2Balegged-wheel。轮转换是由从中心呈放射状向外扩展struts轮轮(见图gydF4y2Ba 2gydF4y2Ba)。Adabot使用进化算法进行了优化,其物理特性和控制器能够更好地处理地形,包括不同大小的障碍。在以前的工作gydF4y2Ba 15gydF4y2Ba),一个类似的系统优化最大化了速度在不平坦的地形。本研究不同在两个主要方面:(1)在这里我们进化控制器为一个更艰巨的任务:gydF4y2Ba 路点后gydF4y2Ba,(2)我们从进化的两种类型的分析结果反馈控制器(而不是前馈)。gydF4y2Ba

图1gydF4y2Ba

Adabot,作出与可变形的轮子。gydF4y2Ba

(一)gydF4y2Ba

模拟设备gydF4y2Ba

(b)gydF4y2Ba

3 d印制的原型gydF4y2Ba

图2gydF4y2Ba

插图Adabot轮的扩展机制,struts完全收回(左),部分扩展,如轮胎螺栓(中)和完全伸展像legged-wheels(右)。gydF4y2Ba

在这项研究中,我们发展机器人的底盘维度,车轮半径,轮struts的数量,以及一个有限状态机(FSM)控制器或一个人工神经网络(ANN)控制器。最好的进化FSMs和人工神经网络进行了分析和比较。这个初始的工作,以确保我们能够有效地分析安,网络只有三个输入节点,零隐藏节点,和三个输出节点。输入完全连接到输出。网络比2型Braitenberg稍微复杂的车辆(gydF4y2Ba 16gydF4y2Ba]。我们的分析得出的结论是用来创建一组新控制器设计原则,利用这两种技术。特别有吸引力的设计一个控制器,不是黑盒像安但不如一个FSM的严格定义。源代码已经可以在GitHub (gydF4y2Ba https://github.com/anthonyjclark/adabot02-anngydF4y2Ba)。gydF4y2Ba

2。相关工作gydF4y2Ba

领域的进化机器人(ER),进化算法(EA)优化给定系统的自由变量gydF4y2Ba 17gydF4y2Ba]。ER方法已经成功地应用于许多不同类型的机器人系统(空中、水上,散步,等等)。例如,我们以前使用微分进化进化自适应神经网络和机器鱼的形态(gydF4y2Ba 18gydF4y2Ba,gydF4y2Ba 19gydF4y2Ba),和摩尔et al。gydF4y2Ba 20.gydF4y2Ba]进化等级控制器为分段蠕虫动画。尽管进化经常利用在抽象层面上优化轮式机器人导航过程(例如,看到戈麦斯et al。(gydF4y2Ba 21gydF4y2Ba和雷曼兄弟和斯坦利gydF4y2Ba 22gydF4y2Ba]),它没有经常被用来直接演变作出形态,和我们所知这是第一个研究可变形的轮的特征的进化。gydF4y2Ba

大量的ER研究利用人工神经网络来控制移动机器人,包括gydF4y2Ba 虚拟生物进化gydF4y2Ba(gydF4y2Ba 23gydF4y2Ba),这被认为是第一个ER的作品之一。人工神经网络使用一个进化方法时提供许多好处。首先,由于人工神经网络是所谓普遍接近者(gydF4y2Ba 24gydF4y2Ba),通常产生进化gydF4y2Ba 小说gydF4y2Ba有时不直观的结果可能没有被发现当手工创建一个控制器(gydF4y2Ba 25gydF4y2Ba]。其次,人工神经网络需要少量的用户设计。具体地说,一个进化算法可以自动决定每个输入的重要性(传感器值)的计算每个输出(驱动机制)gydF4y2Ba 26gydF4y2Ba]。使用一个安的主要缺点是,它被认为是一个黑箱系统。也就是说,gydF4y2Ba 如何gydF4y2Ba安达到其结果往往不清楚或分析。然而,最近一些研究者试图从进化神经网络提取状态机。例如,Yaqoob和“gydF4y2Ba 27gydF4y2Ba)自动生成状态机相同的属性的一种进化神经网络的激增。gydF4y2Ba

3所示。AdabotgydF4y2Ba

硬件。gydF4y2BaAdabot,见图gydF4y2Ba 1gydF4y2Ba,是一个原型设备,包括一个覆盆子π3模型B (RPi)作为其主要的控制董事会。零售价格指数(RPi)被选为它能够运行机器人操作系统(ROS) (gydF4y2Ba 28gydF4y2Ba,gydF4y2Ba 29日gydF4y2Ba),Adabot使用部署其软件系统。零售物价指数的大小限制的最小尺寸Adabot的底盘。具体来说,底盘必须至少8厘米,8厘米。表gydF4y2Ba 1gydF4y2Ba列出所有可配置参数Adabot的物理特性,在哪里gydF4y2Ba WgydF4y2Ba hgydF4y2Ba egydF4y2Ba egydF4y2Ba lgydF4y2Ba BgydF4y2Ba 一个gydF4y2Ba 年代gydF4y2Ba egydF4y2Ba 和gydF4y2Ba TgydF4y2Ba rgydF4y2Ba 一个gydF4y2Ba cgydF4y2Ba kgydF4y2Ba WgydF4y2Ba 我gydF4y2Ba dgydF4y2Ba tgydF4y2Ba hgydF4y2Ba 表示前后轮轴之间的距离和车轮之间的横向距离,分别gydF4y2Ba 年代gydF4y2Ba tgydF4y2Ba rgydF4y2Ba ugydF4y2Ba tgydF4y2Ba CgydF4y2Ba ogydF4y2Ba ugydF4y2Ba ngydF4y2Ba tgydF4y2Ba 参数表示的数量每轮struts。gydF4y2Ba

表1gydF4y2Ba

Adabot物理参数。gydF4y2Ba

的名字gydF4y2Ba	范围gydF4y2Ba
WgydF4y2Ba hgydF4y2Ba egydF4y2Ba egydF4y2Ba lgydF4y2Ba BgydF4y2Ba 一个gydF4y2Ba 年代gydF4y2Ba egydF4y2Ba	8 - 16厘米gydF4y2Ba
TgydF4y2Ba rgydF4y2Ba 一个gydF4y2Ba cgydF4y2Ba kgydF4y2Ba WgydF4y2Ba 我gydF4y2Ba dgydF4y2Ba tgydF4y2Ba hgydF4y2Ba	8 - 16厘米gydF4y2Ba
WgydF4y2Ba hgydF4y2Ba egydF4y2Ba egydF4y2Ba lgydF4y2Ba RgydF4y2Ba 一个gydF4y2Ba dgydF4y2Ba 我gydF4y2Ba ugydF4y2Ba 年代gydF4y2Ba	2到3厘米gydF4y2Ba
年代gydF4y2Ba tgydF4y2Ba rgydF4y2Ba ugydF4y2Ba tgydF4y2Ba CgydF4y2Ba ogydF4y2Ba ugydF4y2Ba ngydF4y2Ba tgydF4y2Ba	0到7gydF4y2Ba

每个轮子是由自己的直流齿轮马达磁编码器。同样,每个轮子的struts包括一组由一个线性伺服伸出和缩回。传感,Adabot包括三个前锋面对距离传感器和IMU(硬件陀螺仪,使用硬件加速计,使用硬件磁强计)。最后,它使用一个2.4 GHz无线通信模块是由2200 mAh电池组,它提供了约两个小时的操作时间。gydF4y2Ba

支柱的扩展。gydF4y2Ba图gydF4y2Ba 2gydF4y2Ba描绘了支撑扩展过程。这种机制允许轮表现出一系列的特征。与struts完全收回,车轮常规运行;当扩展少量,struts作为轮胎螺栓;struts完全伸展,每个轮子类似于legged-wheel。由于设计的局限性,最大扩展struts等于车轮的半径- 1厘米(gydF4y2Ba 米gydF4y2Ba 一个gydF4y2Ba XgydF4y2Ba EgydF4y2Ba XgydF4y2Ba TgydF4y2Ba =gydF4y2Ba WgydF4y2Ba hgydF4y2Ba egydF4y2Ba egydF4y2Ba lgydF4y2Ba RgydF4y2Ba 一个gydF4y2Ba dgydF4y2Ba 我gydF4y2Ba ugydF4y2Ba 年代gydF4y2Ba - - - - - -gydF4y2Ba 1gydF4y2Ba 厘米)。Adabot更详细讨论的软件和轮扩展机制,与进化的一个例子Adabot ROS和露台与ROS(模拟环境紧密耦合),看到我们的初步研究[gydF4y2Ba 15gydF4y2Ba]。gydF4y2Ba

模拟。gydF4y2Ba模拟环境的影像图所示gydF4y2Ba 3gydF4y2Ba。环境通过生成填充40箱随机尺寸,位置,和密度。这些盒子作为模拟机器人必须遍历的障碍。如果一个新生成的框碰撞与现有的盒子从仿真中删除。我们看到平均31箱放置在环境。盒子的高度范围从2到5厘米,这是足够高(相比gydF4y2Ba WgydF4y2Ba hgydF4y2Ba egydF4y2Ba egydF4y2Ba lgydF4y2Ba RgydF4y2Ba 一个gydF4y2Ba dgydF4y2Ba 我gydF4y2Ba ugydF4y2Ba 年代gydF4y2Ba 值)大大减少轮式移动机器人(gydF4y2Ba 30.gydF4y2Ba]。此外,而不是每个箱子在固定位置,有可能Adabot推一个盒子(取决于它的大小和密度)。gydF4y2Ba

图3gydF4y2Ba

一个环境,包括随机生成障碍。当前路点显示为深灰色的球体,和机器人从原点开始面临正轴(路点,沿着红轴线)。gydF4y2Ba

在这项研究中,我们使用动态动画和机器人工具箱(DART) (gydF4y2Ba https://dartsim.github.io/index.htmlgydF4y2Ba)。飞镖是专门为机器人应用程序和相当的速度比常见的选择(如果不是更快)[gydF4y2Ba 31日gydF4y2Ba]。gydF4y2Ba

路点导航控制。gydF4y2BaAdabot是由旋转打滑驾驶风格机器人将其左、右车轮以不同的速率。虽然每个轮子和轮子支撑集可以独立控制的,在本研究中我们只有三个控制输出:(1)左侧车轮的角速率,(2)对车轮的角速率,和(3)一个扩展为所有四套struts。尽管它可能是有益的独立控制每个轮子,在这项研究中我们选择同步两个左右车轮,车轮。这降低了进化控制参数的数量,使我们能够使用一个差动驱动机器人动力学预测模型。在未来,我们将探索独立控制每个轮子的影响。gydF4y2Ba

为Adabot援助在搜索和救援行动,它必须能够成功gydF4y2Ba 封面gydF4y2Ba(完全搜索)指定区域。一个简化版的这个任务,调用gydF4y2Ba 路点导航gydF4y2Ba,被认为是在进化的优化。对于这个任务,作出必须访问一组路径点序列。gydF4y2Ba

FSM控制。gydF4y2Ba这个任务的hand-designed FSMs中描述的人物gydF4y2Ba 4gydF4y2Ba。这个FSM包括两个独立的行动:(a)指挥机器人朝着下一个路点通过控制左、右车轮,和(b)扩展struts当机器人正在减少流动由于一个障碍。从本质上讲,机器人仍然在gydF4y2Ba 向前gydF4y2Ba国家只要标题之间的角度作出和方向的目标(gydF4y2Ba αgydF4y2Ba tgydF4y2Ba 一个gydF4y2Ba rgydF4y2Ba ggydF4y2Ba egydF4y2Ba tgydF4y2Ba 在某个阈值)。一旦超过阈值,要么FSM转换gydF4y2Ba 左gydF4y2Ba或gydF4y2Ba 正确的gydF4y2Ba状态。在gydF4y2Ba 左gydF4y2Ba和gydF4y2Ba 正确的gydF4y2Ba州,机器人将旋转不变gydF4y2Ba αgydF4y2Ba tgydF4y2Ba 一个gydF4y2Ba rgydF4y2Ba ggydF4y2Ba egydF4y2Ba tgydF4y2Ba 大于gydF4y2Ba lgydF4y2Ba 。gydF4y2Ba TgydF4y2Ba ogydF4y2Ba FgydF4y2Ba ogydF4y2Ba rgydF4y2Ba wgydF4y2Ba 一个gydF4y2Ba rgydF4y2Ba dgydF4y2Ba TgydF4y2Ba hgydF4y2Ba rgydF4y2Ba egydF4y2Ba 年代gydF4y2Ba hgydF4y2Ba 或小于gydF4y2Ba RgydF4y2Ba 。gydF4y2Ba TgydF4y2Ba ogydF4y2Ba FgydF4y2Ba ogydF4y2Ba rgydF4y2Ba wgydF4y2Ba 一个gydF4y2Ba rgydF4y2Ba dgydF4y2Ba TgydF4y2Ba hgydF4y2Ba rgydF4y2Ba egydF4y2Ba 年代gydF4y2Ba hgydF4y2Ba 分别在FSM转换回gydF4y2Ba 向前gydF4y2Ba。阈值角度如图gydF4y2Ba 4 (c)gydF4y2Ba。gydF4y2Ba

图4gydF4y2Ba

(一)FSM控制机器人的方向,(b)的单一国家控制轮struts,描述角度和(c)图用于触发状态之间的转换。gydF4y2Ba

(一)gydF4y2Ba

方向键控制gydF4y2Ba

(b)gydF4y2Ba

扩展控制gydF4y2Ba

(c)gydF4y2Ba

环境图gydF4y2Ba

决定什么时候,多少轮应该扩展struts,我们使用一个简单的微分驱动模型和比较预期的速度和测量速度。具体来说,我们计算预期的线性(gydF4y2Ba vgydF4y2Ba )和角(gydF4y2Ba ωgydF4y2Ba 速度(基于轮利率)使用以下模型:gydF4y2Ba (1)gydF4y2Ba vgydF4y2Ba =gydF4y2Ba VgydF4y2Ba rgydF4y2Ba +gydF4y2Ba VgydF4y2Ba lgydF4y2Ba 2gydF4y2Ba ,gydF4y2Ba (2)gydF4y2Ba ωgydF4y2Ba =gydF4y2Ba VgydF4y2Ba rgydF4y2Ba - - - - - -gydF4y2Ba VgydF4y2Ba lgydF4y2Ba TgydF4y2Ba rgydF4y2Ba 一个gydF4y2Ba cgydF4y2Ba kgydF4y2Ba WgydF4y2Ba 我gydF4y2Ba dgydF4y2Ba tgydF4y2Ba hgydF4y2Ba 在哪里gydF4y2Ba VgydF4y2Ba rgydF4y2Ba 和gydF4y2Ba VgydF4y2Ba lgydF4y2Ba 分别是左和右轮线速度,然后呢gydF4y2Ba TgydF4y2Ba rgydF4y2Ba 一个gydF4y2Ba cgydF4y2Ba kgydF4y2Ba WgydF4y2Ba 我gydF4y2Ba dgydF4y2Ba tgydF4y2Ba hgydF4y2Ba 代表轮子之间的距离在同一轴线(前方或后方轴)。这些计算值(预计基于差动驱动模型)然后减去实际(gydF4y2Ba 测量gydF4y2Ba)线速度和角速度值。的实际速度模拟机器人提供的模拟器,可以测量并在真实的环境中使用一个摄像系统开销。之间的差值(错误预期和实际速度)然后在0和1之间产生gydF4y2Ba vgydF4y2Ba egydF4y2Ba 和gydF4y2Ba ωgydF4y2Ba egydF4y2Ba ,这是按比例缩小的线速度和角速度误差,分别。这两个错误值然后使用指数平滑过滤。最后,他们被用于以下计算所有struts的扩展数量:gydF4y2Ba (3)gydF4y2Ba egydF4y2Ba xgydF4y2Ba tgydF4y2Ba vgydF4y2Ba =gydF4y2Ba 米gydF4y2Ba egydF4y2Ba xgydF4y2Ba tgydF4y2Ba ·gydF4y2Ba vgydF4y2Ba egydF4y2Ba +gydF4y2Ba bgydF4y2Ba egydF4y2Ba xgydF4y2Ba tgydF4y2Ba ,gydF4y2Ba (4)gydF4y2Ba egydF4y2Ba xgydF4y2Ba tgydF4y2Ba ωgydF4y2Ba =gydF4y2Ba 米gydF4y2Ba egydF4y2Ba xgydF4y2Ba tgydF4y2Ba ·gydF4y2Ba ωgydF4y2Ba egydF4y2Ba +gydF4y2Ba bgydF4y2Ba egydF4y2Ba xgydF4y2Ba tgydF4y2Ba ,gydF4y2Ba (5)gydF4y2Ba egydF4y2Ba xgydF4y2Ba tgydF4y2Ba %gydF4y2Ba =gydF4y2Ba 马克斯gydF4y2Ba ⁡gydF4y2Ba egydF4y2Ba xgydF4y2Ba tgydF4y2Ba vgydF4y2Ba ,gydF4y2Ba egydF4y2Ba xgydF4y2Ba tgydF4y2Ba ωgydF4y2Ba ,gydF4y2Ba (6)gydF4y2Ba egydF4y2Ba xgydF4y2Ba tgydF4y2Ba =gydF4y2Ba 米gydF4y2Ba 一个gydF4y2Ba XgydF4y2Ba EgydF4y2Ba XgydF4y2Ba TgydF4y2Ba ·gydF4y2Ba egydF4y2Ba xgydF4y2Ba tgydF4y2Ba %gydF4y2Ba 在哪里gydF4y2Ba egydF4y2Ba xgydF4y2Ba tgydF4y2Ba vgydF4y2Ba 和gydF4y2Ba egydF4y2Ba xgydF4y2Ba tgydF4y2Ba ωgydF4y2Ba 表示由于线性扩展计算量和角速度值,分别。这两个值计算使用一个线性方程和一个可配置的斜率(gydF4y2Ba 米gydF4y2Ba egydF4y2Ba xgydF4y2Ba tgydF4y2Ba )和拦截(gydF4y2Ba bgydF4y2Ba egydF4y2Ba xgydF4y2Ba tgydF4y2Ba )。最后扩展量(gydF4y2Ba egydF4y2Ba xgydF4y2Ba tgydF4y2Ba )是基于这两个值的最大值,并计算最大可能扩展的比例(gydF4y2Ba 米gydF4y2Ba 一个gydF4y2Ba XgydF4y2Ba EgydF4y2Ba XgydF4y2Ba TgydF4y2Ba )。从本质上讲,struts将延长一个量是线性正比于当前速度误差(最大线性和角度之间的误差)。因此,当Adabot遇到一个障碍,降低其流动性(相比,预测的差动驱动模型),它将扩展struts为了爬过障碍。gydF4y2Ba

表gydF4y2Ba 2gydF4y2Ba显示所有可配置参数的FSM (hand-chosen值显示在括号中)。除了第一个gydF4y2Ba 米gydF4y2Ba egydF4y2Ba xgydF4y2Ba tgydF4y2Ba 和gydF4y2Ba bgydF4y2Ba egydF4y2Ba xgydF4y2Ba tgydF4y2Ba 表中,每个名称采用以下形式:大写字母代表一个状态图gydF4y2Ba 4(一)gydF4y2Ba(gydF4y2Ba FgydF4y2Ba 流gydF4y2Ba,gydF4y2Ba lgydF4y2Ba eftgydF4y2Ba,或gydF4y2Ba RgydF4y2Ba 锁定宽和高gydF4y2Ba),紧随其后的是一段时间内,紧随其后的是一个轮角速度或角阈值也在图中描述gydF4y2Ba 4(一)gydF4y2Ba。最后,以减少振动和潜在损害轮struts,车轮的最大角速率是线性缩减从20 radgydF4y2Ba^{−1gydF4y2Ba}4 rad年代gydF4y2Ba^{−1gydF4y2Ba}当struts充分扩展。gydF4y2Ba

表2gydF4y2Ba

Adabot FSM参数(Hand-Chosen)。gydF4y2Ba

的名字gydF4y2Ba	范围gydF4y2Ba
米gydF4y2Ba egydF4y2Ba xgydF4y2Ba tgydF4y2Ba	(0.5)0到1gydF4y2Ba
bgydF4y2Ba egydF4y2Ba xgydF4y2Ba tgydF4y2Ba	(0.5)0到1gydF4y2Ba
FgydF4y2Ba 。gydF4y2Ba 年代gydF4y2Ba pgydF4y2Ba egydF4y2Ba egydF4y2Ba dgydF4y2Ba	(20)0到20 radgydF4y2Ba^{−1gydF4y2Ba}
FgydF4y2Ba 。gydF4y2Ba TgydF4y2Ba ogydF4y2Ba lgydF4y2Ba egydF4y2Ba fgydF4y2Ba tgydF4y2Ba TgydF4y2Ba hgydF4y2Ba rgydF4y2Ba egydF4y2Ba 年代gydF4y2Ba hgydF4y2Ba	(10)0到90°gydF4y2Ba
FgydF4y2Ba 。gydF4y2Ba TgydF4y2Ba ogydF4y2Ba RgydF4y2Ba 我gydF4y2Ba ggydF4y2Ba hgydF4y2Ba tgydF4y2Ba TgydF4y2Ba hgydF4y2Ba rgydF4y2Ba egydF4y2Ba 年代gydF4y2Ba hgydF4y2Ba	(-10)−90 0°gydF4y2Ba
lgydF4y2Ba 。gydF4y2Ba lgydF4y2Ba egydF4y2Ba fgydF4y2Ba tgydF4y2Ba 年代gydF4y2Ba pgydF4y2Ba egydF4y2Ba egydF4y2Ba dgydF4y2Ba	(-20)−20 - 20 radgydF4y2Ba^{−1gydF4y2Ba}
lgydF4y2Ba 。gydF4y2Ba RgydF4y2Ba 我gydF4y2Ba ggydF4y2Ba hgydF4y2Ba tgydF4y2Ba 年代gydF4y2Ba pgydF4y2Ba egydF4y2Ba egydF4y2Ba dgydF4y2Ba	(20)−20 - 20 radgydF4y2Ba^{−1gydF4y2Ba}
lgydF4y2Ba 。gydF4y2Ba TgydF4y2Ba ogydF4y2Ba FgydF4y2Ba ogydF4y2Ba rgydF4y2Ba wgydF4y2Ba 一个gydF4y2Ba rgydF4y2Ba dgydF4y2Ba TgydF4y2Ba hgydF4y2Ba rgydF4y2Ba egydF4y2Ba 年代gydF4y2Ba hgydF4y2Ba	(5)0到90°gydF4y2Ba
RgydF4y2Ba 。gydF4y2Ba lgydF4y2Ba egydF4y2Ba fgydF4y2Ba tgydF4y2Ba 年代gydF4y2Ba pgydF4y2Ba egydF4y2Ba egydF4y2Ba dgydF4y2Ba	(20)−20 - 20 radgydF4y2Ba^{−1gydF4y2Ba}
RgydF4y2Ba 。gydF4y2Ba RgydF4y2Ba 我gydF4y2Ba ggydF4y2Ba hgydF4y2Ba tgydF4y2Ba 年代gydF4y2Ba pgydF4y2Ba egydF4y2Ba egydF4y2Ba dgydF4y2Ba	(-20)−20 - 20 radgydF4y2Ba^{−1gydF4y2Ba}
RgydF4y2Ba 。gydF4y2Ba TgydF4y2Ba ogydF4y2Ba FgydF4y2Ba ogydF4y2Ba rgydF4y2Ba wgydF4y2Ba 一个gydF4y2Ba rgydF4y2Ba dgydF4y2Ba TgydF4y2Ba hgydF4y2Ba rgydF4y2Ba egydF4y2Ba 年代gydF4y2Ba hgydF4y2Ba	(5)−90 - 0°gydF4y2Ba

安控制。gydF4y2Ba作为替代的FSM控制器,我们发展一个安同样的任务。神经网络接收三个输入(每个比例在0和1之间):(1)gydF4y2Ba αgydF4y2Ba tgydF4y2Ba 一个gydF4y2Ba rgydF4y2Ba ggydF4y2Ba egydF4y2Ba tgydF4y2Ba ,(2)gydF4y2Ba vgydF4y2Ba egydF4y2Ba ,(3)gydF4y2Ba ωgydF4y2Ba egydF4y2Ba 。本质上讲,安FSM提供相同的信息,并产生相同的三个输出值(左和右轮利率和一个扩展量)。在我们的前期工作中,我们发现隐藏节点是该任务不必要的(相同的策略和健身价值实现和没有隐藏节点)。安的基因组包含13个值:一个整数值代表激活函数(物流、双曲正切或修正线性单元)和12值神经网络权重(三个输入+一个偏见的三个输出)。gydF4y2Ba

进化。gydF4y2Ba在这项研究中,我们采用协方差矩阵适应进化策略(CMA-ES) [gydF4y2Ba 32gydF4y2Ba]。特别是,我们使用pycma(由汉森(gydF4y2Ba 33gydF4y2Ba]),适用于实值问题和支持等处理整数值gydF4y2Ba EgydF4y2Ba xgydF4y2Ba tgydF4y2Ba CgydF4y2Ba ogydF4y2Ba ugydF4y2Ba ngydF4y2Ba tgydF4y2Ba 。gydF4y2Ba

4所示。讨论和结果gydF4y2Ba

在本节中,我们提供我们的结果从Adabot进化。具体来说,我们进化的Adabot两个环境(有或没有障碍)和两种不同的控制器。这些四个实验重复20次。最后,我们讨论的原则,可以从这些实验。gydF4y2Ba

4.1。健身的计算gydF4y2Ba

这里,Adabot的目标是访问一组坐标(路点)序列。在一个单一的模拟过程中,设备有30 (gydF4y2Ba tgydF4y2Ba 米gydF4y2Ba 一个gydF4y2Ba xgydF4y2Ba 秒钟访问gydF4y2Ba 四个gydF4y2Ba预定义的路径点,但仿真将尽快终止第四路点。健身计算如下(pycma用于最大化这个函数):gydF4y2Ba (7)gydF4y2Ba fgydF4y2Ba =gydF4y2Ba 2gydF4y2Ba wgydF4y2Ba +gydF4y2Ba 1gydF4y2Ba - - - - - -gydF4y2Ba 最小值gydF4y2Ba ⁡gydF4y2Ba dgydF4y2Ba ,gydF4y2Ba dgydF4y2Ba 米gydF4y2Ba 一个gydF4y2Ba xgydF4y2Ba dgydF4y2Ba 米gydF4y2Ba 一个gydF4y2Ba xgydF4y2Ba +gydF4y2Ba tgydF4y2Ba 米gydF4y2Ba 一个gydF4y2Ba xgydF4y2Ba - - - - - -gydF4y2Ba tgydF4y2Ba tgydF4y2Ba 米gydF4y2Ba 一个gydF4y2Ba xgydF4y2Ba 在哪里gydF4y2Ba wgydF4y2Ba 代表着路点的数量,gydF4y2Ba dgydF4y2Ba 和gydF4y2Ba dgydF4y2Ba 米gydF4y2Ba 一个gydF4y2Ba xgydF4y2Ba 表示下一个路点的距离和距离的比例因子,分别gydF4y2Ba tgydF4y2Ba 表示发生的时间。这个函数是为了提供一个光滑的梯度生成控制器快速导航到所有路点。的第一部分方程确保CMA-ES算法严重倾向于任何控制器达到甚至单一路点;这个组件的值从0到8。接下来,距离组件添加到奖励解决方案驱动序列的下一个路点附近,但不要达到四个。开始时这是特别有用的解决方案时进化的早期阶段。组件导致的距离值在0和1之间。仿真结束后四路点以来,时间分量将一个值在0(零剩余时间)和1之间(四路点都在瞬间达到)。组件的时间是为了支持任何控制器快速解决的任务。因此,最大可能健身是10。gydF4y2Ba

4.2。进化没有障碍gydF4y2Ba

在我们的第一个实验中,gydF4y2Ba FSM-0-1gydF4y2Ba,我们发展中的15个参数表gydF4y2Ba 1gydF4y2Ba(物理)和gydF4y2Ba 2gydF4y2Ba(控制)的环境中没有障碍。的命名方案实验表明控制器类型(gydF4y2Ba FSMgydF4y2Ba或gydF4y2Ba 安gydF4y2Ba)的最大数量(0或40)潜在的障碍,和试验的数量/健身评价(1或2)块健身和迭代图所示gydF4y2Ba 5gydF4y2Ba(这个图展示了两个实验的健身价值不包含障碍)。在第一个实验中,还有零障碍,因此环境永远是相同的。在以后的实验中,每一个健身评价包括两个试验与随机生成的障碍。如图,在所有复制实验Adabot达到四路点在大约10秒,这对应于一个健身值为9.7。人口迅速收敛最终值,可能是因为这个实验被播种hand-designed的已知参数实现好的结果(见表gydF4y2Ba 2gydF4y2Ba)。进化的结果,然而,迅速超越hand-chosen值。这个实验是一个方便的其他人可以比较的基线。gydF4y2Ba

图5gydF4y2Ba

情节的两个实验中发现的最大的健身没有障碍。阴影区域表示置信区间的一个标准差的意思是20复制的每个实验。最大程度的健身是10,和健身价值超过2表明Adabot能达到至少一个路点。gydF4y2Ba

第二个实验中,表示gydF4y2Ba ANN-0-1gydF4y2Ba。也达到健身值为9.7,这表明一个安能有效执行的任务导航机器人的序列点。对于这个实验,17个总参数进化:表中列出的四个物理特性gydF4y2Ba 1gydF4y2Ba和13安参数在前一节中讨论。尽管这些实验达到相同的最终的健身价值,图的检查gydF4y2Ba 5gydF4y2Ba表明,ANN结果需要更长的时间evolve-roughly 120次迭代相比,不到10 FSM的迭代。这可以解释为缺乏种子控制器和事实,不像一个FSM,安必须从头学习整个解决方案。gydF4y2Ba

图gydF4y2Ba 6gydF4y2Ba描绘的轨迹表现最好的控制器从这两个实验。虽然这些轨迹类似,有一个关键的区别:安积极控制只有一个轮子。FSMs,另一方面,可以就地顺时针和反时针旋转,这就是为什么有更清晰的在左边的情节。gydF4y2Ba

图6gydF4y2Ba

最好的进化轨迹个人第一两个实验:FSM-0-1 ANN-0-1。没有障碍的礼物,这些轨迹。gydF4y2Ba

图gydF4y2Ba 7gydF4y2Ba展示了最好的FSM和安的车轮速度控制器。进化安永远设置右轮的最大速度。安往前移动,将它的左车轮设置为相同的值,并将通过左侧车轮旋转相反的方向。有效地,安只能左转,然而,这不是一个问题相对简单的任务。gydF4y2Ba

图7gydF4y2Ba

左、右车轮速度和支柱扩展数量最好的发展解决方案gydF4y2Ba FSM-0-1gydF4y2Ba(一)和gydF4y2Ba ANN-0-1gydF4y2Ba(b)。左纵轴显示值轮速度(固体红线和dash-dot蓝线),和正确的纵轴显示了轮支撑的规模扩展数量(橙色虚线)。gydF4y2Ba

(一)gydF4y2Ba (b)gydF4y2Ba

图gydF4y2Ba 8gydF4y2Ba提供了一个比较健康的价值观和发展物理特性这两个实验。这图只显示结果相结合最终数量的复制实验。从这个图中,我们可以建立良好的物理特性是什么Adabot不面临任何障碍。具体地说,gydF4y2Ba 轴距gydF4y2Ba和gydF4y2Ba TrackWidthgydF4y2Ba应该是8.5厘米和11.5厘米,分别gydF4y2Ba WheelRadiusgydF4y2Ba应该是3厘米,gydF4y2Ba StrutCountgydF4y2Ba并不重要因为struts不延长。gydF4y2Ba

图8gydF4y2Ba

分布为进化的健身价值和物理特征组合的最终数量gydF4y2Ba FSM-0-1gydF4y2Ba(左)和gydF4y2Ba ANN-0-1gydF4y2Ba(右侧)实验。y轴的极限参数限制允许在进化过程中。gydF4y2Ba

最后,图gydF4y2Ba 9gydF4y2Ba情节所有进化FSM的分布参数。值得注意的是,没有障碍,没有进化FSMs或人工神经网络由大量扩展struts。这个结果并不像任何意想不到的扩展将导致速度降低由于线速度前面所提到的,扩展struts不需要当不存在障碍。也感兴趣的FSM对称进化而来的。具体来说,阈值和速度进化的gydF4y2Ba 左gydF4y2Ba和gydF4y2Ba 正确的gydF4y2Ba状态是近乎完美的镜像。gydF4y2Ba

图9gydF4y2Ba

所有进化FSM参数分布gydF4y2Ba FSM-0-1gydF4y2Ba实验。图中描述的这些参数gydF4y2Ba 4(一)gydF4y2Ba和表gydF4y2Ba 2gydF4y2Ba。gydF4y2Ba

(一)gydF4y2Ba (b)gydF4y2Ba

4.3。进化与障碍gydF4y2Ba

最后两个被称为进化实验gydF4y2Ba FSM-40-2gydF4y2Ba和gydF4y2Ba ANN-40-2gydF4y2Ba。这些实验不同于前两次在两个方面。首先,每个健身价值计算的平均两个试验(其中每个试验持续最多30秒),其次,每个健身试验发生在31随机生成的环境障碍。利用多个试验期间的健康评估改善进化结果的鲁棒性gydF4y2Ba 34gydF4y2Ba]。这些实验显示在图的健身情节gydF4y2Ba 10gydF4y2Ba。值得注意的是,人工神经网络进化与障碍大大减少最大的健身。一些个人达到健身9以上,然而,我们发现这是只有当随机生成的环境不会造成很多困难。视频(和交互式动画)高健身人士可以在这里找到:gydF4y2Ba FSM-40-2gydF4y2Ba:gydF4y2Ba https://youtu.be/VXnrwwpE598gydF4y2Ba(gydF4y2Ba https://goo.gl/NtoVYegydF4y2Ba),gydF4y2Ba ANN-40-2gydF4y2Ba:gydF4y2Ba https://youtu.be/q8PFqQps5e4gydF4y2Ba(gydF4y2Ba https://goo.gl/2xjh6XgydF4y2Ba)。gydF4y2Ba

图10gydF4y2Ba

情节等最大的两个实验中发现的健康障碍。阴影区域表示置信区间的一个标准差的意思是20复制的每个实验。最大程度的健身是10,和健身价值超过2表明Adabot能达到至少一个路点。gydF4y2Ba

类似于图gydF4y2Ba 8gydF4y2Ba,图gydF4y2Ba 11gydF4y2Ba展示了进化的物理分布特征。这些分布有更大的传播由于随机生成环境。发现在这些值分布表明,障碍物的存在没有剧烈的影响物理特征的进化。首先这是意想不到的,然而,分析这些值(和可视化结果行为)揭示了一些基本原则:(1)打滑驾驶机器人是很重要的gydF4y2Ba 轴距gydF4y2Ba小于gydF4y2Ba TrackWidthgydF4y2Ba(这将减少gydF4y2Ba 轮滑gydF4y2Ba和提高可控性),(2)最大化速度gydF4y2Ba WheelRadiusgydF4y2Ba应该最大化(因为我们正在轮角速率更大的轮将导致更高的速度),和(3)只要struts的数量大于4的系统将能够浏览生成的环境。第一和第二原则比赛结果我们看到的物理原型,我们打算调查第三原则在不久的将来。gydF4y2Ba

图11gydF4y2Ba

分布为进化的健身价值和物理特征组合的最终数量gydF4y2Ba FSM-40-2gydF4y2Ba(左)和gydF4y2Ba ANN-40-2gydF4y2Ba(右侧)实验。y轴的极限参数限制允许在进化过程中。gydF4y2Ba

在两组之间的物理特性是相似的实验中,控制策略已经被调整到处理的障碍。图gydF4y2Ba 12gydF4y2Ba显示了两种解决方案的控制模式随机选择表现最好的个人的gydF4y2Ba FSM-40-2gydF4y2Ba和gydF4y2Ba ANN-40-2gydF4y2Ba实验。注意,因为环境是随机生成的,即使进化安不到四路点测试,但这并不意味着它没有这样做在健康评估。故事情节在图的两个最显著的特征gydF4y2Ba 12gydF4y2Ba进化人工神经系统控制器的操作速度降低,模拟车轮的障碍正在扩展struts控制器。进化FSM的轮扩展struts是当达到第一个障碍时,他们仍然大约一半延长的时间评估。安控制器使用了一个稍微不同的策略。车轮struts初完全扩展模拟和依然如此。这意味着作出的最高速度必须减少安全(见部分gydF4y2Ba 3gydF4y2Ba)。gydF4y2Ba

图12gydF4y2Ba

左和右轮为最好的进化速度和支柱扩展FSM安(a)和(b)在一个随机生成的环境,包括障碍。类似于图gydF4y2Ba 7gydF4y2Ba,左边和右边垂直轴显示尺度车轮速度和支柱扩展数量,分别。gydF4y2Ba

(一)gydF4y2Ba (b)gydF4y2Ba

研究进化的FSM价值观,我们看到几乎相同的值被发现除了对所有参数gydF4y2Ba bgydF4y2Ba egydF4y2Ba xgydF4y2Ba tgydF4y2Ba (一组分布类似于图gydF4y2Ba 9gydF4y2Ba为了节省空间,省略了)。在实验中没有障碍,gydF4y2Ba bgydF4y2Ba egydF4y2Ba xgydF4y2Ba tgydF4y2Ba 聚合为零;然而,对于这个实验gydF4y2Ba bgydF4y2Ba egydF4y2Ba xgydF4y2Ba tgydF4y2Ba 聚集到0.45。更高的价值gydF4y2Ba bgydF4y2Ba egydF4y2Ba xgydF4y2Ba tgydF4y2Ba 结果在struts总是被扩展(即使没有遇到障碍)。因此,这些行为更慢,因为struts需要攀爬的障碍。gydF4y2Ba

直接检查进化神经网络的初始权值只提供了有限的观点产生的行为。同样,比较每个输入的影响在每个输出隔离掩盖了由此产生的行为。例如,一些输出值只活跃的一些组合多个输入值时。因此,在图gydF4y2Ba 13gydF4y2Ba我们提供所有成对的输出输入关系的速度离开车轮热图的形式。这些热点图使用一个参数生成扫描在所有可能的输入组合。每个方块都代表给定的输出值x和y轴上的两个输入值平均值为剩余的所有可能值输入。的情况下也是如此gydF4y2Ba ANN-0-1gydF4y2Ba实验中,剩下导航是由驱动轮速度不同,所以我们没有提供热图轮支撑和速度输出。检查图显示,左侧车轮的速度与两个积极的线性关系gydF4y2Ba ωgydF4y2Ba egydF4y2Ba 和gydF4y2Ba αgydF4y2Ba tgydF4y2Ba 一个gydF4y2Ba rgydF4y2Ba ggydF4y2Ba egydF4y2Ba tgydF4y2Ba 这gydF4y2Ba αgydF4y2Ba tgydF4y2Ba 一个gydF4y2Ba rgydF4y2Ba ggydF4y2Ba egydF4y2Ba tgydF4y2Ba 对控制的影响最大(因为它是用来把机器人对目标)。gydF4y2Ba

图13gydF4y2Ba

热图显示输入和输出之间的关系的左车轮最佳安进化而来。浅色表示轮子在其最大的远期利率,和一个黑暗的颜色表明它是在其最大的逆向速率。所有输入和输出值在0和1之间。输出区域只显示左侧车轮只有安输出,表现出各种不同的值。gydF4y2Ba

在这两个实验包括障碍,进化控制器扩展struts并没有完全收回。然而,有一个明显的优势缩回struts:机器人最大允许速度更高。因此,它可能是一个问题用差动驱动模型来计算错误。我们已经确定了两个简单的模型的误差来源:(1)不考虑当struts延长轮有一个更大的有效半径,和(2)模型没有考虑噪声打滑操舵和扩展struts的性质。gydF4y2Ba

为我们最后的这两个控制模型之间的比较,我们表现最好了5个人从每个复制实验和评估他们三个新环境。新环境要求移动机器人驱动四次进一步处理障碍的两倍。仿真时间也增加了从30年代到90年代。从这些评价结果如图所示gydF4y2Ba 14gydF4y2Ba。如图,FSM控制器仍然能够达到平均两路点,而安连一个控制器经常未能达到。gydF4y2Ba

图14gydF4y2Ba

最好的进化控制器从每个复制在新的环境评估。FSM控制器仍然能够达到一些路点,但大多数安控制器连一个未能达到。gydF4y2Ba

总之,关于我们发现Adabot的优化系统gydF4y2Ba (1)gydF4y2Ba

相似的物理特性最优环境中有或没有障碍。gydF4y2Ba

(2)gydF4y2Ba

左右车轮的速度应该有一个线性关系gydF4y2Ba αgydF4y2Ba tgydF4y2Ba 一个gydF4y2Ba rgydF4y2Ba ggydF4y2Ba egydF4y2Ba tgydF4y2Ba (而不是离散关系与当前FSM一样)。这将使机器人gydF4y2Ba 方向的转变gydF4y2Ba向目标。gydF4y2Ba

(3)gydF4y2Ba

可以通过控制解决的任务只有一个轮子,然而,这可能不是一个可取的特点。在未来的工作中,我们计划添加一个进化压力的进化人工神经网络在两个方向上,例如,通过创建环境和需要左和右转的路点。gydF4y2Ba

(4)gydF4y2Ba

控制杆将需要一个更复杂的机器人动力学模型。一旦扩展struts,很难辨别当他们应该收回。在未来的工作中,我们将调查的方法和测量参数识别和建立检测流动性差。gydF4y2Ba

考虑到这些观察,我们开发了一个混合两个控制器。控制器是在gydF4y2Ba 左gydF4y2Ba当gydF4y2Ba αgydF4y2Ba tgydF4y2Ba 一个gydF4y2Ba rgydF4y2Ba ggydF4y2Ba egydF4y2Ba tgydF4y2Ba 大于零,在吗gydF4y2Ba 正确的gydF4y2Ba否则。这些状态方程如下:gydF4y2Ba (8)gydF4y2Ba αgydF4y2Ba 年代gydF4y2Ba cgydF4y2Ba 一个gydF4y2Ba lgydF4y2Ba egydF4y2Ba =gydF4y2Ba 2gydF4y2Ba ·gydF4y2Ba 1gydF4y2Ba - - - - - -gydF4y2Ba αgydF4y2Ba tgydF4y2Ba 一个gydF4y2Ba rgydF4y2Ba ggydF4y2Ba egydF4y2Ba tgydF4y2Ba πgydF4y2Ba - - - - - -gydF4y2Ba 1gydF4y2Ba (9)gydF4y2Ba lgydF4y2Ba egydF4y2Ba fgydF4y2Ba tgydF4y2Ba lgydF4y2Ba egydF4y2Ba fgydF4y2Ba tgydF4y2Ba =gydF4y2Ba - - - - - -gydF4y2Ba 米gydF4y2Ba 一个gydF4y2Ba XgydF4y2Ba RgydF4y2Ba 一个gydF4y2Ba DgydF4y2Ba ·gydF4y2Ba αgydF4y2Ba 年代gydF4y2Ba cgydF4y2Ba 一个gydF4y2Ba lgydF4y2Ba egydF4y2Ba (10)gydF4y2Ba lgydF4y2Ba egydF4y2Ba fgydF4y2Ba tgydF4y2Ba rgydF4y2Ba 我gydF4y2Ba ggydF4y2Ba hgydF4y2Ba tgydF4y2Ba =gydF4y2Ba 米gydF4y2Ba 一个gydF4y2Ba XgydF4y2Ba RgydF4y2Ba 一个gydF4y2Ba DgydF4y2Ba (11)gydF4y2Ba RgydF4y2Ba 我gydF4y2Ba ggydF4y2Ba hgydF4y2Ba tgydF4y2Ba lgydF4y2Ba egydF4y2Ba fgydF4y2Ba tgydF4y2Ba =gydF4y2Ba 米gydF4y2Ba 一个gydF4y2Ba XgydF4y2Ba RgydF4y2Ba 一个gydF4y2Ba DgydF4y2Ba (12)gydF4y2Ba RgydF4y2Ba 我gydF4y2Ba ggydF4y2Ba hgydF4y2Ba tgydF4y2Ba rgydF4y2Ba 我gydF4y2Ba ggydF4y2Ba hgydF4y2Ba tgydF4y2Ba =gydF4y2Ba 米gydF4y2Ba 一个gydF4y2Ba XgydF4y2Ba RgydF4y2Ba 一个gydF4y2Ba DgydF4y2Ba ·gydF4y2Ba αgydF4y2Ba 年代gydF4y2Ba cgydF4y2Ba 一个gydF4y2Ba lgydF4y2Ba egydF4y2Ba 在哪里gydF4y2Ba αgydF4y2Ba 年代gydF4y2Ba cgydF4y2Ba 一个gydF4y2Ba lgydF4y2Ba egydF4y2Ba 是gydF4y2Ba αgydF4y2Ba tgydF4y2Ba 一个gydF4y2Ba rgydF4y2Ba ggydF4y2Ba egydF4y2Ba tgydF4y2Ba 1和1之间的比例。这个简单的混合控制器能够访问所有路径点在9.9秒,这是十分之一秒的速度比上面的进化控制器报告。控制器也适用在障碍面前当struts延长10%。总的来说,这个混合控制器提供了一个平滑运动和良好的性能。对于未来的工作,我们想发展这个混合控制器以及一种更为复杂的方法处理扩展点所支撑gydF4y2Ba (gydF4y2Ba 4gydF4y2Ba )gydF4y2Ba 以上。gydF4y2Ba

5。结论gydF4y2Ba

作出正变得越来越普遍。同样地,他们的预想环境正变得越来越动态多变。我们已经作出,这样就能更好地处理不同大小的障碍。具体来说,我们比较和分析FSM和安控制器有或没有障碍环境中同时发展我们作出的物理特征。在比较这两种技术,我们能够找到设计原则,结合两者的优点。具体来说,我们发现,两种策略的混合似乎能够保持这两种方法的优势。例如,FSM为本研究设计的一个优势是,它是在两个方向,但是没有足够的进化压力这一行为进化的人工神经网络。另一方面,人工神经网络进化更连续的自然转动。而不是把,他们倾向于gydF4y2Ba 方向的转变gydF4y2Ba向目标。最后,hand-designed控制器结合了这两种策略,但它可能没有明显的设计这样一个控制器没有首先进化FSMs和ann。gydF4y2Ba

尽管方向控制器是简单的优化,相关的复杂动力学爬障碍使它更难设计一个控制器扩展Adabot的struts。具体来说,差动驱动模型用来预测机器人线性和角速度不考虑障碍,车轮滑动或轮struts的延伸。我们未来的工作将集中在优化混合动力控制器和调查不同的策略来扩展和缩回struts,这样机器人能够更有效地获得轮式和legged-wheel运动的好处。gydF4y2Ba

改善控制一种可能性是使用递归神经网络(RNN)控制。这样做可能提供了一种方式,可以让机器人可以感觉它已经从一种类型的地形转换到另一个。发展一个RNN,然而,需要更加谨慎选择的进化压力,它可能需要一个更在任务难度逐渐增加。技术如Lexicase选择(gydF4y2Ba 35gydF4y2Ba)可以用来发展RNNs工作在许多类型的地形。gydF4y2Ba

数据可用性gydF4y2Ba

所有代码用于生产我们的结果,所有数据生成的进化算法用于支持这项研究的结果已经存入以下库:gydF4y2Ba https://github.com/anthonyjclark/adabot02-anngydF4y2Ba。gydF4y2Ba

的利益冲突gydF4y2Ba

作者宣称没有利益冲突。gydF4y2Ba

确认gydF4y2Ba

这项工作是由NSF批准号phy - 9723972。gydF4y2Ba

1gydF4y2Ba

霍尔丹gydF4y2Ba

d . W。gydF4y2Ba

彼得森gydF4y2Ba

k . C。gydF4y2Ba

加西亚贝穆德斯gydF4y2Ba

f . L。gydF4y2Ba

担心gydF4y2Ba

r S。gydF4y2Ba

Animal-inspired设计和气动稳定hexapedal millirobotgydF4y2Ba

《2013年IEEE机器人与自动化国际会议上,ICRA 2013gydF4y2Ba

2013年5月gydF4y2Ba

德国gydF4y2Ba

3279年gydF4y2Ba 3286年gydF4y2Ba

2 - s2.0 - 84887292983gydF4y2Ba

2gydF4y2Ba

SaranligydF4y2Ba

U。gydF4y2Ba

比勒gydF4y2Ba

M。gydF4y2Ba

•柯蒂斯gydF4y2Ba

d E。gydF4y2Ba

RHex:一个简单的和高度移动的昆虫机器人gydF4y2Ba

国际机器人研究杂志》上gydF4y2Ba 2001年gydF4y2Ba 20.gydF4y2Ba 7gydF4y2Ba 616年gydF4y2Ba 631年gydF4y2Ba

10.1177 / 02783640122067570gydF4y2Ba

2 - s2.0 - 0035410808gydF4y2Ba

3gydF4y2Ba

奎因gydF4y2Ba

r D。gydF4y2Ba

的办公室gydF4y2Ba

j . T。gydF4y2Ba

金斯利gydF4y2Ba

d . A。gydF4y2Ba

RitzmanngydF4y2Ba

r·E。gydF4y2Ba

通过抽象生物原则改善流动性gydF4y2Ba

学报2002年IEEE / RSJ智能机器人和系统国际会议gydF4y2Ba

2002年10月gydF4y2Ba

瑞士gydF4y2Ba

2652年gydF4y2Ba 2657年gydF4y2Ba

2 - s2.0 - 0036450723gydF4y2Ba

4gydF4y2Ba

可以忍受gydF4y2Ba

M。gydF4y2Ba

GrimmingergydF4y2Ba

F。gydF4y2Ba

基什内尔gydF4y2Ba

F。gydF4y2Ba

不莱梅gydF4y2Ba

D。gydF4y2Ba

一个多才多艺的踩步搜索和救援机器人的应用程序gydF4y2Ba

学报2008年IEEE国际研讨会上安全、安全与救援机器人,SSRR 2008gydF4y2Ba

2008年11月gydF4y2Ba

日本gydF4y2Ba

35gydF4y2Ba 40gydF4y2Ba

2 - s2.0 - 62949102842gydF4y2Ba

5gydF4y2Ba

KenneallygydF4y2Ba

G。gydF4y2Ba

德gydF4y2Ba

一个。gydF4y2Ba

•柯蒂斯gydF4y2Ba

d E。gydF4y2Ba

设计原则的家庭直接传动腿式机器人gydF4y2Ba

IEEE机器人与自动化信件gydF4y2Ba 2016年gydF4y2Ba 1gydF4y2Ba 2gydF4y2Ba 900年gydF4y2Ba 907年gydF4y2Ba

10.1109 / LRA.2016.2528294gydF4y2Ba

6gydF4y2Ba

大gydF4y2Ba

C。gydF4y2Ba

BenamargydF4y2Ba

F。gydF4y2Ba

PlumetgydF4y2Ba

F。gydF4y2Ba

BidaudgydF4y2Ba

P。gydF4y2Ba

稳定性和牵引优化的可重构wheel-legged机器人gydF4y2Ba

国际机器人研究杂志》上gydF4y2Ba 2004年gydF4y2Ba 23gydF4y2Ba 外扩gydF4y2Ba 1041年gydF4y2Ba 1058年gydF4y2Ba

2 - s2.0 - 6344270183gydF4y2Ba

10.1177 / 0278364904047616gydF4y2Ba

7gydF4y2Ba

郑gydF4y2Ba

C。gydF4y2Ba

刘gydF4y2Ba

J。gydF4y2Ba

诈骗gydF4y2Ba

t E。gydF4y2Ba

张gydF4y2Ba

Z。gydF4y2Ba

盛gydF4y2Ba

T。gydF4y2Ba

周gydF4y2Ba

J。gydF4y2Ba

马gydF4y2Ba

Y。gydF4y2Ba

阴gydF4y2Ba

M。gydF4y2Ba

wheel-legged混合运动机制的设计与分析gydF4y2Ba

机械工程的发展gydF4y2Ba 2015年gydF4y2Ba 7gydF4y2Ba 11gydF4y2Ba

2 - s2.0 - 84949032834gydF4y2Ba

8gydF4y2Ba

史密斯gydF4y2Ba

l . M。gydF4y2Ba

奎因gydF4y2Ba

r D。gydF4y2Ba

约翰逊gydF4y2Ba

k。gydF4y2Ba

塔克gydF4y2Ba

w·R。gydF4y2Ba

Tri-Wheel:小说wheel-leg流动的概念gydF4y2Ba

学报2015年IEEE / RSJ智能机器人和系统国际会议(——)gydF4y2Ba

2015年9月gydF4y2Ba

德国汉堡gydF4y2Ba

4146年gydF4y2Ba 4152年gydF4y2Ba

10.1109 / IROS.2015.7353963gydF4y2Ba

9gydF4y2Ba

金gydF4y2Ba

Y.-S。gydF4y2Ba

荣格gydF4y2Ba

G.-P。gydF4y2Ba

金gydF4y2Ba

H。gydF4y2Ba

赵gydF4y2Ba

K.-J。gydF4y2Ba

楚gydF4y2Ba

C.-N。gydF4y2Ba

与被动轮变压器:wheel-leg混合机器人可变形的轮子gydF4y2Ba

IEEE机器人gydF4y2Ba 2014年gydF4y2Ba 30.gydF4y2Ba 6gydF4y2Ba 1487年gydF4y2Ba 1498年gydF4y2Ba

10.1109 / TRO.2014.2365651gydF4y2Ba

2 - s2.0 - 84916598270gydF4y2Ba

10gydF4y2Ba

陈gydF4y2Ba

研究所。gydF4y2Ba

黄gydF4y2Ba

K.-J。gydF4y2Ba

陈gydF4y2Ba

W.-H。gydF4y2Ba

盛ydF4y2Ba

S.-Y。gydF4y2Ba

李gydF4y2Ba

学术界。gydF4y2Ba

林gydF4y2Ba

P.-C。gydF4y2Ba

Quattroped: leg-wheel可变形的机器人gydF4y2Ba

IEEE / ASME举办gydF4y2Ba 2014年gydF4y2Ba 19gydF4y2Ba 2gydF4y2Ba 730年gydF4y2Ba 742年gydF4y2Ba

10.1109 / TMECH.2013.2253615gydF4y2Ba

2 - s2.0 - 84895920848gydF4y2Ba

11gydF4y2Ba

陈gydF4y2Ba

W.-H。gydF4y2Ba

林gydF4y2Ba

H.-S。gydF4y2Ba

林gydF4y2Ba

Y.-M。gydF4y2Ba

林gydF4y2Ba

P.-C。gydF4y2Ba

TurboQuad:小说Leg-Wheel可变形的机器人与平稳和快速行为的转变gydF4y2Ba

IEEE机器人gydF4y2Ba 2017年gydF4y2Ba 33gydF4y2Ba 5gydF4y2Ba 1025年gydF4y2Ba 1040年gydF4y2Ba

2 - s2.0 - 85019948889gydF4y2Ba

10.1109 / TRO.2017.2696022gydF4y2Ba

12gydF4y2Ba

魏gydF4y2Ba

Z。gydF4y2Ba

首歌gydF4y2Ba

G。gydF4y2Ba

乔gydF4y2Ba

G。gydF4y2Ba

张gydF4y2Ba

Y。gydF4y2Ba

太阳gydF4y2Ba

H。gydF4y2Ba

设计和实现一个leg-wheel机器人:TransleggydF4y2Ba

机制和机器人技术杂志》上gydF4y2Ba 2017年gydF4y2Ba 9gydF4y2Ba 5gydF4y2Ba

2 - s2.0 - 85021227470gydF4y2Ba

13gydF4y2Ba

MintchevgydF4y2Ba

年代。gydF4y2Ba

FloreanogydF4y2Ba

D。gydF4y2Ba

自适应形态学:多通道和多功能机器人的设计原则gydF4y2Ba

IEEE机器人与自动化杂志gydF4y2Ba 2016年gydF4y2Ba 23gydF4y2Ba 3gydF4y2Ba 42gydF4y2Ba 54gydF4y2Ba

2 - s2.0 - 84990929253gydF4y2Ba

14gydF4y2Ba

于她gydF4y2Ba

。gydF4y2Ba

赫德gydF4y2Ba

c·J。gydF4y2Ba

苏gydF4y2Ba

H。gydF4y2Ba

一个可变形的轮腿机器人被动gydF4y2Ba

学报2015年IEEE / RSJ智能机器人和系统国际会议(——)gydF4y2Ba

2015年9月gydF4y2Ba

德国汉堡gydF4y2Ba

4165年gydF4y2Ba 4170年gydF4y2Ba

10.1109 / IROS.2015.7353966gydF4y2Ba

15gydF4y2Ba

克拉克gydF4y2Ba

a·J。gydF4y2Ba

进化adabot:移动机器人与可调轮扩展gydF4y2Ba

计算情报学报2017年IEEE研讨会系列(1)gydF4y2Ba

2017年11月gydF4y2Ba

火奴鲁鲁,嗨gydF4y2Ba

1gydF4y2Ba 8gydF4y2Ba

10.1109 / SSCI.2017.8280979gydF4y2Ba

16gydF4y2Ba

丹尼特gydF4y2Ba

d . C。gydF4y2Ba

BraitenberggydF4y2Ba

V。gydF4y2Ba

车辆:合成实验心理学。gydF4y2Ba

哲学评论gydF4y2Ba 1986年gydF4y2Ba 95年gydF4y2Ba 1gydF4y2Ba 137年gydF4y2Ba

10.2307 / 2185146gydF4y2Ba

17gydF4y2Ba

席尔瓦gydF4y2Ba

F。gydF4y2Ba

杜阿尔特gydF4y2Ba

M。gydF4y2Ba

专题gydF4y2Ba

lgydF4y2Ba

奥利维拉gydF4y2Ba

s M。gydF4y2Ba

克里斯坦森gydF4y2Ba

a . L。gydF4y2Ba

进化机器人的开放问题gydF4y2Ba

进化计算gydF4y2Ba 2016年gydF4y2Ba 24gydF4y2Ba 2gydF4y2Ba 205年gydF4y2Ba 236年gydF4y2Ba

2 - s2.0 - 84974824203gydF4y2Ba

10.1162 / EVCO_a_00172gydF4y2Ba

18gydF4y2Ba

克拉克gydF4y2Ba

a·J。gydF4y2Ba

麦金利gydF4y2Ba

p K。gydF4y2Ba

棕褐色gydF4y2Ba

X。gydF4y2Ba

提高一个模范自由通过进化计算自适应控制器gydF4y2Ba

16基因与进化计算学报》发布会上,GECCO 2015gydF4y2Ba

2015年7月gydF4y2Ba

西班牙gydF4y2Ba

137年gydF4y2Ba 144年gydF4y2Ba

2 - s2.0 - 84963682488gydF4y2Ba

19gydF4y2Ba

克拉克gydF4y2Ba

a·J。gydF4y2Ba

棕褐色gydF4y2Ba

X。gydF4y2Ba

麦金利gydF4y2Ba

p K。gydF4y2Ba

进化多目标设计一个灵活的对机器鱼尾鳍gydF4y2Ba

生物灵感和仿生学gydF4y2Ba 2015年gydF4y2Ba 10gydF4y2Ba 6gydF4y2Ba

2 - s2.0 - 84951798156gydF4y2Ba

20.gydF4y2Ba

摩尔gydF4y2Ba

j . M。gydF4y2Ba

斯坦顿gydF4y2Ba

一个。gydF4y2Ba

抢七和多样性:隔离效应Lexicase选择gydF4y2Ba

《2018年的会议上人工生命gydF4y2Ba

2018年7月gydF4y2Ba

日本东京gydF4y2Ba

590年gydF4y2Ba 597年gydF4y2Ba

10.1162 / isal_a_00109gydF4y2Ba

21gydF4y2Ba

戈麦斯gydF4y2Ba

J。gydF4y2Ba

马里亚诺•gydF4y2Ba

P。gydF4y2Ba

克里斯坦森gydF4y2Ba

a . L。gydF4y2Ba

设计有效的新奇搜索算法:一个全面的实证研究gydF4y2Ba

16基因与进化计算学报》发布会上,GECCO 2015gydF4y2Ba

2015年7月gydF4y2Ba

西班牙gydF4y2Ba

943年gydF4y2Ba 950年gydF4y2Ba

2 - s2.0 - 84962221268gydF4y2Ba

22gydF4y2Ba

雷曼兄弟gydF4y2Ba

J。gydF4y2Ba

斯坦利gydF4y2Ba

k . O。gydF4y2Ba

放弃目标:通过搜索进化新奇gydF4y2Ba

进化计算gydF4y2Ba 2011年gydF4y2Ba 19gydF4y2Ba 2gydF4y2Ba 189年gydF4y2Ba 222年gydF4y2Ba

10.1162 / evco_a_00025gydF4y2Ba

2 - s2.0 - 79957482984gydF4y2Ba

23gydF4y2Ba

西姆斯gydF4y2Ba

K。gydF4y2Ba

竞争发展的三维形态和行为gydF4y2Ba

人工生命gydF4y2Ba 1994年gydF4y2Ba 1gydF4y2Ba 4gydF4y2Ba 353年gydF4y2Ba 372年gydF4y2Ba

10.1162 / artl.1994.1.353gydF4y2Ba

24gydF4y2Ba

HornikgydF4y2Ba

K。gydF4y2Ba

StinchcombegydF4y2Ba

M。gydF4y2Ba

白色的gydF4y2Ba

H。gydF4y2Ba

多层前馈网络普遍接近者gydF4y2Ba

神经网络gydF4y2Ba 1989年gydF4y2Ba 2gydF4y2Ba 5gydF4y2Ba 359年gydF4y2Ba 366年gydF4y2Ba

10.1016 / 0893 - 6080 (89)90020 - 8gydF4y2Ba

2 - s2.0 - 0024880831gydF4y2Ba

Zbl1383.92015gydF4y2Ba

25gydF4y2Ba

邦加德gydF4y2Ba

j . C。gydF4y2Ba

进化机器人:以生物启发的方法来自主的设计,自适应机器gydF4y2Ba

ACM的通信gydF4y2Ba 2013年gydF4y2Ba 56gydF4y2Ba 8gydF4y2Ba 74年gydF4y2Ba 83年gydF4y2Ba

2 - s2.0 - 84881514851gydF4y2Ba

26gydF4y2Ba

斯坦利gydF4y2Ba

k . O。gydF4y2Ba

MiikkulainengydF4y2Ba

R。gydF4y2Ba

进化神经网络通过增加拓扑gydF4y2Ba

进化计算gydF4y2Ba 2002年gydF4y2Ba 10gydF4y2Ba 2gydF4y2Ba 99年gydF4y2Ba 127年gydF4y2Ba

2 - s2.0 - 0036594106gydF4y2Ba

10.1162 / 106365602320169811gydF4y2Ba

12180173gydF4y2Ba

27gydF4y2Ba

YaqoobgydF4y2Ba

M。gydF4y2Ba

“gydF4y2Ba

B。gydF4y2Ba

非常小的飙升进化神经网络识别模式在一个连续的输入流gydF4y2Ba

计算情报学报2017年IEEE研讨会系列(1)gydF4y2Ba

2017年11月gydF4y2Ba

火奴鲁鲁,嗨gydF4y2Ba

1gydF4y2Ba 8gydF4y2Ba

10.1109 / SSCI.2017.8285420gydF4y2Ba

28gydF4y2Ba

表亲gydF4y2Ba

年代。gydF4y2Ba

GerkeygydF4y2Ba

B。gydF4y2Ba

康利gydF4y2Ba

K。gydF4y2Ba

车库gydF4y2Ba

W。gydF4y2Ba

共享软件与活性氧(ROS的话题)gydF4y2Ba

IEEE机器人和自动化》杂志gydF4y2Ba 2010年gydF4y2Ba 17gydF4y2Ba 2gydF4y2Ba 12gydF4y2Ba 14gydF4y2Ba

10.1109 / MRA.2010.936956gydF4y2Ba

29日gydF4y2Ba

表亲gydF4y2Ba

年代。gydF4y2Ba

欢迎来到ROS的话题gydF4y2Ba

IEEE机器人与自动化杂志gydF4y2Ba 2010年gydF4y2Ba 17gydF4y2Ba 1gydF4y2Ba 13gydF4y2Ba 14gydF4y2Ba

2 - s2.0 - 77949636314gydF4y2Ba

30.gydF4y2Ba

奎因gydF4y2Ba

r D。gydF4y2Ba

纳尔逊gydF4y2Ba

g . M。gydF4y2Ba

巴赫曼gydF4y2Ba

r . J。gydF4y2Ba

金斯利gydF4y2Ba

d . A。gydF4y2Ba

的办公室gydF4y2Ba

j . T。gydF4y2Ba

艾伦gydF4y2Ba

t·J。gydF4y2Ba

RitzmanngydF4y2Ba

r·E。gydF4y2Ba

并行互补策略实现生物原则为移动机器人gydF4y2Ba

国际机器人研究杂志》上gydF4y2Ba 2003年gydF4y2Ba 22gydF4y2Ba 3 - 4gydF4y2Ba 169年gydF4y2Ba 186年gydF4y2Ba

2 - s2.0 - 0037645840gydF4y2Ba

10.1177 / 0278364903022003003gydF4y2Ba

31日gydF4y2Ba

穆雷打造gydF4y2Ba

J.-B。gydF4y2Ba

ChatzilygeroudisgydF4y2Ba

K。gydF4y2Ba

20年的现实差距:几个思考模拟器在进化机器人gydF4y2Ba

学报2017年基因与进化计算大会伴侣,GECCO 2017gydF4y2Ba

2017年7月gydF4y2Ba

德国gydF4y2Ba

1121年gydF4y2Ba 1124年gydF4y2Ba

2 - s2.0 - 85026881642gydF4y2Ba

32gydF4y2Ba

汉森gydF4y2Ba

N。gydF4y2Ba

穆勒gydF4y2Ba

s D。gydF4y2Ba

KoumoutsakosgydF4y2Ba

P。gydF4y2Ba

降低时间复杂度的derandomized进化策略与协方差矩阵适应(CMA-ES)gydF4y2Ba

进化计算gydF4y2Ba 2003年gydF4y2Ba 11gydF4y2Ba 1gydF4y2Ba 1gydF4y2Ba 18gydF4y2Ba

10.1162 / 106365603321828970gydF4y2Ba

2 - s2.0 - 0042879997gydF4y2Ba

33gydF4y2Ba

汉森gydF4y2Ba

N。gydF4y2Ba

CMA进化策略:一个教程gydF4y2Ba

http://arxiv.org/abs/1604.00772gydF4y2Ba

34gydF4y2Ba

路德gydF4y2Ba

E.-L。gydF4y2Ba

SamuelsengydF4y2Ba

E。gydF4y2Ba

GlettegydF4y2Ba

K。gydF4y2Ba

迷因机器人控制进化和适应现实gydF4y2Ba

学报2016年IEEE研讨会系列计算智能、SSCI 2016gydF4y2Ba

2016年12月gydF4y2Ba

希腊gydF4y2Ba

2 - s2.0 - 85016061633gydF4y2Ba

35gydF4y2Ba

摩尔gydF4y2Ba

j . M。gydF4y2Ba

克拉克gydF4y2Ba

a·J。gydF4y2Ba

麦金利gydF4y2Ba

p K。gydF4y2Ba

动画的复杂性对分级控制的演变的影响gydF4y2Ba

学报2017年基因与进化计算会议,GECCO 2017gydF4y2Ba

2017年7月gydF4y2Ba

德国gydF4y2Ba

147年gydF4y2Ba 154年gydF4y2Ba

2 - s2.0 - 85026422309gydF4y2Ba