1。介绍gydF4y2Ba
自主无人地面车辆(作出)提供优秀的解决方案的任务需要搜索和监测在环境被认为过于偏远的或危险的人类。考虑gydF4y2Ba
搜索和救援gydF4y2Ba:自然灾害后可以使用作出应急人员帮助找到受害者不稳定和危险的地方。作出长期的操作时间,可以携带沉重的有效载荷(如传感器),和可以搜索在狭窄和覆盖的地方,如森林和洞穴。gydF4y2Ba
确保作出可以处理许多不同类型的地形是一个持续的挑战。研究人员已经发明了几种不同的方法来解决流动性问题的多种多样的地形。具体来说,机器人设计与车轮前行,追踪,腿gydF4y2Ba
1gydF4y2Ba),legged-wheels(无框的车轮,车轮辐条与地面接触)(gydF4y2Ba
2gydF4y2Ba- - - - - -gydF4y2Ba
5gydF4y2Ba结束],wheeled-legs(车轮腿和悬浮液可以驱动)(gydF4y2Ba
6gydF4y2Ba- - - - - -gydF4y2Ba
8gydF4y2Ba),和可变形的轮子gydF4y2Ba
9gydF4y2Ba- - - - - -gydF4y2Ba
12gydF4y2Ba]。虽然这些系统提供了一个优势传统轮式机器人,优化并不是表现在绝大多数这些研究。此外,正如被Mintchev和FloreanogydF4y2Ba
13gydF4y2Ba),大多数研究人员在该地区的可变形的轮子目前专注于机械设计,控制和未来工作的决策。例如,大多数机器人与可变形的轮子(远程遥控gydF4y2Ba
11gydF4y2Ba,gydF4y2Ba
14gydF4y2Ba),和金等。gydF4y2Ba
9gydF4y2Ba)设计了一个被动触发机制,不需要任何控制器的输入。gydF4y2Ba
设备在这项研究中,gydF4y2Ba
AdabotgydF4y2Ba(见图gydF4y2Ba
1gydF4y2Ba),包括可变形的轮子,可以顺利被转换从一个圆轮子,轮子和轮胎gydF4y2Ba
钉gydF4y2Balegged-wheel。轮转换是由从中心呈放射状向外扩展struts轮轮(见图gydF4y2Ba
2gydF4y2Ba)。Adabot使用进化算法进行了优化,其物理特性和控制器能够更好地处理地形,包括不同大小的障碍。在以前的工作gydF4y2Ba
15gydF4y2Ba),一个类似的系统优化最大化了速度在不平坦的地形。本研究不同在两个主要方面:(1)在这里我们进化控制器为一个更艰巨的任务:gydF4y2Ba
路点后gydF4y2Ba,(2)我们从进化的两种类型的分析结果反馈控制器(而不是前馈)。gydF4y2Ba
Adabot,作出与可变形的轮子。gydF4y2Ba
模拟设备gydF4y2Ba
3 d印制的原型gydF4y2Ba
插图Adabot轮的扩展机制,struts完全收回(左),部分扩展,如轮胎螺栓(中)和完全伸展像legged-wheels(右)。gydF4y2Ba
在这项研究中,我们发展机器人的底盘维度,车轮半径,轮struts的数量,以及一个有限状态机(FSM)控制器或一个人工神经网络(ANN)控制器。最好的进化FSMs和人工神经网络进行了分析和比较。这个初始的工作,以确保我们能够有效地分析安,网络只有三个输入节点,零隐藏节点,和三个输出节点。输入完全连接到输出。网络比2型Braitenberg稍微复杂的车辆(gydF4y2Ba
16gydF4y2Ba]。我们的分析得出的结论是用来创建一组新控制器设计原则,利用这两种技术。特别有吸引力的设计一个控制器,不是黑盒像安但不如一个FSM的严格定义。源代码已经可以在GitHub (gydF4y2Ba
https://github.com/anthonyjclark/adabot02-anngydF4y2Ba)。gydF4y2Ba
2。相关工作gydF4y2Ba
领域的进化机器人(ER),进化算法(EA)优化给定系统的自由变量gydF4y2Ba
17gydF4y2Ba]。ER方法已经成功地应用于许多不同类型的机器人系统(空中、水上,散步,等等)。例如,我们以前使用微分进化进化自适应神经网络和机器鱼的形态(gydF4y2Ba
18gydF4y2Ba,gydF4y2Ba
19gydF4y2Ba),和摩尔et al。gydF4y2Ba
20.gydF4y2Ba]进化等级控制器为分段蠕虫动画。尽管进化经常利用在抽象层面上优化轮式机器人导航过程(例如,看到戈麦斯et al。(gydF4y2Ba
21gydF4y2Ba和雷曼兄弟和斯坦利gydF4y2Ba
22gydF4y2Ba]),它没有经常被用来直接演变作出形态,和我们所知这是第一个研究可变形的轮的特征的进化。gydF4y2Ba
大量的ER研究利用人工神经网络来控制移动机器人,包括gydF4y2Ba
虚拟生物进化gydF4y2Ba(gydF4y2Ba
23gydF4y2Ba),这被认为是第一个ER的作品之一。人工神经网络使用一个进化方法时提供许多好处。首先,由于人工神经网络是所谓普遍接近者(gydF4y2Ba
24gydF4y2Ba),通常产生进化gydF4y2Ba
小说gydF4y2Ba有时不直观的结果可能没有被发现当手工创建一个控制器(gydF4y2Ba
25gydF4y2Ba]。其次,人工神经网络需要少量的用户设计。具体地说,一个进化算法可以自动决定每个输入的重要性(传感器值)的计算每个输出(驱动机制)gydF4y2Ba
26gydF4y2Ba]。使用一个安的主要缺点是,它被认为是一个黑箱系统。也就是说,gydF4y2Ba
如何gydF4y2Ba安达到其结果往往不清楚或分析。然而,最近一些研究者试图从进化神经网络提取状态机。例如,Yaqoob和“gydF4y2Ba
27gydF4y2Ba)自动生成状态机相同的属性的一种进化神经网络的激增。gydF4y2Ba
3所示。AdabotgydF4y2Ba
硬件。gydF4y2BaAdabot,见图gydF4y2Ba
1gydF4y2Ba,是一个原型设备,包括一个覆盆子π3模型B (RPi)作为其主要的控制董事会。零售价格指数(RPi)被选为它能够运行机器人操作系统(ROS) (gydF4y2Ba
28gydF4y2Ba,gydF4y2Ba
29日gydF4y2Ba),Adabot使用部署其软件系统。零售物价指数的大小限制的最小尺寸Adabot的底盘。具体来说,底盘必须至少8厘米,8厘米。表gydF4y2Ba
1gydF4y2Ba列出所有可配置参数Adabot的物理特性,在哪里gydF4y2Ba
WgydF4y2Ba
hgydF4y2Ba
egydF4y2Ba
egydF4y2Ba
lgydF4y2Ba
BgydF4y2Ba
一个gydF4y2Ba
年代gydF4y2Ba
egydF4y2Ba
和gydF4y2Ba
TgydF4y2Ba
rgydF4y2Ba
一个gydF4y2Ba
cgydF4y2Ba
kgydF4y2Ba
WgydF4y2Ba
我gydF4y2Ba
dgydF4y2Ba
tgydF4y2Ba
hgydF4y2Ba
表示前后轮轴之间的距离和车轮之间的横向距离,分别gydF4y2Ba
年代gydF4y2Ba
tgydF4y2Ba
rgydF4y2Ba
ugydF4y2Ba
tgydF4y2Ba
CgydF4y2Ba
ogydF4y2Ba
ugydF4y2Ba
ngydF4y2Ba
tgydF4y2Ba
参数表示的数量每轮struts。gydF4y2Ba
Adabot物理参数。gydF4y2Ba
|
的名字gydF4y2Ba |
范围gydF4y2Ba |
|
WgydF4y2Ba
hgydF4y2Ba
egydF4y2Ba
egydF4y2Ba
lgydF4y2Ba
BgydF4y2Ba
一个gydF4y2Ba
年代gydF4y2Ba
egydF4y2Ba
|
8 - 16厘米gydF4y2Ba |
|
TgydF4y2Ba
rgydF4y2Ba
一个gydF4y2Ba
cgydF4y2Ba
kgydF4y2Ba
WgydF4y2Ba
我gydF4y2Ba
dgydF4y2Ba
tgydF4y2Ba
hgydF4y2Ba
|
8 - 16厘米gydF4y2Ba |
|
WgydF4y2Ba
hgydF4y2Ba
egydF4y2Ba
egydF4y2Ba
lgydF4y2Ba
RgydF4y2Ba
一个gydF4y2Ba
dgydF4y2Ba
我gydF4y2Ba
ugydF4y2Ba
年代gydF4y2Ba
|
2到3厘米gydF4y2Ba |
|
年代gydF4y2Ba
tgydF4y2Ba
rgydF4y2Ba
ugydF4y2Ba
tgydF4y2Ba
CgydF4y2Ba
ogydF4y2Ba
ugydF4y2Ba
ngydF4y2Ba
tgydF4y2Ba
|
0到7gydF4y2Ba |
每个轮子是由自己的直流齿轮马达磁编码器。同样,每个轮子的struts包括一组由一个线性伺服伸出和缩回。传感,Adabot包括三个前锋面对距离传感器和IMU(硬件陀螺仪,使用硬件加速计,使用硬件磁强计)。最后,它使用一个2.4 GHz无线通信模块是由2200 mAh电池组,它提供了约两个小时的操作时间。gydF4y2Ba
支柱的扩展。gydF4y2Ba图gydF4y2Ba
2gydF4y2Ba描绘了支撑扩展过程。这种机制允许轮表现出一系列的特征。与struts完全收回,车轮常规运行;当扩展少量,struts作为轮胎螺栓;struts完全伸展,每个轮子类似于legged-wheel。由于设计的局限性,最大扩展struts等于车轮的半径- 1厘米(gydF4y2Ba
米gydF4y2Ba
一个gydF4y2Ba
XgydF4y2Ba
EgydF4y2Ba
XgydF4y2Ba
TgydF4y2Ba
=gydF4y2Ba
WgydF4y2Ba
hgydF4y2Ba
egydF4y2Ba
egydF4y2Ba
lgydF4y2Ba
RgydF4y2Ba
一个gydF4y2Ba
dgydF4y2Ba
我gydF4y2Ba
ugydF4y2Ba
年代gydF4y2Ba
- - - - - -gydF4y2Ba
1gydF4y2Ba
厘米)。Adabot更详细讨论的软件和轮扩展机制,与进化的一个例子Adabot ROS和露台与ROS(模拟环境紧密耦合),看到我们的初步研究[gydF4y2Ba
15gydF4y2Ba]。gydF4y2Ba
模拟。gydF4y2Ba模拟环境的影像图所示gydF4y2Ba
3gydF4y2Ba。环境通过生成填充40箱随机尺寸,位置,和密度。这些盒子作为模拟机器人必须遍历的障碍。如果一个新生成的框碰撞与现有的盒子从仿真中删除。我们看到平均31箱放置在环境。盒子的高度范围从2到5厘米,这是足够高(相比gydF4y2Ba
WgydF4y2Ba
hgydF4y2Ba
egydF4y2Ba
egydF4y2Ba
lgydF4y2Ba
RgydF4y2Ba
一个gydF4y2Ba
dgydF4y2Ba
我gydF4y2Ba
ugydF4y2Ba
年代gydF4y2Ba
值)大大减少轮式移动机器人(gydF4y2Ba
30.gydF4y2Ba]。此外,而不是每个箱子在固定位置,有可能Adabot推一个盒子(取决于它的大小和密度)。gydF4y2Ba
一个环境,包括随机生成障碍。当前路点显示为深灰色的球体,和机器人从原点开始面临正轴(路点,沿着红轴线)。gydF4y2Ba
在这项研究中,我们使用动态动画和机器人工具箱(DART) (gydF4y2Ba
https://dartsim.github.io/index.htmlgydF4y2Ba)。飞镖是专门为机器人应用程序和相当的速度比常见的选择(如果不是更快)[gydF4y2Ba
31日gydF4y2Ba]。gydF4y2Ba
路点导航控制。gydF4y2BaAdabot是由旋转打滑驾驶风格机器人将其左、右车轮以不同的速率。虽然每个轮子和轮子支撑集可以独立控制的,在本研究中我们只有三个控制输出:(1)左侧车轮的角速率,(2)对车轮的角速率,和(3)一个扩展为所有四套struts。尽管它可能是有益的独立控制每个轮子,在这项研究中我们选择同步两个左右车轮,车轮。这降低了进化控制参数的数量,使我们能够使用一个差动驱动机器人动力学预测模型。在未来,我们将探索独立控制每个轮子的影响。gydF4y2Ba
为Adabot援助在搜索和救援行动,它必须能够成功gydF4y2Ba
封面gydF4y2Ba(完全搜索)指定区域。一个简化版的这个任务,调用gydF4y2Ba
路点导航gydF4y2Ba,被认为是在进化的优化。对于这个任务,作出必须访问一组路径点序列。gydF4y2Ba
FSM控制。gydF4y2Ba这个任务的hand-designed FSMs中描述的人物gydF4y2Ba
4gydF4y2Ba。这个FSM包括两个独立的行动:(a)指挥机器人朝着下一个路点通过控制左、右车轮,和(b)扩展struts当机器人正在减少流动由于一个障碍。从本质上讲,机器人仍然在gydF4y2Ba
向前gydF4y2Ba国家只要标题之间的角度作出和方向的目标(gydF4y2Ba
αgydF4y2Ba
tgydF4y2Ba
一个gydF4y2Ba
rgydF4y2Ba
ggydF4y2Ba
egydF4y2Ba
tgydF4y2Ba
在某个阈值)。一旦超过阈值,要么FSM转换gydF4y2Ba
左gydF4y2Ba或gydF4y2Ba
正确的gydF4y2Ba状态。在gydF4y2Ba
左gydF4y2Ba和gydF4y2Ba
正确的gydF4y2Ba州,机器人将旋转不变gydF4y2Ba
αgydF4y2Ba
tgydF4y2Ba
一个gydF4y2Ba
rgydF4y2Ba
ggydF4y2Ba
egydF4y2Ba
tgydF4y2Ba
大于gydF4y2Ba
lgydF4y2Ba
。gydF4y2Ba
TgydF4y2Ba
ogydF4y2Ba
FgydF4y2Ba
ogydF4y2Ba
rgydF4y2Ba
wgydF4y2Ba
一个gydF4y2Ba
rgydF4y2Ba
dgydF4y2Ba
TgydF4y2Ba
hgydF4y2Ba
rgydF4y2Ba
egydF4y2Ba
年代gydF4y2Ba
hgydF4y2Ba
或小于gydF4y2Ba
RgydF4y2Ba
。gydF4y2Ba
TgydF4y2Ba
ogydF4y2Ba
FgydF4y2Ba
ogydF4y2Ba
rgydF4y2Ba
wgydF4y2Ba
一个gydF4y2Ba
rgydF4y2Ba
dgydF4y2Ba
TgydF4y2Ba
hgydF4y2Ba
rgydF4y2Ba
egydF4y2Ba
年代gydF4y2Ba
hgydF4y2Ba
分别在FSM转换回gydF4y2Ba
向前gydF4y2Ba。阈值角度如图gydF4y2Ba
4 (c)gydF4y2Ba。gydF4y2Ba
(一)FSM控制机器人的方向,(b)的单一国家控制轮struts,描述角度和(c)图用于触发状态之间的转换。gydF4y2Ba
方向键控制gydF4y2Ba
扩展控制gydF4y2Ba
环境图gydF4y2Ba
决定什么时候,多少轮应该扩展struts,我们使用一个简单的微分驱动模型和比较预期的速度和测量速度。具体来说,我们计算预期的线性(gydF4y2Ba
vgydF4y2Ba
)和角(gydF4y2Ba
ωgydF4y2Ba
速度(基于轮利率)使用以下模型:gydF4y2Ba
(1)gydF4y2Ba
vgydF4y2Ba
=gydF4y2Ba
VgydF4y2Ba
rgydF4y2Ba
+gydF4y2Ba
VgydF4y2Ba
lgydF4y2Ba
2gydF4y2Ba
,gydF4y2Ba
(2)gydF4y2Ba
ωgydF4y2Ba
=gydF4y2Ba
VgydF4y2Ba
rgydF4y2Ba
- - - - - -gydF4y2Ba
VgydF4y2Ba
lgydF4y2Ba
TgydF4y2Ba
rgydF4y2Ba
一个gydF4y2Ba
cgydF4y2Ba
kgydF4y2Ba
WgydF4y2Ba
我gydF4y2Ba
dgydF4y2Ba
tgydF4y2Ba
hgydF4y2Ba
在哪里gydF4y2Ba
VgydF4y2Ba
rgydF4y2Ba
和gydF4y2Ba
VgydF4y2Ba
lgydF4y2Ba
分别是左和右轮线速度,然后呢gydF4y2Ba
TgydF4y2Ba
rgydF4y2Ba
一个gydF4y2Ba
cgydF4y2Ba
kgydF4y2Ba
WgydF4y2Ba
我gydF4y2Ba
dgydF4y2Ba
tgydF4y2Ba
hgydF4y2Ba
代表轮子之间的距离在同一轴线(前方或后方轴)。这些计算值(预计基于差动驱动模型)然后减去实际(gydF4y2Ba
测量gydF4y2Ba)线速度和角速度值。的实际速度模拟机器人提供的模拟器,可以测量并在真实的环境中使用一个摄像系统开销。之间的差值(错误预期和实际速度)然后在0和1之间产生gydF4y2Ba
vgydF4y2Ba
egydF4y2Ba
和gydF4y2Ba
ωgydF4y2Ba
egydF4y2Ba
,这是按比例缩小的线速度和角速度误差,分别。这两个错误值然后使用指数平滑过滤。最后,他们被用于以下计算所有struts的扩展数量:gydF4y2Ba
(3)gydF4y2Ba
egydF4y2Ba
xgydF4y2Ba
tgydF4y2Ba
vgydF4y2Ba
=gydF4y2Ba
米gydF4y2Ba
egydF4y2Ba
xgydF4y2Ba
tgydF4y2Ba
·gydF4y2Ba
vgydF4y2Ba
egydF4y2Ba
+gydF4y2Ba
bgydF4y2Ba
egydF4y2Ba
xgydF4y2Ba
tgydF4y2Ba
,gydF4y2Ba
(4)gydF4y2Ba
egydF4y2Ba
xgydF4y2Ba
tgydF4y2Ba
ωgydF4y2Ba
=gydF4y2Ba
米gydF4y2Ba
egydF4y2Ba
xgydF4y2Ba
tgydF4y2Ba
·gydF4y2Ba
ωgydF4y2Ba
egydF4y2Ba
+gydF4y2Ba
bgydF4y2Ba
egydF4y2Ba
xgydF4y2Ba
tgydF4y2Ba
,gydF4y2Ba
(5)gydF4y2Ba
egydF4y2Ba
xgydF4y2Ba
tgydF4y2Ba
%gydF4y2Ba
=gydF4y2Ba
马克斯gydF4y2Ba
gydF4y2Ba
egydF4y2Ba
xgydF4y2Ba
tgydF4y2Ba
vgydF4y2Ba
,gydF4y2Ba
egydF4y2Ba
xgydF4y2Ba
tgydF4y2Ba
ωgydF4y2Ba
,gydF4y2Ba
(6)gydF4y2Ba
egydF4y2Ba
xgydF4y2Ba
tgydF4y2Ba
=gydF4y2Ba
米gydF4y2Ba
一个gydF4y2Ba
XgydF4y2Ba
EgydF4y2Ba
XgydF4y2Ba
TgydF4y2Ba
·gydF4y2Ba
egydF4y2Ba
xgydF4y2Ba
tgydF4y2Ba
%gydF4y2Ba
在哪里gydF4y2Ba
egydF4y2Ba
xgydF4y2Ba
tgydF4y2Ba
vgydF4y2Ba
和gydF4y2Ba
egydF4y2Ba
xgydF4y2Ba
tgydF4y2Ba
ωgydF4y2Ba
表示由于线性扩展计算量和角速度值,分别。这两个值计算使用一个线性方程和一个可配置的斜率(gydF4y2Ba
米gydF4y2Ba
egydF4y2Ba
xgydF4y2Ba
tgydF4y2Ba
)和拦截(gydF4y2Ba
bgydF4y2Ba
egydF4y2Ba
xgydF4y2Ba
tgydF4y2Ba
)。最后扩展量(gydF4y2Ba
egydF4y2Ba
xgydF4y2Ba
tgydF4y2Ba
)是基于这两个值的最大值,并计算最大可能扩展的比例(gydF4y2Ba
米gydF4y2Ba
一个gydF4y2Ba
XgydF4y2Ba
EgydF4y2Ba
XgydF4y2Ba
TgydF4y2Ba
)。从本质上讲,struts将延长一个量是线性正比于当前速度误差(最大线性和角度之间的误差)。因此,当Adabot遇到一个障碍,降低其流动性(相比,预测的差动驱动模型),它将扩展struts为了爬过障碍。gydF4y2Ba
表gydF4y2Ba
2gydF4y2Ba显示所有可配置参数的FSM (hand-chosen值显示在括号中)。除了第一个gydF4y2Ba
米gydF4y2Ba
egydF4y2Ba
xgydF4y2Ba
tgydF4y2Ba
和gydF4y2Ba
bgydF4y2Ba
egydF4y2Ba
xgydF4y2Ba
tgydF4y2Ba
表中,每个名称采用以下形式:大写字母代表一个状态图gydF4y2Ba
4(一)gydF4y2Ba(gydF4y2Ba
FgydF4y2Ba
流gydF4y2Ba,gydF4y2Ba
lgydF4y2Ba
eftgydF4y2Ba,或gydF4y2Ba
RgydF4y2Ba
锁定宽和高gydF4y2Ba),紧随其后的是一段时间内,紧随其后的是一个轮角速度或角阈值也在图中描述gydF4y2Ba
4(一)gydF4y2Ba。最后,以减少振动和潜在损害轮struts,车轮的最大角速率是线性缩减从20 radgydF4y2Ba−1gydF4y2Ba4 rad年代gydF4y2Ba−1gydF4y2Ba当struts充分扩展。gydF4y2Ba
Adabot FSM参数(Hand-Chosen)。gydF4y2Ba
|
的名字gydF4y2Ba |
范围gydF4y2Ba |
|
米gydF4y2Ba
egydF4y2Ba
xgydF4y2Ba
tgydF4y2Ba
|
(0.5)0到1gydF4y2Ba |
|
bgydF4y2Ba
egydF4y2Ba
xgydF4y2Ba
tgydF4y2Ba
|
(0.5)0到1gydF4y2Ba |
|
FgydF4y2Ba
。gydF4y2Ba
年代gydF4y2Ba
pgydF4y2Ba
egydF4y2Ba
egydF4y2Ba
dgydF4y2Ba
|
(20)0到20 radgydF4y2Ba−1gydF4y2Ba |
|
FgydF4y2Ba
。gydF4y2Ba
TgydF4y2Ba
ogydF4y2Ba
lgydF4y2Ba
egydF4y2Ba
fgydF4y2Ba
tgydF4y2Ba
TgydF4y2Ba
hgydF4y2Ba
rgydF4y2Ba
egydF4y2Ba
年代gydF4y2Ba
hgydF4y2Ba
|
(10)0到90°gydF4y2Ba |
|
FgydF4y2Ba
。gydF4y2Ba
TgydF4y2Ba
ogydF4y2Ba
RgydF4y2Ba
我gydF4y2Ba
ggydF4y2Ba
hgydF4y2Ba
tgydF4y2Ba
TgydF4y2Ba
hgydF4y2Ba
rgydF4y2Ba
egydF4y2Ba
年代gydF4y2Ba
hgydF4y2Ba
|
(-10)−90 0°gydF4y2Ba |
|
lgydF4y2Ba
。gydF4y2Ba
lgydF4y2Ba
egydF4y2Ba
fgydF4y2Ba
tgydF4y2Ba
年代gydF4y2Ba
pgydF4y2Ba
egydF4y2Ba
egydF4y2Ba
dgydF4y2Ba
|
(-20)−20 - 20 radgydF4y2Ba−1gydF4y2Ba |
|
lgydF4y2Ba
。gydF4y2Ba
RgydF4y2Ba
我gydF4y2Ba
ggydF4y2Ba
hgydF4y2Ba
tgydF4y2Ba
年代gydF4y2Ba
pgydF4y2Ba
egydF4y2Ba
egydF4y2Ba
dgydF4y2Ba
|
(20)−20 - 20 radgydF4y2Ba−1gydF4y2Ba |
|
lgydF4y2Ba
。gydF4y2Ba
TgydF4y2Ba
ogydF4y2Ba
FgydF4y2Ba
ogydF4y2Ba
rgydF4y2Ba
wgydF4y2Ba
一个gydF4y2Ba
rgydF4y2Ba
dgydF4y2Ba
TgydF4y2Ba
hgydF4y2Ba
rgydF4y2Ba
egydF4y2Ba
年代gydF4y2Ba
hgydF4y2Ba
|
(5)0到90°gydF4y2Ba |
|
RgydF4y2Ba
。gydF4y2Ba
lgydF4y2Ba
egydF4y2Ba
fgydF4y2Ba
tgydF4y2Ba
年代gydF4y2Ba
pgydF4y2Ba
egydF4y2Ba
egydF4y2Ba
dgydF4y2Ba
|
(20)−20 - 20 radgydF4y2Ba−1gydF4y2Ba |
|
RgydF4y2Ba
。gydF4y2Ba
RgydF4y2Ba
我gydF4y2Ba
ggydF4y2Ba
hgydF4y2Ba
tgydF4y2Ba
年代gydF4y2Ba
pgydF4y2Ba
egydF4y2Ba
egydF4y2Ba
dgydF4y2Ba
|
(-20)−20 - 20 radgydF4y2Ba−1gydF4y2Ba |
|
RgydF4y2Ba
。gydF4y2Ba
TgydF4y2Ba
ogydF4y2Ba
FgydF4y2Ba
ogydF4y2Ba
rgydF4y2Ba
wgydF4y2Ba
一个gydF4y2Ba
rgydF4y2Ba
dgydF4y2Ba
TgydF4y2Ba
hgydF4y2Ba
rgydF4y2Ba
egydF4y2Ba
年代gydF4y2Ba
hgydF4y2Ba
|
(5)−90 - 0°gydF4y2Ba |
安控制。gydF4y2Ba作为替代的FSM控制器,我们发展一个安同样的任务。神经网络接收三个输入(每个比例在0和1之间):(1)gydF4y2Ba
αgydF4y2Ba
tgydF4y2Ba
一个gydF4y2Ba
rgydF4y2Ba
ggydF4y2Ba
egydF4y2Ba
tgydF4y2Ba
,(2)gydF4y2Ba
vgydF4y2Ba
egydF4y2Ba
,(3)gydF4y2Ba
ωgydF4y2Ba
egydF4y2Ba
。本质上讲,安FSM提供相同的信息,并产生相同的三个输出值(左和右轮利率和一个扩展量)。在我们的前期工作中,我们发现隐藏节点是该任务不必要的(相同的策略和健身价值实现和没有隐藏节点)。安的基因组包含13个值:一个整数值代表激活函数(物流、双曲正切或修正线性单元)和12值神经网络权重(三个输入+一个偏见的三个输出)。gydF4y2Ba
进化。gydF4y2Ba在这项研究中,我们采用协方差矩阵适应进化策略(CMA-ES) [gydF4y2Ba
32gydF4y2Ba]。特别是,我们使用pycma(由汉森(gydF4y2Ba
33gydF4y2Ba]),适用于实值问题和支持等处理整数值gydF4y2Ba
EgydF4y2Ba
xgydF4y2Ba
tgydF4y2Ba
CgydF4y2Ba
ogydF4y2Ba
ugydF4y2Ba
ngydF4y2Ba
tgydF4y2Ba
。gydF4y2Ba
4所示。讨论和结果gydF4y2Ba
在本节中,我们提供我们的结果从Adabot进化。具体来说,我们进化的Adabot两个环境(有或没有障碍)和两种不同的控制器。这些四个实验重复20次。最后,我们讨论的原则,可以从这些实验。gydF4y2Ba
4.1。健身的计算gydF4y2Ba
这里,Adabot的目标是访问一组坐标(路点)序列。在一个单一的模拟过程中,设备有30 (gydF4y2Ba
tgydF4y2Ba
米gydF4y2Ba
一个gydF4y2Ba
xgydF4y2Ba
秒钟访问gydF4y2Ba
四个gydF4y2Ba预定义的路径点,但仿真将尽快终止第四路点。健身计算如下(pycma用于最大化这个函数):gydF4y2Ba
(7)gydF4y2Ba
fgydF4y2Ba
=gydF4y2Ba
2gydF4y2Ba
wgydF4y2Ba
+gydF4y2Ba
1gydF4y2Ba
- - - - - -gydF4y2Ba
最小值gydF4y2Ba
gydF4y2Ba
dgydF4y2Ba
,gydF4y2Ba
dgydF4y2Ba
米gydF4y2Ba
一个gydF4y2Ba
xgydF4y2Ba
dgydF4y2Ba
米gydF4y2Ba
一个gydF4y2Ba
xgydF4y2Ba
+gydF4y2Ba
tgydF4y2Ba
米gydF4y2Ba
一个gydF4y2Ba
xgydF4y2Ba
- - - - - -gydF4y2Ba
tgydF4y2Ba
tgydF4y2Ba
米gydF4y2Ba
一个gydF4y2Ba
xgydF4y2Ba
在哪里gydF4y2Ba
wgydF4y2Ba
代表着路点的数量,gydF4y2Ba
dgydF4y2Ba
和gydF4y2Ba
dgydF4y2Ba
米gydF4y2Ba
一个gydF4y2Ba
xgydF4y2Ba
表示下一个路点的距离和距离的比例因子,分别gydF4y2Ba
tgydF4y2Ba
表示发生的时间。这个函数是为了提供一个光滑的梯度生成控制器快速导航到所有路点。的第一部分方程确保CMA-ES算法严重倾向于任何控制器达到甚至单一路点;这个组件的值从0到8。接下来,距离组件添加到奖励解决方案驱动序列的下一个路点附近,但不要达到四个。开始时这是特别有用的解决方案时进化的早期阶段。组件导致的距离值在0和1之间。仿真结束后四路点以来,时间分量将一个值在0(零剩余时间)和1之间(四路点都在瞬间达到)。组件的时间是为了支持任何控制器快速解决的任务。因此,最大可能健身是10。gydF4y2Ba
4.2。进化没有障碍gydF4y2Ba
在我们的第一个实验中,gydF4y2Ba
FSM-0-1gydF4y2Ba,我们发展中的15个参数表gydF4y2Ba
1gydF4y2Ba(物理)和gydF4y2Ba
2gydF4y2Ba(控制)的环境中没有障碍。的命名方案实验表明控制器类型(gydF4y2Ba
FSMgydF4y2Ba或gydF4y2Ba
安gydF4y2Ba)的最大数量(0或40)潜在的障碍,和试验的数量/健身评价(1或2)块健身和迭代图所示gydF4y2Ba
5gydF4y2Ba(这个图展示了两个实验的健身价值不包含障碍)。在第一个实验中,还有零障碍,因此环境永远是相同的。在以后的实验中,每一个健身评价包括两个试验与随机生成的障碍。如图,在所有复制实验Adabot达到四路点在大约10秒,这对应于一个健身值为9.7。人口迅速收敛最终值,可能是因为这个实验被播种hand-designed的已知参数实现好的结果(见表gydF4y2Ba
2gydF4y2Ba)。进化的结果,然而,迅速超越hand-chosen值。这个实验是一个方便的其他人可以比较的基线。gydF4y2Ba
情节的两个实验中发现的最大的健身没有障碍。阴影区域表示置信区间的一个标准差的意思是20复制的每个实验。最大程度的健身是10,和健身价值超过2表明Adabot能达到至少一个路点。gydF4y2Ba
第二个实验中,表示gydF4y2Ba
ANN-0-1gydF4y2Ba。也达到健身值为9.7,这表明一个安能有效执行的任务导航机器人的序列点。对于这个实验,17个总参数进化:表中列出的四个物理特性gydF4y2Ba
1gydF4y2Ba和13安参数在前一节中讨论。尽管这些实验达到相同的最终的健身价值,图的检查gydF4y2Ba
5gydF4y2Ba表明,ANN结果需要更长的时间evolve-roughly 120次迭代相比,不到10 FSM的迭代。这可以解释为缺乏种子控制器和事实,不像一个FSM,安必须从头学习整个解决方案。gydF4y2Ba
图gydF4y2Ba
6gydF4y2Ba描绘的轨迹表现最好的控制器从这两个实验。虽然这些轨迹类似,有一个关键的区别:安积极控制只有一个轮子。FSMs,另一方面,可以就地顺时针和反时针旋转,这就是为什么有更清晰的在左边的情节。gydF4y2Ba
最好的进化轨迹个人第一两个实验:FSM-0-1 ANN-0-1。没有障碍的礼物,这些轨迹。gydF4y2Ba
图gydF4y2Ba
7gydF4y2Ba展示了最好的FSM和安的车轮速度控制器。进化安永远设置右轮的最大速度。安往前移动,将它的左车轮设置为相同的值,并将通过左侧车轮旋转相反的方向。有效地,安只能左转,然而,这不是一个问题相对简单的任务。gydF4y2Ba
左、右车轮速度和支柱扩展数量最好的发展解决方案gydF4y2Ba
FSM-0-1gydF4y2Ba(一)和gydF4y2Ba
ANN-0-1gydF4y2Ba(b)。左纵轴显示值轮速度(固体红线和dash-dot蓝线),和正确的纵轴显示了轮支撑的规模扩展数量(橙色虚线)。gydF4y2Ba
图gydF4y2Ba
8gydF4y2Ba提供了一个比较健康的价值观和发展物理特性这两个实验。这图只显示结果相结合最终数量的复制实验。从这个图中,我们可以建立良好的物理特性是什么Adabot不面临任何障碍。具体地说,gydF4y2Ba
轴距gydF4y2Ba和gydF4y2Ba
TrackWidthgydF4y2Ba应该是8.5厘米和11.5厘米,分别gydF4y2Ba
WheelRadiusgydF4y2Ba应该是3厘米,gydF4y2Ba
StrutCountgydF4y2Ba并不重要因为struts不延长。gydF4y2Ba
分布为进化的健身价值和物理特征组合的最终数量gydF4y2Ba
FSM-0-1gydF4y2Ba(左)和gydF4y2Ba
ANN-0-1gydF4y2Ba(右侧)实验。y轴的极限参数限制允许在进化过程中。gydF4y2Ba
最后,图gydF4y2Ba
9gydF4y2Ba情节所有进化FSM的分布参数。值得注意的是,没有障碍,没有进化FSMs或人工神经网络由大量扩展struts。这个结果并不像任何意想不到的扩展将导致速度降低由于线速度前面所提到的,扩展struts不需要当不存在障碍。也感兴趣的FSM对称进化而来的。具体来说,阈值和速度进化的gydF4y2Ba
左gydF4y2Ba和gydF4y2Ba
正确的gydF4y2Ba状态是近乎完美的镜像。gydF4y2Ba
所有进化FSM参数分布gydF4y2Ba
FSM-0-1gydF4y2Ba实验。图中描述的这些参数gydF4y2Ba
4(一)gydF4y2Ba和表gydF4y2Ba
2gydF4y2Ba。gydF4y2Ba
4.3。进化与障碍gydF4y2Ba
最后两个被称为进化实验gydF4y2Ba
FSM-40-2gydF4y2Ba和gydF4y2Ba
ANN-40-2gydF4y2Ba。这些实验不同于前两次在两个方面。首先,每个健身价值计算的平均两个试验(其中每个试验持续最多30秒),其次,每个健身试验发生在31随机生成的环境障碍。利用多个试验期间的健康评估改善进化结果的鲁棒性gydF4y2Ba
34gydF4y2Ba]。这些实验显示在图的健身情节gydF4y2Ba
10gydF4y2Ba。值得注意的是,人工神经网络进化与障碍大大减少最大的健身。一些个人达到健身9以上,然而,我们发现这是只有当随机生成的环境不会造成很多困难。视频(和交互式动画)高健身人士可以在这里找到:gydF4y2Ba
FSM-40-2gydF4y2Ba:gydF4y2Ba
https://youtu.be/VXnrwwpE598gydF4y2Ba(gydF4y2Ba
https://goo.gl/NtoVYegydF4y2Ba),gydF4y2Ba
ANN-40-2gydF4y2Ba:gydF4y2Ba
https://youtu.be/q8PFqQps5e4gydF4y2Ba(gydF4y2Ba
https://goo.gl/2xjh6XgydF4y2Ba)。gydF4y2Ba
情节等最大的两个实验中发现的健康障碍。阴影区域表示置信区间的一个标准差的意思是20复制的每个实验。最大程度的健身是10,和健身价值超过2表明Adabot能达到至少一个路点。gydF4y2Ba
类似于图gydF4y2Ba
8gydF4y2Ba,图gydF4y2Ba
11gydF4y2Ba展示了进化的物理分布特征。这些分布有更大的传播由于随机生成环境。发现在这些值分布表明,障碍物的存在没有剧烈的影响物理特征的进化。首先这是意想不到的,然而,分析这些值(和可视化结果行为)揭示了一些基本原则:(1)打滑驾驶机器人是很重要的gydF4y2Ba
轴距gydF4y2Ba小于gydF4y2Ba
TrackWidthgydF4y2Ba(这将减少gydF4y2Ba
轮滑gydF4y2Ba和提高可控性),(2)最大化速度gydF4y2Ba
WheelRadiusgydF4y2Ba应该最大化(因为我们正在轮角速率更大的轮将导致更高的速度),和(3)只要struts的数量大于4的系统将能够浏览生成的环境。第一和第二原则比赛结果我们看到的物理原型,我们打算调查第三原则在不久的将来。gydF4y2Ba
分布为进化的健身价值和物理特征组合的最终数量gydF4y2Ba
FSM-40-2gydF4y2Ba(左)和gydF4y2Ba
ANN-40-2gydF4y2Ba(右侧)实验。y轴的极限参数限制允许在进化过程中。gydF4y2Ba
在两组之间的物理特性是相似的实验中,控制策略已经被调整到处理的障碍。图gydF4y2Ba
12gydF4y2Ba显示了两种解决方案的控制模式随机选择表现最好的个人的gydF4y2Ba
FSM-40-2gydF4y2Ba和gydF4y2Ba
ANN-40-2gydF4y2Ba实验。注意,因为环境是随机生成的,即使进化安不到四路点测试,但这并不意味着它没有这样做在健康评估。故事情节在图的两个最显著的特征gydF4y2Ba
12gydF4y2Ba进化人工神经系统控制器的操作速度降低,模拟车轮的障碍正在扩展struts控制器。进化FSM的轮扩展struts是当达到第一个障碍时,他们仍然大约一半延长的时间评估。安控制器使用了一个稍微不同的策略。车轮struts初完全扩展模拟和依然如此。这意味着作出的最高速度必须减少安全(见部分gydF4y2Ba
3gydF4y2Ba)。gydF4y2Ba
左和右轮为最好的进化速度和支柱扩展FSM安(a)和(b)在一个随机生成的环境,包括障碍。类似于图gydF4y2Ba
7gydF4y2Ba,左边和右边垂直轴显示尺度车轮速度和支柱扩展数量,分别。gydF4y2Ba
研究进化的FSM价值观,我们看到几乎相同的值被发现除了对所有参数gydF4y2Ba
bgydF4y2Ba
egydF4y2Ba
xgydF4y2Ba
tgydF4y2Ba
(一组分布类似于图gydF4y2Ba
9gydF4y2Ba为了节省空间,省略了)。在实验中没有障碍,gydF4y2Ba
bgydF4y2Ba
egydF4y2Ba
xgydF4y2Ba
tgydF4y2Ba
聚合为零;然而,对于这个实验gydF4y2Ba
bgydF4y2Ba
egydF4y2Ba
xgydF4y2Ba
tgydF4y2Ba
聚集到0.45。更高的价值gydF4y2Ba
bgydF4y2Ba
egydF4y2Ba
xgydF4y2Ba
tgydF4y2Ba
结果在struts总是被扩展(即使没有遇到障碍)。因此,这些行为更慢,因为struts需要攀爬的障碍。gydF4y2Ba
直接检查进化神经网络的初始权值只提供了有限的观点产生的行为。同样,比较每个输入的影响在每个输出隔离掩盖了由此产生的行为。例如,一些输出值只活跃的一些组合多个输入值时。因此,在图gydF4y2Ba
13gydF4y2Ba我们提供所有成对的输出输入关系的速度离开车轮热图的形式。这些热点图使用一个参数生成扫描在所有可能的输入组合。每个方块都代表给定的输出值x和y轴上的两个输入值平均值为剩余的所有可能值输入。的情况下也是如此gydF4y2Ba
ANN-0-1gydF4y2Ba实验中,剩下导航是由驱动轮速度不同,所以我们没有提供热图轮支撑和速度输出。检查图显示,左侧车轮的速度与两个积极的线性关系gydF4y2Ba
ωgydF4y2Ba
egydF4y2Ba
和gydF4y2Ba
αgydF4y2Ba
tgydF4y2Ba
一个gydF4y2Ba
rgydF4y2Ba
ggydF4y2Ba
egydF4y2Ba
tgydF4y2Ba
这gydF4y2Ba
αgydF4y2Ba
tgydF4y2Ba
一个gydF4y2Ba
rgydF4y2Ba
ggydF4y2Ba
egydF4y2Ba
tgydF4y2Ba
对控制的影响最大(因为它是用来把机器人对目标)。gydF4y2Ba
热图显示输入和输出之间的关系的左车轮最佳安进化而来。浅色表示轮子在其最大的远期利率,和一个黑暗的颜色表明它是在其最大的逆向速率。所有输入和输出值在0和1之间。输出区域只显示左侧车轮只有安输出,表现出各种不同的值。gydF4y2Ba
在这两个实验包括障碍,进化控制器扩展struts并没有完全收回。然而,有一个明显的优势缩回struts:机器人最大允许速度更高。因此,它可能是一个问题用差动驱动模型来计算错误。我们已经确定了两个简单的模型的误差来源:(1)不考虑当struts延长轮有一个更大的有效半径,和(2)模型没有考虑噪声打滑操舵和扩展struts的性质。gydF4y2Ba
为我们最后的这两个控制模型之间的比较,我们表现最好了5个人从每个复制实验和评估他们三个新环境。新环境要求移动机器人驱动四次进一步处理障碍的两倍。仿真时间也增加了从30年代到90年代。从这些评价结果如图所示gydF4y2Ba
14gydF4y2Ba。如图,FSM控制器仍然能够达到平均两路点,而安连一个控制器经常未能达到。gydF4y2Ba
最好的进化控制器从每个复制在新的环境评估。FSM控制器仍然能够达到一些路点,但大多数安控制器连一个未能达到。gydF4y2Ba
总之,关于我们发现Adabot的优化系统gydF4y2Ba
相似的物理特性最优环境中有或没有障碍。gydF4y2Ba
左右车轮的速度应该有一个线性关系gydF4y2Ba
αgydF4y2Ba
tgydF4y2Ba
一个gydF4y2Ba
rgydF4y2Ba
ggydF4y2Ba
egydF4y2Ba
tgydF4y2Ba
(而不是离散关系与当前FSM一样)。这将使机器人gydF4y2Ba
方向的转变gydF4y2Ba向目标。gydF4y2Ba
可以通过控制解决的任务只有一个轮子,然而,这可能不是一个可取的特点。在未来的工作中,我们计划添加一个进化压力的进化人工神经网络在两个方向上,例如,通过创建环境和需要左和右转的路点。gydF4y2Ba
控制杆将需要一个更复杂的机器人动力学模型。一旦扩展struts,很难辨别当他们应该收回。在未来的工作中,我们将调查的方法和测量参数识别和建立检测流动性差。gydF4y2Ba
考虑到这些观察,我们开发了一个混合两个控制器。控制器是在gydF4y2Ba
左gydF4y2Ba当gydF4y2Ba
αgydF4y2Ba
tgydF4y2Ba
一个gydF4y2Ba
rgydF4y2Ba
ggydF4y2Ba
egydF4y2Ba
tgydF4y2Ba
大于零,在吗gydF4y2Ba
正确的gydF4y2Ba否则。这些状态方程如下:gydF4y2Ba
(8)gydF4y2Ba
αgydF4y2Ba
年代gydF4y2Ba
cgydF4y2Ba
一个gydF4y2Ba
lgydF4y2Ba
egydF4y2Ba
=gydF4y2Ba
2gydF4y2Ba
·gydF4y2Ba
1gydF4y2Ba
- - - - - -gydF4y2Ba
αgydF4y2Ba
tgydF4y2Ba
一个gydF4y2Ba
rgydF4y2Ba
ggydF4y2Ba
egydF4y2Ba
tgydF4y2Ba
πgydF4y2Ba
- - - - - -gydF4y2Ba
1gydF4y2Ba
(9)gydF4y2Ba
lgydF4y2Ba
egydF4y2Ba
fgydF4y2Ba
tgydF4y2Ba
lgydF4y2Ba
egydF4y2Ba
fgydF4y2Ba
tgydF4y2Ba
=gydF4y2Ba
- - - - - -gydF4y2Ba
米gydF4y2Ba
一个gydF4y2Ba
XgydF4y2Ba
RgydF4y2Ba
一个gydF4y2Ba
DgydF4y2Ba
·gydF4y2Ba
αgydF4y2Ba
年代gydF4y2Ba
cgydF4y2Ba
一个gydF4y2Ba
lgydF4y2Ba
egydF4y2Ba
(10)gydF4y2Ba
lgydF4y2Ba
egydF4y2Ba
fgydF4y2Ba
tgydF4y2Ba
rgydF4y2Ba
我gydF4y2Ba
ggydF4y2Ba
hgydF4y2Ba
tgydF4y2Ba
=gydF4y2Ba
米gydF4y2Ba
一个gydF4y2Ba
XgydF4y2Ba
RgydF4y2Ba
一个gydF4y2Ba
DgydF4y2Ba
(11)gydF4y2Ba
RgydF4y2Ba
我gydF4y2Ba
ggydF4y2Ba
hgydF4y2Ba
tgydF4y2Ba
lgydF4y2Ba
egydF4y2Ba
fgydF4y2Ba
tgydF4y2Ba
=gydF4y2Ba
米gydF4y2Ba
一个gydF4y2Ba
XgydF4y2Ba
RgydF4y2Ba
一个gydF4y2Ba
DgydF4y2Ba
(12)gydF4y2Ba
RgydF4y2Ba
我gydF4y2Ba
ggydF4y2Ba
hgydF4y2Ba
tgydF4y2Ba
rgydF4y2Ba
我gydF4y2Ba
ggydF4y2Ba
hgydF4y2Ba
tgydF4y2Ba
=gydF4y2Ba
米gydF4y2Ba
一个gydF4y2Ba
XgydF4y2Ba
RgydF4y2Ba
一个gydF4y2Ba
DgydF4y2Ba
·gydF4y2Ba
αgydF4y2Ba
年代gydF4y2Ba
cgydF4y2Ba
一个gydF4y2Ba
lgydF4y2Ba
egydF4y2Ba
在哪里gydF4y2Ba
αgydF4y2Ba
年代gydF4y2Ba
cgydF4y2Ba
一个gydF4y2Ba
lgydF4y2Ba
egydF4y2Ba
是gydF4y2Ba
αgydF4y2Ba
tgydF4y2Ba
一个gydF4y2Ba
rgydF4y2Ba
ggydF4y2Ba
egydF4y2Ba
tgydF4y2Ba
1和1之间的比例。这个简单的混合控制器能够访问所有路径点在9.9秒,这是十分之一秒的速度比上面的进化控制器报告。控制器也适用在障碍面前当struts延长10%。总的来说,这个混合控制器提供了一个平滑运动和良好的性能。对于未来的工作,我们想发展这个混合控制器以及一种更为复杂的方法处理扩展点所支撑gydF4y2Ba
(gydF4y2Ba
4gydF4y2Ba
)gydF4y2Ba
以上。gydF4y2Ba
5。结论gydF4y2Ba
作出正变得越来越普遍。同样地,他们的预想环境正变得越来越动态多变。我们已经作出,这样就能更好地处理不同大小的障碍。具体来说,我们比较和分析FSM和安控制器有或没有障碍环境中同时发展我们作出的物理特征。在比较这两种技术,我们能够找到设计原则,结合两者的优点。具体来说,我们发现,两种策略的混合似乎能够保持这两种方法的优势。例如,FSM为本研究设计的一个优势是,它是在两个方向,但是没有足够的进化压力这一行为进化的人工神经网络。另一方面,人工神经网络进化更连续的自然转动。而不是把,他们倾向于gydF4y2Ba
方向的转变gydF4y2Ba向目标。最后,hand-designed控制器结合了这两种策略,但它可能没有明显的设计这样一个控制器没有首先进化FSMs和ann。gydF4y2Ba
尽管方向控制器是简单的优化,相关的复杂动力学爬障碍使它更难设计一个控制器扩展Adabot的struts。具体来说,差动驱动模型用来预测机器人线性和角速度不考虑障碍,车轮滑动或轮struts的延伸。我们未来的工作将集中在优化混合动力控制器和调查不同的策略来扩展和缩回struts,这样机器人能够更有效地获得轮式和legged-wheel运动的好处。gydF4y2Ba
改善控制一种可能性是使用递归神经网络(RNN)控制。这样做可能提供了一种方式,可以让机器人可以感觉它已经从一种类型的地形转换到另一个。发展一个RNN,然而,需要更加谨慎选择的进化压力,它可能需要一个更在任务难度逐渐增加。技术如Lexicase选择(gydF4y2Ba
35gydF4y2Ba)可以用来发展RNNs工作在许多类型的地形。gydF4y2Ba