文摘
在高度自动驾驶,司机可以从事nondriving任务但有时不得不接管控制。我们认为,当前的收购质量措施,如最大纵向加速度,还不够,因为他们忽略的临界情况。本文提出了一种新颖的方法量化的司机如何执行一个automation-to-manual收购通过比较人类行为优化的行为作为轨迹规划计算使用。human-in-the-loop研究在高仿真度的6自由度驾驶模拟器进行25参与者。收购ego-lane车道改变避免道路施工需要,同时考虑到其他交通工具。每个参与者遇到六个不同的收购情况,用不同的时间预算(5 s、7 s或20 s)和交通密度水平(低或中等)。结果表明,司机表现出相当高的纵向和横向加速度比优化行为,尤其是在短时间内预算方案。在场景中交通密度、轨迹规划显示一个温和减速,让车辆在左边的车道通过;许多参与者,另一方面,没有减速车道前变化,导致危险的左车道上车辆紧急刹车。总之,我们的结果说明评估人类收购行为的价值相对于优化行为。 Using the trajectory planner, we showed that human drivers are unable to behave optimally in urgent scenarios and that, in some conditions, a medium deceleration, as opposed to a maximal or minimal deceleration, is optimal.
1。介绍
在过去的几十年中,改善传感器技术,人工智能,和控制系统已导致增加车辆自动化。自适应巡航控制系统(ACC)技术,介绍了在1990年代,有可能增加司机安慰通过自动化纵向控制任务(1- - - - - -4]。最近到来的援助系统能够进行横向控制导致情况选择分离提供的司机是他或她从车辆的控制回路5,6]。然而,在当前和将来的自动化水平(SAE水平2/3),人类仍有回退代理的角色,因为自动驾驶系统的局限性有关他们的操作设计域和不可预见的道路情况的处理7,8]。
它已被证明是不可能的循环可能导致退化的大局意识,精神欠载、自满,和精神过载如果自动化达到系统边界和操作员必须夺回控制权(例如,9])。自动车辆的司机是容易受到不利影响,但不得不接管控制在需要的时候,引发了大量的研究automation-to-driver收购。特别是,一个重要的话题涉及量化人类司机如何接管的自动驾驶系统。
提出了各种各样的收购质量措施的文献(见[10];审查)。Radlmayr et al。11)使用的最大纵向加速度作为收购质量措施,而西et al。12使用横向加速度和中心线偏差的最大值。在其他的研究中,使用最低收购质量量化时间碰撞(MTTC) [13- - - - - -16]。
已经阻碍了这些措施的解释的事实,不同的场景不同需求强加给司机。Zhang et al。17)调查了129收购的研究,发现时间预算和交通密度是最常用的独立变量。场景可以从nonurgent不同,没有立即需要接管一个空的路上(18- - - - - -20.),非常紧急,碰撞的时间预算是5 s或少或在多个车辆驱动附近(21- - - - - -23]。紧急场景通常会导致“贫困”分数收购质量度量,如低MTTC [24,25)和高加速度(26]。黄金等。27说,用较短的时间预算,司机反应是“质量差”(p . 1938)。这种解释黄金等人的问题是,在紧急情况下,高的车辆加速度可能是理想的或甚至是必要的,避免了一次事故,从而反映出“好”而不是“穷”驾驶行为。总之,场景的类型将对收购质量措施有很大的影响,但文献往往忽视这一事实的解释收购质量。收购质量措施可能无法说明的如果不是相比,最优参考行为。
本研究旨在评估使用小说场景特定方法的优点来定义收购质量。我们评估时间预算和交通密度的影响不仅是“传统的”收购分数(例如,最大加速度)还与获得的分数从轨迹规划。更具体地说,我们考虑到场景中临界通过比较分数场景特定的措施优化行为,获得通过大众汽车集团研发中心开发的轨迹规划,沃尔夫斯堡。
human-in-the-loop驾驶模拟器研究使用不同的驾驶场景。本研究的独立变量是时间预算和交通密度,为这两个变量已经被证明在先前的研究强烈影响收购质量使用传统质量度量(11,28,29日]。我们使用5、7,20年代时间预算。5 s的时间预算是至关重要的,一个7 s时间预算是一个安全的最低收购后从事辅助工作(27,30.,31日]。20年代的场景包括调查人类收购行为的情况几乎没有紧迫感和人类可以自由决定何时以及如何行动。
2。方法
2.1。参与者
31个保时捷公司员工招募参与这项研究。他们需要一个有效的驾驶执照,以及正常或corrected-to-normal愿景。总共6个参与者必须排除由于不完整的数据记录。因此,分析数据从25个参与者进行的,其中13是女性和12是男性。有11个9、3和1的参与者在21 - 30,31-40,每周,分别和51-60年龄类别。两个参与者表示有参加了一个关于之前自动驾驶模拟器的研究。这项研究是人类受试者研究伦理委员会的批准你代尔夫特,和所有参与者提供书面知情同意。
2.2。装置
昆虫驾驶模拟器在Weissach保时捷研究和开发工具,使用德国,(32- - - - - -34]。昆虫是配备了一个功能齐全的保时捷Macan的模型。车辆动力学软件是基于全电动保时捷Taycan。6自由度运动基础平台(eMove em6 - 640 - 1800)的致动器中风640毫米。动感平台的算法是根据古典惨败。形象化的视野是180度,通过投影仪显示在所有三方3840×2160像素,以及天花板。一面镜子没有身体上出席,但集成到模拟。可视化是60赫兹的频率刷新。模拟器在收购的一个场景如图1。在实验中,参与者戴Dikablis眼球追踪眼镜(35]。
2.3。道路环境
自动汽车驾驶模拟双车道高速公路130公里/小时。所有车辆的宽度,包括ego-vehicle,是1.78米。车道宽度是3.88米。在大约30分钟车程,六个收购场景发生。这些收购引发了道路施工在右车道上。道路施工是361米长。所有的收购发生在直线路段上的车辆。没有硬的肩膀在右边。
2.4。人机界面
自动化可以使用方向盘上的一个按钮被激活。激活后,消息显示在仪表板,表明司机被允许手离开方向盘。证实了激活的灰色方向盘图标(自动化)变绿(自动化活动(见图)2)。
(一)
(b)
(c)
参与者进行视听nondriving任务看喜剧电视连续剧的形式(参见[36])。视频会自动开始播放时的10.9英寸centre-display自动驾驶的功能被启用。
在每个收购场景中,参与者收到了单程听觉信号基音300赫兹和峰在342.5赫兹,432.5赫兹,666.7赫兹,866.7 Hz以及视觉警告在仪表板上。方向盘图标切换到红色的两只手拿着它,如图2。此外,centre-display变黑,说:“手动开车时有限的功能。”
2.5。独立变量
一个3×2试设计,随着时间的推移,预算(3)水平和交通密度水平(2)作为独立变量。六个收购场景发生每个参与者,由每个组合的时间预算和交通密度,如表所示1。
交通密度水平“低”和“媒介”,如在文献中定义为5和10车辆每公里,分别为(37]。对于中等交通密度场景,左车道超车的车辆,这是推动以恒定的速度140公里/小时,开车直接ego-vehicle背后的收购请求,即刻车道改变不安全。在低流量密度条件下,立即巷变化是可能的,由于没有附近的车辆安全的收购请求。
图3显示了场景布局的场景1。类似的场景数据2- - - - - -6提供的补充材料(数据吗S1- - - - - -S5)。
6个场景出现的顺序是抵消使用拉丁方法。收购各种之间的自动驾驶时间3至5.5分钟,来抵消预期。总行驶距离为60.4公里,与部分自动驾驶的人均50.1公里(23.1分钟)。
2.6。因变量
我们计算各种收购措施之前,在文献中已经使用(例如,19,38,39]),如表所示2。四个主观因变量也包括,基于Radlmayr et al。10]。每次收购后,参与者被要求评价该方案中,对临界规模级评级(非常noncritical-very至关重要),复杂性(非常uncomplicated-very复杂),不适(很舒服很舒服),主观时间预算(超过地太少)。请注意,这些都是翻译从德国;整个研究是在德国进行的语言。时间预算和交通密度的影响评估使用双向重复测量方差分析(方差分析)。
2.7。过程
参与者被安排成小时的时段。后欢迎参与者和感谢他或她参与,参与者被要求读一个信息形式。这种形式高度自动驾驶系统的功能解释说,仪表盘上的图标,如何激活自动驾驶系统,nondriving任务的可用性(电视剧),收购请求,必须完成的四个问题在平板电脑上。参与者被告知自动化无法应对任何情况下,应优先考虑安全,遵守交通规则。接下来,参与者签署了同意书,完成了人口统计问卷,要求在驾驶模拟器坐下。
当模拟器还是静止的,实验者在乘客座位解释了如何激活自动驾驶功能和主观评级应该如何在平板电脑上完成。接下来,眼球追踪眼镜被移交给参与者和校准使用DLab行为研究软件(版本3.5)。一个安全简报。参与者系好安全带,被告知,打开车门将立即停止动态模拟器,并被告知,无线电通信在必要时总是可能的。5分钟之后试驾期间参与者习惯手动控制,自动化,显示图标,执行nondriving任务,并完成问卷的平板电脑。试驾后,助理退出模拟器。一旦移动基础平台被激活,主要研究开始。
开始的时候开车,开车时参与者进行自动驾驶功能在正确的车道上。没有速度要求激活,尽管它是建议开车时激活自动驾驶功能大约130公里/小时,这是自动驾驶系统的目标速度。自动驾驶功能将加速或减速的目标速度130公里/小时。如果自动驾驶功能,视频自动centre-display开始玩。参与者使用眼球追踪相机记录的目光。以防目光经常针对道路而不是centre-display,用对讲机提醒参与者信任自动驾驶系统和参加的视频。
一旦自动驾驶功能促使收购请求,司机被要求重新手动控制,而考虑到任何潜在的左车道超车的车辆。通过道路施工后,参与者回到正确的车道和提醒学生自动驾驶系统。汽车自动驾驶的时候,参与者完成了主观评级之前的收购方案。从模拟器控制房间,这是检查表单是否正确。如果不是这样,参与者被要求通过对讲机重新提交评级形式。
一旦完成评级,参与者继续看视频显示在centre-screen。此订单是重复的事件(表6倍1)。第六接管场景后,对讲机用于要求参与者带来汽车陷入停顿。移动基础平台是降低,参与者退出模拟器。postdrive问卷填写关于模拟器逼真度。在这个问卷,参与者也给开放的反馈关于这项研究的机会。参与者提供一些喝的和甜的。一旦所有参与者关于这项研究的潜在问题被回答,参与者再一次感谢。
2.8。轨迹规划
轨迹规划是用来为六个场景生成参考轨迹。的有预见性的时间轨迹规划是改变与每个场景的时间预算。这创建了一个相同的紧迫性驾驶模拟器研究的参与者。
轨迹规划依赖当地的运动规划和使用一个线性奖励函数最大化路线进展,舒适和安全。更具体地说,轨迹规划最大化进展到目标(即。,the end of the roadworks) and distance to objects, while minimizing acceleration, jerk, wheel angle, and wheel angle changes.
前进的轨迹规划执行一个详尽的搜索操作。因此,每个周期的模型预测控制(MPC),该算法取得了大量的推动政策,隐式地包含多个行为,例如,车道后,车道变化,迂回,紧急停止。最后选择驾驶策略奖励最高价值,而令人满意的基于模型的约束。
奖励函数影响的驾驶风格。奖励函数中使用的权重是由大众集团研究决定使用一个类似于回溯过程,手动驱动车辆,并为每个时间步和相应的国家在世界上,“人类”的权重计算。更多信息轨迹规划提供了Rosbach et al。41]。
轨迹规划和human-in-the-loop模拟器使用了相同的文件描述仿真环境(openDRIVE扩展.XODR . xml,使用活力构建虚拟测试(VTD) 2.1软件(42),包括相同的模拟车辆。
轨迹规划认为一个简单的运动自行车模型。的车辆参数轨迹规划是那些2012 -模型的大众高尔夫。因为优化参考轨迹是车辆动力学的限制范围内,这种偏离车辆模型中使用驾驶模拟器(保时捷Taycan)被认为是本研究重要的目标。
3所示。结果
的场景2(时间预算= 5 s和交通密度=低),驾驶数据失踪两个参与者由于数据记录错误。图4为所有六个场景显示所有25个参与者的轨迹。此外,它显示了优化轨迹驱动的轨迹规划。
在场景1(时间预算= 5 s和交通密度=媒介),两个参与者与道路施工坠毁,和三个参与者过马路的界限。在场景2(时间预算= 5 s和交通密度=低),零与道路施工参与者坠毁,和三个参与者过马路的界限。没有崩溃或道路离职发生在7和20年代时间预算情况。
图5提供信息的速度模式在收购策略。在场景中1和3(时间预算= 5或7 s和交通密度=媒介),规划师快速减速让车辆在左边的车道通过启动车道改变。大多数参与者做了同样的事情,尽管有些晚。少量的参与者带来了他们的车辆完全停止的场景1- - - - - -3。图5进一步表明,少量的参与者中密度场景加速,大概是为了改变车道快速到来前的车辆在左边的车道。
3.1。最小时间碰撞(MTTC)
参与者的每个场景如图MTTC值6以及对应的值轨迹规划。MTTC在场景1和2中,往往是小于1,表明一个十分关键的交互(cf。43- - - - - -45])。在非关键场景(5和6),MTTC显示很大的个体差异。轨迹规划改变车道相对较晚,导致一个MTTC值低于MTTC大多数参与者的价值。根据双向重复测量方差分析,交通密度的影响和时间预算MTTC显著(表3)。标准差,意味着每个因变量和两两比较提供了补充材料(表S1- - - - - -S53)。
3.2。加速措施
结果如图四个加速度的措施7。参与者表现出类似水平的最大左向右横向加速度,对称模式,它的特点是一个正常的车道改变。轨迹规划在横向和纵向方向开车更加顺利,而参与者。然而,对于5和7年代时间预算场景中交通密度(场景1和3)、轨迹规划和参与者的过程相对出现相似。这种相似性可以用这一事实来解释轨迹规划减速让接近车辆在左边的车道,和大部分的参与者。场景5(时间预算= 20年代和交通密度=媒介),轨迹规划没有减速让左车道上车辆通过,有足够的时间等到左车道上车辆已经过去。一些人类司机,另一方面,也为左车道上车辆减速,或者他们加速(见图5),随后为主要车辆制动。
双向重复测量方差分析(表3)表明,交通密度的影响是显著减速和加速。时间预算的影响最为明显的横向加速度;也就是说,参与者将更多的时间预算时突然短。
3.3。车道改变时间
图8显示了参与者和车道改变时间的轨迹规划。在5和7年代场景中,参与者通常改变车道超过了轨迹规划。20年代的场景中,参与者平均车道变化的持续时间被类似于轨迹规划。交通密度巷变化持续时间的影响不显著,但时间预算的影响显著(表3)。
3.4。最小或最大分数不是最优:说明轨迹规划的价值
图9MTTC显示了参与者和他们的最大减速在场景3(时间预算= 7 s和交通密度=媒介)。可以看出参与者表现出较低的最大减速(可能通常被视为收购高质量)和早期巷变化(MTTC高值)最终在一个高度危险的处境,在左边的车道超车车辆不得不启动紧急停止。轨迹规划显示优化减速约4米/秒2,就足以让左边的车道的车辆通过。这些研究结果表明,较低的最大减速和高MTTC不良在这个场景中。
3.5。主观的评价
问卷调查结果如图10。一般来说,实验操作取得了预期的效果,与紧急情况(时间预算= 5 s)与介质流量密度被视为最关键的,不舒服,和复杂的。nonurgent场景(时间预算= 20 s)交通密度较低,另一方面,被认为是最重要,最舒服,最复杂的。交通密度的影响和时间预算是重要的所有四个问题(表3)。
3.6。司机的反应时间
结果表明,人类需要大约0.9年代出席,约2.5年代参加后视镜,和2 s抓住方向盘(图/联系11)。轨迹规划,另一方面,不容易受到人类信息处理这些延迟。表3显示时间预算的影响和交通密度eyes-on-road时间并不重要。这一发现是明智的,因为只有当司机在路上,他或她可以评估的时间预算和交通密度。有显著影响的时间预算eyes-in-side-mirror倍和hands-on-wheel倍;参与者需要更时间时间预算时更高。
4所示。讨论
在这项研究中,我们评估人类收购质量不同的时间预算和交通密度水平和比较结果的优化行为获得通过轨迹规划。措施表明,加速度轨迹规划开车非常顺利和人类参与者。参与者表现出特别大的横向加速度越时序要求严格的场景,这可能是因为参与者被即将到来的道路施工吓了一跳。轨迹规划“知道”收购请求的从那一刻开始,人类需要时间来评估形势,而事实表明的平均eyes-on-road时间约为0.9秒。高加速度的另一个原因是,参与者可能没有注意到这些高加速度由于固有的物理局限性motion-base模拟器(46,47]。几位与会者表示实验模拟器运动后感觉不现实。在20年代时间预算情况,另一方面,参与者的中间车道改变时间接近车道改变时间的优化轨迹。总之,结果表明,人类的收购策略之间的差异和轨迹规划是在关键时刻的场景。也就是说,人类似乎无法表现最佳时时间要求很高。
Petermeijer驾驶模拟器的研究等。19,36)表明,司机变得更快、更流利接管控制增加收购经验。Payre et al。48建议司机应该被训练如何操作他们的自动驾驶系统。因此,有人可能认为,比较是不合理的未经训练的司机与路径规划的结果。然而,指出,人类行为和优化行为之间的区别通常是非常大的(见,例如,图7)。不太可能更有经验/训练有素的司机会执行与轨迹规划的紧急情况。
20年代时间预算包括检查人类驾驶行为nonurgent收购场景在一个优化轨迹。参与者表现出较大的个体差异,这可以归因于个人喜好关于车道改变。这些发现符合一个荟萃分析Zhang et al。17]的结论是,参与者不尽快接管控制,但可能会推迟他们的操舵或制动响应根据他们的自由裁量权。加速度轨迹规划的措施和车道变化持续时间在20年代条件类似的时间关键型5和7秒时间预算情况。换句话说,轨迹规划倾向于相对较快地完成车道改变策略,而不是减少侧向加速度较大的时间预算。
图9说明了这一事实不应该依赖于一个单一的测量(减速)峰值作为索引的收购质量。在紧急情况中交通密度,轨迹规划慢慢减速,让车辆在左边的车道通过执行一个光滑的车道改变。这里,轨迹规划采用4 m / s的减速2,这是足以让左边的车道的车辆通过,同时保留高舒适和进步。人类参与者,另一方面,显示大的个体差异。一些参与者根本没有减速,立即巷的变化,因此在左边的车道的车辆不得不启动紧急制动;其他参与者发起紧急减速自己为了防止碰撞与道路施工。总之,结果表明,较低的减速和早期巷变化以避免碰撞与道路施工不可取,在这种情况下。可取的是与一个中间减速刹车,一种行为不确定使用传统收购措施,但被轨迹规划。
离线优化轨迹的计算。从理论上讲,这个计算可以进行实时轨迹规划在大众集团研究是专为实时应用作为一个自动驾驶系统不可分割的一部分。我们不主张产生的轨迹最优轨迹规划。相反,轨迹为一组特定的优化变量,如路线进展,加速度,物体接近。可以得到不同的结论如果选择不同重量的轨迹规划。例如,它可能分配一个低体重为进展加速和增加重量,导致算法驱动更激进的驾驶风格。
总之,本研究显示质量评估收购的好处相比,参考行为。人类大幅偏离优化加速度值如果情况紧急。换句话说,紧急情况是危险的,不仅因为即将发生碰撞的(物理因素)也因为人类有困难的情况下表现最佳的时间压力(psychobehavioural因素)。此外,我们表明收购措施不应孤立地使用。最大化(即司机安慰。,minimizing the deceleration) was found to be highly dangerous in scenarios of medium traffic density. The comparison with the trajectory planner showed that intermediate deceleration values are most desirable.
最近,提出了框架,结合成一个单一的收购质量各项指标得分。收购可控性评级(TOC)量化收购质量通过编码表,专家使用评分检验人类收购行为的视频(49]。同样,收购绩效评分(上衣)结合三个变量与车辆相关指导、心理过程和主观评价。这三个变量可以组合成一个单一的质量分数(10]。这些方法是传统方法的改进,但他们依靠主观的判断。目前的轨迹规划方法可以有助于更客观量化的收购质量。
数据可用性
原始数据和脚本在网上是可得到的https://doi.org/10.4121/uuid: 64 ff102c a2a7 - 4008 - 9 fb1 c7a957——088534。
的利益冲突
作者宣称没有利益冲突。
补充材料
辅料包含(1)场景2 - 6的道路布局,(2)轨迹规划值相关的因变量,因变量(3)统计数据,和(4)原始数据的各个参与者。(补充材料)