文摘

人类司机的行为,这是非常困难的模式,是一个非常复杂的随机系统。描述一个高精度司机行为模型在不同道路几何图形,司机的行为模型的提出了一种新的算法基于鲸鱼优化algorithm-restricted玻耳兹曼机(WOA-RBM)方法。该方法建立了目标优化函数首先,其中包含训练元深度学习网络基于真正的驾驶行为数据。第二,最优的训练参数限制玻耳兹曼机可以通过遏制鲸鱼优化算法。最后,训练有素的模型可以有效地用于表示人类司机的操作。MATLAB仿真结果表明,该驱动程序模型可以达到90%的精度。

1。介绍

驱动程序模型可以应用于(1)车辆动力学(1]包括车辆组件设计、车辆动力学分析、整体车辆稳定性分析、机载控制和设计;(2)智能交通系统(ITS) (2,3)包括交通流的仿真基于驾驶员行为的控制理论模型和建模司机的冒险行为;(3)无人驾驶车辆系统(4];和(4)交通能源消耗系统5]。交通能源消耗系统不同于车辆动力学仿真。交通能源消耗系统将道路的影响,所以我们的研究侧重于道路等级如何影响对司机的行为特征。驾驶行为,包括加速行为,减速行为,和统一的行为,对行车安全的影响(6,7)、车辆燃油消耗(8- - - - - -10),和空气污染11]。设计一个汽车的驱动周期需要调查和收集的实际驾驶数据,分析实验数据,并建立汽车驾驶条件使用相关的数学理论方法。本文基于收集的车辆速度的距离,我们也考虑道路等级如何影响车速的操作条件。由此产生的车辆的操作条件可用于确定车辆的燃料消耗和技术发展以及评价的新模型。司机的行为是非常重要的建立一个精确的模型。的主要因素影响驾驶行为模型的准确性(包括道路几何和天气条件12,13]。由于司机的行为是一个非常复杂的随机系统(14- - - - - -17),设计驱动程序行为建模是一个非常具有挑战性的任务。

目前,司机的行为建模技术研究的主要成果如下。Cai et al。18)开发了一种新概念的驾驶指纹地图代表驾驶特性。Miyajima和武田19)提出了一个司机的行为建模方法通过使用行车驾驶数据。该方法通过统计机器学习技术,实现如隐马尔可夫模型和深入学习。Angkititrakul et al。20.)提出了一种随机司机行为模型基于高斯混合模型的框架。这个方法允许改编计划提高模型能力更好地表示特定的驾驶感兴趣的特点。施等。21]提出评估驾驶风格规范基于个性化的司机驾驶行为建模。攻击性指数提出了定量评价驾驶风格在这个方法中,可以应用于检测异常驾驶行为。山田和高桥22)提出了一个司机的行为建模方法在不同环境条件下基于真实流量数据。在这种方法中,行驶速度被认为是一个函数的几个因素,如整体旅行时间表,速度和路面条件。谷口et al。23]提出了一种无监督学习方法,它是建立在原双清晰度分析器模型的基础。这种方法预测可能的场景分段和驾驶行为的建模的驾驶行为时间序列数据。奥田硕et al。24)提出了一个概率加权自回归外生模型中多个自回归外生模型是由概率权重函数。这个模型可以表示实际的驾驶行为。有丰富的关于这一主题的出版物使用不同的优化方法,例如,瞬时优化算法(25],狼群算法[26)和遗传算法(27,28]。

然而,方法(19,20.是非常复杂和强烈依赖于历史数据。施等。21),提出定量评价驾驶风格规范基于个性化的司机驾驶行为建模。结果表明,驾驶行为建模的预测精度会受到复杂环境的影响。方法的建立22- - - - - -24,29日)需要大量的实际驾驶数据测量数据,也强烈地依赖于历史数据。

要解决这些问题,本文提出了一种新的基于WOA-RBM司机行为模型的方法。这种方法建立了目标函数,其中包含的训练过程遏制司机的行为基于真实数据。然后,最好的训练参数通过WOA得到遏制。最后,遏制训练后根据最好的训练参数可以用来构建司机行为模型。

本文组织如下。部分2描述了驱动数据收集。部分3提出了基于WOA-RBM驾驶行为建模的过程。部分4显示了实验结果,证明本文提出的方法可以实现更好的性能。结论部分5

2。驱动数据收集

在本节中,驾驶数据来自Manteca附近沿着120号公路的测量数据,加州,美国。为了建立一个高度精确的驾驶行为模型中,超过2000种不同的司机的驾驶行为数据收集每个路线。Manteca的收集测量数据在6月17日7月28日(六周),201830.]。车辆速度测量确定9点在图1。从地图上(图1),该高速公路是一个大约直路。建模时司机,只有道路等级的影响司机的速度是,所以道路的曲率不显示。在未来的研究中,我们将考虑道路曲率驱动模型。路年级很小,但它仍然有很大影响车辆的能源消耗。减少的能量来自两个原因。首先,如果车辆匀速或加速,减少能量消耗的发电厂(发动机和/或电机)驱动车辆下坡比平坦的路上因为重力积极的工作有助于克服负功的空气动力阻力和轮胎滚动阻力。汽车的部分势能转化为动能。第二,如果一辆车减慢在平坦的道路或下坡,降低动能由制动以热能的形式浪费。另一方面,如果车辆在一场艰苦的减慢,减少的一部分动能势能转化为车辆的制动动能和更少的浪费。收获的势能后可以转换为动能在走下坡路了。 In summary, road slope change turns the vehicle’s potential energy into an energy buffer to store the kinetic energy. The data are collected in 5-minute interval between 00:00 and 23:55 every day at each measurement point. Vehicle speeds at positions other than the 9 points are estimated by linear interpolation. The studied route stretches along 6.1 km of highway driving. The altitude varies from approximately 9 to 17 m. And the origin altitude is approximately 13 m while the terminal altitude is approximately 17 m. The road is sampled by 305 even steps with the step length m。第一周的记录速度轨迹和道路的高度数据所示23。司机通常增加速度4和6公里之间,因为这段路设置限速。

4显示道路的坡度信息环境。当斜率大于0时,路是一个艰苦的路;当斜率小于0时,这条路是一个下坡道路;斜率等于0时,道路是平坦的道路。

驱动数据如表所示1

数据的大小 ,每一行中的数据代表2004个不同的司机的驾驶行为在同一路段,和每列中的数据显示每个司机的驾驶行为在不同的采样点。

3所示。司机基于WOA-RBM行为模型

本文提出了一种基于WOA-RBM新的司机行为模型,模仿人类驾驶行为在现实世界的驾驶。这种新方法设计基于理论的遏制和WOA。

3.1。深入学习网络基于遏制

深入学习网络基于元能解决多层网络训练的问题,也容易实现(31日,32]。深度学习神经网络基于元结构如图5

有两个遏制和一个反向传播(BP)网络在此结构中,有一个隐藏层和一层可见每一元,这两个层之间的连接通过一个双向连接,如图6

在参考文献[31日,32),遏制的方程可以定义如下: 在哪里 之间的能量函数输入吗 向量和隐层输出向量 , 是一个连接权重矩阵, 是可见的层, 是隐藏层, 可见节点的偏见吗 , 隐藏节点的偏见吗

每个可见的概率 和隐藏层 可以被定义为

重量的对数梯度(2)可以计算 在哪里 是数据和的平均值 的平均值模型。因此,遏制的学习规则可以被计算 在哪里 是遏制的学习速率。

同样,索引的参数方程(1)可以计算如下:

从上面的分析,指出影响疟疾的参数训练性能包括初始值 ,隐层的数量 ,和数量的可见层 因此,它是重要的,选择合适的参数。

根据上述原则,我们假设遏制的训练过程表示如下: 在哪里 代表了训练误差。训练误差越小,越接近驾驶行为模型类似于实际的驾驶行为。

3.2。计算最优遏制训练参数

显然,最佳遏制训练参数的计算是一个np难问题。很难直接计算全局最优值。要解决这个问题,本文提出了鲸鱼优化算法(WOA) [33- - - - - -35]。WOA的主要步骤如下:步骤1。步行和觅食阶段:座头鲸可以找到食物的位置,和座头鲸的行为被定义为 在哪里 是一个系数向量, 鲸鱼和食物之间的距离, 是随机位置, 当前位置。下一刻的位置可以被定义为 向量 在方程(7)和(8)可以表示为 在哪里 是一个随机向量的价值所在的范围 是价值减少线性2 - 0。在这篇文章中,鲸鱼人口 提出了为 步骤2。包围和收缩阶段:座头鲸发现目标食物时,其他鲸将座头鲸的位置和周围的食物。这个阶段的方程可以给出如下: 在哪里 随机向量的位置,选择当前的鲸鱼数量。步骤3。螺旋捕食阶段:所有的鲸鱼将螺旋方向的最优位置座头鲸,鲸鱼会产生很多泡沫在捕食的食物;这一阶段的方程 在哪里 鲸鱼之间的距离和最优的解决方案, 是一个对数螺线的形状, 是一个随机号码的

最后,我们可以定义一个随机值 从螺旋捕食者区分contraction-bounding阶段。方程如下:

总之,WOA的流程图如图7

3.3。司机基于WOA-RBM行为模型

在完成优化过程中,我们获得最优参数:

随后,优化元模型可以表示为

优化的学习规则遏制可以计算的

根据上面的理论介绍,基于WOA-RBM司机行为模型图所示8。司机的行为模型和车辆模型构成闭环控制系统。司机行为模式实际上是一个被控对象的逆模型(车辆)。本文基于道路试验数据,学习控制方法用于构建一个司机通过机器学习模型。假设车辆速度在一个特定的位置 ,,司机按下油门踏板和刹车踏板的结果将影响车辆速度下一个位置 预期的下一个位置的速度 ,即。,the road’s speed limit. The collected vehicle speed data are used to train the optimal control parameters which are input into the driver behavior model. At the same time, the road grade, the actual speed of the vehicle, and the deviation between the actual speed and the expected speed are also input into the driver behavior model. Subsequently, the driver behavior model outputs acceleration or deceleration to control the driving of the vehicle.

8显示该司机的行为模型。在这个模型中,采样驱动程序数据用于训练WOA-RBM模型。最优参数 , , , , , WOA后得到了深入学习网络优化。WOA-RBM模型训练与最优训练参数后驾驶行为模型。最后,驾驶行为模型是用于车辆控制系统。在图8“公路信息”具体是指道路等级。 显示所需的速度和实际速度之间的差异。整个闭环控制系统输出车辆速度。加速或减速驱动操作。

4所示。实验

本文提出的驾驶行为模型是通过MATLAB 2017 b模拟和验证平台。提出了驾驶行为模型的性能和其他几个现有的驾驶模型也比较。电脑的配置如下:英特尔i - 9700 K与8核心处理器,CPU频率4 GHz, 16 G的内存大小,64位Windows 7专业版操作系统,和Nvidia GeForce GTX 980图形卡。

4.1。的参数

该司机的行为模型的初始参数如表所示2

在这个实验中,100个不同的道路部分收集,和大约2000名司机的驾驶数据收集每个路线。每个路由中的每个司机的驾驶行为数据收集在306点。

在这篇文章中,随机选择70组训练样本,其余30组选为测试样本。

4.2。WOA优化过程

WOA的优化过程如图9

9显示,当迭代的数量是9,WOA最小化作为遏制疟疾深度学习神经网络训练误差。遏制参数优化前后的比较如表所示3

仿真结果表明,随着迭代次数的增加,作为遏制疟疾深入学习网络训练误差逐渐减少。当迭代的数量是4,WOA最小化作为遏制疟疾深度学习神经网络训练误差,精度内 遏制参数优化前后的比较如表所示3。WOA进行优化后,遏制最佳的学习速率 是0.0039,视觉层次的数量 是2,隐藏层的数量 2,参数的最优值 分别是0.1748和0.6883,初始网络的最优初始平均重量 是0.088。根据这些参数,训练效果的元可以获得最优结果。

4.3。司机的行为模型的性能

路的信息已经显示在图4。实际的驾驶行为和司机的驾驶行为预测行为模型模拟图10

10显示六个司机的行为从WOA-RBM-based司机行为的输出模型符合实际的驾驶行为。因此,驾驶行为模型提出了预测精度高。

此外,标准估计误差(见)是用来评估该模型的驾驶行为,定义为 在哪里 是实际的驾驶行为数据,即。车辆的速度 司机在 采样点, 司机的行为预测的数据吗 司机在 采样点。

的仿真结果见图所示11

11表明,看到开车的数据和实际的数据是通过WOA-RBM模型。仿真结果表明,看到2000多不同的司机是低于1。因此,基于WOA-RBM司机行为模型可以正确地模拟司机的行为。

通过培训100驾驶操作的数据在不同的路线,高水平的预测精度。相应的测试结构如图12:

从仿真结果可以看出,100种不同的路线,驾驶行为预测算法提出了可以获得较低的。相比之下,仿真结果图13为不同的路线,看到的驾驶行为预测算法提出了总是接近0.2。它显示了算法的准确性高。

过度拟合方法训练误差非常小,而泛化误差很大。因为模型可能过于复杂,“记住”训练样本,但其泛化误差是非常高的。算法提出了这个话题,辍学机制是用来防止过度拟合。

4.4。比较

评估WOA-RBM-based司机行为模型的性能,提出了一些其他司机的行为模式进行比较和分析,包括个人流动的模型基于数据库驱动(36),随机驱动踏板行为模式16),司机使用行车驾驶行为建模数据19),和司机的行为建模使用基于遗传算法的隐马尔科夫模型(28]。四种方法的仿真结果如图14- - - - - -16

司机的驾驶行为预测行为模型如图14。仿真结果表明驱动提出WOA-RBM模型得到的数据更接近实际的驾驶数据。

看到不同的驾驶模型的输出值和真正的驾驶数据计算根据方程(17)。可以看出WOA-RBM-based驾驶模型的性能提出了比这更好的驾驶模型的提出(16,19,28,36]。这是由于这样的事实:WOA-RBM-based驾驶模型提出了可以获得的最佳训练参数遏制通过WOA深度学习,可以获得一个模型更符合实际的驾驶数据通过学习驾驶训练数据。

13表明,看到WOA-RBM模型是最低的,而模型(28是最大的。

13显示了看到的所有驱动程序模型。驱动数据被添加到验证不同训练数据的影响,见表4。比较五个驾驶模式,相应的看到值由方程计算(17)和WOA-RBM驾驶行为预测模型提出了预测最高性能比其他算法具有更好的性能和更少的训练样本。

5显示了不同道路的影响,包括光滑的路,少起伏的道路,和大起伏的道路。仿真结果表明,该WOA-RBM模型具有最佳性能在各种各样的道路。剩下几个算法有较大的预测误差。尤其是道路起伏大,差异越来越明显。

另一方面,正确的和最佳的驾驶行为也可以减少车辆的能源消耗。在我们之前的论文(29日),讨论的能量消耗模型。在本文中,使用相同的能耗评估方法。能量计算所需的机械能推动车辆。车辆的能源消耗可以从其纵向动力学估计,如图15。通过牛顿定律,我们有以下方程: 在哪里 机器的质量, 是车辆加速度, 车辆的速度, 是滚动摩擦, 空气动力阻力, 是力引起的公路边坡, 动力系统产生的牵引力, 重力加速度, 在辐射道路等级的角度, 滚动摩擦系数, 环境空气的密度, 是空气阻力系数, 是额叶区域的车辆。图16比较能源消耗的性能。

正确的和最佳的驾驶行为还可以减少车辆的能源消耗。图16表明该WOA-RBM-based司机行为模式有较低的能源消耗比其他四个模型。

操作机动车时,提供适当的驾驶操作是必不可少的,因为它将减少能源消耗。这意味着频繁的加速和制动是一个驾驶方法不当,会增加能耗。

5。结论

本文基于WOA-RBM司机行为的一种新的算法模型提出了深入学习网络。模型建立了目标函数,其中包含深刻的学习网络的训练。遏制疟疾后培训基于最优参数用来预测输出动作准确地通过道路信息。在未来,它极大的兴趣收集大量的数据从不同的道路和不同的司机开车。

数据可用性

所有的原始数据在这个研究是免费的。读者希望重复这个研究可以通过以下链接:http://pems.dot.ca.gov/

的利益冲突

作者宣称没有利益冲突。

确认

本研究支持的科研项目由陕西省教育部门(项目号20 jk0747)。