文摘

同意,它是连接车辆技术有广泛的影响交通管理系统。为了缓解城市拥堵,提高道路的能力,提出了一种多车道的时空轨迹优化方法(MSTTOM)达到全部潜能的连接车辆通过考虑车辆安全、通行能力、燃油效率,司机安慰。在这个MSTTOM,连接车辆的动态特性,车辆的状态向量,优化的目标函数,约束制定。方法求解轨迹优化问题是基于Pontryagin最大原则,强化学习(RL)。一个典型的场景与测量单向4-lane部分交叉,和收集到的数据在24小时内测试。结果证明,该方法可以通过增强优化交通流车辆燃油效率32%,减少污染物排放17%相比,先进的蓄洪水库原型应用程序(GPPA)计划。

1。介绍

城市道路网的通行能力限制的时间延迟,潜在的安全隐患和环境污染造成的交通堵塞。根据美国交通部2019年发布的统计数据,27%的高速公路在美国被屏蔽了在城市交通的高峰期,54%的车辆拥堵的状态(1]。十字路口,城市道路网络的重要节点,导致80%的这些城市交通拥挤2]。因此,缓解城市交通拥堵的路口作为优化对象是一个具有挑战性的工作。

时空轨迹优化的实现主要包括两个部分:(1)实现的动态速度控制多个车辆在纵向方向上;(2)实现的合作换道控制多个车辆在水平方向上。在智能交通系统(ITS)美国交通部发布的战略计划在2010年,基于时空轨迹的动态速度协调被表示为一个重要的公路网络交通流优化的方法(3]。Grumert和Tapani4)建立了一个可变速度限制算法:基于交通占用。结果表明:可以增加16%的交通流量。乔et al。5)更新:算法通过检测车辆在多个电台从道路安全的角度,指导解决延迟问题。随着合作的发展车辆基础设施系统(新的)和连接车辆(CVs),不连续动态限速的问题可以解决了连续动态速度控制(6]。考虑到随机的交通状况,朱镕基和Ukkusuri [7)提出了一种通过RL实现动态限速控制方法。在这种方法中,基于链接的动态网络负载模型成立于CVs的环境,可减少18%的总旅行时间。Aldana-Munoz et al。8)提出了一个方法,结合环境驾驶和速度指导优化连续线性时空轨迹。实验结果表明,线性时空轨迹优化稳定可以改变交通流的干扰。王等人。9)提出了一个速度指导模型基于模型预测控制(MPC)的时空轨迹可以提前了。魏et al。10)提出了一个合作优化方法multivehicle时空轨迹,建立了基于简化Newell线性车辆模型。考虑到不同的道路环境和天气状况,梅洛和Chiodi11)提出了一种时空轨迹的模糊逻辑控制模型,这就增加了决策过程的有效性为13%。梁等。12)提出了一个方法来优化常见的时空轨迹自动车辆和手动驾驶车辆。自主车辆的比例增加,平均延迟时间减少了25%,平均停留时间减少了47%。王等人。13,14CVs)设计了一种联合控制模型和交通信号,旨在优化车辆排,十字路口的信号时间提高交通效率。仿真结果表明,联合控制模型可以减少停车时间54%。Mirheli et al。15)提出了一种基于时空的分布式协作控制逻辑轨迹,这没信号灯可以应用到交叉路口。在这项研究中,车辆与这个逻辑应用程序方案可以通过信号交叉口最优轨迹没有碰撞。王等人。16)开发了一种合作与多个交叉阶段的时空轨迹优化方法。在这种方法中,基于动态负载的下界估计网络构建提高车辆动态网络的鲁棒性和稳定性。

城市道路或与单通道或双车道高速公路主要是在上述研究;然而,多车道的时空轨迹优化仍缺乏研究。在多车道车辆的主要挑战在于如何解决复杂的时空轨迹换道问题。此外,事故造成的换道行为使多个车道被占,使道路拥堵更加严重(17]。考虑换道的风险由vehicle-to-vehicle (V2V)通信延迟,Hongil和Jae-Il18)提出了一个面向边界框(OBB)方法减少通信延迟通过定义横向和纵向梯度控制器。李等人。19)提出了一种新的基于CVs换道模型来评估关键换道过程中车辆的距离。势场理论集成安全,车辆运动状态在不同的速度和加速度条件下动态地呈现。最后,换道路线可以确定通过时空轨迹的选择。大多数的研究提供思路和理论支持multivehicle合作基于时空换道轨迹。然而,由于大量的数据计算和系统复杂性高多车道的时空轨迹,常见的多车道路段交通效率问题尚未有效解决和改善通过多个单通道的优化方法。

解决上述问题,MSTTOM建立了连接车辆。空间时间生成轨迹,结合车辆当前状态信息和信号计时信息。此外,在驾驶过程中,RL的轨迹可以优化。此外,汽车可以改变车道和更新其通过合作换道轨迹策略设计这个模型。本研究的重大贡献,车辆可以通过十字路口在最佳时空轨迹,进一步解决当前多车道路段的拥堵问题。

本文的其余部分组织如下:典型的应用场景,并介绍了部分的结构方法2。MSTTOM节中描述的具体内容3,轨迹生成和优化。并给出了仿真实验结果通过相扑/ Python和分析部分4稳定的进展,油耗率、污染物排放,计算时间也选择评价指标。最后,部分5总结了纸。

2。典型应用场景连接车辆

2.1。应用场景

十字路口的上游部分,多车道的应用场景中,被vehicle-to-everything覆盖(V2X)无线通信,如图1。车辆的轨迹从上游到十字路口过程将基于MSTTOM动态计算。

2.2。系统结构

MSTTOM如图的流程图2。过程可以描述如下:交通信号和车辆驾驶信息收集首先由路边单元(RSU)和车载单元(酸),以便在当前路口目标车道和到达时间可以计算;其次,通过连接车辆的最优轨迹生成状态和约束,在当前交叉路口的通行能力可以通过合作换道在线优化策略;最后,每个连接车辆可以通过十字路口通过RL的优化结果与旅行时间最小。时空轨迹和澄清在图优化的状态3

3所示。多车道的时空轨迹优化方法(MSTTOM)

首先,本文中定义状态向量包含车辆驾驶的信息,如位置,速度,加速度,交通信号时间的信息。其次,制定车辆轨迹的成本函数和约束。最后,车辆的最优轨迹动态计算通过极大值原理和RL。

3.1。状态向量

在城市交叉路口的典型场景,我们定义的车辆进入路段C,在那里n代表了th巷路的部分从右边到左边(选为参考目标车辆)和nth车辆从下游到上游,分别。因此,我们定义车辆的状态向量C作为x(t): (在哪里x(t),y(t)是车辆的位置C在时间t, (t)是车辆的行驶速度C在时间t,v′(t)是车辆的横向速度C在时间t

输入车辆加速度的方法u(t),它可以表示如下: 在哪里u(t)是车辆的纵向加速度C在时间tu′(t)是目前车辆的横向加速度C在时间t

与此同时,车辆目标车道的信号计时信息 和交通流信息 (t)的相邻车道 被定义为 在哪里 车辆的目标阶段状态吗C, 其余时间的阶段吗 ,R红灯期间巷吗,G莱恩的绿灯时间吗, 代表左车道的交通流平均速度 和右车道1, 是左车道的交通流密度平均 和右车道 交通流平均速度 和平均交通流密度k(t)可以表示为 在哪里N车辆的总数, 莱恩的最大车辆数, 最小数量的车辆在车道吗,l是路段的长度。

被描述为系统状态方程

3.2。成本函数

为了确保车辆能够准确地跟随系统的轨迹设计,固定和可变成本的过程中从上游到下游被认为和制定,这可以表示为 在哪里 当车辆吗C离开路段, 当车辆吗C进入路段, 是过程的固定成本, 可变成本的过程。固定成本包括固定成本项目(如驾驶距离十字路口和预期速度)和路段的旅行时间。这个过程可以被描述为 在哪里 车辆的目标时间吗C开车的路段, 车辆的预期速度吗C在十字路口, 是目标车道的车辆,然后呢d车道宽度。 , , 的重量是路段的旅行时间,驾驶路段长度、预期的速度在十字路口,分别和目标车道的十字路口。 , , R+。

可变成本包括加速和减速的汽车驾驶在纵向和横向车道。它的功能可以表示为 在哪里 能量变化的权重是由纵向和横向加速度的车辆,感受。 , R+。 是联网的车辆的亥维赛纵向加速度的函数,可以用来单独纵向减速过程中的加速度引起的可变成本: 表示车辆通过路口的时候低密度条件下的交通流,也称为汽车的时候C离开的道路没有限制。时间由四部分组成:初始时间 ,时间 在加速状态,时间 在恒速状态,和时间 在减速状态,可以描述如下: 在哪里 , , 可以表示为 在哪里 的限速路段, 的速度限制在下游出口车道, 车辆的最大加速度吗C, 车辆的最大减速吗C

然而,城市道路部分不可能维持一个低密度的状态。因此,连接车辆通过当前路口临时排。候选人的时间 车辆C可以计算为 在哪里 是两个相邻车辆在车道之间的最小进展吗下游出口的部分。

为了提高十字路口的通行能力,目标时间 车辆C在当前路口通行的绿色信号控制,可选择的根据 在哪里ξ是绿灯时间的车道的设置,地板上(t)舍入的功能。

车辆的预期速度定义为速度限制在下游出口,以确保车辆的最大效率,可以描述为

总之,函数可以集成成本

3.3。约束

为了减少上述成本函数J,七约束,即初始车辆状态、车辆间距、速度、加速度,混蛋,信号时间,和无线通信,应该满足的优化问题。

3.3.1。初始车辆状态

假设一个连接C进入检测器的路段;当nn马克斯,柜台会重置。车辆的初始状态C被定义为

3.3.2。车辆间距

车辆不可避免地会在驾驶过程中前后状态。因此,汽车C在车道上和前面的车辆C(n - 1)应该确保一定的位移在时间和空间上。安全约束可以制定 在哪里τ时间位移的车辆吗C和前面的车辆C(n - 1),d空间位移的车辆吗C和前面的车辆C(n - 1)

3.3.3。速度

为了确保车辆在路上的安全部分,速度约束应用于他们。纵向速度约束拥抱速度信息涉及速度限制在该节和最低速度0。因此,我们有

横向速度约束,车辆偏转角主要受到车辆动力学,可以表示为 在哪里α马克斯的最大角是通过车辆的前轮可以向左转,α(t)代表了当前车辆的前轮转向角,和α马克斯代表的最大角车辆的前轮转向右边。

因此,车辆的侧向约束条件显示为

3.3.4。加速度

为了保证发动机能提供足够的电力和刹车片可以提供车辆足够的力量限制,车辆的加速或减速应指定为一个约束。加速度约束可以表示为 在哪里u马克斯是最大纵向制动减速的加速度的车辆,u马克斯的加速度最大纵向加速度的车辆,u′马克斯车辆的最大横向加速度是左边,然后呢u′马克斯是车辆的最大加速度。

3.3.5。混蛋

混蛋约束车辆加速度的变化率约束,也被称为约束或舒适约束的影响。混蛋约束的目的是消除加速度变化的负面影响在驾驶过程中。混蛋约束显示为 在哪里j马克斯代表了最大纵向落后的混蛋,j马克斯代表了最大纵向向前混蛋,j′马克斯代表了最大的横向加速度,和j′马克斯代表的最大横向加速度。

3.3.6。信号时间

信号时序约束的车辆可以确保车辆避免侵犯通过十字路口时,可以表示为

3.3.7。无线通信

V2X是一个通信系统通过汽车与任何可能影响车辆的实体。因此,V2X技术是无线通信技术的本质。在无线通信技术的实际应用,时间延迟和数据包丢失是不可避免的,这可能会影响网络的稳定和安全的车辆系统中。无线通信的相关参数约束如下: 在哪里 代表时间延迟和丢包的概率C在时间t

3.4。基于极大值原理的解决方法

MSTTOM由Pontryagin解决的最大的原则,建立了问题的哈密顿函数 在哪里λ有肋骨的向量的向量的定义是x代表的额外成本的变化J造成的小变化 x的向量x

在容许集U,最低输入 成本必须满足最低的哈密顿函数,它可以表示如下:

因此,汉密尔顿MSTTOM显示为的函数 变化的横向运动轨迹优化的过程中车辆合作换道。

在解决问题的过程中,状态向量λ固定成本应该满足的条件,显示为

3.5。合作换道优化

为了准确地描述战略合作换道过程中,车辆的换道的要求显示在图中4。车辆C,选为车辆,是一个红色的车道,准备从当前车道变换车道到目标车道 此外,黄色的车辆的车辆被定义为最主要的威胁C、橙色车辆的车辆被定义为二级威胁C和蓝色的车辆被定义为non-threat车辆C

如果目标车道不相邻车道上,它可以分解成多个换道过程。最优轨迹是加载到交通环境,和潜在的换道冲突可以进行安全检查。换道安全检查的流程图如图5

如果两个相邻车辆收到相同的并发请求,有一个优先考虑的车辆以更高的速度。如果相邻车辆基于日常驾驶习惯也有类似的速度,有一个优先考虑的车辆在左边的车道。

不同交通饱和度应满足合作换道的策略。饱和度越高参与此案,复杂性越高换道的策略将被期望。因此,高饱和度的情况下讨论如下:(我)汽车主题C发起一个请求换道到目标车辆 在选择目标的差距。(2)目标车辆 和它的后方车辆 调整自己的速度来确定车辆的安全缺口C(3)车辆C开车到目标车道上 (iv)车辆的时空轨迹更新原来的车道和目标车道上,如图所示6

3.6。基于RL轨迹优化

为了提高MSTTOM的效率,本文设计一种基于RL范式的优化算法,可以快速匹配最优轨迹。优化算法制定车辆的当前位置和速度。目标车道和时间段建模作为输入,和组车辆加速制定输出。车辆换道发起请求时,可以连接到合作换道轨迹的策略通过RL匹配网络。一旦完成换道,时空轨迹将匹配RL实现多车道的轨迹优化。

MSTTOM满足马尔可夫性质的状态向量;也就是说,下一个状态年代t+ 1系统仅与当前状态有关年代t,但不是直接关系到之前的状态。因此,状态向量可以如下所示: 在哪里P的概率矩阵之间的过渡状态。

通过集成、动作向量的集合的形式将轨迹数据。动作向量一个t在当前状态年代t显示为

五元组(年代,一个,P,R,γ)定义描述MSTTOM的过程。其中,年代是集,包括车辆的当前状态和路段的交通流状态;一个是执行操作的集合,即横向和纵向加速度输出的设置优化;R是奖励函数的过程中,负线性成本函数是哪一个J;和γ是折扣因素在计算价值函数。一个固定的政策 ,价值函数 可以计算为

一个动作值函数 可以通过定义计算每个行动的价值一个,这是形容

贝尔曼最优值函数的递归方程最优状态 和最优行动价值函数 可以通过引入马尔可夫性质计算成(31日)和(32),它可以显示如下: 在哪里 是下一时刻的状态和行为,分别。

最优策略得到了最大化上述函数可以表示为

函数可以计算q学习算法,该算法过程算法所示1

q学习算法
(1) 初始化(年代,一个);
(2) 而( )
(3) {选择初始状态年代0和行动一个0根据ε贪婪策略;
(4) 而( )
(5) {选择行动一个t国家年代t根据ε贪婪策略,得到奖励rt和下一个状态年代t+ 1;
(6) ;
(7) ;}}
(8) 得到最优策略

在算法1,年代T是在第五行终止状态。随后的状态估计的当前值函数是用于更新最优行动函数在第七行。为了提高算法的探索能力的多样性,具体公式显示为 在哪里N(一个)操作的总数,ε贪婪是基于1 -最优策略采取行动ε概率和随机行动是确保政策的可能性被选为每个动作的概率ε

4所示。相扑/ Python模拟和分析

在本节中,我们将模拟和分析提出MSTTOM通过相扑/面向平台来验证方案的可行性和有效性。同时,最优水平的流动信号十字路口将保证在实验。

4.1。基于相扑的实验平台

相扑是微观交通仿真软件(20.]。相扑是离散的模拟时间和连续空间,内部和每辆车的位置描述。在相扑,车辆碰撞模型是免费的,所以,不完整造成的变异是不允许出现在仿真模型。相扑分配适当的路线通过Dijkstra算法车辆考虑不同的交通需求。相扑的结构映射如图7

4.2。实验方案

摘要相扑的Netedit是用来进行基于图的多车道的实验场景1如图,模拟场景8。十字路口是一个典型的十字路口,红绿灯设置为一个典型的四阶段信号光。由于每个部分的类似的空间特点,选择4-lane部分从西到东的实验。

在仿真过程中,基准方案在软件、蓄洪水库原型应用程序(GPPA)方案21],MSTTOM方案提出了用于模拟和比较交通流条件下的性能和各种车辆饱和0.6,0.8和1.0。汽车仿真图如图9

三个方案相比,本文定义如下:(我)基准方案:在这个方案中,传统的人工驾驶车辆模型在软件采用相扑,这意味着没有控制车辆和网络通信。因此,车辆的驾驶状况在当前传统的驾驶习惯可以模拟在这个场景中。(2)GPPA方案:GPPA驾驶优化方案由联邦高速公路管理局(供)已经被测试和验证。在这个方案中,所有车辆交通流的CVs和GPPA优化控制的系统。(3)MSTTOM方案:所有车辆在这个方案是CVs, MSTTOM应用于所有车辆。与GPPA方案相比,有强大的优势在MSTTOM稳定和快速的计算效率。与此同时,这个方案是复杂的多车道和自适应multivehicle场景。

模拟条件和参数设置这三个方案如表所示1。与此同时,车辆状态由克劳斯车辆模拟模型(22]。

为了消除不相关的因素的影响在该方案中,模拟设置在相扑简化通过考虑以下条件:(我)在模拟环境中,有相同的模型,与所有车辆大小和运动学特征。(2)没有特殊的气候影响在模拟环境中,和道路附着系数保持不变。(3)道路是直的仿真环境。没有坡道,nonmotorized车辆车道,或停车位,导致车辆进入或退出。(iv)没有路段的倾角变化,这意味着车辆不会旅行上坡或下坡。(v)模拟环境的车辆到达的概率是随机和服从泊松分布。

基于相扑仿真流程如图10。可以看出,红色的车从西向东试图通过十字路口直走在绿色的持续时间从最右边的车道。在这个过程中,红色的车辆完成合作通过MSTTOM换道车辆在左边的车道。

4.3。结果分析

通过相扑的仿真软件,汽车可以被导出的输出数据和分析。左边的车道上车辆的时空轨迹测试路段如图11的时空轨迹,车辆运行在正确的车道是用蓝色虚线,和时空轨道上运行的车辆左边的车道由红色实线来表示。值得注意的是,换道车辆能迅速完成换道和安全优化方法。一旦车辆请求变更车道,车辆在目标车道可以调整车辆位置和储备请求换道车辆的最优安全缺口。环境下的多车道的路口路口,没有锋利的变速车辆接近十字路口的时候。因此,实现预期的效率优化车辆的车辆换道可以证明合作优化。

进展和失去的时间在十字路口停止线的分析了道路网络图12,蓝色曲线左边的车道的测试统计结果基准计划,绿色曲线左边的车道的测试统计结果GPPA计划,和红色曲线左边的车道的测试统计结果MSTTOM方案。第一车的无意义的数据在绿色和红色阶段实验结果不包括在上面的统计数据。跳的部分曲线是第一辆车的损失时间开始时绿灯或失去的时间进展的以下车辆。通过观察,就可以发现,可以有效地减少车辆的进展,车辆通过路口停止线的数量在一个单位时间增加,饱和流率在提高十字路口MSTTOM方案。GPPA方案的过程中,一些车辆受到车辆换道的影响,从而导致显著增加的进展,提高绿灯时间损失。MSTTOM方案下,车辆在十字路口的进展是明显减少,在十字路口和饱和流率增加。根据路口十字路口的交通控制特点,有效绿灯时间和饱和流率的增加将直接导致越来越多的车辆通过路口停止线,这意味着十字路口的吞吐量将得到改善。

汽车燃料效率和整个系统的相应的利润MSTTOM以下图分析13。t检验的结果表明,有显著的统计差异在汽车燃料效率数据MSTTOM方案与基准方案。通过观察,可以看出MSTTOM的使用可以有效地提高汽车燃料效率和降低车辆燃油消耗。

计算后,车辆燃料消耗利润如图14。在不同的车辆饱和的情况下,有一个重要的燃料效率效益GPPA方案和MSTTOM方案。比较GPPA计划和方案的优化方法提出本文的优点MSTTOM方案在改善交通流动,提高汽车燃料效率,减少污染物排放是显而易见的。

在MSTTOM方案,系统计算时间分析在不同迭代步骤和优化时间跨度是显示在图15。最大的计算时间是0.93优化时间跨度50秒时,迭代时间步长是0.2秒。在仿真过程中,优化时间跨度的CVs不到50秒,每个时间步迭代大于0.2秒。因此,系统的计算时间小于1秒;即有效的系统时间的性能满足实时优化的要求。

确保最优的目标信号交叉路口的车辆的机动性,提高汽车燃料效率,减少污染物排放可以在MSTTOM方案实现。与现有GPPA算法相比,MSTTOM的优势如下:(我)多车道的合作换道的功能策略随机条件下的交通流在MSTTOM实现方案。(2)与基准方案相比,流动性提高路段内的车辆,车辆燃油效率提高32%,污染物的排放减少17% MSTTOM方案。(3)与先进GPPA方案相比,有24%的减少汽车燃料消耗MSTTOM方案。(iv)交通路口信号控制所造成的波动是光滑的和交通流路段MSTTOM方案更合理。(v)交通过程中的随机性,MSTTOM计划显示了它的优越性在鲁棒性比其他现有的方案。(vi)MSTTOM方案的计算时间小于1秒,和分布主要集中在0.3秒到0.7秒,满足实时优化的要求。

5。结论

MSTTOM提出了一项新计划,缓解交通压力,减少交通堵塞在多车道道路部分。在多车道的路口交通效率低的问题进行了研究和分析。四个阶段的工作,即文献总结,场景和结构介绍、方法优化设计和实验验证,确定和优化对象,进行。研究结果和创新如下:(我)提出了一种基于V2X车辆换道方法。首先,换道环境信息分类和定义潜在威胁的分析车辆的驾驶环境。第二,潜在威胁车辆的换道行为进行了分析,并进行冲突检测,以确定优先顺序换道过程。然后,换道差距和目标合作车辆并宣布决定。最后,相关车辆的时空轨迹更新。车辆的换道合作战略MSTTOM合理规划奠定了基础。(2)本文设计一种多车道的时空轨迹优化方法。基于最优控制理论,国家控制CVs Pontryagin驱动模型的最大的构造原理。成本函数是由连续的功能目标完成和制定最优利润。符合实际情况的约束的车辆也成立。最后,轨迹数据优化的q学习算法来实现实时优化。(3)相扑软件是用于验证的可行性和有效性MSTTOM通过比较它与GPPA供料计划在美国。实验结果表明,MSTTOM可以有效地优化交通流,提高车辆燃油效率,减少污染物排放,改善交通十字路口的车辆的效率。

数据可用性

所有生成的数据或分析在本研究中包括这篇文章。

的利益冲突

作者宣称没有利益冲突有关的出版。

确认

这项工作是由中国国家重点研发项目(批准号2018 yfb1600500)和北京新星计划(批准号Z181100006218076)。