文摘

本文试图提出一个自由换道的上下文中基于信号博弈决策模型混合交通流的自治和定期的车辆。异质性的影响在不同的司机和司机一样的内生性换道行为,例如,激进还是保守,通过规范整合不同的回报函数在不同的场景。模型校准和验证使用NGSIM数据集和一个上下两层的标定框架,包括两种方法,遗传算法和完美贝叶斯均衡。根据仿真比较结果表明,该信号基于游戏的模型优于传统的天基换道模型,该模型产量相对稳定的倒数时间碰撞下的换道和更高的成功率不同交通密度。最后,进行敏感性分析来检验该模型的鲁棒性,这表明信号基于游戏的模型是稳定的不同比率的驱动程序类型。

1。介绍

换道行为对交通流的影响是至关重要的。司机执行换道行为来获得一个更好的驾驶条件(高速度、大空间,等等)或者到正确的车道是一个复杂的决策过程受到周边环境的许多可见和不可见的因素和司机。一个坏的换道决定可以导致严重的交通问题1),如交通故障,瓶颈放电率减少,走走停停的振荡和安全隐患2),而合作换道可能改善交通状况。

与传统汽车相比,连接和自主车辆启用vehicle-to-vehicle和vehicle-to-infrastructure通信技术的承诺在提高交通效率和安全3]。不过,可以预见,一段时间内,普通车辆和自动车辆共存的道路上(4]。这意味着一定程度的合作是人类之间需要司机和自主车辆。自主车辆需要正确地、准确地应对环境和对特定的驱动程序。

现有自主车辆的换道的研究大多集中在换道轨迹的发展,换道控制器,设计和预测的换道意图,而自主车辆的换道决策没有充分解决,特别是在不同驱动程序之间的交互和异质性,换道过程中是一个重要的问题。为了填补这一研究空白,提出了自动车辆的换道决策机制与传统车辆混合交通流的上下文。司机的异构换道行为是集成的基于信号博弈的方法,而不同的回报函数根据司机的类型,建立了积极的或者保守。模型校准和验证使用NGSIM数据。此外,敏感性分析是通过微观执行检查模型鲁棒性相比,传统的空间模型。

本文的其余部分组织如下:第二节审查现有的换道的方法。第三节介绍了本文提出的方法。提出了数据处理和模型校准和验证的部分45,分别。部分67目前的仿真过程的细节和主要发现。本文总结了8节讨论未来可能的研究方面。

2。文献综述

在换道的文学研究中,三种类型的模型主导的造型换道决策:基于规则的模型、基于实用和游戏模型,基于理论模型(2]。

先锋Gipps提出的基于规则的模型(5)包含几个换道行为的影响因素,如碰撞避免、屏障的位置,类型的车辆,特殊的车道,先进的速度的可能性。当有多个车道改变,一组优先级规则用于确定目标车道。虽然涉及的影响因素是合理的和相当详尽,车辆之间的互动和沟通,例如,考虑其他车辆移动障碍,被忽略了。另一个限制是,这个模型没有考虑异构司机和假设的特点相同的驱动程序是常数随时间(例如,有时一个保守的司机可以做一些积极的行动为某些原因)。基于Gipps的工作,杨和Koutsopoulos [6)做了一些改进,将换道过程分解为四个步骤:考虑换道,确定目标,寻找可以接受的差距,和执行更改。但是,没有这个模型的校准和验证。飞驒[7)分类三种类型的换道行为:自由换道,合作换道和强制换道和提出了一种新的模型能够描述车辆之间的相互作用,克服Gipps模型的缺陷之一。

不同于基于规则的模型、基于用途的模型假设不同级别的换道行为取决于驱动特点和地位不同个体司机(8]。艾哈迈德(9]扩展模型,通过融合强制性换道的决定。此外,应对可能的自由换道和强制换道决策之间的依赖性,托莱多et al。10)提出了一个综合模型,引入了随机词捕捉未被注意的变量,这或许可以解释不同的司机之间的异质性和改变风格相同的驱动程序。

第三种方法造型换道行为是博弈论提供了一种模型驱动程序之间的交互。第一个工作聚焦于普通车辆的合并行为是由基塔(11]。在那之后,孟et al。12)使用车辆的速度和加速度构造回报函数不考虑司机的异质性。Yu et al。13代表一个Stackelberg博弈模型来描述自主车辆的换道的决策过程。支付函数被定义为车辆间距和安全系数的线性组合。此外,该系数被认为是司机的侵略性的函数。该模型与传统的基于规则的模型相比有很大的优势,因为它涉及到侵犯了车辆的横向运动。不过,后悔和从众等心理因素考虑。阿里et al。2)提出了一个博弈模型下强制换道场景策略集是由经验数据筛选的。基于NGSIM US101数据(14)和驾驶模拟器数据,模型验证通过预定义的微观指标,如混淆矩阵、时间和位置误差。

除了以上提供的模型,研究人员还应用人工智能模型换道决策过程,如BP神经网络(15)和模糊推理系统(16]。毫无疑问,这些模型通常可以达到一个更好的预测,模型的性能很大程度上取决于混合交通流数据的质量和数量,仍很难获得。此外,人工智能模型往往无法解释的模型在某种意义上它可以帮助不大理解换道行为的机制。

相对于人类司机的情况,未来的交通状况将与自驾车辆混合,表明各种人类司机和自驾车辆之间的相互作用。几个问题,可能出现与传统的交通环境。首先,自驾车辆接收大量信息环境(即。,real-time traffic information and vehicle-to-vehicle communication) through various sensors or cameras, which indicates that an optimal lane-changing decision can be made relatively easier than human drivers if the information can be correctly and sufficiently recognized and used. This means when modelling the lane-changing behaviour of autonomous vehicles, additional assumptions may be needed. Moreover, the lane-changing decision of autonomous vehicles plays a vital part in the coordination of traffic system. Human drivers use their experience to decide whether to change lanes, while autonomous vehicles need to learn to interact with human drivers instead of following fixed rules or being constantly courteous. Autonomous vehicles need a higher degree of accuracy and effectiveness in responses than human drivers to cope with different styles of driving and lane-changing behaviour.

最近的研究试图区分司机从自由换道行为的角度和指定的回报函数基于安全性和效率。根据一组面试官的主观意见或者使用聚类算法,不同的驾驶风格积极或不积极等可以被识别(17- - - - - -19]。异质性的影响在不同的驱动程序在其他车辆换道行为是至关重要的,特别是在连接环境和自主车辆。然而,这种异质性可能不足以反映相同的变化决定的司机。研究表明,司机通常调整他们的驾驶风格在不同的交通情况1]这样相同的驱动程序可能有不同的换道的风格在不同的时间和空间的情况下(20.,21]。

这意味着的重要性和必要性,建立一个合理的自动车辆换道决策机制在混合交通流,一个人应该系统地整合不同的驱动程序之间的交互和异质性。首先,自由换道不是单向的决策过程,需要与他人互动。在换道的情况下,决定两个参与者都受到彼此的影响。然而,这样的一个交互已经被所有人忽视现有方法除了博弈论。第二,除了不同的司机之间的异质性,的变化特征相同的司机没有注意。决定应该由考虑驾驶员的实时反应,而不是一个固定的驾驶风格的分类,因为驾驶员可以在某些情况下以相反的方式正常。

因此,在本文中,我们试图将异构行为在不同的司机和相同的司机换道的决策过程。我们所知,这是第一次尝试考虑之间的异质性的影响不同的司机和司机换道相同的内生性决定。为了模拟这种决策的动态特性,提出了信号博弈的方法。在下面几节中,我们将提出的方法和仿真结果。

3所示。材料和方法

在这里,我们把一个换道决策过程作为一个游戏,游戏理论是潜在有用的造型换道行为。在下面几节中,我们首先介绍博弈论的概念,采用信号游戏,在这项研究中。然后我们现在在换道行为的规范设置的混合交通流的自治和驾驶员的汽车。

3.1。博弈论和信号游戏

博弈论是一个强大和成熟的数学工具。它通常是用于模型之间的相互作用过程在经济领域的两个或两个以上的球员。与许多学科,博弈论已广泛应用于人类逻辑决策。它有六个主要概念:游戏玩家,战略,回报,信息集,和平衡。游戏的定义是任何情况下都受到玩家的决定,一个球员被视为一个决策者在这个游戏。策略是一个决定,一个球员可能会在这种情况下。回报是用来测量的成本由于一对决定。信息集包含所有可用的信息。平衡是一个游戏的最佳状态,每一个玩家的决定和他们的回报。

解决方案在博弈论均衡可分为四种类型的时间和信息的本质。同时移动游戏的完整信息,适当的解决方案概念是纳什均衡(NE),而对于游戏的顺序时间完整的信息,最好的解决方案是现在进行完美的平衡(SPE)。不完全信息时,贝叶斯纳什均衡(BNE)和完美贝叶斯均衡(PBE)解决方案来解决同步移动和连续时间游戏,分别。它是一组策略顺序和信仰,这样的策略是合理的考虑到球员的信仰和玩家尽可能通过贝叶斯规则更新信念(22]。

在各种各样的游戏,游戏是一个简单类型的信号动态贝叶斯博弈在博弈理论23]。它包括两个玩家,称为发送方和接收方,一方叫自然随机决定发送方,接收方的类型。接收方不知道发送方确定的类型但知道发送方类型的概率。例如,假设有两个潜在的类型、强和弱。即使性质决定发送方是弱类型,接收者只有推断的类型发送者通过观察其行为,例如,接收信息,懦弱的概率是0.4和0.6的强大。

因为换道行为顺序(一个行为根据对方的行为)和信息可能不完整(目标车道上车辆的类型是未知的希望改变车道的车辆),应用信号游戏基于PBE换道过程。

3.2。信号的游戏换道

换道过程中决定混合交通流,自治(CAR-E)和常规车辆(CAR-TF)这两名球员。当CAR-E换车道的需求,它表明其意图其他车辆,CAR-TF。CAR-TF将如何应对意图通过发送一个信号一旦收到意图。注意,发出一个信号通常可以视为一个警告司机的行为,如重大或装角加速度。然而,积极的司机可能有更高的几率比其他类型的司机发出一个信号。观察的反应CAR-TF, CAR-E可以分析CAR-TF和计算回报值的行为以作出最优决策。

因为司机在CAR-TF的类型,例如,侵略性或保守,这很大程度上影响换道决定CAR-E CAR-E是未知的,我们假设的概率CAR-E知道CAR-TF咄咄逼人的司机p。CAR-E CAR-TF知道这是信仰,CAR-E知道CAR-TF知道这是CAR-E的信念,这意味着p是两个球员之间的常识(24]。

在这里,我们定义ΘCAR-TF类型的集合 ,在哪里 分别代表了积极型和保守型。一种类型的先验概率p,然后是另一种类型的先验概率 让CAR-TF的信号设置 ,年代和NS表示信号而不是信号,分别。CAR-E被定义为的操作集 ,在哪里C表示换道行为和W代表等待决定。CAR-E的每个信号接收和可能的行动,每个CAR-TF, CAR-TF有回报 和CAR-E 所有可能的策略游戏展示在表1

在游戏中序列,“自然”选择CAR-TF的类型,而且CAR-E知道类型的先验概率 注意,“自然”是虚拟的,不参与这个游戏。当CAR-TF收到CAR-E的意图,它选择一个操作 (通常与司机的类型)。然后,CAR-E观察CAR-TF的作用, ,然后推断后验概率 使用贝叶斯规则。然后CAR-E需要一个动作, 考虑到多个序列的可能性在每个阶段,博弈树可以用来描述决策机制,如图1

在图1, 的成本是CAR-TF发出一个信号,如注意力下降和加速度波动。 分别CAR-TF CAR-E带来极大的损失,在这种情况下,CAR-E变更车道时的司机CAR-TF是咄咄逼人。 CAR-TF CAR-E的利益带来极大的损失,分别CAR-E变更车道的情况当司机CAR-TF是保守的。 遗憾的激进和保守CAR-TFs CAR-E变更车道的情况当司机的CAR-TF没有发出一个信号。

2显示了一个示例的换道过程假定CAR-E变换车道。E代表CAR-E, TF代表CAR-TF。TL和L1是领先的车辆目标车道和当前车道,分别称为CAR-TL和CAR-L1。

考虑到速度和驾驶空间是两个主要因素影响换道行为,我们包括空间和速度支付函数。此外,后悔也是考虑的指标来模拟个人的决策。

是换道的起始时间 的时间完成这个过程。然后,车辆之间的距离可以计算如下: 在那里, , 表示之间的距离CAR-E CAR-L1, CAR-E CAR-TL, CAR-E和CAR-TF ,分别; 表示车辆的长度。 , 表示的纵向位置CAR-L1的中心,CAR-E CAR-TL, CAR-TF 分别。因此,CAR-E和CAR-TF之间的距离 在哪里 CAR-TF的瞬时速度和CAR-E吗 加速度率CAR-TF和CAR-E吗

这里,激进和保守的遗憾CAR-TFs被定义为函数之间的速度差CAR-TF CAR-E如下: 在哪里 CAR-TF和CAR-E的速度吗 ,分别。 要估计的参数。

CAR-TF的成本发送信号定义基于加速度在不同时间的差异,这表明分心造成发出一个信号,由以下方程: 在哪里 CAR-TF的加速度在哪里 是一个参数估计。

对于积极CAR-TFs,损失是依赖于不同时间在两辆车之间的距离 ,这可以通过使用下面的公式计算: 在哪里 是要估计的参数。

CAR-TL和CAR-E的速度 ,分别。 损失是量化的空间和速度;因此,保守CAR-TFs的损失可以通过使用下面的公式计算: 在哪里 要估计的参数。

同样,激进和保守的收益功能CAR-Es可以计算如下: 在哪里 表示速度效益的权重系数CAR-E的回报,可以手动设置的控制器。越高 ,速度上的关注。较低的 可以在一些危险的路段设置为自动创建一个更为谨慎的驾驶风格的车辆。 , , 要估计的参数。

3.3。平衡设置和模型的解决方案

根据先前的研究在游戏理论,信号游戏可以通过下面的方法来解决23]。让 CAR-TF的类型,它是由自然选择。 表示CAR-TF和CAR-E选定的操作。CAR-TF的回报和CAR-E表示为 是每种类型的概率分布CAR-TF行动 , 一个概率分布到每个行动 在行动 此外,当CAR-E更新CAR-TF类型的概率贝叶斯规则,CAR-TF和CAR-E成为的策略 ,分别。因此,一个完美贝叶斯均衡(PBE)信号博弈策略配置文件 和后验信念 ,满足以下方程:

注意,条件 意味着CAR-TF考虑的影响 CAR-E和条件 意味着CAR-E使最好的应对行动CAR-TF通过了解后的信念。此外,条件 贝叶斯规则的应用。

根据不同动作的球员,这个游戏的PBE可以分为三个子范畴,即分离均衡,池平衡和semiseparating平衡。正如下面所讨论的,这些平衡是用来获得游戏的全套解决方案。

分离均衡表示不同类型的CAR-TFs与1的概率选择不同的行动,即。明确、操作显示类型。例如,激进的司机总是选择发送一个信号,而保守的(即司机总是选择沉默。,什么也不做)。在这种情况下,一旦CAR-TFs采取一个行动,CAR-E可以区分其类型正确,使最优行动。

可能有两种不同的情况:(1)所有积极的司机发出一个信号,和所有的保守司机什么也不做;(2)所有积极的司机什么也不做,和保守的司机发出一个信号。

在第一种情况下,我们假设所有积极的司机发出一个信号,保守的人什么都不做。首先,让我们考虑回报从CAR-E的角度来看。如果CAR-E所观察到的一个信号,它认为CAR-TF咄咄逼人的一个基于的假设。根据博弈树的支付矩阵,它的成本 (即。,the payoff is )改变车道,而这将是0的等待决定。显然,0比 ;因此,它倾向于等待,而不是改变一个车道。相反,如果CAR-E(即不遵守任何行动。,CAR-TF does nothing), it will reckon that the driver is more conservative. If CAR-E changes lane, the payoff will be ,这是高于等待的回报(0)。因此,CAR-E更有可能改变车道。因此,CAR-E的战略可以总结如下:

达到平衡,回报的双方都必须被考虑。因此,进一步分析是进行CAR-TF的兴趣。有些情况下可以总结在表2根据相应的博弈树的分支。

为了满足假设之前,一组不平等可以推导出:

因此,这个平衡的条件

同样的程序可以在第二种情况下进行。

池平衡表示,不同类型的CAR-TFs选择相同的动作,这使得CAR-Es无法更新先验概率。换句话说,没有进一步的信息包含在发送者的选择。CAR-E唯一能做的就是预测根据类型 (原来的概率)。

有两种情况:所有司机去信号或什么都不做。第一个情况下,CAR-E回报可以推导如下:

这里,如果 ,然后CAR-E会选择改变车道。相反,如果 ,然后CAR-E会选择等待另一个机会。

在第一个条件相匹配,CAR-TF可以概括在表的回报3根据其兴趣。

根据上面的讨论中,一组不平等条件可以推导出: 来了第一个策略。

所有CAR-TFs将发出一个信号,CAR-E将改变车道。剩下的分支机构可以通过同样的方式。

Semiseparating平衡是最复杂的情况。这意味着某些类型的CAR-TFs随机选择的行为,和其他类型的CAR-TFs选择具体行动。一个保守的司机更有可能产生当其他车道的车辆换道意图。然而,他/她也可以假装咄咄逼人的司机为了保护他/她自己的利益。因此,在这项研究中,semiseparation平衡可分为两类。一是积极CAR-TFs选择发送信号的一部分,其余的不是,而保守的人不采取任何行动。相反,另一个例子是保守CAR-TFs选择发送信号的一部分,其余的没有,尽管所有积极的司机选择发送信号。

在第一种情况下,当CAR-E收到信号时,它将确定CAR-TF咄咄逼人的类型和选择等待为了得到最优的回报。其他场景更为复杂,当没有信号,CAR-E将不得不根据概率确定最佳策略。让 信号的概率行动积极的司机,也就是说, 自主车辆的换道行为的概率是观察一个信号时,也就是说, 然后,CAR-E观察没有的概率

然后,

因此,CAR-E的回报不同的策略可以总结如下:

可由方程 ;因此,

根据CAR-TF的策略,它的回报可以总结在表4

因此, 可以由激进的司机的收益方程, ;因此,

假设所有的保守的司机不采取任何行动;因此,从他们的角度来看, ,也就是说,

总之,当 积极CAR-TFs选择发出一个信号,而保守的人什么都不做。

根据上述分析,可以概括在表整个模型的解决方案5

4所示。数据

美国NGSIM - 101数据集用于校准模型。这个数据集收集好莱坞的高速公路上,洛杉矶,包括详细的车辆轨迹每0.1秒。图3显示了研究区NGSIM美国- 101数据集。

为了实现该模型,数据首先清洗按照下列原则:(1)由于专注于汽车模型的换道行为,其他类型的车辆(即的记录。、摩托车和重型车辆)被移除。(2)好莱坞高速公路五车道的高速公路与辅助车道和两个坡道(即。,Lane 6, Lane 7, and Lane 8). Therefore, records related to these three lanes, which could be seen as mandatory lane-changing behaviour, were removed.(3)考虑车辆的换道行为时完全不同的交通流是过度拥挤或在畅通的情况下,记录间隔为进展超过30米或短于6米被过滤掉26]。

此外,一个司机的决定时间窗口是经验视为2秒(2];因此,我们基于一个两秒钟间隔提取数据集。

此外,我们将换道过程分为三个阶段,即lane-keeping地平线(路)决定,换道(LC)决策地平线和LC持续时间。LC点确定当车辆通过车道边界的中心。图中可以看到细节4

为了模拟自主车辆换道决定,换道和等待随机选择的记录数据。此外,还有更多lane-keeping病例比换道病例的数据集。太多lane-keeping模型校准情况下将有一个巨大的影响,导致换道行为预测率低。因此,重要的是要确定的换道和lane-keeping记录之间的比例。路决定的时间跨度越长,越路情况下。因此进行敏感性分析确定路决定地平线。因此,本研究以2秒为路决定视野,即。,两种情况之间的比例是相等的。

CAR-E的策略(即。,waiting or changing) can be determined by the existence of lane-changing point. However, it is a challenge to extract the strategies of CAR-TF from vehicle trajectories, i.e., signalling or not. Therefore, the steady-state regime is adopted to identify CAR-TF’s action based on vehicles’ acceleration status in the sense that a steady-state regime is achieved when the acceleration or deceleration rate is lower than 0.05 g (“ “重力加速度)27]。加速或减速时小于0.05 g, CAR-TF的策略可以被视为“信号”;否则被视为“信号”。

由于轨迹数据的限制,是不可能找到确切的时间和位置时LC决定。然而,它可以来自信用证期限自LC点很容易确定。LC持续时间通常是定义为时间通过完成LC操作空间。许多研究已经完成LC持续时间(表6)。在这项研究中,采用4 s,用于发现端点LC的决定。然后,LC的起点决定可以确定根据两秒钟决定的时间窗口。

最后,共有741个观测被选定,包括391换道记录和350 lane-keeping记录。表7显示了提取的分布策略。

5。模型校准

该模型的校准是实现我们估计的参数,以最小化之间的差异观察决策NGSIM数据集和决策提出了预测的模型。本文采用标定框架建立了刘et al。35),也适用于阿里et al。2)和康Rakha (36]。

如图5,整个问题分为两个层次:上部和更低的水平。上层用于狭窄的预测决策和观察到的决定之间的区别,而低水平的目标是找到一个全套的平衡游戏。在编程之前,决策需要从原始观测数据中提取。让k是迭代索引。在第一阶段,一组参数初始化。通过应用这些参数定义为回报函数之前,策略可以为每一个找到车辆使用PBE的方法。然后,我们计算预测策略和实际之间的差异在高层决策。重复这些步骤,不停止,直到达到收敛。

上问题,这种编程的功能被定义为观测数据和预测数据的区别如下: 在哪里n是观测的数量;是记录的索引;和 分别预测的行动并观察行动。

遗传算法用于上层问题最小化目标函数,因为它不是限制函数的形式37]。

相反,低水平根据完美贝叶斯均衡问题已经解决了。为了寻求纳什均衡的整个解集,策略等工具(38)和Nashpy (39在Python中包40)已经发展找到一个简单的游戏的平衡。然而,信号游戏更复杂,因为它具有不完全信息的动态特性。因此,而不是直接采用这些包,我们探索三个不同的平衡(即。,年代eparating equilibrium, pooling equilibrium, and semiseparating equilibrium) to seek the optimal solution in the level problem.

两个指标衡量模型计算可预测性,即回忆(也称为敏感性)和F1分数(41]。被广泛应用于机器学习的分类模型,可以从方程(21)和(22): TP表示真正的阳性病例,即。,the observation and the predicted action are both positive; FP denotes the false positive cases, i.e., the observation is negative, while the predicted action is positive; FN denotes the false negative cases, i.e., the observation is positive, while the predicted action is negative.

使用70%的数据校准的模型和剩余的验证、表8总结了参数的结果。从表中我们可以看到这一点 低于 ,这意味着保守的司机更有可能后悔比积极的司机。消极的 表明,当CAR-TFs发送一个信号存在干扰。同时它可以得出结论,保守驱动距离超过积极价值驱动 低于

6。模拟

根据以上提供的校准参数,进行仿真实验。为目的的同情,一个传统的天基LC模型只考虑车辆之间的差距也适用。仿真框架呈现在图6。它可以分为五个部分,通道初始化,车辆的输入和输出,操纵控制,信息更新和绩效评估。

车道的长度设置为10公里。假设车辆随机分布在两车道在初始时间(初始化通道)。有三对斜坡上公路,车辆进入或者退出道路随机每秒(车辆输入和输出)。此外,车辆的信息,如位置,速度,加速度,每0.1秒更新一次的模拟(信息更新)。民的部分是设计根据方程(23)[42]: sp是计算了吗 被定义为以下车辆的瞬时速度和领先的车辆,分别;D两辆车之间的距离;D年代表示安全距离; 反应时间;和 是两倍的最大平均减速的倒数。详细的参数设置提出了表9。仿真场景的一个示例是呈现在图7(修改Anushagj [43])。

7所示。结果与讨论

本节使用效率和安全性评估模型的性能指标,可以由LC的成功率(LC)和第一次碰撞时间的倒数(TTC) [44]。

7.1。结果LC率

LC率意味着司机可以完成LC成功后第一次尝试时需要改变车道。图8介绍了信用证的拟议的模型和空间模型在不同交通流密度。一个可以看到,增加密度,减少车辆之间的空间进展。因此,信用证的两个模型都是在下降的趋势。然而,信号基于游戏模型的LC利率高于同期的空间模型,这意味着信号基于游戏的模型更有效。可能的情况是当进展之间的空间自主汽车和普通汽车不够大,太空控制器选择等待。相反,信号分析和与其他基于游戏控制器,采取最好的行动。,换车道。这有助于自主车辆了解交通信息和做出更合理的策略,而不是过于谨慎,即。,等待更大的差距。

注意,利率为代表的第一次尝试的结果是车辆变换车道时第一次换道的愿望。在现实中,这是不可能的,每一个驱动程序可以随时改变车道成功当他或她想要,因为仍然需要时间来找到一个合适的位置。因此,这是可以理解的,两个模型的率只有20%左右。总之,建立的模型优于空间模型的效率。

7.2。TTC的结果−1

TTC指目标车辆的时间可以使用通过调整自己的速度,以避免碰撞与前面的车辆。它的倒数可以计算使用以下方程: 在哪里 以下车辆的瞬时速度; 是领先的车辆的瞬时速度;和D两辆车之间的距离。

显然,当TTC的倒数是负的,以下车辆的速度低于领先的车辆,所以没有碰撞的危险。相反,当碰撞时间的倒数是积极的(即。,the speed of the following vehicle is greater than that of the leading vehicle), the risk of collision increases as the value increases. Figure9结果显示在不同的交通流密度。TTC的倒数两车道保持相对稳定的密度变化。因此,信号的性能基于游戏的模型几乎一样好空间模型的安全。

为了检查上述研究结果的可靠性,我们进一步比较TTC的结果−1两车道不同场景下的决策控制器。结果如表所示10。可以看出,85年th百分比和15th百分位的TTC−1的基本空间模型略高于信号基于游戏的模式,表明该模型的结果在一个相对较低的TTC值−1。换句话说,该模型不仅具有较高的效率。,higher lane-changing rate) but also provides a relatively safer traffic condition.

评估模型的性能稳定,该模型在不同的场景下运行的不同比率咄咄逼人的驱动程序(p)和交通流密度。图10和表11显示结果。它可以发现TTC−1值保持在一个稳定的水平在不同的场景下,拟议的模型和LC率通常高于天基模型。因此,我们可以得出结论,表明基于游戏的性能模型不同的价值观下是稳定的p

8。结论

本文的重点是建立一个集成的混合交通流条件下自动车辆换道模型,运用信号博弈的方法。几个模拟进行了评估模型的性能。结果表明,该模型具有较高的换道率比太空模型和仍然几乎类似的TTC的水平−1同时在不同的密度值。因此,我们得出这样的结论:该模型可以提高效率的换道而不降低安全。同时,不同比例的两种类型的司机(保守或激进)将测试模型的灵敏度。一个可以看到信号基于游戏的不同比例模型是稳定的,这意味着它可以用在不同的地区,不同成分的司机。

尽管建议模型优于空间模型,模型仍有进一步提高的空间。一种可能性是放松假设只存在两种类型的驱动程序。这将不可避免地增加模型的复杂性。此外,混合交通流的数据涉及自主车辆NGSIM数据集不存在,无论是在许多其他可用数据集。然而,由于自主车辆被训练来模仿人类的行为,使用传统数据校准自动车辆不应产生很大的影响。然而,这不应排除重新调整该模型的数据连接车辆可用。

然而,该模型显示了其潜在的应用在复杂的情况下,如造型连接车辆之间的交互和冲突之间有更多的驾驶风格和车辆信息不足的环境。在处理这些案件时,游戏需要的范围进一步扩大,如领导车辆的行为添加到模型,量化不同的驾驶行为的影响在换道过程决定,和完善收益函数与人类心理有关。有趣也会考虑天气的影响和道路障碍模型的外观。我们认为这些方面是我们的未来的工作。

数据可用性

读者可以访问数据的潜在结果研究从相应的作者((电子邮件保护))。

的利益冲突

作者宣称没有利益冲突有关的出版。

确认

这项工作得到了长安大学研究生短期出国留学项目(300203110004)、中国国家重点研发项目(2019 yfb1600302),中央大学的基础研究基金(冠心病:300102219210和冠心病:300102210201),和111年在中国西部城市群的可持续交通工程(没有。B20035)。