文摘
不断发展的城市基础设施重点可持续运输导致扩散的易受伤害的道路使用者(VRUs),十字路口的骑车人和行人等。交叉口安全评价主要依赖于历史事故数据。然而,由于一些局限性,包括稀有、不可预见性,和不规则的撞车事件,崩溃可能并不准确的定量和定性分析。超越这些限制,可以积极评价交叉口安全量化near-crashes使用替代措施称为代理安全措施(ssm)。本研究着重于开发模型预测临界near-crashes十字路口的车辆和自行车之间基于ssm和运动数据。视频数据从十路口十字路口的圣地亚哥被训练逻辑回归(LR)、支持向量机(SVM)和随机森林(RF)模型。time-to-collision T的一种变体2和postencroachment时间(PET)被用来指定监控时间和识别关键near-crashes,分别。四个场景创建使用两个阈值5和3 s宠物和T2。在每个场景中,五个监测周期长度检查。RF模型优越与其他模型相比在所有不同的场景和在不同的监测周期的长度。结果还显示一个小性能和监测周期长度之间的权衡模型,确定模型与监测周期长度的10到20帧表现略好于那些较低或较高的长度。顺序向后和向前特征选择方法也被应用,增强模型的性能。最好的射频模型已经召回85%或更高的值在所有场景。同时,射频预测模型仅仅考虑后端表现的更好near-crashes回忆的90%以上。
1。介绍
日益增长的兴趣使用环保的旅游方式,如骑自行车和走路,有一个事故涉及的数量呈上升趋势。比较车辆的交通方式,自行车和行人的风险增加致命或严重的伤害时的碰撞。根据国家公路交通安全管理局(NHTSA)报告(1]2018年,857自行车事故发生在美国道路,比前一年增加了6%,是自1990年以来的最高数字。骑自行车死亡人数增加了2009年的交通事故死亡总数的1.9%到2018年的2.3%。十字路口时视为热点看交通事故和伤害由于复杂的相互作用的性质。特别混合交通流的存在使得路口更重要的是造成大量的交通事故和碰撞。根据联邦高速公路管理局(供),平均每年有250万事故发生在十字路口。交通安全国家公路交通安全管理局在2018年公布的事实表明,29%的pedalcyclist死亡发生在十字路口。道路使用者的运动具有明显的冲突的模式可能会导致大量的信号交叉路口的交通事故(2]。因此,它是至关重要的理解之间的动态交互骑车人和机动车通过看关键的冲突。
一般来说,直接或间接的技术可以用来执行安全分析(3]。直接的技术取决于历史事故数据对道路安全的程度进行评估。传统上,碰撞频率和碰撞严重程度被用作安全评价指标。事故数据帮助识别高风险地区,当前条件下,必要的安全改进,和道路使用者的安全性评价4,5]。然而,不可预测性和不规则的事故发生在现实环境导致低效率的定量和定性崩溃的决心。由于错误的可能性或不一致的报告,事故数据是不可靠的6]。当谈到改善交叉口安全,事故数据有几个局限性。首先,随着道路事故是罕见的事件,需要很长一段时间有意义的事故数据可用。这是更多的情况下特定的事故类型正在研究(例如,骑车人让左转弯的方法之间的崩溃和车辆通过路口从相反的方法)。此外,改进设计和需求增加等变化可以发生在很长一段时间,可能影响安全评价结果。第二,危机事件的报道很大程度上取决于所涉及的道路使用者类型和危机事件的严重性,也发现分布不均7]。具体来说,易受伤害的道路使用者严重低估,从而使它不可靠和不准确使用崩溃数据安全性评价。第三,尽管事故数据指定事件的发生,它有一个有限的范围信息崩溃的原因,包括预碰撞运动,不同的道路使用者的行为模式,以及其他环境方面(7]。最后,事故数据分析是一种被动的方法补救措施可以被整合后才发生崩溃,因此,关键位置确定后,观察多个死亡和伤害,和对策实施后(8]。
考虑到这些缺点,间接安全指标研究了(7,9- - - - - -11]。提出了交通冲突技术(TCT) (12,13(即,利用冲突。,near-crashes) as a substitute for actual crashes [14,15]。交通冲突”是一种可以观察到的情况下,两个或两个以上的道路使用者的方法在空间和时间,有一个碰撞的风险,如果他们的动作不变”(16]。TCT概念分类基于冲突的各种交通事件严重性级别和代表道路使用者互动作为一个连续的安全事件。这些安全事件范围从轻微冲突,潜在的冲突,严重冲突(17,18]。这些冲突的严重程度和频率通常由措施称为量化代理安全措施(ssm)。关键near-crashes发现如果一个导弹价值跨越临界阈值(19]。
频率估计near-crashes使用地对地导弹进行了过去,仍然正在进行研究。各种地对地导弹已经被使用,其中,time-to-collision (TTC)和postencroachment时间(PET)已被广泛用于评估信号交叉路口的安全。在一个即时tTTC被定义为“两路用户采取的时间冲突,提供碰撞航向和速度的区别是一样的”(20.]。考虑两个道路使用者的轨迹,相对time-to-collision (RTTC)估计时间的差异由第一和第二道路使用者达成预测轨迹交点(提示)。TTC被认为是一个特例的RTTC RTTC值为零(即。同时,用户达到提示导致碰撞)。随着RTTC逐渐减弱,冲突被认为是更重要的。然而,低价值的RTTC也可能来自遥远的情况下,当两个对象从到达时间接近了小费。因此,RTTC独自不可能是一个合适的指标near-crashes至关重要。为了解决这个问题,Laureshyn et al。7)提出了T2随着预测时间最新的道路使用者达到矛盾点。T的低价值2表示时间保持第二道路使用者执行制动或做一个规避机动,以防止或减轻潜在的碰撞。宠物的定义是“时间的离开纷扰的车辆之间从冲突角度和车辆的到来的权利冲突的时候”(14,21]。与TTC和RTTC,宠物为所有道路使用者提供了一个单一值相互交叉的道路。作为宠物的计算方法是基于一个观察提示(相对于“预测提示”TTC),它被认为是一种有形的指标的关键交互是基于实际发生与预测。
自地对地导弹主动可以用来识别不安全的事件,它是发展模型来预测是否感兴趣的互动将会是安全的。及时预测near-crashes可用于更改信号设置等对策避免或减轻事故或警告接近道路使用者对潜在碰撞在连接环境中。然而,有数量有限的关于这一主题的研究,尤其是对vehicle-bicycle交互。本研究的目的是开发信号交叉路口的自行车模型预测临界bicycle-vehicle near-crashes。运动学特性,比如速度和加速度以及ssm模型被用于开发过程。使用逻辑回归预测模型是(LR)、支持向量机(SVM)和随机森林(RF)方法。本文的其余部分组织如下:在文献综述部分过去的研究进行了综述。接下来,描述了数据准备工作。随后,场景开发使用不同的地对地导弹随后解释模型开发部分。最后,模型的结果、结论和未来的研究进行了讨论。
2。文献综述
建模事故概率和严重程度一直是研究者和实践者之间的研究。传统的安全性能函数(SPFs)估计道路段的碰撞频率或交叉路口作为解释变量的函数描述巷道设计和环境的特点,汽车,和人类22,23]。由于罕见的崩溃和偶发性,统计计算模型如泊松和负二项(NB)及其变体经常用于分析解释变量和预测事故频率(24- - - - - -26]。除了统计计算模型、人工智能模型也已提出了事故频率预测(27- - - - - -29日]。粮食安全特别计划考虑限速等设计特点和典型交叉口类型以及聚合措施年度平均每日流量(AADT)来识别危险地点和缺失的个体司机行为的信息。然而,人们发现在个人交通动力学变化可能是一个潜在因素崩溃,可以利用实时预测事故的发生(22]。解释变量相关交通动力学包括速度、流和入住率得到实时交通数据(30.]。
几项研究进行了考虑交通动态数据以及事故数据来预测事故可能性在不同道路类型和十字路口。哦,et al。30.)定义一段5分钟崩溃之前作为一个破坏性的交通条件和一段5分钟前30分钟崩溃正常交通条件。使用两个交通状况,防晒指数模型是使用非参数贝叶斯方法开发的实时评估事故的可能性。发现速度是最可靠指标的标准差来开发一个精确的防晒系数。在这个模型的实时应用,交通动态连续监测在5分钟的时间间隔来估计每个间隔后事故可能性。如果崩溃的可能性高于某个阈值,司机会提醒减少/增加速度减少整体速度变化。同样,侯赛因和室31日)开发了一个贝叶斯网络模型使用交通数据收集从高速公路16个月实时预测崩溃。本研究认为5分钟聚合平均速度和累积流量作为主要的预测变量。前5分钟崩溃称为“预碰撞交通状况和相应的平均速度和累积流量被用来预测事故的概率。提高SPF的性能,支持向量机相结合的混合模式k聚类算法则是承诺开发更好的崩溃的预测(32]。交通流数据5 - 10分钟之前崩溃的发生被认为是在这个研究。速度、体积和交通流上游和下游之间的区别和平均交通流量预测变量被认为是在这个研究。将分析扩展到路口十字路口,元,Abdel-Aty [33)建立了一个贝叶斯条件逻辑模型来预测实时崩溃在十字路口十字路口的入口处。这个模型获得最好的结果在交通数据取自坠毁前5 - 10分钟的时间。除了实时交通数据、信号时间和天气条件被认为是为了预测事故可能性。
大多数事故预测模型利用历史事故数据有一定的局限性,如前所述。为了克服这些限制,崩溃代理人,也称为“near-crashes”或“交通冲突,”已经提出,看看他们是否可以作为安全可靠的指标。El-Basyouny和赛义德34)开发计划基于信号交叉路口的交通冲突,发现重大比例关系交通冲突和碰撞。在类似的研究中,萨基和赛义德(35)开发计划从交通冲突为每个事故类型。一些努力(36- - - - - -38)专注于发展崩溃概率评估碰撞风险的框架基于道路使用者的假想的未来运动和交通冲突的概念。例如,傅et al。36)使用distance-velocity (DV)框架研究二级pedestrian-vehicle nonsignalized十字路口的交互。在这项研究中使用的框架包含道路使用者运动和ssm数据与司机反应时间来评估安全的道路使用者之间的相互作用。一些研究调查了崩溃和near-crashes之间的关系。帕克和Zegeer [39]显示崩溃和near-crashes之间存在显著的线性关系。他等。40]使用安全飞行员模型部署(SPMD)研究地对地导弹和崩溃之间的统计关系,发现修改time-to-collision (MTTC)表现好于减速,以避免崩溃(德拉克)和TTC。
许多研究证明极值理论方法的好处估计崩溃的风险(极端事件)基于风险的道路使用者之间的相互作用(41- - - - - -44]。在最近的一项研究中,这种方法被用来预测崩溃在路口十字路口基于交通冲突从微观交通仿真和真实的数据45]。模拟结果表明高相关性和实际现场交通冲突和有前途的结果崩溃估计使用领域的冲突。郑,赛义德46)四个地对地导弹相比,包括TTC、宠物,修改time-to-collision (MTTC)和减速,以避免崩溃(德拉克),估计信号交叉路口的交通事故,发现MTTC产生最精确的结果。郭et al。47)评估near-crashes评估的使用安全性和显示原因崩溃和near-crashes之间的正相关关系。类似的分析是由(48,49)确认崩溃和near-crashes之间的正相关关系。
尽管地对地导弹已经被用在许多研究来评估安全或实际调查他们的相关性崩溃,利用ssm预测near-crashes研究有限,总结如表1。一些研究利用回归分析估计的频率near-crashes时期。例如,艾萨和赛义德52,54)建立了一个安全性能模型预测信号交叉路口的交通冲突在每个循环使用一组解释变量如交通量、队列长度和排比率。马等。53)开发了一个模型来预测每小时冲突风险指数(HCRI)高速公路不同领域使用变量如交通量和速度在主线和匝道的地区。HCRI计算基于后端和车道改变冲突被TTC。
其他的努力一直在进行预测和分类之间即将到来的near-crashes一双实时道路使用者。利用即将撞车SHRP2 NDS的数据集的数据,奥斯曼et al。51]应用几个监督机器学习模型预测曲线near-crashes几秒钟前发生。车辆运动学数据的标准差如加速度、偏航率、速度、和踏板位置监视期间在冲突之前被用作独立变量来确定即将到来的不安全事件。时间交通冲突分为两个时期:湍流地平线,运动时间监测和记录的数据,其次是预测期,时间冲突前的模型来预测结果。从敏感性分析结果显示1秒尽可能最优预测地平线长度和3秒动荡地平线。本研究得出的结论是,即将撞车预测模型的最高效的预测实例near-crashes以最小错误的预测。福尔摩沙等。50)结合高度分解的交通数据来自高速公路事件检测和自动信号(MIDAS)各种地对地导弹包括TTC和宠物从车载传感器数据计算从一个使用集中式检测车辆,集成数据架构开发实时交通冲突检测和预测方法使用深度学习方法。总共有26个输入变量组成的六个广泛使用的一类,使用平均值和标准偏差的自我车辆的速度和速度方差等车道车道和交通变量之间的速度、密度、流量、进展,和占用。安全交通动力学和交通冲突被确定使用探测车辆之间的时间进展和主要车辆追尾和车道改变冲突。发现TTC速度不同,天气和交通密度。最好的深层神经网络模型提供了一个94%的准确性。然而,这项研究仅限于车道改变和后端类型的冲突。
2.1。识别关键事件
尽管地对地导弹提供了一种量化即将撞车事件,有必要区分关键或非关键通过考虑等事件感兴趣的SSM的阈值。研究预测临界near-crashes采取不同的方法来区分关键和非关键near-crashes。福尔摩沙等。50考虑若干标准时间进展,横向距离和速度的和领先的车辆识别关键车道改变和追尾冲突。艾萨和赛义德52用TTC的阈值范围,修改time-to-collision (MTTC)和减速速度以避免崩溃(德拉克)标签near-crashes,他们报告所有这些变化的结果。马等。53)招募了一群学生观看视频并找到near-crashes至关重要。然后,他们利用TTC 85百分位值作为阈值这SSM。没有共识的研究人员使用一致的阈值。这可能是由于各种因素如类型的路上,司机的行为在不同的位置,不同类型的冲突,和使用的地对地导弹类型55,56]。马哈茂德et al。5738]提供了一个审查常见地对地导弹及其阈值。阈值中找到最佳的地对地导弹,最近的一项研究[58]研究了ssm的阈值范围,选择了最大化的事故数据之间的相关系数和风险与ssm有关。赛义德et al。59)只包括bicycle-vehicle交互,TTC值小于3 s的安全性评价。在另一项研究中,TTC和宠物阈值被认为是1.5秒车辆之间的相互作用(包括出租车),卡车(包括汽车),行人和骑自行车的60]。考虑vehicle-bicycle交互,Zangenehpour et al。61年)用于TTC和宠物阈值小于5秒,小于1.5秒标签冲突,冲突和危险。在一些研究62年,63年),汽车和自行车之间的冲突分为两类;冲突被归类为非常危险的交互宠物≤1.5秒,危险的交互1.5秒<宠物< 3秒,轻微的交互3.0秒<宠物≤5.0秒,没有交互宠物> 5秒。表2总结了一些常见的一类阈值用于先前的研究。
3所示。材料和方法
本研究旨在开发一个模型来预测关键信号交叉路口的bicycle-vehicle交互。模型响应变量是一个二分变量(关键或非关键)标签使用宠物的价值。此外,本研究利用T2(时间碰撞的一种变体如前所述)来定义一个监测期间道路使用者运动数据提取预测模型的发展。本研究总结在图的方法1。
3.1。数据收集和准备
在这项研究中,我们使用收集的数据从摄像头安装在十路口十字路口在圣地亚哥。视频数据被收集在一段时间内24小时为每个路口工作日(星期二、星期三、星期四)在5月,6月,2018年7月。收集原始数据的一项研究[65年]。十个路口十字路口利用本研究选择基于他们的更高的自行车活动被手动审查录像。数据收集的十大网站图所示2和表3。
视频数据被审查关注早上,下午,晚上高峰时间。基于人工观察的最大自行车活动,视频数据过滤进一步降至5分钟短片关注bicycle-vehicle交互。视频数据分析进行原始视频数据以提取其症结在于的轨迹和转换成自顶向下视图(鸟瞰图)。这一过程的详细过程可以在找到65年),讨论了数据注释等任务,对象检测和提取轨迹。图3显示了一个示例注释的任务是至关重要的识别对象的轨迹。而机器视觉建模并不是本研究的重点,使用机器视觉模型的输出包括其症结在于类型,在每一帧的位置。每一帧在这项研究是1/30秒。
汽车和自行车都是被监控的,他们互相计算每个交互地对地导弹和运动学特征。几个运动特性包括速度、加速度、相对距离的方法,和相对速度的方法计算车辆和自行车在每一帧。为每辆车和自行车,彼此互动,技巧是利用速度和预测两个对象的标题。接下来,每个对象的时间达到预测提示确定随着时间的十字路口(和 ,分别)。TTX及其衍生物是连续变量,也就是说,只要预测两个其症结在于十字架的道路,这些值可以计算。此外,宠物被计算估计的时间框架的区别当第一个道路使用者离开观察提示和时间框架当第二个达到同样的观察技巧。表4显示所有功能被用于这项研究。
3.2。场景开发
场景是使用两个参数:(1)宠物值是用来确认“关键(C)”或“被(NC)”near-crashes。两个常用的3 s和5 s的值被用来识别near-crashes至关重要。即将撞车被标记为关键当宠物价值定义的阈值以下。同时,near-crashes没有宠物或者宠物价值高于阈值被标记为非关键。(2)如图4T2值被用来定义监测工作一段时间。监测周期的结束(TE)被指定为第一次T2在交互价值达到低于定义阈值。3和5 s T的两个阈值2被利用。没有一个T的交互2价值低于阈值并不视为即将撞车。例如,T25秒的价值意味着在一个互动,第二道路使用者(最远的从)5秒执行一个操作,以避免潜在的事故。步进1、5、10、20和30帧向后监测时期结束点明显不同的起点(T年代),导致五个不同长度的监测期(1/30、1/6,1/3,2/3,1 s,分别)。因此,开发了四个场景使用不同的宠物(即即将撞车预测模型。3和5)和T2(即。,3和5) thresholds. Each scenario was examined for five different monitoring periods. As illustrated in Figure4等运动特性和ssm RTTC记录在监控期间直到T2达到低于阈值(例如,3)在TE。运动学数据记录在每一个时间框架在监视期间为每个特性导致了一系列的值。因此,统计平均值和标准偏差等措施被用来减少多个值。由于速度和旅行方向的突然变化,地对地导弹根本不存在的价值框架在一个交互。因此,最后一个值记录的这些特性的监测周期使用。地对地导弹的最后记录值也更说明交互,因为它提出了情况的严重程度最接近小费。表5显示所有30初始特征用于这项研究。
3.3。模型建立和分析
预测bicycle-vehicle冲突“关键冲突”和“被冲突”是一个分类问题。三个流行的逻辑回归监督机器学习分类器,支持向量机,随机森林用于构建vehicle-bicycle即将撞车预测模型。逻辑回归是一种常用的机器学习分类器提供易于实现和解释和快速计算。同时,它已广泛应用于崩溃预测文献和主要作为基准模型。因为这项研究的因变量是二分(关键或非关键near-crashes),我们使用二元逻辑回归来描述依赖和独立变量之间的关系。支持向量机是一种监督机器学习分类器,可用于解决分类和回归问题。这种方法情节中的每个数据点n维空间中定义的输入特性。然后,算法找到最佳超平面可以把类与类之间的最大差距。根据核函数,支持向量机可以进行线性和非线性分类边界。支持向量机适用于例高维输入功能,它可以在面对异常值和极端情况下表现良好在二进制分类,导致好的泛化。随机森林(RF)是一个集成学习方法可用于分类和回归问题。它生成几个随机决策树训练时间和依赖于多数选票在这些树来预测类为每个观察。射频表现良好在不平衡数据集,因为它产生一些树在数据的子集,结合了所有的树的输出,它减少了过度拟合和方差的问题。
在这项研究中,逻辑回归和支持向量机实现使用Python scikit-learn图书馆。随机森林分类器实现使用Python中的BalancedRandomForestClassifier imbalanced-learn包。在这个实现的随机森林,随机采样的多数类(被near-crashes)上执行的每个引导样本。这个分类器选择地址预测模型中的数据不平衡的问题。
3.4。模型评价
使用分层模型性能评估5倍交叉验证与20个重复。这种方法适合小型数据集和有助于消除偏见和模型过度拟合训练(66年]。在这个实现中,数据集被分成5层状折叠相同比例的积极和消极的情况下,每一次的折叠作为测试集,剩下的折叠用于培训。这个过程重复20次,它提供了一种更健壮的模型评估。
评估我们的模型,一些性能指标,如AUC(曲线下的面积),总体精度,回忆,和F2。AUC是接受者操作特征(ROC)曲线下的面积测量的能力分类器正确区分类。的F2的变化F分数衡量,计算精度和召回的调和平均数,如方程所示(1)。高的价值F分数表明高平衡分类器的性能。在F2计算,给出更高的体重回忆因为正确地识别(即少数类。,critical near-crashes) is more important than incorrectly classifying a noncritical conflict as critical. Other metrics such as the overall accuracy alone may not be suitable for model evaluation as they result in poor classification performance for the minority class. Therefore, we opted to useF2作为主要指标之间的比较结果不同的分类器,但其他指标也被用于比较:
4所示。结果与讨论
324 vehicle-bicycle交互确定T2不到5 s。这些事件,85例有宠物值小于5 s,和58例宠物值小于3 s。考虑到T2阈值3 s事件的数量减少到174年的交互,其中56个宠物价值不到5 s和46个宠物不到3 s的价值。病例数的减少是由于一个较小的阈值自然会导致更少的观测。
图5显示了F2所有即将撞车的情景预测模型的性能。平衡随机森林超过SVM和逻辑回归在所有场景。由于每个引导多数类的随机采样,平衡随机森林的表现要好于不平衡数据。也可以看到,与T的交互2不到5 s、模型使用10-frame监测时期有更高的性能,而对于与T的交互2小于3 s, 20-frame监测周期模型表现的更好。通过增加监视周期长度,有更多的数据用于模型,这可能有助于更准确地预测near-crashes。然而,通过增加监测周期的长度,数据从之前即将撞车发生被添加到模型中,从而对模型性能造成负面影响。因此,小之间的权衡模型的性能和监测周期长度是明显的,表明模型与监测周期长度的10到20帧表现略好于那些较低或较高的监测周期的长度。
(一)
(b)
(c)
(d)
表6显示的详细结果最佳即将撞车预测模型的四个场景。
为了减少过度拟合和改善模型性能,顺序向后和向前进行特征选择。这些方法是使用Python实现Mlxtend包(67年]。落后的特征选择的算法开始的所有功能,然后在每个步骤中,一个又一个功能,消除最大化模型的性能。同时,在每个步骤中,算法之前尝试添加删除功能回功能子集,看看他们是否可以提高性能。算法经过30特性在这项研究和确定最高的最佳特征子集F2性能平衡的随机森林使用相同的交叉验证技术。向前选择利用一个类似的过程,除了它开始,为零的特性,和特性被添加在每一步。以防都向前和向后的特性选择达到相同的结果,包含更少的变量的特征子集选择模型训练,以减少过度拟合。图6显示了从特征选择获得最佳性能的每个场景。
(一)
(b)
(c)
(d)
表7显示即将撞车的详细结果预测使用所选的特征子集。从表中可以看出,特征选择模型显著提高性能。
改变T2从5到3 s导致阈值F2改进,如表所示7。T的值较小的事件2现状道路使用者的位置接近的尖端。因此,改进可以归因于这样一个事实,其症结在于接近,他们的行为是更好地反映在他们的运动和SSM-related特性。此外,降低T2阈值导致那么严重的排斥相互作用和提高了数据不平衡,进而提高模型的性能。
最后,预测模型研究了near-crashes的后端类型。后端near-crashes被确定为互动与冲突的方向,几乎构成了每个场景的交互的一半。表8在每个场景展示了最好的结果在尾端的near-crashes特征选择。比较表8与表7,即将撞车预测模型有更好的表现在几乎所有的指标考虑后端交互。性能的增加可能是由于这一事实,在尾端near-crashes,道路使用者互动是在同一或相邻车道朝同一个方向。因此,这些道路使用者更可预见的未来的轨迹。相比之下,在其他类型的near-crashes,如交叉或侧击交互,预测道路使用者是更具挑战性的运动。收益率的突然变化的方向旅行和交通转向或穿越时添加更多的不确定性的预测问题。
5。结论和未来的工作
有惊人的上升崩溃涉及信号交叉路口的骑车人的数量。本研究采取了主动安全评估的方法来预测临界bicycle-vehicle信号交叉路口的near-crashes几秒钟前发生。运动学数据交互的道路使用者和ssm监视期间被用来开发预测模型区分关键和非关键活动。视频数据收集从十路口十字路口的圣地亚哥被用于这项研究。关键车辆之间的相互作用和骑车人标签使用两个宠物阈值的3和5 s。不同监测时期也定义使用两个T2阈值3和5 s以及五个不同的监测周期长度从1/30到1秒。即将撞车预测模型开发和使用三个支持向量机的机器学习分类器相比,逻辑回归,随机森林。
在几乎所有指标、平衡随机森林提供了更高的预测性能相比,支持向量机和逻辑回归,因此,被认定为最好的分类器。而即将撞车预测模型的四个场景与回忆在70%以上,表现相当好F2 60%以上,向后和向前的两种特征选择方法是采用减少过度拟合,提高模型的性能。这两个算法是实现为了找到最高的特征子集F2模型的交叉验证一样训练。回忆和特征选择显著提高F2指标85%以上和70%左右在所有四个场景,分别。此外,AUC度量的模型特征选择后80%以上。预测在尾端的准现金回忆价值进一步提高到90%以上在所有的情况下,建议可以实现更好的预测性能时只考虑某种冲突类型。结果还表明,当结束的监测周期T的定义2阈值的5 s, 10-frame监测周期导致了最好的预测性能。当一个T2阈值的3 s, 20-frame监测时期导致最佳的性能。监测周期较小或大于10和20导致较低的预测性能在所有场景。这表明一个小监控周期长度之间的权衡和预测性能。
本研究中所开发的模型可以用于智能交通管理中心专注于积极的安全的应用程序。在这项研究中使用的建模框架也可以扩展并应用于冲突涉及其他道路使用者类型(例如,vehicle-scooter)。在连接环境中,这些模型可以实时通知主动安全计划通过确定何时何地关键道路使用者之间的冲突发生。为所有类型的交互开发预测模型准确即将撞车是具有挑战性的。通常情况下,骑自行车的人比行人移动得更快,和他们的动作通常比汽车更不可预测。此外,许多骑自行车往往参与危险的和突然的动作,通过十字路口。等新兴交通技术自动化车辆,以及更新的运输方式,如电动自行车和摩托车与未知的行为影响,还会增加预测的复杂性问题。未来的研究可能会专注于为所有道路使用者类型和广泛的数据收集在不同的地理位置,以获得代表互动样本。本研究致力于开发模型只使用运动数据。然而,应该指出的是,其他因素如几何设计、交通信号方案,和天气也可能扮演了一个重要的角色在确定即将撞车事件的严重性。 While this study adopted SSM thresholds recommended by previous studies, it should be noted that any SSM and threshold should be validated as there is no consensus among researchers on what metrics or thresholds are the right ones for unsafe event identification. Future research may focus on including other environmental and design characteristics in near-crash identification and also incorporating more metrics and thresholds as well as qualitative analysis to conduct validation and sensitivity analysis studies. Future work could also entail investigating multiple conflict severity classes, other methods, and features.
数据可用性
使用的数据来支持本研究的发现是一个研究项目的一部分,由于隐私原因不能被共享。
信息披露
本文的内容反映了作者的意见,负责提供的事实和信息的准确性。
的利益冲突
作者宣称没有利益冲突有关的出版。
确认
资助这项研究部分是由加州参议院法案1“2017”的道路维修和责任法案,由加州州立大学运输联盟。本研究部分基金由安全通过中断(Safe-D)国立大学交通中心(UTC),美国交通部的资助的大学交通中心项目(联邦资助数量:69 a3551747115)。