文摘

Highway-rail平交道(HRGC)崩溃继续在美国铁路伤亡的主要贡献者,一直深入研究在过去。数据挖掘模型专注于预测而占主导地位的一般线性模型专注于模型和数据健身。决策者和交通工程师依靠预测模型研究级事故频率,使安全改进。梯度增加(GB)模型在许多研究领域已经得到普及。在这项研究中,要完全理解模型性能HRGC事故预测性能,选择GB模型与功能梯度下降算法来分析highway-rail年级口岸的崩溃(HRGCs)和确定因素因素。此外,贡献者的重要性和partial-dependent关系产生进一步了解的关系确定的贡献者和HRGC崩溃可能同意“黑匣子”,大多数机器学习方法面临的问题。此外,为了充分展示模型的预测性能,一个全面的模型预测能力的评估基于六进行测量,验证和GB模型的预测性能并与决策树模型作为参考由于他们的声望和可比数据的可用性。证明了GB模型产生更好的预测精度,并揭示了非线性贡献者和碰撞可能性之间的关系。一般来说,HRGC事故可能是由几个交通暴露因素显著影响:公路交通,铁路货运量,火车旅行速度等等。

1。介绍

汽车和火车之间的碰撞highway-rail平交道口(HRGCs)经常有严重的后果1]。的交通事故都在美国HRGCs(2000 - 2014), 12%导致死亡2]。众多的模型已经开发识别主要因素,探索崩溃和解释变量之间的关系,以便更好地理解安全性能并能够应用在HRGCSs降低失事率的有效对策。

因为事故数据随机、离散和非负特征,广义线性模型(glm) [3)已普遍选择调查崩溃和因素之间的关系。然而,主和曼纳林[4)指出,这些模型面临着各种数据的挑战源于崩溃数据分布和不当的漠视。的卢和Tolliver [5和哦et al。6],HRGC崩溃数据经常显示underdispersion分布,样本方差小于样本均值和不太常见的漠视是适合这样的数据集。此外,可用的事故数据集通常包含大部分缺失数据和异常值。glm对噪声非常敏感数据(7]。

在这项研究中,充分展示了模型应用程序及其功能分析安全数据,一个健壮的数据挖掘技术,选择梯度增加(GB)模型来分析在HRGCs崩溃。glm不同,它不需要预定义的潜在的依赖和独立变量之间的关系。因此,underdispersed HRGC数据没有问题。此外,为了更好地理解模型的预测性能,综合提出了模型预测的准确性评价体系包括六个测量和评估。

2。文献综述

glm或其他统计模型被普遍采用的交通安全决策者和研究人员捕获许多因素之间的关系,使交通安全风险的评估。泊松和负二项(NB)模型已经广泛应用于碰撞频率的研究(8- - - - - -14]。Zero-inflated泊松和Zero-inflated负二项模型已经开发的扩展泊松和NB模型试图克服贫穷模型罕见的性能数据(6,15- - - - - -18]。然而,这些模型仍然需要满足数据分布的假设。正如文献中指出的,这些参数回归模型有严重的局限性19- - - - - -22]。研究人员很难维护所需的各种假设这些模型在许多应用程序中。未能满足这些假设导致了无数的错误。卢和Tolliver [5)表示,underdispersion存在于HRGC崩溃数据。然而,负二项模型作为最受欢迎的全球语言监测机构模型假定overdispersion分布。γ模型(6)、Conway-Maxwell-Poisson和伯努利(5建议处理underdispersed事故数据。然而,这些模型很难实现,因为模型的复杂性。此外,所有glm假设线性关系转化反应的链接功能和解释变量,很难获得真正的动态非线性关系。

基于树的机器学习模型和其他非参数方法最近被交通安全研究人员(23],和Karlaftis Golias [21)进行了农村公路安全研究模型碰撞频率与决策树模型。燕和Radwan24研究了追尾事故的影响因素。秦和汉25)分类交叉崩溃。燕et al。26应用决策树(DT)模型来预测在HRGCs train-vehicle崩溃。Keramati et al。27)采用生存分析评估几何对HRGC安全性能的影响。所有的现有文献采用GB作为方法进行安全研究只侧重于一个应用程序的一部分;它侧重于一些能够更好地处理缺失值和提供更好的整体精度(28),而其他人只关注它的简化版本,DT方法,生产可判断的关系(24,26]。

一个非参数基于树模型,梯度推进模型,用于检查HRGC崩溃和因素之间的关系。极其强大的GB模型理解的结构复杂的数据集和探索潜在的因变量和自变量之间的关系。GB模型广泛应用于各种交通研究领域(29日,30.]和[31日]。与线性模型,GB模型不需要统计假设。GB模型被认为是优于简单的DT模型由于其技术处理缺失数据,与数据噪声鲁棒性,抵制过度拟合(32]。在这项研究中,作者往往会进行一个完整的应用程序和性能评估证明GB模型的完整的学习和预测方面包括(1)构建预测模型的数据,(2)生产可判断的关系,(3)展示声音通过一个完整的预测性能分析预测能力。

3所示。方法

3.1。数据

数据用于这项研究来自两个公共来源:(1)联邦铁路局的(联邦铁路管理局)办公室安全事故/事件数据库和(2)联邦铁路局安全办公室highway-rail穿越库存。生成一个新的结合数据库基于HRGC身份证号码在两个数据库,它包括信息的崩溃和描述highway-rail穿越。数据库包含了19年的历史在北达科他州HRGCs事故信息。有5713 HRGCs在北达科塔州,其中354在19年历史事故记录。目的研究crash-associated因素,二进制目标变量(崩溃)定义了两个层次:值为- 1指示发生了碰撞,而值0代表一个穿越没有崩溃。表1列出所有筛选变量,包括一个目标变量,一个ID变量,30个潜在变量的贡献。

3.2。梯度增加

梯度增强方法可以被视为多个添加剂树(垫),是一种机器学习数据挖掘技术提出的回归和分类问题(33,34斯坦福大学)。GB方法理论上扩展和提高了简单的DT模型使用随机梯度增加[33]。GB的形式产生一个预测模型一的几个简单的决策树模型(35]。因此,GB模型继承了所有的决策树模型的优点,同时提高其他方面,如鲁棒性和准确性34]。此外,其他几个特性使GB模型有吸引力,包括处理大型数据集的能力没有预处理,抵抗异常值,能够处理缺失数据,鲁棒性复杂数据,抵制过度拟合(34,36]。

GB模型是一个级数展开逼近真实的函数关系(36]。一般而言,开始的GB模型拟合数据与一个简单的决策树模型,有一定的误差的健身与数据。简单的决策树算法的详细描述和数据选择可以称为郑et al。28]。考虑到错误拥有相同的相关结果值,GB模型然后发展另一个决策树模型的错误或前面的树的残差。这个顺序的过程会重复,直到错误最小化。

GB的详细算法描述如下(29日,37]: 在哪里x是一组预测和 响应变量的近似。 是单身和参数决策树吗 表明分离变量。 (n= 1,2,…n)系数,确定每一个树的总和。弗里德曼(38)提出了功能梯度下降优化算法找到最终的最优GB模型,这是一个迭代的树构建的过程。方法继续添加树,直到所有的观察都完全安装。这将导致一个overfitted模型只执行完美的训练数据(低偏差),但预测精度很低(高方差)用不同的数据集。为了避免过度拟合,拟合的模型然后需要测试一个测试数据集。迭代训练时将停止模型的性能达到某一程度时,模型预测井的训练和测试数据集。

正则化参数避免过度拟合和提高模型性能的关键。正则化参数通常包括两个参数:学习速率和树的复杂性。学习速率也叫收缩率(39]。它控制模型以多快的速度更新或改进后每个阶段。学习速率的值范围从0到1。小值的学习速率产量巨大的改善和减少损失函数,但需要更多的迭代次数和计算时间29日]。更高的价值,接近于1,导致过度拟合和表现不佳39]。树复杂性表示每个单一简单的树的节点数(37]。较高的节点数量将引入低偏差在训练集,同时增加方差在测试集。这种现象被认为是偏见方差的权衡。因此,学习速率和树复杂性率必须平衡满足这个权衡,避免过度拟合。

4所示。结果

本部分提出了本研究的发现。R是软件进行分析研究。首先,选择一个最优模型提出了基于模型的性能。然后,基于最优模型,影响变量按其重要性排名到目标变量。之后,前有影响力的变量对事故预测的影响进行了分析。最后,模型之间的性能比较是进行DT模型和GB模型。

4.1。模型设置

检测变量之间的相互作用和充分利用GB模型,更高层次的树提出了复杂性和较低的学习速率试验(39]。在这项研究中,模型是测试下学习速率的三个值:0.05,0.01,和0.005,和五个层次树的复杂性:2,4,6,8,15。表2显示了模型执行与不同的学习速率和树复杂性水平。“类”表示事故水平1 0表示没有崩溃,崩溃。列“训练数据误差百分比”和“测试数据误差百分比”显示的预测误差百分比训练数据和测试数据,分别。“树”表示树的数量需要训练一个优化模型相应的学习速率和树下的复杂性。很明显,为学习速率较低或更低的树的复杂性,需要更多的树来实现最优模型。

最优模型应该预测对训练和测试数据;此外,准确预测事件的水平也是至关重要的。此外,树木的数量达到最佳性能所需的模型表明计算时间时,应考虑选择正则化参数。通过平衡模型性能的训练误差,测试错误,事件的预测误差,将预测误差,获得所需的树木数量优化模型,并计算资源需求,本研究选定模型学习速率为0.01,树的复杂性8,1092棵树的整体最优。为最优模型预测精度是85.7%也水平(崩溃= 0)和事件级别(崩溃= 1)为83.9%。变量的重要性及其影响在HRGCs将生成基于最优模型使用1092简单的决策树。

4.2。变量的重要性

一个变量的重要性在一个简单的单一的树是用的次数来衡量变量用作分配器和方改善归因于树由于分裂的变量。后总结的次数作为分流器和方改善合奏的树木,总和的平均值被视为变量在模型中重要性。一个高价值的变量重要性表明高水平的贡献预测(34]。在这项研究中,作者使用相同的算法来测量变量的重要性。

3介绍了相关变量的重要性每个贡献者基于所选择的最优GB模型。“相对重要性”列显示相应的变量的重要性与100年被分配到最重要的变量和一个相对百分比值其他贡献者的变量。“影响百分比(%)”是一个绝对的重要性因素表明每个变量的预测做出了多少贡献。28因素的三十HRGCs认定有对事故的影响,和十大因素贡献约60%的总崩溃影响力。单因素影响力范围从1%到11%。公路交通和铁路白天交通仅贡献了约20%对事故的影响,其中大多数都不到5%。换句话说,崩溃在HRGCs复杂,不能用只有几个因素来解释,但公路交通和白天的铁路交通发挥最具影响力对事故可能性的影响。

在所有28个影响因素中,平均每日公路交通,每日一条龙交通,火车检测类型,夜间一条龙交通、列车速度、平均和车道的数量是六大贡献者崩溃的预测。在这六个变量,其中四个是与交通有关的变量描述高速公路和铁路交通风险敞口和贡献了约30%的预测。大多数预测都是交叉特征(28日)17日,如SPSEL ADVWARN, PAVEMRK,提供信息预警系统和train-detecting系统,他们累计贡献约50%的影响。

4.3。边际贡献的影响变量

批评在文学作品中随处可见的一个更新的预测建模方法如梯度提高解释的难度相对于线性回归模型。出于这个原因,partial-dependent情节分析是在本研究进行的。Partial-dependent情节可以被视为一种图形表示的贡献系数为每个单独的独立变量。本质上,部分情节是基于模型的模拟36]。中出现的值y设在响应变量的模拟值。一个积极的y值表明特约变量对应的值有积极影响的分类模型。在这项研究中,所有其他贡献者在平均值,研究目标变量的影响变化。图1演示了使用partial-dependence情节描述的边际影响三种类型的贡献者:交通,高速公路,和交叉特征。

4.3.1。交通特征变量

数据1(一)- - - - - -1 (d)现在AADT的影响,DAYTHRU NGHTTHRU,分别在HRGCs可能性和AVG_TRAIN_SPEED崩溃。非单调关系显示一个明确的非线性、动态和复杂的目标贡献和碰撞可能性之间的关系。注意,显示的效果目标变量的影响在崩溃的可能性而其他贡献者的意思是有影响力的水平。然而,很明显,约增加模式存在于所有交通风险变量除了夜间火车体积。在图1(一)突然,失事率达到一个峰值,当AADT大约是500,这表明一个“崩盘”很可能发生当AADT是500。AADT大于500,一个可以告诉在一般情况下,碰撞可能性与AADT增加逐渐增加;然而,并不是单调的关系,还有其他在2500年和10000年AADT两座山峰。非单调的原因是所有其他贡献者的影响在他们的平均水平。在图1 (b),崩溃的可能性保持基本恒定DAYTHRU 7至20时;然而,它开始增加后每天白天的火车交通从20增加列车。如图1 (c)NGHTTHRU之前,碰撞可能性低波动率达到11日之外,突然大幅增加是观察表明,事故可能性急剧增加,如果夜间一条龙交通从11个增加到13个,仍然很高当夜间一条龙体积大于13。观察从这个图显示另一个贡献者的平均水平控制支配影响事故可能性相比,夜间火车交通而影响体积达到11之前在零附近。图1 (d)表明崩溃不太可能发生当火车速度小于30英里每小时和急剧增加,当列车速度提高到35英里每小时,而其他贡献者的意思是影响水平。如图所示,口岸与列车旅行速度介于3和13不太可能崩溃。

4.3.2。高速公路特征变量

1 (e)显示的效果的一个高速公路特征变量:HWYSYS。发现事故往往发生在过境点相交的《联邦助建公路(编码为3)。相比之下,口岸相交non-Interstate高速公路(编码为2)或non-Federal-aid高速公路(编码为4)不太可能崩溃。

4.3.3。交叉特征变量

穿越的影响特征变量对HRGC设计至关重要。数据1 (f)1 (g)显示两个交叉特征变量的影响,分别SPSEL和TRAFICLN。这表明一个直流电音频叠加(SPSEL = 2)安装在HRGC有助于减少事故的可能性。它还表明,事故往往发生在HRGCs随着时间不断的警告(CWT)系统。波变换系统,一个警告信号被激活故意提供一个常数预选的预警时间,通常25秒。所以,缓慢移动的火车,火车和之间的距离十字路口可以更比快速流动的火车。然而,CWT系统不能准确地测量速度的改变可导致实际变化预警时间常常低于预期的预警时间。如图1 (f)、高速公路不超过2车道有负面影响在崩溃。此外,值得注意的是,与4车道高速公路最高的积极影响事故的预测。这可能是由于更复杂交通状况涉及换道活动,将阻止司机的视觉的跨越和火车。

4.4。模型预测精度评估和比较

预测结果可以概括在一个分类表(表中4),并在此基础上,模型预测精度的测量计算。观察到的事件类是由“现在”表4,同时也观察到类是由在表“缺席”4。如果一个观察是预测事件类,它是显示在表“积极的”4,否则“消极。“真阳性的数量(TP)和真正的负面(TN)表示的数量正确的预测。假阳性的数量(FP)和假阴性(FN)显示的数量错误的预言与观测条件。

尽管模型的预测性能是一个关键指标,只有数量有限的研究人员发表了他们的预测性能结果的研究(40- - - - - -43]。做报告的人预测评估结果,他们只会选择性地评估的准确性,而不是提供一个完整的图片模型的预测技巧,因为在他们的研究中,预测性能作为验证工具,而不是一个完整的评估重点。最常选择的测量方程描述(1)- (3)对事件类,大事类,和整体预测,分别为:

敏感性和特异性的数量计算正确预测给定数量的观测条件。敏感性在其他一些研究也称为回忆或真阳性率虽然特异性称为真阴性率。方程(1)表明,在所有观察到的现状(TP + FN), TP的模型使得许多正确的预测。然而,它忽略了假阳性的数量(FP)预测。问题敏感性忽略FP是可以高灵敏度牺牲大量的假阳性预测;作为回报,它可能会浪费有限的安全改进预算分配如果决策者依赖模型预测结果分配预算。传统选择预测精度参数,灵敏度、特异性和准确性,只是部分代表一个模型的预测精度。画的全貌,模型的预测精度,还应该包括三个额外的预测精度测量的分析。

分别为事件和大事类,阳性预测率(PPR)和消极的预测率(NPR)真阳性和真阴性预测率在每种情况下预测条件方程所示(4)和(5)。预测准确率计算方程(3)和(6)准确类(精度)和失败类(假率(FR)),分别为:

所有指标的值越大除了FR,更好的预测功率表示的模型。

在这项研究中,所有6测量评估提出了梯度提高模型并与决策树模型的结果(28)作为参考电平。结果如表所示5

几个有趣的发现可以从表5:(1)预测功率仅基于精度、灵敏度和特异性可以高估了模型的预测能力。高价值的测量可以偏见也预估的高容量不均衡数据集等事故的数据集,因为撞车事件noncrash相比是相对罕见的事件。(2)注意,相对低的阳性预测率对模型造成的不平衡数据集较低的可分性。阳性预测率也称为精度表明误警率。这个值通常是低不平衡数据,因为模型试图提高准确性和灵敏度通过牺牲更多的假阳性的估计。在这项研究中,尽管GB模型偏离剧本表演比DT模型而言,PPR /敏感性,两种模型仍然无法提供一个良好的灵敏度等不平衡数据崩溃数据用在这项研究中,这可能会很麻烦,因为当决策者依赖模型的估计分配预算,他们可以增加不必要的开支和浪费资源恐慌。(3)通过观察综合精度评估拟议中的六个测量,可以有一个完整的模型的预测能力和预测模型的权衡。(4)比DT模型最高的GB模型同时提高灵敏度和精度。在所有测量,GB模型比DT模型偏离剧本表演。(5)GB模型的训练数据集,比较敏感,精度,NPR和特异性,只有27.3%的GB模型的估计是正确的,尽管这占88.6%的实际观察到的事件。此外,99.1%的noncrash预测是正确的,实际观察到的也占84.1%。同样的模式可以在DT模型。它表明,两个模型高估了崩溃(更假警报真实事件估计)相比,低估noncrash(相比少了真正的大事估计)。(6)在大多数测量,GB和DT模型表现得更好的训练数据集和测试数据集相对不太好的。(7)值得提到在GB模型精度大于84%,这是一个杰出的改进,与先前的研究相比(44- - - - - -46]。

5。研究总结

作为演示,GB模型可以准确地识别贡献变量并确定最优模型,以避免过度拟合与正则化参数仿真分析。更重要的是,它还可以提供易于解释影响变量的相对重要性和partial-dependent阴谋现在影响力对事故预测变量的边际影响。

GB模型克服了许多缺点等常见的统计模型的有限能力模型underdispersed崩溃和糟糕的预测性能的稀有事件(事故)通过使用训练数据和测试数据。与DT模型比较结果,GB模型演示了它能够成功地识别贡献变量及其相对重要性水平。

此外,提出了基于六个测量可以评估的评估方法模型预测精度更彻底和全面的分类研究。GB模型优于DT模型的改进预测精度在训练和测试数据集。当前GB和DT数据挖掘模型高估了事件(假报警)增加其准确的事件报道预测率(灵敏度),可以误导决策者安全改进资源浪费在不必要的过境点。处理不平衡数据集在机器学习和改善预测性能需要未来的研究关注。

数据可用性

的数据支持本研究的发现可以从作者的请求。

信息披露

本文的内容反映了作者的意见,负责事实和信息的准确性。

的利益冲突

作者希望确认没有利益冲突与此相关出版物。

作者的贡献

潘博士,丹佛Tolliver博士和黄应负责的研究理念和研究起始概念。潘博士,丹佛Tolliver博士和子健郑博士设计的研究。子健郑博士和阿明Keramati收集数据。子健郑博士和潘路模型进行建设。黄博士应负责实验室/软件资源支持。子健郑博士,潘博士,孝义周,阿明Keramati进行结果的分析和解释。子健郑博士,锅,博士和丹佛Tolliver草案准备手稿。所有作者回顾了结果和批准的最终版本的手稿。

确认

作者想表达深深的感谢北达科塔州立大学和Mountain-Plains财团(MPC),一所大学由美国交通部交通中心。