碰撞严重程度基于改进神经网络的预测方法和因子分析

文摘

事故严重程度的预测已提高了交通事故研究的关键问题。因此,这方面的进步,在这项研究中,一个彻底的人工神经网络结合改进metaheuristic算法开发和测试的结构、训练函数,因子分析,并比较结果。I5数据,华盛顿州的州际高速公路2011 - 2015年期间,被用于拟合和预测,然后设置理论三层神经网络(NN),一种改进的粒子群优化(PSO)与自适应惯性权重的方法是提出优化神经网络,最后,比较在不同的适应策略。结果表明,虽然算法产生几乎相同的预测准确性,反向传播方法结合非线性惯性权重设置在PSO产生快速全球和精确的局部最优搜索,从而展示更好的理解整个模型的解释,这可能最适合模型,最后,因子分析表明,non-road-related因素,尤其是vehicle-related因素比road-related变量更重要。本研究中所开发的方法可以应用于大数据分析交通事故和用作fast-useful工具交通安全政策制定者和研究人员。

1。介绍

1.1。事故严重程度

交通安全是一项具有挑战性的任务完成,已被确认为世界各地热点崩溃。致命的崩溃在美国的总数增加到35000年的2016。此外,根据华盛顿州碰撞总结报告,共有117053崩溃被确定在华盛顿州,包括499致命的碰撞,碰撞36531受伤,和77358年property-damage-only碰撞,表明事故发生每4.5分钟和一个死于车祸的人每隔16小时(1]。图1显示了美国和华盛顿州之间交通死亡率(1]。数十亿美元的个人和财产损失浪费在交通事故每年在世界各地(2]。

实现的内在目标探索众多因素,引发事故,事故严重程度通常用于事故分析来表示的损伤程度。KABCO规模提出了华盛顿州运输局表示的损伤:K-fatal受伤;A-incapacitating-injury;B-nonincapacitating受伤;c小调受伤;和O-property-damage-only受伤。KABCO规模已被许多学者广泛接受和适应了(例如,3- - - - - -5])。本文预测的目标是重新集结成三类基于KABCO规模和事故严重性的组合类别的5年的数据(2011 - 2015)从个人数据获取系统,即incapacitating-injuries,受伤,noninjuries。

1.2。事故严重程度的预测

事故预测问题一直是一个受欢迎的世界各地的研究领域。大量研究基于经典统计模型进行了预测分析,例如,线性,非线性,广义线性模型(GLM),广义估计方程(天啊),名义上的二进制(NB)和泊松回归模型,这被认为是一个好的尝试彻底制定几十或几百个说明的变量之间的关系。然而,应该指出的是,传统的统计方法有其局限性。人工智能(AI)技术,特别是深度学习方法(6),作为一个新兴但有前途的工具,解决传统统计领域,面临的问题更值得关注和探索。

安全性能函数(SPFs)经常用来展示不同的事故和事故影响参数之间的关系。这样的函数通常使用事故频率作为目标变量。高速公路安全手册(7)有几个章节展示整个网络的平均碰撞频率,设施,或者个人网站。Elvik et al。8)开发的六个幂函数来演示速度和道路安全之间的关系;这六个方程稍微调整下根据道路特点以下类别:致命的伤害,死亡和严重伤害,伤害,致命事故,致命和严重事故,所有伤害事故。Russo et al。9)用负二项回归模型开发四组粮食安全特别计划的基础上,进行的碰撞频率和残差分析来证明的准确性。公园和Abdel-Aty [10]开发了几个事故修改因素(cmf)交通和道路横断面元素noncurved和弯曲巷道部分使用一个横断面的方法,发现cmf为增加车道和路肩宽度减少每年的平均每日流量(AADT)水平增加。利用贝叶斯排名技术,艾哈迈德et al。11)检查的安全影响巷道几何事故发生率以及山区高速公路部分特性和不利天气条件和证实,大幅下调的片段更怨声载道地沿着研究部分。

许多研究人员都渴望深入的使用对交通安全研究的统计分析,如线性、非线性、漠视,哎呀,NB、泊松回归模型。这样的模型表现当解释变量的数量是受到限制。Debrabant et al。12]一个自回归Poisson-Tweedie模型应用于矿井时空上聚合的医院记录交通事故,并证实该方法很准确,适用于一个黑点识别问题。裴et al。13)建立了一个联合概率模型与马尔可夫链相结合,蒙特卡罗(密度)的方法,和完整的贝叶斯估计解释性因素的影响,和他们的结果表明,该模型取得了良好统计配合和提供一个精确的分析解释的影响因素。El-Basyouny et al。14]应用多变量模型基于密度模拟解决天气因素的影响,和他们的研究结果表明,温度和降雪与直观的统计上显著的标志对于所有类型的崩溃,而降雨主要是无关紧要的,最大风速与少数例外事故类型呈现正相关。

为了解决传统的统计模型的缺点,事故分析领域的学者更愿意使用人工智能方法。Karlaftis和Vlahogianni15]讨论了统计方法和神经网络之间的相同点与不同点(NNs),和他们的研究结果表明,目标的分析比使用的工具,更重要的是,总是假设所有的建模方法。特定的交通事故分析,虽然经典统计模型如NB,毒药,和贝叶斯网络可以达到很好的识别广泛的危险因素,他们也限制在一个有限的因素假设与深度学习方法(16]。借助于现代计算机的强大的硬件和软件,深度学习方法成为我们日常生活的许多方面强大的工具(6]。例如,在一个事故分析,曾庆红和黄(17]使用修剪NN碰撞严重程度,采用凸组合(CC)训练算法和神经网络修剪一个函数近似(N2PFA)结构优化方法,并发现的CC优于反向传播(BP)算法的收敛能力和训练速度;此外,简化神经网络结构的节点可以获得更好的性能。黄等。18)开发了一个优化的径向基函数神经网络(时滞)大小模型来分析事故频率和相关危险因素之间的关系,以及他们的比较工作表明,时滞模型比负二项模型大小和反向传播神经网络(摘要)模型。李等人。5)开发了一种数据驱动的方法结合nondominated排序遗传算法(NSGA-II)与神经网络识别的关键因素在一个致命的高速公路事故分析。所有的上述研究更侧重于神经网络结构本身,使用复杂的数学公式来说明抽象的概念;然而,他们很少有深思熟虑的,详细的,和一般程序处理一个完整的交通问题严重程度分析。

然而,简而言之,统计和人工智能方法在前面的研究仍然面临一些挑战,特别是神经网络,传统的海军新闻更容易陷入局部最优按照其随机权值初始化第一个开始。尽管一些研究[5,18)进行了解决上述问题,全局最优搜索的效率粒子群优化(PSO)和局部最优搜索其他优化方法还需要改进。

解决上述问题,本文的目的如下:(1)提供一个摘要算法集成算法自适应惯性权重的建立事故严重程度预测模型;(2)进行详细的因素分析(FA)基于精确模型来量化不同变量的内部关系和异质性,引发事故的杰出的严重性。预测目标在第一阶段事故严重性。应该注意的是,论文的新颖性在于一个集成的方法将一个新兴的人工智能技术和传统的统计模型碰撞严重程度进行了分析。此外,略微最初使用FA和PSO的计算参数的崩溃触发。

本文的组织结构如下:第一部分,展示讨论的背景和严重性级别进行这项研究的原因。在第二部分,经典统计模型和神经网络模型处理事故分析来阐述并评价了各种方法的优点和局限性。下一节演示了数据集的处理,包括它的描述和简化。在第四部分,整个方法的开发模型和数据整合的过程提出了突出严重程度进行预测的过程。最后,给出的结果与结论。

2。数据描述

在这项研究中使用的数据集包括从公路安全信息系统获得的数据(上学);在此系统中,数据从九个州(加州、华盛顿、明尼苏达州、密歇根州、缅因州、俄亥俄州、北卡罗来纳州和伊利诺斯州)在美国是可用的。考虑到作者的时间学习在华盛顿国家2016年至2017年期间,事故数据从这个被选为目标数据。

上学的数据包含了,大约两个表的变量。第一个是相关的事故,车辆,和主人文件,涉及时间、环境、ACCIDENT-RELATED信息、车辆信息、司机信息、住户,巷道元素,和步行/骑自行车信息,而第二个表是更关心包含位置/链接元素的巷道,巷道分类、道路线形、截面、道路功能、交通管制/操作和交通数据。此外,还有数万subvariables的表。

事故数据从华盛顿州的I5 2011 - 2015的提取。数据从第一个四年,2011 - 2014年,被用来适应模型,和后一年的数据作为预测验证集。总崩溃是9926年,10083年,10127年、11628年和12804年从2011 - 2015。根据这些原始样品,以下步骤之前需要进行挖掘模型输入程序:(1)排除明显不相关的变量。超过40的特征是要求从上学数据库系统,和一些功能,如“CASENO”(事故案例编号),“里程碑”(里程碑),“RD_INV”(一个链接变量事故文件用于合并操作),和“RTE_NBR”(路线号码)不相关事故严重程度,为简单起见省略了。(2)样品特性,比如“光”、“天气”,和“ACCTYPE”(事故类型)值,如“未知”,“南”“明确的”和“空”也为简单起见省略了。(3)一些名义变量不能用连续数字如“DIR_CURV”(水平曲线方向)和“DIR_GRAD”(垂直曲线坡度方向),这两个代表的相对方向向左或向右,变成了离散尺度值(“1”或“0”)。(4)vehicle-related和司机相关变量如“DRV_AGE”(司机年龄)和“DRV_SEX”(司机性)与accident-related合并数据文件通过“CASENO”的标签,而研究生/ curve-related变量与accident-related合并数据通过“里程碑”;在这里,一个数据处理计算机程序编写的MATLAB开发定位之间的“里程碑”“BEGPOST”和“ENDPOST”研究生/曲线文件。(5)“VEHYR”,这表明车辆模型,转化为车辆操作通过以下公式: 在哪里指的是车辆操作的 , 指的是车辆模型在原始文件中(例如,“十一”代表2011年和今年“98”代表“1998”),和指的价值。例如,如果一辆车是在2011年和一个事故发生在2013年,应该是 ,指示。(6)输出文件包含向量来自原始数据集的“严重性”变量。详细noninjury源自“1,没有受伤,”伤害来自“6,Nondisabling损伤;7,可能受伤,“和失能伤害是来自其余的。描述的向量是通过以下公式: 在哪里是指碰撞项的输出 ,和指的是布尔受伤事故严重程度指数,noninjury,失能伤害。

处理后通过上述步骤,4310,4494,4436,4666,从2011年到2015年和4984年样本用于模型拟合和验证;看数据,事故似乎更容易发生在冬季(冷季),在工作的日子里,而年轻的司机导致大量的事故(图2)。

(一)

(b)

(c)

选择后的20个功能(表1)可以从原始文件,数据清洗和处理工作的下一步是变量标准化进行了使用min-max方法通过以下公式:


类别	变量	价值的定义

Nonroad	(1)事故类型,(2),(3)工作日	分类、分类和分类
	(4)位置类型、光(5),(6)驱动性	分类、分类和分类
	(7)司机的年龄,(8)驱动程序限制,(9)车辆	连续、分类和分类
	(10)车辆类型和天气(11)	分类和分类

路	(12)道路特点和(13)路面	分类和分类
	(14)路功能类和角(15)曲线	分类和连续
	(16)曲线方向和(17)梯度方向	分类和分类
	(18)梯度比例和(19)曲线半径	连续和连续
	(20)曲线的程度	连续

从表1,我们可以看到,在所有20个功能,有15个分类和五个连续变量。此外,对于研究的角度看,我们所有的变量分为两大类别:road-related nonroad-related。

3所示。方法

3.1。神经网络与BP方法

一个人工神经网络使用信息技术来模拟人类的神经元,可以处理复杂的输入之间的连接,隐藏层和输出层。多层神经网络中,一个三层简单的神经网络已被证明是大多数采用有效的在一个先前的研究(19]。

向前传播三层神经网络的输入变量可以被定义为一个输入向量 : 在哪里指的是输入变量,= 20,指的转置矩阵计算。

同样,事故严重性级别的期望输出向量可以在哪里指的是布尔指数与伤害有关的事故,指的是一个布尔指数noninjury-related崩溃,和指的是一个布尔指数的失能伤害。

此外,输入层和隐层之间的权重矩阵, ,应该是在哪里表示之间的重量输入节点和隐藏的节点和指隐藏层的总数,我= 20。

隐层和输出层之间的权重矩阵, ,应该是在哪里表示之间的重量输出节点和隐藏的节点,指隐藏层的总数,以及向量的值指示损伤、noninjuries和失能伤害。

一般三层神经网络的结构如图3。

使用向前计算方法[17),隐层节点的输出可以描述为在哪里米是输出神经元的数量,表示之间的重量输入节点和隐藏的节点,指的是隐层节点的总数输入层和隐层之间的激活函数,然后呢是偏差项。

同样,从隐层输出计算显示为在哪里表示之间的重量输出节点和隐藏的节点,是指隐层节点的总数,矢量值包括受伤、noninjuries和失能伤害,和是激活函数在输出层和隐层之间。是偏差项。

一般来说,如乙状结肠或棕褐色的激活函数h选择和有能力将输入信号转换为一个特定的范围。如果网络采用乙状结肠函数作为输出的激活函数,输出可以缩小到一个小范围 ;然而,隐藏和输入层之间,通常,棕褐色h采用函数,因为它通常可以快速收敛。

另一方面用于建立一个神经网络的定义隐层的节点数,而且没有简单和完整的定义这个数字的数学方法;然而,基于经验的前研究[20.),使用的经验公式如下: 在哪里是隐藏节点的数量,输入节点的数量,是输出的数量,和是一个常数不同的从1到10。

基于BP方法(17),当地的梯度和的输出和隐藏层神经元和调整值和他们的连接权重如下: 在哪里和分别是动量和步长。

在网络可以更新权重

其他比一般BP方法,还有一些其他的修改培训功能,包括弹性反向传播(RPROP)、共轭梯度反向传播,动量梯度下降/,和自适应反向传播。这些功能有不同程度的准确性和训练速度,因此,应该尝试找到一个更好的解决方案。

在传统的英国石油(BP)方法,初始化权重公式(6)和(7)是随机初始化后两个不同的均匀分布。然而,该实现将高度可能导致整个模型的解决方案在一个局部最优。为了解决这个问题,作者提出了一个改进自适应惯性权重粒子群优化方法来提高本地和全局搜索最优初始权重摘要。在下一节中提供的细节。

3.2。算法与自适应惯性权重

粒子群优化方法是一个著名的metaheuristic计算方法提供了1995年(21]。同样,很容易使用在不同的优化应用程序22]。这种方法的标准和原始公式在哪里是粒子在生成和表示这个粒子的速度的一代。和两个常数通常采取在2的价值。和是两个均匀随机数在[0,1]的范围,经历了由粒子本身是最好的位置,然后呢粒子群经历是最好的位置。

从摘要本文初始权重的粒子被视为PSO算法和优化问题可以被描述为映射空间的决定X来Y,对一个典型的3 - layer神经网络,它们是编码在以下设置: 在哪里指的是重量和偏见输入层和隐层,连接指的是重量和偏见隐层和输出层连接。此外,转移目标函数Y是神经网络的均方误差(MSE)。

标准或原始算法,它可以解决非线性或nondifferentiable问题容易,但特定的搜索空间粒子几乎是固定在每个阶段的一代,这意味着模型可以很容易和快速的找到一个解决方案,当地最优附近的一个可能的解决方案。因此,将局部搜索能力和全局搜索能力之间的权衡(之前23),一个惯性权重引入公式(14),它可以写成: 在哪里是惯性权重控制全球和局部最优搜索速度,它每一代中迭代线性或非线性形式。

因此,在本文中,不同的惯性权重设置方法(23- - - - - -25),包括线性和非线性形式比较如下: 在哪里和参考重量在开始和结束的一代,他们通常设置为0.9和0.4,分别是当前迭代,是麦克斯的一代。

函数图公式(18)- (20.)是描绘在图4。从图4的重量,我们可以看到,一个相对较高的值起初为了扩大搜索空间全局最优;然而,在迭代结束时,它收敛缓慢提高局部最优搜索。

总之,整个程序的伪代码在章节3.1和3.2规定如下:为我= 1:麦克斯的一代为J= 1:人口规模粒子初始化;BP神经网络计算健身(MSE);更新粒子速度(自适应惯性权重);更新粒子的位置;结束结束分配解决BP神经网络;BP神经网络训练、测试、验证;神经网络预测;

计算过程图5。

3.3。因子分析

进行因子分析(FA)、因素重要性指数(造成)介绍了。在实践中,根据非线性和分类功能n整个输入空间维输入向量构造。因此,从工程的角度看数学,一阶偏导数的结果Y关于变量可以解释输入变量的连接权重向量,根据链式法则在微积分,和数学描述如下: 在哪里是线性从隐层到输出层输出值的摘要,可以被描述为公式(9),因此,方程(21)转换为在哪里j是隐层节点,是指通过隐层到输出层的权重,表示对激活函数的导数之间的输出和隐藏层。

考虑到公式(8)加上微积分的链式法则、公式(22)可以写成在哪里简短说明公式(8),指的是通过输入层到隐层权重。表示对激活函数的导数在输入层和隐层之间。

通过公式(24),我们可以看到,虽然有固定的输入向量维度的价值和是固定的对吗 ;因此,考虑到剩余的部分,造成的变量可以写成的价值和可以通过公式计算(12)和(13)。这些值存储在一个字典在计算过程中程序代码。

最后,为了缓解模拟方差模型的训练过程,介绍了造成期望一定通过运行模型k时报》:

4所示。结果与讨论

4.1。神经网络模型结构测试

基于该理论在前一节中所讨论的,在建立一个神经网络最主要的步骤是定义良好的隐层节点数和一个更好的培训功能。通常,模型性能(均方误差,MSE)结合总迭代收敛数是用来测试结构。隐层节点的数量,根据公式(105 - 14),连续编号的选择;训练函数,如下(表之一2)是应用。


不。	函数名	缩写

1	高炉煤气拟牛顿反向传播	高炉煤气
2	共轭梯度反向传播Powell-Beale重启	CGB
3	共轭梯度反向传播与Fletcher-Reeves更新	CGF
4	共轭梯度反向传播与Polak-Ribiere更新	本金保证产品
5	梯度下降法反向传播	GD
6	梯度下降法和自适应学习速率反向传播	GDA
7	与动量梯度下降	GDM
8	梯度下降法w /动量和自适应学习速率反向传播	GDX
9	一步sec反向传播	OSS
10	RPROP反向传播	RP
11	按比例缩小的共轭梯度反向传播	SCG
12	Levenberg-Marquardt反向传播	LM
13	贝叶斯规则反向传播	BR

最后两个表的方法2通常提供一个计算速度快,但往往是具有挑战性的和低效当处理大数据的问题,尤其是,GPU硬件配置较低。在目前的研究中,考虑到样本大小,GPU的支持不是一个问题,因此,这一细微的差异不是很重要的问题。

从理论上讲,在隐藏层节点的数目应该的范围内基于公式(10);通常,然而,隐层节点的数量不低于10,因此,结合测试使用流行的训练函数和10 - 14隐层节点数进行了基于循环测试。

我们随机分离样本数据从2011年到2014年形成的数据集训练、测试和验证对70%,15%,15%。详细的数据总量17839年被分成12487年,2676年和2676年,根据训练、测试和验证。结果如表所示3。


	10	11	12	13	14	平均

高炉煤气	0.260	0.252	0.250	0.250	0.208	0.242
CGB	0.202	0.206	0.254	0.244	0.246	0.230
CGF	0.208	0.240	0.204	0.242	0.232	0.224
本金保证产品	0.220	0.222	0.202	0.240	0.202	0.218
GD	0.230	0.232	0.236	0.224	0.232	0.230
GDA	0.204	0.206	0.208	0.204	0.206	0.204
GDM	0.466	0.472	0.228	0.216	0.240	0.324
GDX	0.206	0.202	0.204	0.198	0.204	0.202
OSS	0.200	0.202	0.204	0.244	0.206	0.212
RP	0.206	0.202	0.198	0.206	0.210	0.204
SCG	0.204	0.206	0.198	0.206	0.204	0.204
LM	0.204	0.204	0.198	0.208	0.202	0.202
BR	0.199	0.199	0.199	0.198	0.198	0.198
平均	0.230	0.234	0.214	0.220	0.214

从表可以看出312和14个隐层节点实现最佳性能(换句话说,最低的MSE)和最低MSE的BR训练函数。然而,当采用这些方法,梯度值GDA、GDX(自适应学习速率),迅速和LM减少在早期验证阶段,因此,快速收敛于预设的目标,和方法如BR, GDM,和GD收敛缓慢,需要比平时更多的验证。因此,总之,GDA的选择,GDM,或LM应该更好,并考虑缺乏GPU支持模拟环境中,我们选择了Levenberg-Marquardt反向传播(LM)的培训功能。在测试数量,LM 12隐层的节点表现出最好的性能。

4.2。PSO优化的结果

后设置PSO优化器的自适应惯性权重,我们可以得出以下性能通过每次迭代图。

消除随机数据分离方差,100 -时间进行了仿真,为每个表中描述的方法是平均表现4。


类别	性能	训练精度(百分比)	预测精度(百分比)

神经网络	0.235	78.5	71.6
神经网络与标准PSO	0.232	78.6	72.4
与PSO神经网络( )	0.298	73.2	70.5
与PSO神经网络( )	0.194	80.4	73.1
与PSO神经网络( )	0.196	79.3	73.6

从图6和表4可以看到,它的性能是指MSE训练模型,训练精度指的是平均分类精度在训练集(17839年),并预测精度是指从2015年4984个样本之间的分类精度。尽管健身(MSE)的算法滴在早期(几乎从22日)开始,它是收敛差和性能的不良状况,培训/测试的准确性,这意味着它缺乏某些局部最优搜索能力。另一方面,算法和(两个非线性公式)优于其他方法不仅在全局最优搜索(28,而神经网络与标准PSO滴从近40)也在当地最优搜索(具有良好的性能和准确性),与标准PSO神经网络和神经网络在中间水平与一个可以接受的结果。可以假定数据刷新,与非线性将执行控制算法优于其他方法。

(一)

(b)

(c)

(d)

如表所示4,训练的准确性比预测的结果;相对较低的样本数量可能是一个主要因素。值得注意的是,所有类别的性能以同样的速度相关的样本大小,和它可以得出结论,虽然预测精度应用于其他样本可能导致略微更糟糕的精度,模型可以解释所有方差和贡献者。

4.3。因子分析的结果

两个算法的最终结果介绍了非线性自适应惯性权重表5。


变量	类别	与PSO神经网络( )		与PSO神经网络( )
变量	类别	造成	相对百分比(%)	造成	相对百分比(%)

Acctype	Nonroad	0.108	77.3	0.080	63.4
月	Nonroad	0.088	63.1	0.102	81.0
工作日	Nonroad	0.061	43.7	0.054	43.5
loc_type	Nonroad	0.080	57.1	0.076	60.1
rd_char1	路	0.078	55.6	0.063	50.2
Rdsurf	路	0.052	37.4	0.456	36.2
光	Nonroad	0.069	49.1	0.071	56.1
天气	Nonroad	0.067	47.7	0.059	47.2
func_cls	路	0.063	45.1	0.058	46.1
drv_sex	Nonroad	0.024	17.4	0.017	13.1
drv_rest	Nonroad	0.043	30.5	0.039	31.0
Vehtype	Nonroad	0.092	65.6	0.090	72.0
dir_curv	路	0.032	23.2	0.028	22.1
dir_grad	路	0.020	14.2	0.019	15.1
drv_age	Nonroad	0.117	83.4	0.113	90.0
Vehyr	Nonroad	0.140	100.0	0.126	One hundred.
curv_ang	路	0.047	33.5	0.045	35.4
pct_grad	路	0.056	40.1	0.052	41.3
deg_curv	路	0.035	25.1	0.032	25.4
curv_rad	路	0.040	28.4	0.034	26.8

从图7和表5我们可以看到,两种方法(PSO和算法 )提供几乎相同的排名对每个变量,尽管有一些小的区别,例如,月和光线在第二种方法排名略高,而司机性排名稍低。近7或8的20个变量的相对重要性值超过50%,包括车辆,司机年龄、事故类型、月,类型,位置和道路功能类(也在第二种方法),车辆和司机年龄前两个值。此外,相关道路曲线和梯度等因素变量最不重要,唯一重要的因素导致了严重程度的预测是道路功能类,这表明是否对某种类型的道路事故发生。因此,可以得出结论,相对道路变量的贡献小于相对nonroad变量,特别是,而相对车辆因素(车辆和类型)。因此,政策制定者应该更加注意车辆和司机的监管规则,以及道路设计,以减少在未来可能的严重程度。

(一)

(b)

司机年龄和月是另外两个重要的因素在预测事故严重性。从样本的大小,我们可以看到,最严重的事故发生在华盛顿州的冬季(12月、1月和2月),和司机低于25岁和60岁以上的更容易遇到严重的伤害事故。本月可能占山区西雅图地区的雨季,而年龄可能来自于年轻人和年长的人更容易犯严重错误。

5。结论

在这项研究中,一个彻底的人工神经网络(ANN)是解决事故严重性级别的问题建模和因子分析(FA)。除了测试不同类型的训练结构和方法,更重要的是,提出了一种非线性自适应PSO优化方法,以解决全球和本地搜索能力之间的权衡问题在先前的研究中。不同算法的细节测试证实了我们的假设。额外的因素分析也提供了一个不同的观点而前统计分析。可以得出主要结论如下:(1)12个隐层节点数符合本文模型;和BP方法(Levenberg-Marquardt)时可以更好地利用快速的协助下硬件(2)仿真结果表明,该算法与非线性自适应惯性权重优化器优于标准PSO算法和线性自适应惯性权重(3)通过因子分析(FA),可以发现,在所有20个变量,nonroad-related变量可以占大多数的严重性预测方差,和雨山区在西雅图的原因可能是月的因素和重要性,同时,司机年龄的影响,年轻的和年长的人更容易遇到严重的崩溃

主要的创新可以总结如下:(1)传统研究常用统计方法如泊松回归,负二元回归,probit模型和广义分对数或识别和数学内部资格内部触发器和它们对事故严重程度的影响,而本文利用FA作为分析工具,这是不寻常的事故严重程度的系统研究现状,我们认为我们尝试延长碰撞严重程度分析的方法,并在未来可以开展更多的研究工作。(2)FA,传统统计实现,也可以作为一个强大的解释性工具在最后阶段的模型,和我们的工作已经证明了这一点。足总在本文中的应用表明,基本的统计方法是仍然有用和高效而人工智能方法有时没有一个令人愉快的解释数据的内在机制。

本研究中所开发的方法可以应用于大数据分析交通事故和用作fast-useful工具交通安全政策制定者和研究人员。作者认识到可以进一步调查。本文只讨论了事故严重程度。进一步的研究可以从的角度进行碰撞类型(例如,正面碰撞和追尾事故)。此外,数据集在今后的研究中可以扩大提高准确性。

数据可用性

本研究中使用的数据集是由公路安全信息系统的数据请求(上学),并请求访问这些数据应由灌装形式在以下链接:https://www.hsisinfo.org/datarequest.cfm。

的利益冲突

作者宣称没有利益冲突。

确认

作者要感谢公路安全信息系统,美国,智能交通应用和研究实验室(星实验室)华盛顿大学,美国和西北太平洋运输联盟地区10,美国也感谢中国国家自然科学基金(批准号51778141和51778141),中国学术委员会,江苏创新博士生资助项目(KYLX15_0157)提供必要的数据和支持。

引用

华盛顿州运输部,死亡率分析报告系统(FARS)辅助数据集分析用户手册2007 - 2016年年度总结碰撞华盛顿州交通部奥林匹亚,佤邦,美国,2015。
d的主,f .曼纳林crash-frequency数据的统计分析:一个回顾和评估方法论的选择,”交通研究部分:政策和实践,44卷,不。5,291 - 305年,2010页。视图:出版商的网站|谷歌学术搜索
x, s . Chen和f·陈,“多元时空建模碰撞频率的损伤严重程度的水平,”在事故的研究分析方法15卷,29-40,2017页。视图:出版商的网站|谷歌学术搜索
r . o . Mujalli、g·洛佩兹和l . Garach”交通事故不平衡数据集的贝叶斯分类器,”事故分析和预防卷。88年,37-51,2016页。视图:出版商的网站|谷歌学术搜索
d . y . Li, m·朱z曾庆红,和y . Wang”识别致命伤害的重要因素使用遗传算法和神经网络的高速公路事故,”事故分析和预防卷,111年,第363 - 354页,2018年。视图:出版商的网站|谷歌学术搜索
y LeCun (y Bengio g·辛顿,“深度学习”,自然,卷521,不。7553年,第444 - 436页,2015年。视图:出版商的网站|谷歌学术搜索
AASHTO,公路安全手册美国国家公路运输官员协会,华盛顿特区,2010年美国。
r . Elvik、p·克里斯坦森和阿蒙森,“速度和交通事故:一个评价的模式,”钢铁洪流报告,740卷,2004年。视图:谷歌学术搜索
f·罗威m . Busiello, g .戴尔水,“安全性能函数有关的农村公路的事故严重程度,“事故分析和预防卷,93年,第91 - 75页,2016年。视图:出版商的网站|谷歌学术搜索
公园和m . Abdel-Aty”,安全性能的组合交通和道路横断面设计元素在直线和曲线段,“交通运输工程学报,一个部分:系统,卷143,不。6、文章ID 4017015, 2017。视图:出版商的网站|谷歌学术搜索
黄m·艾哈迈德·h . m . Abdel-Aty,格瓦拉,“探索贝叶斯分层方法开发山区高速公路安全性能函数,“事故分析和预防,43卷,不。4、1581 - 1589年,2011页。视图:出版商的网站|谷歌学术搜索
b . Debrabant Halekoh, w·h·Bonat d·l·汉森j . Hjelmborg和j·劳里岑”与Poisson-Tweedie模型确定交通事故黑点。”事故分析和预防卷,111年,第154 - 147页,2018年。视图:出版商的网站|谷歌学术搜索
x裴、s . c . Wong和n n。苏“事故预测模型的联合概率的方法,”事故分析和预防,43卷,不。3、1160 - 1166年,2011页。视图:出版商的网站|谷歌学术搜索
k . El-Basyouny s Barua, m . t .伊斯兰教,”调查的时间和天气影响事故类型使用全贝叶斯多元泊松对数正态模型,”事故分析和预防卷,73年,第99 - 91页,2014年。视图:出版商的网站|谷歌学术搜索
m·g . Karlaftis和依Vlahogianni统计方法和神经网络在交通研究:差异,相似之处和一些见解,“交通研究部分C:新兴技术,19卷,不。3、387 - 399年,2011页。视图:出版商的网站|谷歌学术搜索
L.-Y。常”,分析高速公路事故的频率:负二项回归和人工神经网络,”安全科学,43卷,不。8,541 - 557年,2005页。视图:出版商的网站|谷歌学术搜索
问:曾庆红和h .黄”,稳定和优化的神经网络模型对事故伤害严重程度的预测,”事故分析和预防卷,73年,第358 - 351页,2014年。视图:出版商的网站|谷歌学术搜索
h .黄问:曾庆红,x裴,和徐p, s . c . Wong“预测事故频率使用一个优化径向基函数神经网络模型中,“Transportmetrica答:运输科学,12卷,不。4、330 - 345年,2016页。视图:出版商的网站|谷歌学术搜索
美国美国微积分,神经网络和学习机器美国新泽西,Prentice Hall,皮斯卡塔韦,第3版,2009年版。
j·s·贾德,神经网络设计与学习的复杂性美国剑桥,麻省理工学院出版社,马,2000年。
j·肯尼迪进行r·c·埃伯哈特,“粒子群优化”《IEEE 1942 - 1948国际会议上神经网络皮斯卡塔韦,新泽西,美国,1995年。视图:谷歌学术搜索
r波里,j·肯尼迪,t·布莱克威尔”粒子群优化”,群体智慧,1卷,不。1,33-57,2007页。视图:出版商的网站|谷歌学术搜索
y史进行r·埃伯哈特:“修改粒子群优化器”IEEE国际会议上计算情报学报》上Ankorage,页69 - 73年,正义与发展党,美国,1998年6月。视图:谷歌学术搜索
l . Zhang h . Yu, s .胡”提高粒子群优化的新方法,”遗传和进化Computation-GECCO 2003卷,2327年,第139 - 134页,2003年。视图:出版商的网站|谷歌学术搜索
梁和w .董”,PSO算法与动态惯性权重向量和尺寸突变,”计算机工程与应用卷,47号5,29-32,2011页。视图:谷歌学术搜索

离散动力学性质和社会

认知建模的多通道数据密集型应用在自然和社会系统(COMDICS)

文摘

1。介绍

1.1。事故严重程度

1.2。事故严重程度的预测

2。数据描述

3所示。方法

3.1。神经网络与BP方法

3.2。算法与自适应惯性权重

3.3。因子分析

4所示。结果与讨论

4.1。神经网络模型结构测试

4.2。PSO优化的结果

4.3。因子分析的结果

5。结论

数据可用性

的利益冲突

确认

引用

版权

更多相关文章

相关文章