文摘

年度致命的交通事故数据经常展示时间序列特征。现有的交通安全分析方法(例如,负二项(NB)模型)往往不能适应的动态影响因素致命的交通事故数据,并可能导致偏见的参数估计结果。因此,提出了一种线性泊松自回归(PAR)模型。本研究的目的是应用PAR模型,分析了动态交通法规和气候影响致命的交通事故发生的频率在一个大的时间跨度(从1975年到2016年)在伊利诺斯州。此外,NB模型,NB时间趋势,利用外源输入变量和自回归综合移动平均模型(ARIMAX)也发展到比较他们的表演。建模结果的重要结论可以概括如下。(1)PAR模型更适合分析交通法规的动态影响年度致命的交通事故,尤其是瞬时的影响。(2)法律,允许摩托车和自行车继续在红灯遵守规则适用的“合理时间”会导致年度致命的交通事故的频率增加14.98%在短期内和长期的30.69%。气候平均温度和降水集中期等因素无关紧要的影响在伊利诺斯州的年度致命的交通事故。因此,模拟结果表明PAR模型更适合年度致命的交通事故数据,并在评估一个优势的动态交通法规的影响。

1。介绍

报告的国家公路交通安全管理局(NHTSA)显示,34439年机动车事故造成37461人死亡,平均每天102人死亡的2016年。减少死于交通事故的人数,重要的是分析影响因素影响致命的交通事故的频率。在许多因素中,交通法律被认为是一个有效的措施去减少严重伤害和死亡的数量作为宏观调控的一种手段。现有的一些研究分析了某些交通法规的影响交通事故的数量,如安全带法律[1),影响下驾驶(酒后驾车)法律2,3),和酒精的控制律(4]。然而,这些交通法规的动态影响交通事故没有得到充分研究。

到目前为止,许多交通安全分析模型已经开发出来。由于交通事故的频率非负整数,许多研究认为此类事件遵循泊松分布,模拟交通事故的频率使用泊松回归模型(5,6]。然而,泊松模型不能处理overdispersed或underdispersed数据和可能导致偏见的估计。为了分析overdispersed数据,许多研究提出了不同的混合泊松模型,如Poisson-gamma模型(负二项(NB)模型)7- - - - - -13],Poisson-lognormal模型[14- - - - - -16],Poisson-inverseγ模型(17]。与许多零(即为数据。,excess zero-count data), the zero-inflated models were applied, including the zero-inflated Poisson model [18,19),zero-inflated负二项模型(20.- - - - - -22(即),及其扩展模型。,multiple random parameter zero-inflated negative binomial regression model [20.)和零膨胀泊松回归模型与随机参数的影响(23])。虽然罕见,事故数据有时会underdispersion的特征。Conway-Maxwell-Poisson模型(24和对角膨胀的二维泊松回归模型25)是合适的。

最近的一些作品回归模型不能妥善处理交通事故统计数据的时间序列特征。诺兰et al。26)提出了一种时间趋势变量作为解释变量的统计回归模型考虑系列相关。然而,这种模式可能不会明显占序列相关性的影响。另一种方法是模拟可能的动态交通事故统计数据滞后因变量的泊松或NB模型。这些模型未能充分代表持续时间系列的动力,因为他们暗示过程的增长率是取幂系数滞后因变量。这样一个过程可能产生时间序列数据而不是动态数据(27]。这两种模型的动态模型与一个趋势,但不一定是一个周期性或动态组件。另一种方法来处理时间序列的自回归综合移动平均(ARIMA)模型及其扩展包括季节性自回归综合移动平均(SARIMA) [28)和非线性自回归外生(NARX) (29日]。这些时间序列模型可能并不适用于离散时间序列变量(如交通事故统计数据)。考虑时间序列和响应的离散特征变量,一个整数值自回归(INAR)泊松模型(30.- - - - - -34)开发。然而,动态特性的影响因素没有充分描述INAR模型。一些方法可以充分模型的动态和分布年度致命的交通事故数据。

为了解决上述问题,本研究提出了一个线性泊松模型自回归(PAR)。本研究的目的是应用PAR模型分析交通法规的动态影响年度致命的交通事故频率使用收集的数据从宏观的角度在伊利诺斯州从1975年到2016年。的贡献是演示PAR模型的性能分析的动态影响因素对交通事故的频率和定量分析交通法规的影响。

剩下的纸是组织如下。部分2介绍了规范、评估和解释标准(p)模型。部分3描述了本研究中使用的数据集和数据的来源。节4统计模型的结果显示,了解不同因素的贡献年度致命的交通事故在伊利诺斯州和比较各种模型的性能。结论和未来的部分提供了建议5

2。方法

2.1。PAR模型

展示模型之前,首先介绍了线性自回归(AR)过程。AR模型描述随机变量在一些时间利用随机变量的线性组合在更早的时间方程(1)。这是一个常见的时间序列。 在哪里 交通事故数的值在时间吗t, 过去的交通事故统计值吗之前的时间 , 自相关系数, 是随机误差项。

因为有PAR模型中的解释变量,有必要重新定义变量的基于“增大化现实”技术的过程。有条件的数据 取代 基于“增大化现实”技术(p)模型,它是一个矢量,包括所有的依赖和独立变量的观测值 在哪里 是过去的解释变量(交通事故影响因素)之前的时间 可以被视为在时间之前的信息感兴趣的系列吗 假设 是一个马尔可夫过程的实现条件转移概率 让有条件的期望 在时间 有一个有限的意思。然后, 是一个 阶线性自回归过程见以下方程:

然后,我们可以得到方程(4)和(5)利用迭代的期望35的方程(3): 在方程(5)是一个几何级数 ;然后,

,方程(3)可以写成

这是一个线性AR (p)过程,的分布 是不习惯。唯一的角色分配 是定义的可能值吗

票面价值(p)模型可以定义如下。模型的假设是观察到的交通事故数量 从泊松分布生成的条件吗 然后,测量方程获得的观测值在以下方程:

假设 是有条件的线性AR过程意味着什么 ,它定义了状态变量模型。根据测量方程(8),这种状态密度与它的意思 和方差 在指数的家庭。边际泊松分布的均值或状态变量的发展根据静止的基于“增大化现实”技术(p)与自相关过程参数 ,及其过渡方程表示如下: 在哪里 - - - - - -解释变量的矩阵组成的各种交通事故影响因素, 是一个 - - - - - -向量回归参数, 是许多因素。

最后,假设状态变量的密度与γgamma-distributed共轭先验的位置参数 和尺度参数 ,所以 在哪里 之前是用观察到的交通事故数据构造。之前可以帮助找到条件均值和方差在时间 基于前面的 观察。

因为之前是γ,利用扩展卡尔曼滤波器,在时间条件分布 鉴于 也是γ,即 因为测量是泊松方程和状态方程是γ,估计后的时间 方程(11)。这是一个负二项分布。

取代AR(1)过程 并获得票面价值(1)用负二项分布预测模型。PAR前方一步条件预测函数(p)模型表示如下:

2.2。乘数的影响

因为票面价值(p)模型认为一个解释变量矩阵 ,解释不同于泊松和NB模型显著(36]。有影响乘数的概念作为一个高斯线性自回归模型,这是解释变量的变化的影响 瞬时影响乘数的分析计算,可以获得这个改变意味着函数的一阶导数。计算过程见以下方程: 在哪里 解释变量的系数 这是瞬时的影响交通事故影响因素的冲击 的意思是交通事故 长期影响乘数即总效应的冲击 可以通过方程计算(14),如在高斯时间序列分析。长期乘数可以与其他统计回归模型的参数估计,衡量的影响冲击条件意味着的事件数量。

长期影响乘数和瞬时影响乘数的概念对应于平均影响和经济学中边际影响,分别。在经济学中,对应于整个时间的平均影响,而边际影响对应于“现在”。的长期影响是相对于整个过去,而应该考虑过去的影响。然而,瞬时影响乘数或边际影响(边际效应部分推导得到的 如方程所示(13)关注的是对未来的影响没有考虑过去。

泊松和NB模型,长期和瞬时的影响因子是相同的,它们也可以通过方程计算(14)。这种差异的原因是票面价值(p)模型的解释变量对交通事故的影响和动态响应的解释变量随时间的变化。

3所示。数据描述

伊利诺斯州的年度致命的交通事故频率数据从1975年到2016年获得国家公路交通安全管理局的死亡率分析报告系统(法尔斯)。一年一度的致命交通事故为因变量,以避免漏报由于各种交通事故的定义。一些交通法规被认为对瞬时和长期从定量的角度对交通事故的影响。根据世卫组织(37),5个道路安全风险因素(即。,speeding, drunk-driving, the use of helmets, seatbelts, and child restraint systems) played an important role in traffic injuries and deaths. And Senna et al. [38)认为,受酒精影响的状态下开车总是一个主导的问题。由于交通事故法律的深远的影响,法律的研究数据基本上是基于今年[1,39]。因此,交通法规在表1被选为年度致命的交通事故分析。法律相关的变量被设置为二进制变量。例如,伊利诺斯州的最初的安全带法律的生效日期是1月1日,1988,然后这个交通法律变量与第一13期和1 0之后(每交通法律用于这项研究及其生效日期如表所示1)。如果法律的实施日期是今年下半年,法律被认为是第二年的工作。

此外,交通安全是由各种因素确定为相关数据集的分析解释变量如何影响年度致命的交通事故。为了符合法律因素,我们还选择了一些宏观指标从1975年到2016年在伊利诺伊州的间隔年。数据集组装从各种各样的来源包括美国能源信息管理局、联邦高速公路管理局,国家酗酒和酒精中毒研究所。数据集涵盖经济、社会、司机、气候、和法律因素。汇总统计数据如表所示1。注意提到的气候因素不同于微观的天气因素,这表明湿和干燥条件对大时空范围。在数据集,国内生产总值(GDP),总车辆数英里的旅行(车辆行驶里程),农村车辆行驶里程作为车辆行驶里程总数的比例,人均啤酒消费量,汽油价格,和安全带法用于分析各种因素对交通事故的影响(3]。Geedipally et al。3)表明,酒后驾车的法律,啤酒消费,农村车辆行驶里程的比例和冲击的经济在交通事故有重要的影响。请注意,所有的经济指标转换为使用消费者价格指数(CPI) 2016美元在美国劳工统计局(Bureau of Labor Statistics)计算器。

4所示。模拟结果

(即四个模型。,the ARIMAX, PAR, NB, and NB with a time trend model) are developed using the Illinois data, where the ARIMAX, NB, and NB with a time trend model are considered as benchmark models. All the models constructed in this paper are implemented with R. The main purpose is to identify the influential traffic laws affecting the fatal traffic accidents. Figure1显示了这一趋势的致命交通事故频率和车辆行驶里程。从图可以看出1致命的交通事故的频率与时间和显示序列相关性显著减少,而车辆行驶里程的增加时间。

票面价值(p)模型中提到的方法,顺序 票面价值(p首先确定(表)模型2)。基于(1)模型,逐步回归是用来选择所有重要变量作为解释变量的组合的模型。因此,最终的模型只包括原始解释变量的一个子集,在表中所示23。Akaike信息准则(AIC)这是一个估计量的统计模型的相对质量对于一个给定的数据集提供订单选择的另一个手段。其值越小,模型的拟合效果越好。当 ,模型的复杂性显著增加但AIC并不减少。所讨论的Eluru et al。40),不同于AIC,贝叶斯信息准则(BIC)对模型过度拟合与一个更大的惩罚过度参数。从表可以看出2PAR, BIC值(4)和(5)模型相比略有不同,因为票面(5)模型参数超过票面价值(4)模型。此外,估计不重要的参数在表中以粗体显示2。有无关紧要的参数 ,这将影响乘数的影响的分析解释变量。根据模拟结果表2,票面(2)模型选为最终的模型。

除了标准(2)模型,ARIMAX, NB, NB时间趋势模型相比也作为替代模型。由于时间序列数据中,ARIMAX模型考虑解释变量选择的替代模型。基于AIC值,最终模型确定ARIMAX(1 1 0)。此外,NB模型,这是最常用的交通事故频率分析,被认为是一个替代模型。此外,NB的时间趋势模型,该模型可以考虑时间序列和离散交通事故的特征频率也比通过使用一个简单的解决方案。这些模型的参数值是使用最大似然估计法估计。

这些模型的结果如表所示3。根据AIC和BIC值表3,(2)模型最适合这个数据集,紧随其后的是NB的时间趋势模型和ARIMAX(1 1 0)模型。NB模型提供了最合适的性能。时间趋势的模型结构似乎适合以来最好的交通事故序列相关。以AIC为例,标准模型的拟合性能NB模型相比增加了12%,ARIMAX模型相比,6%和5%相比,NB的时间趋势模型。然而,解释变量的系数估计的ARIMAX模型不显著;换句话说,ARIMAX模型不能解释这些因素如何影响年度致命的交通事故。NB的时间趋势模型,大部分的解释变量是重要的和的值参数估计类似于NB和PAR(2)模型。然而,带法和啤酒消费变量是无关紧要的。这一现象表明,这个模型可能无法帮助我们解释各种法律的影响因素对交通事故的频率。自从PAR(2)模型和NB模型都具有统计学意义的变量,其拟合比较性能和参数估计在接下来的段落。

除了ARIMAX模型,其他模型属于回归模型。在造型致命的交通事故,车辆行驶里程总被认为是一个偏移的术语,因为是一个线性关系总车辆行驶里程和致命的交通事故3]。从定性的角度来看,这两个系数估计的NB和PAR模型表明,啤酒消费量最大的影响在这些因素对年度致命的交通事故(表的频率3)。然而,AIC和BIC的PAR值(2)模型比NB的模型要小得多。注意,PAR模型可以在致命的交通事故中捕获动力学数据,并提供更好的拟合性能。除了拟合优度统计,我们进一步比较标准(2)模型的模拟结果和NB模型。

对于动态模型,得到的结果不能完全显示系数表3,它代表的平均效应解释变量(41]。此外,广义线性模型包括一个链接功能,这使得它难以解释独立模型的原始系数(41]。换句话说,估计系数表3单位不能直接量化的影响因素变化对致命的交通事故频率。因此,为了比较解释变量的影响在不同的致命交通事故模型,长期和瞬时乘数计算通过使用方程(13)和(14)。因为本研究关注交通法规的影响年度致命的交通事故,只有法律的影响因子在第一列的表45。由于票面(2)模型的动态结构,长期影响的价值乘数大于瞬时冲击的乘数 这三个法律(如皮带法律,酒后驾车钢化处罚,法律和酒精)导致致命的交通事故,其中酒后驾车钢化处罚法律最大的影响。酒后驾车的实现钢化处罚后,致命的交通事故的频率在短期内减少到91年和186年。然而,实施法律,允许摩托车和自行车继续在红灯遵守规则适用的“合理时间”(红色)运行会导致致命的交通事故的频率的增加。在这项研究之前,Pai和周素卿(42)显示高关联骑车red-running在台湾和事故。红色的影响运行总增加201是致命的交通事故在长期和72年致命的交通事故在短期内,这表明本法是不利于交通安全。本法可能旨在增加nonmotorized车辆的交通效率和减少旅行时间,但这是不可取的,提高交通效率的交通安全。

最后,NB和PAR乘数的影响(2)模型进行比较(表45)。所有的信号参数估计的NB和PAR模型都是相同的。它可以观察到致命的交通事故的频率随汽油价格的增加,带的实施法律,酒后驾车处罚的执行法律。随着啤酒消费量上升和红色允许运行,致命的交通事故的频率增加。然而,影响乘数的值估计的NB和PAR(2)模型显著不同。以红色运行法的实现为例,这是唯一的法律变量导致的增加交通事故的频率数据集,红色的瞬时影响运行法律是大约98标准(2)模型,这意味着实现法律运行的红色增加了事故的数量到98年在这一点上。红色运行的长期乘数法是201,这意味着事故的频率增加了201从长远来看。NB模型估计的影响执行113年的红乘数法运行。这些百分比变化如表所示45。PAR(2)模型的总百分比变化由于干预致命的交通事故的数量增加了30.69%,而瞬时变化百分比是14.98%。NB模型,改变致命的交通事故的数量是17.59%。PAR(2)模型的瞬时效应小于NB的瞬时效应模型,和长期的影响PAR(2)模型比NB的长期影响模型。这一现象的原因是,票面(2)模型的估计系数包括动态特性。长期乘数考虑前一个阶段的影响,而只考虑当前瞬时效应的影响。自 描述了乘数效应,平均计算 只能描述的平均效果。因此,NB的瞬时效应模型实际上反映了平均效应,导致过高的短期效应。NB模型不能正确地考虑致命的交通事故数据的动态,从而导致过高的解释变量的瞬时冲击的致命的交通事故。

剩下的三个变量,长期和瞬时乘数PAR模型估计的影响小于NB估计的模型。以带法为例,瞬时和长期百分比变化由于干预估计的PAR模型和−−7.32%和15%,分别和NB的估计的乘数模型−20.15%。这一现象表明,NB模型高估了解释变量的影响,尤其是对瞬时的影响。票面价值的动态特性(p)模型使它更适合估计交通法规的动态影响年度致命的交通事故。安全的瞬时影响干预策略可以通知交通管理机构设计更合适的交通法规,虽然NB模型不能提供这类信息。

5。结论

年度致命的交通事故统计数据时间序列特征。现有的交通事故分析模型不能完全模型动态特性和分析解释变量的动态影响年度致命的交通事故。许多交通事故分析解释变量,执行交通法规的动态效应还没有被广泛关注。在这项研究中,提出了一种线性泊松自回归模型来分析长期和瞬时交通法规影响年度致命的交通事故。然后,PAR的建模结果(p)、ARIMAX NB, NB时间趋势模型进行了比较。几个主要结论总结如下:(1)PAR模型可以超越ARIMAX, NB, NB的时间趋势模型的拟合性能和估计的动态效果。票面价值(p)模型更适合分析交通法规的动态影响年度致命的交通事故。与ARIMAX模型相比,票面价值(p在事故中)模型可以考虑离散特征数据和分析的影响因素。相比之下,NB的时间趋势模型,票面价值(p)模型可以准确地分析多个解释变量的影响在致命的交通事故的频率。与NB模型相比,票面价值(p)模型可以捕捉年致命的交通事故频率和时间序列计算动态交通法规和其他解释变量的影响。NB的动力学模型的疏忽导致偏见的参数估计,尤其是无法估计瞬时乘数的因素。然而,瞬时乘数可以表明交通法律干预的直接影响交通安全管理机构和帮助新法律。(2)一些气候和交通法律因素被认为是定量评估他们的影响在伊利诺斯州的年度致命的交通事故。平均气温和降水集中期微不足道的影响。钢化处罚酒后驾车的法律结果在减少年度短期致命的交通事故12.52%和25.65%从长远来看,这对致命的抑制作用最大的交通事故的法律分析。然而,法律允许红运行会导致增加年度致命的交通事故14.98%在短期和长期的30.69%。因此,控制酒后驾车行为和修改法律运行的红色可能显著降低的频率年度致命的交通事故,这对未来交通法律发展提供指导。

票面价值(p)模型可以广泛应用于分析时间序列统计数据。除了本文中提到的交通法规,适用的解释变量表现出突然改变可以扩展的因素如政策法规的出现,和动态的影响这些变量可以解释为标准(p)模型。对于未来的研究,票面价值(p)模型可以应用于交通事故调查收集的数据从其他网站。此外,与数据采集技术的发展,多源数据集(43- - - - - -46)可以用来分析交通事故。

数据可用性

使用的实验数据来支持本研究的发现可以从相应的作者。

的利益冲突

作者宣称没有利益冲突有关的出版。

确认

共同赞助的这项研究是由中国国家重点研究和发展计划(批准号2018 yfe0102800),上海市科学技术委员会(批准号19210745700),中央大学的基础研究基金(批准号22120200035)。