文摘
道路交通安全是一个社会普遍关注的问题。重要的是交通管理者理解道路交通事故的分布模式。为此,本研究探讨了空间和时间模式的道路交通事故事故发生频率和事故严重程度的观点。道路交通事故数据从2016年到2018年在哈尔滨,中国,被用于分析。首先,完成了空间定位事故使用地理编码,和本地化的事故数据按季节分类。然后,密度分析和和不考虑道路网密度。密度分析的结果表明,当道路网密度被认为,事故是主要分布在城市中心,而事故更分散时,没有考虑道路网密度。第三,聚类分析考虑事故发生严重事故发现低幅度的集群主要在城市中心。安全性事故集群大多出现在郊区。最后,这两种方法的结果显示通过使用届时系统技术。 Areas of the city with a high frequency and severity of crashes in each season were identified. This study will help traffic management to have a more visual and intuitive understanding of the urban traffic safety situation and to take targeted measures to improve it accordingly.
1。介绍
道路交通事故造成的人员伤亡和财产损失严重。据世界卫生组织(1),大约130万人死亡和伤害发生全世界每年由于交通事故。道路交通死亡的8日全世界人类死亡的主要贡献人。2016年,63093人死于交通事故在中国比在美国的1.7倍。死亡率达到2.72每10000辆汽车,在美国(2.1倍2]。减少交通事故的数量,它是必要的,以确定何时何地事故频繁发生。之前的研究表明,事故发生有一定的空间和时间模式。频率和严重程度高的地区的崩溃会随着时间变化,发生在不同区域内的城市。因此,事故的频率和严重性结合了解事故发生的时空分布模式。这些信息有助于交通管理者采取有针对性的预防措施,减少死亡和伤害。
最前面的交通事故数据分析使用的数学统计方法(3- - - - - -5]。这些方法主要使用事故频率来确定事故热点的位置(6]。他们的操作和表达是相对简单的,但这些方法有很多局限性,如缺乏时间和空间可视化和无法连接。相比之下,空间统计方法可用于可视化交通事故通过GIS技术的空间分布特征。相比与传统数理统计、空间统计充分利用GIS的空间数据处理的优势。一方面,交通事故的分布可以通过GIS可视化技术(可视化7- - - - - -9]。另一方面,通过使用各种GIS空间分析工具,学者可以探索交通事故的空间分布特征和空间之间的关系从不同的角度不同的交通事故(10- - - - - -12]。最常见的GIS空间统计方法是密度分析,完成空间可视化的事故通过内核密度和点密度方法(13- - - - - -16),聚类分析,可以确定交通事故空间分布的聚集,扩散,或随机分布的最近邻距离,里普利的K函数法(17- - - - - -19),它可以识别出交通事故热点地区热点分析(20.- - - - - -22和空间自相关分析23- - - - - -25]。
一般而言,现有研究已经报道的一系列交通事故数据的分析结果,但仍存在一些缺点。首先,在先前的研究在事故密度分析,只有事故密度被认为是,道路网密度的影响没有考虑事故密度。第二,交通安全水平的措施不仅包括交通事故的频率也严重事故的后果。尽管先前的研究已经调查了事故严重程度较高的区域的空间分布特点,很少有与事故发生频率和事故严重程度的空间分布特征。
因此,针对前人研究的不足,事故第一次空间位于地理编码方法。其次,事故分为四类根据发生的季节。然后,使用密度分析和聚类分析,交通事故的频率和严重程度高的地区被确定。最后,结合两种分析方法的结果来确定易出事故的严重程度不同的领域。
本文旨在调查事故的空间和时间模式从两个角度:事故发生频率和事故严重程度。本文的其余部分安排如下。部分2描述了交通事故数据。部分3显示了本研究中使用的主要方法。密度分析和聚类分析的结果提出了部分4。最后,部分5给出了结论。
2。数据处理
这项研究集中在城市哈尔滨,位于中国东北。哈尔滨占地面积大约53100公里2在2017年,人口955万。本研究只集中在主要城市的市区。每个数据点都包含基本的事故信息,如发生时间、发生的位置,事故伤亡,道路类型和天气数据。在这个研究中,其中一些信息(见表1)被选为研究。
在GIS中,交通事故的位置通常是伴随着纬度和经度坐标。然而,纬度和经度并不包括在原始数据。因此,经度和纬度坐标需要从交通事故的描述位置决定。然后,确定事故的空间位置。这个过程称为地理编码(26]。田et al。27)评估质量的四个在中国主流的地理编码服务(百度,高德牌、搜狗腾讯)。腾讯的地理编码API的服务质量被认为是相对较高的,数据质量和较高的比另一个更完整的地址数据服务。因此,本文选取腾讯完成事故的转换,然后将转换后的数据导入GIS坐标。当腾讯API返回编码的结果,它还返回结果的可靠性。可靠性可靠性值的范围从1(低)到10(高可靠性)。结果被认为是可信的,当它有一个可靠性7分以上,所以这些结果保留在这个研究。地理编码的过程,5850年事故后被确定为进一步研究。
图1说明了交通事故的整体空间分布从2016年到2018年。这个数字表明,发生事故主要集中在中心城区。
3所示。方法
3.1。届时系统方法
届时系统技术可以帮助我们认识到交通事故的位置。它已广泛应用于时空集成(28,29日]。本文从3年的交通事故数据被分成四个季节根据子集哈尔滨的气候条件。然后,密度分析和聚类分析被应用于计算每个子集的强度。最后,结果按顺序排列在空间分布的图形显示交通事故。根据相关文献的建议(30.),类边界应该重叠。如表所示2、事故被季节分为四个子集。有一些重叠子集,以避免时间之间的界限。
3.2。密度分析方法
本研究使用点密度和线密度来确定空间模式的交通事故。前者是通过计算单位面积上的事故的数量。后者是通过计算单位面积上的部分的长度。
密度的计算分析在GIS与社区的方法。例如,研究区域被划分为几个小广场与边长细胞d当计算事故点的密度。最终每个单元对应一个像素在输出地图。事故区域的细胞密度k是位于Dk事故和社区的半径设置为r。Nk(r)是事故的数量在一个社区中心的中心细胞k和半径r。点密度计算如下:
道路网密度区域的细胞k是位于Dk路。同样的,lk(r)是同一个小区内道路的长度。具体公式如下:
此外,d和r需要根据实际的计算。他们通常获得GIS的最低输出图像的高度和宽度,和最低的1/250th是30分之一。研究区在东经126.15和127.15之间,北纬46.09和45.52。最小经度和纬度后得到输出图像宽度转换为实际的距离。细胞的长度230米,附近1900米半径选择的密度分析。
3.3。聚类分析方法
聚类分析是一个更严格的数据分析的过程。空间聚类分析将物理或抽象对象的集合类空间数据中相似。反过来,类似的类的数据得到的空间模式(31日]。在这篇文章中,异常值分析在GIS探索事故严重程度的空间格局。首先,这种方法与传统的聚类分析方法,如层次或部门基于集群的方法。这些方法只能确定一个样本是否属于某个类别(32]。然而,局外人分析确定样品,不属于任何类别。这提供了一个更全面的空间格局分析事故。第二,离群值的计算分析是基于单独的事故样本点的属性。原始数据的属性在很大程度上保留了下来。这有助于深入研究事故。
离群值分析是通过计算当地莫兰的执行我的一个意外。它衡量每个事件点的属性之间的关系和其他邻近点的值。离群值计算分析如下: 在哪里当地莫兰的吗我统计的数据点我,n是事故的总数,和数据点的属性吗我和j摘要(对应于事故严重程度),是全球平均的属性,空间之间的重量吗我和j,是一个二阶采样矩阵的数据点的属性。
在形式上,可以表示为 在哪里分数计算数据点的 在哪里和可以表示为
有五种统计离群值分析结果:高聚类(高度差),高低集群(h l)、低聚类(L-H),新低集群(L-L),和无意义的。总的来说,95%的置信水平被用来表示统计学意义。换句话说,结果被认为是显著的值小于0.05。相应的z分数应该介于−1.96,+ 1.96之间根据正态分布。如果结果有统计学显著性我> 0,那么数据点有相同级别的高或低属性的相邻点。点的属性值比较平均属性值的所有数据点,以确定结果显示高度差或L-L集群。如果我< 0,那么数据点的性质差别很大的邻点,关键是局外人。
4所示。分析结果
4.1。密度分析
以下4.4.1。事故点的分布密度
单位面积上的事故的频率是一个指标。该指标用于衡量城市道路交通安全水平。在本节中,点密度分析是用来计算这个值。此外,交通事故产生的时间和空间分布。这种方法有助于确定事故热点时间波动的事故。此外,最大值归一化法用于正常密度值。该方法便于事故密度间隔的分类和比较。
根据相关文献[28事故发生),密度结果分为3个层次。密度0.5和0.8的值被用作两个截止点。密度值介于0和0.5表明事故的低密度区,值在0.5和0.8之间显示一个中间密度的事故,和值0.8至1表明事故的高密度区域。密度计算结果如图所示2。
(一)
(b)
(c)
(d)
如图2,交通事故的数量在春季和秋季是相似的。中间密度高事故的位置是相同的在这两个季节。此外,交通事故的数量在夏季高于其他季节。事故的中间密度高的地区在夏天也更广泛分布。高密度事故区域统计数据如表所示3。高密度事故地区被发现在同一行政区划在春天,夏天,秋天。在冬季,这些区域位于只有Daoli区。高密度区域是最大的在夏天,大约5公里2。高密度区域的事故发生率是最高的。
一个中间密度的区域事故的统计数据如表所示4。密度高的区域事故被发现在同一行政区划在春天,夏天,秋天,这些地区主要位于Daoli Daowai,香坊,南岗区地区。冬天的高密度区域事故除了包括巴航其他三个季节。一个中间的区域密度最大的事故是在夏天,约35.22公里2。车祸率在一个中间的地区在冬天事故密度最高。
总之,事故中间密度高的区域集中在大型购物中心,学校,医院(黄色圆圈),尤其是第一医院和附近的哈。这些地区在夏季和冬季大和较小的在春天和秋天。此外,事故密度在某些领域(黄色圆圈)被发现没有明显改变在时间和空间上通过届时系统技术。然而,在一些地区密度波动在空间和时间。例如,绿色的盒子图2 (d)没有发现在其他的季节。值得注意的是,有一个高密度的南部地区冬季事故(在图所反映出的盒子2 (b))不确定为高密度区域在其他的季节。
4.1.2。事故点密度考虑道路网密度的分布
单位面积上的事故点的密度决心在前一节中。然而,这种分析没有考虑道路网的密度。事故的时空模式没有充分体现。因此,一个新的时空事故模式是通过计算获得。这个计算是由分裂点密度的道路网密度(Dk事故/Dk路)获取事故频率单位道路长度。分工的密度值与上述一致。新模式,考虑道路网密度,如图3。
(一)
(b)
(c)
(d)
一个明显的变化如图3。事故的空间和时间模式显著不同的季节。此外,新领域和中间密度高的事故被确定。新的高密度区域事故的统计数据如表所示5。事故密度与行政区划的比较表明,在春天和秋天,事故发生在Daowai和香坊区,而在夏季和冬季,他们发生在Daoli区。事故密度和公路网络的比较表明,在春天和秋天,事故主要集中在Nanzhi道路,施工便道,Gongbin路和红旗街。在夏季和冬季,事故主要集中在先锋路和南直路。高密度的事故在秋天面积是最大的,在约14.11公里2。事故发生率在高密度地区最大的春天。
更新后的中间密度的区域事故的统计数据如表所示6。与行政区划进行比较表明,在春天,秋天,冬天,一个中间密度Daoli发生事故,Daowai,香坊地区。在夏天,一个中间密度的区域事故还包含南岗区区。道路网的比较表明,事故在每个赛季中间密度的区域主要是集中在Gongbin路,信阳路,Dongzhizhi路,Nanzhizhi道路,施工便道,等等。在夏季和秋季,这些地区还包括天恒大街等等。在冬天,他们包括hap路,禾欣路、和平路等等。中间的区域密度最大的事故是在夏天,约41.39公里2。意外率在一个中间密度的地区事故相似的季节。
总之,高密度的区域的大小事故在春季和冬季更小,同时,在夏季和秋季更大更广泛分布。此外,届时系统生成演示事故在每个季节的时空模式。一些地区(以盒1、2和3在图4随着时间的推移)基本上没有波动。在一些地区,有空间和时间模式的变化。这些领域的例子包括盒子5位数4 (b)和4 (c)和盒子4在图4 (d)。这些地区有一个低密度的事故在所有其他的季节。
(一)
(b)
(c)
(d)
相比之下,结果如图2,分析了相对密度高的区域中间和事故相似,虽然显著变化被观察到在某些领域。一些研究结果获得后考虑道路网密度。首先,一些地区是较轻的在图的颜色3比图2。例如,黄色的圆圈在图的地区2和绿色框如图2 (d)成为地区或中间密度较低的事故。这表明密度结果在这些地区由于过度密集的公路网。第二,新领域和中间密度高的事故被确定在每一个季节。事故的频率单位道路长度是高箱在图4和图53 (b)和盒子4在图3 (b)。最后,在该地区没有明显变化(盒3在图3 (b))。是否考虑事故的频率单位面积或单位道路长度、中级到高密度区域的事故在这个地区被确定。
4.2。聚类分析
前一节展示了结果事故的频率分析时不考虑事故的严重程度。流量管理器测量事故的严重性考虑不仅事故的频率也造成的财产损失和人员伤亡事故。事实上,如果一个地区偶尔会有一个特别严重的事故,它更值得关注的领域小事故频繁发生。因此,根据相关文献和数据,事故严重程度是本节分为3个层次(如表所示7)。
有一些模式的分布在时间和空间不同程度的交通事故。在这个分析,事故严重程度作为一个因素来评估事故的空间聚类的结果。聚类结果如图所示4。
盒子的位置在图4对应于图3。黑暗的红点(高度差)代表安全性事故类的。深蓝色的点(L-L)代表了最低严重性事故类。光红点(h l)显示高安全性事故点包含在几个空间范围被许多低幅度的事故点。浅蓝色的点(L-H)显示几个低幅度的事故点所占据的空间区域内许多安全性事故点。灰色的点表明事件点没有明显的集群功能。
如图4,不同类型的聚类特性被确定在每一个季节。巴航的某些地区显示安全性事故的趋势。同样,这种模式也观察到书房的西南部地区在春天。这些地区大多是集中在外围和郊区远离城市中心。相比之下,大多数事故都分散在城市中心。在某种程度上,交通事故会造成人员伤亡和财产损失,尽管大多数事故的严重程度很低。此外,东北地区的交通事故Daoli地区冬天L-L类,表明这个地区低幅度的事故是一个热点。
4.3。结合密度分析和聚类分析
这种方法使我们能够清楚地理解综合聚类和密度分析的结果。通过结合这些分析,事故严重程度在中间值和密度高的地区事故被确认。更重要的是,这些区域有一个排名,应该注意。流量管理器可能目标个人领域更好的管理和监管。例如,在春天,有三个中间密度高的区域事故(包围盒图4)。例如,米米是事故的数量在区域1聚类分析后,米= 1,2,3,4,5,代表高度差事故,h l, L-H,分别和L-L类和无意义的事故。所占的比例 ,这表明这个地区的可能性最终会表现出一定的聚类特性,计算吗
同样,聚类结果的比例计算每个季节使用方程(7)。计算结果如表所示8。一些地区的聚类结果是无意义的,并不在这个表。如表所示8L-L类、事故占事故的比例相对较大的区域(图14(一)),在区域1和4(图4 (b))和地区(图1和24 (d))。这一结果表明,虽然道路事故单位长度的频率大于在这些领域,事故的严重程度普遍较低。相反,G-G类事故占事故的比例相对较大的区域(图54 (c))。这个结果表明,事故单位道路长度的频率较高,事故的严重程度较高。
5。结论
(1)本文结合届时系统密度分析技术来研究交通事故的空间和时间模式的季节从事故频率的角度。结果表明,事故密度分布更分散在夏季和冬季道路网密度是不考虑。事故发生后考虑道路网密度,密度分布在夏季和秋季更加分散。(2)事故严重程度分为三个级别:事故造成财产损失,事故导致受伤和致命的事故。这三个层次的基础上,聚类分析被用来探索事故的空间和时间模式。得出了以下的结论。交通事故在城市中心主要显示h l和L-L类的特征。交通事故在城市的中心部分通常是低幅度的事故。相反,结果表明,具有高度差类性质的事故主要是外城区和郊区。这表明大多数交通事故在这些领域安全性事故。(3)密度分析是区域分析。这种方法反映了粗事故的时空模式的照片。聚类分析可以准确的事故点。城市地区容易发生事故的严重性被确定通过结合两种方法。结果表明,事故严重程度较低地区1在春天,夏天,冬天,尽管事故的频率更高。地区5在秋天,不仅是事故的频率更大而且事故的严重程度普遍较高。(4)由于数据的限制,进一步分析事故的原因导致空间模式是必要的。下一步将进行深入研究各种类型的交通事故的原因,考虑到道路特点和基础设施,以提供一个更详细的交通安全管理的依据。数据可用性
使用的数据来支持本研究的发现可以从相应的作者。
的利益冲突
作者宣称他们没有利益冲突有关的出版。
作者的贡献
Meina王,文汇张了概念化,方法,和准备初稿;王Meina导致软件;京易和Tiangang羌族导致验证;文汇张和Meina王了正式的分析;Xirui Meina Wang Chen,靖易造成数据管理;Xirui陈、王Meina和Tiangang羌族导致审查和编辑。所有作者已阅读及同意发布版本的手稿。
确认
作者要感谢哈尔滨公安局交通警察局提供相关数据的案例研究。这项研究是由国家重点研究和开发项目(2017 yfc0803901)和中央大学的基础研究基金(2572018 bg01)。