文摘
热点识别(HSID)是一个关键的部分进行安全评估。典型的网站排名方法常常是植根于使用经验贝叶斯(EB)方法来估计安全观察事故记录和预测事故频率基于类似的网站。EB的表现方法是高度相关的选择(即参照群体的网站。,roadway segments or intersections) similar to the target site from which safety performance functions (SPF) used to predict crash frequency will be developed. As crash data often contain underlying heterogeneity that, in essence, can make them appear to be generated from distinct subpopulations, methods are needed to select similar sites in a principled manner. To overcome this possible heterogeneity problem, EB-based HSID methods that use common clustering methodologies (e.g., mixture models,则和分层聚类)选择“类似”网站建设开发计划。clustering-based EB的性能方法使用真正的事故数据进行比较。HSID结果,计算在德克萨斯州的农村公路资金数据,表明这三个clustering-based EB分析方法优于传统的统计方法。因此,正确分类的道路段异构崩溃数据可以进一步提高HSID精度。
1。介绍
(即网络筛选识别网站。,roadway segments or intersections) with promise for safety treatments is an important task in road safety management [1- - - - - -7]。网站的识别与承诺,也称为崩溃热点或危险的位置,是第一个任务在整个安全管理过程8]。这项任务的一个广泛应用的方法是流行的经验贝叶斯(EB)方法。EB方法描述和推荐公路安全手册(9为道路安全管理)。这个方法是相对不敏感的随机波动的频率事故有两个线索结合起来,站点的观测碰撞频率和崩溃的预期数量计算从安全性能函数(SPF)均匀的网站(或参照组)(10,11]。EB方法可以向均数回归正确的偏见和完善的预测均值一个实体(12]。进一步,它是相对简单的实现相比,贝叶斯方法。
尽管EB的方法有几个优点,有几个问题可能会限制其广泛应用的方法。首先,人口(即参考的选择。,similar sites) influences the accuracy of the EB method. When estimating the safety performance function, the crash data are usually obtained from distinct geographic sites to ensure a sufficient sample size for valid statistical estimation [10]。因此,聚合碰撞数据通常包含异质性。当进行EB分析,参照群体必须类似于目标群体的几何设计、交通体积,等等。手动识别这样的参照群体是一个相当耗时的任务运输安全分析师的时间可以花在别的地方会更好。第二,EB过程相对比较复杂,需要相当大的运输安全分析师培训和经验来实现它的安全性评价。因此,准备所需的培训投资分析师进行EB评估可能也是一个障碍。因此,一些快速和肮脏的传统评价方法可以应用作为妥协的方便,这可能会产生问题的结果。
鉴于规范正确的参照群体对EB方法的准确性至关重要,本研究的主要目的将检查不同的聚类算法(如centroid-based集群、connectivity-based集群和发布出去是依靠集群)和开发一个程序来确定适当的参照群体EB分析。
2。相比之下热点识别方法
2.1。传统热点识别方法
一个常见的HSID方法是事故频率(AF)方法。网站排名基于房颤和热点被定义为站点的事故频率超过一些阈值(13]。的会计问题暴露在AF方法可以通过考虑事故率(AR)而不是事故频率。因此,基于“增大化现实”技术的方法已经被一些分析师和规范化使用由交通事故频率计数。虽然房颤和AR方法容易实现,他们很难占事故数据的随机性。因此,另一种流行的HSID方法被开发,被女修道院院长经验贝叶斯方法等。14]。几十年前推出以来,EB方法已经使用多次在许多安全性研究[15- - - - - -23]。使用EB方法的关键优势之一是它占向均数回归(RTM)的偏见。EB方法也可以帮助提高精度的情况下数量有限的历史事故数据可用于分析在给定的网站。在其核心,EB方法预测预期的事故数的加权组合在一个特定的网站事故现场基于历史数据和计数估计数量的事故在类似的位置决定从一个回归模型24]。回归模型通常称为防晒系数,通常考虑道路和交通特征(例如,平均每日流量)类似的网站。迄今为止,最受欢迎的选择防晒系数是负二项回归模型(25- - - - - -27]。通过EB HSID方法而言,EB估计计算每个站点,然后根据这些估计网站排名。网站超过阈值被认为是热点。除了EB的方法,另一个相对常见HSID方法植根于所谓“事故还原电位”(ARP)。ARP度量用于排名网站被减去估计计算事故从观察到的事故数计算在给定的网站,估计事故数从哪里来从数据回归模型开发了类似的网站的目标。在不同HSID方法,EB的方法可能是最广泛应用的方法筛选网站与潜在的安全治疗。
2.2。集群选择类似的网站
在接下来的部分中,我们介绍三种方法,可以用于将数据分组到不同的集群。正如上面提到的,事故数据经常表现出异质性,会影响模型估计如果没有正确地占。这里的想法是集群崩溃数据分成不同的组,希望使在某种程度上与底层的亚种群崩溃数据生成。然后,单独的负二项回归模型(即(NB)。,SPFs) can be developed based on each cluster and EB estimates can then be computed using an SPF that hopefully considers sites that truly are “similar” to the site in question.
2.2.1。NB的广义有限混合回归模型
NB的广义有限混合回归模型组件(GFMNB -)假设遵循NB的混合分布,如下所示(28]: 在哪里组件的重量吗(重量参数) 和 ;是组件的数量; 组件的平均速度 ; 协变量的向量;是一个向量回归系数的组件 ; 为 ;和向量组件的参数吗 。
GFMNB -模型,开发重量参数的方程所示(4)。通过使用协变量的函数,GFMNB -模型使每个站点有不同的重量为每个组件依赖于特定场地协变量的值。邹et al。28)展示了这种额外的灵活性可以带来更好的分类结果 在哪里是组件的估计重量在段 ; 组件的估计系数吗和是未知系数的数量;和协变量的向量。
2.2.2。聚类则
的聚类算法则通常被归因于劳埃德(29日)和安德森(30.),它是一个最流行的今天在使用聚类算法。算法的输入数据点;在这里,每个数据点可以被视为一个路段的事故数据集和其相应的描述性的变量(例如,车道宽度和平均每日流量(ADT))。与数据,集群中心初始化。集群中心可以选择随机点在特征空间(即。,points that do not exist in the data set could be selected) and random data points in the feature space (i.e., only points in the dataset can be selected) or through a variety of other methods. For this project, the initialization using使用随机数据点的数据集。算法然后收益在一个迭代过程直到收敛,收敛的定义是在哪里的集群作业不改变。每个数据点的第一步迭代分配到集群,集群中心和数据点之间的距离本身是最小的;距离度量用于这项工作是欧氏距离定义为所示(5)。然后,第二步重新计算每个集群中心。该算法的伪代码如下所示: 在哪里是两个点之间的欧氏距离;是数据点指数,从1: ; 是可变的指数,从1:为变量;和是两个数据点的规范。
k - means算法
Cluster-Assignment一步 在哪里数据点集群作业吗 ; 是中心的集群 ;和所有其他变量被定义为之前。
Center-Update一步 在哪里基数(数据点的数量)在集群和所有其他变量被定义为之前。
2.2.3。分层聚类
层次聚类方法不同——聚类结果不依赖于集群的数量(即使用。,the results will always be the same for a given number of clusters) nor an initialization. Rather, they are rooted in the use of a dissimilarity measure defined between clusters that is defined in terms of all possible pairwise combinations of data points within two given clusters. In this research, agglomerative (i.e., bottom-up) hierarchical clustering in the form of complete linkage clustering was considered. Agglomerative clustering methods (e.g., complete linkage, single linkage, and average linkage) take the data points (i.e., road segments and their corresponding descriptors) as inputs and begin with each data point as its own cluster; a lone data point forming its own cluster is also known as a singleton. For complete linkage clustering, the algorithm proceeds in a total of 步骤(即。,one step less than the total number of data points in the dataset) and at each step, the two clusters with the smallest intergroup dissimilarity measure are joined to form a new cluster. Thus, in each successive step, the number of clusters is reduced by one. For complete linkage clustering the intergroup dissimilarity is defined as follows [31日]: 在哪里 两个任意集群和吗
因此,对于每一个步骤的完整链接聚类算法,最小值的两个集群最大类间距离连接。
2.3。基于分类EB方法
在这一点上是很重要的澄清这个工作的主要贡献。众所周知,聚合碰撞可能有某种程度的异质性,好像他们是来自多个不同的亚种。因此,如果一个人能够试图捕捉这异质性和组数据为不同的单位,理想情况下,基于他们的亚种群生成,更好的安全性和估计HSID排名可能被获得。因此,三种类型的聚类算法(GFMNB -基于模型的,——聚类、层次聚类完成链接)提出了集群的数据划分为不同的子组,希望对应的亚种群生成的数据。集群的主要想法/应用程序(即是定义组。,clusters) of data points such that all points assigned to/belonging to a given cluster are closer/more similar to the points in that cluster than any other cluster [31日]。
聚类方法存在一个理想的手段来代表/描述事故数据内的异质性。因此,我们运用clustering-based EB方法在这项研究作为一个新的热点识别的方法。对于这些方法,提到的是三种类型的集群,HSID目的的分类方法有四个主要步骤如下。第一,完整的输入数据集中到崩溃通过GFMNB——集群模型中,——聚类算法、层次聚类算法。在这项研究中,集群的数量考虑设置等于组件选择GFMNB——的数量模型,它本身就是选择贝叶斯信息准则的基础上(BIC)。然而,最终的选择选择数量的集群和数量的组件在GFMNB -模型分析。算法的第二步就是把数据分成组的基础上,应用聚类算法的结果。算法的第三步NB的要求估计回归模型(即。防晒指数)为每个子组/集群数据和使用这些粮食安全特别计划的进一步代EB估计为每个站点。例如,如果 ,两个粮食安全特别计划将在每个估计和数据两组将EB估计计算通过相应的防晒指数的应用。第四和最后,EB估计所有网站所有子组聚合和排名,之后热点识别是基于阈值或其他方法。从这里开始,基于分类HSID方法提到的将被称为:GFMNB-based EB方法,方法EB方法,分别和hierarchical-based EB方法。基于分类的总结EB HSID方法如表所示1。
2.4。热点识别方法的评估标准
为目的的评估HSID方法的性能,需要一些标准化的测试过程。最终,分析师将关注HSID方法的能力,找到易于发生事故的地点和适当排名网站根据风险。这些问题都直接关系到安全优先治疗的总体目标在资金有限的环境热点。而大量的测试是可用的和决定哪些测试是最优的还不是很清楚,有人可能会说,“好”表现(即将到来的测试描述中描述的)跨多个测试可能是一个合理的指标HSID方法的整体性能。因此,我们考虑三个常用测试归因于Cheng和华盛顿(32]:一致性测试(SCT),该方法一致性测试(MCT),和总排名差异测试(有)。关于这三种测试的更多信息,有兴趣的读者被称为程和华盛顿(32]。
3所示。数据和分析
3.1。数据描述
为了检查的有效性,本文提供的方法,选择使用一个数据集的研究小组使用在许多先前的安全性研究,这是德州农村公路事故数据集分割。收集的数据集包含事故数量超过1499农村的公路段历时5年,1997 - 2001年国家公路合作研究项目(砂浆)17 - 29日项目(33]。因为上述测试评估的热点识别方法需要进行比较的数据从不同时期,1499年的数据集由观察被分解成两个时间的子集。第一个子集,称为“时间1”从今以后,包含原始数据集的数据记录在1997年和1998年。第二子集,称为“时间2”从今以后,包含原始数据集的数据记录下来,1999年,2000年和2001年。因此,这两个子集的结合是原始数据集以1499分。变量来描述部分收集的和被认为是独立变量在分析包括分析期间日均流量(),车道宽度(LW,英尺),总肩宽(即。,the sum of shoulder width on both sides of the roadway in feet, SW in feet), and curve density (i.e., the number of curves per mile, CD). The dependent variable in the analysis is the number of crashes observed on each segment over the analysis period, and another variable, segment length ( ,在英里),被认为是一个偏移量的回归。总结提出了数据集的统计数据表2。
3.2。建模结果
研究基于分类EB方法,GFMNB -模型由事故记录时间1和2,分别。每个时间段的数据被用来估计有限混合模型组件;也就是说,单独的NB模型估计为每个类型的混合模型,结合在一起形成一个加权估计。然后,GMFNB -模型被用来作为clustering-based EB的基础方法。也就是说,在模型中使用的组件数量被选为集群的数量的基础用于分组的崩溃数据在每个上述聚类方法。
当估算GFMNB -模型中,也许最主要的问题是确定应该使用多少组件模型中(即。,选择)。为了选择组件的数量为每个模型在每个时期,公园等的方法。34)是应用于本研究。在这种方法下,分析师与越来越多的组件构建有限混合模型(两个以上)并选择最终的模型(和数量的组件)通过拟合优度指标,如Akaike信息准则(AIC)或者前面提到的BIC,平衡组件的数量和整体模型适合(通过对数似测量)。Eluru et al。35)指出,BIC比AIC的应用更严格的处罚根据数量的组件,因此它可能是更健壮的防止过度拟合。因此,BIC被选为手段的选择组件的数量有限混合模型的两个时间段: 在哪里的对数似是模型 ; 有限混合模型组件的数量 ;和样本大小(即。,number of sites in dataset).
在这项研究中,GFMNB -从事故数据模型开发时间与越来越多的组件1和2 3或4。图1表明使用 (即。,finite mixture models with two components) leads to the best goodness-of-fit as indicated by the lowest value of BIC. Hence, the number of components is selected as 和GFMNB -模型可以被表示为GFMNB-2模型。重要的是要注意,一般来说, 可能并不总是最优数量的组件和选择将取决于数据。也就是说,BIC选择一个合理的方法来使用 。
通过检查图1,一个可以看到BIC值报告GFMNB-2模型不是一样大的常规NB模型( )在相应的时间段表明混合物模型具有更好的拟合优度。进一步的选择 基于BIC似乎暗示的存在两个不同的亚种群内的事故数据对应于每个时间段,而不是一个孤独的人口数据。
3.3。分组结果
根据GFMNB——的结果拟合过程,确定GFMNB模型有两个组件符合数据最好。因此,对于每个HSID clustering-based-EB手续的,完整的事故数据分成两组每个时期(即。四组总),NB模型估计和相应的EB估计计算。也就是说,给定时间段的事故数据1和2,前面所提到的三种聚类算法(即,则,分层与完整的链接,并估计GFMNB -模型)是应用于群每个时间段的数据分成两个集群,EB估计计算。
表3显示了每个组件分组结果,在每个聚类方法对时间考虑。对于每一个组件,样本容量以及平均值和标准偏差(SD)的每个变量数据集(如前所述)。从表中可以看出,一般来说,意味着值车道宽度、路肩宽度,区段长度组件之间的差别并不是很大。说,在某些情况下,特别是对于分组基于层次聚类时间2,组件之间碰撞的平均数量显著不同。此外,有实质性差异的平均值平均每日流量()组件之间所有聚类方法考虑在这两个时间段。这种趋势表明,数据被认为这里可能来自潜在的亚种群交通量是族群成员的定义特征的异质性,因此一个好的描述符数据。
崩溃数据集中每个时间段根据前面所提到的三种聚类方法,EB估计之后获得的估计是NB回归模型的两个组件对应于给定聚类方法对于一个给定的时期。当解释结果从今以后,一个人应该考虑使用的样本量估计NB模型。例如,样本的大小(即“组件1”。,one grouping) for Time Period 2 as defined via hierarchical clustering with complete linkage has only 66 data points. Thus, modeling results associated with this group (namely, the results of the SPF and corresponding EB estimates) and the overall EB estimates for Time Period 2 as determined via hierarchical clustering (i.e., the aggregation of the EB estimates for components 1 and 2) should be interpreted with caution.
3.4。测试结果
在本节中,评估的6个不同HSID方法,房颤,基于“增大化现实”技术,EB(在这里,所有的数据都被认为是作为从一个人口),GFMNB-based EB的方法, 方法EB方法,hierarchical-based-EB方法,进行使用的三个主要测试从程和华盛顿32]。所有测试过程涉及到两个不同时期的比较,我们使用在表定义的时间段2。进一步,我们考虑三个不同场景的高风险网站的数量在每个HSID方法选择的考虑。这些场景对应考虑1%、5%、和10%的网站作为高风险(例如, 、0.05和0.10)。例如,在这项研究中,当 (即,共有大约150个网站。,~10% of the 1,499 total sites) will be considered as high-risk, and their data will be used in calculation of the test statistics for the various HSID methods.
表4显示的结果六HSID方法考虑下这个网站的一致性测试。正如上面提到的,SCT的目的是测量一致性方法确定站点的高风险。最基本的原理是,高风险网站应该显示持续高崩溃计数随着时间的推移,因此SCT统计量的值越高,执行HSID的更好的方法。从表中可以看出,表现最差的方法在所有高风险网站识别(即截止水平。,所有值)是基于“增大化现实”技术的方法。当百分之一的网站都被认为是高风险的,传统的EB的方法,方法EB方法,hierarchical-based EB方法都执行同样。的情况下,5%和10%的网站都被认为是高风险的,方法EB方法被确定为表现最好的HSID方法根据SCT。也就是说,在这两种情况下,价值的SCT hierarchical-based-EB方法检验统计量给出了这些获得的值非常接近方法方法,表明它也似乎在HSID那样好。
六HSID方法评价结果的一致性测试方法如表所示4。MCT旨在评估一致的识别相同的高风险网站在不同的时间段。因此,MCT检验统计量的值越高,性能越好(即HSID方法。,更高的值意味着更多的网站被确定为高风险时期考虑)。从表4,你会发现,在所有三个截止水平比例的网站需要考虑高风险、GFMNB-based EB方法执行最好的。也就是说,案件中10%的网站都被认为是高风险的,方法方法执行。所有截止的水平,此外,所有clustering-based EB方法的结果(例如,GFMNB,————和hierarchical-based)表现出非常相似的性能。作为SCT的情况,基于“增大化现实”技术的一贯表现最糟糕的方法在所有三个截止水平比例的网站被认为是高风险的。
表4礼物HSID-procedure评价的结果在总排名差异测试。再一次,这个测试是基于一致的识别高风险网站的时间,但在这里,网站的排名确定为高风险在一个时间段比较相同的排名网站在另一个时间。因此,有测试统计值越小,越在HSID性能的方法。从表中可以看出,GFMNB-based EB方法产量最好的HSID性能在所有三个截止水平的比例的网站被认为是高风险的。根据这个测试,其他clustering-based EB方法(例如,实现方法和hierarchical-based)比天真的房颤和AR方法在所有截止值也比EB方法规定的5%和10%。,就像前两HSID性能测试,HSID一贯执行的基于“增大化现实”技术方法水平最差在所有三个截止比例的网站被认为是高风险的。
总的来说,前面的测试表明,GFMNB-based EB方法似乎表现出最强的HSID性能在所有三个测试和在不同截水平的比例的网站被认为是高风险的。也就是说,从其他clustering-based EB方法获得的结果(例如,实现方法和hierarchical-based)通常是关闭并倾向于比房颤,基于“增大化现实”技术和标准的EB的方法。从所有的测试,看来AR方法执行最坏的打算。以来这种行为可能是一个可能的解释测试站点都是乡村公路段,许多可能出现低ADT值,因此,正如上面提到的,少量的网站可能过多高风险以来,基于“增大化现实”技术的计算可实现交通计数。最终HSID方法时自己利用EB的方法计算安全估计网站排名出现之前执行比天真的房颤和基于“增大化现实”技术的方法。这一发现与许多先前的研究包括[是一致的17,36,37]。
3.5。讨论
从前面分析,似乎HSID GFMNB-based EB程序执行时最好的评估与前面所提到的三种测试程序(32在德州农村的公路事故数据集。说,似乎所有EB-based方法通常比天真的方法,尤其是基于“增大化现实”技术HSID方法。一个可能的原因EB-based HSID方法可能是由于他们表现更好的使用观察历史事故数据和预测事故数与SPF类似的网站。此外,EB RTM偏见的方法能够调整。也就是说,传统的EB HSID方法不是没有局限性。主要的限制,可能出现当有相当程度的异质性等事故数据使其崩溃数据似乎源自不同的亚种。这样的异质性可能会出现大量的事故数据收集来自不同地区显著的地理和各种其他特定场地条件。通常,事故数据聚合,以确保足够的样本大小可用于模型估计(即。,为了减少回归系数的标准误差值)。为了解决这一问题的会计数据的异构性,提出了三种clustering-based EB方法在这个报告。这些方法背后的理念是集团整体的崩溃数据集(即。, full list of study sites) into smaller subsets such that the site in each subset was more similar to sites within their groups than sites in other groups according to features, such as traffic volume, lane width, and other predictors. Further, it was hoped that such clustering could potentially help uncover the underlying groups/subpopulations from which the data could have been generated. Indeed, it appears that the clustering-based EB methods that applied——、分层,GFMNB-based集群能够分析异构数据和超越HSID而言更传统的方法。
虽然clustering-based EB HSID方法有几个好处,他们不是没有局限性。也许clustering-based EB的最大限制的方法是,在某些情况下,他们可以集群数据分组与相对较小的样本大小。然后,回归模型(即。,SPFs) developed from these small samples are more likely to exhibit their own issues such as biases in their coefficient estimates. This issue can further be compounded when analysts interpret the biased results and have the potential to make erroneous inferences/conclusions. As such, it is important that one be cognizant of the sample sizes of the clusters and what impacts they may have on model estimates and resulting inference [38]。最终一如既往地鼓励分析师解释所有的结果,尤其是那些相应的回归模型由小样本(例如,100个或更少的网站)和谨慎。
4所示。结论
本研究介绍了三个clustering-based EB热点识别目的的方法。聚类方法被认为是GFMNB-g模型,——聚类、层次聚类完成链接。新开发clustering-based EB HSID方法在性能方面比较传统HSID方法,包括EB方法,以及天真的房颤和AR方法,三种方法比较性能在不同时间段HSID由程和华盛顿(32]。当研究HSID结果基于不可分割的方法应用到德州农村公路事故数据,结果表明,所有三个clustering-based EB分析方法优于传统的统计方法。此外,似乎可以增强HSID适当分类的准确性巷道部分根据碰撞的异质性数据(即。发展计划之前,聚类数据用于EB估计)。说,一个人应该总是小心谨慎当巷道分类段划分为集群道路段分类不当会导致错误的结果(例如,偏置系数估计从粮食安全特别计划开发小样本大小)。尽管提出clustering-based EB尚未准备好实际应用方法,运输安全分析师可以使用clustering-based EB EB估计的计算方法,避免手动识别类似的团体在异构数据集,一个任务,很难作为底层亚种群的数据通常是未知的。未来的工作可以评估开发的性能测量评估HSID整体性能的三个clustering-based EB(即方法。时,确定聚类方法是最好的,最好使用每个)。
的利益冲突
作者宣称没有利益冲突。
确认
作者要感谢主多米尼克博士从德州农工大学慷慨地为我们提供德州崩溃数据。这项研究是由西北太平洋运输协会共同主办(合同编号。DTRT13-G-UTC40),中国国家自然科学基金(批准号51608386,格兰特没有。71601143),和上海帆船项目(批准号16 yf1411900)。