科学的规划

在这一页上

文摘介绍方法结果结论数据可用性的利益冲突确认引用版权相关文章

特殊的问题

大数据挖掘和应用在智能城市

把这个特殊的问题

研究文章|开放获取

体积2021年| 文章的ID4702669| https://doi.org/10.1155/2021/4702669

动态的方法识别的最大速度限制基于电子收费数据的高速公路

福民邹,¹ 冯郭,¹ 君山田,² Sijie罗 ,² 项羽,² 清谷,³ 和Lyuchao廖⁴

学术编辑器: 朱小

收到了 05年8月2021年

修改后的 2021年10月16日

接受 2021年11月02

发表 2021年11月18日

文摘

克服的缺点的最大限速信息高速公路(即。,long update cycle and great complexity of information recognition), in this work, an Electronic Toll Collection (ETC) gantry data-based method for dynamically identifying the maximum speed limit information of expressways is proposed. Firstly, the characteristics of the ETC gantry data are analyzed, and then data are cleaned and reconstructed, after which an algorithm is proposed for constructing a vehicle travel speed data set. Secondly, the speed feature vector model of the road section is established by taking the relationship among the speed distribution feature, time domain feature, and the maximum speed limit of the road section into consideration. Then, a data supplement algorithm is constructed to solve the problem of the imbalance of data samples. Finally, the combined GC-XGBoost classification algorithm is used to train and learn the potential speed limit features, and it is verified through the Fujian Provincial Expressway ETC data and the speed limit information provided by the Fujian Traffic Police. The result shows that the accuracy of the method in the recognition of the maximum limited speed information of the expressway is 97.5%. Compared with the traditional limited speed information recognition and extraction methods, the proposed approach can identify the maximum limited speed information of each section of the expressway more efficiently. It can also accurately identify the dynamic change of the maximum limited speed information, which is able to provide data support for intelligent expressway management systems and map providers.

1。介绍

近年来,中国的高速公路等系统技术已迅速发展。越来越多的车辆等设备安装。在驾驶这些车辆与发射等,导致大量等数据。目前,累积等有超过2.2亿的用户,车主的利用率是78%1]。此外,等龙门还可以与人工收费系统用户(MTC)。因此,等龙门系统几乎收集所有车辆在高速公路的交通信息,反映整个高速公路的交通状况,可以为信息化建设提供强有力的支持,汽车基础设施建设合作,和自动驾驶2智能高速公路的]。获得的最大限速信息高速公路的每个部分是智能高速公路管理的一个重要组成部分3];它可以为司机提供高速公路限速信息(4,5),以避免交通事故引起的超速和提供可靠的认知和决策自主车辆行驶速度。然而,最大限速信息是动态的,多变的。相关管理部门将调整的限速信息根据道路交通流路段,道路养护条件,交通事故的数量(6- - - - - -8]。目前,收集限速标识信息的方法主要是手工收集,然后更新的数据上传到系统在一段时间内。然而,这种方法有两个缺点:第一,它需要专业人员前往高速公路和收集限速信息,这巨大的人力和物力成本。第二,它有一个长更新周期,司机不能获得最新的限速信息,导致开车时安全隐患,交通效率的道路也就相应地减少了。因此,研究如何自动收集限速信息,动态地确定最大限速信息实时的道路上具有研究意义。

交通流预测和旅行时间预测是交通领域的研究热点。大部分的研究方法和速度限制识别是基于机器学习算法的监督学习。所不同的是,速度限制识别是一个分类问题,和交通流预测和旅行时间预测回归问题。道路最高限速信息的识别主要依赖于图像识别技术(9- - - - - -12)和浮动车轨迹数据挖掘技术。图像识别技术获得每条道路的限速信息识别的限速信息交通标志在路上。机器学习是广泛应用于各种研究领域13]。支持向量机(SVM) [14),极端学习机(ELM) [15),多任务卷积神经网络(MTCNN) [16用于训练和学习限速标志特性来实现最大的识别道路速度限制。虽然这些方法相对合适的识别效果,他们要求调查者收集路上的限速标志的照片,会消耗大量的资源。此外,收集周期长,无法达到实时和动态识别最大限速信息。浮动车的轨迹数据挖掘、浮动车配备全球定位系统,它记录了时间,地点,和其他信息的车辆,和浮动车轨迹数据挖掘可以获得所有浮动车的行驶速度特性的道路上(17]。机器学习算法(18能够学习的最大限速功能在道路的车速信息实现最高限速的识别信息。然而,浮动车占所有汽车的一小部分,不能完全反映车辆的速度在高速公路上。因此,最大速度限制识别基于浮动车数据仍然有一定的缺陷。

针对高成本的限速标志识别和轨迹数据识别的缺点,本研究提出了一种利用实时交通数据收集的方法等龙门系统动态识别高速公路的最大速度限制,而解决问题的手册信息收集的高成本和不完整的车辆数据。首先,集构造算法和部分路段速度行驶速度异常滤波算法是为了保证样本数据的完整性和可靠性。然后,限速功能的速度特征向量模型构造我的车速的限速功能在不同的方面。最后,以534年的道路最高限速信息部分福建省高速公路的样本集,然后multivoting合奏算法用于执行监督分类培训和交叉验证在路上速度特性。测试结果表明,该方法可以确定最大限速信息和认识到最大速度限制的动态变化信息。

本文的贡献可以概括如下。首先,构建的算法速度的路段,可以解决这个问题的速度路段不能计算由于缺乏发射的交易记录等,获得每个路段上车辆的速度准确和完全。第二,这个提议的提取特征路段速度从不同方面构建路段速度特征向量模型和我之间的潜在关联特性车辆的速度在高速公路和道路限速信息。第三,高速公路的最大速度限制的动态识别方法提出了识别高速公路的最大速度限制,验证该方法的有效性通过真正的最高限速信息,和科学性验证通过比较大量的预测算法。

本文组织如下。部分1介绍了道路限速的研究方法识别。部分2定义了相关的概念在这工作。部分3描述了每个部分的动态方法,高速公路最高时速限制。部分4展示了实验结果和分析。部分5结论和未来的工作。

2。相关定义

定义1。每个等统称为龙门高速公路 ,和两个相邻在路上构成一个高速公路部分,被称为 , ,和 ,如图1,在那里路段的起点,的终点路段,路段的实际距离。

定义2。高速公路网络,由所有的高速公路的部分在这个提议,称为。

定义3。一组发射等,在高速公路开车时一辆车通过,形成一系列的节点按时间顺序称为轨迹 , , , , 。轨迹点,包括节点时间和属性 , 的标签吗我th节点通过的车辆车辆经过时信息交互时间节点。轨迹的起点,轨迹的终点。

定义4。车辆的平均速度通过某一路段叫做路段速度。所示的计算方法是以下方程: 在哪里路段的实际长度,当车辆通过道路的起点部分,然后呢当车辆通过道路的终点。

定义5。道路部分描述的速度色散的色散的措施通过路段的车辆的平均速度。车辆在高速公路的部分速度在一段时间内构成的速度设置部分。的价值排序速度:速度85 ,和15百分位的速度。速度色散指数可以表示为值范围越大,越高速度的信息。

定义6。速度限制包括最低速度限制和最大速度限制。限速值通常是一个整数10的倍数。在本文中,我们只讨论最大速度限制。

3所示。方法

3.1。等数据预处理

3.1.1。等数据清理

等龙门系统可以产生大量的交易数据在短时间内。由于系统错误,信息交流中断,恶劣天气条件下,这些因素会导致异常的数据会影响结果。为了减少干扰,数据需要预处理,主要包括以下几方面。

数据冗余:多个数据之间的重复。每辆车通过的交易信息等龙门应该是唯一的。然而,由于问题的数据采集、传输、存储过程中,和其他的中间环节,它可以导致重复数据上传和重复,造成数据冗余。因此,这些数据需要清理。

数据误差。数据记录不符合正常的驾驶规则,包括两个发射等,控制不同的驾驶方向记录同样的车辆在同一时间,和不同的传递记录相同的车辆在同一时间被记录。这些数据需要过滤或删除。

3.1.2。车辆在路段速度识别算法

为了计算路段的速度分布,有必要获得每个龙门的所有车辆的交易数据。然而,龙门事务数据可能丢失。因此,所有交通数据和道路网络数据需要检查和补充,以确保龙门事务数据的完整性。交易数据后等龙门系统最初清洗,轨迹每辆车的构造按时间顺序根据每个龙门的交易数据。遍历每个相邻等龙门,在一个接一个。检查是否路段形成的两个门属于高速公路网络。如果路段属于高速公路网络G,速度车辆通过的部分直接生成。和速度表示如下: 在哪里代表了一定时期内的所有车辆的数量的路段和代表路段上的每个车辆的平均速度在一定的时期。

如果不属于高速公路道路网吗 ,这意味着数据发射中间部分失踪。和路径搜索算法的基础上 , 需要执行的填补缺失的龙门事务数据。如图2如果形成的路段和在道路网不能查询G,使用和为基本节点。可行的路径 , , , 可以通过路径搜索。和辅助节点,平均速度吗之间的和作为速度吗 , , 。

确保平均速度的可靠性 ,最低速度将高速驾驶30公里/小时,最大速度高速驾驶160公里/小时(19]。如果平均速度值不在范围内 ,在哪里之间的所有路段的平均速度吗和 ,它将被删除异常数据。节速度数据结构算法的具体过程算法所示1。

输入:一辆车的轨迹数据D高速公路路网数据G
输出:路段的速度数据
(1)	功能部分(D)/ /车辆轨迹数据分为各个部分的数据
(2)	D= {D₁,D_2,…,D_E},D_我= {N_我,T_我}
(3)	为我= 0 e 1做的事情
(4)	节点_我、节点_{我+ 1}←D_i.N,D_{我+ 1. n}/ /提取两个相邻数据点的节点信息
(5)	时间_我,时间_{我+ 1}←D_信息技术,D_{我+ 1. t}/ /提取两个相邻数据点的时间信息
(6)	δ=时间_{我+ 1}-时间_我/ /计算时差两个相邻数据点
(7)	R_智商←(节点_我、节点_{我+ 1})/ /重组前后车辆的节点信息传递部分
(8)	R_信息技术←(时间_我,时间_{我+ 1})/ /车辆的前后时间信息传递部分
(9)	R_我←(路_智商、道路_信息技术δ)
(10)	Sec←{R₀,R₁R、…_{e 1}}/ /封装到秒
(11)	结束了
(12)	返回交会
(13)	结束功能
(14)	秒= {R₁,R_2,…,R_米}←(D)部分
(15)	为每一个R_j在证券交易委员会(j= 0,1,2,…,m)做/ /从数据中提取道路信息,R_j= (问_j,T_jδ_j)
(16)	如果问_j在G然后
(17)	距离_k←G_k。_距离/ /得到路段距离高速公路网络k=问_j
(18)	t=秒_j.delta/ /提取车辆通过道路所需的时间部分
(19)	=距离_k/t/ /通过路段车辆的速度
(20)	R_丰富多彩←/ /添加速度属性
(21)	如果问_j不是在G/ /道路信息不能被发现在高速公路网络,还有狼狈的两个节点之间的路段节点信息
(22)	{N₁N₂、…N_Z}←shortest_path (G,N_j)/ /搜索两个节点之间的最短路径,路径的节点数据集,问_j= (N₁,N_Z)
(23)	一个= {一个₁,一个₂,…_{z 1}}←{N₁N₂、…N_Z}/ /转换路径节点数据集路段数据集
(24)	路径= {}
(25)	为一个_我在一个那么
(26)	路径={路径₁、路径₂路径,…_{z 1}}←G_k。_距离/ /得到路段距离高速公路网络,和添加到路径k=一个_我
(27)	结束了
(28)	一个。_距离←总和(路径)
(28)	V_一个←。_距离/R_j。_δ
(29)	如果V_一个≥V_最小值和V_一个≤V_马克斯然后
(30)	为一个_我在一个那么
(31)	t_我←/V_一个/ /计算时差
(32)	t₁,t₂←R_j。_T/ /提取时间分别通过两个节点
(33)	如果我= 1然后
(34)	一个_i.tq←t₁/ /车辆进入入口的时候一个_我
(35)	一个_i.th←t₁+t_我/ /车辆离开时入口一个_我
(36)	一个_i.delta←t_我/ /时差
(37)	其他的
(38)	一个_i.tq←t₁+ t_张/ /车辆进入入口的时候一个_我
(39)	一个_i.th←t₁+t_我/ /车辆离开时入口一个_我
(40)	一个_i.delta←t_我- t_张/ /时间经过的路段
(41)	一个_信息技术←(一个_i.tq,一个_i.th)
(42)	一个_注射←V_一个
(43)	结束了
(44)	←{Q TδV} / /得到纠正部分信息,包括路段节点,时间和路段速度属性
(45)	R_j←/ /替换原R_j,并生成一个新的R_j
(46)	如果
(47)	如果
(48)	结束了
(49)	speed_data←{R₀,R₁、…R_c}/ /生成速度路段的数据

3.1.3。离群值为路段信息的检测算法

为了更好地分析每个部分的路段速度分布特性,噪声数据清洗模型检测和消除数据中的异常值。模型的基本思想是使用箱线图的速度上限和下限检测异常点,并确定阈值区间过滤速度异常数据。收集大量的条件下高速公路等交易数据,根据中心极限定理,路段速度数据集应该是正态分布。箱线图和速度的上限和下限,满足3σ正态分布的区间范围可以更好的证明的合理性实现通过箱线图分析异常值检测和过滤。如图3有6箱线图中的元素点,其中是1/4分割点;中位数;是3/4分割点;和 ,之间的距离是什么和。也有上限和下限。在这里,代表了交通流的速度值大于25%,代表着速度值大于50%的交通流量,和代表了交通流的速度值大于75%。因此,上限和下限的噪声数据清洗阈值模型,表示如下:

然后,获得速度滤波的阈值范围如下:

其中,路段的速度数据的范围之内保留,异常数据被删除。

3.2。特征向量模型的高速公路速度

汽车行驶在高速公路有不同的速度在不同时间或不同的道路部分。通过统计分析功能的交通路段的速度,潜在的联系车辆和道路速度限制的速度可以获得的信息,在该路段速度构造特征向量模型。特征向量主要分为三类,第一个是frequency-speed百分位的功能,第二个是路段速度评价功能,第三个是路段速度时域特性。

3.2.1之上。路段Frequency-Speed百分位特性

路段frequency-speed百分位特性反映了部分速度的分布在不同的时间,包括50百分位的速度值,上下第25百分位,和上下15百分位的路段的速度设置,然后将它转换成多维特征向量。它可以表示如下: 在哪里分别是,15日,25日,五十,75,85,和95百分位总截面的速度分布,它可以描述整个路段的速度分布。

3.2.2。路段速度评价功能

描述路段速度特性在频域相关的评价指标,包括平均速度、速度标准偏差,和速度色散,从而转变成多维特征向量。它是表达如下: 在哪里多数的部分速度,代表车辆速度的一般水平统计;和是整个路段的平均间隔速度和标准偏差 ,分别;和属性的速度色散指数,反映了变化的范围和速度数据的分散范围。

3.2.3。路段速度时域特性

路段速度时域特性反映了交通流的速度进化规律在不同的路段在不同速度条件有限。白天如果节速度数据分析没有考虑不同时期的特点,它是容易受到道路拥堵和其他因素在个别时期,它不能反映速度和道路的演化特征。因此,有必要全面整合的速度特征信息公路在不同时期。一整天分为24个时间段,表示为0,1,…分别,23岁。然后,采矿和计数在每个时期每个路段的速度信息进行寻找每个路段的速度变化规律。如图3,多维速度时域特征向量构造。它是表达如下: 在哪里是每个时期的路段平均速度的数据样本;也就是24个时间段的路段平均速度在整个天,由大变小,需要第一n值。在这里,我们采取前6的值,避免造成的干扰相对较低的路段速度引起的交通拥堵或在某些时期道路维护。

3.3。样本不平衡处理

摘要道路速度限制分类值构造符合80公里/小时,100公里/小时,110公里/小时,120 km / h中指定的“道路限速标志设计规范”(JTG / T 3381-02-2020)和“高速公路工程技术标准”(JTG b01 - 2003)。因为大多数我们收集的数据是100 km / h,这意味着100 km / h的数据大小是远远超过其他三种类型的样本数据,80公里/小时,110公里/小时,120公里/小时。这将创建一个样本类别之间的不平衡。因此,为了解决数据样本不平衡的问题,有两种处理方法,包括采样过密和欠采样(20.]。过采样是复制少数样品多次扩大少数样本的数据量。这过采样方法将复制先前存在的样本数据,这将导致模型训练过程中一定程度的过度拟合。欠采样是随机删除部分数据的大部分样品或选择一个样本的一部分这类样本数据根据一定比例。这种方法只会导致模型的学习样本数据规则的一部分;因此,它不能有效反映完整的模式样本的类别。为了缓解这些问题,一种改进的随机采样过密法SOMTE [21)是利用少数样本进行了分析,利用他们的相似性特征空间添加模拟新样本数据集。少数样本数量的扩大,原始数据集和类别之间的色散是减少;因此,失衡问题已经解决了。SOMTE的过程可以分为以下步骤:步骤1。选择少数样本类别的特征向量集速度限速值为80,110,120公里/小时步骤2。对于每一个类别的样本集,欧氏距离作为度量特征空间,然后每个样本的样本集之间的距离是迭代计算确定k最近的邻居采样点步骤3。执行随机线性插值采样点与所选的连接年代相邻采样点生成新的样品步骤4。重复步骤2和步骤3,直到高速公路速度的不同类别特征向量数据集达到一个平衡

3.4。最大速度限制识别分类模型

高速公路限速信息的采集是影响行车安全的一个重要因素。不同的道路部分对应于不同的限速信息,和限速信息的差异直接影响车辆的状态,这使得相关数据显示一个特定的模式。使用强大的学习机器执行深入学习和培训的相关数据可以实现高精度的识别结果。XGBoost集成学习的方法是基于提升算法(22]。其学习机器通常采用决策树模型和学习的真正价值和当前预测的残差值的树通过连续迭代生成的新树。然后,所有树木是积累的结果作为最终结果获得一个更好的分类精度(23- - - - - -25]。通过使用XGBoost算法作为识别的分类器的最大速度限制的信息高速公路,最大限速信息可以准确确定。

样本数据集是由提取16-dimensional速度从高速公路部分特征向量数据与已知的速度限制的信息。假设数据集。特征向量的吗我th样本,也称为输入值,也就是说,构造16-dimensional高速公路速度特征向量。的输出值是我th样本,即道路速度限制分类标签值对应。假设XGBoost集成学习模型的集成回归树,XGBoost算法的预测结果在以下方程可以表示为: 在哪里树的数量,对应于k回归树结构和叶重 , 是一个集成分类器组成的所有回归树,然后呢对应的预测评分k回归树的示例。

XGBoost的目标函数由一个损失函数和正则项,表示如下: 在哪里误差函数和吗正则化项。常规的词可以表示如下: 在哪里代表模型的惩罚系数,值范围是[0,1]。代表的叶子的数量kth树;是正则项系数。

XGBoost算法采用的添加剂逐步集成策略培训过程。首先,优化第一棵树,然后优化第二棵树,直到th树进行优化,优化过程中损失函数不断减少。通过添加一个增量函数迭代过程的优化目标函数,可以提高预测精度,和计算方法可以表示为如下方程: 在哪里是一个常数项和代表的预测值(t−1)的迭代我样本。然后,进行二阶泰勒方程和丢弃的扩张常数项,以减少模型的运行时间,表示如下: 在哪里代表叶的样本集和和一阶导数和二阶导数的损失函数,分别。

目标函数转化为一个二次函数关于找到最小值,然后每个叶节点的最优预测分数,得到目标函数的最优值如下: 在哪里 , 。

之后,XGBoost参数的优化主要包括以下4个步骤:步骤1。选择一个更高的学习速率,设定一个合理的辅助参数的初始值,和使用交叉验证在每个迭代中获得理想的决策树步骤2。根据步骤1,学习速率和决策树的数量决定,和交叉验证方法和网格搜索方法用于优化每个提升机的参数步骤3。方法是一样的步骤2;根据给定的数据,调整正则化参数,以减少过度拟合步骤4。适当的减少学习速率来确定最终的理想模型的参数组合

3.5。最大速度限制识别模型

鉴别问题的最高限速信息高速公路是一个分类问题。识别模型的框架如图4。动态识别的高速公路限速信息根据以下步骤实现。首先,采用数据清理等发射事务数据,删除重复的数据和错误数据。车辆速度识别,算法寻找失踪的发射等事务中记录数据和准确减少高速公路龙门分布。路段的速度可以通过计算获得发射之间的车辆的速度。然而,也有一些非常大的或小的离群值的速度路段,箱线图用来去除速度异常值。接下来,每个驱动部分的速度进行了分析,和frequency-speed百分位的模型特性,间隔速度评价功能,构造和区间速度时域特性。由于速度分布数据有很大的不同,各种类型的过采样算法用于扩大少数样本获取平衡数据。最后,数据分为训练数据和测试数据。训练数据被输入到XGBoost培训与学习算法; the training process is shown in process 1 in Figure4。同时,网格搜索和交叉验证用于在XGBoost找到每个提升机的最优参数;优化过程流程如图2所示4。

4所示。实验和结果

4.1。介绍实验数据

等龙门系统是高速公路等系统的主要部件之一,用于实时汽车驾驶信息监督记录、车辆路径识别、收费数据拟合、和其他功能14]。实验数据主要包括三类。一个是等事务中所收集的数据等各个部分的龙门福建省高速公路9天9月3日至9月11日2020;它包含50个高速公路包括Fuyin高速公路,Xiazhang高速公路,和高速公路,其中包含534部分,约1亿块的数据。每个部分之间的平均距离是8.9公里,85%的部分距离小于16公里,最大距离是30公里;其分布如图5。这些数据是来自福建省高速公路信息技术有限公司有限公司的主要属性数据如表所示1。第二类是道路限速信息数据,包括路段的名称和路段的最大限速值,这是来自福建的网上公告交通警察。用于模型的学习、培训和测试;第三类是高速公路的各个部分的距离从北极监测和评估方案,包括各个部分的节点对龙门和实际路段距离。

4.2。实验结果和分析

4.2.1。准备等数据预处理

匹配最初的清洗等数据和道路网络拓扑数据,每辆车的路段速度计算,然后是高速公路路段速度构造数据集。表2显示数据的主要特征。由于一些随机因素的影响,可能会有一定数量的异常数据;这些异常值可以检测到每个路段的噪声数据过滤模型。消除噪声数据之后,路段速度预处理后得到的数据。如图6,路部分路段的速度数据从9月3日,2020年9月11日,2020年。其中,每天的日期为横坐标,纵坐标代表路段速度的大小。此外,每个框代表的总体分布的路段速度路段在那一天,和黑色的起源代表了一部分需要被删除。路段的原始速度数据是大约在122.9万年,异常数据约119万,占9.68%,预处理部分速度数据大约是1110万。

4.2.2。路段速度特征向量

在获得数据集预处理速度路段,路段速度特征向量模型构造了基于高速公路路段速度特性的统计分析。因此,高速公路路段数据集包含3种类型,包括16-dimensional特征向量,其样本分类标志值。所示的属性表3- - - - - -5模型的特征向量,输出后数据特征提取速度。其中,是一个路段;例如,代表之间的路段等340507年龙门等351 c03龙门。代表日期交通状况发生时,代表每个部分是15%至95%的驾驶速度,表示模式、平均、标准偏差和色散的车辆速度,表示第一个6值排序后24个时间段的平均道路速度,和代表了最大限速值。

4.2.3。平衡分析的样本数据

路段速度有5081个样本特征向量的数据集,其中样本的数量80公里/小时,100公里/小时,110公里/小时,120公里/小时速度限制占5.31%,87.24%,9.39%,和2.83%,分别不同类别之间的严重不平衡,影响模型识别的效率。因此,击杀用于oversample样本数据与限速80,100,和120 km / h,这使得它可以实现各类样本之间的相对平衡。在实验中,击杀所获得的新数据的算法作为算法的输入模式。样本数据包含训练样本和测试样本数据。

4.2.4。模型的性能的结果

XGBoost算法的参数设置是一个重要因素影响的性能模型。为了提高模型的准确性,一组敏感性试验进行优化的性能模型。首先,四个提升机参数识别产生重大影响的模型,包括n_estimators learn_rate max_depth, min_child_weight。其次,结合网格搜索和交叉验证(门将)是用于获得最优参数,在其中交叉验证。遵循的方法部分3.4参数优化。搜索范围、步长和postexperiment参数优化为每个参数如表所示6。

建立的模型可以通过以上处理,使用测试数据来验证模型的有效性,并混淆矩阵的结果如表所示7。3295年测试样本,3212年被正确识别,准确率97.5%。80公里/小时数据的识别精度为100%。这是因为数据与80 km / h的速度限制是完全不同于其他类别,可以更好的区分。然而,类别之间的差距数据with100 km / h and110 km / h很小,很容易导致错误识别。其中,有824个样本数据,限速100公里/小时,759年被正确识别,和47的限速110公里/小时,在某种程度上使准确率降低。出于同样的原因,110 km / h的准确率限制也较低的位置与其他三个类别。

4.2.5。比较和分析

(1)均衡的数据影响分析。为了验证打过采样的影响模型算法,原始数据集和数据集处理杀算法用于训练和学习。模型的其他步骤是一致的,两个模型分类器。分类结果的比较如表所示8。第一类模型结果对应数据集由击杀处理算法,和第二类模型结果对应于原始数据集。以下从表可以看到8:(1)击杀后算法采样过量数据,召回率和准确率F1-score所有类别都大大提高。(2)数据的限速值100公里/最样本。没有过采样数据扩张过程中,这个类的评价指标仍在改善,表明攻击算法不仅可以大大提高识别的准确性少数限速信息,而且有效地提高识别精度的主要限速信息。(3)击杀算法提高了预测精度的数据与限速110公里/小时,120公里/小时,召回率和F1-score也大大提高。它几乎没有影响类数据的预测精度与限速80公里/小时,但在召回率有很大的影响F1-score。

(2)特征向量模型的比较和分析。只有调整输入功能,其他步骤保持不变;不同类型的特征的有效性在高速公路部分速度特征向量模型可以得到证实。七集的实验设置来验证一个单一特征的影响和多个功能组合的模型。模型被认为是表明只有frequency-velocity百分位特性。模型只考虑路段速度评价功能。模型只考虑路段速度的时域特性。模型表明frequency-velocity百分位特点和路段速度评价功能。模型考虑frequency-velocity百分位特点和路段速度时域特性。模型考虑了路段速度评价功能和路段速度时域特性。模型考虑frequency-velocity百分位功能,路段速度评价功能,和路段速度时域特性。考虑到的所有特性,实验结果进行了比较。实验结果如图所示7,A1-A7表示模型 , , , , , ,和 ,分别。以下可以看到:(1)当只有一个功能是补充说,一个更好的模型预测效果可以通过添加frequency-velocity百分位功能,其次是间隔速度评价功能模型和层速度时域特性模型。(2)当两个特性,预测效果相比,改进的一个特性。当所有的特性,预测的效果是最好的。(3)每个特性的贡献在高速公路的速度特征向量模型部分的预测模型从大到小排列,即路段speed-frequency百分位功能,路段速度时域特性,和路段速度评价功能;每个特性的特征向量的贡献图所示8。

(3)分类模型的比较。进一步说明模型的优势,我们比较GBDT的性能,然而,支持向量机,演算法,逻辑回归(LR)与我们的方法。实验结果如表所示9。从六个不同分类方法的比较表7演算法,支持向量机和LR分类器表现不佳的准确性,召回率,和F1-score。GC-XGBoost GBDT,然而,最多能得到理想的结果在高速公路限速信息识别,和识别精度高。特别是,GC-XGBoost优于GBDT和资讯的质量结果,准确率最高的97.5%。

5。结论

本文提出的方法识别高速公路限速信息等数据挖掘分析的基础上。首先,处理异常数据等龙门,路段速度数据集构造算法。路段的速度数据构造,和离群样本在每个路段被淘汰的箱线图分析,确保数据的准确性等表达式。然后,击杀算法用于oversample少数限速类别的样本之间实现平衡各种类型的路段限速信息。最后,提出采样过量训练样本输入到GC-XGBoost(网格搜索+交叉验证+ XGBoost)培训与学习算法;然后比较和分析与多个类似的算法。实验结果显示如下:(1)每个特性的贡献在高速公路的速度特征向量模型部分的预测模型是安排从大到小,其次是speed-frequency比例特性,时域特性和速度特性评估。三个类别的功能有改善效果预测模型,和frequency-speed百分位特性的改善效果最好。(2)测试样本数据,限速80公里/小时,100公里/小时,110公里/小时,和120 km / h分类数据识别准确率是100%,92.1%,97.9%,99.9%;总体精度为97.5%。类别数据之间的差距有100公里/小时,110公里/小时非常小,因此,识别精度相对较低。(3)速度限制识别GC-XGBoost精度为97.5%,精度0.98,召回是0.97,F1-score是0.97。实验结果明显优于其他的五个算法,可以准确地识别的最大限速信息高速公路。

本文考虑了混合动力汽车的速度特性,它适用于高速公路的最大速度限制信息的识别。然而,这项工作仍有一些限制:(1)识别限速100公里/小时,110公里/小时就没那么有效了。更多的限速功能可以被认为是探索两者之间的差异提高限速识别效果。(2)在这项研究中,我们没有考虑不同车道的限速值相同的道路。在未来,他们可以被认为是分析限速信息通过不同车道的道路上车辆分类和道路车道数量和构造一个更完整的高速公路限速信息识别模型。

数据可用性

使用的数据来支持本研究的发现正在禁运而研究成果商业化。请求数据,本文的发表之后的12个月内,将被相应的作者。

的利益冲突

作者宣称没有利益冲突。

确认

这项工作是由中国国家自然科学基金(41971340),中央政府的专项资金来指导地方科技发展(2020 l3014), 2020年福建省“皮带和道路”技术创新平台(2020 d002),省级候选人几百、几千一万人才的福建(GY-Z19113)。

引用

“交通运输部的中华人民共和国。今天,宣布我国高速公路的变化过程(EB / OL)。(2021-03-22),“https://mp.weixin.qq.com/s?__biz=MzI3MDQwMDQ5NQ==&mid=2247537632&idx=1&sn=8c806399c88108c7bae2c3dd00f56e30&scene=0。
视图: 谷歌学术搜索
z姚明,h .江,江y, y Cheng和b跑,“综合计划和轨迹优化连接自动车辆冲突地带,“IEEE智能交通系统,1 - 11,2020页。
视图: 出版商的网站 | 谷歌学术搜索
m·h·Hosseinlou s a Kheyrabadi, a . Zolfaghari“确定最佳限速交通网络,”IATSS研究,39卷,不。1,36-41,2015页。
视图: 出版商的网站 | 谷歌学术搜索
l .艾亚茨和i . Van Schagen驾驶速度和道路交通事故的风险:一个评论,”事故分析和预防,38卷,不。2、215 - 224年,2006页。
视图: 出版商的网站 | 谷歌学术搜索
g . Sugiyanto和美国Malkhamah”,确定最大速度限制在城市道路增加交通安全,”Jurnal各种,卷80,不。5,2018。
视图: 出版商的网站 | 谷歌学术搜索
b . Khondaker和l . Kattan”可变速度限制:概述”,交通信,7卷,不。5,264 - 278年,2015页。
视图: 出版商的网站 | 谷歌学术搜索
a . Van Benthem“最佳限速的高速公路是什么?”《公共经济学》杂志卷。124年,44 - 62,2015页。
视图: 出版商的网站 | 谷歌学术搜索
y张和p . a . loannou”结合可变限速和公路交通的车道变更控制,”IEEE智能交通系统,18卷,不。7,1812 - 1823年,2016页。
视图: 谷歌学术搜索
c j .曹歌,s .彭”改善了智能车辆的交通标志检测与识别算法,”传感器,19卷,不。18,4021年,页2019。
视图: 出版商的网站 | 谷歌学术搜索
s . k . Berkaya h . Gunduz o . Ozsen和G Serkan,“循环交通标志检测与识别,”专家系统与应用程序48卷,第75 - 67页,2016年。
视图: 出版商的网站 | 谷歌学术搜索
d . Tabernik和d . Skočaj”,为大规模的交通标志检测与识别,深度学习”IEEE智能交通系统,21卷,不。4、1427 - 1440年,2019页。
视图: 谷歌学术搜索
m .梁x崔,问:歌曲,“交通标志识别方法基于HOG-Gabor特征融合和Softmax分类器,”交通运输工程杂志》上,17卷,不。03年,151 - 158年,2017页。
视图: 谷歌学术搜索
江c和x雪”,统一紧凑遗传算法匹配书目本体,“应用智能,51卷,第7532 - 7517页,2021年。
视图: 出版商的网站 | 谷歌学术搜索
f . Zaklouta和b . Stanciulescu“实时交通标志识别的三个阶段,”机器人和自治系统,卷62,不。1 - 24,2014页。
视图: 出版商的网站 | 谷歌学术搜索
阿齐兹和f·优素福,“交通标志识别基于特征融合和榆树分类器,”Procedia计算机科学卷,127年,第153 - 146页,2018年。
视图: 出版商的网站 | 谷歌学术搜索
h·罗,y, b, w . Fuchao f·本,“使用多任务卷积神经网络交通信号识别,”IEEE智能交通系统,19卷,不。4、1100 - 1111年,2017页。
视图: 谷歌学术搜索
a·帕斯卡尔f . Deflorio m . Nicoli Dalla Chiara先生,和m . Pedroli”高速公路货运速度模式识别与浮动车数据应用,”交通研究部分C:新兴技术,51卷,第119 - 104页,2015年。
视图: 出版商的网站 | 谷歌学术搜索
l .廖x江、M·林和f M邹,“道路限速信息识别方法基于数据挖掘的交通轨迹,“交通运输工程杂志》上,15卷,不。5,118 - 126年,2015页。
视图: 谷歌学术搜索
j·杨,j .许高,b .国华x大学出版社和l . Menghui”建模速度极限之间的关系和特征的高速公路交通流速度,”可持续性,11卷,不。17日,第4621页,2019年。
视图: 出版商的网站 | 谷歌学术搜索
r·c·Prati g·e·巴蒂斯塔和m . c . Monard”类不平衡和随机抽样研究决策树学习系统,”学报联合会国际会议上人工智能理论和实践施普林格,页131 - 140年,波士顿,MA - 2008年7月。
视图: 出版商的网站 | 谷歌学术搜索
n . v .拉k·w·鲍耶l . o .大厅,和w·p·Kegelmeyer“击杀:少数over-sampling合成技术,”人工智能研究杂志》上》16卷,第357 - 321页,2002年。
视图: 出版商的网站 | 谷歌学术搜索
t·陈和c . Guestrin“Xgboost:一个可伸缩的树增加系统”22 acm sigkdd学报》国际会议上知识发现和数据挖掘大学出版社,页785 - 794年,纽约,纽约,美国,2016年8月。
视图: 谷歌学术搜索
t . t . Chen, m . Benesty et al .,“Xgboost:极端的梯度增加,”XGBoost贡献者(cph)(基础XGBoost实现,1卷,不。4、2015。
视图: 谷歌学术搜索
Parsa a b, a .罪犯,h . Taghipour s Derrible和a . Mohammadian”向更安全的高速公路,应用XGBoost和世鹏科技电子实时检测和事故特征分析,“事故分析和预防文章ID 105405卷,136年,2020年。
视图: 出版商的网站 | 谷歌学术搜索
m z . f . x, y . d . Wong, c . Palanisamy和c·柴”学习方法基于XGBoost驾驶特性评估和风险预测,“事故分析和预防卷,129年,第179 - 170页,2019年。
视图: 出版商的网站 | 谷歌学术搜索

版权

PDF 下载引用

下载其他格式

订单打印副本

的观点

503年

下载

406年

引用