文摘
随着国民经济的繁荣和快速发展,交通行业在中国迅速发展。然而,超载车辆造成交通事故频繁。因此,缓解或解决相应的问题与公路工程安全与市场经济有关,超负荷的一种改进的技术管理是迫切需要。在这项研究中,分析了超载的数据高速公路和高速公路在中国,我们开发了一个机器学习模型通过比较聚类分析的表演,反向传播神经网络(摘要),广义回归神经网络(GRNN)和小波神经网络算法)在分析全球和本地时间序列数据过载。在一个案例研究中,我们的研究结果揭示了江苏省高速公路上超载的趋势。给予足够的数据,摘要比GRNN和算法的执行。随着训练数据量的增加,GRNN表现更好,但运行时增加。将三种方法之间的最短的运行时,能反映未来趋势的过载过载的月度数据预测。我们的模型与潜在价值提供信息高速公路网络管理部门通过数据挖掘。这些信息可以帮助管理部门合理分配资源和优化信息利用率。
1。介绍
随着国民经济的繁荣和快速发展,交通运输业也在中国迅速发展。然而,相关的重载管理系统并没有相应的开发和执行交通法律并没有变得更严格。因此,交通运营商希望扩大他们的利润通过重载车辆;然而,过载会导致频繁的交通事故。根据中国交通运输部公路局,卡车超过80%的道路交通事故是由于超载运输。重载不断造成道路伤害(1和交通事故2),物流市场的扰乱了正常的经济秩序,并影响公路运输经济的健康发展3]。因此,缓解或解决与公路工程安全相关的问题和市场经济,超负荷的一种改进的技术管理是迫切需要。
在这项研究中,我们建立了一个机器学习模型公路泛滥和过载。我们探讨了过载特性通过聚类分析和比较了表演的反向传播神经网络(摘要),普遍采用的方法,训练神经网络,广义回归神经网络(GRNN),一个径向基函数神经网络和小波神经网络算法),一种新的神经网络,结合了古典乙状结肠神经网络与小波分析(WA),以确定最好的方法,分析和预测数据过载。此外,我们提供信息与过载等更多的潜在价值特征、过载率,和过载的趋势,公路网络管理,探索数据挖掘分析结果的应用在日常和即时过载使用聚类分析和神经网络的管理工作(NNs)。
本研究作出了重大贡献在协助公路管理部门合理配置资源,优化信息的利用率,提高交通管理方法和管理效率,减轻公路工程安全问题。此外,本研究艾滋病在经济和环境发展和为未来的工作提供了一个实用的参考超载管理。
2。背景
科技领域的迅速发展使过载控制软件和硬件的不断升级;因此,各级收费中心在中国能够存储越来越多的详细历史数据(4]。这些大量数据包含丰富的有价值的信息。传统研究方法分析我国重载的特点主要包括文献综述、统计预测模型和博弈分析模型。例如,李和王分析高速公路超载车辆的特点,通过聚类分析(5]。Ryu等人分析了车辆行为泛滥使用博弈理论和风险偏好模型[6]。另外,现在一些学者通过构建数据模型研究相关的特征。程等人建立了一个行为判断和预测模型,研究了车辆绕道行为(7]。章分析了超载对道路的影响能力通过VISSIM仿真(8]。看到大多数当前的研究是基于数据建模进行数据挖掘;因此,我们应该使用哪种模式的研究探索如下。
过去的研究已经显示过载特性(4,9)首先应该澄清超载管理的进一步研究这个问题。机器学习,一个典型的数据挖掘技术,使用“黑盒”的原则来构建一个机器学习模型解决复杂和多样化的数据(10]。机器学习领域的交通管理,目前应用于特征挖掘,预测,交通事件的响应,并及时处理。例如,穆罕默德Yasin和艾哈迈德提出了高速公路交通事故预测模型基于人工神经网络(ANN)来分析交通事故的特点(11]。李等人提出了态势感知机器学习模型,对影响因素进行了彻底调查交通管理人员的疲劳程度(12]。穆罕默德Abdulhafedh等人进行数据挖掘和机器学习方法可持续智能城市交通分类和表示,机器学习是极其有效的交通状态的识别和分类(13]。因此,可以用于数据挖掘,机器学习研究重载的特点,和预测重载模式充分利用大量的历史数据在现有国内各级公路收费中心;这符合当前对非现场执法的需求和技术。这可以显著改善公路交通管理和减轻公路工程安全问题。
研究交通运输特点,目前采用机器学习的方法包括支持向量机(SVM),逻辑回归(LR),聚类分析,安。
支持向量机已经成功地用于分类、回归分析和模式识别(14]。Sangare等人强调,支持向量机可以展示更好的性能数据量较低;然而,它缺乏能够自动识别相关的特性,及其计算成本很高(15]。林和李的建议得到比SVM预测交通堵塞(16]。LR是概率和统计方法用来预测事件是一个重要的机密数据模型(17]。然而,敏感的多重共线性独立变量和影响的回归结果。此外,LR将高度适合功能矿业通过影响因素的分析。(18]。因为这个研究已经取得了足够的数据,一个不需要考虑使用SVM仅仅因为它执行比其他方法更少的数据。此外,考虑到其高计算成本和糟糕的预测性能与NNs相比,支持向量机不是一个实际的选择。此外,独立变量影响过载可能导致多重共线性问题;因此,LR的回归结果也受到影响。因此,支持向量机和LR限制开采的特点,过载和过载的预测。
聚类分析是一个典型的和非常有效的方法,探索和法律特征。它可以发现数据没有先验知识的内部分布结构对正确的结果(19]。亚辛和Pooja使用K聚类则从交通事故中提取隐藏信息数据和创建训练集;该方法的精度是99.86% (19]。Žunić等人使用K——聚类分析道路的影响,环境,车辆和司机在交通事故和强调,集群已经应用在一些情况下在当前的专业和科学实践和实例在交通管理领域的20.]。最常使用的聚类分析方法包括层次聚类算法和dividing-based聚类算法。根据multiperiod本研究系统的原始数据,聚类K——集群,这是最经典的,普遍的,和常用算法领域的交通、选择和组合。K则很容易实现;然而,分类类的数目必须事先指定。使用系统聚类可以解决这个问题;同时,k - means也可以弥补任何缺陷的不准确的终止条件系统聚类。
安可以用于分析非线性因素,ANN模型演示高精度和配合度。常用的人工神经网络包括摘要,GRNN和算法。例如,王等人建立了一个摘要模型来估计碰撞结果的概率不同的交通事故。模型精度大于90%,模型表现出良好的拟合效果(21]。张、张相信GRNN模型具有较高的精度和可靠性比历史平均水平和向量自回归(VAR)在短期交通流预测22]。侯等人表明,算法具有良好的自适应能力和自学习能力预测短期交通量(23]。摘要在网络理论相对成熟,性能和具有较高的自学习和自适应能力,这使它能够提取数据的事件之间的“合理规则”看不见的模式和充分挖掘数据。摘要的全局近似算法相比,GRNN的特点是一个最佳的近似,可以处理不稳定的数据,避免局部最优的问题可能发生由于摘要,将连续的数据相比有明显优势,而这意味着这三个NNs有不同的功能3,24]。因此,当足够的历史数据可用于训练,摘要,GRNN,算法可以适应适当的超载行为的特点,如时序的影响大,随机性大,非线性影响因素,相当适合解决功能问题的挖掘和预测建模的超载车辆。
目前的研究多数基于数据挖掘的数据建模;因此,本研究探讨了模型,可以使用机器学习的最后选择两个模型:聚类分析和神经网络。机器学习已经应用在交通领域的研究,但很少用于过载特性的分析。因此,正如前面所讨论的,我们探索的过载特性通过聚类分析和比较BP的表演,GRNN,和算法来决定最好的方法,分析和预测数据过载。
3所示。材料和方法
3.1。实验数据
江苏省高速公路数据(15 565数据单位)和全国省级公路溧阳市(30 764数据单位)的数据,从2018年到2019年,收集从江苏省高速公路交通管理部门。数据集包括“车牌”、“巷”,“时间”,“车辆和货物的总重量,”“轴数,”“额定重量,”“过载标准,”“过载率”和“过载时间间隔。“这些数据集的细节如下。车牌。车牌是车辆车牌识别,和数据集的形式是“苏DETXXX,”,“苏”是江苏省和“X”是一个整数。车道。一个车道的道路车辆旅行。如果有三个车道,靠近中央分区被定义为第一车道,中间巷二巷,外圈是第三车道上。时间。时间指的是当汽车通过检测站;数据集的形式“年/月/日,小时:分钟。”总重量的车辆和货物。这是指车辆和货物的总重量;单位是吨(例如,“t 49”)。轴数。轴数是指轴的总数中配置的下部车辆底架。汽车通常分为六轴类之一。额定重量。额定重量是指最大允许车辆负载的情况下确保安全驾驶。单位是吨(例如,“t 49”)。过载标准。超载车辆标准确定重量超过额定重量表示驾驶执照。如果它超过额定重量,它称为超重。 过载时间间隔。过载间隔分为“不到5%,”“5 - 30%,”“30 - 50%,”“50 - 100%,”和“100%以上”。
3.1.1。数据预处理
这个研究的原始数据集不正确格式化并不能被计算机所理解。在建立模型之前,这个问题必须解决,以确保良好的数据质量。因此,数据清洗、缺失数据处理、编码,并进行了归一化。字符数据,如“最大的轴距,“省高速公路错过了2007年的数据,和美国国家公路数据不包含字符数据;因此,我们删除了这些字符数据。字符数据,如“时间”、“车牌”和“检测站式”转换为数值数据(表1)。0和1之间的所有数据归一化消除数量级的差异,也可以减少摘要模型过度拟合的可能性。
3.1.2。数据提取
从原始数据中提取的数据处理和被分为高速公路数据和国家、省高速公路数据。
聚类分析提取二维(2 d)数据进行分析。“过载率”的具体数据是“过载区间”;因此,“超载间隔”是丢弃。的属性是“车牌”、“货物毛重和车辆”,“超载标准(额定重量),”“轴号”和“过载率,”而“过载标准”类似于信息由“货物毛重和车辆”;因此,我们选择“货物毛重和车辆”,以避免重复。
神经网络还可以提取二维数据进行分析。由于缺乏数据和速度数据从6月到12月2019年11月,国家和省级数据,只有国家和省级数据2018年溧阳市的选择进行分析。2019年5月,有738小时江苏省高速公路数据点。在这个研究中,国家和省级公路数据2018年溧阳市的选择根据月度,季度和年度数据。每月的数据测量时间和贡献了289件2018年12个月的数据。小时,和964年的季度数据测量数据点在2018年第一季度。年度数据以小时,3367块数据在2018年为306天。
总之,进行聚类分析提取属性“时间”,“车辆和货物的总重量,”“轴号”和“过载率”来分析数据。摘要和GRNN提取“时间”、“货物毛重和车辆”,“轴号”和“过载率”从江苏高速公路、省道的数据。将只用于处理二维时间序列数据,即。“过载率”数据。
3.2。机器学习
3.2.1之上。聚类分析
提出了集群,在左右th无监督学习的世纪,是一个典型的研究方法。它旨在组织类似的观察到多个集群的观察每个单独的多个变量,在每个集群样本的相似性最大化,最大化未知组之间的差异,揭示数据固有的分布结构。潜在的聚类分析概念起源于传统的分类法,遇到复杂的分类问题。与传统的分类不同,需要的数据类型分为聚类分析通常是未知的,是由特定集群分析结果。(1)系统聚类:系统聚类的目标是一步一步对每个样本进行分类的标准距离函数计算,直到满足样品的需求系统的聚类算法。其中,距离计算公式和标准主要是用来计算样本之间的平均距离和集群形成的每个迭代和它们之间和每个样本。不同的距离计算公式和标准计算结果产生不同的距离。常见的距离计算标准包括最短距离法、最长距离法、中间距离法、重心法、类平均距离方法。(2)K——集群:K则被认为是一个至关重要的聚类算法(25数据集),一个迭代的过程。在这个迭代过程,数据集分为“k“预定义的不重叠的集群或子组。集群之间的数据点是尽可能相似,和集群之间的距离是保留的最长时间。集群分配数据点,这之间的距离的平方的总和集群质心和数据点是最小的。在这里,集群重心的算术平均集群中的数据点。
在这项研究中,系统的集群和K——聚类是聚类分析相结合;具体的过程如图1。K聚类则需要确定聚类”的数量k“在聚类之前,本研究旨在集群的重载数据国家和省级高速公路从2018年到2019年每季度李阳的城市。因此,我们使用系统聚类得到的聚类树图8个季度从2018年到2019年,确定相同数量的集群类”k“在8个季度,考虑到数据的连续性。在此基础上,获得的聚类结果K——分析。
3.2.2。神经网络
(1)摘要利用安是一个监督机器学习算法(26]。摘要被称为一个误差反向传播人工神经网络。这是一种普遍采用的方法训练得到,这有助于计算损失函数的梯度相对于网络中所有的权重和增强层之间的连接性来获得最优解(27]。摘要通常有三个或三个以上层。每一层的一个摘要由几个神经元。在本研究中,摘要是用来建立一个高速公路数据和机器学习模型预测过载率和趋势。摘要利用的算法流程可分为三个步骤图2摘要:建立、培训和预测。首先,摘要的具体结构是根据拟合函数的特点决定的。因为有四个输入参数——“时间”,“车辆和货物的总重量,”“轴号”和“类型的检查站”,只有一个输出参数,即“过载率”的三层节点的数目摘要是“4 - ? 1”;这意味着有四个输入层节点,隐层节点的数目是未知的,有一个输出层节点。在现实中,我们只能使用所发生的头几个月的数据来预测随后的结果。因此,考虑实际情况,在本研究中,我们按时间顺序排列的数据,系统地把他们分为训练数据和测试数据10:1的比例。隐层节点的数量可以计算如下: 在哪里表示隐层节点的数量,表示输入层神经元的数量,表示输出层神经元的数量,和是一个常量值介于1和10。替换 和 在方程(2),我们获得之间的一个值 和 因为节点的数量是一个整数4 - 12所示。如果拟合非线性函数很简单,摘要的预测误差随节点的数量的增加而减小。如果函数是复杂,误差降低,然后增加。探索适当的隐藏节点的数量,一个循环写的代码来评估预测的拟合优度的拟合程度获得隐藏节点的最优数量。拟合优度指的回归模型的拟合精度观测值。一般来说,可决定的系数(也称为确定性系数)是用来确定拟合优度。值越接近于1,模型的拟合程度越好;相比之下,越接近为零,模型的拟合程度就越低。在这个研究中,模型的预测能力是评估通过计算确定系数,如下: 在哪里是可测系数,是th预测价值,是真正的价值,表示样品的数量。(2)提出了广义回归神经网络GRNN的唐纳德·f·Specht 1991年美国学者。它本质上是一个径向基函数神经网络但有别于传统的径向基函数神经网络。它是一种强烈的回归工具和强大的非线性映射能力和灵活的网络结构,可以用于回归,预测和分类研究[28]。在本研究中,GRNN被用来建立一个高速公路数据和机器学习模型预测过载率和趋势。GRNN的算法流图可分为三个步骤3grnn建立、训练和预测。首先,GRNN结构是根据拟合函数的特点决定的。输入层神经元节点的数量等于学习样本的维数。在模式层神经元节点数等于学习样本的数量,即。,“Time,” “Gross weight of vehicle and goods,” “Axle number,” and “Type of inspection station,” whereas that in the output layer is equal to the dimension of the output vector of the learning samples, i.e., “Overload rate.” Therefore, the GRNN does not need to determine the number of hidden layer nodes. Unlike the BPNN, the GRNN only needs to confirm the SPREAD parameter and thus exhibits considerable computational advantages. In this study, the parameters of SPREAD were determined by loop training. The loop code starts with “for SPREAD = 0.1 : 0.1 : 2,” which means SPREAD is assigned from 0.1 and the step distance is 0.1, and each loop increases by 0.1 until SPREAD = 2. Similar to the manner followed for BPNN, for GRNN, the data are arranged in chronological order and systematically divided into training data and testing data in a 10:1 ratio.(3)小波神经网络算法是一种新型的神经网络相结合的经典乙状结肠NNs与小波分析(WA) [29日]。佤邦的概念是考虑到傅里叶变换的缺点,不能准确评估某种信号出现的时间。相比之下,佤邦可以通过小波分析信号的局部特征基函数转换和选择在二维方向的信号。算法可以进行时频局部分析,具有收敛速度快,能有效地避免陷入局部最优。
在这项研究中,将被用来建造高速公路的机器学习模型,国家和省级公路数据和预测过载率和趋势。适合小波神经网络的算法流程可以分为三个步骤图4:算法的建立、训练和预测。
首先,算法的结构是根据拟合函数的特点决定的。在这项研究中,根据过载和拟合优度的周期性特征操作的结果,数量的神经元节点的三层神经网络确定“4-4-1。“四个输入层节点显示过载率在4个时间点预测的时间节点。隐层节点的小波基函数组成。有一个节点的输出层,它表示过载率预测。相似的方式遵循摘要和GRNN对于算法,数据按时间顺序排列并系统地分为训练数据和测试数据10:1比例。
4所示。结果
表2介绍了聚类结果聚类的数目6时,也就是说,K= 6。“车辆和货物的毛重”给车辆和货物的平均总重量的时候进入高速公路。“毛重”和“总重量的比例”的比例平均毛重的组件。“轴”和“比例的轴数”是轴的分量的比例数量的时候进入高速公路。“过载率”给出了超载车辆的年平均增长率的时候进入高速公路。“工具”的比例显示的百分比车辆经过的时候进入高速公路的车辆总数。
它可以观察到,在江苏省高速公路上,车辆有六个轴上面,体重49 t在23:00-04:00进入高速公路和12:00-14:00更有可能表现出超载行为,和这些车辆的超载率高于其他人在此期间。大多数车辆进入高速公路和17:00-22:00凌晨,其中six-axle 49 t以上重的车辆更容易过载。在车辆进入高速公路06:00-07:00和15:00-16:00之间,两轴汽车称重18-27 t更可能是超载。在08:00-11:00之间的车辆进入高速公路,四轴的车辆称重37-43 t和43-49 t更可能是超载。
表3介绍了国家和省级数据的聚类结果在2018年和2019年的8个季度。的定义“车辆和货物的总重量,”“毛重的类别”,“总重量的比例”,“轴数,”“轴的比例数字,”“过载率”和“工具”的比例是一样的。分析如下。
国家和省级高速公路的数据聚类结果2018年四个季度如下:(1)大多数车辆进入省道00:00-08:00和第一季度16:00-20:00,其中six-axle 49 t以上更重的车辆可能超载;上面six-axle车辆称重的过载率49 t和进入省道在02:00-03:00更高。在车辆进入全国省级公路11:00,2-axle,纵然,4-axle 27-36 t和37-49 t重的车辆更容易被重载。(2)在第二季度,大多数车辆进入高速公路00:00-08:00之间和14:00-21:00之间,其中6-axle 49 t以上重的车辆更容易被超载;过载的6-axle t和进入高速公路的车辆重量超过49 21:00-23:00之间高。在车辆进入全国省级高速公路从上午9点到下午一点,纵然27-36 t和37-49 t重的车辆更容易被重载。(3)在第三季度,大多数车辆进入高速公路00:00-8:00之间和16:00-20:00之间,其中6-axle 49 t以上重的车辆更容易被超载;过载的6-axle t和进入高速公路的车辆重量超过49 21:00-23:00之间高。09:00-15:00之间的车辆进入高速公路,2-axle,纵然,4-axle 27-36 t和37-49 t重的车辆更容易被重载。(4)第四季度,大多数车辆进入高速公路00:00-08:00和13:00-22:00之间,其中6-axle车辆重量超过49 t更有可能是超载。 At 23:00, the overload rate of 6-axle vehicles weighing above 49 t and entering the highway was high. Among the vehicles entering the highway between 09:00–12:00, 4-axle vehicles weighing 27–36 t and 37–49 t were more likely to be overloaded.
国家和省级高速公路的数据聚类结果2019年四个季度如下:(1)在第一季度,大多数汽车进入了国家和省级公路04:00-13:00之间和18:00-23:00之间,其中6-axle 49 t以上更重的车辆可能超载;上面6-axle车辆称重的过载率49 t和进入省道00:00-03:00之间高。14:00-17:00之间的车辆进入高速公路,2-axle 18-27 t和27-36 t重的车辆更容易被重载。(2)在第二季度,大多数车辆进入高速公路00:00-15:00之间,其中6-axle车辆重量超过49 t更有可能是超载。从00:00至03:00过载率6-axle车辆重量超过49 t和进入高速公路高。车辆进入全国省级公路06:00-15:00之间,4-axle 37-43 t重的车辆更容易被重载。16:00-23:00之间的车辆进入全国高速公路,4-axle和6-axle车辆重量超过49 t更有可能是超载。(3)在第三季度,大多数车辆进入高速公路04:00-05:00之间和14:00-18:00之间,其中6-axle车辆重量超过49 t更有可能是超载。03:00从02:00,过载率6-axle车辆重量超过49 t和进入全国省级公路高。在车辆进入高速公路22:00-01:00之间和07:00-13:00之间,4-axle 37-43 t重的车辆更容易被重载。 Among the vehicles entering the highway at 06:00, 2-axle and 3-axle vehicles weighing 27–36 t were more likely to be overloaded. (4) In the fourth quarter, most vehicles entered the highway between 08:00–15:00, among which 6-axle vehicles weighing above 49 t were more likely to be overloaded. The overload rate of 6-axle vehicles weighing above 49 t and entering the highway between 00:00–04:00 was high. Among the vehicles entering the highway from 05:00 to 07:00, 2-axle vehicles weighing 18–27 t and 27–36 t were more likely to be overloaded. Among the vehicles entering the highway from 16:00 to 23:00, 4-axle and 6-axle vehicles weighing above 49 t were more likely to be overloaded.
数据5(一个)- - - - - -5(我)显示高速公路的轮廓值数据和国家、省高速公路数据。一个轮廓值−1和1之间的值。当集群内聚度等于分离度,轮廓的值是0。轮廓值越接近于1,内聚度和分离度越好。如果轮廓值更接近−1,不应该被分为一组。上述数据显示,所有的轮廓值是0,和大多数高于0.8,表明聚类的结果是好的。
(一)
(b)
(c)
(d)
(e)
(f)
(g)
(h)
(我)
BP的预测结果,GRNN和算法的高速数据数据所示6(一)- - - - - -6 (c)。的预测结果每月、季度和年度BP, GRNN,将国家和省级公路数据2018年在溧阳市数据所示7(一)- - - - - -7 (c),8(一个)- - - - - -8 (c),9(一个)- - - - - -9 (c),分别。
(一)
(b)
(c)
(一)
(b)
(c)
(一)
(b)
(c)
(一)
(b)
(c)
数据6(一),7(一),8(一个),9(一个)表明,该预测过载率符合实际过载率当使用摘要拟合曲线”y= 0.99x+ 0.0068”、“y= 0.97x+ 0.0088”、“y= 0.96x+ 0.011”和“y= 0.97x+ 0.0021”,分别。“R2“值总是大于0.95;这表明摘要模型的有效性。数据6 (b),7 (b),8 (b),9 (b)显示拟合程度的预测使用GRNN时过载率和实际过载率拟合曲线”y= 0.53x+ 0.045”、“y= 0.49x+ 0.036”、“y= 0.83x+ 0.0236”和“y= 0.86x+ 0.0126”,分别。“R2”值大约0.5,这并不符合拟合程度一样,表现出的结果使用摘要。数据6 (c),7 (c),8 (c),9 (c)显示的拟合程度预测过载率和实际过载率在使用算法的拟合曲线”y= 0.16x+ 0.151”、“y= 0.18x+ 0.1748”、“y= 0.17x+ 0.198”和“y= 0.02x+ 0.217”,分别。“R2“值总是小于0.2,这对应于最低的拟合程度的三种方法。
表4- - - - - -6目前的预测结果摘要,GRNN算法,分别表示的数据和结果的过程中机器学习。所有数据分为训练数据和测试数据的比例10:1根据部分中描述的过程和运行3.2。摘要表现出高度的预测结果拟合所有的验证数据,训练数据和测试数据,这也表明,没有过度拟合模型表现良好。GRNN预测需要长时间运行时由于其包含交叉验证和循环训练。算法无法准确预测过载率,并有其预测价值和实际价值之间的差距。这是推测算法通常用于短期时间序列预测,而季度和年度数据预测属于长期时间序列预测;因此,预测结果不理想,无论过载率和过载的趋势。虽然过载率从月度数据不够准确,这可能反映了过载的趋势。此外,将省略了属性预测有用的摘要,如“车牌”,“巷”,“车辆和货物的总重量,”“轴号”和“速度”,只用“过载率”和短期预测的时间序列。因此,预测结果显示过载率和短期之间的弱相关。
5。讨论
根据江苏省高速公路的聚类结果,6-axle超过49 t和重的车辆进入高速公路23:00-4:00和12:00-14:00之间更容易表现出超载行为,和这些车辆的超载率高于其他人在此期间。大多数车辆进入高速公路和17:00-22:00凌晨,其中6-axle 49 t以上重的车辆更容易过载。这意味着检验工作者应不断重视上述车辆称重49 t在此期间。此外,更多的资源,如人力、应该23:00-04:00和12:00-14:00之间分配。
比较2018年和2019年的聚类结果表3组中,某些变化被观察到的特征在过去的两年里。(1)高峰小时2018年和2019年之间的差异大约是2 h,和槽小时在2018年和2019年之间的差异大约是2 h。推测这是由于超负荷的工作时间管理在2018年和2019年发生了变化。(2)在2018年和2019年第一季度的过载率低于其他三个季度。与2018年相比,2019年过载率降低。这是猜测,因为常州执行几个重载管理联合行动在2019年,因为超载治理的加强。(3)在2018年至2019年之间,没有明显变化的“车辆和货物毛重”和“轴”。
表7总结了聚类结果的国家高速公路在2018年和2019年。2018年,大多数重载车辆进入高速公路00:00-08:00之间和16:00-20:00之间,在高过载和车辆集中21:00-23:00之间和02:00-03:00之间。2019年,大多数重载车辆进入高速公路从内到15:00,和车辆的高过载率集中00:00-03:00之间。在2018 - 2019年,大多数重载车辆6-axle 49 t以上,重的车辆和车辆超载率高的也6-axle车辆称重49 t以上。
比较预测结果的摘要,GRNN算法,常见的回归预测模型的评价指标包括均方误差(MSE),确定性系数 ,和拟合优度。确定性系数的数值反映了拟合优度。因此,我们选择了确定性系数,MSE和运行时间t整个代码的模型性能标准。此外,本研究利用均方根误差(RMSE),平均误差(我),平均绝对误差(MAE)、平均绝对百分误差(日军)和均方根误差百分率(RMSPE)五个不同的性能标准表8。的平均水平 ,MSE、RMSE我,梅,日军,RMSPE计算表9为了消除摘要的预测误差,GRNN,算法(30.]。
平均值和七个性能标准显示摘要的预测优于GRNN和算法。其性能更准确,尤其是对“高速公路数据”和“国家和省级公路数据(月)。“这是因为随着时间的推移,数据量的增长。虽然整体拟合程度很高,个人预测更大的错误,也和某些性能标准增加的错误数量的增加。明确地评估这种性能的充分性,摘要的性能与现有研究相比,本研究。例如,Kumar使用ANN预测短期非城市高速公路的交通流。在这项研究中,当数据量是160,拟合程度为0.9984,当数据量是480,拟合程度为0.9988 (31日]。本研究拟合程度的摘要是大于0.90和几乎是0.99,这表明摘要在这项研究中有一个非常高度的拟合和模型表现良好。
检测GRNN和算法的缺陷,GRNN的表演和算法也与其他研究相比。张、张美国高速公路使用附近的交通流的空间关系和发展两个多元预测方法,GRNN的也使用(22]。在这项研究中,91.32%的预测误差小于20%。唐等人使用算法来预测短期交通流量拟合程度的0.9453和230数据集用于建模31日]。他们使用算法来预测短期交通流量拟合程度的0.936,864数据集建模和运行时间为0.995。相比与唐et al。32),适合小波神经网络的拟合程度在这个研究非常低。然而,当数据集是相同的,运行时间是类似于其他研究。原因是,尽管这项研究的对象是不同的,随着时间的推移,交通流有很强的相关性。过载,相比其他属性,如“时间”,“牌照”,“巷”,“车辆和货物的总重量,”“轴号”和“速度”,过载率随时间有弱相关。
相比之下,合并后的结果表8和9如下。(1)摘要利用的预测性能优于GRNN和算法。给予足够的数据,摘要是一个更好的预测方法拟合程度高,最小MSE和短时间运行的时间。摘要执行在每小时高速公路数据预测和年度过载率预测,预测结果的摘要可以帮助确定集中的超载管理时间。(2)增加的数据量,GRNN的拟合程度增加,运行时间也增加了。在这项研究中,添加一个“循环”的方法来找到最好的传播大大增加了运行时间。与其他网络相比,GRNN最长运行时间。(3)摘要和GRNN相比,算法的运行时间最短的过载率的预测。虽然算法的拟合程度很低,只需要一个过载率的预测。它可以反映未来趋势的过载率过载的月度数据预测,和其预测结果可以帮助确定数据的集中式超载管理时间是不够的。
6。结论
在这项研究中,我们使用机器学习来建立模型公路泛滥和过载,考虑江苏省为例。重载的特点,总结了历史数据的聚类重载,重载的预测模型和基于摘要的拟合程度高。我们与潜在价值提供了信息高速公路网络管理部门通过数据挖掘。这个信息可以帮助这些管理部门分配资源和优化合理利用率的信息。本研究的结论可以分为两个方面:每日超载管理基于聚类分析和直接基于NNs超载管理。
过载特征聚类分析的基础上,人力资源和其他相关资源应该合理分配。有针对性的监控应该执行过载控制和管理水平,和治理效率应该增强使用信息技术。目前,许多大的漏洞仍然在执法检查的时间和空间,和执法人员和设备是有限的。因此,历史的全面使用过载数据是必要的,以满足需求采取严重措施依法对超载车辆的超载特性。例如,基于本研究的结论,我们可以关注监控6-axle t和进入一个高速公路车辆重量超过49 23:00-04:00和12:00-14:00之间和6-axle车辆重量超过49 t进入全国省级公路21:00-23:00和02:00-03:00之间的一个城市。人力资源和其他相关资源的分配应该增加在这一时期,应该保存在其他时间和相关资源。根据重载的特点,在不同时期不同类型的车辆必须彻底调查改善交通主管部门的管理效率。例如,必须特别注意2-axle 18-27 t和重的车辆进入高速公路之间06:00-07:00和15:00-16:00 4-axle 37-43 t 43-49 t和重的车辆进入高速公路08:00-11:00之间。与此同时,交通管理部门可以合理地调整员工的工作时间在不同的季节。例如,员工在第一季度的工作时间可以减少根据本研究的结论,有效提高工作效率。
基于神经网络的预测模型获得,我们可以预测过载率和过载的趋势,开发辅助程序或软件,并改善现有的执法系统。行政部门的信息资源基本领域一直处于关闭状态。信息资源的行政执法和行政执法监督集成和共享,实时信息,如在人员和设备,添加基于现有系统数据提高重载车辆数据库。在这项研究中,使用基于摘要模型实时信息的人员和设备可以集成开发辅助程序或软件,实现网上在线调查,执法部门和执法活动的监督。因此,各部门可以查询当前过载率和趋势在任何时候,尤其是在集中的法律管理,可以合理地确定的时间和地点集中的法律管理的帮助下预测结果和综合信息的人力和设备。通过检查变化的人力、设备和其他信息,我们可以确定各部门的实时操作,确保业务联动,促进行政执法的联系工作,进一步促进超载的治理,提高执法效率的系统。
高速公路的过载数据挖掘这项研究仅限于江苏省高速公路,和国家、省高速公路的过载数据挖掘是溧阳市有限,这不是普遍的。此外,空间属性,即“入口网站”和“退出网站”没有分析。我们的后续研究将集中在一个相当全面的特性分析和挖掘的时空规律的重载。使用地理信息系统(GIS)、全球定位系统、空间统计模型,和其他先进技术,我们的目标是探索重载车辆在高速公路上的时空规律,可视化与GIS的帮助下,预测目标面积重载,重载运输体积,和重载运输路线,进行更深入的分析,揭示了存在的重载货运车辆在公路网络在不同的空域。
数据可用性
使用的数据来支持本研究的发现可以从相应的作者。
的利益冲突
作者宣称没有利益冲突。
确认
这项工作得到了国家自然科学基金(批准号:71573037)和优先级的学术程序开发江苏高等教育机构在中国(格兰特号码:1105007002)。