文摘
短期流量预测是智能交通系统的一个关键组成部分。它使用历史数据构建模型可靠地预测交通状态在特定位置道路网络在不久的将来。尽管是一个成熟的领域,短期流量预测仍然带来了一些开放问题选择最优数据分辨率,预测一次性的拥堵,和相关的时空相关性的造型。一步解决这些问题,探讨人工神经网络的能力,随机森林,支持向量回归算法可靠交通流模型在不同数据分辨率和应对意外的交通事故。我们也探索不同的特征选择方法识别和更好地理解影响最大的时空属性这些模型的可靠性。实验结果表明,数据聚合不一定实现多元时空机器学习模型的良好的性能。学会了利用高分辨率的模型30秒输入数据优于相应的基线ARIMA模型 。此外,特征选择基于递归特征消除导致模型优于基于线性correlation-based特征选择。
1。介绍
交通拥堵导致重大货币损失在世界各地的国家,2014年与交通拥堵的成本估计十亿仅在美国(1]。大量的精力已经投入减少城市拥堵的。在许多城市,成为不切实际的修建新的道路或扩大现有的道路,都变得更重要的是充分利用可用的资源。智能交通系统、先进的交通管理系统和路线导航系统使用实时交通流从各种传感器收集的数据。在这样的系统中,短期流量预测,帮助做出决定基于流量的预测在不久的将来,更有用的是使用交通状况的实时数据。领域的短期流量预测是在30岁早期作品利用Box-Jenkins ARIMA方法(2]。最近的方法仍然使用原来的ARIMA模型的变化,例如,季节性ARIMA (3,4),但有转向使用机器学习算法解决交通预测的挑战[5]。虽然这样的模型基于机器学习算法已被证明是更可靠的比传统的ARIMA模型,仍有许多开放的问题[6]。这些包括建筑响应算法能够预测一次性的拥堵,确定最优数据分辨率、识别和建模的重要交通数据的时空相关性。本文中描述的研究是一个一步解决这些挑战。我们做出以下主要贡献:(我)探索多元时空分辨率的输入数据的影响在短期流量预测模型的准确性;我们专门考虑使用人工神经网络模型构建,支持向量回归,和随机森林。(2)评估这些预测模型的响应性临时堵塞事件。具体地说,我们研究预测的可靠性提供了这些模型在事故等意外事件的存在。(3)确定时空交通属性,这些模型的性能影响最大,他们的能力在交通数据模型复杂的依赖关系。
我们说明这些贡献上使用历史数据的体积和入住率测量高速公路在奥克兰(新西兰)。我们第一次激励的必要性提出讨论相关工作研究的部分2。接下来,节3描述了数据集和方法用于构建和评估预测模型,和部分4描述了机器学习算法用于构建这些模型。部分5描述了用于实验的假设和措施评估,和部分6分析了相应的实验结果。最后,部分7讨论了结论和未来工作的方向。
2。背景
许多短期流量预测算法被开发出来,这是一个复杂的问题受到多种因素的影响如分辨率(即。聚合级)的输入和输出数据,和时空动态。我们复习本节的一些相关工作。
尽管在现有文献研究主要使用数据聚合超过5分钟和15分钟的间隔,一些之前的研究调查数据分辨率的效果预测提供的相应的可靠性模型;然而,结果是不确定的。例如,公园等。7]研究了聚合对旅行时间预测的影响和考虑聚合水平2分钟至60分钟ARIMA模型的上下文中。他们得出的结论是,更高水平的聚合被要求预测路径旅行时间比旅行时间预测链接。多尔蒂和科贝特8)建造了一个神经网络模型进行预测,发现数据聚合在5分钟的间隔给更好的结果比数据聚合1分钟的间隔。Vlahogianni和Karlaftis9]看着聚合的水平,尽管他们发现颞聚合会扭曲关键的交通流信息,他们还得出结论说,进一步的研究是必要的,以确定最优聚合级别(s)。
高分辨率数据的使用是具有挑战性的多个原因。首先,对于一些统计模型用于短时交通状态预测,它是必要的,以确保输入数据和输出数据聚合级别相同,但这个约束可以放松当使用机器学习算法建立预测模型。第二,尽管研究表明,高分辨率数据(预计)包括更精确的测量;例如,马丁et al。10状态,归纳循环”最准确的计数和存在探测器之一;“这也使得传感器的噪声测量更加明显。尽管这些归纳数据循环可以代表个人车辆在网络,计算模型发展到捕获车辆之间的流段或链接等网络需要健壮的噪音和能够捕捉时空动力学为了利用信息编码在高分辨率数据。研究基于单变量时间序列方法经常执行聚合平滑变化的高分辨率数据9];然而,这些数据平滑技术导致信息丢失(灵敏度),使相应的模型难以获取交通流的时空动态。在本文中的研究报告,我们固定的输出数据的分辨率(即。,为the predictions being made) and examined the effect of different input data aggregation levels on the prediction accuracy.
已经有大量的研究在分析时空动力学的影响。例如,Kamarianakis和Prastacos [11)使用了一个时空的自回归移动平均(STARIMA)模型将数据从上游链接的链接感兴趣他们的预测模型,和钱德拉Al-Deek [12)发现,向量自回归模型,将数据从邻国感兴趣的链接链接执行比ARIMA模型,不考虑相邻的数据链接。杨et al。13)发现,稀疏的选择邻居选择基于水平相关性的链接感兴趣的提高了性能。最小值和Wynter14]表明,多元时空模型模板能够提供很好的预测精度。然而,这些模型依赖于固定的相关性矩阵,很少被修改。结果,这些模型很难跟踪更改或捕捉突然(或意义)之间的拥挤和通畅的交通状况的变化。
除了方法建立ARIMA模型(2- - - - - -4,11,14),基于机器学习的模型和概率估计算法也一直在探索,因为他们是适合模型的复杂的时空关系数据。受欢迎的方法包括人工神经网络(ANN) [15- - - - - -19),支持向量机(SVM) [20.- - - - - -24),k最近的邻居(资讯)25- - - - - -29日),卡尔曼滤波器(30.- - - - - -32),贝叶斯网络(33- - - - - -35),和随机森林36,37]。例如,现有的工作探索了各种安配置。王等人。19)开发了一种时空延迟神经网络(STDNN),其中包括22个链接在伦敦市中心,表明该模型优于STARIMA模型。霍奇et al。38)包含了时空数据的二进制神经网络用于交通预测。Vlahogianni et al。18)使用了遗传算法优化的神经网络模型,发现将时空数据有助于多步预测。最近,人们一直努力使用深层神经网络架构,包括深层信念网络(39,40]和堆叠autoencoders [41]。
没有协议在文献中关于上游和下游链接的数量(邻近的任何感兴趣的链接),应考虑在构建预测模型。虽然一些算法考虑只有一个上游或下游链接(24,29日),其他人认为数量可变的上游和下游的链接(38]。对于一个广泛的时空预测评估,请参阅Ermagun和莱文森(42]。正如Vlahogianni et al。6),捕获从高速公路在交通空间属性数据,仍然是一个悬而未决的问题。
大多数现有的短期流量预测关注典型工作条件(21]。交通(平均)固有的周期性与每日或每周的模式,和许多研究利用这种周期性的算法。然而,准确的预测更有用的情况下临时堵塞事故等周期模式不持有。不离开临时堵塞的研究在他们的输入数据,通常的做法是创建多个模型来处理不同的条件。例如,邓恩和Ghosh [43)使用一个模型与非线性预处理在拥堵的情况下。褐等。44]报道SARMA模型良好的性能在一次性的拥堵,而贝叶斯网络进行更好的在反复出现拥堵。online-SVR-based模型被发现准确预测临时堵塞Castro-Neto et al。(21]。锅等。45)也在捕捉移动瓶颈凸显的一些挑战和一次性的拥堵。看到Vlahogianni et al。6),Ermagun和莱文森(42),哦et al。46,哦,et al。47为更全面的概述在短时交通预测中现有的文献。
在这项研究中,我们探索三个机器学习算法,证明了能力将时空数据预测模型构建智能交通和其他应用程序。具体来说,我们探索(1)人工神经网络(ANN),(2)支持向量回归(SVR),和(3)随机森林(RF)。我们选择了安和SVR,因为他们是最广泛使用的机器学习算法在文献中用于构建预测模型。我们选择随机森林,因为它是一个学习算法,需要少量的参数调整。请注意,我们的研究的主要目的不是为了引入新算法。相反,我们让三个关键的贡献。首先,我们研究如何基于这些算法模型的预测精度变化的函数的聚合级别输入数据。第二,我们探索的能力,这些模型准确应对临时交通拥堵状况。第三,我们确定的时空属性最影响这些模型的预测精度和能力模型在交通复杂的依赖关系数据。
3所示。方法
本节介绍了研究区和数据,并提供了一个数学公式的短期流量预测问题(部分3.1)。这是紧随其后的是数据预处理步骤的描述用于拟议的研究(部分3.2)。
3.1。研究区域和数学公式
本研究在进行部分国家的1号公路(SH1)在奥克兰,新西兰。我们认为数据从45段SH1 Papakura向奥克兰郊区的城市(见图1)。平均而言,在每个方向有三个车道的道路,在这项研究中,我们只考虑道向北。一段的平均长度 ,之间的长度不同和 。
交通可以以不同的方式。最常见的传感器用于收集交通数据是电感回路探测器,它以各种不同的形式出现。双重循环探测器,它有两个电感回路放置一小段距离,能够准确获取车辆的速度越过他们,体积(即。、车辆通过探测器的计数)和入住率(即。的时间,车辆检测器)。然而,大多数的循环在许多城市(包括奥克兰)单回路探测器,它可以测量体积和入住率但只能估计车速的函数这些测量值和平均有效的车辆长度。研究表明,测量速度与一个常数有效车辆长度可能导致的错误(48]。使用这些派生的速度估计决策可能导致误导性的结果因此没有使用速度数据在这个研究。
交通流的基本模型建立了交通工程师认为交通三个关键变量之间的关系:(1)流(体积),(2)密度,和(3)速度。因为密度很难直接测量,入住率是常用的替代49]。不可能准确、全面地描述当前状态的流量只使用流的信息。例如,如果通过一个检测器在200辆间隔,这可能对应于畅通的条件在早期的早晨和晚上,但它也可能对应于高度由于事故高峰时段拥挤的条件。体积和入住率独特的组合定义了交通的当前状态。与许多现有的研究只考虑流进行预测时,它没有定义独特的交通状态,我们认为体积和入住率,因为他们提供有用的信息。他们一起帮助消除歧义,如上面所描述的。
对于每一个预测模型,输入向量 的形式: 在哪里和表示体积和入住率(分别)在时间步 , 段的总数,是历史时间步的总数。每一个这样的模型的输出量或占用聚合在随后5分钟间隔为每个特定的段感兴趣的。这个输出是一个函数的输入向量;例如,如果交通量预测,模型的输出 。每台机器学习算法的目标是建立一个模型,这个函数的输入和输出之间的关系。学模型可以用来预测为任何给定的输入输出。
3.2。数据处理
数据从2016年4月30天的收集45段 在高速公路上。为了得到段水平回路探测器的数据,个人价值观聚合在车道(体积数据总结,入住率是平均)为每个在每个时间点。我们使用体积和入住率值的部分在过去20个时间步 ,导致一个输入向量与1800年属性。确保每一部分的数据合理数量的上游和下游段,预测只是片段在高速公路上(见图1)。回想一下,体积和入住率读数报告每30秒,对应86400时间步。天真的聚合会导致较小的数据集的8640个样本和2880个样本和分别聚合。尽量减少不平衡数据集的大小,使用滑动窗口的方法,导致一个新的样品,每30秒产生的聚合的水平。最后的输入数据集的大小,与20时间步包含在每个输入样本,因此86370个样本分辨率,86190 ,和85790年聚合。确保公平的比较,输出是聚集在同一时间为每个模型所有输入时间分辨率,即代表输入的时间取决于数据的分辨率,而在输出,所有的模型会考虑聚合值区间从当最后输入阅读被带到五分钟过去。
数据集预处理去除一些极端值,是极不可能的。首先,我们使用winsorization [50)设置的上界值的数据集。Winsorization,一个共同的方法来处理异常值,取代所有值之上和之下的一定百分比值的百分比。在本文中,我们设置上百分位这上面的所有值百分比被这个百分比的值取代。如果一个标准正态分布假定,这种选择的上界与剪切值相对应标准差的意思。图2显示从段23 winsorization前后体积值。
第二,我们扩展输入数据中的每个属性的谎言 ;这个比例尤为重要生产稳定的结果与支持向量回归和人工神经网络。扩展了使用训练数据,和相应的比例常数是应用于测试数据。入住率值之间总是保持和输入和输出,不需要额外的处理约束的数据范围。非平稳的时间序列数据通常转换为固定数据之前,应用时间序列模型。然而,交通数据被认为是周期平稳,我们短期流量预测模型作为一个多元模式识别问题,假定所有数据来自相同的底层分布。因此,我们没有执行任何转换,使静止的数据。同时,虽然可以利用交通的周期性质,提高了模型的预测精度,这样做会使人难以可靠和有效地识别和应对临时拥挤条件(也看到部分4所示。2)。
训练的模型实现了使用数据从第一个20天(57600个样本),和数据对应于剩下的十天是用于测试。每个模型的参数调整使用训练数据集。接下来,我们简要讨论的算法用于构建模型对短期流量预测。
4所示。机器学习算法
在本节中,我们描述了三个机器学习算法用于构建预测模型的探讨摘要:人工神经网络(部分4所示。1),支持向量回归(4.2节)和随机森林(4.3节)。
4.1。人工神经网络
前馈神经网络或多层感知器是最常见的人工神经网络(ANN)模型。安排由神经元组成的神经网络层的每一层包含一个或多个神经元。每个神经元与所有相邻的神经元层,和一层内的神经元连接。每个神经元的线性加权和它的所有输入(从层之前)并将其传递通过一个非线性激活函数产生的输出 :
每一个这样的输出然后使用作为输入神经元的下一层,直到最后的(即。、输出)层。每个神经元的权重可能随机初始化可能使每个神经元学习另一个函数的输入。
权重每个神经元与定义神经网络模型的参数,而这些参数估计通过最小化损失函数测量输出值之间的差异估计的网络和真实值包含在训练数据中。回归问题的平方误差估计与真实之间的输出值通常作为损失函数。然后使用反向传播算法来计算这个错误的梯度和通过网络传播这个梯度(向输入层)来更新每个神经元的权重梯度下降法。随机梯度下降算法广泛应用更新权重,我们使用一个基于随机梯度优化器亚当这是计算效率和被很好地扩展到更大的数据集(51]。所有参数的优化器被设置为默认值。
虽然在神经网络非线性激活函数历来乙状结肠函数,实证结果表明,修正的线性单元(ReLU)激活函数提高了模型复杂关系的能力,减少了时间的火车模型(52]。我们因此ReLU激活函数用于网络三个隐藏层,每150个神经元。我们进行了400次迭代的学习与minibatches数据200个样本(每个)。
4.2。支持向量回归
对于分类问题,支持向量机计算的一个边界,决定这个边界之间的利润最大化和最接近的数据样本。支持向量回归(SVR)使用类似的方法进行回归problems-errors对应估计在一个值真实的距离值将被忽略。更具体地说,给定一组训练数据,目标是找到一个函数生产最多偏离实际的目标值训练数据和尽可能平(53]。例如,一个线性函数 如果它有一个小的是平的这可以通过最小化来完成 。因为一个函数,它满足所有要求的约束可能不存在,一些松弛变量 介绍了以允许一些错误。然后我们获得SVR以下公式:
我们也可以将非线性核函数将SVR扩展到非线性问题。受欢迎的内核包括线性内核和径向基函数(RBF)的内核,将输入样本转换为一个高维空间,导致更好的分离(分类)或评估值(回归)。我们通过实验选择使用一个线性SVR的内核,因为它提供了更好的结果。
4.3。随机森林
随机森林(RF) (54)是一种用于构建的集成学习方法分类或回归模型。整体组合来自多个模型提高预测精度的方法。射频,系综是一组决策树训练完整的数据集的子集。选择每个子集被称为装袋或引导聚合技术。如果训练集被定义为输入向量 和相应的输出值(目标) ,将创建决策树如下:为 在1…做选择训练样本随机更换;调用这个子集 火车一个决策树使用 在决策树中每个分割是基于一个随机属性的子集结束了
换句话说,每个子集由抽样从训练集替代导致了决策树。任何测试输入的预测然后从每个决策树预测的平均值:
这种方法可以确保个人树不是高度相关,因为少量的强预测因子。射频方法很受欢迎,因为它们提供一些鲁棒性的干扰数据离群值。他们也能够专注于最有用的属性回归或分类任务考虑而忽略不相关的属性。在我们的研究中,我们使用一个射频100棵树。
5。假设和措施
我们通过实验评估以下假设关于使用机器学习算法的预测模型的学习:(1)学模型能够忽略噪声的放大和高分辨率数据并提供更高精度的变化比不使用高分辨率数据的模型(2)学模型对临时交通拥堵事件,如交通事故,和这种能力提高分辨率的增加的数据(3)学模型能够捕捉复杂的时空演化的交通分配更高的体积和入住率属性重要性提取段段附近的兴趣
作为比较的基线,只要合适,我们使用两个体积预测方法建立在现有文献(ARIMA、历史平均水平)。实验评估假设,我们使用三个措施:准确性、均方根误差(RMSE)和平均绝对误差(MAE),定义如下: 在哪里预测价值和吗的真实价值吗数据样本。
量化反应不重现的条件,我们计算这些措施的样本代表不重现的条件。具体地说,一个样本 被认为如果其输出值之间的差别和每周的季节性预测变量的均值超过两个标准差离均值分布的输出值: 在哪里标准差和吗的意思是预测变量的值在相应时期的那一天。
6。实验结果
本节讨论实验结果评估部分中列出的三个假设5。我们总结的结果部分6。1,6。2,6。4并检查提出的模型的计算效率6。3。与结果报告在许多论文,我们的预测模型考虑不同交通状况,如高峰和非高峰流量在不同的时间,包括周末和公共假日。回想一下,我们探索不同的聚合程度不等来输入数据,但是每个模型的输出音量或占用的车辆(在一个特定的段高速公路)聚合在一段五minutes-see部分3.1为更多的细节。
6.1。使用高分辨率数据
如上所述节3.1使用训练集,预测模型构建和评估测试集。我们反复试验来检查模型的性能稳定使用不同的随机初始化。
结果总结表1显示所有三个机器学习算法表现的更好输入数据相比,聚合水平和聚合的水平。虽然预测精度与分辨率的增加可能不是令人惊讶的,重要的是要注意,决议还放大了噪声的增加和次要的变化数据。作为比较的基线,我们考虑了两种建立体积预测方法在现有文献(ARIMA、历史平均水平)。的ARIMA模型,我们应用一个平方根变换除了一阶差分和验证其平稳性。比较这些方法的输出与输出从学习模型,我们评估模型在相同的输出分辨率 。例如,对于聚合级别,聚合得到的输出值迭代和聚合十多个领先一步预测的输出。另外,结果输入聚合水平得到首先应用Stram-Wei颞解集(55)提取聚合值聚合数据。ARIMA(2, 1, 2)在模型被用于预测卷和输入聚合的水平,ARIMA(2, 1, 1)模型被用于预测的入住率和聚合的水平,和ARIMA(4 1,0)模型被用于输入聚合的水平。这些模型被选中使用Box-Jenkins实验方法。
结果在表1表明相对应的模型输入聚合级别提供平均精度提高在ARIMA方法和平均改进历史平均水平基线。注意,这些结果包括重复和一次性的拥堵事件;我们部分更详细地检查一次性的事件6。2。来证实这些结果的意义,我们进行了Diebold-Mariano (DM)预测精度的测试56]。DM测试比较了一双预测方法的预测精度。测试的零假设是两个预测具有相同的精度。零假设将被拒绝如果DM统计计算超出所需的显著性水平下标准正态分布;例如,对于一个意义 ,零假设被拒绝,如果DM的统计 。我们使用MSE误差度量。表2显示了每一对的DM测试统计模型。除了SVR和射频模型,其他模型明显不同程度的准确性。
表3总结了预测入住率的结果,表明类似的趋势。虽然这三种预测模型基于机器学习算法表现良好,模型基于随机森林算法(部分4所示。3)提供了最高的精度。
接下来,平均精度和梅在一天的不同时间,对三种不同的数据聚合的水平,如图所示3。对于每一个算法,精度提高分辨率。总的来说,我们观察到学会了预测模型的性能显著提高分辨率的增加,尽管相关放大的噪声和次要的变化数据。
(一)
(b)
到目前为止讨论的结果支持第一个假设基于机器学习算法的预测模型能够无视噪声放大的高分辨率数据并提供精度高于模型不使用高分辨率的数据。低精度值在一夜时间可以解释的准确性被表示为一个百分比的车辆和车辆的平均数量在一夜之间被显著降低;这是证实了梅值越低。
6.2。一次性的拥堵
接下来,我们进行第二个假说通过检查临时堵塞事件的预测模型的响应性。我们这样做只有评估训练预测模型在测试集的一个子集组成样本,明显不同于历史平均水平值。结果总结在表4和5。我们观察到的模型使用的输入数据聚合级别比模型使用输入数据和聚合的水平。在学习模型,该模型基于ANN算法提供了更好的性能比基于RF体积预测算法,同时为预测入住率反过来也是正确的。此外,我们观察到学预测模型提供更好的性能比基于历史平均水平,ARIMA模型,建立了短期流量预测方法。
进一步探索学习模型的响应性,我们检查了一个已知的(即。)报道,详细分解沿着高速公路。图4(一)比较的平均体积流量段23日交通量的SH1周四在一个特定的星期四,2016年4月21日。这个日期是在相应的数据测试数据集,也就是说,不习惯训练预测模型。图4(一)显示有显著偏离平均流量约6.40是4月21日,2016年。在社交媒体网站上报道,Twitter,分解SH1在附近这一天(见图4 (b))。更具体地说,Ellerslie入站在微博中提到SH1段27附近,这是在SH1段23。
(一)
(b)
数据5(一个)- - - - - -5 (c)展示如何学会预测模型能够跟踪这个事件对应的交通量,与三种不同的输入数据聚合的水平。相比较而言,数据还包括ARIMA方法的性能。我们观察到在图5(一个)使用高分辨率的输入数据聚合级别启用学习模型预测交通量的变化几乎在同一时间步时一次性的事件发生,而有一个滞后当使用另外两个聚合的水平;基线ARIMA模型的性能明显恶化。
(一)
(b)
(c)
更多的例子如何模型预测在一次性的拥堵,见图6。这些情节表明,ANN模型输入聚合级别响应很快不再发生的拥堵。SVR-based模型和coarser-resolution模型倾向于消除冲击交通和更善于在典型的拥堵条件下消除噪音。RF-based学习模型之间提供良好的整体性能,往往在于ANN-based和SVR模型提供的。
图7显示一个ANN-based学习模型输入数据聚合水平准确地预测交通量在公共假日。回想一下,这个模型没有星期的信息和季节的意思。总的来说,这些结果支持第二个假设模型基于机器学习算法和高分辨率数据更适应一次性的拥堵。
6.3。计算效率和实用的可伸缩性
表6总结提出了模型的训练时间和测试时间,当他们在英特尔核心构建和评估桌面和的RAM。的时间来生成所有模型的预测是在0.1秒。训练时间,即使是在最极端的情况下,在20分钟。因为训练过程可以很容易地创建模型并行网络上的所有部分,这可以通过一个初始离线阶段,我们相信这些方法可以很容易地实现整个交通网络的预测。
我们没有优化algorithms-performance可能已经提高了使用较少的训练样本或优化算法的参数,例如,通过使用一个较小的随机森林的树木数量或一个更小的神经网络。不同的算法需要不同的时间量的培训和测试;例如,模型基于SVR算法(线性)最低培训时间和测试时间非线性SVR模型有更长的训练时间(一个小时一个模型),但他们没有执行以及线性模型。ANN-based模型需要更长的时间来训练,但快速测试期间,而RF-based合奏模型训练和测试的时间较长。
总的来说,我们认为模型基于这些机器学习方法将规模庞大的公路网络。模型可以进行再培训的新数据在接下来的几个星期或几个月,使系统适应变化的道路网络。
6.4。属性选择
接下来,我们评估第三假说有关交通的复杂的时空演化模型的能力。为此,我们首先识别属性,最影响学习的性能预测模型。
识别信息属性的一个常见方法是计算目标变量之间的皮尔逊相关系数和输入的每个属性(42]。然而,皮尔森相关系数是无法捕捉非线性输入属性和thetarget之间的关系可能存在的变量。因此,我们使用了递归特性消除(RFE)方法来选择最相关的(即。信息)属性(58,59]。RFE通过迭代考虑越来越小的属性子集,下降(在每个迭代中)被认为是最不相关的属性。在每个迭代中,我们删除十属性排名最低的重要性。
有不同的方式来描述属性的重要性RF-based模型。因为任何射频是决策树的集合,基尼重要性每个属性的决策树可以平均,例如,到达的属性的重要性。对于一个安,第一层的权重ANN-based模型可以提供洞察的属性在很大程度上造成了预测。以类似的方式,分配给每个属性的权重的线性支持向量机可以用来识别属性的相对重要性(60]。
数据8(一个),9,10可视化的1800个输入属性的相对排名考虑交通预测模型在一个特定的段(这些数据段23)。深色调代表了更多的属性。对于每一个图,左边的图可视化音量属性和右边的图可视化入住率的属性。在这些情节,从左到右沿列x设在代表了部分空间顺序沿着高速公路从南到北。沿着y设在,第一行是最近的时间步,第一行是最古老的时间步,例如,对于为输入数据聚合水平,行20对应于当前时间步前10分钟的数据。总的来说,我们发现这三个模型提供了一个更高的等级在几个时间步相邻段。
(一)
(b)
(c)
(一)
(b)
(c)
(一)
(b)
(c)
更仔细的检查结果表明,预测模型基于SVR和射频分配体积属性重要性高于入住率属性时做决定。同时,相同的属性集无显著影响,这三个模型的性能。对于所有三个模型,属性被认为是重要的变化当输入数据的分辨率变化。例如,对于模型的基础上聚合(即水平。,highest resolution), the set of attributes considered to be important for decision-making mostly included values (of volume and occupancy) from nearby spatial locations and time-steps. The number of attributes corresponding to downstream segments that are nearby is high for the higher-resolution models, especially when predicting nonrecurring congestion events. For the models based on the和聚合的水平,另一方面,属性的集合被认为是重要的还包括来自更遥远的段的值。这些结果添加到当前的知识代表短期流量预测的信息。例如,一些最近的研究发现,有超过一个时间步的数据从邻近位置只提供小改进性能(13]。我们的结果,另一方面,表明体积和入住率值从多个邻近的地点和时间步长对准确预测可能是重要的交通取决于输入数据的分辨率。
为了进一步分析属性的重要性,我们认为这些排名属性的相对重要性不同的子集。我们观察到的性能,特别是准确性,包括后变得平缓属性。图11显示了三个模型的性能聚合级别,考虑数量的函数属性,属性点的降低重要性顺序。类似的结果是观察到的其他两种聚合的水平。
最后,我们比较RFE方法的性能排名与correlation-based更常见的方法和一个属性的方法,选择重要的随机属性;我们考虑相应的性能模型在正常情况下,临时堵塞事件的存在。表7和8以及数据12和13表明RFE排名方法优于其他两种方法的属性。事实上,在一次性的拥堵的情况下,预测精度使用correlation-based属性选择是类似于一个随机选择的重要属性。原因之一提供的糟糕表现correlation-based特征选择是最有可能高度相关的特性输出对应段段考虑最近的道路。然而,在大多数情况下,这些特性给冗余信息。段远可能包含信息的情况下,如队列建立或流量激增并不一定与预测的输出但相当丰富。RFE提供了一个机会来识别这些依赖项,和实验结果表明,这是一个更好的选择准确的交通预测,特别是在一次性的拥堵事件。实验结果也支持该假设基于机器学习算法的预测模型捕捉复杂的时空演化的交通分配更高的重要性更相关的属性预测任务。
7所示。结论
交通拥堵导致世界各国的重要货币损失。短期流量预测帮助做出决定基于交通在不远的未来,更有用的预测不仅仅是使用交通状况的实时数据。尽管是一个成熟的领域,短期流量预测提出了许多开放的(a)选择等问题解决最优输入数据;(b)临时堵塞事件的可靠预测和有效跟踪;和(b)精确造型复杂的时空相关性影响交通估计。我们已经探讨了建设和使用基于三个机器学习算法建立预测模型解决上述问题。具体地说,我们研究了人工神经网络(ANN)的使用,支持向量回归(SVR)和随机森林(RF)和评估这些模型的预测性能的三种不同的输入数据聚合的水平, , ,和 。对于每个学习模型,输出是一个预测(体积或占用)期间,尽管同样的方法可用于提供预测或时间间隔。我们的实验表明以下。(我)高分辨率的数据聚合到一个较低的分辨率与机器学习算法不需要精确的预测。聚合实际上可能有负面影响这些多变量模型的准确性。我们的研究结果表明,机器学习算法能够从高分辨率的数据中提取有用的信息,尽管相应放大传感器测量噪声和可变性。(2)不显式地利用流量的周期性特征,研究机器学习模型执行同样在重复和一次性的拥塞而不需要任何特殊的变化模型。相应的实验结果也表明,这些模型能够捕捉潜在的复杂,时空演化的交通。(3)消除递归特性提供了一个良好的排名为短期流量预测的属性。更常用的线性皮尔逊相关系数特征选择(42提供糟糕的预测精度与随机选择的特征的存在不再发生的拥堵。此外,特征选择使我们能够可视化建模和更好地理解时空模式的机器学习模型。
这些结果为进一步研究打开多个方向。首先,我们将把这些发现在更复杂的机器学习算法对短期流量预测。例如,复杂,影响交通流的非线性关系可能是建模使用深层网络架构,特别是高分辨率的输入数据。我们还将考虑其他数据集来概括本文研究结果报道基于数据从一个单一的高速公路。第二,我们将建立在指定的跟踪能力一次性的拥堵事件为了考虑事故和天气条件。这将需要底层算法模型附加变量及其对交通流的影响。此外,我们将探索全网流量预测的长期目标交通顺畅有效利用资源在各种情况下。
数据可用性
的使用条款在本研究中使用的数据不允许作者直接分发或发布数据。然而,这些数据可以通过api来获得直接从NZTA以下网页:https://www.nzta.govt.nz/traffic-and-travel-information/infoconnect-section-page/。
的利益冲突
先生Rivindu Weerasekera((荣誉)是奥克兰大学的博士生,新西兰。他拥有一级荣誉学位奥克兰大学的电气和电子工程。他的研究兴趣集中在十字路口的智能交通系统和机器学习。Mohan曾经博士(博士)是一个高级讲师在伯明翰大学的计算机科学学院(英国)。他曾是高级讲师大学电子与计算机工程系的奥克兰(新西兰),和一个教员在德州理工大学(美国)目前兼职副教授数学和统计数据。他收到了电气和计算机工程博士学位的德克萨斯大学奥斯汀分校(美国)。曾经博士的主要研究兴趣包括知识表示和推理,交互式机器学习,认知系统,和计算愿景,在自适应的背景下机器人和代理。普拉卡什Ranjitkar博士(博士、孟、大麻(公民))是一个高级讲师在交通工程土木与环境工程系的创始成员大学交通研究中心(曾经)奥克兰,新西兰。他有超过19年的学术、研究和咨询工作经验的交通和其他基础设施工程项目。他有强烈的研究兴趣建模和模拟的交通、智能交通系统、交通运营和管理、交通安全,人为因素,先进技术在交通运输中的应用。 Prior to joining the University of Auckland in 2007, Prakash worked for the University of Delaware in USA (2006–2007) and before that in Hokkaido University in Japan (2001–2006). He is a member of IPENZ Transportation Group and Institute of Transportation Engineers (USA). He is an Editorial Board Member for the Open Transportation Journal and reviewer of Journal of Transportation Research Board, Journal of Eastern Asia Society for Transportation Studies, Journal of Intelligent Systems, and IEEE Transactions of Intelligent Transportation Systems.
确认
作者要感谢迈克•杜克从奥克兰的联合运输操作中心(JTOC)帮助他们获得访问数据用于实验评价。