文摘

交通预测是一个重要的先决条件的应用智能交通系统在城市交通网络。现有的作品采用RNN和CNN /之下,其中GCRN是最先进的工作,描述交通流的时间和空间相关性。然而,很难GCRN应用于大规模的公路网络由于高计算复杂度。为了解决这个问题,我们提出公路网络抽象成一个几何图形,建立一个快速卷积图递归神经网络(FastGCRNN)模型交通流的时空相关性。具体来说,我们使用FastGCN单位有效地捕获之间的拓扑关系图中道路和周围的道路通过重要性抽样与减少计算复杂度,结合格勒乌单位获取交通流的时间依赖性,和时空特性嵌入到基于Encoder-Decoder Seq2Seq框架。大规模的交通数据集实验说明该方法可以大大降低计算复杂度和内存消耗,同时保持相对较高的精度。

1。介绍

交通预测使用提供及时的信息通过物联网技术(物联网)是一个重要的先决条件的应用智能交通系统(ITS) (1在城市交通网络,因为一个准确和高效的预测模型可用于旅客选择高质量的参考路线,道路网络的利用率最大化,并提供一个合理的规划城市建设部门的基础。然而,随着世界范围内城市化、城市道路网络已经显著扩大(2预测),这给交通带来了挑战,因为相应的计算复杂度将大大增加由于扩大公路网络(3]。

本文主要研究城市交通问题的预测基于物联网技术(物联网)在大的城市道路交通网络。这个问题是如何使用历史交通流数据来预测未来交通流数据的时间戳在大型城市道路交通网络。在文献中,已经有大量的研究在交通预测,包括交通量、出租车皮卡和/的交通流量。最初,许多基于统计的方法,如历史平均水平(公顷)4),时间序列(5),K最近邻居算法(资讯)6),和卡尔曼滤波器7),提出了预测道路交通。然而,这些模型一般适用于交通流量相对稳定,不能反映交通流的时间相关数据,也不能反映交通流的实时特性。为了解决交通流数据的不稳定特性,ARIMA (8)和它的变体(9,10在这个领域中使用11]。虽然这些研究表明,预测可以提高通过各种其他因素的考虑,他们仍然无法捕捉复杂的非线性时空相关性。深度学习的最新进展,研究人员可以模型复杂的非线性关系,并在多个领域展示出了一些有希望的结果。这样的成功激发了许多尝试使用深度学习技术在交通流预测。最近的研究提出的使用改善LSTM [12和格勒乌13预测交通流量。此外,考虑到空间结构的影响在不同道路的交通流量,李et al。14,15]提出建模城市的交通量作为形象和分区城市地图(图像)大量网格。在每个网格单元,交通量在一段时间内可以被视为一个像素值。李在此基础上,采用ConvLSTM [16)模型流量之间的时空相关性,利用卷积运算和LSTM单元模型空间和时间相关性,分别。然而,交通流量转化为图像失去城市道路的空间拓扑结构。李等人。17)模拟了交通流扩散过程在一个有向图和捕获的空间依赖使用双向图上的随机漫步和时间依赖用Encoder-Decoder架构安排取样。搜索引擎优化等。18)使用政府通讯(19- - - - - -21)提取交通网络的空间拓扑和RNN找到动态模式来优化交通预测。GCN患有可伸缩性问题,然而,因为它需要大量的空间来维持整个图和嵌入每个节点在内存中22- - - - - -26),和它有一个非常高的计算复杂度27]。

为了解决上述问题,我们建议形成路网成几何图形和构建时空图卷积网络基于抽象图捕捉预测交通流的时空特性。我们建议使用GCN作为空间拓扑模型的提取器和应用抽样方法(28- - - - - -30.GCN)。方法可以把图中的节点模型在批次,在每一批样本的邻居节点,提取节点产生更大的影响这批的节点,并执行卷积操作,大大降低了计算复杂度和内存。FastGCN可以有效地处理大型图像通过重要性抽样,这样内存溢出是不容易发生。然后,我们进一步结合格勒乌提取时间特性来实现交通流的时空特征的提取。最后,我们将时空特性嵌入Seq2Seq [31日基于Encoder-Decoder预测框架)。

2。问题分析

城市交通流预测是根据历史交通流序列,高度时变、非线性、不确定的。道路网的交通流量通常有以下时间特征(32]:(一)周期性。交通流量定期改变。交通流的时间序列通常呈现出波浪或振荡波动的长期趋势。(b)趋势和变化趋势(33]。交通流的时间序列显示常规的变化趋势。它不会改变随机,但它会随时间不断变化。例如,从春天到夏天,早上高峰期的交通量将逐渐进步。呈现一个趋势的变化。(c)连续性。交通流的连续性;之间存在相关性,交通流在不同时间的价值,尤其是在相邻时间段。

在某个时间,交通流也有一些空间特征,如道路交通流上游和下游的影响对当前道路,和限速和交通流量限制的规则相同级别的道路。

针对这两个主要影响因素,尤其是考虑到大规模的道路网络34- - - - - -39),这需要大量的时间空间计算,本文提出了快速图像卷积递归神经网络(FastGCRNN)。

它使用递归神经网络捕捉到交通流量的长期时间依赖性和图卷积神经网络(GCN)来捕获道路间的空间相关性在不同的地理位置。同时,重要性抽样应用于GCN减少大型公路网络的计算复杂度。

3所示。预赛

3.1。符号

给定一个无向图 ,在哪里 是一组节点 , 是一组边缘,可以表示为一个邻接矩阵 , 是一个功能矩阵 表示节点的特征向量 是历史时间序列的长度,每个特性在吗 对应于交通流在一定时间。我们的目标是获取交通信息 ( 的长度是交通流时间序列的预测)在未来一段时间根据历史交通信息X

3.2。图卷积网络

作为semisupervised模型政府通讯可以学习的隐藏表示每个节点。隐藏的所有节点向量层 可以用递归的隐藏的向量层 如下: 在哪里 , 表示层的可学的权重矩阵 , , 是一个激活函数,如ReLu。最初,

4所示。快图卷积递归神经网络

一条路的交通流量是影响周边道路的交通流量和道路的历史交通流本身,因此,预测模型应该考虑这两个因素。模型的时间依赖历史交通的道路上,格勒乌单元嵌入到基于Encoder-Decoder Seq2Seq模型框架来完成序列预测,,邻居间的空间相关性模型的道路、FastGCN用于道路网络的交通地图减少计算复杂度,提高效率。我们整合模型快速提取时空特性,所以我们建议FastGCRNN(递归神经网络快速图像革命)模型。模型的总体架构如图1

该模型主要包括六个部分,即:(一)输入序列X。它是整个预测模型的输入数据,即输入编码器的部分。在道路网络流量图,每个节点的交通流在持续一段时间。(b)输出序列Y。它是整个预测模型的输出(解码器的输出部分)。在道路网络流量图,每个节点的交通流在未来。(c)FastGCN单位。它可以提取道路网络的空间结构信息通过图像卷积。在此基础上,进一步利用抽样降低计算复杂度。(d)格勒乌单位。交通流量时间序列信号,所以我们使用格勒乌单位来捕获输入之间的长期或短期时间依赖交通流时间序列,在其内部嵌入两个FastGCN单元。(e)编码器单元。格勒乌单元组成的,隐藏层的输出状态是通过编码输入网络交通流的时间序列图。(f)译码器单元。它也是由格勒乌单位。当它接收到编码器输出,解码器将不断预测每个节点的交通流量。

整个FastGCRNN模型采用基于Encoder-Decoder Seq2Seq模型框架中,可以使用每个道路在道路网络交通流预测未来交通流量。首先,连续交通流数据 在路上网络输入编码器部分,和在每个时间戳数据实例需要经过FastGCN单位提取道路节点之间的空间结构信息,然后它需要处理的格勒乌单位编码器获取时间的交通流特性。格勒乌编码后,隐藏的状态输出的单位在编码器喂养格勒乌单位在译码器,和空间特性是通过FastGCN进一步提取。最后格勒乌单位不断预测交通流量

4.1。快速的空间特征提取器:FastGCN

城市道路网络中的每个道路并不是孤立存在的,而是与周围的道路,形成一个整体。道路交通流之间的互动;特别是,双向道路,有车辆流入和流出。模型空间相关性的公路网络交通流量,我们抽象的道路在道路网络中节点及其十字路口边,如图2,蓝线和点代表道路和路口的道路网络,分别。因为我们打算预测交通流量的道路,而政府通讯只能做预测节点,我们模型道路节点及其十字路口边,如通过红色三角形和黄线所示图2,分别。

为了考虑多次反射的影响之下,层之下的数量将会增加递归实现多个上游和下游道路之间的信息交换。然而,跨层递归社区扩张带来了时间和内存挑战与大型培训,密集的图形。为了解决这个问题,FastGCN法,解释之下的积分变换嵌入函数在概率测度下。集成在这个时候可以使用蒙特卡罗方法的一致性估计,和图中节点的训练也可以分批进行。因为节点训练是分批进行的,直到图的结构并不局限;执行测试的预测时,节点的数量和连接关系图中可以改变,它不需要训练期间一样的图结构。这就增加了模型的泛化能力和可伸缩性在某种程度上。

FastGCN图中的节点可以被视为独立且同分布抽样点满足某种概率分布,并计算损失和卷积结果表示为每个节点的嵌入函数的积分形式。通过蒙特卡罗积分的估计可以表示近似定义抽样损失和采样梯度。为了减少估计的方差,抽样分布可以进一步改变,使之更符合实际分布。例如,最简单的方法是使用均匀分布抽样卷积。改进的方法是使用重要性抽样使它不断接近真实分布,减少采样造成的误差。

如果一个节点 图中 作为观察对象,其卷积可以视为信息嵌入表达式节点 和图中的所有节点上层通过添加其他形式的邻接矩阵,然后通过可训练的特征维度的变换参数矩阵,相当于一个离散积分,和邻接矩阵相当于体重给每个节点。因此,节点的卷积过程 图中是用积分形式表示

之下的形式集成由蒙特卡罗方法集成,然后转化为离散形式的抽样。在层 , 独立采样和相同的概率吗 ,和近似估计

如果卷积的每一层都使用这个方法采样和信息传递,后层 ,嵌入式节点的表情

在上面的积分形式之下,嵌入式节点的信息表达V需要从图中的所有节点。然而,取样后,只有 图中节点在FastGCN需要交流和融合信息,所以整个图形变化的计算复杂性 ,和效率大大提高。

这是一个例子来说明的优点FastGCN相比之下,如果抽象道路网络图5节点和6边缘,如图34

在之下,每个时代都必须放在一个完整的图,而不是使用只有少数节点图;图中,每个节点需要旋卷,与图中所有其他节点交换信息。FastGCN,我们较大的图像分解为几个小图形的批处理操作,把它们放在内存,以及抽样的方法去除一些低相关性的信息交换节点。每个节点只与采样节点交互图。如图4,每个节点只与节点和节点大肠这样,计算效率大大提高,特别是当它可以计算一个大型图表没有内存溢出。

抽样方法,为了使抽样更接近真正的连接节点,FastGCN不使用统一的采样(40),但重要性抽样。也就是说,每个节点不是根据相同的概率抽样,但使用概率分布 不管怎样使用概率分布抽样,样本的平均值是恒定的,但它会影响样本的方差。为了减少误差,分布 这可以在这里选择样本方差最小化。在这个时候,计算节点的输出 通过FastGCN层

在实验中,只有两个FastGCN单元被用来提取空间特征。这是因为我们需要避免的问题oversmoothing [41]。具体计算过程如下:

4.2。快时间特征提取器:格勒乌

这是一个关键问题能够有效地获取交通流的长期时间依赖性。每个时间戳的观测值如图5。每个节点的流值会随着时间改变。预测是一个典型的时间序列预测问题;也就是说,鉴于每个道路的观测值 历史上时间戳,交通流的价值 时间戳将预测在未来。

LSTM和格勒乌常用时间序列预测。两个模型使用控制机制要记住尽可能多的长期信息和各种任务也同样有效。效率最大化,我们选择格勒乌与相对结构简单,参数少,和更快的培训能力。门格勒乌单位更新,重启门,和内存单元,可以让它有一个筛选的过程对历史数据的记忆,所以它可以保持长期记忆。在格勒乌,时间序列信息保存的内存单元,可以捕获长期和短期记忆时间,提高预测的准确性。

为了完成序列预测,基于Encoder-Decoder Seq2Seq模型结构。Seq2Seq把历史序列输入到格勒乌,提取时间特性,并获得隐藏的状态向量 输入序列的编码器的编码结果。这种状态向量 包含之前所有的特征信息的时刻,这是一个集中体现的时间特性。在译码器, 作为初始输入的解码器生成时间序列预测。这样,Seq2Seq可以提取的时间特征交通量在前面的时期,如距离、趋势、周期性的交通流在时间维度。当交通量预测,该模型可以获得一个平稳变化的交通量根据距离,和接近的特点,可以根据趋势和周期性调整。

5。实验

为了说明模型的作用在大型图表,1865年深圳市罗湖区的道路选择的实验,和特定的道路和区域图所示6

计算每个道路的交通流量,我们将GPS坐标映射到相应的道路通过f方法(42]。映射数据的格式如表所示1。核心领域的道路数量(road_id),车牌号(赛车),上传时间(时间)。每个数据记录代表信息;用时的出租车在路上road_id在特定的时间。

5.1。数据预处理

在数据预处理中,深圳出租车数据转化为连续时间戳在道路网络的形式,即如图,交通数据5。具体来说,我们将原始GPS上传数据映射到公路和计数每个道路上的交通流在每一个时期。所示的数据预处理算法的算法1

(1) 初始化:time_interval= 5分钟(或30分钟),begin_time=2015-01-01就是,roadflow [roadid] [time_num]= 0
(2) 每一个数据记录
(3) time_num←(时间- - - - - -begin_time)/time_interval
(4) 结束了
(5) 所有数据记录分组的用时,按time_num集团内部
(6) 每组记录
(7) 删除重复的记录基于road_idtime_num
(8) roadflow
(9) 结束了
(10) 输出:roadflow
5.2。比较实验

FastGCRNN模型的最大优点是,它可以应用于大型图表,它可以减少计算复杂度而不丧失模型的准确性。深圳的道路网络数据,实验与交通流进行了一系列不同的时间间隔与一些经典的交通流预测模型:(1)哈,ARIMA (2), (3) SVR, (4) LSTM ConvLSTM (5), (6) GCRN [18),(7)GCRNN-nosample。在实验中使用的评价标准是根均方误差(RMSE) [43]。具体实验结果如表所示2

从表中结果,我们可以发现FastGCRNN模型已达到最佳的预测性能RMSE。在这些比较模型,哈,ARMIMA, SVR,和LSTM只考虑时间相关不考虑空间相关性,这也是原因之一他们的可怜的准确性。ConvLSTM将城区划分为一个网格和地图的交通量在网格,每个时间段和交通量被认为是网格的像素值。虽然这种方法考虑车辆流的空间相关性,也失去了道路网的拓扑结构关系图。

验证,提出GCRNN可以减少计算复杂度,与GCRN模型相比,也抓住了道路网的拓扑信息;结果如图7

在图7,我们只比较基线和更高的预测精度,即GCRN GCRNN-nosample。从图7,它可以观察到,FastGCRNN是最低的计算复杂度。的培训时间FastGCRNN GCRN的0.03倍。此外,FastGCRNN减少了训练时间的1/3倍GCRNN-nosample,即。没有取样,GCRNN模型。从实验结果可以得出结论,GCRNN模型和抽样方法可以减少培训时间。

5.3。模型参数分析

在FastGCRNN,每个采样点对精度有一定的影响,模型的训练时间。当使用1685在深圳道路实验,不同的抽样大小被设置为比较的准确性和时间变化。实验结果如图所示8。图中的横坐标显示FastGCN单元的抽样大小在第一和第二层次,分别。蓝色列表示的RMSE预测结果。红线表示时间消耗在每个时代,和上、下两端的最大和最小值时间消耗在培训过程。

从实验结果可以看出,选择不同的抽样大小对精度没有影响,它并不意味着样品越多,获得的更多的信息,更好的预测效果。例如,采样的准确性50每一层的节点图并不是最好的,因为有“桥”式(其他节点影响中央节点将蔓延到其他不相关的遥远的区域)和“树”型(其他节点影响中央节点将局限于小区域节点所属)节点之间的连接关系(44]。如果采样多个节点,节点的影响关系会蔓延到不相关的领域,造成信息冗余,误导更新节点的功能,减少了预测精度。此外,在道路网络图,十字路口通常连接四个道路;也就是说,选择四个节点一跳可以完整的特征信息的提取。这是1865年的统计数据,选择道路的度,如图9。其中,节点度4是最,和70%的节点的度小于5,和近99%的节点的度小于7。因此,抽样数5的情况下已经可以包括周围的邻居在一跳。在这种情况下,不仅减少了训练时间,而且精度不降低。

和我们比较FastGCN和标准之下的时间消耗在不同大小的图形。实验结果如图所示10

从实验结果可以看出,FastGCRNN在处理大型图像问题具有明显的优势。特别是,当图的规模达到一定程度,FastGCRNN仍正常运行GCRNN-nosample模式已经溢出内存时,不能训练。

6。结论

本文主要涉及大型图形具有时空属性的问题通过构造FastGCRNN模型和它们适用于道路网络流量图。提取的模型预测交通流的时间和空间属性在大规模的公路网络交通流。其中,FastGCN用于提取空间中的拓扑结构,加快培训和降低复杂性。格勒乌用于提取时间序列的特性,和Seq2Seq模型基于Encoder-Decoder框架可以完整的序列长度不相等的预测任务。这个模型的最突出的优点是FastGCN嵌入到它,它使用抽样方法来加速空间特征的提取,降低计算复杂度,提高效率。此外,模型不容易内存溢出处理大规模的图结构的数据。

值得一提的是,该模型不仅适用于交通流数据,而且还适用于所有图结构的数据与时空特征,尤其是largerscale数据。

数据可用性

使用的数据来支持本研究的结果可按照客户要求定制丫,(电子邮件保护)

的利益冲突

作者宣称没有利益冲突。