文摘
出租车流城市智能交通系统的重要组成部分。出租车流的准确预测提供了一个有吸引力的方式寻找潜在的交通热点城市,这有助于避免严重的交通拥挤,提前采取有效措施。出租车流的当前的预测及其对城市交通的影响密切相关的术语叫做乘客(OD)信息。然而,高质量的OD信息并不总是可用的。为解决这一问题,提出了一个预测模型,命名为TaxiInt,在这项研究中。不同于其他density-clustering-based方法,神经网络,或OD信息模型为基础,TaxiInt预测出租车使用出租车轨迹数据流。每条道路的空间特性和时间特性提取使用图卷积网络,这是训练有素的道路网络信息和轨迹数据。实验进行一个真正的出租车数据显示我们的模型的有效性。它可以预测出租车流与高精度给定城市十字路口。
1。介绍
出租车是城市交通的综合反映。它提供信息不仅交通状况也是人群活动的趋势。出租车流的准确预测有助于发现潜在的交通热点城市采取有效措施,避免交通拥挤。在过去的几十年里,研究出租车流的预测已经吸引了广泛关注(1]。巴兰设计旅行信息系统预测的机票和旅行时间乘坐出租车乘客被规划。作者声称,精度和实时性能被大规模验证评估(2]。进行了一个类似的工作。作者提出了一个混合模型耦合深度学习模型和分位数回归针对旅行时间预测(3]。香港提出一个框架称为TBI2Flow出租车客流预测(4]。此外,出租车流的预测被认为是有利于优化公共交通规划(5和发现不合理的城市规划6]。
目前,出租车乘客上车,坐放特性,叫做叫做(OD)信息,是最常用的功能之一,出租车流量预测。一些研究人员利用机器学习模型来分析出租车数据,如density-clustering模型(DBSCAN) [7),支持向量机(SVM) [8- - - - - -10),再邻居(资讯)11]。结合了一些基本模型来创建一个小说,然后用它来分析数据。李(12)提出了一种组合模型预测潜在的乘客需求在不同地区基于Daubechies小波分析和最小二乘支持向量机(二)。最近,卷积神经网络(CNN)被用来发现汽车旅行的空间特征,和循环神经网络用来学习周期和趋势旅游数据的规律。姚(13)设计了一种深刻的多视图时空网络预测出租车的需求。刘(14)提出了一个更符合实际的时空网络的预测出租车需求空间,充分考虑时间和全球相关信息。徐(15)采用合并图注意和复发性架构预测对出租车的需求在全市范围之内。这些初步的研究取得了预期的成功。但是他们的高度取决于乘客的OD预测信息,这可能很容易受到很多外部因素的影响,如记录仪器的失败,从司机的错误操作,或者叫出租车从移动应用程序的中断。更重要的是,OD信息在大多数情况下是一个数字的状态。一旦数据错过或干扰,很难重建。
OD信息相比,车辆的轨迹数据,获得了定位系统(GPS),不断更新和更可靠。如果一些轨迹数据的丢失,他们可以通过最近的重建有效的跟踪点。由于这种吸引力的优势,提出了各种trajectory-based模型的交通流预测。徐(16]提出WTFPredict使短期交通流预测方法,基于出租车数据和气象数据。张(17)用出租车数据预测短期流动趋势在城市地区城市人群流动分析。李建造了一个特性融合模型融合的代表特征提取交通数据的时间和空间特性(18]。提出了深度学习的方法来提取交通流的复杂特性,然后预测短期交通流预测精度高和稳定性(19]。
最近,神经网络图(GNN)成为越来越多的使用网络交通流的预测。较常见的卷积,卷积GNN的内核数量灵活的邻居节点使GNN更适合复杂的交通应用。Lv介绍了GNN交通网络分析的弹性(20.]。崔提出了HGC-LSTM框架,它是基于GNN LSTM,学习交通网络中的连接之间的相互作用(21]。
在这项工作中,提出了基于GNN小说框架。与现有的方法,分析了大规模的城市的出租车流,该框架提出了研究集中在出租车在城市交通流的预测热点可能对整体交通状况的影响更大。首先,出租车轨迹数据转化为交通流数据的核心相交道路网络中的节点。然后,GNN模型和时间序列网络创建捕获路口交通流的时空信息。最后,一个名叫TaxiInt模型用于谓词十字路口的出租车流。TaxiInt包括三个独立的部分交通流的模拟三个特点,分别是(22),每个组件包含一个注意力机制,图卷积网络,和一个共同的卷积网络。
这个工作的方法具有以下优点:(1)少要求出租车的数据集。TaxiInt并不取决于旅客OD信息。它使用了轨迹数据预测城市交叉口的交通流量。(2)模型的可靠性。三个交通流的特征提取TaxiInt由三个独立的组件。时空信息的提取将比现有的基线模型更可靠。
2。TaxiInt框架
在本节中,我们介绍我们TaxiInt框架,它引用的网络(22]。如图1TaxiInt的总体框架由三部分组成:数据来源,基于时间的路网交通信息的变化曲线,以及神经网络结构。在一个部分中,所使用的数据源TaxiInt包括出租车轨迹数据显示,城市道路网络数据,气象数据,工作日的标签信息。在B部分中,选择区域的道路交通信息在一段时间内显示在时间轴的形式。图中的红边代表了密集的出租车交通。不同颜色的补丁代表不同的时间点在时间轴上。C是一个原理图部分时间图和神经网络结构图。所表达的含义的颜色块顶部的时间轴是一致的b部分的内容总体框架包括3个子单元,每一个都包含2圣块捕获流量计时信息和道路网络空间信息。
(一)
(b)
(c)
2.1。预赛
在这里,我们定义一个道路信息网络作为一个无向图 ,如图1B部分,是一个节点集, , 是一套边缘,它反映了节点之间的联系,然后呢 是一个可调矩阵基础上 。接下来,我们定义输入数据 ,这已经从轨迹数据转换,对于每一个时间片,然后呢意味着该节点的数量特征。由于输入数据是由多个时间片,我们介绍 代表整个输入数据流是时间片数。
2.2。时空的关注
如图1C部分,在第一部分,我们将数据反馈给“时空关注”结构的网络模型,这是由“空间关注”组件和“时间关注”组件。通过使用这些组件,我们可以捕捉动态信息,如空间和时间相关性,从信息流的必经之路。
2.2.1。空间注意组件(SAtt)
在空间维度,出租车在每个路口流可能会影响到在相邻路口的流量价值。为了增加网络模型的敏感性交通道路网络的空间结构中的数据,我们引入注意机制模型对空间相关性的变化更加敏感。 在哪里 是输入流的吗SAtt组件。 , , , ,和 可以学到的参数,C是通道的数量。层,我们使用的激活函数。从关注矩阵 ,我们可以得到图节点之间的相关性的重量,将根据输入流的动态调整层。在组件的最后部分,我们选择将softmax函数来确保重量之和是一个节点。
2.2.2。时间关注组件(梭织)
在交通流预测领域,道路交通分布会随着时间而改变。因此引入梭织组件来捕捉出租车流量的变化在不同的时间片。 在哪里 , , , ,和 参数是习得的。像矩阵 ,矩阵自动获取输入流的变化,使整个交通网络敏感时间维度的趋势。然后,我们选择将softmax函数来确保重量之和节点是一个和得到 。
2.3。时空卷积
声波衰减和梭织组件自动捕捉重要信息的输入流。然后,调整输入流将送入时空卷积组件,由图像卷积的空间维度和一个共同的卷积在时间维度。
2.3.1。图卷积组件
在不同的道路和时间条件下,节点可以被视为改变图的信号。因此,为了充分利用空间性质的道路信息网络,我们用卷积谱处理整个图的信号在每个时间片和捕获的空间相关性的邻居节点通过信号相关性。
在光谱图分析,我们可以获得的属性图结构通过分析拉普拉斯算子矩阵及其特征值。图像卷积是一种卷积操作实现通过使用傅里叶域中的斜向移动的线性算子代替经典的卷积运算符(23]。然而,他们并不是有效的在处理大规模的图网络。因此,我们采用切比雪夫多项式解决任务约但有效(24]:
2.3.2。常见的卷积组件
从邻国捕捉空间依赖关系后,我们组标准卷积层在时间维度,用于更新节点的信号从邻近的时间片。下面是一个示例的一个公式层: 在哪里定义了一个常见的卷积过程中使用的参数是时间维度卷积内核。层,我们选择的激活函数。
2.3.3。多元融合
在网络模型的最后一部分中,我们把三个组件的输出。一般来说,有不同的时间和空间分布在城市出租车需求不同的社会功能。即使对于同一地区,出租车流是不同的在不同的时间片。因此,集成的公式定义如下: 在哪里是阿达玛产品操作。 , ,和有三个学习和可调参数,以反映不同程度的 , ,和影响最终的预测目标。
3所示。实验
在本节中,我们介绍了出租车数据集,基线,我们的实验和评价指标。结果显示TaxiInt和测试基线。
3.1。数据集和数据预处理
这项工作中所使用的数据包括三个部分:轨迹数据,气象数据,网络数据的必经之路。轨迹数据聚集从GPS记录器,从3月1日,2018年,2018年3月31日。整个数据集包括12544辆和1087825260条记录。每个记录包括五个要素:出租车ID,纬度和经度,出租车速度、乘客状态和时间标记。GPS数据的采样频率是22。表1提出了一种典型的轨迹数据的示例。天气数据都是从“wunderground”网站(https://www.wunderground.com),每日收集沉淀2018年3月在杭州。
道路网络数据从“Open-StreetMap”网站获得。图2显示了杭州城市的道路网络图,它是用于这项工作。地图上的与橙色高亮显示的区域是我们选择的路点的辐射范围,观察节点模型的训练。所选区域的道路网络信息包括一些主干道路、风景区、商业领域,和一个小居民区。我们设置的时间间隔为5分钟,出租车,十字路口在每个区间,包括出租车数量,出租车的速度,和相邻路口的交通流在1公里。
有六个交通热点区域,如图3。数据3(一个)和3 (e)代表杭州的交通枢纽,数字3 (c)和3 (f)代表杭州的城市核心区域,图3 (b)是教育领域,和图3 (d)居民的居住面积。本研究选择上述地区的出租车轨迹数据来验证TaxiInt的预测效果。
(一)
(b)
(c)
(d)
(e)
(f)
因为我们认为OD信息被扭曲,所以乘客身份被从我们的模型。然后,数据清洗过程中,数据集的格式转换。我们删除客运现状和过滤的出租车id不能完全当月考勤(出租车发生不到2018年3月31天)。最后,剩下12196辆的记录。这个模型使用328路分城市道路地图的训练,大部分位于十字路口附近。
图4示意图描述了路过的车辆计数的过程在每个时期每个路口。黑点代表十字路口。黑色虚线圆圈代表预设十字路口观察范围在这篇文章中,和它的半径是R_range f .黄色虚线所示点是车辆轨迹。固体蓝线代表了道路。我们设定一个十字路口范围阈值R_range,当车辆进入一个十字路口,我们会计算车辆信息。如图4“A-C-B-E-F-CD”,车辆驾驶序列,所以十字路口的交通流数据,B, D, E, F增加一个,路口C增加两个。每个路口的平均速度也使用类似的方法计算。靠近十字路口的车辆的轨迹C摇像一个集群。引起这些问题的原因往往是由于等待交通信号灯。需要过滤的车辆信息在短时间内反复出现在一个十字路口。前台流程后,我们终于2数据集:(1)道路网络邻接矩阵 ,这是用来记录道路节点之间的距离,和(2)节点信息矩阵 ,用来记录出租车流量、平均速度、数量的出租车在节点,天气降水,周末和工作日/状态,在每一个时间片。
自从每周城市交通流量的变化,为了保证培训的效果,TaxiInt(在模型训练过程中),本研究将单月数据集划分为三部分,包括21天的训练集,验证集,7天长假,为期3天的测试集。该方法分割的数据模型的训练是一种常见的方法在机器学习(25- - - - - -27]。
3.2。基线
我们比较TaxiInt以下三个基线,和每个方法的性能评估指标的平均绝对误差(MAE)。公顷(历史平均法):该方法预测的价值通过计算平均过去12值LSTM(长短期记忆):LSTM是一个时间序列递归神经网络(28]基于CNN和LSTM LCTFP:模型用来预测高速公路交通流(29日]
3.3。结果
TaxiInt预测每个路口的出租车流在下一个小时。自模型设置的时间间隔为5分钟,12个数字是需要为每个预测计算。图5显示了损失的变化值在TaxiInt模型的训练。纵轴代表损失指数,横轴代表迭代周期。如图5在培训过程中,迭代数量达到1500时,产出损失往往是稳定的。我们保留2000次迭代后的学习参数和预测出租车的六个地方杭州3月30日和3月31日。
表2提供了美短期预测的结果(第一个5分钟间隔)预测结果。它有四个模型和24 6地区的预测结果。杭州六选定地区的热点,包括交通枢纽,核心城区,住宅区和教育领域。的值代表短期路口交通预测模型的准确性。
图6显示美长期预测效果的结果(12段)的预测结果,反映了不同模型预测变化时间间隔后增加。它可以发现TaxiInt优于基线本文在每个地区选择。通过观察表2和图6,我们可以发现TaxiInt模型优于所有6个地区的基线,和HA模型类似于LSTM模型的短期预测,和HA的预测模型比在不同地区LSTM更稳定。与其他三种模型,HA模型缺乏获取长期的时间序列特性,因此预测结果随着时间间隔的增加变得更糟。LSTM考虑交通流变化的信息在过去不同的时期,所以LSTM预测。基于LSTM LCTFP执行一维卷积的交通量信息在时间轴上,进一步提取数据特征而失去部分有效的信息,导致不如LSTM有效性。TaxiInt考虑空间相关性和时间相关性,所以它有一个比前三个模型更好的预测效果。
(一)
(b)
(c)
(d)
(e)
(f)
4所示。结论
出租车数据的研究是智能交通领域的一个主要问题。出租车流的预测更容易受到当地的道路网络。本研究提出了TaxiInt模型中,卷积神经网络注意力机制和时空相关性的出租车流嵌入。TaxiInt关注出租车的分布在不同的城市街区的学习从不同的时间片。通过将轨迹数据转换为图形结构,它可以预测干道的出租车流节点城市热点在不同的时间片。它消除了依赖OD预测的信息,减少了需求高精度数据集。此外,与旅客OD信息相比,出租车的轨迹分布包含更多关于交通状况的信息。实验结果证明模型的有效性在预测出租车在热点地区流动。在未来的研究中,我们打算引入更多的城市居民的活动信息,扩大和丰富模型的功能。因此,它可以有利于城市的市政规划。
数据可用性
使用的数据来支持本研究的发现可以从相应的作者。
的利益冲突
作者宣称没有利益冲突。
确认
这项工作是支持的中国博士后科学基金会(2019 m662112)和绍兴大学的科学研究基金会(20195024)。