文摘

当城市轨道交通正面临着大量的通勤乘客在高峰时期,乘客往往等待下一班火车因为地铁在满载运行,导致延误乘客的总旅行时间。拥堵延迟的计算和预测地铁站可以指导操作部门和乘客做出更好的规划和选择。在本文中,我们使用基于深度学习技术的一种新方法来评估地铁站的拥堵延迟。首先,我们使用自动售检票(AFC)系统数据来评估站的拥堵延迟。然后,我们使用一个卷积长期短期记忆(Conv-LSTM)网络提取时空特征解决短期预测问题地铁拥堵延迟的网络结构。客流时空变量包括入站,出站客流,乘客数量推迟,和平均延迟时间。时空序列,输入和预测目标都是时空三维张量在端到端训练模型。验证了该方法的有效性的一个案例研究重庆轨道交通。实验结果表明,Conv-LSTM比基准模型捕捉时空相关性。

1。介绍

随着国民经济的快速发展和城市化水平的不断提高,旅客旅行的数量和城市轨道交通建设项目也迅速增加。到2019年底,中国大陆40个城市开了城市轨道交通,每年的乘客数量多达230亿7.1亿次。此外,仍有65个城市的城市轨道交通计划已获批准,和中国的城市轨道交通正处于大发展时期,建设。

尽管地铁客运能力大的特点,交通供给和需求的失衡往往发生在高峰时期(1]。由于地铁车厢和平台的承载能力限制,一些乘客需要等待下一班火车,甚至更多。这一现象的乘客住在平台将延长乘客的等待时间,延误乘客的总旅行时间。在这种情况下,它是非常重要的为乘客和操作部门准确掌握地铁网络系统的内部操作状态。

地铁拥挤在车厢通常指人群。当乘客在拥挤的地铁车厢,不能将减少舒适和增加旅行时间(2]。增加旅行时间的一部分由于拥塞称为拥塞延迟,可以作为一个指标来反映当前状态的客流在车站。这个想法的实现得益于大规模应用程序自动售检票(AFC)系统数据。亚足联数据记录的卡号、时间和位置的每位旅客的旅行。因此,它是可能的计算之间的旅行时间和延误的乘客在地铁ODs系统通过实时大数据挖掘技术(3]。本文研究地铁乘客的旅行时间延迟和法官的拥塞状态站的平均旅行时间延迟通过分析乘客在车站等待。让地铁运营商和乘客有效地把握未来的操作状态,我们使用最先进的深度学习方法来预测车站拥堵。

本文的主要贡献如下:(1)基于乘客出行时间的计算使用亚足联数据,我们使用的想法控制变量消除干扰因素的区别和使用真正的旅行时间和正常的高峰时期,在非高峰时期旅行时间评估乘客拥堵延迟。(2)地铁客流拥堵延迟的整个网络由图像和时间序列来表示。其中,图像包含的空间传播拥挤相邻站点之间的延迟,和时间序列包含了地铁车站拥堵延迟的时间依赖性。(3)我们扩展传统的完全连接长短期记忆(FC-LSTM)网络想法回旋的短期记忆(Conv-LSTM)网络,它有一个卷积input-to-state和国与国之间的转换和结构可以有效地捕捉时空相关性的拥塞延迟。(4)拥塞延迟整个重庆的地铁网络计算和预测,并验证了该方法的有效性通过操作数据。这与传统的不同客流预测研究,通常仅限于站或route-level预测。

本文的其余部分组织如下。部分2评论过去的工作和领域的现有方法拥堵延迟的计算和预测。部分3介绍了如何使用亚足联数据拥塞延迟计算。配合的预测拥塞延迟,Conv-LSTM结构中使用本文中描述的部分4。部分5分析了重庆轨道交通的拥堵延迟分配网络。部分6简要地总结了本文的工作,提出了展望。

在地铁拥堵延迟问题的研究领域,没有完整的和有效的计算和预测方法。然而,近年来,大数据处理技术和人工智能技术发展迅速,这为我们提供了新的思路和方法,研究地铁拥堵延迟问题。

研究领域的地铁乘客拥堵延迟,现有文献主要集中在评估和优化旅客旅行时间和等待时间。早在2009年,Vansteenwegen [4]提出了线性规划方法优化比利时铁路的火车时间表,发现一般的等待成本可以降低40%。AFC系统的广泛使用和大数据技术的不断发展近年来,研究人员开始使用亚足联数据研究乘客的等待时间和拥堵问题,取得了很多成果。Yong-Sheng和En-Jian5)使用了一种新的基于贝叶斯推理公式估算模型评估地铁乘客的出行时间分布和证明走,等待,转移,车载地铁乘客的旅行时间属于一个截断正态分布通过亚足联的数据。Ingvardson et al。6)提出了一个混合分布组成的均匀分布和β分布来估计乘客的等待时间。然后,智能卡数据用于验证该方法可以改善公共交通的等待时间的估计模型。一些学者使用数学规划来优化培训进展和使用亚足联数据来验证模型的有效性。刘等人。7]地铁换乘站的发车间隔优化结合模拟退火和并行计算和验证,该模型可以有效地减少乘客的等待时间通过亚足联的数据。阴et al。8)火车调度问题提出了一个集成的方法在一个双向城市地铁运营成本最小化和乘客等待时间。验证了该方法的有效性通过北京地铁的运营数据。罗等。9)提出了一种混合方法,它结合了静态交通分配模型基于代理的动态交通仿真模型来估计经常拥挤的地铁系统。

近年来,机器学习在各种实际应用上已经取得了巨大进步10]。目前,一些成就在客流的预测和交通拥堵利用深度学习的方法。杨et al。11)提出了一种改进的基于长期短期记忆的长期特性模型(ELF-LSTM)神经网络。它的优点充分利用长短期记忆(LSTM)在处理时间序列和神经网络模型克服了限制,不能完全学习长期由于时滞时间依赖性。Huaizhong et al。12)深度学习的方法用于预测一个地铁车站的客流通过考虑天气、节假日、地面运输、和其他因素。王等人。13)提出了一个深刻的学习方法的错误反馈循环卷积神经网络(eRCNN)结构连续交通速度的预测。他们把北京环城公路为例,验证了模型的可行性确定拥堵来源。陈等人。14)提出了一种混合算法相结合的模式基于黄土的季节性潮流分解和LSTM神经网络(STL-LSTM)减轻不规则波动的影响和提高短期地铁客流量预测的性能。人工智能等。15]Conv-LSTM用来解决机场延误的问题预测网络结构,验证了模型的有效性。郑et al。16)开发的一种引起Conv-LSTM模块提取空间和短期时间特性,能够有效地获取交通流的复杂非线性。Sudatta et al。17)定义了车辆拥堵分数在一块并使用LSTM神经网络结构来预测街道网络的拥塞。此外,一些学者使用平行结构模型来预测拥塞。马等。18)提出了一种平行结构组成的一个卷积神经网络(CNN)和双向长期记忆网络(BLSTM)预测地铁客流。然而,并行体系结构的计算和分析过程是复杂的。林等。19]事件检测系统为研究对象,提出了事件检测框架的基础上生成对抗网络(甘斯)来解决事件样本不足的问题。李等人。20.)扩大样本容量和平衡的数据集使用生成对抗网络(甘),然后提取交通流的时间和空间的相关性,发现事件通过时间和空间上堆放autoencoder (TSSAE)。短期旅客需求预测,柯et al。21]提出了融合卷积长期短期记忆网络(FCL-Net)地址空间依赖关系、时间依赖性和外生依赖关系在一个端到端的学习架构。

总之,通过回顾现有的结果,我们发现,入站在地铁车站客流一般受到乘客的出行习惯和天气,所以可以获得更好的预测结果用LSTM及其改进模型(22]。然而,我们发现,地铁车站的交通拥堵不仅与客流进出车站的交通拥堵也密切相关邻站。具体地说,与平台上的乘客站拥挤后由于运输,如果下一站没有大量的乘客下车,为剩下的车厢,乘客被困在平台的现象仍将发生在下一站。这迫使我们有效地提取空间特征,考虑时间序列数据。因此,我们作出根本性的调整传统LSTM方法和采用Conv-LSTM提取客流拥堵的时空特征实现的预测车站客流拥堵和达到更好的预测效果。

3所示。交通拥堵延迟计算

客流拥堵意味着乘客受到其他乘客的运动和环境的状态,增加旅行费用(旅行时间、体育消费)。车站的客运交通拥堵表明,有限的空间(空间,火车剩余容量)和设备能力不能满足乘客的需求,从而逐渐形成堵塞。与其他时期相比,客流量高峰期的显著提高,和大量的乘客在短时间内聚集在当地的空间,这很容易导致乘客拥堵。如果我们不能实现预警和有效的管理,它将给地铁运营带来安全风险。然而,有许多乘客延误的理由。例如,客流拥挤,火车延误,信号故障和其他客观因素会导致旅客旅行时间的增加。当旅客旅行时间超过某个阈值,这意味着乘客旅行不同于往常一样,它可能有一个延迟。由于拥挤的客流高峰期间,乘客等客观因素阻碍了其他乘客或控制措施,导致额外的时间在旅行的过程中损失。相反,延误表示为区别真正的旅行时间和正常的旅行时间。

其中,增加客运交通拥堵造成的旅行时间称为拥塞延迟,这是本文的主要研究对象。交通拥堵延迟主要由行走延迟和等待延迟。(1)走延迟的主要原因包括缓慢旅行造成客流拥堵,排队引起的设备能力的限制,增加旅行距离车站客流组织调整所致。(2)等待延迟的主要原因是,乘客不能在火车上由于满载率高。因此,本文采用的控制变量,选择具体日期排除其他因素的干扰(火车延迟和信号故障),和关注客流拥堵的影响旅行时间延迟。

的乘客需要转移在旅行的过程中,我们只能知道乘客进出站的位置通过亚足联的数据,不能确定乘客的转移。此外,当旅客的旅行时间增加由于客运交通拥堵,我们不能判断增加旅行时间发生在原点站或转运站。因此,当我们站拥挤程度的评估,我们采取nontransfer乘客为研究对象。如果这部分乘客拥堵延迟,也可以判定nontransfer乘客进入站在同一时期也将面临同样的拥堵情况。

3.1。非高峰时期正常的旅行时间

我们假设,在非高峰期间,乘客不会留任董事会由于乘客拥挤在车厢或平台。在这种情况下,乘客的等待时间是一个近似均匀分布 ,和乘客的最大等待时间发车间隔 在非高峰时期。

由于乘客的步行速度大约是正常(5),我们假设入站步行时间 和出站步行时间 的乘客服从正态分布

一些研究人员认为,同一车站进出的道路的平台是一样的,所以他们将进入和离开车站的步行时间相同的值。然而,通过调查,我们发现,一些站点有不同的路线的乘客进入和离开平台,乘客不同的方向在楼梯上进出平台时,楼梯的能力也不同。因此,我们计算和分析步行时间进入和离开平台,分别。对车站p的步行时间,乘客进出站台可以设置

没有转移路线(p∼)为研究对象,可以由整个旅行时间 在哪里 表示整个旅行时间从车站的乘客p到车站, 表示在站乘客的等待时间p, 表示从站乘客的总在车上的时间p到车站。当火车运行时间根据时间表, 是固定值。

根据每一个旅行时间元素的独立性,旅行时间的均值和方差可以给出的 在哪里 表示旅行时间的均值和方差的路线(p∼), 表示平均步行时间的乘客在车站, 表示乘客的步行时间的方差的车站,和 表示列车在车站的发车间隔p在非高峰期间。 可以从城市轨道列车运行数据; 可以通过亚足联数据计算。的时间范围可分为k 为乘客进入车站 ,整个旅行时间可以给出的

对线ln站,平均步行时间 每个站在非高峰期间可以获得通过引入方程(2)方程(4)。

3.2。高峰时期交通拥堵延迟

交通拥堵延迟是指造成的额外的旅行时间的一部分客流拥堵在车站和车厢。它主要包括客流拥堵造成的额外的步行时间走链接和客流拥堵造成的额外的等待时间在等待链接。

同样的站在同一时间点,由于不同的上下方向,等待情况的乘客也不同。如图1本文计算平台上下方向的拥堵延迟时间单独每个车站。对线ln站,平台的数量是2n

没有转移路线(p∼)为研究对象,可以由整个旅行时间 在哪里 表示的乘客拥堵延迟时间的向上或向下的方向p

根据每一个旅行时间元素的独立性,旅行时间的均值和方差可以给出的

使用步行时间 在上一篇文章中,拥堵延迟时间获得的乘客在车站p可以通过方程(6)。

车站拥挤研究的时间范围分为k 为乘客进入车站 ,可以给出的总延迟时间

如果乘客到达平台均匀,平均等待时间=发车间隔的一半。换句话说,即使没有拥堵的平台,一半的乘客的等待时间比发车间隔的一半长。

因此,对于一个特定的乘客,即使 ,不确定,乘客拥堵延迟。为了避免乘客数量的计算误差与拥塞延迟造成的这部分乘客,完整的发车间隔作为乘客的最大等待时间没有拥堵延迟。的乘客拥堵延迟超过完整的发车间隔视为延迟。乘客的数量可以给推迟了 在哪里一个表示订单号的乘客,高峰期的轨道交通 , 表示所有乘客旅行沿途的集合(p∼期间)

对车站p,旅客的比例与拥塞延迟 可以由 在哪里 表示延迟的旅客到达车站p期间 表示所有乘客旅行沿途的数量(p∼在这段时间

对车站p,平均拥堵延迟时间的乘客进入车站 可以由

4所示。深度学习预测

乘客拥堵延迟具有复杂特征在空间和时间维度。车站的客运交通拥堵延迟一定时间可以从两个方面来解释。从时间维度的角度,乘客拥堵延迟下一时期可以被视为乘客拥堵延迟的延续之前的时期。从空间维度的角度,车站的客运交通拥堵延迟是受到相邻站的拥堵延迟的影响,和交通拥堵延迟相邻站有一定的空间相关性。因此,我们应用Conv-LSTM处理空间相关性,时间依赖性,地铁乘客的拥塞的网络拓扑性质延迟。在本节中,我们将简要地回顾传统FC-LSTM结构,然后解释Conv-LSTM的深度学习体系结构和优势。

4.1。FC-LSTM

LSTM RNN结构的一种特殊形式,主要用于解决问题的梯度和梯度爆炸消失在长序列的过程中训练。在大多数RNNs,隐藏层的功能H是乙状结肠的基本应用程序函数。然而,LSTM架构使用特制的记忆细胞存储信息,更好地发现和利用数据的长期依赖。简而言之,LSTM可以在长序列比普通RNN表现得更好。

LSTM的主要创新是它的存储单元的蓄电池状态信息。每当有一个新的输入,如果输入门 被激活,输入信息将积累进入细胞。此外,如果门 打开,过去的细胞状态 可能是“被遗忘”的过程。最后一个单元的输出是否会传播到最终状态进一步控制门的输出 使用记忆细胞和盖茨控制可以确保梯度的信息将被捕获的细胞,避免消失得太快了。FC-LSTM补充道“窥孔连接”传统LSTM结构,允许门层看到细胞的状态。FC-LSTM层的内部结构如图2。FC-LSTM可以被视为一个多版本LSTM输入、输出和状态是一维向量。在本文中,我们遵循FC-LSTM公式(23),表示如下:

, , 表示输入门,忘记门,门输出。 代表一个一维向量或标量 可以给一个不同的维度。加权参数矩阵 ,进行一个向量之间的线性变换。 是拦截参数。运营商” “是阿达玛产品; 和褐色h的两个非线性激活函数吗

因为内部的门FC-LSTM被类似的前馈神经网络计算,这个结构可以处理时间序列数据,但对于空间数据,这将带来冗余。原因是空间数据具有很强的地方特色,但FC-LSTM不能描述这些地方特色。

4.2。Conv-LSTM

获得一个更好的模型的时空关系,我们扩展了传统Conv-LSTM FC-LSTM主意。方法是取代input-to-state和国与国之间的FC-LSTM卷积计算而不是前馈(24]。通过叠加多个Conv-LSTM层形成一个编码预测结构,我们可以建立一个端到端的培训模型对短期地铁拥堵延迟预测。Conv-LSTM可以克服传统LSTM网络空间的缺点依赖性。与传统LSTM相比,Conv-LSTM转换所有的输入,输出,隐状态和各种盖茨从一个二维矢量三维张量。Conv-LSTM之间的比较和FC-LSTM如图3

我们定义,地铁拥堵延迟系统的网格在空间区域组成P行和列。网格中的每个单元和一个地铁站Z随着时间的推移,测量尺度不同。因此,在任何时候可以用张量信息 ,在哪里R是观察到的功能域。Conv-LSTM决定了未来状态的网格中的一个细胞通过其本地邻居的输入和过去的状态。关键表达式如下:

所有的输入 ,电池输出 ,隐状态 ,和盖茨 , , Conv-LSTM的三维张量的最后一行和列两个维度。操作员 表示卷积, 阿达玛的产品,所以权重矩阵将被转换为一个卷积滤波器计算。

在本部分中,我们可以把Conv-LSTM作为模型来处理二维网格的特征向量。我们可以预测中央电网的特点,根据网格中的点周围的特点。因此,我们可以做一个短期预测的时空下的地铁拥堵延迟系统变量。

Conv-LSTM的训练步骤如下(算法1)。

输入记录的数量入站客流 在训练数据集记录的数量出站客流 在训练数据集记录延迟率的数量 在训练数据集记录的数量平均拥堵延迟时间 在训练数据集回顾窗口:
输出Conv-LSTM学参数
过程Conv-LSTM培训初始化一个空集: 定义的所有时间片t 一个培训的观察 投入
结束了初始化所有的加权和拦截参数
重复一批样品是随机选择的 参数估计通过最小化目标函数
直到收敛性判据见面
结束程序

5。一个实验案例

5.1。数据集

本文以重庆地铁网络作为一个例子来验证模型。重庆地铁系统,乘客需要输入智能卡信息在每个地铁站的自动售检票系统。AFC系统记录每个乘客的入口和出口的信息(例如,事务时间和车站ID)。卡数据显示在表的一个示例1。本研究选择40个工作日的操作数据重庆地铁在2018年9月和10月。首先,地铁乘客延误率和拥塞延迟指数计算的方法部分3。然后,RMSE、美和R2计算值的预测结果来评估能力和Conv-LSTM模型的有效性。

5.2。结果

我们需要把地铁网络图分成许多小单位,确保每个小单位最多包含一个地铁站。因此,我们采取地铁网络细胞的行和列的值为64。此外,数据将被分为两个部分:第一部分是训练数据(35天),第二部分是测试数据(5天)。我们将与不同层测试Conv-LSTM模型确定最佳结构。未来预测的延迟率是使用历史观测数据(如乘客进出站的数量,延迟率和平均延迟时间。

摘要均方根误差(RMSE),平均绝对误差(MAE)和确定系数(R2)是用于验证模型的预测精度: 在哪里 表示实际价值, 表示预测价值。 表示的意思 ,n测试集的大小,表吗2显示了预测结果之间的比较该模型和基准模型。结果表明,Conv-LSTM网络优于基准模型预测性能的三个指标。通过比较基准模型,我们可以发现,机器学习方法具有更好的预测性能比传统的时间序列模型。CNN和Conv-LSTM网络明显的优势在空间相关性捕捉和验证的重要性考虑空间相关性的预测地铁拥堵延迟。其中,Conv-LSTM达到最佳的预测性能衡量RMSE(0.0331),这是CNN(0.0354)低于6.5%。Conv-LSTM结合性能更好的空间特性和时间序列的特性,和卷积层可以实现从状态过渡到状态,所以它可以捕捉网络编码的空间相关性更好。

4显示的实际情况延误率重庆地铁网络的红色柱状图表示向上的方向,蓝色的条形图表示向下方向,柱状图的高度代表拥堵延迟率的大小。图5显示的拥堵延迟率的预测重庆地铁网络。较暗的颜色,车站的延迟率就越高。这两种可视化图有效地反映Conv-LSTM的良好的预测效果。根据直观的比较实际的延迟和预测的延迟,我们发现,该模型可以有效地捕捉每个节点的时空特性,使一个有效的预测。

此外,我们发现了一些规则的训练和预测模型。首先,最高的车站拥堵延迟主要集中在地铁站1号线和3号线的交点站在周围的地区。这主要是因为第3行,因为世界上摘要跨坐式单轨交通线路最长,有它的能力有限。此外,3号线穿过几个重要地区和转运站在重庆,吸引大量的旅客。在高峰时期,甚至需要等待5列车在火车上。其次,在早晨的高峰拥堵高峰发生7:30 - 8:30,在晚上,峰值发生在下午18:30,这和通勤乘客的规则是一致的。第三,我们还发现拥堵主要发生在地区内圈内,内圈外而拥塞的可能性相对较小。这是有关地铁网络的布局由重庆的特殊地形。中心城市有相对较少的路线,方便乘客聚集在城市地区,这将导致交通拥堵。

结合乘客拥堵延迟分布和可视化的方法有利于地铁运营部门检测和预测车站拥堵和后续工作计划安排提供更合理的依据,甚至地铁网络规划。与此同时,它还可以为旅客旅游路线规划提供参考。

6。结论

的原因分析的基础上地铁旅行时间的延迟,本文运用控制变量的概念提出乘客拥堵延迟的计算方法在地铁网络的水平。考虑到电台之间的客流拥堵是传染性,车站的交通拥堵不仅是相关的历史拥堵车站还与相邻站的交通拥堵。因此,结合客运交通拥堵的时空特性,我们使用改进的深度学习方法基于CNN和Conv-LSTM FC-LSTM做出短期预测地铁车站拥堵延迟。Conv-LSTM不仅保留FC-LSTM的优点,也适用于时空的卷积数据由于其独特的结构。我们使用各种基准模型来评估该模型的性能。试验结果表明,Conv-LSTM令人满意解决乘客拥堵延迟预测问题的地铁站。

在这篇文章中,一个端到端的深度学习结构基于时空变量是用来实现乘客拥堵延迟的短期预测分布,可以实时掌握地铁网络的拥堵情况。一方面,它可以帮助运行管理部门制定更好的管理和规划方案。另一方面,它可以帮助乘客掌握地铁站的拥堵情况,做出更好的旅行计划和选择。然而,本文也有相应的缺点,如转移乘客将面临两次或更多的等待时间,我们不能准确地确定拥堵延迟的具体时间和地点。在未来的工作中,我们将讨论如何判断和计算传输的拥塞延迟乘客,并将它添加到预测模型。

数据可用性

对数据的访问是受限制的。调查数据来源具有一定的保密性。

的利益冲突

作者宣称没有利益冲突。

确认

作者感谢重庆轨道交通(集团)有限公司,有限公司,提供必要的数据。这项研究受到了中国国家重点研发项目(2017 yfb1200702)。