短期客流预测的轨道交通车站基于麦克风特征选择和ST-LightGBM考虑客流转移

文摘

解决当前的问题对地铁客流短期预测方法,如不清楚影响因素、精度低、高时空复杂性,地铁客流的方法基于ST-LightGBM后提出了考虑客流转移。首先,使用历史数据作为训练集,将问题转化为一个数据驱动对于多输入变量回归预测问题,地铁客流的短期预测问题的形式化和识别困难的问题。其次,我们提取的候选人可能会影响客流时间和空间特性在一个地铁站的乘客旅行数据基于客流的空间转移和空间相似。第三,我们使用最大信息系数(MIC)特征选择算法来选择特征作为输入产生重大影响。最后,对地铁客流短期预测模型基于光梯度增加机器(LightGBM)模型建立。考虑到客流转移,这种方法有一个时空成本低,精度高。数据集上的实验结果Lianban地铁站在厦门城市表明,该方法获得的预测精度高于SARIMA, SVR和BP网络。

1。介绍

近年来,中国经济发展迅速,城市化进程逐渐加快。中国不断增加的努力构建公共交通。其中,城市轨道交通尤为明显,在公共交通领域的一个新的方向。城市轨道交通具有承载能力强、准时率高,节能,环保1]。发展城市轨道交通是缓解城市交通拥堵的一种有效方式。因此,它是中国城市交通发展的未来趋势建立综合交通系统与城市轨道交通为骨干、公共交通为主体,以及各种运输方式相互联系。到2019年底,轨道交通已经建成的40个城市在中国,和地铁建设的总里程已经达到6736.2公里(2]。客流预测不仅起着指导的作用在轨道交通的规划和设计,还在轨道交通的运作中扮演不可替代的重要作用。最常用的客流预测方法是四级方法(3,4],它由四个部分组成:一代旅行,旅游分销、旅游模式分裂,和旅行任务。这是一个宏观的预测方法。第一个城市,实际上这种方法用于交通预测在1962年,芝加哥。它非常适合的长期预测客流和具有重要意义对轨道交通网络的规划,工程项目的建设,站设备的选择。然而,长期客流预测不能解决的问题引发的日常运营的轨道交通。随着轨道交通的发展,大多数人选择轨道交通作为主要的交通方式,这直接导致了快速增长的轨道交通客流。这导致乘客拥堵等问题,运营效率低、不平衡的能力和需求,和可怜的行车安全5,6]。因此,我们必须采取更加科学准确的短期客流预测方法预测短期客流。通过短期客流预测,我们可以获得旅客旅行的数据在未来很短的时间内,掌握准确的客流变化趋势并提供的基础操作的组织和管理部门(例如,它可以帮助操作部门实现动态调整轨道交通容量的高峰时间,服务人员的合理安排,以及紧急情况的及时治疗)。此外,短期客流预测可以提高轨道交通的运行效率,减少乘客的时间成本,提高乘客的满意度,从而提高公共服务的水平,并提高轨道交通的竞争力。然而,短期在地铁车站客流的影响因素是复杂的。和短期客流的特点是非线性,非平稳,随机性,和意外,使预测更加困难。使用数据驱动的方法来解决短期预测问题被证明是一种有效的方法(7,8]。LightGBM是一种新的提高框架模型,提出了由微软在2015年(9]。它具有训练速度快、低内存消耗,能迅速处理大量数据,并具有更好的模型精度,适用于解决短期客流预测轨道交通的问题。

本研究的研究目的是预测短期客流的地铁站。本文的主要贡献和新奇的如下:(1)为了补充缺乏科学分析地铁客流短期预测问题,我们正式描述问题的基于数据驱动的模型和分析困难的问题,以更好地描述地铁客流短期预测的复杂性。(2)为了克服问题的功能不完备和高成本的特性获取在传统的方法中,我们使用的时间特性,空间相似的特性,和空间转移特性提取IC卡数据作为候选人的影响特性,更全面和容易获得。(3)为了解决这一问题所导致的沉重的计算负担过多的输入特性,进一步选择的候选功能使用最大信息系数(MIC)特征选择算法提取显著特征,从而降低特征的维数,减少了计算成本。(4)为了解决这些问题,现有的方法不能反映短期客流的不确定性和预测精度不够高,我们使用集成学习算法LightGBM作为预测模型描述的非线性特征短期客流,提高预测精度。(5)数据集上的实验结果Lianban地铁站在厦门城市表明,该方法获得更高的预测精度比SARIMA SVR和BP网络。

目前,许多学者进行了大量的短期客流的预测研究。历史平均模型是第一个方法应用于交通流预测(10]。然而,历史平均水平很难回归模型反映了随机性的客流。它需要强大的稳定性和周期性的数据,从而导致其恶劣的应用条件。因此,历史平均模型的性能研究的El Esawey [11和杨et al。12不太好。卡尔曼滤波(13)模型也是一个常用的客流预测方法。焦et al。14)提出了三种改进的卡尔曼滤波模型的轨道交通客流短期预测,取得了良好的预测结果。时间序列模型是一个典型的客流预测模型(15]。Milenkovićet al。16)铁路客流预测使用集成的自回归移动平均模型(ARIMA),取得了良好的预测结果。Anvari et al。17)构建了一个时间序列预测框架基于Box-Jenkins方法的公共交通系统,包括ARIMA模型。李等人。18)提出了一个混合模型,结合一个象征性的回归模型与ARIMA模型预测的客流西安铁1号线。预测结果表明,该混合模型比简单的ARIMA模型具有更好的预测精度。随着机器学习的兴起,基于数据的非参数回归模型应用于短期客流预测的研究。关于支持向量机(SVM)模型(19,20.)、太阳等。21]预测转移对北京轨道交通客流通过设置一个小波支持向量机模型。再对事例)回归模型22),Habtemichael和软脂酸十六酯23)提出了一种非参数和数据驱动方法短期流量预测基于识别类似的交通模式使用一个基于事例增强算法。关于贝叶斯网络模型,鲁斯et al。24]提出了一种基于动态贝叶斯网络方法来预测短期巴黎地铁的客流,可以正常工作,即使数据是不完整的。神经网络模型(25,26),朱et al。27)构建了一个三层神经网络来预测出站和入站的地铁车站客流分析的主要动态因素影响轨道交通车站客流。预测精度高于传统的线性回归方法。刘和陈28)使用SAE的非线性特征提取输入和建造了一个混合模型(堆叠autoencoder-deep神经网络,SAE-DNN)预测BRT车站的客流。陈等人。29日)建造了一个长期短期记忆网络对轨道交通客流预测模型基于经验模态分解。刘等人。30.)使用深度学习架构的出站客流预测研究站根据铁路火车的到达时间表和入站其他站的客流。汉et al。31日)利用图像卷积我每个站的时间和空间相关性,提出短期客流预测模型对轨道交通基于时空图卷积神经网络。两种方法只考虑空间相关性的站内轨道交通系统的影响,忽略其它公共交通模式(即之间传输的影响。,传统的公共汽车交通和快速公交系统(BRT))和轨道交通32]。历史平均模型不能反映客流的变化带来的不确定性,因此预测结果误差比较大。卡尔曼滤波模型需要很多参数向量的计算,使其操作复杂。客流波动较大时,时间序列ARIMA模型不能有效地捕获客流的趋势。支持向量机和事例模型具有较高的时间复杂度并不能适应大规模的训练数据。贝叶斯网络模型的网络建设过程是复杂的。神经网络模型收敛速度慢,它容易成当地的解决方案,对训练数据的高需求。

最近,一个集成学习算法也应用于轨道交通客流预测,取得了良好的效果33]。LightGBM是一个开源、快速、有效提高框架基于决策树算法,基于梯度增加。LightGBM支持有效的并行训练,达到好的结果在回归和分类问题34- - - - - -37),这是非常适合这个领域。在这项研究中,一个时空特征提取方法,提出了考虑客流转移,和地铁车站客流预测模型基于LightGBM构造。本文的其余部分的结构如下。节3,一个正式的描述提出了地铁客流预测的问题。节4,一个时空特征提取方法,并介绍了客流预测模型。节5实验研究基于厦门(一个在福建省东南部城市,中国)公共交通数据,介绍了实验结果和性能评估模型。

3所示。地铁车站客流预测问题的正式描述基于数据驱动和多元回归模型

3.1。相关定义

(1)轨道交通。快速、大容量公共交通的一般术语与电能功率及轮轨交通系统(本研究是指地铁)。(2)地铁站。一个地方提供一个对地铁列车停止运送货物或旅客的。(3)通卡。一种智能卡片可用于公共交通支付系统。(4)BRT二维码。一种二维码可用于BRT支付系统。(5)地铁二维码。一种二维码可用于地铁支付系统。(6)BRT单程票。一种匿名BRT自动票自动售货机销售的票,这是进入车站前刷卡一次,需要放入回收孔之前离开车站。(7)地铁单程票。一种匿名的地铁车票出售的门票自动售货机,自动进入车站前刷卡一次,需要放入回收孔之前离开车站。(8)数据驱动模型。没有先验知识,模型是根据大量的历史数据训练。(9)入站客流短期预测的一个地铁站。预测进入车站的乘客总数的短时间内(数小时或更少)。(10)转移客流。的乘客总数不同运输方式之间转移的时间单位。

3.2。介绍了数据字典的成分

有足够的数据预测的基础。旅客数据获取技术的快速发展,足够的数据可以获得短期客流预测。厦门的公共交通系统被认为是一个例子。在研究期间,有六个主要的乘客在厦门付款类型:“通卡”,“硬币支付,”“BRT二维码,”“BRT单程票”,“地铁二维码”、“地铁单程票。“传统的公交交通支持两种支付方法“通卡”和“硬币付款。“BRT支持三种付款方法的“通卡,”“BRT二维码,”和“BRT单程票。“轨道交通支持三种付款方法的“通卡,”“地铁二维码,”和“地铁单程票。“因此,我们计算轨道交通客流使用数据的“通卡”“地铁二维码,”和“地铁单程票。硬币支付“从上面的描述,只能用于常规公交运输;“BRT二维码”和“BRT二维码”只能用于快速公交;“地铁二维码”、“地铁单程票”只能用于地铁;和“通卡”是唯一通用的支付方式运输的三种模式(即。、常规公交交通、快速公交和轨道交通)。 Additionally, the “Yitong card” has the property of a unique physical card number that corresponds to a unique passenger. Therefore, we can only use the “Yitong card” to identify transfer passenger flow. Additionally, we regard transfer passenger flow as one of the influencing factors in the subsequent section.

表1是一个介绍旅游数据记录: 是表示卡识别属性,起源时间,起源站,目的地,目的地车站,日期、付款类型,和旅游模式(轨道交通、BRT或传统的总线传输),分别。


ID	otime	ostation	dtime	dstation	日期	类型	公共交通

178年^∗∗∗521年	08:05:26	Lianban	08:10:38	文藻	2018.11.01	地铁单程票	轨道交通
261年^∗∗∗345年	09:15:23	Zhenhailu	09:25:46	Lianban	2018.11.05	通卡	轨道交通
174年^∗∗∗020年	10:41:00	Lianban	11:01:22	Zhenhailu	2018.11.14	地铁二维码	轨道交通
356年^∗∗∗742年	11:18:36	陈嘉庚	11:55:47	Lianban	2018.11.07	BRT二维码	快速公交
194年^∗∗∗942年	16:30:38	Kaihelukou	16:42:39	Lianban	2018.11.03	通卡	快速公交
285年^∗∗∗865年	13:44:29	Lianban	13:55:24	二世	2018.11.09	BRT单程票	快速公交
454年^∗∗∗261年	18:25:48	休谟	18:38:26	Lianjingerli	2018.11.02	通卡	传统的总线

3.3。正式的描述一个地铁站的客流预测问题基于数据驱动和多元回归模型

让目标地铁站,预测的时间间隔(例如,10、20或30分钟),和是入站车站的客流在目标时间内。首先,时空的特性影响因素决定,表示为 ,在哪里代表了我^th时空的影响特性。它被用作输入到模型中模型的输出。历史数据作为训练数据,对于多输入变量回归模型。地铁车站客流的回归预测模型的训练, 作为输入,并作为输出。训练模型用于获得工作条件下的预测。是训练样本编号, 。是训练样本的数量。在工作条件下, 作为输入,输出的模型可以用作实际客流的预测价值。是测试样本编号, 。是测试样品的数量。通过比较模型的准确性评估与。问题模型如图1。

3.4。困难的问题

(1)有许多因素影响的短期客流地铁站。公共交通一体化的背景下,各种类型的公共交通模式绑定在一起。地铁客流是不仅影响自己的系统,也被其他公共交通模式。如何使用现有的数据提取和从时空维度选择的重要影响因素是一个重要的问题。(2)和短期客流影响因素之间的关系是复杂和非线性。提高预测的准确性,还需要选择一个合适的模型来表达和客流影响因素之间的非线性关系。

4所示。短期客流预测的轨道交通车站基于麦克风特征选择和ST-LightGBM考虑客流转移

地铁车站客流在时间和空间预测是一个复杂的问题。因此,本节分为四个部分:第一部分是候选人的提取时间和空间特性,影响入站地铁车站的客流,第二部分是候选人的选择使用麦克风算法时空特征,第三部分是基于LightGBM引入预测模型,最后一部分是理论分析和该方法和其他方法的比较。

4.1。时空特征提取

以下4.4.1。时间特征提取

让目标地铁站,预测的时间间隔(例如,10、20或30分钟),是入站车站的客流在目标时间内 , “每周信息”(即。,Monday, Tuesday, …, Sunday) in target period ,和是一天的小时对应于目标。因为地铁车站客流变化在一个星期是不同的(例如,工作日和非工作)和每天的客流变化也不同(例如,高峰时段和非高峰时段),与的变化也改变和。此外,客流具有时间延迟的特性。因此,历史入站客流与当期。因此,历史客流集功能,影响是另一个时间吗。最后,三个时态特征提取: , ,和。

4.1.2。空间特征提取

(1)空间相似性特征提取。因为土地的功能空间相邻站的分布是相似的,(即旅游习惯。起飞时间),在这些相邻站的乘客是相似的。因此,有空间相似性地铁站和相邻站的客流(即。,毗邻常规公交车站、快速公交车站和地铁站)。因此,当前的入站的客流,地铁站也相关的历史入站客流邻站。假设目标地铁站有附近的地铁站,附近公交车站(即。,快速公交和conventional bus stations). Then, the spatial similarity features of the passenger flow at the metro station can be represented by the adjacent station history inbound passenger flow matrix (ASHIM). Select the historical inbound passenger flow in the past期。然后,ASHIM的大小 ,它可以用在哪里入站的客流n^th目标地铁站附近的地铁站在时间内和入站的客流米^th目标地铁站附近的公交车站在时间内。

(2)空间转移特征提取。在旅游活动中乘客转移行为。因此,有些乘客可能转移到其他旅游模式的铁路系统(BRT和常规公交运输)。具体来说,一些乘客将转移到一个临近地铁站离开公共汽车或BRT车站后,继续乘坐轨道交通。因此,对于地铁站 ,比例的乘客出站客流的邻近常规公交和快速公交站在前几个时期将转移到地铁站在时间内然后继续完成轨道交通的旅游活动。因此,地铁站在本期的入站客流也客流转移相关的历史出站客流邻BRT和常规公交车站。根据出站的历史客流附近公交车站(即。,快速公交和conventional bus stations) in the past时期,我们可以获得出站客流相邻车站的矩阵,即。历史,毗邻公交车站出站客流(ABHOM)。ABHOM的大小 ,它可以表示为在哪里出站客流的吗米^th目标地铁站附近的公交车站在时间内。的分析,我们得到每个相邻的出站客流汽车站在前面的时期。然而,随着时间的时期尚未发生,对吗 ,我们不知道有多少比例的客流将转移到地铁站在时间内。为了解决这个问题,我们设置转移率矩阵(TRM)根据历史平均水平转移率。TRM的大小 ,它可以表示为在哪里代表的客流 ,转移到地铁站在时间内 ; 代表了历史平均水平的比例来 ;和是历史的时间序列,包括时间几个星期前,同期。因此,我们获得客流转移矩阵(TPM)。TPM的大小 ,它可以表示为

通过添加TPM的所有元素,我们可以获得的总数转移乘客就是从所有地铁站附近的公交车站在时间内。我们获得空间传输特性。

最后,我们提取候选人是由时间和空间特性的候选特征集 : , , , ,和。

4.2。基于最大信息特征选择系数(MIC)

在前面的部分中,我们构建候选客流预测的时空特征和获得一组全面候选人的功能。特征选择可以解决的问题,造成沉重的计算负担过多的输入特性(38]。客流预测更有效,我们需要选择更重要的特性集并获得一个简化功能输入,以便后续学习过程只需要建立一个模型基于重要特性。嵌入式和包装的特征选择算法的性能密切相关的学习者。该算法易于overfit和具有较高的时间复杂度和较差的可解释性。因此,我们选择滤波器的特征选择算法麦克风(39]。与其他过滤特征选择方法相比,麦克风算法可以广泛的衡量变量之间的依赖关系,如线性和非线性关系,即使对于非功能的依赖,不能由一个函数(例如,依赖由多个功能)。此外,作为一个过滤特征选择算法,执行效率高,所以我们选择麦克风作为特征选择方法。

麦克风主要使用互信息计算和网格划分。互信息是一种指示,表明变量之间的相关性的措施。给定的变量和 , 是样品的数量。互信息的定义如下: 在哪里的联合概率密度和和和边缘概率密度的吗和 ,分别。直方图估计是用来估计上述概率密度。假设是一组有限的命令对。定义部门将变量的范围段和B的范围划分为段。因此,是一个网格。计算互信息在每个网格划分。有很多方法划分网格 ,和最大的价值在每个方法的互信息值。定义的最大互信息公式在部门如下: 在哪里数据表明,除以。使用最大归一化值获得不同部门下形成了特征矩阵,定义为

然后,麦克风被定义为在哪里网格划分的上限价值吗。一般来说,谢夫et al。39)建议是最好的。

我们用麦克风来定义特性之间的相关性和目标价值。候选人的特性集。任何特性之间的相关性和被定义为。值范围是[0,1]。越大值之间的相关性越强和 ,和是很强的相关性特性。越小值,较弱的相关性和 ,和是一个弱相关特性。

特征选择的流程图如图2。通过麦克风特征选择算法,我们获得了重要的特性集。

4.3。ST-LightGBM客流预测模型

LightGBM是一个开源、快速、高效的提升框架基于决策树算法,支持有效的并行训练,可以大大缩短训练时间。梯度的想法提高一次迭代变量,增加单独的子在迭代的过程中,并确保损失函数不断减少。让子模型, 复合模型, 损失函数。每次添加一个新的子模型,损失函数减少对变量的梯度下一个最高的信息内容。梯度提高决策树(GBDT)是一个经典的模型。GBDT梯度增加的功能特点和决策树的优点,实现良好的预测结果和overfit并不容易。然而,当计算信息增益,它需要扫描所有样本确定最佳分割点,这会消耗大量的计算时间。LightGBM是一种GBDT用于解决GBDT遇到的问题在大规模的数据处理。基于它包含两个算法:梯度单面抽样(高斯)和捆绑(EFB)优化GBDT专属功能。戈斯(9]提出了证明的梯度较大的样本,其扮演的角色更重要的在计算信息增益获得相当精确的信息增益估计从少量的样本。高斯算法的核心思想是选择一些样品的大梯度总样本,选择一些样品随机从剩下的样本,并将它们合并到新样本学习一种新的分类器。这种方法使得新样本的分布符合小梯度的总样本和训练数据样本。因此,不改变的前提下样本的分布,分类器学习是不会丢失的准确性和分类器学习的速度大大降低。EFB [9)是一个算法,可以减少特征的高维数据的数量,减少损失。它结合非零特征稀疏特征空间在一起形成一个特征,然后建立相同的特征直方图作为一个特性的特性绑定。因此,训练GBDT可以加速在无损的准确性。

同时,LightGBM采用叶片分裂的方法,计算成本低。通过控制树的深度和每个叶节点的最低数量的数据,它避免了过度拟合现象。LightGBM选择决策树算法基于直方图,可以降低存储成本和计算成本。此外,类别的处理功能也提高了LightGBM特定数据的性能。

该方法的框架如图3。从情节我们可以看到,首先,我们从多源交通数据提取时间特性。其次,根据空间位置的地铁站,我们提取空间相似特性和空间转移特性数据。第三,我们使用麦克风算法选择的重要特性。最后,我们建立一个ST-LightGBM客流预测模型来预测一个地铁站的入站客流在真实的场景中。

4.4。可伸缩性和该方法的局限性

4.1.1。该方法的可伸缩性

(1)这种方法可以应用于任何地铁站的入站客流预测。(2)这种方法也可以应用到入站客流预测的常规公交车站和快速公交站。(3)这个方法并不局限的区域,也可以应用到其他城市。(4)这个方法不能应用于铁路车站客流预测下突发事件的影响,如突如其来的恶劣天气(如暴雨、洪水、台风等),恐怖袭击,交通事故,地铁事故。(5)这种方法的应用仅限于警所一级的预测,不适用于代码或市级的预测。(6)这种方法只适用于短期预测,而不是在地铁站周围的环境变化。

10/24/11。该方法的局限性

(1)候选人的特性需要直接或间接地反映了铁路车站客流影响因素。如果有缺失的重要因素,如转移客流,模型预测的准确性会减少。(2)需要收集足够的历史数据作为训练数据集训练短期预测模型。如果历史数据不足、不准确或吵闹,预测模型的准确性会减少。(3)麦克风的阈值算法和ST-LightGBM模型superparameters会影响实验结果的准确性。有必要提前调整参数根据不同的对象。参数选择不当,将导致较低的精度。(4)特征提取的过程是复杂的,尤其是空间传输特性的特征提取。(5)铁路车站客流预测时,需要使用麦克风算法进一步选择候选人的特性来确定模型的输入。这个过程是复杂的。

4.5。理论分析和比较的方法

比较各种铁路客流预测方法如表所示2。与其他方法相比,该方法提取的特性更全面。特别是,它认为转移客流的影响,中扮演着很重要的角色在地铁车站客流的预测。此外,该方法比其他方法具有更高的预测精度和效率。


研究	时间特性	空间特性	传输特性	模型	适用的数据大小的模型	时间复杂度	建模困难	参数复杂性	精度

冯和蔡40]	是的	没有	没有	华宇电脑	中小	低	低	低	低
太阳et al。21]	是的	没有	没有	小波支持向量机	小	媒介	媒介	媒介	媒介
金等。41]	是的	没有	没有	BP网络	大	高	媒介	高	高
唐et al。32]	是的	是的	没有	ST-LSTM	大	高	高	高	高
Zhang et al。42]	是的	是的	没有	Multi-LSTM	大	高	高	高	高
该方法	是的	是的	是的	ST-LightGBM	大	低	媒介	低	高

5。实验

5.1。实验对象和数据集描述

Lianban地铁站(如图4)是一种重要的厦门铁路客流点1,拥有大量稳定的客流。因此,我们选择了Lianban地铁站为研究对象。以1000米为边界条件,我们选择了14个相邻车站客流稳定。Lianban地铁站邻近地铁站的湖滨东路地铁站和Lianhualukou地铁站;邻BRT车站BRT Lianban站和BRT Huoche站;和相邻的常规公交车站Lianban书城市站,Lianjingerli站,斯明法院站,Lianbanguomao站,Lvjiayuanxiaoqu站,Lianbanbei站,Fengyulu站,Huoche站,休谟站,Huminglijing站。

我们认为厦门居民的旅游数据从11月1日,2018年11月25日,2018年,作为实验数据。预测时间间隔分钟。在一天之内有144块的数据。因此,有3600个样本数据。

5.2。评价方法及指标

分析和比较每个实验的预测效果,我们用5倍交叉验证的平均误差。训练样本的数量是2880,和测试样品的数量是720。

我们使用了两个著名的错误评价指标:平均绝对误差(MAE)和均方误差(MSE)。计算公式是

美和MSE的值越低,模型的预测精度越高。

5.3。参数设置

有48个候选人时空特性。所有候选时空特性和相应的MIC值如表所示3。根据图5,麦克风阈值是0.7。我们选择的候选人时空特征与一个麦克风值大于0.7的重要功能,共有23个重要的时空特性。


候选人的时空特性	麦克风的价值

入站BRT Huoche车站的客流在时间	0.880
入站客流Lianban地铁站的时期	0.849
入站Lianbanguomao车站的客流在时间	0.833
入站客流湖滨东路地铁站的时期	0.803
入站的客流斯明法院站在时间	0.771
入站Lvjiayuanxiaoqu车站的客流在时间	0.738
入站Lianbanbei车站的客流在时间	0.691
入站Fengyulu车站的客流在时间	0.613
入站的客流Lianban书城市站时间	0.454
入站Huminglijing车站的客流在时间	0.337
	0.879
入站客流Lianhualukou地铁站的时期	0.840
入站BRT Lianban车站的客流在时间	0.826
入站Lianbanguomao车站的客流在时间	0.803
入站Lianbanguomao车站的客流在时间	0.771
入站的客流斯明法院站在时间	0.723
入站Fengyulu车站的客流在时间	0.658
入站休谟车站的客流在时间	0.522
入站的客流Lianban书城市站时间	0.448
入站Huminglijing车站的客流在时间	0.323
入站BRT Lianban车站的客流在时间	0.861
入站客流湖滨东路地铁站的时期	0.838
入站BRT Huoche车站的客流在时间	0.821
入站Huoche车站的客流在时间	0.783
入站客流Lianhualukou地铁站的时期	0.770
入站Huoche车站的客流在时间	0.706
入站Lvjiayuanxiaoqu车站的客流在时间	0.648
入站休谟车站的客流在时间	0.499
入站Lianjingerli车站的客流在时间	0.430
入站Huminglijing车站的客流在时间	0.313
入站BRT Lianban车站的客流在时间	0.858
	0.836
入站客流Lianban地铁站的时期	0.810
入站客流Lianban地铁站的时期	0.781
入站Huoche车站的客流在时间	0.750
入站Lvjiayuanxiaoqu车站的客流在时间	0.696
入站Fengyulu车站的客流在时间	0.640
入站休谟车站的客流在时间	0.487
入站Lianjingerli车站的客流在时间	0.417
入站BRT Huoche车站的客流在时间	0.857
	0.835
入站客流Lianhualukou地铁站的时期	0.807
入站客流湖滨东路地铁站的时期	0.773
入站Lianbanbei车站的客流在时间	0.744
入站的客流斯明法院站在时间	0.695
入站Lianbanbei车站的客流在时间	0.631
入站的客流Lianban书城市站时间	0.455
入站Lianjingerli车站的客流在时间	0.395

基于厦门交通数据,四个实验中使用的模型:季节性ARIMA (SARIMA), SVR模型,反向传播神经网络(BP网络),和LightGBM。入站客流预测的目标频率的10分钟。每一个模型的细节如下:(1)SARMIA:季节性时期“S”是144,因为在一天有1440分钟(144×10分钟)。ARIMA(2 1 0)×144(0, 1, 1)最终使用。(2)SVR:时间是144(144×10分钟/天)。(3)BP网络:网络结构组成的三层,在每一层的数量单位是10。(4)LightGBM(没有时间和空间的特性,只使用历史客流):Max_depth是11和Num_leaves是512。控制过度拟合,Min_data是30。(5)ST-LightGBM(时间和空间特性):Max_depth是11和Num_leaves是1024。控制过度拟合,Min_data是12。

(一)

(b)

(一)

(b)

(一)

(b)

5.4。实验结果

SARIMA模型的预测效果。模型的预测结果如图所示6,8.28的美价值和MSE值为164.06(随机折)的预测结果。SVR模型的预测效果。模型的预测结果如图所示7。没有特征选择,如图7(一),美值是9.50和均方误差值是170.67。特征选择,如图7 (b),美值8.57和均方误差值是155.94(随机折)的预测结果。BP网络的预测效果。模型的预测结果如图所示8。没有特征选择,如图8(一个),美值是9.40和均方误差值是180.95。特征选择,如图8 (b),美值8.34和均方误差值是151.31(随机折)的预测结果。ST-LightGBM的预测效果与时间和空间特性()。模型的预测结果如图所示9。没有特征选择,如图9(一个),美值是6.95和均方误差值是118.36。特征选择,如图9 (b),美值5.77和均方误差值是86.10(随机折)的预测结果。

5.5。对实验结果的分析

算法的实验结果如表所示4。拟议中的ST-LightGBM实现更好的性能比SARIMA SVR和BP网络。此外,随着特征选择,该模型精度高于其他模型实现的。(1)如图10的训练时间,我们可以看到ST-LightGBM小于BP和SVR模型,但超过SARIMA模型,预测的时间也是如此。这表明,该方法具有较高的计算效率,可用于实际应用。(2)如图所示在第二、第三和最后一行的表4特征选择,模型的预测精度得到了改善。(3)从梅的角度,ST-LightGBM网络比其它模型更准确。美ST-LightGBM模型的误差是30.41%不到的SARIMA模型,SVR模型的不到32.86%,31.57%不到的BP网络模型。(4)此外,MSE, ST-LightGBM模型的MSE误差小于46.78%的SARIMA模型,SVR模型的不到43.77%,低于44.39%的BP网络模型。(5)根据标准偏差,我们可以看到ST-LightGBM方法比其他模型有更好的稳定性。因此,拟议中的ST-LightGBM方法更适合短期对轨道交通客流预测。


实验	方法

1	SARIMA	8.22±0.51	161.16±8.69
2	SVR(没有特征选择)	9.65±0.68	173.36±9.62
2	SVR与特征选择()	8.52±0.54	152.54±7.92
3	BP网络(没有特征选择)	9.42±0.49	181.35±8.46
3	BP网络(与特征选择)	8.36±0.42	154.22±6.51
4	ST-LightGBM(没有特征选择)	6.93±0.13	118.27±3.42
4	ST-LightGBM(与特征选择)	5.72±0.11	85.76±2.42

(一)

(b)

6。结论和未来的工作

我们提出了一种时空LightGBM地铁车站客流预测模型考虑客流转移。与以往的研究方法相比,该方法考虑了时间和空间的特性,影响入站在地铁车站客流。特别的空间特性,我们介绍了空间的概念相似度和空间转移和建立了ASHIM特征矩阵和TPM特征矩阵。因此,空间影响因素被认为是更全面。此外,我们使用了一个麦克风特征选择算法获得的重要功能;因此,模型的输入是简化。此外,与其他方法相比,该方法的预测精度也较高,所以该方法具有更好的适用性的地铁站入站客流短期预测。

在未来的工作中,我们将使用科学的特征提取方法(43进一步从大量的数据中提取有效的特征。目前,很难进一步提高现有单一模型的预测精度。在未来的工作中,我们可以进一步考虑结合快速聚类算法(44- - - - - -46)和其他机器学习或深度学习模型建立组合预测模型,进一步提高预测精度。此外,我们可以结合分布式算法(47,48)来提高模型的预测效率。

数据可用性

使用的数据来支持本研究的结果可在[42]。

的利益冲突

作者宣称没有利益冲突有关这篇文章的出版。

确认

这项研究得到了国家自然科学基金青年基金(没有。1608209),中国福建省自然科学基金项目(没有。2017 j01090),泉州市科技计划的项目中国没有。2018 z008), 2018华侨大学研究和建立研究生教育教学改革项目(没有。18 yjg28),华侨大学研究生科研创新能力培养计划(没有。18014083027),美国国家科学基金会(没有。dms - 0907710),中国国家自然科学基金(没有。18 btj031),陕西省的关键研究和发展项目(没有。2018 zdxm - gy - 036),中国福建省自然科学基金(没有。2019 j01080),福建省科技计划(没有。 2019H0017), and Shaanxi Key Laboratory of Intelligent Processing for Big Energy Data (no. IPBED7).

引用

j .崔y高,j . Cheng和l .史”研究保持调整公交线路的选择模型沿着轨道交通,“《先进的交通工具卷,2020篇文章ID 6385359, 12页,2020。视图:出版商的网站|谷歌学术搜索
中国地铁协会”,城市轨道交通的统计数据和分析报告,2019年,“2020年,http://www.camet.org.cn/tjxx/5133。视图:谷歌学术搜索
k . n .阿里Safwat t·l·马尼安蒂,“总代旅行,旅行分布模态分裂,和旅行的任务模式,”交通科学,22卷,不。1,14-30,1988页。视图:出版商的网站|谷歌学术搜索
m·弗洛里安和美国阮总旅行分布模态分裂和旅行分配模型,”交通研究,12卷,不。4、241 - 246年,1978页。视图:出版商的网站|谷歌学术搜索
p .商r . Li z . Liu k .西安和j .郭”时间表同步和优化考虑时间乘客需求的城市地铁网络,”交通研究记录:《交通研究委员会,卷2672,不。8,243 - 254年,2018页。视图:出版商的网站|谷歌学术搜索
p .商r . Li z . Liu l·杨和y . Wang”趋向股票站调度优化的过饱和的城市轨道交通网络,”交通研究部分C:新兴技术卷,89年,第343 - 321页,2018年。视图:出版商的网站|谷歌学术搜索
李y, z . b .史,和t . Yu”短期负荷预测基于回归模型优化的细菌群体趋药性算法”《2009年国际会议信息和多媒体技术p。306年,济州岛,韩国,2009年12月。视图:出版商的网站|谷歌学术搜索
赵郭z、x, y,和j·杨,w . Wu”短期客流预测基于探地雷达的城市轨道交通和KRR”专业智能运输系统,13卷,不。9日,第1382 - 1374页,2019年。视图:出版商的网站|谷歌学术搜索
g .柯孟,t·芬利et al .,“Lightgbm:一种高效梯度提高决策树,”先进的神经信息处理系统麻省理工学院出版社,页3146 - 3154年,剑桥,妈,美国,2017年。视图:谷歌学术搜索
d·杰弗瑞·k Russam d·罗伯逊,“电子路线指导AUTOGUIDE:研究背景,“交通工程与控制1987年,卷。28日。视图:谷歌学术搜索
m . El Esawey“每日自行车交通量估计:历史平均水平的比较和计算模型,”城市规划与发展》杂志上卷,144篇文章ID 04018011, 2018。视图:出版商的网站|谷歌学术搜索
h·杨,杨j·l·d·汉et al .,“基于时空克里格方法对交通量数据归责,“《公共科学图书馆•综合》文章ID e0195957卷。13日,2018年。视图:出版商的网站|谷歌学术搜索
j .郭w·黄和b·m·威廉姆斯,“自适应卡尔曼滤波方法对随机短期交通流量预测和量化不确定性,”交通研究部分C:新兴技术,43卷,50 - 64年,2014页。视图:出版商的网站|谷歌学术搜索
焦p, r, t .太阳,z, a·易卜拉欣,”三种修正卡尔曼滤波模型对短期轨道交通客流预测,“数学问题在工程卷,2016篇文章ID 9717582, 10页,2016。视图:出版商的网站|谷歌学术搜索
美国诉Kumar和l . Vanajakshi”短期交通流预测使用季节性ARIMA模型和有限的输入数据,”欧洲交通研究回顾p。卷。7日,21日,2015年。视图:出版商的网站|谷歌学术搜索
m . Milenkovićl .Švadlenka诉Melichar: Bojović,z . Avramović,“SARIMA模型方法对铁路客流预测,“运输33卷,第1120 - 1113页,2016年。视图:出版商的网站|谷歌学术搜索
s . Anvari s金枪鱼、m . Canci和m . Turkay”自动Box-Jenkins乘客需求预测工具与应用程序在城市轨道系统中,“《先进的交通工具,50卷,不。1,25-49,2016页。视图:出版商的网站|谷歌学术搜索
g . y . l . Li Wang钟,j . Zhang和b跑,“中短期内客流预测地铁站使用混合模型,”KSCE土木工程杂志》上,22卷,不。5,1937 - 1945年,2018页。视图:出版商的网站|谷歌学术搜索
l . Tang y赵,j·卡布瑞拉,j . Ma和k·l·崔”短期客流预测:一个实证研究在深圳地铁,”IEEE智能交通系统,20卷,不。10日,3613 - 3622年,2019页。视图:出版商的网站|谷歌学术搜索
m . Gensuo z Liqin, l .苗族“地铁车站客流预测基于混合核支持向量机优化通过黄金分割混沌粒子群优化,“计算机工程与应用,卷2015,p . 2015。视图:谷歌学术搜索
y, b .愣,w .关”小说wavelet-SVM短时客流预测在北京地铁系统,”Neurocomputing卷,166年,第121 - 109页,2015年。视图:出版商的网站|谷歌学术搜索
g·a·戴维斯和n . l . Nihan“非参数回归和短期高速公路交通预测,”交通运输工程学报,卷117,不。2、178 - 188年,1991页。视图:出版商的网站|谷歌学术搜索
f . g . Habtemichael和m . Cetin短期交通流量预测基于识别类似的交通模式,”交通研究部分C:新兴技术卷,66年,第78 - 61页,2016年。视图:出版商的网站|谷歌学术搜索
g·加文·j·鲁斯,s . Bonnevay”动态贝叶斯网络的方法来预测短期城市轨道客流与不完整的数据,”交通研究Procedia,卷。26日,53 - 61年,2017页。视图:出版商的网站|谷歌学术搜索
y魏和M.-C。陈,“地铁客流短期预测经验模态分解和神经网络,”交通研究部分C:新兴技术,21卷,不。1,第162 - 148页,2012。视图:出版商的网站|谷歌学术搜索
y呗,z太阳,b .曾庆红,j .邓和c·李,“多模式深度融合模型短期公交客流预测,“应用软计算58卷,第680 - 669页,2017年。视图:出版商的网站|谷歌学术搜索
h·朱、杨x和y,“预测每日入口和出口的轨道交通车站客流深度学习方法,“《先进的交通工具卷,2018篇文章ID 6142724, 11页,2018年。视图:出版商的网站|谷歌学术搜索
l·刘,R.-C。陈,“小说客流预测模型使用深度学习方法,“交通研究部分C:新兴技术卷,84年,第91 - 74页,2017年。视图:出版商的网站|谷歌学术搜索
问:陈,x l . Di, d . Chen h . Lv j . Zhang和p高,“基于经验模态分解的长期短期记忆神经网络对地铁客流短期预测模型,”《公共科学图书馆•综合》,14卷,2019年。视图:出版商的网站|谷歌学术搜索
刘y, z, r·贾”DeepPF:深入学习基础架构地铁客流预测,“交通研究部分C:新兴技术卷。101年,18 - 34岁的2019页。视图:出版商的网站|谷歌学术搜索
韩y s . Wang y任,c . Wang p高,和g·陈,“警所一级的短期客流预测在全市的地铁网络使用时空图卷积神经网络,”ISPRS国际信息杂志》上,8卷,不。6,243年,页2019。视图:出版商的网站|谷歌学术搜索
问:唐,m·杨,杨y,“ST-LSTM:深入学习方法结合轨道交通短期预测的时空特性,”《先进的交通工具卷,2019篇文章ID 8392592、8页,2019。视图:出版商的网站|谷歌学术搜索
l .太阳戴x, y,“基于短期叫做地铁流与概率预测模型选择的方法,”《先进的交通工具卷,2018篇文章ID 5942763, 15页,2018年。视图:出版商的网站|谷歌学术搜索
l·邓j .锅x, w·杨,c . Liu和h·刘,“PDRLGB:精确的dna结合蛋白残留预测使用光梯度提升机,”BMC生物信息学,19卷,p。522年,2018年。视图:出版商的网站|谷歌学术搜索
g . Du马l . js。胡et al .,“30天重新接纳的预测:一种改进的梯度提高决策树的方法,”医学成像和卫生信息学杂志》上,9卷,不。3、620 - 627年,2019页。视图:出版商的网站|谷歌学术搜索
答:联合国和a·库马尔的python应用程序评估决策树的性能提升算法,”环境的进步与可持续能源,37卷,不。2、618 - 623年,2018页。视图:出版商的网站|谷歌学术搜索
j·w·李,叮,j . Wang和c .夏”P2P贷款违约预测基于机器学习从高维数据,”自然史答:统计力学及其应用文章ID 122370卷,534年,2019年。视图:出版商的网站|谷歌学术搜索
李顾x, y, j .贾”的暂态稳定评估特征选择基于kernelized模糊粗糙集和迷因算法,”国际期刊的电力和能源系统卷,64年,第670 - 664页,2015年。视图:出版商的网站|谷歌学术搜索
d . n•y . a•h·k·芬努凯恩et al .,“检测小说在大型数据集关联。”科学,卷334,不。6062年,第1524 - 1518页,2011年。视图:出版商的网站|谷歌学术搜索
冯和g . Cai”客流预测的地铁站基于ARIMA模型,”《2015年国际会议上对轨道交通电气和信息技术施普林格,页463 - 470年,柏林,德国,2016年。视图:出版商的网站|谷歌学术搜索
j .金黄懿慧王,m·李”预测地铁部分客流时空特征的基础上,“应用力学和材料卷,397 - 400,1038 - 1044年,2013页。视图:出版商的网站|谷歌学术搜索
y z, c . Wang高,y . Chen和j·陈,“铁路车站的客流预测基于多源数据和长期短期记忆网络,”IEEE访问,8卷,第28483 - 28475页,2020年。视图:出版商的网站|谷歌学术搜索
问:Ke, j . Zhang h .歌曲,和y Wan,“大数据分析基于部分独立,通过特征提取”Neurocomputing卷,288年,页3 - 10,2018。视图:出版商的网站|谷歌学术搜索
l . y . Chen,美国贝聿铭et al .,“KNN-BLOCK DBSCAN:快速大规模数据的聚类,“IEEE系统,人,和控制论:系统,2019年1 - 15页。视图:出版商的网站|谷歌学术搜索
x y . Chen, w .风扇et al .,“快密度峰值大规模数据的聚类根据资讯,“以知识为基础的系统文章ID 104824卷,187年,2020年。视图:出版商的网站|谷歌学术搜索
陈y,唐,n . Bouguila c . Wang j . Du和h·李,“快速聚类算法基于DBSCAN修剪不必要的距离计算高维数据,”模式识别卷,83年,第387 - 375页,2018年。视图:出版商的网站|谷歌学术搜索
w·魏x夏,m·沃兹尼亚克,x粉丝,r . Damaševičius李和y”Multi-sink分布式功率控制算法在煤矿Cyber-physical-systems隧道,”计算机网络卷,161年,第219 - 210页,2019年。视图:出版商的网站|谷歌学术搜索
w·魏x粉丝,h .歌曲,x的粉丝,和j·杨,“基于不完全信息动态Stackelberg博弈为云计算资源分配使用隐马尔科夫,”IEEE服务计算,11卷,不。1,第89 - 78页,2016。视图:出版商的网站|谷歌学术搜索

科学的规划

对智能世界2020年科学规划

短期客流预测的轨道交通车站基于麦克风特征选择和ST-LightGBM考虑客流转移

文摘

1。介绍

3所示。地铁车站客流预测问题的正式描述基于数据驱动和多元回归模型

3.1。相关定义

3.2。介绍了数据字典的成分

3.3。正式的描述一个地铁站的客流预测问题基于数据驱动和多元回归模型

3.4。困难的问题

4所示。短期客流预测的轨道交通车站基于麦克风特征选择和ST-LightGBM考虑客流转移

4.1。时空特征提取

以下4.4.1。时间特征提取

4.1.2。空间特征提取

4.2。基于最大信息特征选择系数(MIC)

4.3。ST-LightGBM客流预测模型

4.4。可伸缩性和该方法的局限性

4.1.1。该方法的可伸缩性

10/24/11。该方法的局限性

4.5。理论分析和比较的方法

5。实验

5.1。实验对象和数据集描述

5.2。评价方法及指标

5.3。参数设置

5.4。实验结果

5.5。对实验结果的分析

6。结论和未来的工作

数据可用性

的利益冲突

确认

引用

版权

更多相关文章

相关文章

科学的规划

对智能世界2020年科学规划

短期客流预测的轨道交通车站基于麦克风特征选择和ST-LightGBM考虑客流转移

文摘

1。介绍

2。相关工作

3所示。地铁车站客流预测问题的正式描述基于数据驱动和多元回归模型

3.1。相关定义

3.2。介绍了数据字典的成分

3.3。正式的描述一个地铁站的客流预测问题基于数据驱动和多元回归模型

3.4。困难的问题

4所示。短期客流预测的轨道交通车站基于麦克风特征选择和ST-LightGBM考虑客流转移

4.1。时空特征提取

以下4.4.1。时间特征提取

4.1.2。空间特征提取

4.2。基于最大信息特征选择系数(MIC)

4.3。ST-LightGBM客流预测模型

4.4。可伸缩性和该方法的局限性

4.1.1。该方法的可伸缩性

10/24/11。该方法的局限性

4.5。理论分析和比较的方法

5。实验

5.1。实验对象和数据集描述

5.2。评价方法及指标

5.3。参数设置

5.4。实验结果

5.5。对实验结果的分析

6。结论和未来的工作

数据可用性

的利益冲突

确认

引用

版权

更多相关文章

相关文章