文摘

客流预测是必要的重要的铁路运输的组织,最重要的一个基本决策的交通模式和列车运行计划。高速铁路的客流特性的准周期性的变化在短时间内和复杂的非线性波动,因为存在许多影响因素。在这项研究中,一个基于模糊时序逻辑的客流预测模型(FTLPFFM),提出了基于模糊逻辑的关系识别技术,预计短期内高速铁路客流,预测精度也明显改善。一个应用的例子使用实际数据说明了FTLPFFM的精密度和准确度。对于这个应用情况下,该模型执行比k最近的邻居(资讯)和自回归移动平均(ARIMA)模型集成。

1。介绍

高速铁路作为一种大量的客运模式已经在欧洲和日本等发达和发展在中国更大的规模和已计划在美洲大陆发展。在这些领域,高速铁路的角色客运交通系统的骨干。如何提高操作效率和提高客运服务决策demand-responsive最研究关注的重要焦点。作为一个最重要的高速铁路运输决策的基本模式和列车运行计划、客流预测是基本的重要性,和短期客流预测是日常经营管理成功的关键。

最近,许多预测技术被用来解决预测问题。林和阳应用灰色预测模型预测准确台湾光电产业的产值从2000年到2005年(1]。在[2),四个模型开发和测试的高速公路交通流预测问题。他们历史平均水平、时间序列神经网络和非参数回归模型。非参数回归模型显著优于其它模型。杜和任3)提出了一个预测模型火车客流量帮助铁路局的运行策略的分析。工业经济指标和模型分析了基于柯布-道格拉斯理论预测。特别是ARIMA模型已成为最常见的一个方法的参数预测自1970年代。ARIMA模型时滞变量的线性组合和错误条件,已广泛应用于预测短期交通流量等数据,旅行时间和速度。在[4),交通流的时间序列数据的特点是明确的周期循环。季节性自回归综合移动平均(ARIMA)和冬季指数平滑模型开发。在[5),它提出了理论依据与季节性ARIMA建模一元交通数据流过程。在[6),哈米德等人试图建立时间序列模型预测交通量在城市干道,和Box-Jenkins ARIMA模型被证明是最适当的模型复制所有原始时间序列。正如布鲁克斯所言,ARIMA和强劲表现良好线性和平稳时间序列建模7]。然而,ARIMA模型的应用程序是有限的,因为他们认为线性时滞变量之间的关系和他们无法捕捉的结构非线性关系(8]。

非参数回归模型应用于预测交通需求。然而,在这些非参数技术,然而方法已很少采用预测交通需求。罗宾逊和波兰语的提出了利用资讯技术来估计城市把旅行时间与单回路电感回路探测器数据,发现和优化资讯模型提供更准确的估计比其他城市旅行时间联系方法(9]。

神经网络模型经常被用来预测。在[10),时间相关性的时滞递归神经网络和递归神经网络预测和多个描述。和最好的性能达到了时滞递归神经网络。在[11),混合EMD-BPN预测方法相结合经验模态分解(EMD)和反向传播神经网络(症)开发的短期客流预测地铁系统。在[12),铁路短期客流预测模型基于BP神经网络建立了基于BP神经网络的原理及分析铁路客流的时间序列特征。在[13),介绍了神经网络模型相结合的预测单一神经网络预测根据自适应和信贷分配启发式算法基于条件概率理论和贝叶斯规则。在[14),陈和Grant-Muller报道另一种神经计算算法的应用和性能涉及“顺序或动态学习”的交通流过程。这表明潜在的动态神经网络交通流数据的适用性。在[15),李和Chong-Xin混沌理论预测。延迟时间和嵌入维数计算重构相空间,确定人工神经网络的结构,和中国山西电网负荷数据是用来表明该模型比经典标准BP神经网络模型更有效。

采用支持向量机技术也被预测。在[16),修改版本的模式识别技术,即支持向量机回归预测年度平均每日流量。胡等人利用支持向量机回归的理论和方法,建立了基于最小二乘支持向量机回归模型。通过预测客流杭州高速公路在2000 - 2008年,作者表明,最小二乘支持向量机的回归模型有更高的精度和可靠性预测(17]。

自问题,介绍了高速铁路客流预测是高速铁路的组织至关重要。然而,几项研究已经关注短期高速铁路客流预测的基础上,旅客流量的规律性和随机性。一种新方法,因此,非常需要的。基于模糊时序逻辑的客流预测模型(FTLPFFM)提出。高速铁路客流的准周期性的变化充分反映和非线性波动的高速铁路客流处理使用模糊逻辑关系在搜索过程的识别技术。该模型具有明确的物理意义,反映了高速铁路客流的变化和有足够的可理解性和可解释性。短期高速铁路客流的特点至关重要预测模型用于改善预测性能的模糊 最近的邻居通过比较与其他预测方法在短期高速铁路客流预测。

本文的其余部分组织如下。节2,高速铁路的客流特征和客流变化相邻段进行了总结。节3,客流的变化程度分为8个等级根据认知习惯和客流fuzzified变化率。FTLPFFM提出了部分4。节5,FTLPFFM的应用的实验结果与ARIMA和资讯模型在使用三个统计:平均绝对误差(MAE)、平均绝对百分误差(日军)和均方根误差(RMSE)。FTLPFFM似乎更健壮的和普遍的拟合。最后一部分是结论和未来的工作。

2。客流特征提取

短期客流预测,高速铁路客流的特点,总结了基于时间变量,因为客流时间变量有很强的相关性。高速铁路客流的数据收集从Beijingnan火车站到Jinanxi火车站,在每小时客流从3月26日到2012年4月4日(见图1)和日常客流从5月14日到2012年7月31日(见图2)。

两个特征的高速铁路客流在FTLPFFM考虑。第一个重要的特点是准周期性的强加了一个伟大的对客流预测的影响。高速列车的运行时间是6点到放送,早高峰和晚高峰客流比其他时期,这是显示在图1。此外,高速铁路客流通常是稳定的从周六到周三,周四上涨,周五到达峰值,显示在图2。因此,高速铁路客流的波动周期是一天一个星期。第二个是非线性波动也强加了一个伟大的对客流预测的影响。具体来说,客流的变化速度与非线性不稳定波动一段时间,因为很多影响因素,如乘客的运输收入、旅行成本和服务质量,这是显示在图12

3所示。客流规律

符号: :客流在时间 , :点的总数的历史客流系列, :当前客流状态, :客流变化速率 , :客流变化的时间间隔, 的中间值 , 历史客流系列用 。客流变化利率 相邻时间考虑在内,然后分析了客流变化利率变化的客流相邻周期是总结。

3.1。客流的变化率

为了表达客流趋势显然在相邻的时期,更准确地说,客流变化率是标准化的。

定义标准化的客流变化速率 , 。为 ,客流下降的时期 ;为 ,客流增加的时期 ;为 ,客流不会改变

在表1,数据收集从Beijingnan火车站Jinanxi在京沪高速铁路火车站。例如,客流变化的最大值计算相邻的时期 ;客流变化速率从8:00-8:30 8:30-9:00 10月10日计算 。同样,我们可以计算客流变化利率,0.231,0.5158,0.8145−,等等,如表所示1

3.2。客流的变化

为了揭示客流趋势明显的规律性和表达不同程度的客流变化,分别除以客流变化率成八间隔应用德的模糊集合理论18]。

定义论域 划分成相等长度的间隔 , , , , , , , 。这些区间的中点 , , , , , , , 。定义模糊集 基于改变间隔;模糊集 代表一个客流的语言值表示为一个模糊集,

的符号 , , , 表示,客流下降太大,大,microlarge,分别和更少。同时,符号 , , , 表示,客流增加较少,microlarge,大,太大。

八个隶属度函数本文充分反映高速铁路客流的准周期性的变化,和FTLPFFM具有更好的预测结果准确性基于八个隶属度函数。定义的模糊子集的隶属函数 ,即

不同客流变化利率可以fuzzified到相应的模糊集。例如,见表1从7:00-8:00客流变化速率8:00-9:00是0.273,这是fuzzified 。客流变化速率从8:00-9:00 9:00-10:00是0.231,这是fuzzified 。客流变化速率从9:00-10:00 10:00-11:00是0.5158,这是fuzzified 。和客流变化速率从10:00-11:00 11:00-12:00−0.8145,这是fuzzified 。模糊化过程如图3。一些fuzzified客流变化表中列出1

模糊逻辑关系建立了连续两个模糊集,如下: ”表示“fuzzified客流变化速率 从时间 然后fuzzified客流变化速率 从时间 ”。

见图4,fuzzified客流变化率从7:00-8:00 8:00-9:00 从8:00-9:00 9:00-10:00 。因此,我们可以建立一个模糊逻辑关系 。同样,从表1,我们可以建立模糊逻辑关系 , , , ,等等。一些模糊逻辑关系表中列出2

4所示。基于模糊时序逻辑的客流预测模型

符号: :属于客流变化速率 , :邻域的大小, :目前的客流变化速度向量的维数。

4.1。再模型

最近的邻居模型是最著名的模式识别统计模型。然而,模型定义社区的 情况下距离最少的输入状态(19]。文献表明,欧几里得距离通常是用来确定输入状态之间的距离和病例数据库(20.]。预测可以平均情况下观察到的输出值计算,属于左邻右舍的。

例如,一个客流系列 在哪里 是系列的点的总数。我们搜索系列找到最近的邻居,当前的状态 。然后,我们预测 这些最近的价值观的基础上;例如,如果社区大小 和最近的客流 ,那么我们就会预测 的基础上 。的价值 在资讯模型往往是通过实证分析。一般而言,资讯模型可以列出的步骤如下。

步骤1。确定邻域大小 和原始的状态变量。

步骤2。输入的所有原始状态变量到开发数据库。

步骤3。计算欧氏距离的当前状态变量的每个州在开发数据库。

步骤4。选择的输出 最近的邻居的基础上 从数据库开发最短欧氏距离。

第5步。计算预测值的平均输出的 最近的邻居。

4.2。基于模糊时序逻辑的客流预测模型

假设 段历史客流状态向量和 是历史的客流变化速度向量。为 , 是当前客流状态向量和当前的客流变化速度向量。

4.2.1。准备距离度量

给乘客流的状态矩阵和矩阵的客流变化速率,以比较不同时期的客流之间的关系更清楚。客流的状态矩阵是由

矩阵的客流变化速率是由

一个共同的方法来衡量“近似”资讯模型是使用欧氏距离(18]。因此,客流状态向量的欧氏距离和客流变化速度向量如下:

4.2.2。预测客流变化速率

假设邻域搜索过程标识 邻居的客流状态向量 邻居们 ( ), 旁边的是 , 是当前客流状态向量。客流变化利率对应 , 。客流变化速率的数量 属于 和的值 对应于

预测的一种方法是计算平均 年代的邻居已经在社区:

4.2.3。步骤FTLPFFM

FTLPFFM的建立是基于模糊 最近的邻居预测方法。

FTLPFFM步骤如下。

步骤1。从最小邻域大小,

步骤2。从当前的客流的最小尺寸变化率向量,

步骤3。开始时间 预测客流。

步骤4(匹配找到基本的邻居)。找到最近的匹配当前客流状态向量 通过搜索客流系列 使用(5),然后按升序排序。假设一个索引 ,最近的匹配客流状态向量 和历史客流变化速度矢量相关 。在这里,目前客流变化速度向量 ;搜索相同的模糊逻辑关系 ,并选择 匹配的基本的邻居。适当的客流变化速度向量 将在下面讨论。

第五步(匹配找到最近的邻居)。找到最近的比赛 搜索所有历史客流变化速度向量 使用(6),然后按升序排序,选择顶部 匹配。他们是最近邻客流状态向量 和输出 ,

步骤6。估计客流变化速率 使用(7)。

步骤7。计算客流的预测价值 并将其添加到数据库;重复步骤47关于 直到 , 是最后一个。

步骤8。计算实际值和预测值之间的均方根误差,给出的 在哪里 实际值的预测价值吗

第9步。重复步骤38为向量维度

第10步。重复步骤29邻域大小的

步骤11。选择的最优预测值的客流收益率最小RMSE通过优化向量维度和附近。

选择当前的最大尺寸客流变化速度向量和最大邻域大小根据客流的特点。史密斯和Demetsky (1994) (20.使用生成]发现最好的预测 ,Karlsson Yakowitz (1987) (21)建议最好的预测价值生成的使用 。王et al。(2011) (22)和奥斯瓦尔德et al . (2001) (23)显示,最好的结果的时候 。我们获得最好的预测客流的值作为几乎所有的搜索空间,这是 使用不同的数据集,通过大量的实验。

5。案例研究

获得的数据从国家关键技术研究和发展项目,轨道交通控制与安全国家重点实验室,北京交通大学。数据库之间每小时客流7点和晚上九点在京沪高速铁路从北京到济南,分别是分成两个部分:一个评估数据集和测试数据集。估计数据集收集从7月1日到2011年12月31日(2576年)观察和收集到的测试数据集从1到2012年1月22日(300观察)。

根据客流特征,我们可以设置 。开发模型对高速铁路的客流是使用MATLAB实现7.1版。最好的结果的时候 可以看到从RMSE性能和RMSE = 2.7046。最好的预测结果和实际值如图5

ARIMA模型是一个基准测试方法在预测领域,但它是一个灰色的框模型不能反映底层结构属性。资讯数据模型具有动态适应性是白箱模型和有足够的可理解性。和FTLPFFM提出了基于资讯预测模型和有足够的可理解性和可解释性。因此,FTLPFFM ARIMA和资讯模型相比,使用三个统计:梅,日军,和RMSE,如表所示3。和(9)展示了美和日军分别计算。考虑

绝对误差和绝对的相对偏差三个计算模型如图67

的结果,预测结果和实际值之间的比较表明,该模型已被证明是有效和错误是可以接受的。

6。结论和未来的工作

铁路运输是一种越来越受欢迎的交通模式中的悠悠距离旅程近年来在许多国家。短期客流预测中发挥了关键作用高速铁路智能运输系统。摘要FTLPFFM开发测量不确定性的铁路客运高速铁路客流管理。在FTLPFFM,过去的客流序列被认为是预测未来客流识别技术在搜索过程中使用模糊逻辑关系。研究结果表明,预测精度(测量与美,日军和RMSE)的FTLPFFM明显比ARIMA和资讯模型的精度水平。基于模糊时序逻辑的客流预测模型还提供了一个理论基础资源分配的决策。在更一般意义上的应用程序中,该方法可以适应在多模式交通系统特别是铁路运输和地铁交通。为未来的工作,本研究的一个可能的扩展是通过适当提高预测精度应用数据融合和模式识别技术。

利益冲突

作者宣称没有利益冲突有关的出版。

确认

项目是由中国国家自然科学基金(没有。61074151),中国的国家关键技术研究与发展计划(没有。2009 bag12a10),中国国家863高技术研究与发展计划(没有。2012 aa112001),北京交通大学研究基金会(没有。T14JB00380),中国。