文摘

客流急剧增加的成就在中国大城市的地铁网络系统。作为地铁线路的融合节点,转运站需要承担更多的乘客由于金额转移需求在不同的行。然后,传输设施必须面对巨大的压力如行人拥挤或其他异常情况。为了避免行人拥挤或警告管理在它发生之前,是非常必要的预测客流转移预测行人拥挤。因此,基于非参数回归理论,提出了一种转移客流预测模型。为了测试和说明预测模型,数据的传输在西单换乘站客流一个月被用来校准和验证模型。通过比较与卡尔曼滤波模型和支持向量机回归模型,结果表明,非参数回归模型的优点移植能力强,测量精度高,可以准确预测客流转移不同的间隔。

1。介绍

在中国大多数城市面临严重的交通问题,如交通拥堵、污染和事故。一致认为,地铁系统是解决交通问题的有效对策之一。然而,客流增加显著的成就在大城市地铁网络系统。作为地铁线路的融合节点,转运站需要承担更多的乘客由于金额转移需求在不同的行。传输设施必须面对巨大的交通压力,因为乘客总是在很短的时间内到达。因此,行人拥挤或其他异常情况下更容易发生。所以,为了避免行人拥挤或警告管理在它发生之前,是非常必要的预测客流转移预测行人拥挤。

非参数回归被选为预测方法来预测客流是因为作者展示了非参数回归的优点超过其他方法,如卡尔曼滤波(1,2)和神经网络(3,4在先前的研究努力,基于充分的历史数据。

非参数回归适用于不确定和非线性动态系统。它是建立在混乱的系统理论。早期作品由史密斯(5]发现,最近邻预测方法的一个简单的实现提供合理准确的交通状况预测。1987年,Yakowitz [6]建议的使用 最近的邻居在时间序列预测方法。非参数回归的基本方法是深受其根源在模式识别7]。本质上,该方法定位系统的状态(由独立变量定义)附近的过去,类似的状态。一旦建立了这个社区,过去的情况下在附近被用来估计因变量的值。

非参数回归模型非常适用于确定性和非线性预测。它可用于这种情况没有先验知识和足够的历史数据。它可以尝试找到最近邻之间的历史数据和当前数据,和最近的邻居,它试图预测在下一个时间间隔。算法假定所有因素的内在联系中包含历史数据。因此,获得的信息可以直接从历史数据而不是建立近似模型。换句话说,非参数建模不光滑的历史数据。因此,预测效果比参数更精确建模,特别是在特殊事件。作为一个自由参数、可移植和高预测精度的算法,非参数回归的误差相对较小。更重要的是,这种模式非常适合计算机编程,可以应用到复杂的环境。

非参数回归的基本思想是形成一个典型的历史数据库,它是在综合分析的基础上,大量的历史数据。历史数据库包含各种各样的交通状态趋势以及典型规则。每种类型的样本库中的数据代表一个交通发展的趋势。最新的交通实时数据与历史数据进行匹配,找到最近的 组数据。预测未来交通状态是由最近邻的趋势 组数据。因此,整个算法没有固定的参数和系数。它可以预测下一时期交通状态完全基于sample数据库的进化趋势,实时数据的价值。历史数据系列是交通发展的典型模式,短期预测中发挥重要作用。图1显示了非参数回归理论的原则。

由于预测能力,各种非参数回归模型来预测交通状态逐渐。1991年,戴维斯和Nihan [8)使用非参数回归在交通预测。1997年,史密斯和Demetsky [9)使用过去的5个月的交通流预测的数据。状态向量的定义包括历史平均水平流动;结果比历史平均水平和神经网络方法。奥斯瓦尔德et al。10研究如何加速运行时的非参数回归,但精度退化。气和史密斯11)开发出一种距离度量,可以有效地用于分类数据,一般交通事件数据。度量是基于变量值的影响在一个可衡量的目标的目的,选择最近的邻居。当这种方法成立的非参数回归预测模型,它是证明显著优于参数预测模型。

唐和高12)增强预测交通流量的自动事件检测能力基于改进非参数回归算法和标准偏差算法。Turochy [13)耦合的非参数回归的状态监测方法的特点,当前交通状况偏离那些可能会基于历史数据。平均绝对百分比误差为四个最近邻的两个预测程序都减少了。Kindzerske和倪14]介绍了基于非参数回归的复合方法用来预测交通状况。复合方法进行最近邻搜索每个循环探测站只使用数据在接近探测器在道路上的立场。这种方法适应每一个单独探测站减少预测误差在整个巷道。和复合的方法可以预测交通冲击波的发生和传播。

刘等人。15)提出了一种递归实现非参数回归模型预测交通流量和队列拥挤的驱动进化的十字路口。模型可以用来替代传统的低层次的仿真软件实时交通控制系统搜索最优控制变量,然后利用发现的解决方案的输入仿真软件的上层控制系统能够达到系统性能。史和任16)提出了一种新的方法称为MW模型来提高非参数回归模型的准确性和计算速度当数据库太大,难以在短期交通流预测搜索。Zhang et al。17)提出了一个基于规则的 最近的邻居非参数回归模型预测大规模城市道路网络的交通流量。规则是使用粗糙集理论从历史数据中提取,协助寻找附近的邻居。

太阳和张18)也提出了选择性随机子空间预测(SRSP)非常类似于非参数回归模型。SRSP选择性输入空间构建基于皮尔逊相关系数,然后生成随机输入子空间预测。SRSP的方法用于选择相对变量可用于非参数回归模型。

从先前的文献回顾,可以发现各种各样的非参数回归模型被广泛用于预测机动车辆的交通条件。然而,很少有研究与行人交通相关工作。因此,为了验证非参数回归在行人交通状态预测的适用性, 最近的邻居非参数回归模型被用来预测地铁车站的客流转移。非参数回归的移植能力强,测量精度高的优点显示,相比之下,卡尔曼滤波模型和支持向量机回归模型。

2。过程的非参数回归预测

非参数回归预测的应用程序包含五个关键步骤:选择聚类方法的历史数据库,状态向量的定义,类似的机制的确定,最近邻的选择机制,预测函数的选择。

2.1。选择历史数据库的聚类方法

非参数回归和关键的第一步是历史数据准备,其质量直接决定了非参数回归的预测效果。更重要的是,非参数回归的预测效果密切相关聚类方法的选择和计算时间。因此,首先,为了搜索最近的邻居,足够的历史数据库是由聚类方法必须涵盖所有的系统状态。其次,聚类方法应该能够满足要求的实时动态数据分类和满足实时的要求,在线编程。但现在,传统的聚类方法的平均状态向量或一个历史价值作为聚类对象;很难反映数据变化趋势特征。因此,本文将重点讨论改进的聚类方法和模型的运算速度。

2.2。状态向量的定义

状态向量是由状态变量的最小数量,而相关的预测变量。因为也许有很多状态变量与预测变量有关,有必要适当选择状态向量的数量来达到最好的平衡精度和计算速度。

2.3。类似的机制

非参数回归是一个重要的概念,这意味着如何评估当前点的相似性和历史数据库。最常用的度量方法是欧几里得距离或加权欧氏距离。

2.4。选择最近邻的机制

非参数回归的一个核心概念,最近邻机制指的是在历史数据库以及如何成为当前点的近邻。有两种机制:最小值 最近邻居法和核最近邻法,分别。最低 最近的邻居的方法手段 点的相似历史数据库中是最大的。核最近邻法是指将当前点为核心;内的所有点的半径 成为当前点的最近邻。

2.5。预测函数选择

后找到最近邻点,需要使用一个函数来利用这些点来预测下一时期的值。常用的方法是平均加权平均,等等。

3所示。典型模型的改进

3.1。历史数据聚类的改进

非参数回归预测的基本过程是比较近期的数据状态和历史数据,找出最相似的数据序列将被用来预测未来数据状态。因此,为了提供最相似的数据串行、历史数据库应该包括足够的历史信息。,为了反映尽可能多的趋势数据系列,所有的历史数据都存储在数据库中没有任何处理。因此,连续在数据库历史数据的组织方法决定了预测模型的计算效率。历史数据库是转移客流预测的基础。非参数回归的核心概念是最近的数据与历史数据库。从所有的火柴,要么 距离最近的匹配或所有匹配低于给定的阈值。根据计算机科学的数据存储系统,提出了一种改进的历史数据组织方法。这种方法量化历史数据序列的趋势,并设置不同的值不同的趋势用于集群的历史数据系列。

如果数据序列的长度 ,那么历史数据系列 ,最近的数据系列 。因此,下一个数据系列的历史数据库和最近的状态 ,分别。

如果 的趋势描述串行数据序列,然后趋势描述串行的价值是什么

历史数据库的集群类型的数量

对于一个数据系列,聚类标签

2是一个数据序列的趋势与4的长度。基于(2),在历史数据库集群类型的数量

和聚类标签

3.2。串行数据的选择

实验分析的基础上,选择邻居数据作为状态向量。向量包含四个电流转移客流趋势数据和五个历史转移客流趋势数据。四个邻居数据选为串行数据。预测模型计算聚类标签基于四个邻居的趋势数据和搜索最类似的数据从数据库历史连续剧。然后,未来数据状态预测的未来趋势是最相似的数据系列。

3.3。类似的机制

使用欧氏距离计算最近的数据之间的相似水平系列连续剧和历史数据。方程是

除了欧几里得距离,最相似的历史数据的权重连续剧也用于预测模型。所示(7), 的重量是最相似的历史数据串行 。越大 影响越显著水平的预测结果数据串行 是: 在哪里 的数量是最相似的数据系列。

3.4。邻居的选择机制

邻居机制是用来选择最近的邻居。 代表数字的选择最近的邻居,从历史数据库,和数据库的性格有着密切的关系。基于之前的研究结果(13,14,19), 是5。

3.5。选择模型的改进

加权平均的方法基于匹配距离的倒数是选为预测函数。短的距离点更类似的观点。然后,重量更大。对于大多数的非参数回归预测模型,下一个最相似的历史序列的值是作为近期的数据序列的预测价值。未来价值和加权系数基于历史数据用于预测转移客流预测算法。状态向量的预测模型,当前时间的历史数据和最近的时间是用来识别不同的预测系数,和未来趋势的历史数据直接用于计算预测数据。

然而,由于原因,如缺乏历史数据或异常流量,下一个最近的数据串行的价值可能会发生戏剧性的变化,在图3作为一个例子。因此,为了提高预测精度,修正系数的平均值近期数据串行算法。改进的模型 在哪里 是最近的数据串行的平均值作为吗 邻居数据序列的平均值吗 作为

4所示。应用程序

为了测试预测模型的准确性,西单车站的客流转移是用来校准模型。历史数据库是建立转移客流从7月26日到8月25日,2011年。客流的预测数据是8月25日,2011年。预测结果见图49

4.1。高峰时间从7点至9点的预测结果

参见图4,5,6

4.2。预测结果的高峰时间从17点到19点

参见图7,8,9

不同时间和间隔的预测性能如表所示1。很明显,改进的非参数回归模型具有很高的预测精度。最大的平均相对误差小于15%。比较不同预测模型的适用性,卡尔曼滤波模型和支持向量机回归模型选择预测客流转移。数据10,11,12显示的比较三种不同模型的预测能力。与卡尔曼滤波模型和支持向量机回归模型,预测的准确性转移客流和稳定性的改进的非参数回归模型的误差已明显改善。因此,改进的非参数回归预测模型可用于实际应用。

5。结论

作为地铁线路的一个汇聚节点,转运站需要承担更多的乘客由于金额转移需求在不同的行。所以,这真的是非常必要的预测客流转移,以避免行人拥挤或警告管理之前发生。

基于非参数回归理论,提出了一种转移客流预测模型。和数据转移客流在西单换乘站一个月被用来校准和验证模型。结果表明,该模型可以准确预测客流转移不同的间隔。更重要的是,预测精度也比卡尔曼滤波模型和支持向量机回归模型。间隔越大,更准确的预测结果。最大的平均相对误差为12.20%,这意味着可以使用预测模型在真实的应用程序中。

利益冲突

作者宣称没有利益冲突有关的出版。