文摘

地铁站的用电量急剧增加与扩张的地铁网络,这是一个越来越引起人们的关注。根据相关历史数据从现有的地铁站,本文提出一种支持向量回归(SVR)模型来估计每日用电量新建地铁站。模型考虑一些主要影响因素方面的电力消耗的地铁站站的室内设计方案(如车站的布局和分配设施)和外部因素(例如,客流量、空气温度和相对湿度)。与5倍交叉验证遗传算法用于优化hyper-parameters SVR模型的为了提高其精度估计一个地铁站的用电量(ecm)。优化hyper-parameters,北京地铁案例研究的结果表明提出的SVR模型的估计精度可以达到95%,相关系数为0.89。这是表明,该模型比传统的方法可以使用bp神经网络和多元线性回归。本文给出的方法可以适当的工具估计ecm和应进一步协助交付的新节能地铁站。

1。介绍

地铁系统在城市轨道交通系统中起着重要的作用,有许多优点超过其他公共交通方式在城市地区,如有更可靠的服务,能够传输更大体积的乘客,更环保。在中国,地铁网络已经在近几十年来,随着人口爆炸在全国范围内迅速城市化。例如,在北京地铁网络的总长度已达到约591.7公里,连接自2017年以来共有361个车站;到2020年底,预计,网络将会扩展到900公里,预计将容纳552站。

虽然地铁是最节能的运输方式之一,地铁系统的用电量上升明显,运行里程不断增加。北京地铁的数据显示,整个电力消耗的所有行添加到2016年的17.1亿千瓦时,2010年的近3倍。很明显,它给了一个严重的引起人们的关注,电力消耗的总体水平的地铁系统将继续作为其网络不断扩大。此外,根据统计数据来源于北京地铁,地铁站的用电量(ecm)花了大约一半的整个地铁系统的总用电量。减少ecm因此减少整个电力消耗具有重要意义的地铁系统(1]。

ecm描述完整的电力消耗在一个地铁站,涉及所有的子系统,如暖通空调(供暖,通风和空调),照明,和其他设施(如平台屏幕门和自动扶梯)(2),确保车站的正常运行。ecm的大部分是由于暖通空调设备的使用。例如,大约三分之二的ecm在夏天从暖通空调对于大多数北京地铁站(3]。为了降低空调的用电量,自主控制系统开发了王et al。4),冷却供给适应热负荷的变化。平台的安装屏幕门可能有助于防止额外的热量由列车的运动,因此,在某种程度上,降低热负荷的水平在车站(5]。除了空调,照明子系统也占很大一部分的ecm (6]。卡萨尔斯et al。7)开发了一个自适应、节能照明子系统,可以调整根据客流量光照强度。此外,卡萨尔斯et al。8]提出一种智能能源管理系统,它集照明、通风和垂直交通子系统,以提供一个集成节能地铁站。

尽管上述设施和设备,一个车站的布局如何影响ecm没有明确考虑在现有的研究中。事实证明,跨站ecm可能显著不同,给出类似的客流量和相同的设施。换句话说,ecm在很大程度上取决于设计方案,特别是车站的空间结构。因此,重要的是要建立一个评估模型ecm考虑地铁站的设计,这是一个基本工具,适当的为节能设计的地铁站。

能源审计和识别关键影响因素对ecm发展评估模型对ecm的基础。傅和邓9]分析了能源消耗的实际数据在广州火车站和提出了一系列的方法来节省空调系统的能源消耗,电力设备系统和照明系统。洪教授和金(2]研究地铁站在韩国的能源消耗,并探讨了车站的能源消费及其影响因素之间的关系。这些研究指出了影响ecm和主要因素显示,ecm和大多数因素之间的关系是非线性的。然而,这些研究没有提供预测的目的ecm在车站设计阶段协助能源评估设计方案的一个地铁站。

近年来,一系列的线性模型提出了估算能源消耗,假设一个线性能源消费及其影响因素之间的关系。几个例子如下。杨et al。10]试图识别最重要的因素影响ecm通过相关分析和提出了一个回归模型估算电力消费。王等人。11)提出了一个线性计算模型预测给定的地铁网络的能源消耗趋势,基于每月能源消耗的指标。关等。12看不到]应用多元线性回归(MLR)模型分析的贡献不同面积等因素的车站和ecm的客流量。安et al。13)建立了一个线性回归模型来评估现有的地铁站性能和预测未来能源消费水平扩张。然而,事实上,这些模型不太可能实现的高精度预测ecm,因为他们可能无法捕捉潜在的非线性ecm及其影响因素之间的关系。

提高预测精度,非线性bp神经网络(摘要)模型被应用到预测基于历史数据的ecm在香港的地铁系统14]。一个隐藏层摘要通常可以以任意精度逼近任意非线性函数(15]。由于强大的非线性映射能力,摘要是非常受欢迎的预测建筑物的能源消耗和其他系统。Ekici和Aksoy16摘要]用于预测三种不同的加热能源需求的建筑。Yokoyama et al。17)建立了一个摘要利用模型预测建筑物的需求降温。然而,摘要利用模型预测的性能问题是由训练样本的质量和数量。过度学习的数据和陷入局部最小值,这可能在很大程度上降低了预测的准确性,也常见问题在摘要模型的实际应用18]。

另一个问题来自模型训练数据的大小。对ecm的预测,地铁网络,在开发的早期阶段可能无法提供足够大的样本数据。相当小的数据样本大小也会呈现摘要模型无效(19]。支持向量机(SVM),最小化结构风险包括训练误差和模型的复杂性,以达到良好的泛化,是一种新型的基于统计学习理论的机器学习分类方法(20.,21]。原则应用于回归模型的支持向量机也被称为支持向量回归(SVR)模拟和结果的变量之间的非线性关系。SVR已广泛应用于能源预测22- - - - - -25),因为它的非线性逼近能力和处理多个输入和小样本。因此,SVR被认为是一种很有前途的工具来预测ecm在车站设计阶段根据有限的历史数据。

在这项研究中,一个SVR-based日常ecm模型预测,同时考虑内部(如布局站)和外部因素对操作站。考虑到模型的hyper-parameters可能在其预测精度有显著影响(26)、遗传算法(GA) - - - - - -为了优化hyper-parameters折交叉验证应用SVR模型。收集的数据从北京地铁用于演示模型的性能。比较了该方法与其他方法,包括摘要和高模型,也是。本研究旨在为从业者提供一个适当的工具来评估不同的车站设计方案的性能的电力消耗。

本文的其余部分组织如下。部分2ecm和影响因素进行分析,确定SVR模型的输入变量。部分3阐述了SVR模型的基本原理和方法,优化相关hyper-parameters GA。利用该模型,部分4描述了一个案例研究的例子,估计每天ecm在北京地铁和评估模型的性能。最后,部分5总结了研究和总结。

2。胞外基质的影响因素

在本节中,一些主要影响因素ecm的详细描述。这些因素作为输入变量在提出的模型中,通常可以分为两类:1)因素有关室内设计方案和2)其他外部因素需要考虑。

2.1。地铁站的室内设计方案
2.1.1。面积不同的区域

以前的研究(例如,11,12)表明,一个地铁站的规模可能对ecm产生重大影响。一般来说,一个地铁站大致可以分为四个区域:广场、平台、机房和员工住宿的房间。在这些不同的区域、暖通空调、照明及其他设备安装提供一个安全、方便、舒适的环境为乘客和工作人员。什么模型和多少的空调和照明设备必须安装在很大程度上依赖于车站的布局和这些区域的面积。即冷却和照明负荷的地铁站都相关结构系统作为一个整体。在这方面,四个不同区域的实际面积会影响ecm和应被视为输入变量在模型规范。

2.1.2。辅助设施

在地铁站,自动扶梯和电梯装备来提高服务的质量或安全操作期间。电力消耗这些垂直运输设施与他们的数量和高度,这也将包含在模型规范作为输入变量。

正如上面提到的,平台屏幕门安装在平台上也可能与ecm,他们可以有效地减少额外的热量影响地下隧道时全封闭的平台优势。这个因素将不考虑这个,因为大多数北京地铁线路配有屏幕门。

2.2。外部因素

天气是一个关键因素影响集中空调的冷负荷和通风子系统的地铁站。空气从外面站可能会带来一定量的热量和水分,从而增加空调的冷负荷子系统。在这方面,室外空气的相对湿度和温度应考虑作为预测模型的输入变量。

除了天气,客流数量是另一个导致ecm的主要外部因素。内部热量的地铁站建立越来越多的乘客进入车站。因此,总数的乘客进出地铁站也应该作为指定模型的输入变量。

正如上面所讨论的,ecm预测模型的输入变量中列出表1

3所示。SVR模型的发展

本节描述的发展ecm SVR-based模型估计,三个hyper-parameters(用 , )由遗传算法优化。

3.1。SVR的介绍

表示一个向量组成的所有标准化的输入变量,和 ,表示ecm的归一化值 - - - - - -样本数据集。假设数据集的样本大小 数据集可以被定义为 SVR,这可能是用于描述输入和输出变量之间的非线性关系,可以表示在以下表格27]:

在Equaion (1), 表示高维特征空间,这是原始输入空间的非线性映射 , 是未知参数。根据(28),估计未知参数可以通过最小化结构风险函数如下:

在哪里 分别描述了结构风险和经验风险; 描述了一个正则化项控制水平和信心 损失函数。此外,正规化常数 是一个惩罚参数,决定了经验风险之间的平衡和正则化项。右边的第一项方程(2)是衡量 - - - - - -不敏感损失函数在 - - - - - -SVR [29日),它是由方程(3)如下:

损失函数定义了一个“管”(见图1),管的尺寸用 如图1,损失函数的值是零,如果预测的值是在管;否则,该值等于预测误差的区别和管的半径。正规化常数 和管大小 都是user-prescribed参数依赖于实证分析。

通过引入积极的松弛变量 ,Equaion (2)可以转化为原目标函数,在方程(制定4)。如图1, 错误的上下两侧,分别,这是训练误差最小化,以最小化模型。

在方程(优化问题制定4)可以解决在其双重配方,约束是通过引入拉格朗日乘数法处理。双功能如下:

这两个 拉格朗日乘数法。在方程(对偶问题制定5)是鞍点条件,这可以减少方程(6)。

最后,通过引入核函数, (27),并使用方程(6),优化问题可以转化为方程(1)(7)如下。

使用内核函数,特征空间的维度可以解决没有计算map函数 (28]。然而,核函数可以影响SVR模型的预测精度。在这项研究中,在选择和使用高斯核函数,定义为方程(8)如下:

在哪里 描述了高斯核函数的宽度。一个高斯核函数有几个优点30.),该模型相对简单的由于有一个hyper-parameter少,数值困难,相比其他可能在某些情况下是无效的。

选择适当的hyper-parameters, , , ,ecm可以建模为一个函数的影响因素通过解决拉格朗日乘数法, ,上面的二次规划问题制定。

3.2。参数优化算法

根据(26),hyper-parameters , SVR的性能有显著的影响。的hyper-parameter 确定SVR模型的训练误差和复杂性。一个相当小的价值 能增加一个小惩罚训练误差,从而导致模型under-fitting训练数据。反之,如果 太大,模型的泛化能力会降低。的hyper-parameterε确定的宽度 - - - - - -不敏感区域。的价值 增加,支持向量的数量将减少,在这种情况下,合成解决方案是稀疏表示;然而,如果 变得太大,它还将减少训练数据的近似精度。的hyper-parameter 指定了高维特征空间的结构。一般来说,模型的预测误差不会单调减少与增加的价值 但是增加时 变得太大。

尽管许多研究展望hyper-parameters的优化,还有缺乏指标的设置这些hyper-parameters SVR模型会是最合适的。的价值 , 可能是手动确定在实证的基础上(例如,20.,31日),或者通过网格搜索优化(例如,22])。在这方面,本研究采用遗传算法,它也被广泛应用于优化问题(32),试图找到一组最佳hyper-parameters给定模型的性能。hyper-parameters优化算法的流程图如图(卖家)2。提出了肥厚性骨关节病变与肺部转移的主要步骤如下。

步骤1。GA参数进行初始化,包括人口规模、交叉概率、变异概率和最大代(见表2)。

步骤2。生成一个随机的人口。也就是说,初始种群的个体是随机生成的。然后,三hyper-parameters编码的值, , ,在一个染色体, , , 染色体的相当于一个组合hyper-parameters每个编码为二进制值(如图3)。

步骤3。重复步骤(4)的进化过程步骤(6)直到到达最大的一代。当达到最大代时,算法终止和输出当前最优解。

步骤4。计算每个个体的健身价值。首先,每个hyper-parameter的价值是通过解码的染色体。然后用三hyper-parameters SVR模型建立和示例数据应用于模型训练得到归一化均方根误差(RMSE) 最后,每个单独的健身价值可以通过方程计算(9),其中的价值 是由LibSVM工具箱(33]。

这些hyper-parameters通常调谐通过最小化验证错误(34]。摘要 - - - - - -折交叉验证方法(35]采用评价模型的泛化性能与不同hyper-parameters步骤(4)中,归一化均方根误差 用作测量验证错误。

实现一个 - - - - - -训练数据集划分为若干个折交叉验证 模型的子集的大小近似等于一步训练。也就是说, 整个训练数据集用于模型的子集训练叫做训练子集,而其余子集进行验证。验证子集上的规范化RMSE表明hyper-parameters的性能。重复这个过程 次,每个子集将被用于验证一次。所有数据的规范化RMSE在训练数据集获得估计验证错误。5倍交叉验证采用在这项研究中,提出了文献[29日,36]。

步骤5。所有的人都需要评估来确定他们的表现。完整的解决方案和最好的健身价值代表了最好的个体,和这个解决方案将被保存作为后代的个体。

步骤6。在这一步中,GA运营商包括选择算子、交叉算子和变异算子实现生成下一代的后代个体。首先,选择父个体采用轮盘赌的标准。然后通过交叉过程和变异繁殖新个体的过程。图4(一个)显示交叉和图的过程4(b)显示了突变的过程。

最后SVR模型获得的LibSVM工具箱(33)三个hyper-parameters的优化值。SVR模型和肥厚性骨关节病变与肺部转移之间的关系可以被描述在图5

4所示。案例研究

本节演示了一个案例研究的例子估计每日ecm在北京地铁使用上面的方法。部分4所示。1描述案例研究数据收集和预处理,其次是模拟结果提出了部分4所示。2。节4所示。3拟议的SVR模型,比较两种不同的替代模型,包括摘要和儿童高,制作的模型性能;部分4所示。4提出了一种比较使用维持验证和5倍交叉验证的预测精度。此外,部分4所示。5分析不同的输入变量在模型中考虑如何影响ecm估计的性能。最后,一个真实的案例进行说明的可靠性评估方法。所有这些研究都是由MATLAB 2016 a。

4.1。数据描述

考虑上述所有指定的输入变量,历史数据集12地铁站我第十二∼电台(站)的相同的北京地铁是可用的。训练数据集是由历史数据的站我∼站XI,覆盖从8月1日2016年8月30日,2016年。表3列表11站的历史数据(站我∼站XI)在一天。此外,整个测试数据集包含10个样本,从车站聚集十二世。评估SVR模型的性能,测试数据集的日常ecm将预测。

数据预处理通过min-max正常化如下:

在哪里 为变量代表一个真正的价值 - - - - - -th样本, 的最小值和最大值在所有的数据样本。 表示规范化输入和输出变量值, 意味着样本下的输出变量的值 , 是相应的最小和最大输出变量的样本值。

4.2。提出了SVR模型的性能

在本节中,数值的情况下实现验证了SVR模型的有效性。绝对误差百分率(猿),标准偏差(SD),相关系数(CC),相对均方根误差(推定)作为评价指标。表4列出了上面的四个评价指标的公式。

如前所述,hyper-parameters , , 最终的模型性能的影响。在这方面,提出了一种方法来削弱造成的负面影响遗传算法的随机性,将详细描述。使用相同的数据集,hyper-parameters的优化过程是重复20次获得20组不同的值对三个hyper-parameters。ecm预测的过程中,选择hyper-parameters反过来根据参数ID。选择hyper-parameters, SVR预测模型是基于所有训练数据集的训练。ecm的估计结果的第十二地铁站可以获得的测试数据集的输入数据。基于20套hyper-parameters, ecm预测过程也被重复20次。应该注意的是,模型训练进行了在同一训练数据集使用不同的hyper-parameters集。最后,有20个为每个预测样本预测结果。为每个测试样本和预测价值相当于20集的预测结果的平均值。

6显示了20套10测试样本的预测结果第十二地铁站。指标SD,猿,推定和CC评估SVR的性能计算模型。表5介绍了预测电力消耗10样品,连同他们的评价指标。和图7显示了回归曲线的预测值。

从图6,它可以注意到预测结果对应于不同hyper-parameters是不同的。因此,有必要建立一个hyper-parameters SVR模型的优化方案。在这项研究中,采用遗传算法来优化这些hyper-parameters随机性以来不会引起大偏差预测结果。

如表所示5,模型的预测值接近实际的。最小和最大猿预测值的0.17%和2.28%,分别。预测结果的最小和最大SD 0.112×-106千瓦时和0.204×-106分别千瓦时。此外,推定和CC是1.39%和0.89。这些评价指标显示,SVR模型对ecm执行预测精度高。

4.3。比较与选择模型

除了上述提议SVR模型,摘要(14)和高钙模型(37)也被用来预测ecm。本节比较了他们的性能的准确性和适用性。

摘要利用模型由三层组成:一个输入层、隐藏层和输出层。让 表示隐层神经元的数量,这可以对摘要模型的性能产生重大影响。作为一个经验法则(cf。14),它可以推导出方程(12)如下:

在那里, 分别表示输入和输出变量的数量;和 训练集的样本大小。

此外,类似高模型获得的结果直接由20使用IBM SPSS统计软件。注意训练的样本数据的摘要和高钙模型与一个用于SVR模型相同。不同模型的预测结果如图8和各自的模型精度比较表6

在图8SVR模型和摘要模型的曲线更类似于曲线实际价值比高的曲线模型。这是证明了摘要模型和SVR模型能更好地适应样本数据在处理非线性问题。表中给出的结果6表明,SVR模型的预测精度高于摘要和高钙模型。与高钙模型相比,发现SVR模型的预报值更接近实际值,由于SVR模型非线性逼近能力。摘要利用模型相比,SVR模型达到更好的泛化,因为SVR采用结构风险最小化原则虽然摘要模型只考虑经验风险。经验风险最小化的原则是不合理的,当训练数据集的数量是有限的(只有330),因为它只包括训练误差。相反,SVR模型拥有强大的能力来处理小样本的非线性问题。因此,SVR模型更适合ecm预测问题。

4.4。验证方案的比较

在本节中,合作过程中的验证方法也实现hyper-parameters优化验证验证方案的优越性应用本文。,5倍交叉验证。图9和表8预测结果显示在上面的两个方法的实现。不同于一般的抵抗验证方法,训练数据集分为两部分的比例随机根据4:1。和一个用作训练样本集大,同时应该测试与训练模型。抵抗验证的验证方法执行了两次,因为分工的训练样本集和验证样本集是随机的。表7显示了两种方法的结果。和样本集和样本集B表7代表不同的训练样本的ID和验证在两个实验样本。

如图9和表7,5倍交叉验证比坚持。一个可能的原因是,5倍交叉验证使每个样本进行测试,可以获得更多的有效信息;然而,抵抗的预测准确性验证不同显著不同验证样本。这意味着验证样本的选择是很重要的SVR模型的评价结果。然而,训练样本的选择也有伟大的对评价结果的影响。总之,验证方案在评估模型的性能方面扮演重要角色,这可能影响hyper-parameters的优化结果 ,

4.5。影响因素的影响

ecm的9个影响因素预测模型分析了在这一节中。首先,每个输入变量依次删除。然后hyper-parameters优化算法实现基于训练数据的剩余8个输入变量,和优化过程将重复20次。20套hyper-parameters, SVR模型是基于训练数据训练由8个输入变量。最后,预测结果可以通过给预测样本的输入数据。表8列表后ecm的性能预测模型输入变量。

如表所示8,消除不同的输入变量会导致不同程度的ecm预测模型的准确性下降。的平均温度和相对湿度是最重要的影响因素,具有独特的影响比其他因素模型的准确性。广场的面积,面积平台和员工住宿房间的面积对预测精度有很大的影响,。这意味着大规模的地铁站地铁系统的节能设计是很重要的,它可以调整在规划和设计阶段。因此,车站规模应该尽可能减少站电力消耗降低如果住宿的约束能力感到满意。

4.6。预测结果在一个新的地铁站

在本节中,新的地铁站除了上述现有车站采用验证的性能提出了SVR模型估算ecm在设计阶段。这个车站的实际参数和能源消耗超过十天收集和给定的表9

提出了SVR模型的预测结果如图所示10。发现预测的值非常接近实际的相关系数达到0.88。相对应的最大猿,7日样本,不超过2.75%。换句话说,SVR模型能够预测新地铁站的ecm具有令人满意的精度。

5。结论

本文提出了一种新的估计方法给出的ecm小样本大小的数据。ecm的主要影响因素进行了讨论,包括平均空气温度,相对湿度,一些关键部件(即。,station concourse, platform, staff accommodation room and plant room) of a station, number of passengers, and both number and heights of escalators/elevators. All the above nine variables are proposed as the input variables of a SVR model, and the hyper-parameters of the SVR model is optimized by GA. The case studies based on actual data validated the effectiveness of the proposed SVR and demonstrated the SVR model could achieve higher prediction accuracy than a BPNN model and a MLR model. The proposed SVR model provides a promising alternative approach to predicting the ECMS of new metro stations.

牵引能耗的预测新的地铁线路是我们的下一步研究,所消耗的能量的列车牵引也占很大比重的整体能源消耗在一个地铁系统。

数据可用性

使用的数据来支持本研究的结果都包含在这篇文章中,通过表。进一步的细节可能提供给读者,从作者,要求。

的利益冲突

作者宣称没有利益冲突。

确认

这项研究是由中国国家自然科学基金(71571016和71571016)。