文摘
电力负荷预测是重要的在一个可持续的电力系统,这是能源系统的经济运行的关键。电力负荷的准确预测可以为电力系统规划提供可靠的决策。然而,挑战与单一模型预测电力负荷,尤其是对多步预测,由于时间序列数据加载有多个时期。提出了一种深混合模型系列两级分解结构。首先,电力负荷数据分解为组件;然后,封闭的复发性单元(格勒乌)网络,与贝叶斯优化参数,用作subpredictor为每个组件。最后,预测不同的组件是融合来实现最终的预测。电力负荷数据的美国电力公司(AEP)被用来验证该预测。结果表明,该预测方法能有效地提高电力负荷预测的准确性。
1。介绍
随着社会的快速发展,电力应用于生产和生活的各个方面。为了确保平均生产和生活的需要,电力企业总是产生比需要更多的能量。然而,由于权力的非存储,多余的能量会造成浪费资源,和过度的操作也有一个影响电力设备的安全1- - - - - -3]。因此,电力负荷预测是电力企业相当大的意义。负荷预测的好处包括有效的计划年度供电,减少电力浪费和成本、经营和发展计划。准确的预测可以操作提供可靠的决策依据,确保电力系统的可持续发展。
然而,在现实中,许多因素导致电力负荷预测的结果是一个挑战。电力负荷是一个非常复杂的非线性时间序列,使其很难准确预测电力负荷。例如,天气会影响电源的成本(4];其他因素,如该地区的发展水平的差异和不可预知的自然灾害5),也会导致各种电力负荷的变化。
电力负荷数据通常包含以下四部分:(1)趋势组件:它反映了电力负荷数据的主要趋势,主要包含上行和下行趋势。组件的趋势是基本的电力负荷水平很长时间了。如果电力负荷增加,组件是一个上升趋势,如果电力负荷减少,组件将会有一个下降的趋势。(2)日常时期组件:电力负荷数据一天有不同时期的特点,也就是说,高功率负载在一天晚上和低功率负载。(3)年时期组件:电力负荷数据在一年,另一个时期组件和电力负荷将会改变在不同的几个月。(4)剩余组件:这部分是后仍然删除原始数据的趋势和周期性的组件,其中包含复杂的非线性数据和噪声。
图1(一)电力负荷数据显示美国电力公司(AEP)从1月1日,2017年,2020年1月1日。水平坐标图中表明,采样间隔一个小时。图1 (b)显示了原始数据组件分离的趋势。图1 c组件(c₁)显示了整个日常时期,而图1 c(c₂)显示的部分摘录日常时期组件作为一个显示2018年7月,我们可以看到,每日时期组件都有一个不同的时期。图1 (d)显示了年度周期分量。太多电力在冬天和夏天,虽然春天和秋天的电力负荷很低。
(一)
(b)
(c)
(d)
近年来,一个精确的时间序列的预测已经成为研究人员关注的焦点。时间序列通常具有非线性、非平稳的和复杂的周期特性(6,7]。现有的方法预测时间序列的统计预测,包括机器学习、组合预测(8- - - - - -10]。统计预测方法通常是基于数学模型(11,12]。预测模型的建立通常包括回归分析方法(13),灰色模型方法(14,15),支持向量机(SVM) [16,17),自回归综合移动平均(ARIMA) [18)和人工神经网络(ANN) [19]。这些方法往往很难获得准确的预测在处理复杂的非线性数据。
与前面描述的方法不同,深度学习不需要preknown信息和具有较强的学习能力和预测能力。例如,唐et al。20.)提出了一个基于LSTM多层双向递归神经网络和格勒乌;高et al。21格勒乌建立模型)用于短期负荷预测。郭et al。22)提出了一个集成的深入学习方法,集成了多个LSTM网络使用LSTM开发大跨度周期的非线性模式和类似的方法。Kollia和Kollias23提议使用深convolution-recursive神经网络过程中的数据时间序列或二维信息来提高预测精度。阴et al。24)提出了一个三态能量模型,它包括三种状态:发电机,电力负荷和封闭的状态。并提出了一种可伸缩的深度学习的实时发电经济调度和控制基于三态能源未来的智能电网。Zhang et al。25)提出了一个预测模型根据玻耳兹曼机和Elman限制。他等。26)提出了一个深刻的信念网络(DBN)嵌入参数的相关模型。虽然这些深入学习方法的精度提高了与传统方法相比,仍然很难学习足够的特征表示的非平稳的数据。
基于上述研究,最新的研究与深度学习分解相结合的方法,获得较好的预测结果。这些方法将原始数据分解成组件,使用不同的预测方法来预测分解组件,并融合预测结果达到更好的预测结果。例如,季节性潮流分解过程基于黄土(STL)可以获得趋势,季节性和剩余组件的复杂数据27),已被用来作为混合预测作者的前研究天气预报(8,28]。另一个分解方法命名为小波分解,王et al。29日),原始时间序列分解为不同subsignals构造预测。李等人。30.)提出用一个极端的学习机器(ELM)结合变分模态分解(VMD)。郭et al。31日]提出了分解原始序列通过经验模态分解(EMD)和选择不同的模型(包括AR、马和ARMA)基于不同特征的子组件。作者利用EMD分解PM 2.5时间序列数据来获得更准确的预测(32,33]。VMD和EMD相比,STL分解可以保证给一个已知数量的组件(包括3组件,如趋势、季节性和剩余组件),尤其适合与周期性序列数据。
统计和机器学习方法比较,结果表明,预测精度可以提高分解成多个组件单独和建模与预测。此外,还发现hyperparameters产生重大影响的预测性能。因此,优化hyperparameters已经被使用的方法。例如,[34- - - - - -36)原始数据基于小波分解算法和预测组件由一个粒子群优化(PSO)神经网络。另一个优化方法命名为果蝇优化算法(失落)用于选择参数的广义回归神经网络(GRNN) [37]。相比之下,他et al。38)使用了贝叶斯优化算法基于Parzen估计量优化的hyperparameters分位数回归森林(QRF)预测。失落和PSO优化算法集团不适合模型hyperparameter调优,因为他们需要有足够的初始样本点,和最优效率不高。然而,对于深入学习模型的训练过程,我们需要尽量少desample提高优化效率。因此,贝叶斯优化算法被广泛用于深度学习模型,因为它可以获得最佳的全球价值最少采样点。
本文使用一个串行两级分解结构改善预测性能由于多个时期的电力负荷数据的复杂性。此外,贝叶斯优化算法应用于模型的优化hyperparameters。本文的创新贡献如下所示:(1)贝叶斯顺序基于模型的优化(SMBO)算法用于优化模型参数,提高模型的预测性能。(2)根据电力负荷的double-period特征数据,原始数据分解系列两级分解结构。四天鹤座用于组件的趋势,日常时间组件,年度周期分量,和剩余组件。
其余的安排如下。部分2介绍了该系列两级分解和模型用于实现详细预测。节3,我们给SMBO优化算法的实验结果并与其他实验进行比较。最后,部分4总结了结论。
2。系列两级分解优化模型
模型由分解、预测和融合的过程。预测模型的框架如图2,使用两级分解结构,和数据分解成四个组件。在训练阶段,天鹤座用于训练这四个组件。在预测阶段,天鹤座用来预测四个组件。最后,每个子模型的结果是融合得到最终的预测结果。
2.1。系列两级分解
原电力负荷时间序列数据的分解和两个水平。图3显示了图的分解节点的详细信息2。第一级分解后,三个组件的趋势,期间,和残余。然而,剩余的数据仍然包含趋势和周期性的信息。因此,获得的残余第一分解再分解。同样,三组数据,新趋势,新时期和新产生的残差第二分解,可以获得。
原一级分解后的电力负荷数据,趋势 ,期 ,和残余得到了。第二个分解残留进行了获取趋势 ,期 ,和残余 。最后,组件具有相同特征相结合获得最后三分解结果:趋势 ,期 ,和残余 。
2.1.1。第一优先级分解
电力负荷数据是一个离散时间序列的长度吗N,这意味着 ,所以三组数据,趋势,期间,和残留,可以表示成离散的: 在哪里 , ,和周期分量,剩余组件,组件和趋势。详细的分解步骤可以表示如下:(1)第一优先级分解,电力负荷的一天有一个潜在的时期,所以分解周期设置为1天。这里使用的每小时的数据,时间设置为24。 是用来计算时间的数量;的意思围捕的公式输入数据 。(2)利用回归方法,平均趋势组件 ,可以表达时间序列的总体趋势,从原始数据中提取吗 。(3)以下两个步骤之后获得原始数据的周期分量 :(一)计算周期分量的初始值 。(b)因为描述围捕 , 和可能不是相同的。因此,不是所有的数据做出选择,选择数据来 从数据 ,重叠的数据点的同时,除以得到一个周期曲线,这是重复的倍周期分量用同样的N点可以获得。(4)原始数据-周期和趋势数据给残余 ,如 。
2.1.2。第二优先级分解
考虑到第一优先级分解不完全分解原始数据和剩余的数据还含有丰富的周期性信息和趋势信息,第二个层次分解残留获得第一个优先级别分解进行了类似的方法。此外,我们还可以得到第二组数据代表年度趋势,一年一度的时期,和剩余: 在哪里 , ,和每年这段时间组件,剩余组件,分别和趋势组件。详细的分解步骤可以表示如下:(1)第二个时期分解设置为1年,8760小时。然后计算时间的数量 ,在哪里被描述为舍入 。(2)利用回归方法,平均趋势组件 ,可以表达时间序列的总体趋势,提取的残留数据 。(3)遵循以下三个步骤来获得剩余数据的周期分量 :(一)使用 计算初始化组件的输入数据。(b)选择数据来 从数据 ,重叠的数据点的同时,除以得到一个周期曲线,这是重复的倍周期分量用同样的N点可以获得。(c)的窗口大小24小时,平均值是用来代替原始数据获得一个新的周期分量的长度N。(4)每日剩余数据-周期和趋势数据给残余 ,如 。
2.2。Subpredictor
两级分解后,剩余的五个组成部分 ,趋势 ,趋势 ,期 ,和时间被获得。趋势和趋势代表数据的线性趋势,然后和结合数据的趋势。因此,四组subdata终于获得。四个格勒乌为每个subdata网络是训练有素的预测因子。
格勒乌网络LSTM模型的发展。它简化了模型的结构,降低了网络参数需要训练,和继承LSTM解决long-dependency问题的能力。因此,格勒乌是一个很好的预测模型结构。格勒乌模型包括两个部分,更新门和重置门口,和每个格勒乌细胞结构,如图4。
更新门的功能是调整前一时刻的信息传输到当前时刻。值越小,越少的信息从最后一刻到现在。重置门的目的是调整程度的忽视了来自前一时刻的信息。重置门值越大,越不被忽略,这样新输入的信息可以融合更多的存储信息。
向前传播的公式输入数据在每个格勒乌如下所示: 在哪里是输入; 代表候选人的状态更新,重启门,隐藏节点 - - - - - -时间点,和隐藏节点的输出状态 - - - - - -th时间点;表示模型中的权重;代表了偏见;表示元素的乘法;和激活函数应用于细胞,激活函数的数学表达式如下:
根据上述格勒乌细胞的结构和输入和输出数据之间的关系,格勒乌网络构建和图所示5。网络包括多个格勒乌单元,网络层的数量是2。如图5, 格勒乌网络的输入, 是输出,米在每一层格勒乌细胞的数量。
2.3。基于模型的序列优化(SMBO)
深度学习模型训练之前,我们需要初始化hyperparameters模型,从而提高模型的预测性能。的两个预测模型分解为趋势分量和日常周期分量,传统的参数选择方法可以达到预测网络的初始化参数。然而,年度期间组件和残留数据是复杂的,所以在这里,我们使用一个贝叶斯优化,名叫SMBO算法(39]。
SMBO需要一个目标函数,然后更新参数的后验分布空间目标函数。在这里,目标函数被选中的均方根误差(RMSE),也就是说, 在哪里是输入的数量hyperparameter组k,由模型预测结果使用hyperparameter组合 ,和是真正的价值。然后,SMBO算法,我们有 在哪里是最佳的参数组合由SMBO算法,是一组输入hyperparameters和参数空间的多维hyperparameters。
参数空间的更新包括两个步骤:高斯过程(GP)和hyperparameter选择。高斯过程,算法实现了建模和拟合优化的目标函数,得到后验分布对应的输入 ;hyperparameter选择的过程中,“发展”和“探索”是用来实现的过程,寻找以最低的成本获取最优参数。“探索”是指寻找合适的参数在未取样的hyperparameter空间,它常常会导致全局最优参数组合。“发展”将搜索的最后一集hyperparameter空间根据后验概率分布。当目标函数集遵循正态分布, 在哪里的平均值吗 和 , 的协方差矩阵是吗 , 表示为一个高斯过程,是目标函数,的分布服从 ,和初始化可以表示为
在SMBO参数搜索算法,协方差矩阵的高斯过程的迭代次数将会改变。如果hyperparameter组中输入步骤 是 ,协方差矩阵可以表示为 在哪里 ;然后,目标函数的后验概率可以先后获得: 在哪里是观测数据,的平均值吗在 一步,的方差在 一步, 获得目标函数的概率是的一步我+ 1的数据和参数组 , 是正态分布,的分布服从 。下一步是找到最好的参数通过hyperparameter选择后的后验概率。上信心绑定(UCB)收购函数用于本文“发展”: 在哪里是一个常数,是联合采集功能,hyperparameter集团选择在步骤吗 。
SMBO算法算法所示1。
|
3所示。实验结果和讨论
在这项研究中,电力负荷数据来自美国电力公司(AEP),其中包括26280年的数据从1月1日,2017年,2020年1月1日。在实验中,第一个70%的数据被选为训练集数据和剩下的30%作为测试集数据。数据首先被分解,然后归一化分别为每个子组件。在培训过程中,趋势和时间直接放入不同的subpredictors训练,而期吗和残余第一次受到hyperparameter寻求SMBO算法,然后放入不同的subpredictors培训。在测试过程中,不同的组件直接进入训练subpredictors得到最终的预测结果,结果来自不同subpredictors融合得到最终的预测结果。然后,电力负荷预测是用来计划供应精密操作的权力和发展计划。整个系统流程图如图6。
3.1。实验装置
预测使用Keras来构建一个学习模型。电脑服务器上的所有模型都是训练和测试与英特尔核心cpu i7 - 2.21 GHz处理器32 G RAM。在深入学习,许多hyperparameters需要设置(例如,网络层的数量,重量初始化,和学习速率)。格勒乌网络结构设置为两层。
复杂的组件,如年度周期分量和残余分量,本文使用SMBO算法找到最佳hyperparameters网络。其余的参数使用Keras缺省初始化参数获得的模型参数优化的优化功能。
组件(如每日段组件和趋势组件,使用纳丹格勒乌模型优化算法,Keras所有参数使用默认值。网络中的激活函数使用棕褐色h和ReLU。学习和预测步骤设置为24;也就是说,模型使用前一天的电力负荷预测第二天的电力负荷。预测提前一天可以帮助有关部门大致了解第二天的电力负荷和制定适当的计划基于负载。
在这项研究中,五个指标用于评估模型的性能,包括均方根误差(RMSE),归一化均方误差(NRMSE),平均绝对误差(MAE)、对称平均绝对百分误差(SMAPE)和皮尔逊相关系数(R)。前四五个指标越小,模型更准确的预测。第五指示器(价值越大R),更好的观测值之间的拟合效果和预测价值。这五个指标的计算公式如下: 在哪里样品的数量,电力负荷的真实价值,真实的平均价值,是预测值,的平均预测。
3.2。Hyperparameter选择基于贝叶斯优化
表1显示了superparameter SMBO算法的空间。所选hyperparameters包括第一层神经元的数目、批量大小,优化器。所有superparameter组测试模型与一个时代的100年,和优化组hyperparameters终于获得后续网络培训。
表2显示的预测性能的比较贝叶斯参数优化和no-optimization年度周期分量的方法和剩余组件 。根据表2,它可以观察到贝叶斯优化可以显著提高模型的有效性。例如,一年一度的时期的RMSE组件从471.25到349.0855下降了25.9%。同样,剩余组件从606.5918到572.7338下降了5.5%。
预测电力负荷之间的对比为12月12日到23日,2019年,真正的电力负荷如图7。我们可以看到周末电力负荷较低,而工作日电力负荷较高。一天,上午和下午较高,中午较低。因此,它是合理的,该方法分解原始的电力负荷数据的两倍,考虑到周期性每天。
3.3。比较不同模型的预测结果
在设置的实验中,我们比较了该方法的性能与七个模型,即。递归神经网络(RNN) (40),长期短期记忆(LSTM) [41],格勒乌[42),STL-RNN(基于STL RNN) STL-LSTM(基于STL RNN) [43),STL-GRU(格勒乌基于STL) [8],wavelet-LSTM (W-LSTM) [44]。每小时的电力负荷数据使用来自2月6日,2019年,2019年12月31日。每个模型的部分预测结果如图所示8。从图可以看出,该模型具有最好的性能。
数据9和10分别显示五个指标的比较结果。从表3,我们可以看到,RNN的RMSE LSTM,格勒乌是905.4590,835.8678,和805.0688,分别和梅斯是677.6044,630.6519,和599.9143,分别。通过STL分解、STL-RNN的RMSE STL-LSTM,和STL-GRU RMSE是851.9837,771.5973,和747.3044,分别下降5.9%,7.6%,7.2%。此外,梅斯664.7142、579.3349、554.4263分别下降1.9%,8.1%,和7.6%,分别。因此,可以看出,分解方法是有效改善预测性能。
相反,结果表明,格勒乌网络最佳的预测性能。例如,相比之下,RNN的RMSE LSTM,格勒乌的RMSE降低11.1%和3.7%,分别。的分解方法,相比之下,STL-RNN STL-LSTM, STL-GRU的RMSE下降了12.3%和3.1%,分别。它的正确性验证选择格勒乌subpredictor本文。
此外,我们发现系列两级分解是理性的,并且该模型效果最好,获得最小的RMSE 676.6433, 486.0197美,和SMAPE 0.0328,最高的R0.9575,最不NRMSE 0.0572。相信原始数据含有非线性信息;两个串行分解后,复杂的周期性信息和趋势信息分别预测,可以更好地适应数据,结合可以获得预测结果在更好的性能。本文提出的深度学习预测模型可以结合一些参数估计算法(45- - - - - -51)如迭代算法(52- - - - - -57)和递归算法(58- - - - - -64年]研究新的建模和预测方法对于不同的工程应用问题65年- - - - - -69年)如系统建模、信息处理和交通通信系统。
4所示。结论
更精确的电力负荷预测的结果可使发电公司和动力操作公司更好地控制操作状态,促进市场的监管,节约成本,防止污染。本研究使用一个串行两级分解结构分解电力负荷时间序列根据不同时期,这减少了复杂非线性关系的原始数据的电力负荷。总体趋势成分表明,电力负荷数据变化缓慢,可以理解为电力负荷维持在一定水平了很长一段时间。每日时期组件显示日变化,高天,晚上稍低;此外,一年,冬天较低和较高的在夏天,所有这些对应的实际使用电力。
原始的电力负荷序列分解后,格勒乌用于构建模型预测组件。subpredictors然后融合的预测来获得更准确的预测。两级分解的数据后,在原来的复杂时间序列趋势信息,以及多个周期信息,分为子序列。不同的子序列预测模型建立基于他们不同的特征来获取最终的预测结果。本文提出的预测方法也适用于其他文学研究[70年- - - - - -76年为不同的目的。在未来的研究中,为了进一步提高模型的性能,将采用新的网络结构,将试着和其他分解或合并方法。在这项研究中提出的模型不仅可以应用功率预测还包含多个时期的其他数据信息。
数据可用性
使用的数据来支持本研究的发现可以从相应的作者。
的利益冲突
作者宣称没有利益冲突。
确认
这项工作是支持部分由中国国家自然科学基金(号。61673002,61903009,61903008),北京市教育委员会(KM201910011010号和KM201810011005), BTBU的年轻教师研究基金项目(没有。QNJJ2020-26),北京优秀人才培养项目为年轻一流的团队(不支持。2018000026833 td01)。