文摘

使每个组件的电气系统是工作在和谐中更具挑战性的越来越多的使用可再生能源,电力输出的是事先难以确定。在西班牙,每日电力市场打开了12个小时的时间,之后的供给和需求预期24小时。估计一代时,能源如核能是高度稳定的,而峰值发电厂可以运行。然而,可再生能源将最终取代峰化器尽可能是依赖于气象条件。在本文中,我们建议使用不同的深度学习技术和架构解决预测风力发电的问题为了参与每日市场,通过预测提前12至36小时。我们开发和比较各种估计基于前馈,卷积和复发性神经网络。这些估计是训练和验证数据从一个风电场位于特内里费岛。我们表明,每种类型的最佳候选人更精确的估计和多项式回归的引用当前使用的风力发电场。我们也进行敏感性分析,以确定哪些估计类型是最健壮的扰动。分析我们的发现表明,最准确和可靠的估计是基于前馈神经网络与SELU激活函数,卷积神经网络。

1。介绍

一个地区的电网由一系列的组件,必须一起工作来完成一个世代和需求之间的平衡,同时确保电力供应的安全性,并提供一定程度的质量和服务。电力系统的结构可以分为四个主要活动:生成、运输、配送、销售。开始的电力供应过程发生在发电厂,发电。根据设备的类型,不同类型的主要能源用于驱动涡轮机或运动,从而将一次能源转换为机械能。轮机和一个发电机联接起来,将机械能转化成电能。提供电能的过程继续通过交通网络,连接各生产工厂消费中心。这个过程发生在高电压降低电流,从而损失。接下来分布过程,从变电站电力传送到交通网络为各种消费。这些变电站减少从交通网络的电压值,适合消费者使用。电力供应流程与营销活动总结,在电力出售给消费者根据他们的感染力量。

在西班牙,法律在1998年54/1997生效。本法是值得注意的,因为在欧洲其他国家,它管制的产生和营销活动,同时继续规范运输和分销方面。从那以后,两个主要运营商一直负责管理的技术和经济方面西班牙的电力市场。一支是红色电气西班牙花园工业(REE),另一个是Operador del梅尔卡多伊比利亚德能源(OMIE),这需要协调他们的努力。后者是负责处理投标买卖能量。电力系统模型,定义的能源价格成为匹配过程,开始被用于各种市场会议:日报,盘中,辅助服务。

日常会话,或每日市场,发生在12:00,投标后的24小时内会话关闭被放置。这是主要市场,因此其中大部分能量的会话协商。

日内市场召开的前一天和送货日期。一旦新提供匹配,它们被添加到日程表产生所谓的最后一小时时间表(西班牙语)的表彰。显然,更少的能量是在这些市场,因为他们的交易时间范围正逐渐减少。他们是为了适应交易预测潜在的变化。表1显示了不同的时间跨度为6日内会话,仅开放给那些买家或卖家参加每日会话。

最后,在需要时使用的辅助服务是解决需求和一代之间的不平衡,调节频率/力量,和控制电压的交通网络。那么,他们的目的是保证平衡,电力系统的安全、质量和可靠性。

对于每个小时,生产者和消费者想要生产或消费电力必须放置一个出价的各种市场根据他们的需求。每小时在每个会话,收到的投标被安排从最高到最低的销售价格,最高最低购买价格,最高与最低价格为0和180.3€/兆瓦时。图形化,结果将会是两个总曲线,在那里 设在能源和 设在在价格上。匹配的方法是“边际”,这意味着匹配代价小时和会话设置交叉的两个总曲线。任何单位剩余低于和高于这个值将被卖掉,买了,分别在那个价格。换句话说,所有的合同将会以这个价格出售。

为了说明匹配过程,图1显示了一个示例情况五发电厂和六大市场的消费者将收购小时H。

因为大多数的需求是不可控的,它提供了最大的购买180.3€/兆瓦时。但值得要求生产商使用什么标准工艺销售提供这种需求。核电和可再生植物往往出售在0€/兆瓦时确保所有它们产生的能量消耗。这是由于技术的限制,如不能停止生产的核和无法储存主要能源的可再生能源。系统总需求之间的差异和产生的能源技术和水电(水流可以由使用水库)被称为热差距。这种差异是必须满足的能源需求使用热技术(如天然气和煤炭),可变成本高于可再生能源和核能。因此,电力市场的竞争热发电厂之间的谎言,因为它是在这些植物之间的交集在市场需求和供给曲线匹配过程,因此最终的销售价格,视情况而定。

如图1显示,较低的需求需要更低的价格,要求更少的工厂在操作和排除最昂贵的植物的匹配过程。增加可再生能源的生产会导致匹配的价格急剧下降,导致需求的情况下,所有的地方都是由生产售价0€/兆瓦时,在许多场合都已经发生了。随着可再生能源在能源结构的比例增长,电力市场的平均价格下降。具体来说,平均2016年在西班牙电力市场能源价格(48.4€/ MWh)下降了23%对2015年到2010年以来的最低价格。这主要是由于大反应水力和风力发电的需求在今年头几个月。

减少热技术的使用需要将更多的风力发电能源结构。为此,生产商必须知道有多少单位每日供应市场。风电场的一代必须预测提前一天,而且,如果有必要,可以纠正这些供应单位6日内市场会议时间范围的27日,24日,20日17日13日和9小时。不幸的是,风能的主要缺点是多么困难作出准确的预测由于这个能源的严重依赖大气状况,以及如何困难,反过来,这些都是预测。

在本文中,我们提出一个依赖深度学习的一系列回归估计技术来预测风电场的一代基于估计的大气条件。这些预测仅供日常市场,这意味着他们必须提供足够准确的结果提前12 - 36小时。

2。材料和方法

下面我们描述实现的估计,使用的数据,用来训练和程序,评估和比较估计。

2.1。数据集

技术和可再生能源研究所(ITER)是该机构最大的风电场运行的特内里费岛。它还为我们提供了这个研究的数据。ITER运行了农场,额定功率为4800千瓦,由八个AE-46发电机。在一小时48小时后的天气预报时间生成一天两次。一天一次的风速12 - 36小时后预计和多项式回归是用来进行估计每个小时的间隔的一代。这估计是发送到OMIE用于日常市场。

ITER给了我们一个数据集与每小时样本的结果数值天气预报(NWP)对不同气象变量,生成预测由ITER使用多项式回归,风力发电和实际测量和自由文本字段包含问题涉及的操作发电机。表2总结了每个样本的特性提供的数据集ITER和显示估计作为输入和输出。

准备数据,我们使用某些功能的工程技术。的时间戳是分解成一天,每天的时间,每一个都是使用的一对值来表示他们的正弦和余弦为了抓住他们的周期性质及其对当地的影响日常风周期。编码的风向也使用这种方法同样的原因。下面显示了一个例子使用风向:

问题是手动的文本转化为发电机的分数不是服务在给定的时间,因为有些样品的总农业产量,是用来调整预测的输出,得到当发电机的一些服务。验证和测试集进行配置时,然而,只有当所有的发电机被采集的样本在服务期间测量。

所有的输入被min-max正常化比例在0和1之间,我们的目标是获得最大的效率在训练。每小时的训练,我们有数据采样从2014年1月至2016年4月,被随机分为三组:60%由训练集的数据,验证集的20%,其余20%的测试数据。数据存储在TensorFlow TFRecords文件效率目的使用TensorFlow框架(1),该工具用于开发,培训,评估各种预测。

2.2。前馈神经网络

第一个架构评估是前馈神经网络(FNN)。在模糊神经网络(2每个神经元在一层接收作为输入所有的从上一层神经元的输出。输出 th神经元的 th层可以表示为显示在以下: 在哪里 是用来表示的输出的重量吗 th神经元的 th层的输入 th神经元的 th层, 的偏见 th神经元的 th层, 神经元的激活函数吗 层。最常见的激活函数是乙状结肠函数,即表示为如下所示:

在回归问题的一方面,乙状结肠激活函数在每个层除了最后一个,输出层,它使用恒等函数 的激活函数。

学习是通过使用标准的深度学习技术,像minibatch梯度下降3)和Adagrad(自适应梯度算法)优化器(4]。后者允许不同的步骤大小不同的特性,所以它不需要指定学习速率。调整后的模型验证每5000训练有素的批次。使用的停止准则是评价的均方误差(MSE)在三个连续的迭代不减少。但为了比较不同预测的准确性,我们使用的平均绝对误差(MAE) [5)和平均绝对缩放误差(激射微波)[6]。美和激射微波时间序列分析中常用的预测误差的措施。

为了避免overadjusting模型训练时,成本函数包含一个组件 2-norm规范所有的重量 和偏见 整个模型。在一些特定的情况下我们使用辍学7)来检查它的影响当试图进一步概括训练模型,但它并没有帮助改善结果。当辍学期间使用的培训,只选择神经元的选择概率 可以被激活。下面显示了神经元的输出表达式的概括 辍学时使用:

2.2.1。ReLU激活函数

当使用minibatch梯度下降训练,向后传播经历了被称为梯度消失的现象8),这大大阻碍了网络的训练与大量的层。在这些情况下ReLU激活函数是非常实用的,因为它不受梯度消失的问题。此外,在回归问题的优势不被限制为0和1之间的输出,从而有利于解决方案的分散性的隐藏的神经元。下面显示了激活函数的表达式 层的神经网络 层。 在哪里 是用来表示激活函数的输入,即输入的加权和神经元,所示(2)。ReLU激活函数的模糊神经网络训练使用这个函数除了每层神经元的输出层。

2.2.2。SELU激活函数

即使使用ReLU激活功能,真正深模糊神经网络难以训练,这妨碍了他们能力处理高层抽象关系输入样本。扩展指数线性单元(SELU)激活函数诱发self-normalising属性,使神经元激活自动往平均为0,方差为19]。这个属性传播在整个网络即使在噪声和扰动的存在。这使得培训网络层和强regularisation和它的使用使培训更加健壮。

下面显示了这种类型的激活函数的表达式: 在哪里 用于指示激活函数的输入。Klambauer et al。9]解释为何 必须显示的值 为了确保神经元激活自动收敛对平均为0和1的方差。

2.3。卷积神经网络

有可能前一小时的大气条件包含信息,可以用来提高预测在任何给定的时间。这些信息被引入基于模糊神经网络的预测准备样品含有每小时天气预报功能 前一小时,表示模型的输入层适当扩大。

为了检查结果被迫利用神经网络时time-local特性之间的相关性通过迫使每一层相邻的神经元之间的连接模式,我们实现了一些预测使用基于卷积神经网络(cnn)模型。cnn在生理上启发变异的模糊神经网络主要用于计算机视觉问题[10),虽然他们的能力利用图像空间本地相关也可以用于时间序列预测。

在这些模型中,每个神经元的输出 不是生成基于在前一阶段,每个神经元的输出所示(2);相反,它是来自空间相邻的神经元的一个子集。为了提高学习效率,每个神经元在同一层同样的重量和偏见,这意味着层可以表达复杂的过滤器,前一层的输出。以下显示的输出 th神经元的 th卷积层: 在哪里 th元素造成的卷积定义的过滤器 与前一层的输出 , 卷积层的激活函数, 表明它的输出 层的通道。在每一个回旋的层,可以应用到不同的输出上一层生成的输出不同的表征或渠道,因此产生的富勒表示数据。为了应用CNN时间序列预测的问题,我们安排样品,这样每个特征的时间序列是一个输入通道网络,从而第一次卷积后。

2显示了一个CNN在本文开发的通用图预测时间序列。在每一个卷积层与ReLU激活函数是一个max-pooling层,输入划分成一组的不重叠的范围,对于每一个范围,输出最大值。后面几个卷积交换层和max-pooling层有一个前馈层(如(2)取得整个网络的输出。

2.4。复发性神经网络

我们已经表明,模糊神经网络和cnn可以使用历史数据系列,但是他们缺乏长期记忆存储信息。他们也不能使用网络的输出中包含的信息在之前的瞬间。复发性神经网络(RNNs) [11)解决这个问题通过输出 在时间戳 取决于之前的计算通过一个隐藏的状态 作为记忆的网络,如下面所示: 在哪里 是输入到网络, 是国家激活函数, 是重量的输入和以前的状态即时成倍增加,分别生成新状态 , 函数,生成网络的输出基于状态。有时这个函数 将恒等函数 ,但它也可以是一个前馈层中描述的(2)。

3显示了RNN我们使用,展开成一个完整的网络。通过展现我们仅仅意味着我们写出完整的网络序列的输入和输出 随着网络的拟合预测。而不是基本RNN细胞解释之前,我们使用两个,更先进的细胞:长短期记忆(LSTM) [11)和封闭的复发性单元(格勒乌)(12)细胞。

LSTM复发性神经网络能够学习和记忆长输入序列,倾向于工作时间序列预测问题的很好(13]。(10)所示,输出 取决于国家 LSTM细胞的激活函数 (这是一般 )。门的输出 控制的程度 用于计算的输出呢 通过阿达玛的产品 :

国家 取决于之前的状态 和候选人的新值的状态 输入门 控制的程度 流进记忆和忘记门 控制的程度 保持在内存中。的 , , 盖茨和新值的候选细胞的状态 可以理解为传统的人工神经元的输出输入的输入的细胞 和细胞的输出 。盖茨的激活函数 是乙状结肠函数,而对吗 它是

格勒乌复发性神经网络使用一个简单的细胞没有忘记门,用更少的参数,这意味着他们通常可以用更少的样本训练。钟等。14实验显示其优势LSTM对于简单的网络,但不能在不同的情况下得出结论,格勒乌是更好的。下面显示了控制这些细胞的行为的方程: 在哪里 细胞的输出的候选人, 是更新门,它控制的程度 用于计算输出和 重设门,控制的程度 流入细胞的输出的候选人 在格勒乌激活功能 乙状结肠函数和吗 ,分别。

2.5。对扰动的敏感性

本文的一个重要方面是分析的行为模型的输入扰动。在接下来的方程我们显示输入的表达式 假设它经历了一个小的增量变化 : 在哪里 th值的输入样本没有干扰。重要的是要注意,输入 的模型 第一层的输入。同样的, 最后的输出层。

一个扰动 在输入 引起的干扰输出 神经网络。当没有扰动的模型的输入,神经网络的输出 为了确定如果模型对扰动具有很好的鲁棒性 th输入、灵敏度 必须计算(15]。我们展示它的表达式如下: 在哪里 是相应的输出变量的值的变化 是输入扰动的比例。

如果灵敏度 低于1.0,这意味着网络输入扰动变弱,而如果它等于1.0,这意味着网络变弱和放大干扰。

3所示。结果与讨论

如前所述,目前风电场使用多项式回归预测农场的一代,成为参与日常所需的市场。给一个想法的准确性,表3显示了美和激射微波对一些使用历史数据估计。激射微波表示绝对误差相对误差估计一小时的天真的预测参考。因此,激射微波大于 表明了预测效果比参考估计量,而激射微波低于 表明它更好的工作。

如表3所示,多项式估计量两倍比一小时的天真的预测参考估计量;然而,这天真估计永远无法使用,因为预测必须和发送给电网运营商提前24小时。

获得一个更现实的比较,这是与另一个天真的估计量,使用实际生成测量24或48小时前的预测在给定的时间。这种天真的估计可以在农场,但表3表明,多项式回归明显比第二个天真的估计量。

3.1。前馈神经网络

数据4,5,6显示验证数据集的激射微波进化的迭代与不同数量的隐藏层网络,神经元和ReLU,乙状结肠,分别和SELU激活功能。

在所有情况下,最终结果是相似的和略优于多项式回归,其激射微波是2.11。图4表明ReLU激活函数产生好结果大约20个隐藏层神经元之间。如果这个大小增加,过度拟合的情况下逐渐升起,激射微波也不是减少添加更多的层或层更大。

5显示了模糊神经网络的结果与乙状结肠激活函数。在本例中,我们清楚地看到,两个隐藏层产生更好的结果,但是在没有通过扩大网络得到进一步改善。乙状结肠激活函数的模糊神经网络需要的步骤三或四倍ReLU网络收敛。事实上,所有的网络类型研究,他们要求最多的步骤收敛。这个问题随着层数由于梯度消失的问题。

6显示了模糊神经网络具有相同的曲线,但SELU激活函数。改善造成增加第一层有一定的大小,可以克服通过增加层数。一般来说,它不产生更好的结果比ReLU激活函数为我们的问题,但这是可以预料到的,因为这个函数的好处是明显的问题,需要大量使用时层Klambauer et al。9]。

然后我们训练有素的估计与上述类似,但由于样本包含每小时天气预报功能 和前5个小时。和之前一样,数据7,8,9展示这个新数据集的激射微波进化。最终结果是相似的在每一个案例,但比多项式回归和前面的模糊神经网络。这说明,这估计能够充分利用时间信息。

数据89也表现出行为类似的数据56分别融合与一个较小的激射微波解决方案。有趣的是,尽管网络SELU激活函数的行为类似于那些ReLU函数,前者表现出更少的过度拟合问题随着网络规模的增长。换句话说,SELU激活功能,增加层数并不能提高但估计同样训练的结果。

3.2。卷积神经网络

我们训练了一个使用架构如图CNN-based估计量2为了比较其性能与以前的模糊神经网络和努力改善后者的结果。卷积过滤器的大小被设置为5,ReLU激活函数卷积层被选中,这些网络像往常一样,max-pooling窗口的大小是3。图10显示验证数据集的激射微波进化在迭代的过程中与不同数量的网络渠道在每个卷积的输出:32 - 8所示。网络的激射微波至少32 16通道非常类似于模糊神经网络获得,但cnn收敛更快,大约一半的时间。培训的优势在于,这种类型的网络可以大大加快利用图形处理单元(GPU),尽管这种可能性不是本文的探索。

11使用一个图像水平256灰色显示的表示系数的第一卷积过滤器训练层CNN与八频道。每个过滤器都有每一行的输入特征,显示了过滤器使用表示为输出层的特征。

3.3。复发性神经网络

一个类似的过程被用来训练RNNs LSTM和格勒乌细胞大小不同的输出 数据1213显示,这一趋势在激射微波训练RNN LSTM格勒乌,分别。两个RNN类型表现出一个错误,非常略大于模糊神经网络和有线电视新闻网。步骤需要完成培训的数量也非常相似,尽管在现实中每一步消耗更多的时间。尽管图中没有显示,但RNNs所需的的时间大约是5倍所需的模糊神经网络。

应该注意,也没有明显的巨大差异之间的RNN LSTM RNN格勒乌。也奇怪这两种类型的RNNs如何工作,即使有大小1细胞,大大减少信息存储在他们的地位比大细胞。

根据这些结果,每日市场预测风力发电的问题更好的解决提供作为输入的时间序列预测前一小时,使用基于模糊神经网络估计ReLU或SELU激活函数,或者cnn。具体来说,后者可以被训练的迭代次数较低,据推测,在更短的时间内使用gpu。关于ReLU模糊神经网络和SELU模糊神经网络,更容易避免过度拟合的后者,不过,如果正确地训练,都是同样准确。

3.4。对扰动的敏感性

最后,我们选择最好的每种类型的模型来分析他们的行为,以应对扰动的输入。在每一个案例中,我们与6小时时间序列模型训练使用。正如我们讨论的部分2。5,我们运行模型和无扰动的输入来计算他们的敏感性。扰动被应用到匹配输入的预测风速和方向时生成的预测,因为这些是最大的输入影响模型的输出。

本文获得的输入扰动比和灵敏度值百分比所示。敏感性低于100%表明,估计能够衰减扰动,而敏感性超过100%表明他们是放大。

14比较各种网络的最佳估计的平均灵敏度类和大小不同的风速扰动水平。图显示所有的估计减弱输入扰动,减少对输出的影响。在所有情况下,最佳的性能表现出的估计基于RNNs,其次是SELU模糊神经网络,乙状结肠模糊神经网络和有线电视新闻网。

15显示了相同的平均灵敏度模型不同的扰动率值在风中方向输入。在这种情况下,结果更不一样,毫无疑问,因为风向和输出功率之间的关系是高度非线性和更复杂的模型充分地在训练。如图15显示,只有估计基于SELU模糊神经网络,cnn, RNNs细胞大小1能够衰减这种类型的扰动。

根据这些结果,考虑获得以前涉及不同的估计量类型评价的准确性,预测风力发电的问题为每日市场更好解决利用估计基于SELU模糊神经网络或者有线电视新闻网。

4所示。结论

在本文中,我们考虑的问题预测风力发电为了参加每日市场调节供给和需求在西班牙电力系统。我们使用深度学习技术开发不同的基于神经网络的预测被训练使用数据提供的风电场,ITER的特内里费岛上的。

预测评估是基于前馈神经网络的不同大小和不同的激活函数,卷积神经网络和递归神经网络。条件是一样的与多项式模型用于农场现在使用,即依赖天气预报提前至少24小时输出预测一代的农场。被训练和检查方法验证模型与样本每小时在过去三年。

有足够的结果,产生更好的结果比小时参考天真的预测估计和多项式模型用于风力农场。具体地说,使用时间序列的输入样本被证明是最好的方法来减少错误。此外,不同类型的神经网络评估,cnn和模糊神经网络与ReLU或SELU激活函数被证明是最准确的,虽然最好的候选人从各种网络类型之间的差异并不显著。传统的乙状结肠模糊神经网络与其他类型训练,尽管他们在训练收敛慢得多。

最后,我们进行了灵敏度分析的模型,这表明训练神经网络能够减弱一些输入扰动。风速扰动的输入,最好的候选人从每个网络类型能够减弱干扰,尽管这是更难以实现与风向的扰动输入,甚至一些网络类型来放大扰动引起的。在这种情况下,CNN, SELU模糊神经网络,和各种RNN类型表现出最好的性能。考虑到所有的结果,最好的神经网络估计,从的角度提供最低的绝对误差和扰动最敏感,是那些基于SELU模糊神经网络和有线电视新闻网。

的利益冲突

作者宣称没有利益冲突有关的出版。

确认

作者要感谢研究所的技术和可再生能源(ITER),特别是Guillermo Galvan加西亚,风的部门负责人和Jonatan费利佩•加西亚,工程部门的经理研发项目,为他们的合作。