文摘
石油和天然气仍将是至关重要的全球经济发展和繁荣了几十年,石油和天然气工业是一个能源密集型产业。因此,提高能源效率生产石油和天然气在石油和天然气公司是一个重要的问题。智能能源消费预测方法能够分析能源消费模式,确定节能目标证明了自己作为一种有效的方法在许多工业领域的能源效率。此外,能源消耗预测,使管理者能够科学计划的能源使用能源生产和能源使用转向非高峰时期。然而,它仍然是一个挑战性的问题在一定程度上的不可预测性和不确定性引起的各种能源消费行为,和这一现象变得越来越明显的石油和天然气公司。为此,在我们的工作中,我们主要讨论了预测能源消耗的石油和天然气公司。首先,四种不同的预测模型,支持向量机,线性回归,极端的学习机器,人工神经网络,训练在训练数据集,然后评估的测试数据集。其次,为了提高能源消费预测准确性,所有这四个模型的组合检查RMSE值通过两个模型的平均输出。结果表明,这四种不同的模型能够预测能源消耗具有良好的准确性,但混合model-artificial神经网络和极端的学习机器精度高。此外,混合模型是安装在石油和天然气工业的能源管理系统来管理油田能耗,提高效率。
1。介绍
石油和天然气仍将是至关重要的全球经济发展和繁荣了几十年,并在2018年从英国石油公司能源展望,据说,石油和天然气的绝对消费将稳步增长的趋势在2040年(1]。此外,全球气候变化的担忧导致需要关注的能量产生这些碳氢化合物燃料和更多的非常规能源的出现和方法继续进一步增加生产能源强度。面对这些挑战,行业认识到能源效率和保护可以作出重大贡献,环境保护和能源供应。
与此同时,2016年,13岁th国民经济和社会发展五年计划的中华人民共和国被释放了。这个声明还特别提出了具体的能耗指标,包括电力行业、可再生能源、水电、风能、太阳能和生物质能。例如,据说能耗预计将在6800 - 7200太瓦时的平均年增长率-4.8% - 3.6 (2]。因此,能源公司必须付出更多努力,合理的能源在能源生产投资和削减能源成本。
一般,最节能的潜力在于终端用户,以及能源效率是一个具有挑战性的问题对于石油和天然气公司,可提供通过实施改善行动,计划和投资。
如今,大数据的增长势头,先进的计量基础设施的巨大进步,和物联网的兴起(物联网),大量的能源消费和生产数据进行收集和存储,许多研究人员使用基于统计的机器学习技术理论探索这些数据和分析能源消费行为(3- - - - - -5]。因此,智能能源预测方法已经证明了自己作为提高能源效率的有效的方法在一些工业领域:作者(6]介绍了神经网络的预测工具和回归模型预测日前小型太阳能光伏发电机输出功率,达到预测精度高;Prema和饶提出一日前太阳能发电预测和时间序列模型提出了峰值性能误差为9.28% (7];一些作者还考虑短期概率太阳能的合奏方法预测和模糊方法对全球太阳辐射预测(8,9]。关于对建筑采暖能耗的预测,探索各种人工神经网络:郭等人使用基于机器学习模型预测室内供暖系统的能源需求(10];相反,值得注意的是,一些研究人员使用回归模型直接计算能耗、和广泛使用的回归方法,实现承诺的性能包括加权支持向量回归和多重线性回归(11- - - - - -13];这些方法将确保更稳定的能源供应和能源优化能源需求的管理企业。
简而言之,本文主要话题发表了“如何准确地预测一个石油和天然气公司的总能源消耗产生一定数量的原油和天然气,帮助公司提高能耗效率吗?”来解决这个问题,本文讨论了四种不同的预测模型,支持向量机,线性回归,极端的学习机器,人工神经网络,它能够准确地预测了公投的最终能源消耗和提高能耗效率。为了更高的性能,讨论了混合模型以及通过两个模型的平均输出。
本文的主要创新包括以下:(1)能源消费的预测的石油和天然气公司在公司层面上,而不是石油操作级别,提出并证明了有利于公司管理者和政策制定者做出明智的决定有关能源使用(2)四种不同的预测方法和6混合模型进行了讨论和分析公司的能源消耗预测(3)讨论了四种性能评价指标评价预测模型,模型和一个较小的值的指数表示模型的更好的性能(4)本文的结果可以用于其他石油和天然气公司预测的能源消耗
本文的其余部分组织如下:常用的或传统的方法来提高能源效率在石油和天然气领域的文献讨论了部分2。部分3总结了该模型。部分4阐述了上述模型的方法。结论和讨论。
2。传统的能源效率的改进方法
在石油和天然气领域,各种各样的机会确实存在减少能源消费总量生产生产相同或更多数量的原油和天然气,和效率的提高可以影响机械、化学和其他物理参数。最常见的能源效率改进生产技术包括高效的生产设备和改进生产过程的变化。例如,在炼油厂,几家公司的研究显示,有一种强烈的潜力提高能源效率,主要领域包括公用事业,解雇了加热器,流程优化,热交换器,电机,电机的应用程序和其他领域(14]。
下列情形的文学研究非常广泛使用的能源效率的改进方法:在15],萍等人改进真空炉的热效率,达到节能的要求通过新技术与炉烟气废热回收技术的应用程序。在[16),以减少能源消耗的石油运输线路,遗传算法被用来预测和优化石油管道。在[17),混合建模方法综合能耗的石油和天然气生产过程,如图1研究;他们专门讨论了整个石油和天然气生产过程,包括机械开采系统和收集和传输过程,分析每个过程链的重要因素,最后建立了回归模型来预测一些采油操作领域的综合能耗。
除了优化操作条件和技术设备的变化,改变能源使用情况生产的管理也是最成功的方式削减能源的生产成本,而且可以实现通过构建组织范围的能源管理计划(14),许多石油和天然气公司已经设计并建造自己的能源管理系统的引导能源效率的承诺。
如今,智能领域也存在小说中的能源效率的机会油气田通过节省运营成本。例如,在智能油田工人和工程师都访问数据和业务相关的文件。复杂问题发生时现场和工人的范围之外的知识,他们能够很容易配合专家来解决这个问题。通过快速操作成本将大大降低,改善决策。与此同时,智能领域也能提供重要的机会来改善现有的条件的上下文中油田资产的油藏工程和生产性能和最终减少能源消耗的石油勘探18]。
在本文中,我们调查了能源效率改善仅仅通过数据驱动的能源消耗与整体机器学习模型预测方法在公司范围内而不是石油操作站,和性能最高模型在实际生产环境中使用。
3所示。提出的模型
该模型包括三个阶段,如图2。第一阶段的目的是将整个数据集划分为几个不同的子集或集群,和聚类方法,即资讯,被认为是。与此同时,这种聚类方法也应用于消除非平稳或错误的样本或观察整个数据集。
第二阶段构造预测二维输入的能量消耗在每个subdataset原油和天然气生产,在这个阶段,四个不同的预测包括支持向量机的机器学习方法,线性回归,极端的学习机器,分别和人工神经网络的研究。
最后一个阶段是设计用于执行最后的预测结果通过整体模型。在[19),得出的结论是,机器学习模型的泛化能力和准确性可能被一个增强模型对单一模型。与此同时,许多研究人员已经证明了许多人的简单组合模型的输出是有利于更好的性能(20.,21]。一般来说,整体模型性能更好的情况下各个模型呈现良好的性能数据和他们的错误分配在不同的空间。在我们的论文中,我们尝试通过6组合的平均值从第二阶段两个模型的输出,然后评估他们的表现。
4所示。方法
4.1。数据集
在这篇文章中,我们收集能源消费和生产数据超过二十年四个石油和天然气公司。通常,在石油和天然气公司,这些数据将公布的能源管理系统,收集的频率是每月一次,然后是公司经理将调整能源使用和生产计划在下个月。12的观察,因此,每年,我们收集,总的来说,数据集包含960个数据样本。我们把这些数据样本分为训练数据集和测试数据集的速度6:4。关于能源消费在石油和天然气行业,它通常包括两部分:工业和nonindustrial一部分。工业是直接生产石油和天然气,能源消耗的主要贡献nonindustrial一部分来自石油工人的日常生活,如加热、烹饪、和运输。在我们的工作中,由于nonindustrial的复杂性和多样性,我们只是考虑到工业部分,这些数据集的表示形式(三倍x,y,z),x表示原油生产,y天然气产量,z工业能源消耗。然而,正如图所示3,能源消耗波动在整个观测数据显示了一个弱关系。因此,石油生产和天然气生产设计的输入能源消费的预测。
4.2。预测指标对模型性能
为了评估这些模型的预测能力尽可能等距,介绍了四种指标。首先,预测精度的能力指标预测误差最小,而且可以直接由以下三个指标: 在哪里N表示样品的总数,是真正的价值,预测的价值。模型的性能是衡量RMSE,梅,日军。值越小表明这些模型的更好的性能。其次,相关系数(R)被认为是衡量真正的价值和预测之间的线性相关。的定义如下: 在哪里E是期望值和标准差运营商吗和和手段和 。范围的相关系数可能需要的任何值(−1,1)。当相关系数接近于零,没有很强的线性相关的真实价值和预测。信心的关系不仅仅是正式确定的相关系数也对我们的数据的数量。如果有几双,那么需要对相关系数非常接近1或−1。可以找到更多信息的系数(10]。
4.3。聚类
提出了模型的第一步是将所有这些数据样本划分到不同的子集,然后建立一个特定的预测模型为每个数据子集。从统计的角度来看,集群在本文中被认为是一个无监督分类的问题,和子集数目是未知的。为此,应考虑以下问题:应该使用聚类方法对这些数据进行分类?子集应该创建多少个?
然而,有许多先进的方法来挑战,和以前的工作,K——在这种情况下似乎正确的模型。
的K——作为一个centroid-based聚类方法,主要遵循两步迭代计算:首先,每一个观察是分配给最近的子集,然后调整手段,这样总within-cluster平方距离之和最小化。这个过程一直重复,直到意味着仍无动于衷。
在我们的工作中,在使用之前K算法,则要提前确认集群的数量,和有很多技术可以用来找到最优数量的集群计算within-cluster和大类间距离或使用R平方指数验证集群通过测量集群的同质性。我们使用K则把类似的数据集划分为同一组,因此应该考虑within-cluster距离的总和。经过许多过程和对小数据集大小,最好的数子集是设置为3,最后每个子集的成员如表所示1。
4.4。模型的预测结果
本部分旨在阐明使用回归算法的结果预测能耗,并有多个回归模型用于回归分析。在这篇文章中,四种不同的回归模型,即支持向量机,线性回归,极端的学习机器,人工神经网络,讨论了石油生产和天然气产量预测的输入能源消耗的石油和天然气公司。
线性回归(LR)的主要方法是找到之间的功能关系一个线性方程的输出和输入。关于输入变量的数量,有两种类型的线性回归模型:简单线性回归和多元线性回归。在我们的工作中,输入变量包括石油生产和天然气生产,所以我们选择的多元线性回归方程(1)符合能源生产和能源消费之间的关系。 在哪里Y表示输出变量,X1,X2X、…n意思是输入变量,n代表输入变量的数量, , ,…的线性回归系数。在培训过程与训练数据集和最小二乘方法,测试的结果数据集提出了表2。
人工神经网络(ANN)方法取得了巨大成功的建筑和能源领域的预测显示强劲表现在处理输入和输出的非线性回归。人工神经网络模型捕获特性在数据集通过多个层次的处理层。在这一部分,但是人工神经网络来预测开发能源消费和2包括输入层神经元和等于输入特征向量的维度,第一个隐层和第二隐层神经元4和5,分别和输出层神经元由1对能源消耗。主动使用函数是乙状结肠。表3显示测试数据集的结果。
极端学习机(ELM),作为一种新的学习算法,是广泛应用的分类和回归它的简单性和良好的泛化能力。与人工神经网络相比,极端的学习机器由一个单隐层和需要计算成本低。关于能源预测的情况下,许多研究人员还选择这个模型来研究其性能。在我们的工作中,我们构建极端学习机模型4隐层神经元预测能源消耗。表4显示了该模型的测试数据集的结果。
支持向量机(SVM),作为一个最强大的和准确的数据挖掘算法,已经广泛应用于许多领域,如分类和回归。由于强烈的非线性函数逼近能力,也越来越多地使用支持向量机来解决非线性回归估计问题。如今,许多研究人员使用支持向量机来预测室内电力消耗,和误差分析表明,支持向量机提供了更好的性能和更高的比大多数数据挖掘方法的准确性。在这篇文章中,我们也讨论了预测的支持向量机能耗、多项式核函数是用于构建支持向量机模型。表5显示了测试的结果数据集和支持向量机模型。
4.5。混合模型预测结果
许多能源消费预测问题似乎与单一机器学习模型过于复杂,所以我们尝试混合方法探索预测精度。通常,混合模型能够弥补单个模型的缺点和提供更好的性能。因此,我们讨论6可能的组合通过两个模型的输出的平均值。减少计算消耗,我们只是选择最具代表性的常用指标,即 ,而不是四个指标,来评估这些6组合的性能。
如表所示6安和榆树的混合模型,对所有数据集达到最佳性能,并结合的结果总是比任何个人的结果。最后,我们选择混合model-ANN和榆木的最终模型,混合模型的结果对所有子集的测试数据如表所示7。
5。结论
本文首先讨论了四种常用的机器学习方法在石油和天然气行业能源消费预测。实验结果显示,大部分的分析四种模式可以为能源消费预测,提供良好的性能,这些模型的确定系数是0.70和0.95的范围在所有的数据集。线性回归模型,它显示了最糟糕的表现有以下理由:能源消耗数据集太复杂,提出了一种强烈的非线性关系。支持向量机模型和多项式核函数还显示了良好的性能,和确定系数(R2所有这些数据集)大约是0.70。安和榆树最高精度,证明了可行性的情况下在石油和天然气领域的能源消费预测。为了提高最终能源消耗预测的准确性,我们尝试通过混合方法的平均输出,也是训练的训练数据集。最后结果显示混合模型能够获得更好的预测精度比个人的准确性。和安和榆树的混合模型提供了最好的性能和选择作为我们最终的模型来预测能源消费总量在石油和天然气领域,我们还安装了此模型在石油和天然气工业的能源管理系统帮助公司预测的总能源消耗和提高能耗效率。
数据可用性
部分或全部数据、模型或代码生成或使用在研究本质上是专有或机密,可能只是提供了限制。
的利益冲突
作者宣称没有利益冲突。