文摘
古典下降方法,比如Arps产量递减曲线分析,简单的原则和方便的应用程序有优势,它们被广泛用于分析收益率下降。高初始生产,然而,对碳酸盐岩储层快速下降,和大型生产波动,与大多数井没有稳定的生产周期,传统的下降方法的适应性是不够的。因此,迫切需要开发一种新的分析方法下降。虽然机器学习方法基于多元回归和深度学习近年来应用于非常规油藏,其应用效果一直不理想。例如,基于多元回归预测误差相对较大的机器学习方法,和深度学习样本需求和水库管理的实际情况不匹配。在这项研究中,一个新的等概率基因表达式编程(EP-GEP)方法被开发来克服传统Arps下降的缺点在碳酸盐岩储层的产量递减分析模型。通过模型验证和比较分析的预测效果,这是证明EP-GEP模型表现出很好的预测精度,平均相对误差明显小于传统Arps模式和现有的机器学习方法。该方法的成功应用在碳酸盐岩储层的产量递减分析预计将提供一个新的分析工具对现场油藏工程师下降。
1。介绍
有三个主要阶段完整的石油和天然气井的生产周期:生产上升,稳定和下降。在产量递减阶段,下降模式的选择产生重大影响的预测生产动态和最终采收率的评价(1,2]。经典方法的优势,比如Arps产量递减曲线分析,他们的原则是简单和容易申请,以及各种可以派生的显式表达式。派生的表达式可以预测未来动态产量和可采储量的石油和天然气储层pseudo-steady状态。传统方法的缺点3- - - - - -8)是,减少模型的选择取决于经验;因变量是单一,很难精确描述非线性关系的生产变化。例如,存储和控制模型的碳酸盐岩储层与碎屑岩的不同。水库已经开发出矩阵,骨折、洞穴和其他存储空间,连通性差,非均质性强,高初始生产井,快速下降,大型生产波动。大多数储层井没有稳定的生产周期,需要评估来确定一组生产适用于碳酸盐岩储层预测方法。因此,需要开发和应用新的建模方法准确地预测碳酸盐岩储层的生产。目前,机器学习是越来越多地应用于多个行业,石油行业的一些探索性应用案例进行了调查(9- - - - - -11]。
近年来,产量递减基于多元回归的机器学习方法,如人工神经网络、支持向量回归,随机森林,和梯度增强,正逐渐取代传统的数据分析方法(12- - - - - -17]。然而,现有的基于多元回归产生大的机器学习方法在油井产量递减分析预测错误。
此外,深度学习方法,如复发性神经网络,已经申请了产量递减分析(18,19]。然而,深度学习方法是最适合高频(如日报)生产数据,由于其网络结构的特征。这大大限制了深度学习方法的应用程序,因为大多数生产数据月度记录的形式存在。尽管深度学习方法可以用来处理月度数据,他们也需要处理时间和nontemporal复杂网络结构的数据。回归机器学习方法相比,油藏工程师使用深度学习方法有困难(20.]。因为上面提到的问题,缺乏应用机器学习的分析碳酸盐岩储层下降,机器学习方法中使用的基因表达式编程(GEP)是本研究分析碳酸盐岩储层的产量递减。
创业计划是基于遗传算法(GA)和遗传编程(GP)。它在知识挖掘展品性能优良,功能发现,优化和预测(21]。实施是一个机器学习的建模工具,可以用来建立一个明确的模型结构简单,预测精度高通过进化不知道提前模型的结构和参数,无需领域背景知识,从而避免了系统的机理分析。有困难在建立预测模型和预设模型结构基于回归方法,然后参数的主体性是决定使用统计方法[22]。GEP方法已经成功地应用在许多学科和领域(23- - - - - -26]。然而,使用实施预测碳酸盐岩储层的生产还没有报道。因此,有必要模型GEP机器学习方法和预测效果进行更深入的研究。
2。等概率GEP算法
《全球经济展望》结合了遗传算法的优点和全科医生。在表达方面,它继承了简单和快速固定长度的线性编码的遗传算法的特点,和基因表达(语义表达式),它继承了GP的灵活的树结构。的变化特征,即。,simple coding to solve complex problems, are 2–4 times faster than traditional machine learning evolutionary algorithms [22]。
然而,知识挖掘过程的实施是被动的和容易陷入局部最优。无向进化和过早收敛降低解决方案的效率和质量。因此,有必要引导人口基因的演化过程,采用特定的方法,以防止溶液过程陷入局部最优。等概率GEP (EP-GEP)方法开发的这项研究可以有效地解决进化无向当地和过早收敛的问题,提高算法的收敛效率和解决方案质量。
执行EP-GEP优化计算过程如下。随机生成一个特定数量的染色体个体形成了初始种群。产生候选集优秀个体的初始种群。选择最好的适应人群中个体根据碳酸盐分析油井生产下降。接下来,根据适应度函数,人口评估每个人的反应。选择、突变、插入、重组并执行其他人群中对个体遗传操作产生新的后代,形成一个新的人口。新生成的数量继续进入下一轮的优化过程。如果当地收敛过早出现在这个过程总结,进入基因表达等概率的计算过程优化和执行遗传操作,如等概率选择、突变、插入的字符串,和重组,对个人在人口(三个相等的概率图1,例如)。产生新的后代形成新的人口,和新生成的人口和候选人继续进入下一轮的优化计算。随后,重复优化计算过程,直到满足迭代终止条件。优化过程的流程图如图1。
因为EP-GEP算法是基于传统GEP的基因结构、遗传算子、适应度函数是相同的GEP算法中描述的部分2.1- - - - - -2.3。
2.1。基因结构
EP-GEP处理的对象是一个染色体(基因组)组成的一种单基因或多基因。EP-GEP是基于一个简化的基因基因在生物学的原则。它由一个线性的、固定长度的字符串的符号。虽然染色体长度是固定的,表达式树(ETs)不同的大小和形状可以表示生成不同的个体。一个例子是代数表达式如下:
相应的表达式树,即。,individual’s phenotype, is shown in Figure2,在那里是平方根函数。从上到下,从左到右,可以遍历表达式树来获取相应的表达式。
EP-GEP基因分为头部和尾巴。基因可以组成的变量或函数,但基因尾部只能由变量。头部长度和尾巴满足以下方程: 在哪里表示函数中的所有功能集。
2.2。遗传算子
EP-GEP创建一个算法的初始种群,人口中的每个染色体代表一个解决问题的办法。随后,执行一系列遗传操作产生新个体与高适应性获得更好的解决方案。实施的基本遗传算子包括九个类型,即。,selection, mutation, inverted string, string insertion, root string insertion, gene transformation, single-point recombination, two-point recombination, and gene recombination [21]。
2.3。适应度函数
新生成的环境适应性染色体应该评估获得最佳的解决方案。类似于其他进化算法、机器学习的大小(即适应度函数值。、健身)用于EP-GEP染色体质量进行评估。有时,一个合适的适应度函数可以定制根据要解决的问题。
适应度函数的选择必须结合具体的实际问题。选择不同的健身功能可能导致健身等功能的范围方差,标准差,均方根误差(RMSE)发生显著的变化。
结合碳酸盐岩油井的产量递减分析问题,分析的目的是为了解决回归的迹象。健身功能广泛用于解决这个问题是均方误差、均方根误差、平均绝对误差(27]。最小值是必需的。当预测之间的差异和实际值是0,那么理想的最小值是零(18]。在这项研究中,使用适应度函数表达的RMSE得到以下方程:
2.4。减少分析数据集
在哈萨克斯坦北Akar油田碳酸盐岩油藏,储层空间,如矩阵、骨折、岩溶洞穴。储层连通性较弱,非均质性强。生产井依靠自然能源开采和展示高初始生产,快速下降,和大型生产波动,大多数井没有稳定的生产周期。在这项研究中,典型的生产特色A2是选择GEP方法适应性分析。
3所示。结果和分析
3.1。EP-GEP时间序列模型的训练
第一个175数据集从284套A2用于EP-GEP时间系列培训。实验参数表中列出1。组织176 - 284年被用作验证和预测数据集。
的价值模型的训练后为0.9084(图3)。经过EP-GEP模型训练,比较石油产量的拟合值和实际值之间进行(图4)。
优化的表现型框架由五sub-ETs(图5)。
3.2。EP-GEP模型验证和预测
EP-GEP训练模型被用来预测验证/预测数据集。该模型与其他下降方法相比,例如双曲下跌,指数下降,谐波下降,和修改双曲线下降,分析以及A2生产的下降曲线。衰退方程被用来预测验证/预测数据集。此外,使用其他时间序列预测方法的预测结果,例如,自回归移动平均(ARMA)、自回归移动平均(ARIMA)集成,使用神经网络和机器学习方法,例如,递归神经网络(RNN)进行了比较。
在四个Arps下降的预测模型,谐波模型显示下降最大的错误,其次是指数和修正双曲线下降(图模型6)。双曲递减模型最小的错误,但有一个大的错误验证/预测数据集。
的ARMA模型训练后值为0.8910(图7),这是更符合实际生产数据的变化从175年到230年个月。这一趋势从230年持续到280个月但略不同于验证/预测数据集。ARIMA模型训练后价值为0.8963,但预测结果并没有表现出显著的上升或下降的趋势,和验证的错误/预测数据集也大。RNN模型训练集展示了良好的培训效果;它的值为0.9081,但预测结果显示一个大错误,表明该方法适应性差小样本数据集。
总的来说,使用EP-GEP方法建立的模型进行分析比传统的下降,ARMA / ARIMA时间序列,RNN和其他机器学习的神经网络模型。EP-GEP预测模型的平均误差为3.69%。
3.3。验证EP-GEP机器学习的有效性
上面的描述中只显示EP-GEP模型的有效性分析油井产量递减。EP-GEP算法的有效性验证的其他五井研究区域(表2)。结果表明,整体EP-GEP算法的预测效果优于其他机器学习时间序列的方法。
4所示。结论
(1)在这项研究中,GEP方法是解决传统模式Arps下降的缺点分析碳酸盐岩储层的产量递减。模型有效性和预测的比较分析表明,EP-GEP模型表现出良好的预测精度,平均相对误差小于传统的Arps模式(2)多个油井产量递减分析的结果表明,EP-GEP机器学习算法产生了较高的预测精度和提供更好的稳定性比其它时间序列的机器学习方法。该算法可以为水库现场工程师提供新的水库管理分析工具
命名法
| Avg2: | 平均两个输入, |
| Max2: | 最大的两个输入, |
| Min2: | 最低的两个输入, |
| 否定: | 一个输入的负面价值, |
| rt: 3 | 立方根的一个输入, |
| Ln: | 自然对数的一个输入, |
| 返回值: | √一个输入, 。 |
数据可用性
使用的数据来支持本研究的发现正在禁运而研究成果商业化。请求数据,本文的发表之后的12个月内,将被相应的作者。
的利益冲突
作者声明没有潜在的利益冲突的研究,本文的作者和出版。
确认
本研究支持引进高层次人才科研启动基金从中国石油大学胜利学院(kq2019 - 005)。