文摘

机器学习方法已逐渐成为一个重要和有效的方法来分析在油藏数值模拟储层参数。本文提供了一种机器学习方法来评估之间的连接性注入和生产井储层夹层控制的。在这篇文章中,反向传播(BP)和卷积神经网络(cnn)是用来训练动态数据与夹层的影响控制连接在储层培训模型。数据集训练动态生产数据在不同渗透率下,夹层倾角和注射压力。连通性计算通过使用深度学习模型,和连接因素 定义。结果表明,与BP相比,CNN在连接,更好的性能(AARD)平均绝对相对偏差低于10.01%。此外,CNN接近传统方法预测结果。本文提供了新的见解和方法评估常规或非常规储层的井间连通性。

1。介绍

不透水层的层间功能或非常低渗透高阻层流体流动。阻止流体流动和分离流体流动单元在一定范围内,在驱油过程有很大的影响。它是影响剩余油的形成与分布的主要因素和储层非均质性研究的关键内容。是具有重要意义的井网调整和潜在的油田开发利用方向动态调整水库实时根据夹层分布和倾角的连接结果的特点。特别是,它是非常重要的判断准确动态注入和生产井之间的连接时,注水油藏进入后期的发展(1- - - - - -4]。

研究夹层,地质资料主要是用来预测的规模配置床,但没有统一的规模和细度的理解。特别是,与生产性能的关系不够明确,因此很难直接指导油气田的勘探和开发储层配置的研究成果。这大大限制了储层配置研究的快速发展(5- - - - - -12]。

主要有三种传统方法分析喷射器和生产者之间的连通性评价。首先,一些学者使用统计的斯皮尔曼相关系数(SCC)评估井间的连通性。赛et al ., Refunjor, Soeriawinata Kelkar基于叠加原理建立了一个连接反演模型使用连接通过计算分析斯皮尔曼相关系数(13- - - - - -15]。看不到第二,许多学者应用多元线性回归(MLR)的研究方法良好的连接。例如,阿尔贝特尼等人建立了一个改进的多元线性回归模型来评估喷射器和生产商之间的连接(16]。第三,一些学者利用电容模型(CM)来分析连接。基于整个底部压力(必和必拓)和利率数据,约瑟夫等人,Kaviani等人提出了两个改进厘米在必和必拓数据不可用(17,18]。

使用机器学习的方法来评估井之间的连接有两个优点。首先,常用的方法,如厘米和高模型,输入动态生产数据并不局限于生产和压力数据。这是因为传统的方法是建立一个连接系数的数学模型分析描述连接。然而,在不同的条件下,建立了机器学习模型学习动态生产数据的特点。输出是平均渗透率和分裂的角度。因此,输入变量不局限于动态数据。本文提供的含水信息添加动态生产数据作为输入数据特点,使预测结果更加准确。其次,通过机器学习模型预测时间是很少的。当动态生产数据获得的训练模式,连接结果反馈可以不到一秒,远低于传统方法几天或更长时间了,如示踪剂测试干扰测试和压力测试(19- - - - - -23]。

在本文中,使用机器学习的方法来评估控制井储层夹层之间的连接性;具体的研究步骤如下:(1)建立一个注入和生产井之间的两相流数学模型,并以压力、含水量和注射压力在不同层间分布和倾角特征作为输入参数(2)根据训练数据集,英国石油公司和美国有线电视新闻网的方法被用来构建一个深度学习模型训练训练 和训练, (3)所描述的连接是计算训练 和训练, ,和不同的BP和CNN方法的准确性进行比较

本文的研究结果可以提供新的见解和未来油田开发的前景。

2。方法

2.1。BP神经网络

BP神经网络是神经网络的网络结构模型,该模型结合了多层感知器的误差反向传播算法。目前,该模型已广泛应用于各个领域,并取得了极大的成功。BP神经网络的最大优势在于从输入到输出的非线性映射能力,这使得它特别适合解决极其复杂的内部机制。其次,由于存在的误差反向传播算法,神经网络在训练过程中具有较强的自学习和自适应能力。最后,BP神经网络具有一定的容错,和当地或部分神经元参数异常,也不会有很大的影响对整个培训的结果。BP神经网络的这些优势使它非常适合预测井间连通性。它可以迅速建立一个非线性映射关系动态生产数据和地层平均渗透率条件下的非物质模型,这样可以利用动态生产数据转化平均渗透率通过模型训练和测试(24,25]。

BP神经网络在结构上由三部分组成:输入层、隐藏层和输出层。同时,计算过程主要分为两个阶段:正向传播和反向传播。向前传播的过程是利用神经网络的权值和阈值来计算我们的期望的输出变量基于输入数据。反向传播网络中不断更新权重和阈值根据输出变量的误差,以便输出结果可以不断地接近真实价值。神经网络的输入层设计在这项研究中总共有3600个神经元,描述石油生产,含水,注入体积。隐层的三层结构,每一层都包含120个神经元中提取数据的特征输入层。只有两个输出层神经元代表平均磁导率和床层内(显示在图1)。

2.2。卷积神经网络

卷积神经网络在各个领域得到了广泛的应用,取得了巨大的成功,由于其独特的特征提取和降维方法。CNN的结构主要由五部分组成:输入层、卷积层、汇聚层,完全连接层和输出层。卷积层用于提取数据特征,在那之后,池层是用来减少提取数据的维数(26,27]。

在这项研究中,我们合并石油产量( ),含水( ),和注入量( )数据到一个新的数据集( )和重塑其数据格式( )作为输入层,它可以方便的提取特性通过卷积层。然后,连接到输入层两个卷积层,每个池。卷积核的大小两个回旋的保护层 ,分别和卷积内核的数量是60和120年。两个池层,马克斯池功能和内核的大小 被采用。连续三次完全连接层随后池层,每一层神经元组成的40。最后,还有两个神经元的输出层,表明平均渗透率——训练 和解剖的角度——训练 (如图2)。

2.3。模型评价

计算完成时,需要评估模型的统计评价指标,以验证该模型。本文用一些错误评估标准来研究模型结果的准确性。这些方法包括平均相对偏差(ARD),平均绝对相对偏差(AARD),均方根误差(RMSE)如下28,29日]: 在哪里 在每组代表总数的数据。 真正的价值,我们预计从每组,然后呢 是相应的神经网络计算的预测价值。

2.4。收购连通系数

生产和压力数据的基础上注入和生产井,井间连通性系数的数学模型建立。另一个基于示踪监测评价实验方法在水驱油藏井间连接有很高的成本和时间。本文研究的影响层间有一定的角度注入和生产井之间的连通性。训练因素:动态数据、平均渗透率和层间的角度。目标因素:平均渗透率,层间的角度。与传统模式相比,它更合理使用动态数据来计算平均渗透率和层间角,和井间连通性的表达的平均渗透率——训练 和层间角——训练 是更合理的。连通性评价方程如下所示:

在这里, 连通系数和训练吗 和训练, 机器学习的训练价值。

3所示。过程

3.1。数据集集合

本研究准备渗透率动态数据,层间的角度,作为训练模型和相应的注塑生产关系。在实际油田开发中,很难获得足够的渗透率模型,噪声和动态数据包含大量的数据,这是不适合深度学习培训。因此,本文使用数据的数值模拟训练。

这个实验需要注射生产也是一个例子。如图3油藏有一定角度的层间,和层间的渗透率是0。然后,我们使用生产井的动态数据重新计算的平均渗透率和层间夹角注入和生产井井间的连通性。我们设计的平均渗透率变异范围(1400),步长5医学博士和夹层之间的角度和主要流行(0,90°),每个渗透率下步长4.5°。每一次迭代的渗透率,相应的模型可以生成不同层间的角度。同时,该模型可以改变网格大小,不同的注入量,和其他条件。基于油水两相渗流模型,模拟包括1701个种子模型和相应的动态数据采用IMPES方法。

4(一)显示了生产井的生产受到不同层间的角度相同的渗透率。横轴是生产时间,纵轴是石油生产。曲线清楚地描述,水流的行驶速度成反比的角度夹层夹层的屏蔽效应。结果表明,角度越大,越慢水油井的突破,产量越高,最高产量也很高。

4 (b)显示了含水曲线受到不同层间的角度相同的渗透率。横轴是生产时间,纵轴是水的内容。在同等渗透率,层间角越大,屏蔽效果越明显,越慢水突破,含水上升越慢。角度越小,水行驶速度越快,越快满足水,含水量上升越快。

5(一个)显示了生产井生产相同的层间角在不同渗透率的影响。横轴是生产时间,纵轴是石油生产。曲线清晰地描述了随着渗透率的增加,产量越高,下降越快。渗透率降低和生产的峰值减少。

5 (b)显示了含水曲线相同的层间角在不同渗透率的影响。横轴是生产时间,纵轴是水的内容。渗透率越大,油井见水快。渗透率越低,水突破越慢。然而,由于层间的屏障作用,渗透率越低,水驱替速度越低,波及体积越大,含水率越快在后期将会上升。

当然,注入量在一定程度上也会影响这些特征参数。我们增加注入压力变化深度学习模型。号码是1200天,模型参数如表所示1

3.2。培训过程

在机器学习过程中,培训过程如下:(1)正常的输入和输出(30.]

规范化数据可以提高模型的计算效率在一定程度上。 在哪里 是初始值, 是它的归一化值,然后呢 在变量的最小值和最大值,分别。(2)数据集分为训练集和测试集根据一定的比例。英国石油公司和CNN模型可以选择,和测试集来评估模型(3)在实际应用程序中,使用动态生产数据输入到模型快速获取连接信息没有更新培训

3.3。优化技术

摘要优化技术是由ReLU和辍学31日,32]。ReLU具有分段线性的特性,这使它向前,向后,和分段线性导数,所以更容易优化。传统的s形的函数很容易丢失信息在传播的过程中由于两端的饱和度。ReLU可以使神经元输出为0的一部分,这会导致稀疏的网络,减少参数的相互依存关系,缓解过拟合,如图6。神经网络的一些其他参数如表所示2

4所示。结果与讨论

4.1。模型校准

隐藏层的数量有重要影响的预测神经网络模型。从理论上讲,越层神经网络,更准确的它可以模拟变量之间的非线性映射。然而,太多的层将导致的计算量急剧上升,和金属氧化物半导体将导致梯度计算过程中消失。当然,如果隐藏层的数量相对较小,模型计算结果的准确性将会怀疑。因此,为了更好地预测神经网络的连通性,有必要修改隐藏层的数量。

从表可以看出3AARD值会显著降低层数改变时从1到2无论CNN或BP神经网络。只有一层相比,BP和CNN AARD下降7.6%和6.9%,分别。然而,当隐层增加到3或者4,AARD值不再为CNN,波动明显,基本稳定在25%左右。对于BP神经网络,AARD值在三年内将减少。增加层数对AARD没有显著的影响。考虑到计算资源和准确性,CNN和BP神经网络使用两个和三个层次,分别。

除了隐藏层的数量,数据集的划分也是一个模型,预测效果影响深度学习。是其他参数固定的条件和相应的比例计算,得到最优比例的综合分析数据集。

从表可以看出4AARD值两个神经网络模型的最大误差值是27.3%和19.7%当训练集测试组5:5无论CNN或BP神经网络。这可能是因为训练集样本的数量和地质模型下的动态生产数据获得特定类型不是由神经网络学习。因此,我们增加了训练集,我们可以清楚地看到,当比例是6:4,误差明显降低。培训组的比例继续增加,AARD两个模型的值趋于稳定。结果表明,训练集覆盖了所有类型的地质模型。最后,该部门的比率比数据集修改为6:4。

4.2。模型验证和比较

神经网络计算模型的错误每次训练后损失函数,然后更新重量和反向传播算法得到最优阈值的深度学习模型。因此,模型预测的准确性是评价通过监测RMSE的曲线变化。

从图7,我们可以清楚地得到神经网络训练误差变化。水平轴代表了训练时间,纵轴表示错误的培训 损失函数的计算。一般来说,无论是CNN或BP神经网络,损失曲线的总体趋势是下降。这一现象表明,模型的预测精度不断提高通过每个培训的反向传播算法。与此同时,我们也可以观察到损失曲线模型收敛30岁阶段,测试集的误差是略高于训练集。最后,CNN和BP测试集的RMSE 12.43 md和2.36医学博士分别,这表明,CNN模型比BP模型。

如图8英国石油公司获得的,一般来说,散射点或CNN方法基本上是分布式附近 行,但分散是不同的。CNN预测和之间的偏差 在BP神经网络预测的11%,甚至超过20%。这个散点图进一步证明了CNN的预测方法更精确的比BP神经网络。

从评价结果见表5,BP模型的AARD值是15.35%,测试集是22.56%。相反,AARD CNN模型可以低至10.01%和13.47%,这证明了CNN模型具有更好的预测性能。一句话,我们从许多方面评估模型的准确性和验证的预测——训练 和训练, CNN的培训更加可靠和准确的。

除了验证模型的准确性,我们也比较了两种模型的计算时间,如表所示6。由于大量的数据输入和CNN和BP神经网络的训练时间长,需要2个小时50分钟和1小时15分钟,分别。CNN的方法需要更复杂的数据特征的提取时间。在实践中,我们使用训练有素的模型预测,所以我们需要更加注意时间神经网络预测。你可以看到两个模型(英国石油公司和美国有线电视新闻网)只需要0.8秒和1.1秒预测,分别。

4.3。输入变量的影响因素分析

输入变量的研究不仅在传统使用的石油生产和注射压力模型,这使得数据更加全面和增加了水分。不同的变量作为模型的输入,和每个变量的影响分析了AARD值的预测结果。

如表所示7中,我们使用的输入生产、注水压力、含水的数据模型来验证组合不同的计算结果。首先,当输入数据是基于注射压力,AARD值添加含水或生产获得的输入,分别是28.8%和23.2%,这表明,产量更大比含水率对结果的影响。和计算AARD再次下降到17.1%,当我们增加产量和含水率数据一起作为输入变量。最后,我们添加了注射压力数据的结合含水,AARD结果少也有一定差距显著降低,控制在16.8%。总之,我们含水率数据导入输入。此外,与传统生产和压力,模型可以更好地在计算训练 和训练,

4.4。连通系数的比较

我们随机选择一个样本测试和计算井间连通性系数设置为实际根据样本的平均渗透系数。此外,CNN和传统的厘米,高模型,和其他方法计算相应的连接系数在相同条件下比较分析,如表所示8

5。结论

本文建立了一个机器学习的方法来评估井间连通性的基础上动态生产数据。首先,石油产量的数据,含水,注射压力不同储层规模和注水条件下数值模拟计算。然后,通过BP和CNN的深度研究,上述动态特性之间的差异进行了分析。最后,根据训练- 和训练, ,连接系数计算代表井之间的连接性。通过预测结果的分析和讨论,我们可以获得以下结论:(1)根据大量数据,预测结果的总体AARD CNN方法可以控制在10.01%,低于5.34%的英国石油(BP)的方法。CNN模型证明的有效性(2)生产一体化、压力和含水率数据将使模型更加完整和连通性预测更准确。通过输入变量的影响因素的分析,可以看出神经网络模型的计算AARD是通过将含水率控制在16.8%的数据输入变量,这是远远低于传统的人工神经网络模型(3)神经网络模型的预测相对准确,和预测时间是很短的。基于连通性的比较因素,与一些传统的方法相比,CNN的预测结果更接近真实的连接因素。此外,英国石油公司和美国有线电视新闻网的预测时间是0.8和1.1年代,分别

数据可用性

手稿是一个自包含的数据。整个数据用于支持本研究的结果中包括通讯作者的文章或可用。如果需要任何额外的信息,这可以从相应的作者要求电子邮件:(电子邮件保护)

的利益冲突

作者宣称没有利益冲突有关的出版。

确认

这项工作得到了中国国家自然科学国家重点项目(批准号51834005),国家重大科技项目(批准号2016 zx05025 - 003;批准号2016 zx05010 - 003 - 003),和研究生教育教学改革研究项目(批准号东北石油大学的JYCX_JG10_2018)。