管理的不确定性在地质情况下使用基于机器学习的分类模型对生产数据

文摘

训练图像(TI)有很大的影响在储层建模作为一个多点地质统计学的空间相关性。与方差图两点地质统计学的数学定义,有一个高度的地质不确定性来确定一个适当的TI。本研究的目的是开发一个分类模型,以确定适当的地质情况中似是而非的是通过使用机器学习方法:(a)支持向量机(SVM), (b)人工神经网络(ANN)和(c)卷积神经网络(CNN)。在模拟生产数据用于训练分类模型,可以选择最可能的TI当观察到的反应生产投入训练模型。据我们所知,本研究是第一个应用程序的CNN生产历史数据是由一个矩阵形式作为输入图像。训练数据将覆盖各种生产趋势使机器学习模型更可靠。因此,总共800信道水库从四个是生成的,具有不同的信道方向考虑地质不确定性。我们把它们分成训练、验证和测试集的576年,144年和80年,分别。输入层由800年生产数据。,oil production rates and water cuts for eight production wells over 50 time steps, and the output layer consisted of a probability vector for each TI. The SVM and CNN models reasonably reduced the uncertainty in modeling the facies distribution based on the reliable probability for each TI. Even though the ANN and CNN had roughly the same number of parameters, the CNN outperformed the ANN in terms of both validation and test sets. The CNN successfully classified the reference model’s TI with about 95% probability. This is because the CNN can grasp the overall trend of production history. The probabilities of TI from the SVM and CNN were applied to regenerate more reliable reservoir models using the concept of TI rejection and reduced the uncertainty in the geological scenario successfully.

1。介绍

可靠的储层建模是最重要的一个任务领域发展规划的决策过程。各种类型的静态数据一起使用来构建一个水库一般model-most,核心样本,测井、地震解释、露头、地质概念。特别是核心和测井是重要的储层建模作为硬数据,但它们只能通过钻井成本。因此,了解空间相关性如变异函数和训练图像(TIs)是重要的生成,钻井储层属性数据不可用。

传统地质统计学算法如序贯高斯模拟和克里格识别使用变异函数空间关系。但是,变异函数只能评估两个点之间的关系,即使有其他数据附近(1]。从1990年代开始,多点地质统计学(MPS),大概是三个或更多的数据点,开发(2,3]。在国会议员,使用钛代替方差图传达空间关联信息。尽管健壮的变异函数估计公式,这是基于地质情况和地质概念(1]。

信道建模的水库、渠道流在TI的方向是最重要的参数之一,因为它会影响注射和生产井之间的连接。一些研究人员使用多个TIs评估合理的地质情况考虑不确定性通道方向(4- - - - - -6]。即使相同的软硬数据用于相同的地质统计学方法,完全可以创建不同的储层模型根据TI(使用6]。此外,固定频道和遍历性也很重要保护连接通道储层建模时(7]。

确定最合理的TI从多个可能性,先前的研究已经提出了两种方法:生产型TI排斥和盲目的试井。TI的概念拒绝排除不适合TI,相比有一个很大的错误后观察到的生产历史实现储层模拟使用静态模型从多个候选人TI (6,8,9]。然而,它需要复杂的程序,例如,基于距离的聚类簇的数量是敏感和距离的定义10]。盲人试井的概念定量测量程度的恢复日志的数据排除执行议员时从不同的是(11]。然而,这种方法是敏感的随机种子,因为等概率特性在序贯仿真和日志数据被设置为一个盲测。

机器学习已经被应用于各种各样的研究主题包括语音识别(12,13)、公共卫生(14),和游戏15]。最近,机器学习算法被认为是解决储层表征的问题。如果一组储层模型和他们的生产数据是可用的,代理和逆模型可以由机器学习方法。构建一个代理(或代理)模型,进行监督学习使用的储层参数输入层和生产反应在输出层。这种方法主要研究作为替代成分和非传统的模拟需要大量仿真时间16- - - - - -20.]。逆模型相反的顺序参数:生产反应和储层参数的输入和输出层,分别。实施后储层模拟数以百计的初始储层模型来获取训练数据,观察生产数据可以用来制造history-matched水库模型(21,22]。

大多数以前的研究依赖于简单的人工神经网络(ANN)算法,偶尔被扩展到更深的ANN模型通过增加隐藏层的数量(23]。最近的深度学习的进步推动了更先进的算法,如概率神经网络(并),递归神经网络(RNN)卷积神经网络(CNN),生成对抗网络(甘)。并由输入、模式,总结,和决策层次和更可靠的渗透率建模应用于岩相的分类(24]。最近一些研究试图RNNs应用于储层产量和压力等时间序列数据(25- - - - - -29日]。RNNs已经应用的递减曲线分析(DCA)预测页岩储层的生产,作为非常规储层不满足标准在DCA的假设。(25,27,28]。一些研究CNN算法应用于图像数据,例如,地震资料和核心图像。使用地震数据、断层解释(30.和对象分类31日可以通过CNN自动化。CNN算法已经成功地应用于microcomputed断层扫描图像来估计孔隙度和孔隙大小32),钻井岩屑分类岩相(33),并为矿物特征(SEM图像分割34]。卷积autoencoder被应用于从地震图像,提取主要特征与结果reparameterized数据用于ensemble-based历史匹配(35]。氮化镓是一种受欢迎的同时生成模型火车两个不同的网络。GAN可以产生新的样本训练数据的分布的基础上,我们可以通过调节网络管理样品(36]。甘也,可以生成空间相关数据不需要任何额外的议员,在储层建模(降低计算成本37]。

在这项研究中,一种新型分类模型4是不同的通道方向基于生产数据使用机器学习算法开发。提出分类模型提供生产数据在输入层和输出层中的每个TI的概率。换句话说,机器学习模型告诉我们,它可能是某个通道方向输入层中的生产历史。然后,TI的概率是用于再生信道水库模型找出影响的不确定性减少通道方向。相比之下,三个算法,支持向量机(SVM),安,和CNN,比较TI分类的准确性。特别是,CNN是首先应用于一个二维矩阵的生产历史。在支持向量机的情况下,它是一种传统的机器学习算法,不基于神经网络的概念,分类和显示性能可靠相(38- - - - - -40]。在这项研究中,它已被证实对TI分类问题。

节2.1介绍了该方法的工作流程,和下面的部分2.2阐述了支持向量机,安,和CNN算法。部分2.3在这项研究中使用的数据集。部分3.1和3.2显示分类结果在四个是使用支持向量机训练集和测试数据集,安,CNN。节4所示。1,训练模型检测参考字段获取每个TI的概率,然后用来再生通道概率模型部分4所示。2。部分5包括通过这项研究结果和未来的工作。

2。方法

2.1。提出了分类模型

地质储层模型的不确定性可能导致困难生产可靠的预测性能。因为储层属性是高度异构通道水库,更重要的是构建合理的地质模型来管理的不确定性。

我们的目标是构建一个基于机器学习分类模型对TI议员减少地质不确定性。图1显示了该方法的概念,这是一种逆模型,因为静态参数,TI,估计生产历史。输入数据在我们的模型是油和水的生产历史,在每个地质和输出概率情况下,它显示了最可能的TI的水库。

我们测试了三个机器学习算法研究:支持向量机,安,和CNN。特别是,我们集中在CNN是否可以应用于时间序列数据,如生产速度虽然一直以表现的图像数据,例如,渗透率的分布,饱和度和压力。在这项研究中,我们安排生产数据转化为一个二维矩阵应用2 d CNN。

2.2。机器学习方法

2.2.1。支持向量机(SVM)

支持向量机是一种监督学习算法中最强大的分类器(41,42]。SVM发现一个超平面,可以从其他组单独的一个给定的一组数据。它是有效地分类数据分为两类,但也可以用于多类分类(43,44]。

图2(一个)显示了一个玩具问题涉及80个训练数据点在二维空间。数据分为两类,红色和蓝色的颜色。使用训练数据,支持向量机发现一个超平面(实线),两组之间的利润最大化。超平面最近的数据定义为支持向量,和保证金计算超平面之间的距离的总和(虚线)和支持向量(用绿色突出显示)。支持向量机的训练后,模型可以分类新数据集,如图2 (b)。新的20数据点,9 11青色的颜色,黄色和成功红色和蓝色区域分组,分别。

(一)

(b)

2.2.2。人工神经网络(ANN)

神经网络是受人类的大脑,擅长模式识别(45]。每个神经网络具有输入和输出层以及它们之间多个隐藏层来解决非线性问题(46- - - - - -48]。它是一种基本的神经层感知器已发展到各种形式的方法如CNN, RNN,氮化镓。安在这项研究中,有两个隐藏层被用来训练分类模型。

安显示敏感性能数据的数量是相对较小的特定的问题(23]。在这种情况下,hyperparameters如隐藏层的数量和每个隐层神经元通过灵敏度分析应该检查。如今,优化hyperparameters可以自动实现自动化的机器学习算法,如AutoKeras算法(49]。

训练数据输入到输入层和输出层中使用他们的标签是训练ANN模型。目标是最小化之间的错配真正的标签通过优化数据和估计价值之间的所有连接层的重量和偏见。有几种方法可以提高分类性能的安50),我们使用了min-max缩放和辍学的技术。因为我们想知道每个TI在输出层的概率,将softmax神经元激活函数的总和就变成了1。

2.2.3。卷积神经网络(CNN)

CNN是一种流行的深度学习算法和优越的ANN模型对图像数据特征提取和培训能力。CNN的输入数据格式是一个2 d或3 d矩阵,使其广泛应用于图像和视觉处理的研究(51- - - - - -53]。区分从安CNN的主要因素是使用卷积和池层自动提取图像的特征(54]。

卷积的层,一个过滤器用于从图像数据中提取主要特征和权重调整过滤器在训练(图最小化目标函数3(一个))。池是一个缩小抽样方案涉及的提取主要特征、和图3 (b)显示了一个简单的例子,马克斯池的最大价值选择中值最大池内的过滤器。卷积的过程和池使CNN优于其他深度学习方法学习图像数据。详细信息在CNN架构用于本研究中提供了部分3.2。1。

(一)

(b)

2.3。数据集的分析

综合储层模型生成使用斯坦福大学地质统计学建模软件(SGeMS)工具。我们构造的二维通道水库模型与不同分布的砂泥岩和页岩相。效果砂和通道相分散,使其重要特征的方向和连接通道预测油和水生产、正常。我们假设存在不确定性在地质情况下的信道方向和四个图像如图4似是而非的是(6]。我们想知道哪个TI更适合给定的生产历史数据。

(一)

(b)

(c)

(d)

训练基于机器学习的分类模型,共有800个模型由单一SGeMS正规方程模块:为每个TI 200模型。每个模型被提出网格系统,每个网格包含。如图5(一个)核心数据,我们认为九井提取含有砂相。它由八个生产井和单一水注入井,位于中心的模型通过注水,提高生产效率。在这项研究中使用的参考模型是图所示5 (b),它有通道连接在垂直方向,因为它是使用垂直(0度)钛生成图4(a)。每个相统一的渗透率将1000和1 md砂页岩,分别为(5,6,8]。图5 (c)显示了四个200储层模型的相应。即使同样的硬数据被用于同样的地质统计算法,地质的不确定性情况下,TI,有大量对静态建模的影响。这就是为什么我们想开发适当的TI的基于机器学习的分类模型。

(一)

(b)

(c)

我们把800储层模型分成三组构造基于机器学习的分类模型。二十模型200模型从每个测试集选择TI,剩下的180模型被划分在一个80/20的比例144年培训模型和36验证模型。800年初始模型的四个TIs, 576年144年培训和验证数据随机选择,而80年从每个TI组选择测试数据一致。

我们有信息的地质模型及其TI,但附加信息,模型的动态数据,需要根据生产数据构建分类模型。储层模拟是在800年首次进行的模型来获得生产使用ECLIPSE 100年从斯伦贝谢的反应。四个动态项,即。,well oil production rates, well water cuts, and field cumulative oil and water productions, were obtained until 1,000 days in 20-day intervals. Therefore, each model consisted of a total of 900 production data: 400 well oil production rates (50 time steps × 8 producers), 400 well water cuts, and 50 field cumulative oil and water productions. Finally, each initial model has a set of production data and TI index which were used in the input and output layers, respectively.

3所示。机器学习模型的训练和验证

基于机器学习的分类模型的目的是预测TI指数(编码为1、2、3、4为0,45岁,90年,和135度,分别)对应于生产数据在输入层。我们训练支持向量机,安,和CNN使用部分中描述的数据集2.3。分类性能对TI定量准确性分数的训练相比,验证集和测试集。特别是,我们注意到测试组分数,因为它表明一般训练模型的适用性。

我们使用Python 3.7的程序代码和一些Python库,包括NumPy scikit-learn Matplotlib,分析数据。同时,我们使用TensorFlow 1.13构建安和CNN模型。使用的所有库是开源项目,不断升级来支持用户构建最新版本的机器学习模型。

3.1。支持向量机

3.1.1。特征选择

SVM试图找到最佳超平面可分类的一组输入数据(见部分2.11)。当数据的维数很高,可以模糊超平面,恶化的分类。因此,而不是使用所有输入参数(900年本研究生产数据),通过特征选择最好排除冗余特性来改善分类结果。不像CNN,支持向量机是需要预处理特征提取前的培训。

SVM是加上一个离散小波变换(DWT),这是一个广泛使用的特征提取方法从输入数据中通过选择主要特点(55- - - - - -57]。DWT使用一组小波的叠加构造小波变换的基函数。各种类型的小波可用于这个目的,包括哈雾,Daubechies,双正交的,coiflet symlet,迈耶,小波58]。因为我们对小波类型数据集不敏感,我们使用哈雾wavelets-the简单类型的wavelet-to DWT。

选择的数量特性可以调节在DWT分解级别。增加功能的分解水平降低;根据经验给出了水平的选择这是九个或更少(59因为输入特征的大小是900。

灵敏度分析的分解级别实施优化支持向量机的性能特征提取。表1列出了训练支持向量机模型的精度,验证集和测试集通过调整从0到9的分解级别。准确性分数计算正确分类的数量除以每个数据集的总数:576培训,144验证,80测试数据。传统的分类模型评估了基于混淆矩阵的机器学习模型,因为它只有两个选项,是否发生滑坡(60- - - - - -62年]。然而,使用TI的分类模型的概率是本身评估地质情况而不是选择概率最高的TI作为一个炎热的编码方案。重要的是评估可能的地质概念和评估的不确定性,而不是一个明确的答案。


分解水平	特征尺寸		训练集	验证设置	测试集

9	2	分数	0.4635	0.4167	0.4125
8	4		0.6944	0.6458	0.6375
7	8		0.8003	0.7917	0.7625
6	15		0.9028	0.9028	0.8375
5	29日		0.9201	0.8889	0.8750
4	57		0.9306	0.8611	0.8500
3	113年		0.9236	0.9236	0.8375
2	225年		0.9184	0.9097	0.8500
1	450年		0.9184	0.9167	0.8875
0	900年		0.9184	0.9028	0.8628

DWT的分解级别较高,特征选择的数量是小的。支持向量机模型只使用两个特性(最高分解级别)为三个数据集提供了最贫穷的分类虽然可视化的两个特性是有效的。图6显示80个测试储层的分布模型使用这两个功能。如果测试集分类正确,只有这两个特性,一把锋利的超平面可以定义根据TI区别;然而,混合TI 2 d平面上的索引显示一个贫穷的支持向量机的精度。

曲线在图7画的准确性分数表的灵敏度分析1。蓝色、红色和绿色线表示训练的结果,验证集和测试集,分别。增加功能的数量4、8、然后十五显著提高分数,这波动超出15特性。然而,它并不总是更好的使用更多的功能:最好的测试集的分数是450年获得使用功能,而使用29特性获得了第二。因为线的斜坡开始改变分解级别6后,15个特征被选为理想数量的特征为给定的问题。

3.1.2。支持向量机模型与原始数据减少

在前面的小节中,灵敏度分析是在功能上实现减少从原来的900原始数据:400年石油生产利率,削减400,累计50 50石油和水制作。因为大多数的问题在油藏工程有欠定的,大量的输入数据通常有助于获得改进的解决方案。然而,使用支持向量机在分类是,大量的特性并不能保证更好的结果。同时,冗余测量数据给虚假信息在历史匹配(63年]。因此,在本节中,我们测试了SVM的性能与降低原始数据集来提高精度的分数。

原始数据的数量也减少了(a)只使用的石油产量削减利率和水生产商(800功能)或(b)使用石油产量水平(400特性)。表2和3显示的每种情况下的支持向量机。在表3,最大分解水平8因为限制特征的数量到400年虽然是等于在表91和2。


分解水平	特征尺寸		训练集	验证设置	测试集

9	2	分数	0.6094	0.5139	0.5750
8	4		0.7083	0.7222	0.7000
7	7		0.8299	0.8264	0.8125
6	13		0.8993	0.9167	0.8625
5	25		0.9288	0.8750	0.8750
4	50		0.9323	0.8958	0.8625
3	One hundred.		0.9306	0.8958	0.8750
2	200年		0.9115	0.8958	0.8875
1	400年		0.9236	0.9375	0.8875
0	800年		0.9236	0.9167	0.8750


分解水平	特征尺寸		训练集	验证设置	测试集

8	2	分数	0.5764	0.6042	0.5500
7	4		0.7517	0.6597	0.6250
6	7		0.8628	0.8264	0.8000
5	13		0.9219	0.8472	0.8375
4	25		0.9253	0.8889	0.8125
3	50		0.9392	0.8750	0.8000
2	One hundred.		0.9358	0.8819	0.8375
1	200年		0.9497	0.8542	0.8125
0	400年		0.9566	0.8472	0.8250

表中的结果2和3遵循了类似的趋势,这些表的支持向量机1。当只有两个特征被用于800年和400年的原始数据,支持向量机训练不当,给了不可靠的测试集分类。测试集分数最大的增长发生在800年和400年的四和七个特性原始数据,分别。在13岁以上特性,分数似乎保持稳定。

图8展示了一个测试集分数的比较三种情况:900年的部分数据3.1。1紫色的线,黑线800年的数据,400年的数据为青色。400行数据显示最低的测试集分数不管分解水平。这表明比使用各种类型的数据,例如,oil and water, to improve the SVM rather than using a single type of production data. The 800-feature line indicated higher scores than the 900-feature line, because the use of similar types of data, e.g., well oil production and field cumulative oil production, was likely to prevent the extraction of principal features via DWT. It is important to determine an optimal number of features in the DWT because the three SVM models showed a reliable classification performance when the decomposition level was nearly six regardless of the number of the raw data.

3.2。安和美国有线电视新闻网

在本节中,我们分析了使用安和CNN TI分类问题,多个隐藏层训练分类模型。基于部分3.1。2,800年的动态数据,400年的石油产量率和400年削减水,被用于输入层。安和CNN的主要区别是安排800年的输入数据。CNN需要输入数据作为一个形象,即。,a matrix type, while ANN assigns a vector type to the input layer. Accordingly, we constructed a matrix-form dataset of the production data for the CNN (Figure9(一个))。这个矩阵作为图像显示时间的生产趋势图9 (b)。培训两种算法之前,800年生产数据被规范化使用min-max标量值从0到1删除单位规模的影响。我们使用这张图片作为输入的CNN。

(一)

(b)

3.2.1之上。安和CNN的结构模型

安普遍改善,因其隐层是由“更深。“因此,重要的是设置类似数量的参数在安和CNN架构比较他们的表演。表4和5显示结构的神经网络在安和CNN,分别。我们建立了ANN结构与450年和200年两个隐藏层的大小。输入和输出层的数量是固定的800四是生产数据和概率。每一层的参数数量的总和,如表所示4总共有451454。


层	的节点数量	参数的数量	激活函数

输入	800年		- - - - - -

隐藏的图层1	450年		线性整流函数（Rectified Linear Unit）

隐藏层2	200年		线性整流函数（Rectified Linear Unit）

输出	4		Softmax

总和		451454年


层	维	参数的数量	激活函数

输入			- - - - - -

卷积图层1			线性整流函数（Rectified Linear Unit）
		- - - - - -
马克斯池图层1			- - - - - -

卷积层2			线性整流函数（Rectified Linear Unit）
		- - - - - -
马克斯池层2			- - - - - -

完全连接层	128年		线性整流函数（Rectified Linear Unit）

输出	4		Softmax

总和		478724年

表5提供一个CNN的详细结构模型。CNN架构配置了两个卷积层和两层完全连接。输入矩阵中元素的数量( )相当于输入向量的安。卷积第一层使用32过滤器的大小 ,和补零被用来保持输入大小。然后,马克斯池用于数据缩减了50%。两次重复这个过程后64过滤器的大小在第二个卷积层,完全连接层的数据都被夷为平地,128个节点。最后,它是完全连接到节点的输出层,等于这的数量。共有478724个参数在CNN的参数的数量的总和卷积和完全连接层。注意,马克斯池层没有因为预先确定的权重参数。因此,安和CNN的参数的数量是相当类似。

3.2.2。安分类模型的算法

使用描述的结构部分3.2。1,我们训练有素的ANN模型分类是基于生产数据。亚当优化器应用于最小化损失函数的学习速率0.0001。培训1000年时代应用使用十批大小。

训练的准确性分数、验证和测试集的安图所示10。数据之间的差异10 ()和10 (b)辍学层的效果,这是一个有用的正则化技术阻止安过度拟合训练集。当辍学层没有添加到安(图10 ()),过度拟合问题发生后100时代的分数聚合1火车集。因为ANN模型没有修改时代后,验证和测试成绩没有提高了。验证和测试的性能比火车更重要,这样分类模型应用于看不见的观察生产数据合理。

(一)

(b)

辍学时使用的安(图10 (b)),验证集和测试集的分数变化在0.8和0.9之间,而训练集分数聚集到0.95 1000时代。然而,ANN模型需要极高的时代数字训练,因为测试集的分数还是波动。虽然ANN模型也可以提高通过改变批量大小,优化器,和结构,这些hyperparameters是固定的,因为我们的目的是比较之间的分类性能安和CNN。

3.2.3。由CNN算法分类模型

CNN的矩阵应用于800年生产数据。批量大小等参数和优化器使用的相同安。辍学率将0.5和培训时代是100。

图11CNN的数据显示了结果的排列图9(一个)。训练集的分数大约是0.95,这表明网络是正确安装。验证和测试集的分数在100时代分别为0.9和0.85,分别。因为测试成绩相比增加了30.77%在图安的分数10 (b)在同一时期,CNN是更有效的比安稳定可靠TI分类。安的,重要信息等生产数据的索引,索引,并通过向量类型的动态数据失踪了800年的数据。然而,数据的矩阵是由时间步的顺序列和索引和类型的动态数据行图9(一个)。也明显输入生产形象有效地解释了CNN。

然后又介绍了CNN的准确性是否受到数据排列的影响。因为生产形象图9 (b)不是用一个独特的形状,我们重建图像的不同安排800年生产数据。数据12(一个)和12 (b)显示选择相比,原安排在图9(一个)。在案例1图12(一个),800年的数据的基础上安排生产井和原始矩阵的大小是一样的情况下, 。2图12 (b)是原始数据的转换配置( 矩阵)。

(一)

(b)

(c)

(d)

病例1和2的准确性分数数据12 (c)和12 (d)分别遵循类似的趋势的原始图11。虽然似乎有一些准确性分数的差异在三个案例中,效果不是CNN整体性能的关键。因此,“图像”的生产数据不敏感的安排生产数据因为CNN可以自动提取重要特征通过卷积和池层(64年]。

4所示。不确定性量化使用训练模型

4.1。应用参考模型

因为800年初始储层模型产生的四种不同(图4和5 (c)),有一个高度的初始模型的不确定性。减少不确定性在地质情况下,我们想知道哪些TI更适合图的参考模型5 (b)。训练支持向量机后,安,和CNN模型应用于观察生产数据的参考,每个TI的概率,这是训练有素的输出模型,用于再生热源模型是基于它的比例。

表6提供了一个比较的概率是三个训练得到的模型。支持向量机的概率估计TI 1 83.4%,而且它是一个可靠的结果,因为参考模型生成使用TI 1。SVM-generated概率TI 3是最低的在四个指标0.46%因为TI 3的水平通道连接图41 TI (c)是最鲜明的垂直连接图4(一个)。因此,SVM给适当的评估参考生产数据的应用程序中。


	TI 1(0度)	TI 2(45度)	TI 3(90度)	TI 4(135度)

支持向量机	83.4	1.35	0.46	14.79
安	0	0	0	One hundred.
美国有线电视新闻网	94.77	1.14	0	4.09

安产生一个完全错误的估计中,观察到的数据与TI 4只。这表明,TI 4等于100%的概率,其余是无用的。从CNN, TI 1的概率94.77%,高于其它模型,概率TI 3等于零。TI 2和TI 4的估计是1.14%和4.09%,分别,这两个相对较小值。CNN提供最佳估计在三种训练模型;它可以解释观察到的地质信息隐藏的位置数据,如时间序列和井生产历史的矩阵。

4.2。比较初始储层模型和再生模型

一百年新的储层模型被使用的概率表生成6。TI拒绝改编的概念在再生的储层模型(6,8,9]。表7显示100年再生模型的构成的三个机器学习算法。例如,CNN由95年的100款新车型模型从TI 1,一个模型从TI 2,从钛和四个模型4。注意,最初的800模型由四个TIs以同样的速度(200 / TI)模型。


	TI 1(0度)	TI 2(45度)	TI 3(90度)	TI 4(135度)

支持向量机	83年	1	1	15
安	0	0	0	One hundred.
美国有线电视新闻网	95年	1	0	4

尽管硬数据是固定在图9分5(一个),概率伪相图的概念6,8)申请议员算法作为软数据以改进再生模型的可靠性。地图可以被定义为选择性模型的均值在800初始模型,模拟之间的更少的错误和观察到的动态数据。注意,不需要额外的油藏模拟计算错误,因为储层模拟已经进行了所有初始模型训练机器学习模型。错误的评估了绝对不合群的石油产量率如下: 在哪里和生产井的数量和观察到的时间步骤,分别设置为8 - 50。和分别模拟和观察到的石油产量率。

在这项研究中,五个渗透率模型与最小的不适应环境的选择和他们变成相模型:1000 md砂(指数1)和1 md页岩(索引0)。在图5的均值相模型13被用来为砂相相概率图。这张地图是结合TI准则表7和硬数据图5(一个)在国会议员的算法。

图14显示了800年的初始模型和100再生模型为每个机器学习算法。均值模型的初始模型没有连接(图(14日)),因为四是对生成的初始模型同样适用。硬数据位于的地点可以被识别。相比之下,为再生模型的均值模型所特定的渠道模式。安的情况,因为100生成模型只使用TI 4有一个135度的方向(图频道4(d)),再生模型的平均连接约135度的方向图14 (c)显著不同于参考图5(一个)。

(一)

(b)

(c)

(d)

均值模型再生模型的支持向量机和CNN合理模拟效果连接在引用字段。例如,P1和P2图之间的联系5(一个)出现在数据14 (b)和14 (d)。这两个算法产生了类似的结果,因为大多数再生模型的创建在这两种情况下从真正的TI 1。相比800年的均值初始模型(图(14日)),再生模型的支持向量机和CNN可以显著减少渠道分销的不确定性通过确定适当的TI基于观测数据。

5。结论

在本文中,我们提出了基于机器学习TI根据观察到的动态数据分类方法。四种不同的概率是在输出层评估通过削减石油产量率400和400水在输入层。三个算法,支持向量机,安,CNN,被训练到800初始信道水库的TI和生产历史。

在支持向量机的情况下,TI分类的结果是对原始数据的数量以及敏感的数量选择功能。训练集的准确性分数576模式,大幅增加,直到分解达到6级,但在那之后,比分是聚合。这意味着大量的使用功能并不能保证可靠的支持向量机的结果,应该进行灵敏度分析确定最优支持向量机的特征尺寸。

800的安用一个向量动态数据为输入层,而CNN采用矩阵的动态数据,16到50,输入层。类似的复杂性之间的神经网络下安和CNN, CNN是优于安的准确性分数因为CNN可以保留信息的动态数据,如时间依赖性和水井的位置。

训练后的三个算法使用最初的储层模型,训练模型应用于观察到的动态数据的参考模型获得的概率TI。结果,CNN生产最好的估计,对TI 1 95%左右,这是用于参考。使用每个TI的概率,我们再生100通道模型来减少不确定性在通道方向。而100安未能再生模型的模拟通道连接在引用字段中,那些由支持向量机和CNN有类似的渗透率分布参考字段。这些结果表明,训练有素的机器学习算法可以减少不确定性指导合理的TI的地质情况。同时,矩阵的动态数据被成功应用到CNN作为图像数据。在未来的工作中,可以使用再生模型作为一个历史拟合方法的可靠的先验模型。

数据可用性

数据请求。

附加分

突出了。(i)训练分类模型(TIs)是由图像使用基于机器学习方法。(2)的输出训练模型,观察生产数据表明适当的TI。(3)生产数据矩阵构造应用卷积神经网络(CNN)。(iv) CNN优于支持向量机、人工神经网络通过减少不确定性相分布。

的利益冲突

作者宣称没有利益冲突。

确认

b .康感谢首尔国立大学工程研究所的朝鲜。k . Lee感谢斯伦贝谢提供软件(海燕,Eclipse,等等)用于油藏模拟。本研究支持韩国地球科学研究所的科研补助金和矿产资源(KIGAM) (gp2020 - 037)和韩国的能源效率与资源研究所的能源技术评估和规划(KETEP)韩国政府工业和能源(20162010201980)。

引用

a·g·Journel”相结合的知识从不同来源:替代传统的数据独立性假设,”数学地质,34卷,不。5,573 - 596年,2002页。视图:出版商的网站|谷歌学术搜索
f . b . Guardiano r·m·斯利瓦斯塔瓦,“多元地质统计学:超越二元的时刻,”地质统计学Troia 92艾德,苏亚雷斯,页133 - 144,施普林格,多德雷赫特,1993。视图:出版商的网站|谷歌学术搜索
b . Strebelle和a·g·Journel“水库使用多点统计建模,”SPE年度技术会议和展览新奥尔良,路易斯安那州,2001年。视图:出版商的网站|谷歌学术搜索
b . Jafarpour d·b·麦克劳林,“估计channelized-reservoir渗透率合奏卡尔曼滤波器:整体设计的重要性,”SPE杂志,14卷,不。2、374 - 388年,2013页。视图:出版商的网站|谷歌学术搜索
s . k . Lee Jung, j .崔承哲,“整体流畅与集群为3 d信道协方差水库地质不确定性,”石油科学与工程》杂志上卷,145年,第435 - 423页,2016年。视图:出版商的网站|谷歌学术搜索
j·k·李,s . Kim崔承哲,b . Min和h·s·李,“迭代信道水库使用history-matched相概率数据的静态建模和拒绝的训练图像,”石油的科学,16卷,不。1,第147 - 127页,2019。视图:出版商的网站|谷歌学术搜索
w . j . Al-Mudhafar“多点地质统计学的岩相模拟河流sand-rich沉积环境:一个案例研究从Zubair形成/南鲁迈拉油田,”SPE储层评价和工程,21卷,不。1,第053 - 039页,2018。视图:出版商的网站|谷歌学术搜索
j·k·李,j . Lim崔承哲,h·s·李,“再生的信道化水库使用history-matched facies-probability地图没有逆方案,“石油科学与工程》杂志上卷,149年,第350 - 340页,2017年。视图:出版商的网站|谷歌学术搜索
h .公园,c . Scheidt d·芬威克a·鲍彻和j . Caers”历史匹配和不确定性量化相模型与多个地质解释,“计算地球科学,17卷,不。4、609 - 621年,2013页。视图:出版商的网站|谷歌学术搜索
康,s . Kim h·荣格,j .崔承哲,和k·李,“有效的储层评价不确定性使用基于距离的聚类:复习一下,”能量,12卷,不。10,1859年,页2019。视图:出版商的网站|谷歌学术搜索
k . k . h . Kim Lee h·s·李,c·w·李和h·d·Shin“岩相建模通过多点统计和经济评价NPV为白垩纪早期体积Wabiskaw成员阿萨巴斯卡油砂地区,加拿大,”地球科学前沿,9卷,不。2、441 - 451年,2018页。视图:出版商的网站|谷歌学术搜索
诉某某先生,s m . Siniscalchi h . Behravan诉m·萨勒诺和Kukanov,“提高全民演讲属性分类与深层神经网络对外国口音特征”Proc。为基础。Commun相依Int。演讲。Assoc。INTERSPEECH 2015德国德累斯顿,页6 - 10,2015。视图:谷歌学术搜索
s m . Siniscalchi和v . m .萨勒诺”,适应新的麦克风使用人工神经网络可训练的激活函数,“IEEE神经网络和学习系统,28卷,不。8,1959 - 1965年,2017页。视图:出版商的网站|谷歌学术搜索
Chae s, s . Kwon d·李,“预测传染病使用深度学习和大数据,”国际环境研究和公共卫生杂志》上,15卷,不。8,1596年,页2018。视图:出版商的网站|谷歌学术搜索
d .银、黄,c·j·麦迪森et al .,“掌握围棋和深层神经网络树搜索,“自然,卷529,不。7587年,第489 - 484页,2016年。视图:出版商的网站|谷歌学术搜索
m·a·艾哈迈迪s Zendehboudi,洛杉矶詹姆斯,“开发一个健壮的代理模型有限公司₂注:耦合Box-Behnken设计和联结主义方法”,燃料卷,215年,第914 - 904页,2018年。视图:出版商的网站|谷歌学术搜索
f . Alenezi和美国Mohaghegh”,开发一个智能代理SACROC注水油藏数值模拟模型,”SPE西部地区会议,页汽车贝克尔斯菲市,加利福尼亚州,2017。视图:出版商的网站|谷歌学术搜索
w . j . Al-Mudhafar“多项式和非参数回归的有效预测代理元建模:通过应用有限公司₂在页岩油藏三次采油,”天然气的科学与工程》杂志上,第72卷,第103038页,2019年。视图:出版商的网站|谷歌学术搜索
a . k .贾比尔·m·b·Awang和c·p·Lenn Box-Behnken设计评估混相的代理模型有限公司₂在异构的碎屑岩储集层摇,”天然气的科学与工程》杂志上40卷,第248 - 236页,2017年。视图:出版商的网站|谷歌学术搜索
j .郑j.y. Leung) r·p·Sawatzky和j·m·阿尔瓦雷斯“代理模型预测SAGD生产从包含页岩储层壁垒,”能源技术杂志》上,卷140,不。12日,2018年。视图:出版商的网站|谷歌学术搜索
c . s . j . Kim Kim公园,和k·李,“先验模型建设ES-MDA通过堆叠autoencoder深神经网络预测储层生产,”石油科学与工程》杂志上,第187卷,第106800页,2020年。视图:出版商的网站|谷歌学术搜索
金,k·李,j . Lim h .宋和b . Min,“合奏smoother-neural网络及其应用的发展历史匹配信道水库、”石油科学与工程》杂志上,第191卷,第107159页,2020年。视图:出版商的网站|谷歌学术搜索
b . s . Kim k h . Kim Min, j . Lim和k·李,“代合成密度测井数据深度学习算法在阿尔伯塔省的黄金领域,加拿大,”Geofluids,卷2020,26页,2020。视图:出版商的网站|谷歌学术搜索
w . j . Al-Mudhafar”整合为岩相分类和渗透率测井解释模型通过先进的机器学习算法,”石油勘探和生产技术杂志》上,7卷,不。4、1023 - 1033年,2017页。视图:出版商的网站|谷歌学术搜索
j . k . Lee Lim, d . Yoon和h·荣格“预测页岩气生产Duvernay使用深度学习算法,形成“SPE杂志,24卷,不。6,2423 - 2437年,2019页。视图:出版商的网站|谷歌学术搜索
p . s . Omrani Dobrovolschi, s . Belfroid p Kronberger, e·穆尼奥斯,“改善虚拟流量计量的准确性和back-allocation通过机器学习”阿布扎比国际石油展览和会议。石油工程师学会2019年,阿联酋阿布扎比。视图:出版商的网站|谷歌学术搜索
马j .太阳x, m . Kazi”递减曲线分析比较与递归神经网络RNN DCA生产预测的多井,”SPE西部地区会议加登格罗夫,加利福尼亚,2018年。视图:出版商的网站|谷歌学术搜索
c·詹s Sankaran诉莱莫恩,银行另一位名叫j·格雷比尔和D.-O。美国最大经济产量,应用机器学习为非常规资源生产预测,”第七届非常规资源技术研讨会论文集2019年,科罗拉多州丹佛市。视图:出版商的网站|谷歌学术搜索
d .张、陈y和j .孟”综合测井代递归神经网络,通过“石油勘探和开发,45卷,不。4、629 - 639年,2018页。视图:出版商的网站|谷歌学术搜索
吴x, y史、美国Fomel和l .梁“卷积神经网络地震断层解释的图像,”赛格技术项目扩展摘要20182018年,阿纳海姆,管理方。视图:出版商的网站|谷歌学术搜索
y史,吴x和s . Fomel”自动salt-body使用深卷积神经网络分类,”赛格技术项目扩展摘要20182019年,阿纳海姆,管理方。视图:出版商的网站|谷歌学术搜索
n . Alqahtani r·t·阿姆斯特朗,p . Mostaghimi“深度学习卷积神经网络预测多孔介质特性,”SPE亚太石油和天然气会展即将于页。23日至25日,布里斯班,澳大利亚,2018年。视图:出版商的网站|谷歌学术搜索
m . Kathrada和b . j . Adillah”视觉识别钻井岩屑岩性利用卷积神经网络储层描述的援助,”SPE储层描述和仿真会展,17 - 19页,阿布扎比,阿拉伯联合酋长国、2019。视图:出版商的网站|谷歌学术搜索
x z . Chen, j·杨,大肠,和y周,“深上优于SEM图像分割方法在矿物特征,从一个例子Duvernay页岩样品在加拿大西部沉积盆地,”电脑和地球科学,138卷,2020年。视图:出版商的网站|谷歌学术搜索
m·刘,d .基粒Ensemble-based地震历史匹配数据使用卷积autoencoder re-parameterization,”赛格技术项目扩展摘要201814 - 19页。阿纳海姆,管理方,2019年。视图:出版商的网站|谷歌学术搜索
陈和a . h . Elsheikh”参数代条件地质使用生成神经网络实现,”计算地球科学,23卷,不。5,925 - 952年,2019页。视图:出版商的网站|谷歌学术搜索
康和j .崔承哲,“不确定性量化由聚类分析和深度辅助通道水库卷积生成对抗的网络,”石油科学与工程》杂志上,第187卷,第106742页,2020年。视图:出版商的网站|谷歌学术搜索
w . j . Al-Mudhafar“整合内核支持向量机有效岩石相分类的主要支付Zubair形成在南鲁迈拉油田,伊拉克,”地球系统建模和环境,3卷,不。1,2017。视图:出版商的网站|谷歌学术搜索
o . Ameur-Zaimeche a . Zeddouri s Heddam, r . Kechiched“岩相预测在非核心井Sif法蒂玛油田(Berkine盆地,阿尔及利亚南部):比较研究多层感知器神经网络和聚类分析的方法,”非洲地球科学杂志》上,166卷,2020年。视图:出版商的网站|谷歌学术搜索
t . s . Bressan m . de Souza Kehl t . j . Girelli和f . c .初级”评价岩性分类使用地球物理数据的机器学习方法,“电脑与地球科学,第139卷,第104475页,2020年。视图:出版商的网站|谷歌学术搜索
c .对冲基金h . Millwater k·格雷,“钻粘着滑动严重性使用机器学习分类”石油科学与工程》杂志上卷,179年,第1036 - 1023页,2019年。视图:出版商的网站|谷歌学术搜索
k·h·荣格h·乔美国Kim Lee和j·崔承哲,“地质模型采样使用PCA-assisted支持向量机进行可靠的通道油藏描述,“石油科学与工程》杂志上卷,167年,第405 - 396页,2018年。视图:出版商的网站|谷歌学术搜索
p . Saigal, s·钱德拉和r . Rastogi“多媒体三合一支持向量机,”人工智能技术的工程应用卷,85年,第242 - 229页,2019年。视图:出版商的网站|谷歌学术搜索
l . f . Tang亚当,b . Si”组特征选择与多类支持向量机,”Neurocomputing卷。317年,42-49,2018页。视图:出版商的网站|谷歌学术搜索
f . Rosenblatt“感知器:一个概率模型为信息存储和组织在大脑中,“心理评估,卷65,不。6,386 - 408年,1958页。视图:出版商的网站|谷歌学术搜索
阿里,w·穆罕默德,a . Brahme斯科巴o .还,和k .脊柱,“应用人工神经网络对多晶金属的微观力学,”国际期刊的可塑性卷,120年,第219 - 205页,2019年。视图:出版商的网站|谷歌学术搜索
h·欧阳x张,h .严,“指数跟踪基于深层神经网络,”认知系统研究57卷,第114 - 107页,2019年。视图:出版商的网站|谷歌学术搜索
d . e . Rumelhart、g·e·辛顿和r . j·威廉姆斯,“学习back-propagating错误的陈述,”自然,卷323,不。6088年,第536 - 533页,1986年。视图:出版商的网站|谷歌学术搜索
h·金,问:歌曲,x,“Auto-Keras:高效的神经建成搜索系统”,2018年,http://arxiv.org/abs/1806.10282。视图:谷歌学术搜索
z s . Wang Chen和s·陈,“适用性的深层神经网络在巴肯页岩储层产能预测,“石油科学与工程》杂志上卷,179年,第125 - 112页,2019年。视图:出版商的网站|谷歌学术搜索
y LeCun (y Bengio g·辛顿,“深度学习”,自然,卷521,不。7553年,第444 - 436页,2015年。视图:出版商的网站|谷歌学术搜索
萨哈,一个全面的指南卷积神经网络——ELI5方式,2018,https://towardsdatascience.com/a-comprehensive-guide-to-convolutional-neural-networks-the-eli5-way-3bd2b1164a53。
j·f·l·苏萨·m·d·桑托斯·r·m·Magalhaes e . m .否决权g·p·奥利维拉和w·l·罗克,“自动分类烃”导致“在地震图像通过人工和卷积神经网络,”计算地球科学卷。132年,23-32,2019页。视图:出版商的网站|谷歌学术搜索
p . y . Simard d . Steinkraus和j·c·普拉特“卷积神经网络应用于视觉的最佳实践文档分析,”ICDAR,3卷,2003年。视图:谷歌学术搜索
x罗,t . Bhakta m .雅各布森和g . Naevdal”一个四维地震历史拟基于小波多分辨率分析框架与稀疏表示,“SPE杂志,22卷,不。3、0985 - 1010年,2017页。视图:出版商的网站|谷歌学术搜索
j·诺和r f•内维斯”,结合主成分分析,离散小波变换和XGBoost贸易在金融市场,“专家系统与应用程序卷,125年,第194 - 181页,2019年。视图:出版商的网站|谷歌学术搜索
a . Subasi a·艾哈迈德·e·Aličković,a . Rashik哈桑“光刺激对偏头痛的效果检测使用随机森林和离散小波变换,“生物医学信号处理和控制49卷,第239 - 231页,2019年。视图:出版商的网站|谷歌学术搜索
p . k . de马赛Machado Freire, c·a·g·桑托斯和g·b·l·达席尔瓦”使用离散小波变换的分析加上安短期流水量预测,“应用软计算卷,80年,第505 - 494页,2019年。视图:出版商的网站|谷歌学术搜索
m·杨Y.-F。唱,c·刘,z王”,讨论分解层次的选择基于小波的水文时间序列建模、”水,8卷,不。5,197年,页2016。视图:出版商的网站|谷歌学术搜索
y z方,王、l .彭和h .香港“卷积神经网络集成和传统机器学习分类器对滑坡敏感性映射,”电脑和地球科学,第139卷,第104470页,2020年。视图:出版商的网站|谷歌学术搜索
方y, z, h .香港和l .彭”洪水易感性映射使用卷积神经网络框架,“《水文,第582卷,第124482页,2020年。视图:出版商的网站|谷歌学术搜索
y, z, m, l .彭和h .香港”比较研究滑坡敏感性与不同的复发性神经网络映射,”电脑和地球科学,第138卷,第104445页,2020年。视图:出版商的网站|谷歌学术搜索
s . k . Lee Jung, t·李和j .崔承哲,“使用集群协方差和选择性测量数据在三维油藏描述的合奏顺畅,”能源技术交易的ASME杂志》上,卷139,不。2、2017。视图:出版商的网站|谷歌学术搜索
a . Waldeland, a·c·延森l . j . Gelius和a . h . s .过往“卷积神经网络自动地震解释,”Laeding边缘,37卷,不。7,529 - 537年,2018页。视图:出版商的网站|谷歌学术搜索

Geofluids

管理的不确定性在地质情况下使用基于机器学习的分类模型对生产数据

文摘

1。介绍

2。方法

2.1。提出了分类模型

2.2。机器学习方法

2.2.1。支持向量机(SVM)

2.2.2。人工神经网络(ANN)

2.2.3。卷积神经网络(CNN)

2.3。数据集的分析

3所示。机器学习模型的训练和验证

3.1。支持向量机

3.1.1。特征选择

3.1.2。支持向量机模型与原始数据减少

3.2。安和美国有线电视新闻网

3.2.1之上。安和CNN的结构模型

3.2.2。安分类模型的算法

3.2.3。由CNN算法分类模型

4所示。不确定性量化使用训练模型

4.1。应用参考模型

4.2。比较初始储层模型和再生模型

5。结论

数据可用性

附加分

的利益冲突

确认

引用

版权

更多相关文章

相关文章