GEOFLUIDSgydF4y2Ba GeofluidsgydF4y2Ba 1468 - 8123gydF4y2Ba 1468 - 8115gydF4y2Ba HindawigydF4y2Ba 10.1155 / 2021/6155663gydF4y2Ba 6155663gydF4y2Ba 研究文章gydF4y2Ba 总有机碳含量预测湖泊页岩使用极端的梯度提高机器学习基于贝叶斯优化gydF4y2Ba 刘gydF4y2Ba XingzhougydF4y2Ba https://orcid.org/0000 - 0001 - 8611 - 8306gydF4y2Ba 田gydF4y2Ba 智gydF4y2Ba 程ydF4y2Ba 常gydF4y2Ba OstadhassangydF4y2Ba 迈赫迪gydF4y2Ba 研究所的勘探和开发gydF4y2Ba 辽河油田公司gydF4y2Ba 中石油gydF4y2Ba 盘锦124010gydF4y2Ba 中国gydF4y2Ba petrochina.com.cngydF4y2Ba 2021年gydF4y2Ba 7gydF4y2Ba 10gydF4y2Ba 2021年gydF4y2Ba 2021年gydF4y2Ba 4gydF4y2Ba 6gydF4y2Ba 2021年gydF4y2Ba 14gydF4y2Ba 8gydF4y2Ba 2021年gydF4y2Ba 16gydF4y2Ba 8gydF4y2Ba 2021年gydF4y2Ba 7gydF4y2Ba 10gydF4y2Ba 2021年gydF4y2Ba 2021年gydF4y2Ba 版权©2021 Xingzhou刘et al。gydF4y2Ba 这是一个开放的文章在知识共享归属许可下发布的,它允许无限制的使用,分布和繁殖在任何媒介,提供最初的工作是正确的引用。gydF4y2Ba

总有机碳(TOC)含量是一个重要的参数估算页岩油资源。然而,常见的TOC预测方法依赖于经验公式,及其适用性不同地区。在这项研究中,一种新的数据驱动的贝叶斯优化极端梯度增加(XGBoost)模型提出了预测使用有线TOC内容日志数据。古宇湖页岩,渤海湾盆地,中国,作为一个案例研究。首先,相关分析是用来分析之间的关系以及日志和core-measured TOC数据。基于相关性的程度,六个测井曲线反映了TOC含量被选为机器学习构造训练数据集。然后,XGBoost模型的性能进行了测试gydF4y2Ba KgydF4y2Ba 倍交叉验证,模型的hyperparameters测定使用贝叶斯优化方法来提高搜索效率,减少不确定性由经验引起的。其次,通过分析预测错误,确定系数(gydF4y2Ba RgydF4y2Ba 2gydF4y2Ba )的TOC XGBoost模型和预测的内容core-measured TOC含量达到0.9135。均方根误差(RMSE),平均绝对误差(MAE)和平均绝对百分比误差(日军)分别为0.63、0.77和12.55%,分别。此外,五个常用的方法,即gydF4y2Ba ΔgydF4y2Ba 日志gydF4y2Ba RgydF4y2Ba 方法,随机森林,支持向量机,gydF4y2Ba KgydF4y2Ba 最近的邻居,和多元线性回归,是用来预测TOC内容确认XGBoost模型具有更高的预测精度和更好的鲁棒性。最后,该方法应用于预测20勘探的TOC曲线井古宇。我们获得定量的等高线地图TOC首次这一块的内容。这项研究的结果提供便利的快速检测湖页岩油的“风水宝地”。gydF4y2Ba

中国石油天然气集团公司gydF4y2Ba 2017年e-16gydF4y2Ba
1。介绍gydF4y2Ba

最近,非传统的页岩油气储层深刻彻底改变了能源行业在北美和中国gydF4y2Ba 1gydF4y2Ba,gydF4y2Ba 2gydF4y2Ba]。与海洋页岩,渤海湾盆地东北地区主要发育湖泊页岩中,沉积环境的变化频繁,强大的储层不均匀性。甜蜜点的准确、高效的识别薄的页岩是一个热门研究问题。研究发现,页岩油的勘探潜力主要与三个因素有关:生烃潜力,水库容量,和可恢复性gydF4y2Ba 3gydF4y2Ba]。有机物是一个重要的材料确定生烃潜力和碳氢化合物浓缩(gydF4y2Ba 4gydF4y2Ba]。总有机碳(TOC)含量是关键指标评价有机质丰度(gydF4y2Ba 5gydF4y2Ba]。一个精确的TOC值通常是来自Rock-Eval岩心样品的热解;然而,钻探获得核心样本是费时和昂贵,导致core-measured TOC的不连续和不均匀分布数据。此外,富含有机物湖的页岩的厚度通常是很小的;因此,合理使用离散core-measured TOC数据点的生烃潜力进行评估。测井高分辨率,提供连续数据。有机质含量的变化影响形成的岩石物性性质,如放射性、电阻率,和密度(穴),形成一个独特的测井响应;因此,TOC曲线可以预测使用测井(gydF4y2Ba 6gydF4y2Ba]。gydF4y2Ba

目前,利用测井方法来预测TOC内容包括统计相关性,重叠的方法、多元回归和机器学习。啤酒首次提出利用自然伽马放射性强度评估TOC含量(gydF4y2Ba 7gydF4y2Ba]。随后,许多学者建立了实证关系方程之间的自然伽马(GR)日志和TOC在不同领域gydF4y2Ba 8gydF4y2Ba,gydF4y2Ba 9gydF4y2Ba]。Swanson发现有机物主要是相关的放射性铀的吸附量(U)的形成。因此,研究人员预测使用GR射线光谱日志(TOC内容gydF4y2Ba 10gydF4y2Ba,gydF4y2Ba 11gydF4y2Ba等),建立一个线性TOC含量之间的相关性和U日志gydF4y2Ba 12gydF4y2Ba]或建立一个多元统计TOC含量之间的关系和美国日志结合钍(Th) / U比日志gydF4y2Ba 13gydF4y2Ba]。什莫克发现减少的主要原因的巢穴富含有机物的形成是有机质含量的增加;因此,窝之间的回归关系建立了日志和TOC含量(gydF4y2Ba 14gydF4y2Ba]。赫伦提出一个方法来确定使用碳氧比测井(TOC内容gydF4y2Ba 15gydF4y2Ba]。Passey等人提出的gydF4y2Ba △gydF4y2Ba 日志gydF4y2Ba RgydF4y2Ba 方法(gydF4y2Ba 16gydF4y2Ba),重叠孔隙度与深度电阻率(RD)日志和日志使用nonsource摇滚区作为基线建立一个TOC之间的实证关系公式内容和日志。随后,许多学者提出了基于改进的方法gydF4y2Ba △gydF4y2Ba 日志gydF4y2Ba RgydF4y2Ba 方法(gydF4y2Ba 17gydF4y2Ba- - - - - -gydF4y2Ba 20.gydF4y2Ba]。近年来,特殊的日志记录方法的出现提供了许多方法来预测TOC含量。例子包括使用元素捕获光谱计算TOC内容日志(gydF4y2Ba 21gydF4y2Ba]或结合核磁共振日志和窝日志估计TOC含量(gydF4y2Ba 22gydF4y2Ba]。所有上述方法开发了基于岩石物理模型(RPM)和广泛依靠经验公式。由于第三个人工智能的繁荣,机器学习已经广泛用于岩性识别(gydF4y2Ba 23gydF4y2Ba- - - - - -gydF4y2Ba 25gydF4y2Ba和储层评价gydF4y2Ba 26gydF4y2Ba,gydF4y2Ba 27gydF4y2Ba]。机器学习方法TOC含量预测包括支持向量机(SVM) [gydF4y2Ba 28gydF4y2Ba,gydF4y2Ba 29日gydF4y2Ba),高斯过程回归(GPR) [gydF4y2Ba 30.gydF4y2Ba,gydF4y2Ba 31日gydF4y2Ba),极端学习机(ELM) [gydF4y2Ba 32gydF4y2Ba,gydF4y2Ba 33gydF4y2Ba),神经网络(gydF4y2Ba 34gydF4y2Ba,gydF4y2Ba 35gydF4y2Ba),模糊聚类(gydF4y2Ba 36gydF4y2Ba),和随机森林(RF) (gydF4y2Ba 37gydF4y2Ba]。机器学习是数据驱动的,它提高了TOC预测的准确性和效率比传统方法。gydF4y2Ba

实际上,大部分的核心样品可以作为机器学习样本集中在主要储层区。然而,很少有标记数据点存在于nonreservoir区域,导致训练样本的极度失衡。当个体模型被用来优化目标函数,很容易陷入局部最小值,这些模型泛化能力差。整体学习可以有效地解决这个问题通过训练多个模型,利用复合输出。个体模型是用于创建一个最优预测模型,它提供了预测精度高于单个模型。一个受欢迎的一个模型是射频的例子,已用于地震储层预测(gydF4y2Ba 38gydF4y2Ba),岩性识别(gydF4y2Ba 39gydF4y2Ba],烃源岩预测(gydF4y2Ba 40gydF4y2Ba]。然而,射频是基于装袋技术和对噪声很敏感,容易过度拟合进行回归预测。相比之下,梯度提高决策树(GBDT)是基于促进技术和一般执行更好的回归问题。陈等人首次提出极端梯度增加(XGBoost)方法基于GBDT [gydF4y2Ba 41gydF4y2Ba]。与GBDT算法利用一阶导数信息,XGBoost进行损失函数的二阶泰勒展开,包含正则项目标函数找到最优解,避免过度拟合,使该方法高效、灵活、便携。燕等人XGBoost应用于测井解释执行的致密砂岩,发现它比SVM和射频模型更好的流体识别(gydF4y2Ba 27gydF4y2Ba]。阮等人XGBoost用于预测压缩和剪切波在泥晶灰岩和实现精度高于一个人工神经网络(ANN)和支持向量机(gydF4y2Ba 42gydF4y2Ba]。顾等人利用粒子群优化(PSO)算法来确定hyperparameters XGBoost算法和应用XGBoost预测致密砂岩的渗透率(gydF4y2Ba 43gydF4y2Ba]。XGBoost模型到目前为止,还没有被应用到TOC预测水库。因此,在这项研究中,一个工作流组成XGBoost机器学习提出了基于贝叶斯优化TOC预测并应用于湖泊在渤海湾盆地页岩油。预测的结果进行了对比gydF4y2Ba △gydF4y2Ba 日志gydF4y2Ba RgydF4y2Ba 方法和其他典型的机器学习方法证明了该方法的准确性和可靠性。gydF4y2Ba

2。机器学习理论gydF4y2Ba 2.1。XGBoost理论模型gydF4y2Ba

XGBoost是一个整体提高决策树算法,包含多个迭代。这是一个改善GBDT。多个分类和回归树(CART)模型首先构造使用数据集进行预测;这些树会结合成一个新的树模型。迭代模型不断增强,每个迭代生成一个新的树模型符合前面的树的残差。随着越来越多的树木被添加,模型整体的复杂性变得越来越高,直到方法数据本身的复杂性;因此,培训达到最佳结果(gydF4y2Ba 41gydF4y2Ba]。如果有gydF4y2Ba KgydF4y2Ba 回归树、预报函数被定义为的表达gydF4y2Ba (1)gydF4y2Ba ygydF4y2Ba 我gydF4y2Ba ∧gydF4y2Ba =gydF4y2Ba ∑gydF4y2Ba kgydF4y2Ba =gydF4y2Ba 1gydF4y2Ba KgydF4y2Ba fgydF4y2Ba kgydF4y2Ba xgydF4y2Ba 我gydF4y2Ba ,gydF4y2Ba fgydF4y2Ba kgydF4y2Ba ∈gydF4y2Ba FgydF4y2Ba ,gydF4y2Ba 在哪里gydF4y2Ba fgydF4y2Ba kgydF4y2Ba 是gydF4y2Ba kgydF4y2Ba thgydF4y2Ba回归树,gydF4y2Ba FgydF4y2Ba 代表的车,gydF4y2Ba ygydF4y2Ba 我gydF4y2Ba ∧gydF4y2Ba 的预测价值吗gydF4y2Ba 我gydF4y2Ba thgydF4y2Ba样本。gydF4y2Ba

的损失函数gydF4y2Ba lgydF4y2Ba 预测所代表的价值gydF4y2Ba ygydF4y2Ba 我gydF4y2Ba ∧gydF4y2Ba 和真正的价值gydF4y2Ba ygydF4y2Ba 我gydF4y2Ba :gydF4y2Ba (2)gydF4y2Ba lgydF4y2Ba =gydF4y2Ba ∑gydF4y2Ba 我gydF4y2Ba =gydF4y2Ba 1gydF4y2Ba ngydF4y2Ba lgydF4y2Ba ygydF4y2Ba 我gydF4y2Ba ,gydF4y2Ba ygydF4y2Ba 我gydF4y2Ba ∧gydF4y2Ba ,gydF4y2Ba 在哪里gydF4y2Ba ngydF4y2Ba 是样品的数量。gydF4y2Ba

模型的预测精度是共同确定偏差和方差。损失函数代表模型的偏差,和方差是由正则项gydF4y2Ba ΩgydF4y2Ba 抑制模型的复杂性。因此,目标函数gydF4y2Ba ObjgydF4y2Ba 可以被定义为gydF4y2Ba (3)gydF4y2Ba ObjgydF4y2Ba =gydF4y2Ba ∑gydF4y2Ba 我gydF4y2Ba =gydF4y2Ba 1gydF4y2Ba ngydF4y2Ba lgydF4y2Ba ygydF4y2Ba 我gydF4y2Ba ,gydF4y2Ba ygydF4y2Ba 我gydF4y2Ba ∧gydF4y2Ba +gydF4y2Ba ∑gydF4y2Ba kgydF4y2Ba =gydF4y2Ba 1gydF4y2Ba KgydF4y2Ba ΩgydF4y2Ba fgydF4y2Ba kgydF4y2Ba ,gydF4y2Ba (4)gydF4y2Ba ΩgydF4y2Ba fgydF4y2Ba kgydF4y2Ba =gydF4y2Ba γgydF4y2Ba TgydF4y2Ba +gydF4y2Ba 1gydF4y2Ba 2gydF4y2Ba λgydF4y2Ba ωgydF4y2Ba 2gydF4y2Ba ,gydF4y2Ba 在哪里gydF4y2Ba TgydF4y2Ba 代表叶节点的数量,gydF4y2Ba ωgydF4y2Ba 是叶重价值,gydF4y2Ba γgydF4y2Ba 是叶树的惩罚因子,gydF4y2Ba λgydF4y2Ba 叶重惩罚因子。gydF4y2Ba

XGBoost使用梯度推进战略,新生成的回归树需要符合过去的残差预测。的目标函数gydF4y2Ba tgydF4y2Ba thgydF4y2Ba迭代可以写成gydF4y2Ba (5)gydF4y2Ba lgydF4y2Ba tgydF4y2Ba =gydF4y2Ba ∑gydF4y2Ba 我gydF4y2Ba =gydF4y2Ba 1gydF4y2Ba ngydF4y2Ba lgydF4y2Ba ygydF4y2Ba 我gydF4y2Ba ,gydF4y2Ba ygydF4y2Ba ∧gydF4y2Ba 我gydF4y2Ba tgydF4y2Ba −gydF4y2Ba 1gydF4y2Ba +gydF4y2Ba fgydF4y2Ba 我gydF4y2Ba xgydF4y2Ba 我gydF4y2Ba +gydF4y2Ba ΩgydF4y2Ba fgydF4y2Ba tgydF4y2Ba +gydF4y2Ba CgydF4y2Ba 。gydF4y2Ba

对目标函数进行泰勒展开来获得gydF4y2Ba (6)gydF4y2Ba lgydF4y2Ba tgydF4y2Ba ≅gydF4y2Ba ∑gydF4y2Ba 我gydF4y2Ba =gydF4y2Ba 1gydF4y2Ba ngydF4y2Ba lgydF4y2Ba ygydF4y2Ba 我gydF4y2Ba ,gydF4y2Ba ygydF4y2Ba ∧gydF4y2Ba 我gydF4y2Ba tgydF4y2Ba −gydF4y2Ba 1gydF4y2Ba +gydF4y2Ba ggydF4y2Ba 我gydF4y2Ba fgydF4y2Ba 我gydF4y2Ba xgydF4y2Ba 我gydF4y2Ba +gydF4y2Ba 1gydF4y2Ba 2gydF4y2Ba hgydF4y2Ba 我gydF4y2Ba fgydF4y2Ba 我gydF4y2Ba 2gydF4y2Ba xgydF4y2Ba 我gydF4y2Ba +gydF4y2Ba ΩgydF4y2Ba fgydF4y2Ba tgydF4y2Ba ,gydF4y2Ba 在哪里gydF4y2Ba ggydF4y2Ba 我gydF4y2Ba =gydF4y2Ba ∂gydF4y2Ba ygydF4y2Ba ∧gydF4y2Ba 我gydF4y2Ba tgydF4y2Ba −gydF4y2Ba 1gydF4y2Ba lgydF4y2Ba ygydF4y2Ba 我gydF4y2Ba ,gydF4y2Ba ygydF4y2Ba ∧gydF4y2Ba 我gydF4y2Ba tgydF4y2Ba −gydF4y2Ba 1gydF4y2Ba 损失函数的一阶导数和吗gydF4y2Ba hgydF4y2Ba 我gydF4y2Ba =gydF4y2Ba ∂gydF4y2Ba ygydF4y2Ba ∧gydF4y2Ba 我gydF4y2Ba tgydF4y2Ba −gydF4y2Ba 1gydF4y2Ba 2gydF4y2Ba lgydF4y2Ba ygydF4y2Ba 我gydF4y2Ba ,gydF4y2Ba ygydF4y2Ba ∧gydF4y2Ba 我gydF4y2Ba tgydF4y2Ba −gydF4y2Ba 1gydF4y2Ba 损失函数的二阶导数。gydF4y2Ba

因此,只需要计算gydF4y2Ba ggydF4y2Ba 我gydF4y2Ba 和gydF4y2Ba hgydF4y2Ba 我gydF4y2Ba 的损失函数值为每个步骤和优化目标函数得到gydF4y2Ba fgydF4y2Ba xgydF4y2Ba 对每一个步骤。最后,一个最优的整体模型是基于叠加法获得。gydF4y2Ba

2.2。贝叶斯Hyperparameters的优化gydF4y2Ba

当一个机器学习模型建立,hyperparameters需要提前确定。的选择hyperparameters对预测精度有显著影响。因此,重要的是要获得hyperparameters的最优组合。hyperparameters是一种典型的黑盒的优化优化问题。常用的优化方法包括网格搜索(GS),随机搜索(RS)、遗传算法(GA),算法和贝叶斯优化(gydF4y2Ba 44gydF4y2Ba]。遗传算法和PSO算法需要足够数量的初始样本点和不是非常高效的优化。目前,GS、RS和贝叶斯优化是最常见的方法。GS方法需要遍历所有可能的参数组合,这是非常耗时的大数据量和许多hyperparameter维度。相比之下,RS随机样本hyperparameters在一定范围和选择他们通过比较不同组合的性能,不保证会得到最优组合。此外,每个hyperparameter的GS和RS是独立计算的组合。当前计算不使用搜索点的结果,但这些信息指导搜索过程,可以提高结果的质量和搜索速度。相比之下,贝叶斯优化选择最有前途的hyperparameters通过评估过去的结果,使适当的选择hyperparameters比RS方法(用更少的迭代gydF4y2Ba 45gydF4y2Ba,gydF4y2Ba 46gydF4y2Ba]。从理论上讲,贝叶斯优化解决了目标函数的全局最优解:gydF4y2Ba (7)gydF4y2Ba xgydF4y2Ba ∗gydF4y2Ba =gydF4y2Ba argmingydF4y2Ba xgydF4y2Ba ∈gydF4y2Ba XgydF4y2Ba fgydF4y2Ba xgydF4y2Ba ,gydF4y2Ba 在哪里gydF4y2Ba xgydF4y2Ba 表示hyperparameters优化,gydF4y2Ba XgydF4y2Ba 是集hyperparameters优化,gydF4y2Ba fgydF4y2Ba xgydF4y2Ba 是目标函数,gydF4y2Ba xgydF4y2Ba ∗gydF4y2Ba 是hyperparameters的最优组合。贝叶斯优化算法的核心包括两个部分:首先,后验概率分布计算是基于过去的结果使用地质雷达获取的预期均值和方差hyperparameters在每个采样点。第二,收购构造函数来确定下一个采样点基于后验分布。gydF4y2Ba

2.2.1。高斯过程gydF4y2Ba

高斯过程(GP)是一种泛化的多元高斯概率分布意味着定义的函数gydF4y2Ba 米gydF4y2Ba xgydF4y2Ba 和协方差函数gydF4y2Ba kgydF4y2Ba xgydF4y2Ba ,gydF4y2Ba xgydF4y2Ba ′gydF4y2Ba 。gydF4y2Ba (8)gydF4y2Ba 米gydF4y2Ba xgydF4y2Ba =gydF4y2Ba EgydF4y2Ba fgydF4y2Ba xgydF4y2Ba ,gydF4y2Ba (9)gydF4y2Ba kgydF4y2Ba xgydF4y2Ba ,gydF4y2Ba xgydF4y2Ba ′gydF4y2Ba =gydF4y2Ba EgydF4y2Ba fgydF4y2Ba xgydF4y2Ba −gydF4y2Ba 米gydF4y2Ba xgydF4y2Ba fgydF4y2Ba xgydF4y2Ba ′gydF4y2Ba −gydF4y2Ba 米gydF4y2Ba xgydF4y2Ba ′gydF4y2Ba 。gydF4y2Ba

全科医生可以表示为gydF4y2Ba (10)gydF4y2Ba fgydF4y2Ba xgydF4y2Ba ∽gydF4y2Ba 全科医生gydF4y2Ba 米gydF4y2Ba xgydF4y2Ba ,gydF4y2Ba kgydF4y2Ba xgydF4y2Ba ,gydF4y2Ba xgydF4y2Ba ′gydF4y2Ba 。gydF4y2Ba

为了方便在实际应用程序中,我们之前的意思是函数是0。存在一个高斯分布的满足感gydF4y2Ba (11)gydF4y2Ba pgydF4y2Ba fgydF4y2Ba ∣gydF4y2Ba XgydF4y2Ba ,gydF4y2Ba θgydF4y2Ba =gydF4y2Ba NgydF4y2Ba 0gydF4y2Ba ,gydF4y2Ba KgydF4y2Ba XgydF4y2Ba ,gydF4y2Ba XgydF4y2Ba 。gydF4y2Ba

的协方差矩阵gydF4y2Ba KgydF4y2Ba XgydF4y2Ba ,gydF4y2Ba XgydF4y2Ba 可以表示为gydF4y2Ba (12)gydF4y2Ba KgydF4y2Ba XgydF4y2Ba ,gydF4y2Ba XgydF4y2Ba =gydF4y2Ba kgydF4y2Ba xgydF4y2Ba 1gydF4y2Ba ,gydF4y2Ba xgydF4y2Ba 1gydF4y2Ba ⋯gydF4y2Ba kgydF4y2Ba xgydF4y2Ba 1gydF4y2Ba ,gydF4y2Ba xgydF4y2Ba ngydF4y2Ba ⋮gydF4y2Ba ⋱gydF4y2Ba ⋮gydF4y2Ba kgydF4y2Ba xgydF4y2Ba ngydF4y2Ba ,gydF4y2Ba xgydF4y2Ba 1gydF4y2Ba ⋯gydF4y2Ba kgydF4y2Ba xgydF4y2Ba ngydF4y2Ba ,gydF4y2Ba xgydF4y2Ba ngydF4y2Ba 。gydF4y2Ba

相应的协方差函数可以表示为gydF4y2Ba (13)gydF4y2Ba kgydF4y2Ba xgydF4y2Ba ,gydF4y2Ba xgydF4y2Ba ′gydF4y2Ba =gydF4y2Ba 经验值gydF4y2Ba −gydF4y2Ba xgydF4y2Ba −gydF4y2Ba xgydF4y2Ba ′gydF4y2Ba 2gydF4y2Ba 2gydF4y2Ba 。gydF4y2Ba

根据医生的性质,添加后样品gydF4y2Ba XgydF4y2Ba ∗gydF4y2Ba 预测,新的高斯分布可以表示为gydF4y2Ba (14)gydF4y2Ba fgydF4y2Ba fgydF4y2Ba ∗gydF4y2Ba ∽gydF4y2Ba NgydF4y2Ba 0gydF4y2Ba ,gydF4y2Ba KgydF4y2Ba XgydF4y2Ba ,gydF4y2Ba XgydF4y2Ba KgydF4y2Ba XgydF4y2Ba ,gydF4y2Ba XgydF4y2Ba ∗gydF4y2Ba KgydF4y2Ba XgydF4y2Ba ∗gydF4y2Ba ,gydF4y2Ba XgydF4y2Ba KgydF4y2Ba XgydF4y2Ba ∗gydF4y2Ba ,gydF4y2Ba XgydF4y2Ba ∗gydF4y2Ba 。gydF4y2Ba

然后,联合后验分布gydF4y2Ba fgydF4y2Ba ∗gydF4y2Ba 是gydF4y2Ba (15)gydF4y2Ba pgydF4y2Ba fgydF4y2Ba ∗gydF4y2Ba ∣gydF4y2Ba XgydF4y2Ba ,gydF4y2Ba fgydF4y2Ba ,gydF4y2Ba XgydF4y2Ba ∗gydF4y2Ba =gydF4y2Ba NgydF4y2Ba fgydF4y2Ba ∗gydF4y2Ba ,gydF4y2Ba 浸gydF4y2Ba fgydF4y2Ba ∗gydF4y2Ba 。gydF4y2Ba

通过评估均值和协方差矩阵,gydF4y2Ba fgydF4y2Ba ∗gydF4y2Ba 可以从联合后验分布采样。gydF4y2Ba

2.2.2。采集功能gydF4y2Ba

收购功能决定了下一个采样点基于后验概率的结果代理模型。通常,选择采样点的采集功能需要探索新领域的目标空间,利用已知的地区。开发是指寻找全局最优的解决方案基于当前最优解来改善目标函数的平均值。探索是指检测未鉴定的采样点,以减少目标函数的不确定性。当医生作为概率代理模型、改进的四个常用的采集功能包括概率(π),熵搜索(ES),上层信心绑定(UCB),和预期的改善(EI) [gydF4y2Ba 45gydF4y2Ba]。在这篇文章中,EI选为采集功能;它的数学表达式gydF4y2Ba (16)gydF4y2Ba 一个gydF4y2Ba EIgydF4y2Ba xgydF4y2Ba =gydF4y2Ba EgydF4y2Ba 马克斯gydF4y2Ba 0gydF4y2Ba ,gydF4y2Ba fgydF4y2Ba ′gydF4y2Ba −gydF4y2Ba fgydF4y2Ba xgydF4y2Ba ∣gydF4y2Ba xgydF4y2Ba ,gydF4y2Ba DgydF4y2Ba ,gydF4y2Ba 在哪里gydF4y2Ba DgydF4y2Ba =gydF4y2Ba XgydF4y2Ba ,gydF4y2Ba θgydF4y2Ba 代表了观察和gydF4y2Ba fgydF4y2Ba ′gydF4y2Ba 的最小值是当前的观察gydF4y2Ba fgydF4y2Ba 。gydF4y2Ba

2.3。TOC预测过程gydF4y2Ba

TOC的流程图预测基于贝叶斯优化XGBoost模型如图gydF4y2Ba 1gydF4y2Ba。它包含三个部分,即数据预处理、模型建立和模型应用程序描述如下。gydF4y2Ba

数据预处理:我们首先收集core-measured TOC数据和相应的测井数据。数据depth-corrected outlier-processed,和归一化,然后,测井相关TOC预测选择作为机器学习输入特性使用线性回归交会图和皮尔逊相关系数技术。最后,处理数据随机分为训练集和测试集使用一个适当的规则gydF4y2Ba

模型建立:然后我们建立初始的XGBoost模型和优化模型的hyperparameters使用贝叶斯优化算法gydF4y2Ba

模型应用程序:最优XGBoost模型应用于未使用的测井预测TOC含量gydF4y2Ba

流程图的TOC使用贝叶斯优化XGBoost模型预测。gydF4y2Ba

3所示。地质设置和数据分析gydF4y2Ba 3.1。研究区域gydF4y2Ba

古宇位于北部渤海湾盆地辽河萧条的东北地区,覆盖约800公里的区域gydF4y2Ba2gydF4y2Ba(图gydF4y2Ba 2gydF4y2Ba(a))。这是一个新生代陆相沉积凹陷发达的地下室太古代变质岩和元古代碳酸盐岩。从结构上讲,它有一个不规则的三角形中更广泛的南部和北部的窄和有界三大缺点。主要的烃源岩是油页岩发育暗色泥岩戏剧扮演的第四个成员和第三位成员的下第三系沙河街组地层(EgydF4y2Ba2gydF4y2Ba年代gydF4y2Ba4gydF4y2BaEgydF4y2Ba2gydF4y2Ba年代gydF4y2Ba3gydF4y2Ba)。本研究的目标形成E的较低的次要成分gydF4y2Ba2gydF4y2Ba年代gydF4y2Ba4gydF4y2Ba(EgydF4y2Ba2gydF4y2Ba年代gydF4y2Ba4gydF4y2BalgydF4y2Ba),位于古宇(图的中心区域gydF4y2Ba 2gydF4y2Ba(b)),占地面积约200公里gydF4y2Ba2gydF4y2Ba。在137口井钻在EgydF4y2Ba2gydF4y2Ba年代gydF4y2Ba4gydF4y2BalgydF4y2Ba形成良好的油气条件观察在53个井,和4井提供工业石油生产。gydF4y2Ba

研究区域的位置。gydF4y2Ba

在E的沉积gydF4y2Ba2gydF4y2Ba年代gydF4y2Ba4gydF4y2BalgydF4y2Ba,湖水平振荡引起的构造运动导致循环沉积环境的变化,以及形成的岩性(图显示了“三明治”特征gydF4y2Ba 3gydF4y2Ba)。上部是EgydF4y2Ba2gydF4y2Ba年代gydF4y2Ba4gydF4y2BalgydF4y2Ba我集团以黑暗石油页岩和砂岩薄层的局部观察。中间部分是EgydF4y2Ba2gydF4y2Ba年代gydF4y2Ba4gydF4y2BalgydF4y2Ba——集团是由粉砂岩和泥质白云岩。下方是EgydF4y2Ba2gydF4y2Ba年代gydF4y2Ba4gydF4y2BalgydF4y2Ba第三组,闰石油页岩、泥灰岩和白云岩。的总厚度EgydF4y2Ba2gydF4y2Ba年代gydF4y2Ba4gydF4y2BalgydF4y2Ba从20米到220米不等,TOC含量范围从2%到12.8%,gydF4y2Ba RgydF4y2Ba 0gydF4y2Ba 范围从0.4到0.6%,有机质主要是I型,与某些类型IIgydF4y2Ba1gydF4y2Ba和第二gydF4y2Ba2gydF4y2Ba。生烃强度gydF4y2Ba 4200年gydF4y2Ba ×gydF4y2Ba 10gydF4y2Ba 4gydF4y2Ba tgydF4y2Ba /gydF4y2Ba kgydF4y2Ba 米gydF4y2Ba 2gydF4y2Ba 。最新的预测显示,EgydF4y2Ba2gydF4y2Ba年代gydF4y2Ba4gydF4y2BalgydF4y2Ba形成了gydF4y2Ba 20.9gydF4y2Ba ×gydF4y2Ba 10gydF4y2Ba 8gydF4y2Ba tgydF4y2Ba 页岩油开采油气资源,展示重要的潜力(gydF4y2Ba 47gydF4y2Ba]。gydF4y2Ba

地质剖面的EgydF4y2Ba2gydF4y2Ba年代gydF4y2Ba4gydF4y2BalgydF4y2Ba次要成分研究的领域。gydF4y2Ba

3.2。数据分析gydF4y2Ba

在这项研究中使用的数据从关键勘探S352,由测井数据和core-measured TOC数据。S352是钻从3150年到3352遇到EgydF4y2Ba2gydF4y2Ba年代gydF4y2Ba4gydF4y2BalgydF4y2Ba形成,145.92米的密闭取心深度3169 - 3348.97完成,获得的核心长度122.47米,核心回收率83.9%。共有107个实验核心样本获得nonequal间隔在这个核心部分(3169 - 3348.97)。Leco碳和硫分析仪用于测量TOC内容根据国家标准GB / T 191452003 - 104有效TOC数据点。可用常规测井包括GR、自然电位(SP),以及直径(CAL)中子(CNL),窝,运输时间(AC),理查德·道金斯,和自然伽马能谱(U, TH, K)。使用前数据,深度校正和离群值过滤进行以确保core-measured TOC数据和测井数据一一对应。表gydF4y2Ba 1gydF4y2Ba显示日志预处理的分布特征,包括均值、最大值和最小值,标准差,偏态和峰态。可以看出,大部分的测井曲线满足高斯分布,除了RD,有一个很大的偏差。因此,我们应用一个对数变换的RD数据在使用前。gydF4y2Ba

统计分析的结果好S352好日志。gydF4y2Ba

GRgydF4y2Ba 理查德·道金斯gydF4y2Ba 交流gydF4y2Ba 窝gydF4y2Ba 补偿中子测井gydF4y2Ba UgydF4y2Ba THgydF4y2Ba KgydF4y2Ba TOCgydF4y2Ba
APIgydF4y2Ba 欧姆·米gydF4y2Ba μgydF4y2Bas /英国《金融时报》gydF4y2Ba 克/厘米gydF4y2Ba3gydF4y2Ba %gydF4y2Ba ppmgydF4y2Ba ppmgydF4y2Ba %gydF4y2Ba wt. %gydF4y2Ba
的意思是gydF4y2Ba 53.34gydF4y2Ba 18.23gydF4y2Ba 91.56gydF4y2Ba 2.27gydF4y2Ba 36.84gydF4y2Ba 2.14gydF4y2Ba 6.99gydF4y2Ba 1.52gydF4y2Ba 4.11gydF4y2Ba
性病gydF4y2Ba 7.61gydF4y2Ba 41.11gydF4y2Ba 14.19gydF4y2Ba 0.17gydF4y2Ba 7.41gydF4y2Ba 0.71gydF4y2Ba 1.78gydF4y2Ba 0.56gydF4y2Ba 2.37gydF4y2Ba
马克斯gydF4y2Ba 70.73gydF4y2Ba 1.76gydF4y2Ba 117.95gydF4y2Ba 2.64gydF4y2Ba 49.23gydF4y2Ba 3.97gydF4y2Ba 10.27gydF4y2Ba 3.50gydF4y2Ba 10.18gydF4y2Ba
最小值gydF4y2Ba 29.68gydF4y2Ba 296.08gydF4y2Ba 62.80gydF4y2Ba 1.96gydF4y2Ba 19.89gydF4y2Ba 0.63gydF4y2Ba 2.45gydF4y2Ba 0.52gydF4y2Ba 0.29gydF4y2Ba
偏态gydF4y2Ba -0.52gydF4y2Ba 5.80gydF4y2Ba -0.42gydF4y2Ba 0.47gydF4y2Ba -0.57gydF4y2Ba 0.26gydF4y2Ba -0.39gydF4y2Ba 1.33gydF4y2Ba 0.39gydF4y2Ba
峰度gydF4y2Ba 1.64gydF4y2Ba 35.71gydF4y2Ba -0.81gydF4y2Ba -0.55gydF4y2Ba -0.61gydF4y2Ba -0.25gydF4y2Ba -0.12gydF4y2Ba 2.07gydF4y2Ba -0.49gydF4y2Ba

交会图分析创建core-measured TOC之间的相关内容和日志,和线性回归是用来适应数据。确定系数(gydF4y2Ba RgydF4y2Ba 2gydF4y2Ba )计算评估线性模型的拟合优度。它被定义为gydF4y2Ba (17)gydF4y2Ba RgydF4y2Ba 2gydF4y2Ba =gydF4y2Ba 1gydF4y2Ba −gydF4y2Ba ∑gydF4y2Ba 我gydF4y2Ba =gydF4y2Ba 1gydF4y2Ba ngydF4y2Ba ygydF4y2Ba 我gydF4y2Ba −gydF4y2Ba ygydF4y2Ba ∧gydF4y2Ba 我gydF4y2Ba 2gydF4y2Ba ∑gydF4y2Ba 我gydF4y2Ba =gydF4y2Ba 1gydF4y2Ba ngydF4y2Ba ygydF4y2Ba 我gydF4y2Ba −gydF4y2Ba ygydF4y2Ba ¯gydF4y2Ba 我gydF4y2Ba 2gydF4y2Ba 。gydF4y2Ba

交会图如图gydF4y2Ba 4gydF4y2Ba。可以看出AC,补偿中子测井,RD, GR, TH, U有积极与TOC含量的线性关系。gydF4y2Ba RgydF4y2Ba 2gydF4y2Ba 交流是最高(0.3431),其次是CNL (0.2984)。RD之间的线性关系,GR、TH和TOC含量较弱gydF4y2Ba RgydF4y2Ba 2gydF4y2Ba 值为0.0408、0.0112和0.0957,分别。书房和钾(K)有负面与TOC含量的线性关系,与更高gydF4y2Ba RgydF4y2Ba 2gydF4y2Ba 窝(0.2805)和低gydF4y2Ba RgydF4y2Ba 2gydF4y2Ba K (0.1002)。gydF4y2Ba

core-measured TOC之间的交会图和日志:(一)RD-TOC AC-TOC (b), (c) DEN-TOC, (d) CNL-TOC, (e) GR-TOC U-TOC (f) (g) TH-TOC, K-TOC (h)。gydF4y2Ba

多源数据,皮尔森相关系数计算测量的测井数据之间的线性相关程度和TOC的内容。计算使用gydF4y2Ba (18)gydF4y2Ba pgydF4y2Ba xgydF4y2Ba ,gydF4y2Ba ygydF4y2Ba =gydF4y2Ba 浸gydF4y2Ba xgydF4y2Ba ,gydF4y2Ba ygydF4y2Ba σgydF4y2Ba xgydF4y2Ba σgydF4y2Ba ygydF4y2Ba ,gydF4y2Ba

在哪里gydF4y2Ba pgydF4y2Ba xgydF4y2Ba ,gydF4y2Ba ygydF4y2Ba 反映了变量之间的线性相关程度gydF4y2Ba xgydF4y2Ba 和gydF4y2Ba ygydF4y2Ba ,gydF4y2Ba 浸gydF4y2Ba xgydF4y2Ba ,gydF4y2Ba ygydF4y2Ba 协方差的变量gydF4y2Ba xgydF4y2Ba 和gydF4y2Ba ygydF4y2Ba ,gydF4y2Ba σgydF4y2Ba xgydF4y2Ba 的标准偏差gydF4y2Ba xgydF4y2Ba ,gydF4y2Ba σgydF4y2Ba ygydF4y2Ba 的标准偏差gydF4y2Ba ygydF4y2Ba 。gydF4y2Ba

变量之间的相关性评估通过创建一个热图的皮尔森相关系数。如图gydF4y2Ba 5gydF4y2Ba,相关系数表示的值gydF4y2Ba pgydF4y2Ba xgydF4y2Ba ,gydF4y2Ba ygydF4y2Ba 。一个负数代表负相关,正数代表正相关,0表示没有相关性,和一个值接近1或1显示出很强的相关性。可以看出,最高的相关性之间发生交流和TOC(0.59),其次是补偿中子测井(0.55)和窝(-0.53),分别。之间的相关性GR、U和TOC是相对贫穷(分别为0.02和0.07)。gydF4y2Ba

热图的皮尔森相关系数。gydF4y2Ba

总之,所有的测井与TOC含量显著相关。然而,结果提供测井数据的排名根据他们与core-measured TOC的内容。因此,我们可以确定并删除不相关和冗余功能的训练数据集,降低模型的复杂度,减少输入数据的维数,并提高模型的效率(gydF4y2Ba 37gydF4y2Ba]。根据结果,因此,我们选择了六个日志(AC,窝、补偿中子测井、K、TH和RD)作为输入训练功能。gydF4y2Ba

4所示。模型性能的评价方法gydF4y2Ba 4.1。< inline-formula > < mml:数学xmlns: mml = " http://www.w3.org/1998/Math/MathML " id = "还有M78 " > < mml: mi > K < / mml: mi > < / mml:数学> < / inline-formula >倍交叉验证(简历)gydF4y2Ba

在机器学习中,数据通常是随机分为三个部分:训练集,测试集和验证集。然而,我们有很少带安全标签的数据点,导致强烈的不确定性在使用小验证数据集来评估模型的性能和鲁棒性。最优方法来避免这个问题gydF4y2Ba KgydF4y2Ba 倍的履历。数据集分成gydF4y2Ba KgydF4y2Ba 部分,对于每一次迭代,gydF4y2Ba KgydF4y2Ba −gydF4y2Ba 1gydF4y2Ba 部分被用作训练集,其余部分作为测试集,获得gydF4y2Ba KgydF4y2Ba 模型。的gydF4y2Ba KgydF4y2Ba 倍简历利用所有数据,大大提高了模型的学习能力,并提高了模型的鲁棒性。本文建议后Zhang et al。gydF4y2Ba 48gydF4y2Ba和黄gydF4y2Ba 49gydF4y2Ba),折数gydF4y2Ba KgydF4y2Ba 设置为5和有关计算时间和偏见之间的权衡(图gydF4y2Ba 6gydF4y2Ba)。gydF4y2Ba

5倍交叉验证。gydF4y2Ba

4.2。模型的比较gydF4y2Ba

我们比较XGBoost模型的性能与其他机器学习算法。选择四种方法,即、射频、支持向量机gydF4y2Ba KgydF4y2Ba 最近的邻居(资讯)和多元线性回归(高)。这些算法的详细描述可以在书中找到的Mohri et al。gydF4y2Ba 50gydF4y2Ba]。每台机器的hyperparameters使用贝叶斯学习算法确定优化方法,以确保公平。此外,我们使用最广泛gydF4y2Ba ΔgydF4y2Ba 日志gydF4y2Ba RgydF4y2Ba 方法比较。该方法覆盖RD登录对数坐标和算术坐标计算的孔隙度日志TOC含量富含有机物页岩,分开的两个日志。两者的区别日志,gydF4y2Ba ΔgydF4y2Ba 日志gydF4y2Ba RgydF4y2Ba ,然后使用经验gydF4y2Ba (19)gydF4y2Ba ΔgydF4y2Ba 日志gydF4y2Ba RgydF4y2Ba =gydF4y2Ba 日志gydF4y2Ba 10gydF4y2Ba RgydF4y2Ba RgydF4y2Ba 基线gydF4y2Ba +gydF4y2Ba 0.02gydF4y2Ba ΔgydF4y2Ba tgydF4y2Ba −gydF4y2Ba ΔgydF4y2Ba tgydF4y2Ba 基线gydF4y2Ba ,gydF4y2Ba 在哪里gydF4y2Ba RgydF4y2Ba 电阻率(gydF4y2Ba ΩgydF4y2Ba·米),gydF4y2Ba ΔgydF4y2Ba tgydF4y2Ba 是衡量交通时间(gydF4y2Ba μgydF4y2Bas /英尺)gydF4y2Ba RgydF4y2Ba 基线gydF4y2Ba 和gydF4y2Ba ΔgydF4y2Ba tgydF4y2Ba 基线gydF4y2Ba 电阻率和渡越时间值,分别在两个日志重叠的基线organic-deficient区。gydF4y2Ba

的gydF4y2Ba ΔgydF4y2Ba 日志gydF4y2Ba RgydF4y2Ba 和有机成熟度是用来确定富含有机物的TOC含量区,如图所示gydF4y2Ba (20)gydF4y2Ba TOCgydF4y2Ba =gydF4y2Ba ΔgydF4y2Ba 日志gydF4y2Ba RgydF4y2Ba ×gydF4y2Ba 10gydF4y2Ba 2.297gydF4y2Ba −gydF4y2Ba 0.1688gydF4y2Ba LOMgydF4y2Ba +gydF4y2Ba ΔgydF4y2Ba TOCgydF4y2Ba ,gydF4y2Ba 在哪里gydF4y2Ba LOMgydF4y2Ba 是有机成熟度水平。gydF4y2Ba ΔgydF4y2Ba TOCgydF4y2Ba 富含有机物页岩TOC内容背景水平。gydF4y2Ba

4.3。评估标准gydF4y2Ba

除了gydF4y2Ba RgydF4y2Ba 2gydF4y2Ba ,我们选择了均方根误差(RMSE),平均绝对误差(MAE)和平均绝对百分误差(日军)来评估模型的性能。这些标准定义如下:gydF4y2Ba (21)gydF4y2Ba RgydF4y2Ba 米gydF4y2Ba 年代gydF4y2Ba EgydF4y2Ba =gydF4y2Ba 1gydF4y2Ba ngydF4y2Ba ∑gydF4y2Ba 我gydF4y2Ba =gydF4y2Ba 1gydF4y2Ba ngydF4y2Ba ygydF4y2Ba 我gydF4y2Ba −gydF4y2Ba ygydF4y2Ba ∧gydF4y2Ba 我gydF4y2Ba 2gydF4y2Ba ,gydF4y2Ba (22)gydF4y2Ba 米gydF4y2Ba 一个gydF4y2Ba EgydF4y2Ba =gydF4y2Ba 1gydF4y2Ba ngydF4y2Ba ∑gydF4y2Ba 我gydF4y2Ba =gydF4y2Ba 1gydF4y2Ba ngydF4y2Ba ygydF4y2Ba 我gydF4y2Ba −gydF4y2Ba ygydF4y2Ba ∧gydF4y2Ba 我gydF4y2Ba ,gydF4y2Ba (23)gydF4y2Ba 日军gydF4y2Ba =gydF4y2Ba 1gydF4y2Ba ngydF4y2Ba ∑gydF4y2Ba 我gydF4y2Ba =gydF4y2Ba 1gydF4y2Ba ngydF4y2Ba ygydF4y2Ba 我gydF4y2Ba −gydF4y2Ba ygydF4y2Ba ∧gydF4y2Ba 我gydF4y2Ba 马克斯gydF4y2Ba εgydF4y2Ba ,gydF4y2Ba ygydF4y2Ba 我gydF4y2Ba ,gydF4y2Ba 在哪里gydF4y2Ba ygydF4y2Ba 我gydF4y2Ba 是真正的价值,gydF4y2Ba ygydF4y2Ba 我gydF4y2Ba ∧gydF4y2Ba 预测的价值,gydF4y2Ba ϵgydF4y2Ba 是一个积极的最小值,gydF4y2Ba ngydF4y2Ba 是样品的数量。gydF4y2Ba

5。结果与讨论gydF4y2Ba

在这项研究中,采用5倍CV测试模型的性能和鲁棒性。代码实现微机与英特尔酷睿i7 - 7700和32 GB RAM和CPU Windows 10系统。Python编程语言。支持向量机,然而,高钙,射频模型中实现开源Scikit-learn机器学习包。我们使用了开源XGBoost工具包XGBoost算法运行,和gydF4y2Ba △gydF4y2Ba 日志gydF4y2Ba RgydF4y2Ba 方法代码是作者写的。gydF4y2Ba

5.1。模型性能的比较gydF4y2Ba

数据集被随机分为训练集和测试集的5倍的履历。所有数据归一化,消除单位的影响和规模不同的测井参数之间的区别。预测和core-measured TOC含量的交会图如图所示gydF4y2Ba 7gydF4y2Ba;实线是1:1线,虚线是线性回归直线。应该指出的是,gydF4y2Ba ΔgydF4y2Ba 日志gydF4y2Ba RgydF4y2Ba 所有可用的数据用于分析方法,没有使用5倍的简历。结果表明,XGBoost模型的预测性能,最好gydF4y2Ba RgydF4y2Ba 2gydF4y2Ba 到0.9135分,接下来是RMF的模型gydF4y2Ba RgydF4y2Ba 2gydF4y2Ba 0.8931的价值gydF4y2Ba ΔgydF4y2Ba 日志gydF4y2Ba RgydF4y2Ba 方法用一个gydF4y2Ba RgydF4y2Ba 2gydF4y2Ba 值为0.8345。相比之下,其他三种方法平庸的预测性能,gydF4y2Ba RgydF4y2Ba 2gydF4y2Ba 值约为0.74。gydF4y2Ba

交会图预测的TOC和core-measured TOC内容:(a) XGBoost模型,(b)射频模式,(c)gydF4y2Ba △gydF4y2Ba 日志gydF4y2Ba RgydF4y2Ba 方法,(d)资讯模型,(e)支持向量机模型,模型(f)高。gydF4y2Ba

此外,我们比较了RMSE使用5倍的简历和日军的不同的方法。图gydF4y2Ba 8gydF4y2Ba显示了rms的测试集,这表明XGBoost rms和射频远低于其他的方法。此外,它可以推断出,XGBoost模型是最可靠的,因为它的RMSE值最低的在所有情况下,当除外gydF4y2Ba kgydF4y2Ba 是1。图gydF4y2Ba 9gydF4y2Ba显示了测试集的地图。在相对误差性能方面,XGBoost模型优于其他模型,最大日军值为16.14%gydF4y2Ba kgydF4y2Ba =gydF4y2Ba 4gydF4y2Ba ,最低为9.77%gydF4y2Ba kgydF4y2Ba =gydF4y2Ba 1gydF4y2Ba 日军,平均值为12.55%。第二好的模型是射频,最大日军值为17.18%gydF4y2Ba kgydF4y2Ba =gydF4y2Ba 4gydF4y2Ba ,最低为9.05%gydF4y2Ba kgydF4y2Ba =gydF4y2Ba 1gydF4y2Ba 日军,平均值为12.97%。支持向量机的日军大幅波动;最大值为22.86%,最小值为11.06%。的意思是日军价值资讯是16.49%。高钙的最低性能,与日军在每个测试值超过20%。gydF4y2Ba

RMSE 5倍交叉验证的结果。gydF4y2Ba

日军5倍交叉验证的结果。gydF4y2Ba

表gydF4y2Ba 2gydF4y2Ba列出了梅的平均值,RMSE,日军5倍的简历的不同的方法。梅的平均值、均方根误差和日军XGBoost模型0.63,0.77和12.55%,分别和每个值与其他方法相比是最低的。误差分析结果表明,XGBoost方法精度最高,比其他机器学习方法,提供一个重要的优势的gydF4y2Ba ΔgydF4y2Ba 日志gydF4y2Ba RgydF4y2Ba 方法,对TOC的预测。gydF4y2Ba

平均误差值为5倍的简历的不同方法。gydF4y2Ba

模型gydF4y2Ba 美gydF4y2Ba RMSEgydF4y2Ba 日军(%)gydF4y2Ba
XGBoostgydF4y2Ba 0.63gydF4y2Ba 0.77gydF4y2Ba 12.55gydF4y2Ba
射频gydF4y2Ba 0.71gydF4y2Ba 0.82gydF4y2Ba 12.97gydF4y2Ba
支持向量机gydF4y2Ba 0.71gydF4y2Ba 0.88gydF4y2Ba 16.21gydF4y2Ba
然而,gydF4y2Ba 0.82gydF4y2Ba 1.18gydF4y2Ba 16.42gydF4y2Ba
线性gydF4y2Ba 1.26gydF4y2Ba 1.52gydF4y2Ba 23.87gydF4y2Ba
ΔgydF4y2Ba 日志gydF4y2Ba RgydF4y2Ba 0.79gydF4y2Ba 1.07gydF4y2Ba 14.80gydF4y2Ba
5.2。模型验证gydF4y2Ba

我们选择好S352验证的预测结果的TOC含量不同的方法。日志,core-measured TOC数据和TOC曲线预测的不同的方法所示的数据gydF4y2Ba 10gydF4y2Ba和gydF4y2Ba 11gydF4y2Ba。第一个跟踪表示泥浆录井岩性、第二个跟踪日志显示了岩性指标,第三个跟踪是电阻率日志,第四跟踪日志显示了孔隙度、第五跑道是GR射线光谱日志,和6日至10日跟踪TOC曲线预测的gydF4y2Ba △gydF4y2Ba 日志gydF4y2Ba RgydF4y2Ba ,高钙,资讯,支持向量机、射频和XGBoost方法;红点代表core-measured TOC数据。gydF4y2Ba

比较不同方法的预测结果(EgydF4y2Ba2gydF4y2Ba年代gydF4y2Ba4gydF4y2BalgydF4y2Ba我集团)。gydF4y2Ba

比较不同方法的预测结果(EgydF4y2Ba2gydF4y2Ba年代gydF4y2Ba4gydF4y2BalgydF4y2Ba——集团和EgydF4y2Ba2gydF4y2Ba年代gydF4y2Ba4gydF4y2BalgydF4y2Ba第三组)。gydF4y2Ba

图gydF4y2Ba 10gydF4y2Ba显示了E的预测结果gydF4y2Ba2gydF4y2Ba年代gydF4y2Ba4gydF4y2BalgydF4y2Ba我组。3200到3150年间,石油页岩岩性,和测井的波动小,表明形成均匀性好。TOC曲线预测的所有方法与core-measured TOC内容高度相关,和趋势是相似的。然而,在3200年和3236之间,岩性开始改变。电阻率日志显示高电阻特性,core-measured TOC含量显著增加。的预测结果XGBoost、射频和gydF4y2Ba △gydF4y2Ba 日志gydF4y2Ba RgydF4y2Ba 与core-measured TOC方法是在良好的协议内容。相比之下,高钙的预测值,支持向量机,然而方法大大小于core-measured TOC含量。gydF4y2Ba

图gydF4y2Ba 11gydF4y2Ba显示了E的预测结果gydF4y2Ba2gydF4y2Ba年代gydF4y2Ba4gydF4y2BalgydF4y2Ba——和EgydF4y2Ba2gydF4y2Ba年代gydF4y2Ba4gydF4y2BalgydF4y2Ba第三组。的深度EgydF4y2Ba2gydF4y2Ba年代gydF4y2Ba4gydF4y2BalgydF4y2Ba——集团是3248 - 3278 m,岩性为泥质白云岩夹层之间的少量的油页岩。core-measured TOC含量从0.17%到3.84%不等,表明弱生烃潜力。不同方法的预测的准确性是高度可变的。XGBoost和射频方法预测精度高于其他方法。TOC值预测的gydF4y2Ba △gydF4y2Ba 日志gydF4y2Ba RgydF4y2Ba 方法明显大于core-measured TOC值。可能的原因是,这个玩不同的矿物成分很大,基本形成;因此,交流和RD日志大大受岩性的影响,不反映了有机质含量的变化。的深度EgydF4y2Ba2gydF4y2Ba年代gydF4y2Ba4gydF4y2BalgydF4y2Ba第三组是3278 - 3350。这组展示了非均质性强。石油页岩和泥质白云岩夹层之间的频繁,每一层的厚度小于3米。测井显示波动,TOC趋势尚不清楚。core-measured TOC含量从0.29%到9.77%不等。XGBoost方法提供了最高的协议与core-measured TOC数据,RF紧随其后。从获得的预测值gydF4y2Ba △gydF4y2Ba 日志gydF4y2Ba RgydF4y2Ba 、高钙、资讯和SVM方法大大低于core-measured TOC值。gydF4y2Ba

总的来说,预测结果好S352表明,贝叶斯优化XGBoost方法最可靠地执行非齐次的形成,提供最高的预测精度和良好的泛化能力。因此,这种方法更适合TOC预测湖泊页岩油比在这项研究中使用的其他方法。gydF4y2Ba

5.3。TOC分布的预测gydF4y2Ba

我们选择20油井钻在EgydF4y2Ba2gydF4y2Ba年代gydF4y2Ba4gydF4y2BalgydF4y2Ba形成预测使用XGBoost TOC内容模型。预测TOC的等高线地图内容的EgydF4y2Ba2gydF4y2Ba年代gydF4y2Ba4gydF4y2BalgydF4y2Ba- i, EgydF4y2Ba2gydF4y2Ba年代gydF4y2Ba4gydF4y2BalgydF4y2Ba——、EgydF4y2Ba2gydF4y2Ba年代gydF4y2Ba4gydF4y2BalgydF4y2Ba第三组在研究区域如图gydF4y2Ba 12gydF4y2Ba。在EgydF4y2Ba2gydF4y2Ba年代gydF4y2Ba4gydF4y2BalgydF4y2Ba我集团,TOC含量相对较高的西边的A10-A49-A95(> 4%),和附近的最高价值发生S166 (> 6%)。一个TOC含量超过4%的面积是73公里gydF4y2Ba2gydF4y2Ba(图gydF4y2Ba 12(一个)gydF4y2Ba)。在EgydF4y2Ba2gydF4y2Ba年代gydF4y2Ba4gydF4y2BalgydF4y2Ba——集团TOC含量相对较低,从1.5%到3.1%不等。TOC值大于2%的区域覆盖115公里gydF4y2Ba2gydF4y2Ba(图gydF4y2Ba 12 (b)gydF4y2Ba)。在EgydF4y2Ba2gydF4y2Ba年代gydF4y2Ba4gydF4y2BalgydF4y2Ba第三组,TOC含量大于4%的地区附近井S224, A49, A104, Sh25 Sh17,面积23公里gydF4y2Ba2gydF4y2Ba。TOC其他领域的内容是低于4%(图gydF4y2Ba 12 (c)gydF4y2Ba)。垂直,EgydF4y2Ba2gydF4y2Ba年代gydF4y2Ba4gydF4y2BalgydF4y2Ba我集团TOC含量最高,其次是EgydF4y2Ba2gydF4y2Ba年代gydF4y2Ba4gydF4y2BalgydF4y2Ba第三组和EgydF4y2Ba2gydF4y2Ba年代gydF4y2Ba4gydF4y2BalgydF4y2Ba——集团。水平、优质烃源岩主要分布在研究区西部斜坡和其他地区的零星。gydF4y2Ba

等高线地图预测的TOC内容:(a) EgydF4y2Ba2gydF4y2Ba年代gydF4y2Ba4gydF4y2BalgydF4y2Ba我集团(b) EgydF4y2Ba2gydF4y2Ba年代gydF4y2Ba4gydF4y2BalgydF4y2Ba——集团和(c) EgydF4y2Ba2gydF4y2Ba年代gydF4y2Ba4gydF4y2BalgydF4y2Ba第三组。gydF4y2Ba

6。结论gydF4y2Ba

我们提出一个健壮的数据驱动的贝叶斯优化XGBoost模型来预测TOC内容使用有线日志数据。从古宇获得数据,渤海湾盆地,中国,包括日志和core-measured TOC数据。线性回归得到了交会图,皮尔森相关系数计算评价之间的关系以及日志和core-measured TOC数据。结果表明,没有一个日志TOC含量有显著相关性。然而,相关分析使我们能够识别和移除不相关和冗余为TOC测井特性预测和减少模型的复杂性,通过减少输入数据的维数。使用5倍CV模型性能评估。四个标准的量化误差分析表明,该方法性能比传统的方法(gydF4y2Ba ΔgydF4y2Ba 日志gydF4y2Ba RgydF4y2Ba ),gydF4y2Ba RgydF4y2Ba 2gydF4y2Ba 从0.8345增长到0.9135美,RMSE,和日军减少0.79,1.07,14.80%,至0.63,0.77和12.55%,分别。此外,XGBoost模型优于其他流行的机器学习算法(即。、射频、支持向量机然而,,和米lR) in terms of robustness, accuracy, and generalization in predicting TOC for strongly nonhomogeneous lacustrine shale plays. We used the proposed approach for the TOC prediction of 20 exploration wells in the Damintun Sag and obtained contour maps of the TOC content in the E2gydF4y2Ba年代gydF4y2Ba4gydF4y2BalgydF4y2Ba形成。启用了地图识别具有较高的生烃潜力的领域,这是有用的寻找甜蜜点。一般来说,机器学习广泛依赖于训练数据的质量和数量。随着新的勘探时,应该添加额外的数据实时改善可靠性和模型的泛化能力。在未来,我们打算创建一个数据库的机器学习。除了预测TOC含量,该数据库可以用来预测其他岩石物性和地质属性的水库。gydF4y2Ba

缩写gydF4y2Ba 交流:gydF4y2Ba

声波测井gydF4y2Ba

安:gydF4y2Ba

人工神经网络gydF4y2Ba

卡尔:gydF4y2Ba

井径测井gydF4y2Ba

购物车:gydF4y2Ba

分类和回归树gydF4y2Ba

补偿中子测井:gydF4y2Ba

中子测井gydF4y2Ba

窝:gydF4y2Ba

密度测井gydF4y2Ba

EI:gydF4y2Ba

预期改善gydF4y2Ba

榆树:gydF4y2Ba

极端的学习机器gydF4y2Ba

ES:gydF4y2Ba

熵的搜索gydF4y2Ba

遗传算法:gydF4y2Ba

遗传算法gydF4y2Ba

GBDT:gydF4y2Ba

梯度提高决策树gydF4y2Ba

医生:gydF4y2Ba

高斯过程gydF4y2Ba

探地雷达:gydF4y2Ba

高斯过程回归gydF4y2Ba

格:gydF4y2Ba

自然伽马测井gydF4y2Ba

g:gydF4y2Ba

网格搜索gydF4y2Ba

凯西:gydF4y2Ba

钾的日志gydF4y2Ba

资讯:gydF4y2Ba

KgydF4y2Ba 最近的邻居gydF4y2Ba

梅:gydF4y2Ba

平均绝对误差gydF4y2Ba

日军:gydF4y2Ba

平均绝对误差百分比gydF4y2Ba

高:gydF4y2Ba

多元线性回归gydF4y2Ba

PI:gydF4y2Ba

改进的概率gydF4y2Ba

算法:gydF4y2Ba

粒子群优化gydF4y2Ba

RgydF4y2Ba 2gydF4y2Ba :gydF4y2Ba

确定系数gydF4y2Ba

理查德·道金斯:gydF4y2Ba

深电阻率测井gydF4y2Ba

射频:gydF4y2Ba

随机森林gydF4y2Ba

RMSE:gydF4y2Ba

均方根误差gydF4y2Ba

转:gydF4y2Ba

岩石物理模型gydF4y2Ba

拉尔夫-舒马赫:gydF4y2Ba

随机搜索gydF4y2Ba

SP:gydF4y2Ba

自然电位测井gydF4y2Ba

支持向量机:gydF4y2Ba

支持向量机gydF4y2Ba

TH:gydF4y2Ba

钍日志gydF4y2Ba

目录:gydF4y2Ba

总有机碳gydF4y2Ba

药:gydF4y2Ba

上信心绑定gydF4y2Ba

XGBoost:gydF4y2Ba

极端的梯度增加。gydF4y2Ba

数据可用性gydF4y2Ba

使用的数据来支持本研究的结果包括在本文中。gydF4y2Ba

的利益冲突gydF4y2Ba

作者宣称没有利益冲突有关的出版。gydF4y2Ba

确认gydF4y2Ba

这项工作由中国石油天然气集团公司重大科技工程”研究可持续生产关键技术在辽河油田1000万吨原油”(2017号e-16)。gydF4y2Ba

李gydF4y2Ba g . X。gydF4y2Ba 罗gydF4y2Ba K。gydF4y2Ba 史gydF4y2Ba d Q。gydF4y2Ba 关键技术、工程管理和页岩石油/天然气发展的重要建议:Duvernay页岩项目的案例研究在加拿大西部沉积盆地gydF4y2Ba 石油勘探和开发gydF4y2Ba 2020年gydF4y2Ba 47gydF4y2Ba 4gydF4y2Ba 791年gydF4y2Ba 802年gydF4y2Ba 10.1016 / s1876 - 3804 (20) 60094 - 5gydF4y2Ba 赵gydF4y2Ba W。gydF4y2Ba 胡gydF4y2Ba 年代。gydF4y2Ba 侯gydF4y2Ba lgydF4y2Ba 杨gydF4y2Ba T。gydF4y2Ba 李gydF4y2Ba X。gydF4y2Ba 郭gydF4y2Ba B。gydF4y2Ba 杨gydF4y2Ba Z。gydF4y2Ba 页岩油在中国大陆的类型和资源潜力与致密油和它的边界gydF4y2Ba 石油勘探和开发gydF4y2Ba 2020年gydF4y2Ba 47gydF4y2Ba 1gydF4y2Ba 1gydF4y2Ba 11gydF4y2Ba 10.1016 / s1876 - 3804 (20) 60001 - 5gydF4y2Ba 周gydF4y2Ba lgydF4y2Ba 赵gydF4y2Ba X。gydF4y2Ba 柴gydF4y2Ba G。gydF4y2Ba 江gydF4y2Ba W。gydF4y2Ba 聚氨酯gydF4y2Ba X。gydF4y2Ba 王gydF4y2Ba X。gydF4y2Ba 汉gydF4y2Ba W。gydF4y2Ba 关gydF4y2Ba Q。gydF4y2Ba 冯gydF4y2Ba J。gydF4y2Ba 刘gydF4y2Ba X。gydF4y2Ba 关键的勘探与开发技术和工程实践的陆相页岩油:一个案例研究的成员2下第三系Kongdian Cangdong凹陷形成,中国东部渤海湾盆地gydF4y2Ba 石油勘探和开发gydF4y2Ba 2020年gydF4y2Ba 47gydF4y2Ba 5gydF4y2Ba 1138年gydF4y2Ba 1146年gydF4y2Ba 10.1016 / s1876 - 3804 (20) 60124 - 0gydF4y2Ba 温gydF4y2Ba M。gydF4y2Ba 江gydF4y2Ba Z。gydF4y2Ba 张gydF4y2Ba K。gydF4y2Ba 首歌gydF4y2Ba Y。gydF4y2Ba 江gydF4y2Ba 年代。gydF4y2Ba 贾gydF4y2Ba C。gydF4y2Ba 刘gydF4y2Ba W。gydF4y2Ba 黄gydF4y2Ba Y。gydF4y2Ba 刘gydF4y2Ba T。gydF4y2Ba 谢gydF4y2Ba X。gydF4y2Ba 太阳gydF4y2Ba Y。gydF4y2Ba 风扇gydF4y2Ba 年代。gydF4y2Ba 曹gydF4y2Ba X。gydF4y2Ba 朱gydF4y2Ba lgydF4y2Ba 周gydF4y2Ba C。gydF4y2Ba 差异分析有机质富集机制上Ordovician-lower志留纪页岩从中国南部的长江地区页岩气勘探及其地质意义gydF4y2Ba GeofluidsgydF4y2Ba 2019年gydF4y2Ba 2019年gydF4y2Ba 14gydF4y2Ba 9524507gydF4y2Ba 10.1155 / 2019/9524507gydF4y2Ba 刘gydF4y2Ba B。gydF4y2Ba 王gydF4y2Ba H。gydF4y2Ba 傅gydF4y2Ba X。gydF4y2Ba 白gydF4y2Ba Y。gydF4y2Ba 白gydF4y2Ba lgydF4y2Ba 贾gydF4y2Ba M。gydF4y2Ba 他gydF4y2Ba B。gydF4y2Ba 高度前瞻性的岩相及沉积环境湖页岩油连续上白垩纪古龙凹陷青山口组,松辽盆地北部,东北gydF4y2Ba 中部公告gydF4y2Ba 2019年gydF4y2Ba 103年gydF4y2Ba 2gydF4y2Ba 405年gydF4y2Ba 432年gydF4y2Ba 10.1306 / 08031817416gydF4y2Ba 2 - s2.0 - 85061605026gydF4y2Ba 张gydF4y2Ba x L。gydF4y2Ba 肖gydF4y2Ba l Z。gydF4y2Ba 谢gydF4y2Ba r·H。gydF4y2Ba 吴gydF4y2Ba H。gydF4y2Ba 高gydF4y2Ba Y。gydF4y2Ba 页岩气评价岩石物理的工作流gydF4y2Ba 地球物理学进展gydF4y2Ba 2013年gydF4y2Ba 4gydF4y2Ba 啤酒gydF4y2Ba r F。gydF4y2Ba 放射性和古生代页岩的有机质含量gydF4y2Ba 美国石油地质学家协会中部公告gydF4y2Ba 1945年gydF4y2Ba 29日gydF4y2Ba 1gydF4y2Ba 22gydF4y2Ba SupernawgydF4y2Ba i R。gydF4y2Ba 丹gydF4y2Ba M。gydF4y2Ba 链接gydF4y2Ba a·J。gydF4y2Ba 方法原位地球形成的烃源岩潜力的评价gydF4y2Ba 美国专利4 - 071755,1978gydF4y2Ba 什莫克gydF4y2Ba j·W。gydF4y2Ba 有机质含量的测定阿巴拉契亚泥盆纪页岩从伽马射线日志gydF4y2Ba 中部公告gydF4y2Ba 1981年gydF4y2Ba 65年gydF4y2Ba 7gydF4y2Ba 1285年gydF4y2Ba 1298年gydF4y2Ba SwansongydF4y2Ba 诉E。gydF4y2Ba 石油产量和铀含量的黑色页岩gydF4y2Ba 1960年gydF4y2Ba 综合数据分析中心威斯康辛州科学中心gydF4y2Ba SwansongydF4y2Ba 诉E。gydF4y2Ba 在海洋地质和地球化学的铀黑页岩:复习一下gydF4y2Ba 1961年gydF4y2Ba 华盛顿特区gydF4y2Ba 美国政府印刷办公室gydF4y2Ba FertlgydF4y2Ba w·H。gydF4y2Ba ChilingargydF4y2Ba g . V。gydF4y2Ba 总有机碳含量从测井确定gydF4y2Ba SPE地层评价gydF4y2Ba 1988年gydF4y2Ba 3gydF4y2Ba 2gydF4y2Ba 407年gydF4y2Ba 419年gydF4y2Ba 10.2118 / 15612 - pagydF4y2Ba 2 - s2.0 - 0024033907gydF4y2Ba 程ydF4y2Ba z H。gydF4y2Ba 查gydF4y2Ba M。gydF4y2Ba 金gydF4y2Ba Q。gydF4y2Ba 应用自然伽马射线测井和自然伽马能谱测井沉积盆地古环境恢复gydF4y2Ba 中国地球物理学报gydF4y2Ba 2004年gydF4y2Ba 47gydF4y2Ba 6gydF4y2Ba 1145年gydF4y2Ba 1150年gydF4y2Ba 什莫克gydF4y2Ba j·W。gydF4y2Ba 有机质含量的泥盆纪页岩在阿巴拉契亚盆地西部gydF4y2Ba 中部公告gydF4y2Ba 1980年gydF4y2Ba 64年gydF4y2Ba 10.1306 / 2 f919756 - 16 - ce - 11 - d7 - 8645000102 - c1865dgydF4y2Ba 赫伦gydF4y2Ba s . L。gydF4y2Ba 烃源岩评价的总有机碳的日志gydF4y2Ba 日志分析gydF4y2Ba 1987年gydF4y2Ba 28gydF4y2Ba PasseygydF4y2Ba 问:R。gydF4y2Ba CreaneygydF4y2Ba 年代。gydF4y2Ba KullagydF4y2Ba j·B。gydF4y2Ba 莫雷蒂gydF4y2Ba f·J。gydF4y2Ba 粗呢衣服gydF4y2Ba j . D。gydF4y2Ba 有机丰富实用模型,孔隙度和电阻率日志gydF4y2Ba 中部公告gydF4y2Ba 1990年gydF4y2Ba 74年gydF4y2Ba 12gydF4y2Ba 1777年gydF4y2Ba 1794年gydF4y2Ba PasseygydF4y2Ba 问:R。gydF4y2Ba BohacsgydF4y2Ba k . M。gydF4y2Ba 每gydF4y2Ba w . L。gydF4y2Ba 克利曼泰迪斯gydF4y2Ba R。gydF4y2Ba SinhagydF4y2Ba 年代。gydF4y2Ba 从易生油岩气页岩储层地质和非常规页岩气储层岩石物性特征gydF4y2Ba 国际石油和天然气在中国会展gydF4y2Ba 2010年gydF4y2Ba 中国,北京gydF4y2Ba 王gydF4y2Ba P。gydF4y2Ba 程ydF4y2Ba Z。gydF4y2Ba 庞gydF4y2Ba X。gydF4y2Ba 胡gydF4y2Ba K。gydF4y2Ba 太阳gydF4y2Ba M。gydF4y2Ba 程ydF4y2Ba X。gydF4y2Ba 修正后的模型对确定TOC在页岩玩耍:泥盆纪Duvernay页岩的例子,加拿大西部沉积盆地gydF4y2Ba 海洋和石油地质学gydF4y2Ba 2016年gydF4y2Ba 70年gydF4y2Ba 304年gydF4y2Ba 319年gydF4y2Ba 10.1016 / j.marpetgeo.2015.11.023gydF4y2Ba 2 - s2.0 - 84949870980gydF4y2Ba 赵gydF4y2Ba P。gydF4y2Ba 毛gydF4y2Ba Z。gydF4y2Ba 黄gydF4y2Ba Z。gydF4y2Ba 张gydF4y2Ba C。gydF4y2Ba 一种新的估计方法从测井总有机碳含量gydF4y2Ba 中部公告gydF4y2Ba 2016年gydF4y2Ba One hundred.gydF4y2Ba 8gydF4y2Ba 1311年gydF4y2Ba 1327年gydF4y2Ba 10.1306 / 02221615104gydF4y2Ba 朱gydF4y2Ba lgydF4y2Ba 张gydF4y2Ba C。gydF4y2Ba 张gydF4y2Ba Z。gydF4y2Ba 周gydF4y2Ba X。gydF4y2Ba 刘gydF4y2Ba W。gydF4y2Ba 一种改进的方法评估的TOC含量使用dual-difference页岩地层gydF4y2Ba ΔgydF4y2BalogR方法gydF4y2Ba 海洋和石油地质学gydF4y2Ba 2019年gydF4y2Ba 102年gydF4y2Ba 800年gydF4y2Ba 816年gydF4y2Ba 10.1016 / j.marpetgeo.2019.01.031gydF4y2Ba 2 - s2.0 - 85061141961gydF4y2Ba PempergydF4y2Ba R R。gydF4y2Ba 汉gydF4y2Ba X。gydF4y2Ba 门德斯gydF4y2Ba f·E。gydF4y2Ba 雅可比gydF4y2Ba D。gydF4y2Ba 勒孔特gydF4y2Ba B。gydF4y2Ba BratovichgydF4y2Ba M。gydF4y2Ba 费尔巴哈gydF4y2Ba G。gydF4y2Ba 布鲁纳gydF4y2Ba M。gydF4y2Ba BlivengydF4y2Ba 年代。gydF4y2Ba 碳的直接测量含有石油和天然气井使用脉冲中子矿物学的工具gydF4y2Ba SPE年度技术会议和展览gydF4y2Ba 2009年gydF4y2Ba 新奥尔良,路易斯安那州gydF4y2Ba 赫伦gydF4y2Ba M . M。gydF4y2Ba 格劳gydF4y2Ba j . A。gydF4y2Ba 赫伦gydF4y2Ba s . L。gydF4y2Ba jonkleinberggydF4y2Ba r . L。gydF4y2Ba MachlusgydF4y2Ba M。gydF4y2Ba 里德gydF4y2Ba s . L。gydF4y2Ba VissapragadagydF4y2Ba B。gydF4y2Ba 伯纳姆gydF4y2Ba 答:K。gydF4y2Ba 一天gydF4y2Ba r . L。gydF4y2Ba AllixgydF4y2Ba P。gydF4y2Ba 总有机碳和地层评价钢丝绳在绿河油页岩日志gydF4y2Ba 等离子体物理学和受控核聚变gydF4y2Ba 2013年gydF4y2Ba 46gydF4y2Ba 4gydF4y2Ba 593年gydF4y2Ba 609年gydF4y2Ba 谅解备忘录gydF4y2Ba D。gydF4y2Ba 王gydF4y2Ba z W。gydF4y2Ba 黄gydF4y2Ba y L。gydF4y2Ba 徐gydF4y2Ba 年代。gydF4y2Ba 周gydF4y2Ba d . P。gydF4y2Ba 火山岩的岩性识别SVM测井数据:案例研究辽河盆地东部凹陷的gydF4y2Ba 中国Geophysics-Chinese版杂志》上gydF4y2Ba 2015年gydF4y2Ba 58gydF4y2Ba 5gydF4y2Ba 1785年gydF4y2Ba 1793年gydF4y2Ba 席尔瓦gydF4y2Ba 答:一个。gydF4y2Ba TavaresgydF4y2Ba m·W。gydF4y2Ba CarrasquillagydF4y2Ba 一个。gydF4y2Ba MissagiagydF4y2Ba R。gydF4y2Ba 各种gydF4y2Ba M。gydF4y2Ba 岩相分类使用机器学习算法gydF4y2Ba 地球物理学gydF4y2Ba 2020年gydF4y2Ba 85年gydF4y2Ba 4gydF4y2Ba WA101gydF4y2Ba WA113gydF4y2Ba 10.1190 / geo2019 - 0439.1gydF4y2Ba 谢gydF4y2Ba Y。gydF4y2Ba 朱gydF4y2Ba C。gydF4y2Ba 胡gydF4y2Ba R。gydF4y2Ba 朱gydF4y2Ba Z。gydF4y2Ba 而且智能测井岩性识别方法与随机树gydF4y2Ba 数学地质gydF4y2Ba 2021年gydF4y2Ba 53gydF4y2Ba 5gydF4y2Ba 859年gydF4y2Ba 876年gydF4y2Ba 10.1007 / s11004 - 020 - 09885 - ygydF4y2Ba 曹gydF4y2Ba J。gydF4y2Ba 杨gydF4y2Ba J。gydF4y2Ba 王gydF4y2Ba Y。gydF4y2Ba 王gydF4y2Ba D。gydF4y2Ba 史gydF4y2Ba Y。gydF4y2Ba 极端的学习机器非均质砂岩油藏储层参数估计gydF4y2Ba 数学问题在工程gydF4y2Ba 2015年gydF4y2Ba 2015年gydF4y2Ba 10gydF4y2Ba 10.1155 / 2015/287816gydF4y2Ba 2 - s2.0 - 84935923486gydF4y2Ba 287816年gydF4y2Ba XingyugydF4y2Ba y。gydF4y2Ba HanminggydF4y2Ba g . U。gydF4y2Ba YifeigydF4y2Ba 我x。gydF4y2Ba XGBoost算法应用于致密砂岩气藏的测井解释数据gydF4y2Ba 石油地球物理勘探gydF4y2Ba 2019年gydF4y2Ba 54gydF4y2Ba 2gydF4y2Ba 447年gydF4y2Ba 455年gydF4y2Ba 棕褐色gydF4y2Ba M。gydF4y2Ba 刘gydF4y2Ba Q。gydF4y2Ba 张gydF4y2Ba 年代。gydF4y2Ba 动态自适应径向基函数方法总有机碳含量预测有机页岩gydF4y2Ba 地球物理学gydF4y2Ba 2013年gydF4y2Ba 78年gydF4y2Ba 6gydF4y2Ba D445gydF4y2Ba D459gydF4y2Ba 10.1190 / geo2013 - 0154.1gydF4y2Ba 2 - s2.0 - 84894497317gydF4y2Ba 棕褐色gydF4y2Ba M。gydF4y2Ba 首歌gydF4y2Ba X。gydF4y2Ba 杨gydF4y2Ba X。gydF4y2Ba 吴gydF4y2Ba Q。gydF4y2Ba 支持向量回归机技术总有机碳含量的预测从有线登录有机页岩:比较研究gydF4y2Ba 天然气科学与工程》杂志上gydF4y2Ba 2015年gydF4y2Ba 26gydF4y2Ba 792年gydF4y2Ba 802年gydF4y2Ba 10.1016 / j.jngse.2015.07.008gydF4y2Ba 2 - s2.0 - 84937777352gydF4y2Ba 余gydF4y2Ba H。gydF4y2Ba RezaeegydF4y2Ba R。gydF4y2Ba 王gydF4y2Ba Z。gydF4y2Ba 汉gydF4y2Ba T。gydF4y2Ba 张gydF4y2Ba Y。gydF4y2Ba ArifgydF4y2Ba M。gydF4y2Ba 约翰逊gydF4y2Ba lgydF4y2Ba TOC估计的新方法紧页岩气储层gydF4y2Ba 国际煤炭地质杂志》上gydF4y2Ba 2017年gydF4y2Ba 179年gydF4y2Ba 269年gydF4y2Ba 277年gydF4y2Ba 10.1016 / j.coal.2017.06.011gydF4y2Ba 2 - s2.0 - 85030478369gydF4y2Ba 鲁伊gydF4y2Ba J。gydF4y2Ba 张gydF4y2Ba H。gydF4y2Ba 任gydF4y2Ba Q。gydF4y2Ba 杨ydF4y2Ba lgydF4y2Ba 郭gydF4y2Ba Q。gydF4y2Ba 张gydF4y2Ba D。gydF4y2Ba TOC含量预测基于高斯过程回归模型相结合gydF4y2Ba 海洋和石油地质学gydF4y2Ba 2020年gydF4y2Ba 118年gydF4y2Ba 104429年gydF4y2Ba 10.1016 / j.marpetgeo.2020.104429gydF4y2Ba 史gydF4y2Ba X。gydF4y2Ba 王gydF4y2Ba J。gydF4y2Ba 刘gydF4y2Ba G。gydF4y2Ba 杨gydF4y2Ba lgydF4y2Ba 通用电气gydF4y2Ba X。gydF4y2Ba 江gydF4y2Ba 年代。gydF4y2Ba 极端的学习机器的应用在总有机碳含量的预测和神经网络有机页岩钢丝绳日志gydF4y2Ba 天然气的科学与工程》杂志上gydF4y2Ba 2016年gydF4y2Ba 33gydF4y2Ba 687年gydF4y2Ba 702年gydF4y2Ba 10.1016 / j.jngse.2016.05.060gydF4y2Ba 2 - s2.0 - 84973870942gydF4y2Ba 朱gydF4y2Ba lgydF4y2Ba 张gydF4y2Ba C。gydF4y2Ba 张gydF4y2Ba C。gydF4y2Ba 周gydF4y2Ba X。gydF4y2Ba 王gydF4y2Ba J。gydF4y2Ba 王gydF4y2Ba X。gydF4y2Ba multiboost-KELM算法应用于缓解测井曲线的共线性评估海洋中丰富的有机质泥页岩储层:一个案例研究在四川盆地,中国gydF4y2Ba Acta GeophysicagydF4y2Ba 2018年gydF4y2Ba 66年gydF4y2Ba 5gydF4y2Ba 983年gydF4y2Ba 1000年gydF4y2Ba 10.1007 / s11600 - 018 - 0180 - 8gydF4y2Ba 2 - s2.0 - 85050268095gydF4y2Ba 朱gydF4y2Ba lgydF4y2Ba 张gydF4y2Ba C。gydF4y2Ba 张gydF4y2Ba C。gydF4y2Ba 魏gydF4y2Ba Y。gydF4y2Ba 周gydF4y2Ba X。gydF4y2Ba 程gydF4y2Ba Y。gydF4y2Ba 黄gydF4y2Ba Y。gydF4y2Ba 张gydF4y2Ba lgydF4y2Ba 页岩储层预测的总有机碳含量基于一种新的集成的混合神经网络和常规测井曲线gydF4y2Ba 地球物理与工程杂志》上gydF4y2Ba 2018年gydF4y2Ba 15gydF4y2Ba 3gydF4y2Ba 1050年gydF4y2Ba 1061年gydF4y2Ba 10.1088 / 1742 - 2140 / aaa7afgydF4y2Ba 2 - s2.0 - 85047490828gydF4y2Ba 马哈茂德gydF4y2Ba A . A。gydF4y2Ba ElkatatnygydF4y2Ba 年代。gydF4y2Ba 马哈茂德gydF4y2Ba M。gydF4y2Ba AbouelreshgydF4y2Ba M。gydF4y2Ba AbdulraheemgydF4y2Ba 一个。gydF4y2Ba 阿里gydF4y2Ba 一个。gydF4y2Ba 测定总有机碳(TOC)的基于常规测井使用人工神经网络gydF4y2Ba 国际煤炭地质杂志》上gydF4y2Ba 2017年gydF4y2Ba 179年gydF4y2Ba 72年gydF4y2Ba 80年gydF4y2Ba 10.1016 / j.coal.2017.05.012gydF4y2Ba 2 - s2.0 - 85019859121gydF4y2Ba 白gydF4y2Ba Y。gydF4y2Ba 棕褐色gydF4y2Ba M。gydF4y2Ba 动态委员会与fuzzy-c-means集群机器总有机碳含量的预测从有线日志gydF4y2Ba 电脑与地球科学gydF4y2Ba 2021年gydF4y2Ba 146年gydF4y2Ba 104626年gydF4y2Ba 10.1016 / j.cageo.2020.104626gydF4y2Ba HandhalgydF4y2Ba 一个。gydF4y2Ba al-AbadigydF4y2Ba a . M。gydF4y2Ba ChafeetgydF4y2Ba h·E。gydF4y2Ba 伊斯梅尔gydF4y2Ba m·J。gydF4y2Ba 预测的总有机碳在鲁迈拉油田,伊拉克南部使用常规测井和机器学习算法gydF4y2Ba 海洋和石油地质学gydF4y2Ba 2020年gydF4y2Ba 116年gydF4y2Ba 104347年gydF4y2Ba 10.1016 / j.marpetgeo.2020.104347gydF4y2Ba 首歌gydF4y2Ba J。gydF4y2Ba 高gydF4y2Ba Q。gydF4y2Ba 哲gydF4y2Ba lgydF4y2Ba 应用随机森林回归地震储层预测gydF4y2Ba 石油地球物理勘探gydF4y2Ba 2016年gydF4y2Ba 51gydF4y2Ba 6gydF4y2Ba 1202年gydF4y2Ba 1211年gydF4y2Ba CracknellgydF4y2Ba m·J。gydF4y2Ba 阅读gydF4y2Ba a . M。gydF4y2Ba 不确定性的好处:从航空地球物理识别岩性接触区域,卫星数据使用随机森林和支持向量机gydF4y2Ba 地球物理学gydF4y2Ba 2013年gydF4y2Ba 78年gydF4y2Ba 3gydF4y2Ba WB113gydF4y2Ba WB126gydF4y2Ba 10.1190 / geo2012 - 0411.1gydF4y2Ba 2 - s2.0 - 84888028156gydF4y2Ba 赵gydF4y2Ba l . X。gydF4y2Ba 刘gydF4y2Ba j·S。gydF4y2Ba 姚gydF4y2Ba y . X。gydF4y2Ba 钟gydF4y2Ba K。gydF4y2Ba 马gydF4y2Ba J。gydF4y2Ba 邹gydF4y2Ba C。gydF4y2Ba 程ydF4y2Ba Y。gydF4y2Ba 傅gydF4y2Ba X。gydF4y2Ba 朱gydF4y2Ba X。gydF4y2Ba 朱gydF4y2Ba W。gydF4y2Ba 耿gydF4y2Ba J。gydF4y2Ba 定量地震特征的烃源岩在湖泊沉积环境使用随机森林方法:一个例子在东海盆地长江凹陷gydF4y2Ba 中国地球物理学报gydF4y2Ba 2021年gydF4y2Ba 64年gydF4y2Ba 2gydF4y2Ba 700年gydF4y2Ba 715年gydF4y2Ba 程ydF4y2Ba T。gydF4y2Ba GuestringydF4y2Ba C。gydF4y2Ba XGBoost:一个可伸缩的树增强系统gydF4y2Ba 22 ACM SIGKDD国际会议gydF4y2Ba 2016年gydF4y2Ba 纽约,纽约,美国gydF4y2Ba 785年gydF4y2Ba 794年gydF4y2Ba Nguyen-SygydF4y2Ba T。gydF4y2Ba VugydF4y2Ba m . N。gydF4y2Ba tran legydF4y2Ba 答:D。gydF4y2Ba TrangydF4y2Ba b . V。gydF4y2Ba 阮gydF4y2Ba T . T。gydF4y2Ba 研究泥晶灰岩层使用机器学习方法gydF4y2Ba 应用地球物理学杂志gydF4y2Ba 2021年gydF4y2Ba 184年gydF4y2Ba 4gydF4y2Ba 顾gydF4y2Ba y F。gydF4y2Ba 张gydF4y2Ba d . Y。gydF4y2Ba 保gydF4y2Ba z D。gydF4y2Ba 渗透率预测使用PSO-XGBoost基于日志数据gydF4y2Ba 石油地球物理勘探gydF4y2Ba 2021年gydF4y2Ba 56gydF4y2Ba 1gydF4y2Ba 26gydF4y2Ba 37gydF4y2Ba BergstragydF4y2Ba J。gydF4y2Ba BardenetgydF4y2Ba R。gydF4y2Ba BengiogydF4y2Ba Y。gydF4y2Ba KeglgydF4y2Ba B。gydF4y2Ba hyper-parameter优化算法gydF4y2Ba 先进的神经信息处理系统gydF4y2Ba 2011年gydF4y2Ba 24gydF4y2Ba 2546年gydF4y2Ba 2554年gydF4y2Ba 克莱因gydF4y2Ba 一个。gydF4y2Ba 福克纳gydF4y2Ba 年代。gydF4y2Ba 巴特斯gydF4y2Ba 年代。gydF4y2Ba 亨尼希gydF4y2Ba P。gydF4y2Ba HuttergydF4y2Ba F。gydF4y2Ba 机器学习的快速贝叶斯优化hyperparameters大型数据集gydF4y2Ba 人工智能和统计gydF4y2Ba 2016年gydF4y2Ba PMLRgydF4y2Ba 528年gydF4y2Ba 536年gydF4y2Ba 吴gydF4y2Ba J。gydF4y2Ba PoloczekgydF4y2Ba M。gydF4y2Ba 威尔逊gydF4y2Ba a·G。gydF4y2Ba 弗雷泽gydF4y2Ba p . I。gydF4y2Ba 贝叶斯优化与梯度gydF4y2Ba 2017年gydF4y2Ba https://arxiv.org/abs/1703.04389gydF4y2Ba 晓光gydF4y2Ba lgydF4y2Ba XingzhougydF4y2Ba lgydF4y2Ba 金鹏gydF4y2Ba lgydF4y2Ba 智gydF4y2Ba T。gydF4y2Ba 综合评价和勘探实践沙4古宇湖页岩油,辽河萧条gydF4y2Ba 中国石油勘探gydF4y2Ba 2019年gydF4y2Ba 24gydF4y2Ba 5gydF4y2Ba 636年gydF4y2Ba 648年gydF4y2Ba 张gydF4y2Ba W。gydF4y2Ba 吴gydF4y2Ba C。gydF4y2Ba 钟gydF4y2Ba H。gydF4y2Ba 李gydF4y2Ba Y。gydF4y2Ba 王gydF4y2Ba lgydF4y2Ba 预测使用极端的不排水抗剪强度梯度的增加和随机森林基于贝叶斯优化gydF4y2Ba 地球科学前沿gydF4y2Ba 2021年gydF4y2Ba 12gydF4y2Ba 1gydF4y2Ba 469年gydF4y2Ba 477年gydF4y2Ba 10.1016 / j.gsf.2020.03.007gydF4y2Ba 黄gydF4y2Ba T . T。gydF4y2Ba 分类算法的性能评估_k_倍和离开——一出交叉验证gydF4y2Ba 模式识别gydF4y2Ba 2015年gydF4y2Ba 48gydF4y2Ba 9gydF4y2Ba 2839年gydF4y2Ba 2846年gydF4y2Ba 10.1016 / j.patcog.2015.03.009gydF4y2Ba 2 - s2.0 - 84929503174gydF4y2Ba MohrigydF4y2Ba M。gydF4y2Ba RostamizadehgydF4y2Ba 一个。gydF4y2Ba TalwalkargydF4y2Ba 一个。gydF4y2Ba 机器学习的基础gydF4y2Ba 2012年gydF4y2Ba 美国剑桥,马gydF4y2Ba 麻省理工学院出版社gydF4y2Ba