文摘
目前研究应用软计算方法基于梯度增强方法预测无侧限抗压强度(UCS)砂处理microbially-induced方解石沉淀(MICP)。10倍交叉验证方法和hyperparameter执行调优找到最优梯度增强算法的体系结构。总共402数据的无侧限抗压强度测试利用biocemented沙滩上进行研究。数据集包括8个输入参数:平均砂粒径、均匀系数的沙子,初始孔隙比,氯化钙浓度、尿素浓度、脲酶活性、光学密度的细菌,和方解石的内容。这一发现表明,梯度推进的方法表现五个常用的机器学习算法(人工神经网络、随机森林,再邻居,支持向量回归,和决策树)在预测的UCS biocemented金沙。使用梯度增加,预测与实际值(UCS有很强的相关性R2= 0.95)。此外,一系列的相关重要性和特性对数据集进行分析。无侧限抗压强度之间的关系,方解石的内容,和初始孔隙比文章中讨论。此外,为评估提供了一些指导方针的影响环境因素的UCS biocemented金沙。在进一步的研究中,本研究的局限性有关数据不足的相关和环境改造解决。
1。介绍
不可阻挡的全球人口的增长导致了利用所有可用的块建筑用地。因为并不是所有土壤的抗压强度来支持结构负荷、宽松的网站经常稳定促进建设。几种方法被用于提高砂的压缩行为,每一种都有其优点和缺点在经济学方面,环境,和实用性。在传统的土壤改良技术,胶粘剂材料,如水泥、石灰、或其他化学物质通常添加到土壤中提高其强度。尽管这些方法都有效地提高土壤的力量,他们的负面环境影响远远大于他们的机械效益1- - - - - -3]。为了减少对环境的影响与传统的土壤改良方法,开发了一些环保的方法。
Microbially-induced方解石沉淀(MICP)是一个可持续的、具有成本效益的,新方法对提高砂的抗压强度4,5]。biocementation过程增强了抗压强度的砂生产方解石矿物在土壤结构的生物活性;因此,没有水泥或其他化学绑定包含在稳定过程,导致环保地面改进方法。在大多数实验室和现场勘查,频繁进行无侧限压缩试验获得巩固了砂的抗压强度6,7]。无侧限抗压强度(UCS) biocemented砂取决于几个因素,如土壤性质、MICP过程的细节,和环境条件,所以治疗的UCS沙子覆盖大范围从0.15到34 MPa (4]。这对土壤各种抗压强度可以显著影响覆盖结构的设计和功能。合理预测biocemented砂的抗压强度可以提高覆盖结构的初步设计的可靠性和阐明MICP方法的适用性问题。
预测的无侧限抗压强度biocemented沙子,小王和阴8)开发了一种multiexpression编程算法结合蒙特卡罗方法(MEP-MC),依靠发展数学表达式的进化算法。一个数据库组成的351从先前的研究采用数据驱动的开发MEP-MC算法。几个MEP-MC模型是预测的UCS biocemented沙子被发现是可靠和准确的。然而,考虑到先进的软计算技术的优越性,如机器学习技术,作者提出,实现这些新技术可以产生更可靠和简单的模型和算法预测的UCS biocemented沙子。
在过去的几年中,先进的分析和计算研究了软计算技术的发展,这是来自数学和统计算法。机器学习是一种新颖的技术可以用来识别线性和非线性变量之间的关系。机器学习正在利用岩土调查作为解决问题的一种手段,预测灾害,或估算土壤特性9- - - - - -13]。目前,一些有效的算法通常用于岩土工程问题,包括人工神经网络(ann),支持向量机(svm),再邻居(资讯),决策树(DTs),和许多其他人。在数据驱动的建模,它是最常见的构造只有一个强有力的预测模型。在另一种方法,一组模型可以解决一个特定的学习目标。集成学习方法是一个通用的应用程序的几个弱学习者从几个模型预测相结合来提高预测性能。因此,结合更简单学习者将导致更高层次的预测精度比只有一个单独的模型。此外,因为整体机器包含多个学习者,合奏的实现方法是高效的线性和非线性数据14,15]。
一般来说,整体方法基于其结构可以分为两组:并行和顺序。并行算法同时运行多个学习者,然后计算最终的预测从所有独立的学习者。平行的合奏中方法,随机森林更频繁地使用在工程和岩土工程问题(16- - - - - -18]。另一方面,一个连续的过程(也称为刺激)构建顺序基本估计,试图减少偏见的估计量在每个迭代。梯度增加(GB)是一个整体算法构建添加剂顺序回归模型的拟合弱学习者在每个迭代中当前pseudo-residuals [19]。由于土壤问题与非线性行为斗争,梯度推进的方法是适合解决岩土工程问题。大量研究发现梯度增强是一个健壮的方法预测岩土工程问题,如剪切强度(20.- - - - - -22],边坡稳定性[23- - - - - -25),结算(26- - - - - -28],液化[29日- - - - - -31日),和其他岩土工程问题。
开发功能和可靠的模型来预测砂处理的UCS MICP,本研究进行了预测的无侧限抗压强度biocemented砂使用机器学习技术。考虑到梯度增加的能力分析与非线性行为数据集,这种方法采用的主要算法。同时,五个常用的和直接的算法利用比较梯度提高性能的方法。摘要MICP机制节中描述的方法2。随后,梯度增加基本面章节中讨论3。部分4描述了数据集和提供了一个变量的相关分析。这一节还介绍k-fold交叉验证和hyperparameter调优的过程。节5概述了,结果和讨论。修改预测UCS和环境因素,第六节为应用提供指导方针的影响最终UCS温度和pH值。最后,本研究结论来源于和潜在的未来的工作。
2。MICP
Microbially-induced方解石沉淀(MICP)是一个跨学科的方法来提高土壤微生物活动的力学行为。微生物生产方解石晶体(CaCO3土壤孔隙内)土壤颗粒结合在一起,提高刚度和强度。MICP过程有三个步骤:(1)细菌培养;(2)治疗;(3)固化。下面这篇文章,分别给出了每个步骤的详细信息。MICP过程的示意图如图1,描述每一步的因素导致的最终强度砂处理。
2.1。细菌培养
MICP微生物的主要功能是分解尿素和作为催化剂沙粒之间的碳酸钙晶体的形成。在MICP,Sporosarcina巴氏(也称为巴氏芽孢杆菌)是最常见的用于ureolysis由于其高脲酶活性(33,34]。美国巴氏生长在碱性介质,需要尿素和铵增长:尿素为氮和碳的细菌,调节pH值,并允许铵基板通过细胞膜(35- - - - - -37]。因此,美国巴氏正在培养一批有氧含有营养物质有助于生长细菌和脲酶活性增加。大多数以前的研究使用ammonium-yeast提取(34- - - - - -37]或trypticase大豆琼脂(38,39)媒体。巴氏种植。
收获细菌的主要特征测量之前引入到土壤细菌生物量的光学密度在600海里,OD600年脲酶活性,UA。生物质能的光学密度与细菌浓度以及样品中细菌的大小(38]。脲酶活动的指标细菌水解尿素的能力,这是极大地受到环境因素如栽培和储存条件34]。脲酶活性以单位毫米·h−1或者U·毫升−1,可以转换如下:
以前的研究已经表明MICP的性能和最终的强度对土壤影响的细菌密度和总活动(39- - - - - -43]。一项由Hammad et al。43评估的活动年代。巴氏在agar-urea介质,发现更高的CaCO脲酶活性导致更快的结晶3。程等。41)评估biocementation与三个不同的脲酶活动的性能(U·5、10、50毫升−1),发现标本与低水平的脲酶活性表现出更大的UCS CaCO相同数量3内容,这是由于成核站点影响降水模式的差异。赵et al。40]表明,砂处理的高值OD600年和脲酶活性可以保持更重要的无侧限压力。随着细菌浓度的增加,更多的CaCO3是沉淀。基于降水模式的比较三种不同的细菌OD600年(0.2、1和3),王et al。42)得出的结论是,细菌的密度极大地影响CaCO的稳定性3晶体。
2.2。治疗
培养后细菌所需的密度和活动,介绍了细菌和胶结的解决方案到土壤里去的。的细菌和胶结砂质土壤的解决方案可以使用三种方法:注入,表面渗滤和预拌。注射更常用的比其他两个技术,效率较低,实际由于某些限制。在表面渗透,主要问题是与穿透深度受到限制。表面渗滤的治疗深度仅限于2米粗颗粒材料和1米细沙(44]。此外,预拌的方法涉及到令人不安的土体以混合解决方案。由于强烈的混合胶结成分与土壤、伪应力出现在土壤样品在这个过程(4]。另一方面,MICP注入是最常见的方法,改善了土壤而不破坏土壤结构。
注入细菌和胶结解决发生在几个批次顺序:首先,一般细菌悬浮液注入土壤质量,其次是注入胶结的解决方案。然而,一些缺点关于CaCO的同质性3土壤被认为在解决方案中注入土壤(34,45]。CaCO的不均匀分布3是归因于线性减少微生物浓度沿注入路径(46]。可以解决CaCO分配不均3内容通过减缓细菌悬液的注入量或考虑注入细菌之间的休息和胶结的解决方案(47,48]。
胶结的解决方案是由尿素和钙盐,伴随着注入少量的营养或氯化铵维持微生物活动(49- - - - - -51]。钙盐溶液分子钙CaCO供应3结晶,其成分会影响胶结砂形成和钙含量(52- - - - - -54]。在钙成分,氯化钙(CaCl2)最常用于MICP [34,39,45,49,51,55),这是由于产生更大数量的CaCO的能力3(54]。
此外,胶结溶液的浓度影响MICP的性能和最终巩固了土壤的力量。Al-Qabany和苏49)观察CaCO的均匀分布3在砂处理低浓度的解决方案(0.25和0.5米)。大量的研究也表明,砂质土壤处理1 M胶结解决方案的容忍UCS低于土壤处理低浓度(39,48,56]。除了每个解决方案的浓度,尿素的浓度和钙盐之间的比例也可以影响MICP的性能。随着尿素含量超过了钙盐含量、细菌消耗更多的尿素和变得更加活跃;因此,钙含量和biocemented砂的抗剪强度会增加(57,58]。然而,Mahawish et al。58]评价土壤的行为对待克分子数相等的(类似物质的量浓度的尿素和氯化钙)和nonequimolar(尿素含量的两倍氯化钙内容)胶结解决方案,发现产生更多的均匀分布CaCO nonequimolar解决方案3比克分子数相等的解决方案。
2.3。固化
细菌的参与和胶结的解决方案在土壤基质引发反应,导致砂孔隙空间中方解石晶体的形成。的微尺度模拟化学反应表现出图1。化学反应发生在下列顺序:
可以看到,化学反应开始与尿素的分解(CO (NH)2)2+ H2O)的细菌微生物,生产方解石(CaCO紧随其后3)晶体和铵( )离子。化学反应在MICP受到环境因素的影响,如温度和pH值的沙子,影响CaCO3内容和力学特性的金沙。
固化的温度媒体可以显著影响MICP性能。增加设置温度高达50°C提出了脲酶活性,导致更大量的CaCO降水3在MICP过程。然而,砂处理在室温(20 - 25°C)显示更大的强度比治愈50°C,这表明CaCO3口供在50°C比生产更有效地加强biocemented金沙在室温下(4,41,58]。在一个类似CaCO3内容,巩固了砂处理在室温下显示更高的UCS比对待冷或暖的温度。程等。41)认为这种歧视CaCO的不适当3沙粒之间的晶体来填补这一缺口,这源于CaCO的成核速率越快3降水在50°C和较低的成核速度4°C (59,60]。Mahawish et al。58)认为无效降水的形成松散CaCO3晶体在升高的温度下。
的初始pH值MICP环境影响微生物的活动影响CaCO的降水3和治疗砂的强度47,61年]。土壤介质的酸度和碱度高发现微生物形成CaCO荒凉的环境中3晶体(62年,63年]。刘等人。62年CaCO)观察不高效3晶体中沙粒接触处理砂时沉浸在酸性介质的pH值3.5。这也是CaCO报道3通过离子反应质子(H口供被消耗+)在酸性溶液。总的来说,MICP过程的最佳pH值被发现或中性环境(7点左右63年- - - - - -65年]。
3所示。梯度增加
梯度增加(GB)是一个监督机器学习算法,融合了几种弱学习者的输出顺序来生产一个健壮的模型。的示意图表示GB机制如图2。
促进包括顺序应用弱的学习者f(x),反复的修改版本数据,导致一系列疲弱的学习者f米(x),米=1、2、…米。最后预测了所有学习者的预测乘以重量(α米)[66年]:
为了适应这些模型,f(x),损失函数,l(y,f(x)),是最小化训练数据: 在哪里x表示输入变量y是目标变量。最终预测的准确性取决于体重因素通过增加的值算法。每个学习者的重量确定其准确性的基础上,由一个损失函数计算:精度是由学习者获得越多,越低体重因素是分配。因此,通过分配不平等的重量训练集在每个迭代中,学习者知道如何关注错误的数据在下一次迭代。
在梯度增加模型,利用决策树为弱的学习者,这是相对快速构建和执行强大的预测能力67年]。决策树训练集划分成不相交的区域Rj,j= 1,2,…J然后,根据终端节点分配一个常数γj每个地区,所以预测规则,基于输入x,可以定义如下:
在梯度增加过程中,添加剂顺序决策树构造的基础;然后,在每个迭代中对每个训练数据,对pseudo-residuals(损失函数的梯度)最小化。梯度增强算法编写的算法1。
|
在第一步中,模型初始化一个终端节点树。然后,与提高的方法米= 1,2,…米,最好的回归树是安装在4步骤。首先,负梯度(pseudo-residual)的组件, ,为我= 1,2,…N,计算。然后,回归树分区训练数据l不相交的区域,并在每个节点分配不同的常量值。之后,损失函数的最小值在不同地区所在地。因此,当前近似在每个地区分别基于上一次迭代更新。最后GB模型从树木安装在每个迭代的总和乘以系数。换句话说,在最后迭代模型构造等价于最终的模型,其中包括所有树木安装在前面的迭代乘以相应的系数。收缩参数, ,在算法1代表了添加剂过程的学习速率。具有低收缩的操作将有更高程度的精度;因此,大量的计算时间和CPU容量是必需的68年]。
3.1。GB的设计
梯度增强算法主要可以分为三个部分:(1)损失函数,(2)添加剂模型,(3)决策树。在本部分中,分别给出了每个组件的配置。
3.1.1。损失函数
在提升过程中,树木是合适的训练集损失函数。对于连续数据的回归问题,三个著名的损失函数(损失)被利用:绝对误差(l小伙子)平方误差(lls),胡贝尔(l胡贝尔,δ)。前两个函数更著名的计算回归算法。平方误差和绝对误差损失函数的方程为目标变量,y和函数的估计,f,可以制定如下:
平方误差比其他损失函数更方便因为它的导数等于当前模型的残余在每个迭代 。因此,的平方误差损失函数,当前剩余被添加到扩张在每个迭代中,这有利于梯度增强算法的计算(19,67年,69年]。
一个替代的平方误差损失函数是胡贝尔损失函数(70年),这是一个平方误差和绝对误差损失函数: 在哪里δ表示的阈值损失函数转换从绝对误差的平方误差。的最优值δ取决于的分布(y−f)。建议选择α分位数的|的分布y−f|相当于的价值δ。在这种情况下,(1−α)对应于故障点的过程。观测的击穿点指的是分数能够任意修改没有降解的质量结果(19]。
3.1.2。加性模型
如前所述,GB算法符合顺序决策树,每次迭代后增加模型的精度。迭代的数量(n_estimators)会影响最终的模型及其精度。有三种常见的方法来确定最优梯度的迭代次数的提高方法:一个独立的测试集,out-of-bag估计k倍交叉验证。当山脊路(71年]证明5或10倍交叉验证比其他方法更有效的,尽管它可能需要更多的计算时间。
此外,收缩参数(Learning_rate)显著影响GB算法的性能。自收缩代表提升过程的学习速率,较低的值导致模型有更好的预测性能。然而,模型较低收缩需求更多的存储和CPU时间。较低的学习速率需要更重要的迭代来实现最优算法(71年]。
3.1.3。决策树
决策树的配置安装在梯度增加过程会影响最终的精度。决定属性,如限制树木的生长的最大深度(马克斯_深度),分离所需的最小数量的样品内部节点(最小值_样品_分裂),最小数量的样品需要在内部或外部节点(最小值_样品_叶),和数量的特性考虑当寻找最好的分裂(max_features)确定最终的决策树的结构72年]。
4所示。方法
4.1。数据集
402年的数据集包括无侧限压缩试验结果进行砂MICP对待,这是在以前的研究报告(39,41,45,49,55,56,58,73年]。这个以数据库包括所有研究biocemented沙滩上进行适当的测试过程和结果报告,可以依靠。图3显示了引用的贡献及其UCS分布。barplot图3(一个)演示了每个引用的频率,它的上面部分是绘制列。可以看到,数据的分布不平等之间的引用;例如,程et al。41),最密集的参考,构成整个数据集的31.6%,而另一个程等的研究。55)数据集的贡献只有1.7%。此外,图中的箱线图3 (b)为每个单独的引用说明UCS分布研究。每个箱子的底部、中部和顶部是第一四分位数,中位数,分别UCS和第三个四分位数的人口。线从每个盒子的顶部和底部显示最小和最大UCS。每个引用的离群点也显示在图3 (b)。同样,在所有研究UCS分布不相同;不过,可以看出,大部分的研究集中在UCS低于4000 kPa。
(一)
(b)
八个参数作为输入数据集:砂粒径中值,(D)50均匀系数的沙子,Cu,初始孔隙比沙子,e0,氯化钙浓度,米ca尿素浓度,米u、光学密度的细菌,OD600年脲酶活性的细菌,UA方解石的内容,F碳酸钙垢。除了输入参数,其他一些变量几乎类似的整个数据集,所以他们并不包含在数据集。钙的来源是所有研究氯化钙。对待砂最初中性(pH = 7),治愈在室温(20 - 30°C)。
表1提出了数据集的统计信息,包括平均值,标准偏差(性病)、最小、最大和四分位数为每个变量。此外,无侧限抗压强度的分布和每个输入参数表现出图4。变量的描述可以概括如下:(我)金沙分为细到中沙与平均晶粒尺寸从0.14到1.60毫米(图4(一));然而,他们中的大多数可分为细粒度砂(D50< 0.425毫米)(74年]。此外,大多数的金沙有均匀的粒度分布均匀性系数从1到2(图4 (b))。(2)初始孔隙比随密度松散砂(0.43 <e0< 0.86),而大多数的处理土壤有一个初始孔隙比在0.55和0.75之间(图4 (c))。(3)光密度值和活动均匀的分布在整个数据集的细菌:细菌OD600年值在0.1和4.46之间UA值1.7至50 U·毫升−1(数据4 (d)和4 (e))。(iv)尿素的浓度从0.1和氯化钙的解决方案被分发到2加上1摩尔·L−1(数据4 (f)和4 (g))。此外,胶结的解决方案是混合克分子数相等的和nonequimolar比例。(v)的CaCO3内容主要分布在值低于10%;然而,几乎14%的数据F碳酸钙垢超过10%(图4 (h))。(vi)的UCS biocemented金沙31至16000 kPa波动。大多数的样品UCS低于2000 kPa(图4(我))。
(一)
(b)
(c)
(d)
(e)
(f)
(g)
(h)
(我)
4.2。相关的变量
相关分析可以有效地揭示变量之间的关系在一个数据集。在这项研究中,皮尔森相关系数的方法是用于分析变量之间的关系(75年]。皮尔森相关法确定两个变量之间的线性关系的程度。皮尔森相关系数,rp,范围从−1比1。的更高的价值rp表示两个变量之间的强相关性。在图5热图的皮尔森相关系数矩阵的特征描述。很明显,UCS biocemented金沙强烈与方解石含量。相比之下,UCS几乎是独立的均匀系数的沙子。
探索UCS之间的关系F碳酸钙垢,图6显示UCS与不同的分布F碳酸钙垢。线性回归直线的斜率为正也绘制在图6无条件刺激与条件刺激,建立直接关系F碳酸钙垢。换句话说,金沙巩固了相似的测试属性,这些样本与大量CaCO3内容将维持更高的压缩。这种力量增强主要来源于CaCo的角色3晶体在沙子上毛孔将沙粒结合在一起。
土壤的初始孔隙比是一个基本参数来定义密度的土壤。根据图6,孔隙比与CaCO最强的相关性3在数据集的内容。为了探索孔隙比之间的关系,CaCO3内容,UCS, gradient-colored散点图e0和F碳酸钙垢如图7。颜色栏显示在右边的图7给UCS为每个数据的值。颜色条代表UCS范围介于0和10 MPa在图7,所以数据与UCS高于10 MPa是彩色的数据用UCS 10 MPa。尽管非正态分布的e0之间的相关性e0和F碳酸钙垢可以从图吗7:F碳酸钙垢达到更高的价值与更大的沙子e0。换句话说,金沙与更多的孔隙空间有可能产生更多数量的方解石晶体的沙子。此外,使用UCS color-mapped数据证明金沙F碳酸钙垢大多高于10%e0在0.6和0.9之间,这些样本UCS高于2 MPa治疗。因此,提高抗压强度在金沙MICP效率更高更多的孔隙空间(0.6 <e0比密集的< 0.9)。高强度对金沙(UCS > 10 MPa)主要发现在金沙与空隙率从0.6到0.8在图7。
4.3。K-fold交叉验证
模型的验证通过k倍交叉验证的方法,生产可靠的模型获得k次验证。在k倍交叉验证,数据集分为两组:训练集和测试集,测试集是伸出的最终评价模型。分为训练集k次级样本具有相似大小。然后,模型拟合的基础上(k−1)折叠的训练数据,其余的褶皱构造模型验证。重复这个过程k时间,每个褶皱是利用一组交叉验证一次。在k倍交叉验证,模型的评价从平均获得的模型。本研究使用10倍交叉验证通过控股20%的数据集作为测试集模型发展。选择测试集随机在整个数据集。图8说明了图解过程在这项研究中使用的10倍交叉验证。
4.4。Hyperparameter调优
如前所述,梯度增强算法包括三个部分,包括损失函数、添加剂提高,和决策树,每个都有自己的配置。性能的梯度数据集可以显著提高模型通过改变波动模型架构。因此,寻找最优模型是一个关键步骤进行精确预测。校准模型和不同的配置最优模型通常被称为hyperparameter调优,被称为hyperparameters和参数。在这项研究中,hyperparameter调优进行使用RandomizedSearchCV模块在Scikit-learn包(76年]。的RandomizedSearchCV随机运行一组hyperparameters和计算分数,然后返回最好的组得分最高的收益率作为输出参数。优化模型由这个模块依赖的根均方误差交叉验证分数;因此,根本不是overfitted优化模型。hyperparameters和GB模型的最优模型中描述表2。
4.5。精度评估
模型的性能评估标准统计措施美,RMSE,日军,R2。对于一个数据集包含N数据的目标y我和预测的f我为我th数据,这些测量精度可以表示如下:(我)美代表平均绝对误差,表明所有预测的平均绝对误差。梅的低价值揭示了降低误差的模型。它可以测量以下方程: (2)RMSE代表根均方误差,测量误差产生的模型预测。因此,RMSE越低,精度高。RMSE参数可以计算如下: (3)日军介绍了平均绝对百分比误差,这是一个相对直观的衡量。模型的性能提高了日军趋于0时。日军可以计算如下: (iv)的R2确定系数的回归问题,衡量一个模型预测的目标。的R2范围从0到1,价值越高代表模型的更好的性能。的R2与残差平方和的比值,党卫军res总平方和,党卫军合计,可以计算如下: 在哪里的平均水平的目标。
4.6。对比模型
为了评估的性能梯度提高模型在预测UCS biocemented砂,其误差指标与五个常用的机器学习技术,包括人工神经网络(ANN) [77年),随机森林(RF) (78年),再(资讯)79年),支持向量回归(SVR) [80年),而决策树(DT) [81年]。
此外,这项研究的结果进行了比较与小王和阴8),预测的UCS biocemented金沙。他们雇了一个multiexpression编程方法结合蒙特卡罗方法(MEP-MC),依赖于一种进化算法发展数学表达式(82年]。MEP-MC,基于数据库建立了五组,然后每组的模型拟合。在他们的研究中使用的数据库是小于这一研究中,含有351 UCS测试结果。小王和阴8),与本研究相比,没有考虑细菌的脲酶活性作为输入变量。
5。结果与讨论
5.1。模型的性能
表3总结了梯度增加的误差度量方法和其他模型训练集和测试集。很明显,梯度增加(GB)优于其他算法在预测biocemented金沙的无侧限抗压强度。预测由GB产生美等于34 kPa的训练集和229 kPa测试集。换句话说,当一个测试数据介绍了最优GB模型与参数表中给出2,它的UCS可以预测平均误差229 kPa。在数据集,UCS的平均值是1328 kPa(表1);因此,它可以表示,平均绝对误差由GB的17% UCS整个数据集的平均值。此外,GB的RMSE显示了一个类似的趋势等于404 kPa测试集。日军的参数可以更好地探索GB到其他算法的优越性,与比例无关,可判断的误差参数。UCS值估计通过GB展示一个日军等于25%的测试集,而其他算法有日军的36 54%。因此,它可以表示,GB算法能够预测UCS biocemented砂平均误差为25%。
如上所述的文献综述,随机森林(RF)是一个算法组成的几个平行的学习者;相比之下,梯度推进包括几个连续的学习者。从表可以看出3GB的技术远比射频在预测更健壮的UCS金沙MICP对待。RF算法使得预测与美和RMSE 62和GB高出44%,分别。此外,日军用射频测试集等于44.8%,这是近20%大于GB。根据这些观察,连续利用薄弱的学习者更有效比并行预测金沙MICP处理的无侧限抗压强度。
此外,multiexpression编程方法的性能(MEP-MC)由小王和阴8)提出了表3。梯度推进的所有方面的明显优于MEP-MC误差度量。预测得到的美和RMSE MEP-MC 409和652 kPa,分别是78年和从GB模型获得高于61%。
预测UCS的分布与实际UCS在训练集和测试集的数据9和10,分别。可以看出,训练集的预测大多接近或等于目标,和大多数的点在图9(一个)谎言沿线的平等。在图的误差分布9 (b)显示,超过200的训练数据没有错误的估计。测试集的分布,如图10 (),证实GB模型的可靠性。测试集预测集中在平等的线,展示了预测和实际UCS之间高度相关。根据表3确定系数(R2)的测试集等于0.95 GB模型。此外,测试集的产生错误通常分布在图10,大多数是低于500 kPa。
(一)
(b)
(一)
(b)
5.2。可靠性分析
为了建立算法的有效性和可靠性,基于弗里德曼的可靠性分析执行分析(17]。根据这种方法,模型的预测排名根据他们的错误,从1表示的误差最小z最高指示错误,z模型。对于一个数据库,其中包含N数据,模型的平均排名j( )可以使用以下公式计算: 在哪里表示的排名我th数据模型j。
使用方程(15),平均排名( )利用模型计算和绘制图11。这个情节说明了梯度增强方法的优越性,已最低的平均排名相对于其他模型。这一点支持GB的表现五个常用的机器学习技术在预测UCS biocemented金沙。发现这种变化是否在模型的表现是否重要,卡方( )在整个测试集的平均排名计算如下: 在哪里N测试数据的数量,z是算法的数量等于6。卡方检验依赖于零假设(z−1)自由度,这将被拒绝如果计算卡方值等于或大于临界指定一个水平的意义(83年]。的关键卡方分布类似于这项研究中,与5自由度和考虑0.95意义,等于11.07。使用方程(16),卡方= 38.65本研究;因此,可以得出结论,零假设被拒绝,因此,分布模型的性能被发现是重要的。
5.3。功能的重要性
一般来说,梯度推进技术也能提供一个重要的得分为每个变量识别每个特性的价值的建设提高了决策树。功能重要性分数在0到100的范围内波动,和一个变量的值越高表明更大的重要性。功能重要性分析的结果提出了本研究的图12。类似于图中概述的热图5、方解石含量(F碳酸钙垢)被发现是最具影响力的功能梯度增强算法。第二个最重要的特性是初始孔隙比(e0),有10%的功能的重要性。金沙集团的其他特性,细菌和胶结的解决方案最低影响的最后UCS梯度增强算法。
6。环境改造
根据文献综述,UCS biocemented砂是受到周围的温度和土壤的初始pH值。然而,考虑到所有的测试结果包含在数据集进行中性无侧限压缩试验获得砂(pH = 7)在室温(20 - 30°C),这两个变量是不包括在训练模型。应该注意,可用的数据集中在温度和pH值的影响太小,基于这些变量的提取模型几乎是不可能的。解决这种限制,本节提供指南应用温度和pH值的影响的UCS biocemented金沙基于这些小的数据集。鉴于这些研究结果是基于有限数量的测试,这样分析的结果应该相当谨慎地对待。
6.1。温度
在整个数据集在这项研究中,使用养护环境的温度接近室温(20 - 30°C)。程等进行的研究。41)可以将指南修改预测UCS其他温度。程等。41)进行了一系列的无侧限抗压强度测试砂处理相同的治疗项目,但治愈在三种不同固化温度(4、25、50°C)。据报道,最强的biocemented金沙治愈的温度下25°C。因为所有样本处理类似的属性,UCS的样本值对应于50岁和4°C的温度可以规范化的温度25°C。因此,温度系数的参数,rt25°C,定义如下: 在UCST和UCS25°C是标本的无侧限抗压强度值的温度T和25°C。应该提到的方解石含量等于样本。的参数rt,25°C介绍了砂处理的比UCS的温度T 25°C。的分布rt,25°C程的研究等。41)如图13。它可以观察到,标本在4°Crt,25°C值在0.55到0.85范围越来越趋势线。相比之下,的值rt,25°C金沙集团在50°C下降F碳酸钙垢值增加,从0.3到0.5不等。
当它旨在估计bio-cemented金沙的UCS治愈在炎热或寒冷的环境中,图中的趋势线13可以用来估计使用GB模型采用UCS值。UCS应该乘以相应的预测rt,25°C关于温度和CaCO3内容。尽管缺乏相关实验数据的不同温度限制温度修正,这些结果可以有助于提供洞察其他温度。
6.2。pH值
如前所述,酸度(pH < 7)和碱性(pH > 7)产生负面影响的UCS金沙MICP治疗。UCS减少的程度不能准确估计由于缺乏高质量的文献和广泛的数据集;然而,程的结果等。63年)可以提供最初的指导方针。程等。63年]表明,砂与pH值等于9.5和3.5 UCS忍受低于中性沙子,甚至CaCO水平较高的3晶体。酸性砂显示下降率高于碱性:酸性砂的UCS大约25%的中性沙子,而碱性的UCS金沙的50%是中性的沙子。因此,当估计酸性或碱性的UCS金沙被MICP,酸性和碱性的最后UCS金沙可以被认为是25和50%的中性沙子,分别。
7所示。结论和未来的工作
考虑到环境效益和广泛应用microbially-induced方解石沉淀的沙质土壤,金沙MICP处理的无侧限抗压强度预测使用梯度增强技术在这项研究。基于数据集组成的402年的数据中提取从先前的研究,研究结果可以概括如下:(我)梯度推进的一个可接受的性能预测算法实现的UCS biocemented金沙在中性条件(pH = 7)和室温(20 - 30°C)。测试集,由梯度预测提高了美和RMSE等于229和404 kPa,分别。此外,日军和R2分别为25%和0.95。误差指标的比较与其他五个常用的机器学习技术(安,SVR,资讯、射频和DT)证明了梯度增加的表现在所有方面的误差度量。(2)相关性分析显示,UCS biocemented金沙主要取决于方解石的内容。此外,孔隙比之间的相关性被发现和方解石含量表明高水平的碳酸钙沉淀可能发生在土壤孔隙比在0.6和0.9之间。(3)使用现有文献的UCS biocemented金沙在严酷的环境下开发的指导方针的修改预测值。这些分析显示趋势低方解石样品冷(4°C)和热(50°C)的天气。此外,biocemented砂处理在碱性和酸性环境中显示UCS低于中性的。这些修改仅限于特定的温度和pH值范围,因为几乎没有什么可用的数据进行分析。
总的来说,这项研究提供了有价值的见解的应用机器学习算法在预测的UCS biocemented金沙MICP处理,可用于土木工程的应用。然而,进一步实验研究明确和详细的治疗程序(特别是注入细节)可以加强数据库开发我们的模型和研究。MICP治疗金沙不同孔隙率可以提供宝贵的见解MICP治疗确定最优初始条件。此外,进一步的研究在不同的温度和pH值需要增强环境修改的准确性和可行性。
符号
| rt,25°C: | 温度系数为25°C |
| Cu: | 均匀系数 |
| D50: | 中值粒径砂 |
| e0: | 初始孔隙比 |
| f: | 函数估计 |
| (): | 最终提高了函数迭代 |
| f米(): | 函数米th迭代 |
| F碳酸钙垢: | 方解石的内容 |
| k: | 交叉验证的折叠 |
| l(): | 损失函数 |
| l休伯: | Huber函数 |
| l小伙子: | 绝对误差损失函数 |
| lls: | 平方误差损失函数 |
| Learning_rate: | 收缩参数 |
| 梅: | 平均绝对误差 |
| 日军: | 平均绝对误差百分比 |
| max_depth: | 的最大深度限制树木的生长 |
| max_features: | 数量的特性考虑当寻找最好的分裂 |
| 米ca: | 氯化钙浓度 |
| min_samples_leaf: | 最小数量的样品需要在内部或外部节点 |
| min_samples_split: | 最小数量的样品需要分裂的内部节点 |
| 米u: | 尿素浓度 |
| n_estimators: | 的迭代次数 |
| OD600年: | 光密度的生物量在600海里 |
| R2: | 确定系数 |
| Rj: | 地区j在树上 |
| Rjm: | 地区j在树上的米th迭代 |
| r即时通讯: | 负梯度米th迭代 |
| : | 排名的我th数据模型j |
| : | 模型的平均排名j |
| RMSE: | 根均方误差 |
| UA: | 脲酶活性 |
| UCS: | 无侧限抗压强度 |
| UCS25°C: | 无侧限抗压强度的温度25°C |
| UCST: | 无侧限抗压强度的温度T |
| : | 学习速率(收缩) |
| x我: | 输入变量的我th样本 |
| : | 平均水平的目标 |
| y我: | 目标变量的我th样本 |
| z: | 数量的算法 |
| α: | 击穿点在胡贝尔损失函数参数 |
| α米: | 体重因素米th样本 |
| γj: | 常数终端j |
| γjm: | 在每个地区最佳常数米th迭代 |
| δ: | Huber损失函数的阈值 |
| : | 卡方在弗里德曼的分析。 |
数据可用性
在这项研究中使用的数据集是包含在补充材料。
的利益冲突
作者宣称他没有利益冲突,可能影响工作报告。
补充材料
提供一个补充材料文件包含在本研究中使用的数据集。数据集包含的值输入和目标参数按引用的来源和提供了一个文本文件。数据集的符号和引用数据是根据主要的文章。(补充材料)