文摘

为了获得连续在TBM隧道地层信息,使用TBM隧道参数、地层识别是进行再通过模型,模型和改进的熵权法改善地层识别率。通过分析TBM隧道之间的相关性特征参数和地层,隧道特征参数向量是最敏感层通过灵敏度分析,再和地层识别模型基于算法建立了。针对问题,在复杂地层模型有一个很大的错误识别,形成识别模型基于熵权再建立算法,再和错误数据的模型重新计算。地层的识别率在新的模型从90.95%上升到98.55%。再结果表明,模型具有更好的识别效果单一地层分布的区间,和熵权的识别率再显著提高复杂地层模型,它提供了一个有效的方法来利用隧道特征参数获取地层信息。

1。介绍

随着对隧道施工和地下工程的需求在中国,TBM被广泛用作特殊隧道设备。TBM早期阶段的选择和建设,整个建筑部分的地质调查是必需的。由于中国地域辽阔,复杂的地质条件,对TBM施工过程经常面临复杂的地质如巨石,上软,和更低的困难。考虑到工程造价和调查方法(通常是不连续钻探取样),准确的地质特征不能从地质调查所获得的数据。在隧道施工过程中,目标和复杂地质条件的主要原因之一是限制安全、高效施工的隧道,这可能导致TBM的损害,影响工期,更严重的危及隧道施工安全的(1- - - - - -4]。目前,先进的地质预测方法主要分为地质方法、物理勘探方法,和钻探方法(5- - - - - -7]。然而,考虑到大范围的差异其使用和感知对象,每一种都有其优点和缺点,一个传感方法难以得到有效保证的准确性。因此,准确地识别地质特征是特别重要的在TBM隧道。

作为地质学的TBM感知的外部表现,研究隧道参数与地质条件之间的关系有利于地质特征的识别。国内外相关学者进行了广泛的研究TBM隧道参数之间的相关性,主要施工参数的导数参数和地层。赵et al。8]分析了掘进机和各种地层的隧道参数之间的相关性在不同的项目,发现隧道平均速度和平均普及率相当不同。推力和转矩波动在坚硬的岩石地层明显高于在其他层,和其他参数变化不大。Ghasemi et al。9)和Delisio和赵10分别使用模糊逻辑理论方法,支持向量机和多元回归分析方法建立回归模型来预测TBM隧道TBM渗透速度在坚硬的岩石条件下和预测。郭et al。11)提出了一个三阶段方法来预测崩溃TBM隧道的位置预测扭矩和推力的基础上,从建设long-short-term noncollapse面积的数据内存模型。因此,它是可行的,通过盾构隧道参数反演地层信息。

一些学者使用隧道参数对岩石进行分类或识别特定的地质。巴兹et al。12)涉及地质信息的表达和分类的性能优化研究的铣头驱动程序,采用了编码方法来定义修正指数的物理意义输入参数量化地质特征,并结合土壤的力学性能等特点,将土壤层次分为三种类别,提高地质检索的准确性。基于隧道参数、刘等人。13)提出了修正的具体能源和博尔德地质构造的识别模型。利用BP神经网络技术,建立了识别模型,实现单独的识别岩石地质。黄和她14)分类围岩等级根据渣的地质记录和TBM的扩展评价方法,建立了围岩稳定性分类基于扩展理论。侯et al。15)提出了一个附加系综分类器实时预测岩体分类使用TBM操作数据,每个分类器的hyper-parameters优化的网格搜索方法。与单个分类器相比,叠加系综分类器有更好的性能,并具有较强的学习能力对小样本和不平衡样本。刘等人。16)提出了一个基于分类学习模型回归树和学习演算法来预测围岩分类和综合几个over-sampling岩石分类技术来解决失衡问题在数据库中。燕et al。4,17]实现的预测地质特征通过集成网格搜索(GS)和K-fold交叉验证(K-CV)覆盖分类算法(SCA)根据盾构隧道所产生的数据和钻孔数据。因此,除了单一地层的识别,它是非常必要的识别地层的隧道部分。

本文基于Guangfo环线盾构隧道项目在广东省。在适度的部分和完全风化层包含巨石,神气活现的粘性和难以流动,很容易形成硬铣头“泥饼”,美国商会(如图1),这加剧了损失的工具。铣头的扭矩和推力的阻力盾迅速增加。螺旋通常不能发掘和保护不能正常推。隧道工程采用的施工方法,结合露天矿法和TBM法,在浅的隧道的围岩分类为V级∼VI,深的围岩岩体的部分完全被列为三级∼IV。花岗岩的风化剖面不均匀,基岩面起伏极大,有巨石分布式局部在隧道顶部和身体。难以识别的复合层前面的方法。

在主成分分析的过程中盾构隧道参数,介绍了地层,最能反映地层的隧道参数提取。通过灵敏度分析,结合隧道参数最敏感地层识别通过模型被选中时,这减少了冗余的特征对识别的影响率,减少特征参数的维数,具有一定的创新特征选择的方法。本文基于熵权法的EWM-KNN模型(EWM)和资讯模型建立了复合层。识别地层盾构隧道的施工参数的问题解决。特别是对于项目研究,识别的部分包含巨石完全风化层的识别率为98.55%,这是大约高出8%的资讯模型。这个模型有一定创新复合地层的识别。

2。特征参数处理和相关分析

通过获得的实际TBM隧道工程数据,不同的岩土组合在隧道线进行了分析。结合地基承载力特征值的岩石和土壤,单轴饱和抗压强度和围岩等级,不同的岩石和土壤组合划分,地质代码重写。在隧道施工隧道的数据处理分析隧道数据之间的相关性和地质代码。根据隧道工程在广东省,一个土压平衡盾(EPB)机,和露天的方法结合项目中采用盾构法。向上线隧道的总长度是3100.19米,EPB隧穿的是982.80 m和铣头开挖的直径是9.15米(盾构机的主要设计参数如表所示1)。这部分的隧道主要通过残积土、全风化花岗岩,强风化花岗岩,中等风化花岗岩。它包含两个岩石部分可能发生在巨石。

2.1。建立地层代码

根据地质调查数据、地质调查局地图,如图2。结合国家标准岩土工程调查,城市轨道交通(GB 50307 - 2012)18设计和代码的构建基础(GB 50007 - 2011) (19),根据每个岩石和土层的特征和工程地质条件、围岩类型的岩土层TBM隧道施工在这个项目如表所示2

从表可以看出2残积土和全风化花岗岩属于第五、第六年级分别在围岩的分类,但地基承载力特征值非常相似,结构特点和完成国家相对宽松。实际施工过程反映在TBM隧道数据,所以残积土,全风化花岗岩,结合地层的两个标记为代码1号。根据岩石和土壤的不同组合层在TBM隧道部分,地层及其组合标志如表所示3

2.2。隧道参数的处理

研究TBM隧道性能,参数,比如总推力,刀盘扭矩,掘进速度、刀盘转速,和平均土压力通常选择进行分析。以总推力为例,时域信号的采样周期的TBM隧道施工项目1分钟,也就是说,每60年代一群收集数据,如图3(一个)。考虑到干扰中数据的起止阶段和nonexcavation过程中的数据,本文中的无效数据不断收集的数据将被删除,和有效的数据拼接获得测试数据。二进制判别方法是,在一群收集的数据在一个特定的时间,只要一个隧道参数的值是0,当时所有数据将被删除,获取各种隧道正常施工状态下的数据(13),如图3(b)。

收集到的数据在实际工程应用中往往有很多的噪音,和信号抖动是认真的。因此,通过平滑异常值和噪声数据,各种隧道数据随时间变化的趋势,如图3(c)。

原始数据和处理数据之间的比较如图3。之前和之后的结果总推力数据处理,更连续的和直观的反映隧道与隧道的地质参数的变化过程,它提供了数据依据隧道参数和地层之间的相关分析。

2.3。隧道参数和地层之间的相关性分析

TBM隧道的主要参数包括总推力,刀盘扭矩,隧道速度、渗透,和普通的土压力。推力系数和tunneling-specific能源来自主要隧道参数能反映隧道盾构机的性能通过集成各种参数的特点(20.]。

TBM隧道的过程中,渗透率是影响隧道速度和铣头的转速,这被定义为每个旋转的铣刀头的距离,并可以直接反映隧道的效率。与其他隧道参数不变,渗透率随围岩强度的增加而减小。在同一地层条件下,渗透与总推力的增加,因此介绍了推力系数来表示所需的总推力单元渗透,反映的boreability形成。推力的因素F′是定义如下21),其时域图所示4 在哪里F是总推力(kN),p是渗透(毫米/ r),它代表了TBM的向前驾驶距离时刀头旋转一圈。

从能源的角度来看,当其他隧道参数保持不变,刀盘扭矩的增加,铣头速度,或总推力会消耗更多的隧道能量。通过计算单位体积能耗的岩石和土壤的boreability的岩石和土壤,TBM隧道的具体能源(SE)有很强的相关性与岩石强度(22),这是定义如下,时域图如图5 在哪里T是刀盘扭矩(kN·米), 是刀头转速(r / min), 隧道的速度(毫米/分钟),然后呢R是刀开挖半径(米)。

皮尔森相关原则是用于分析隧道参数之间的相关性,衍生参数和地层(13),如以下所示方程,相关结果如表所示4 在哪里XY分别代表两个参数进行相关性分析。

相关系数ρ是实数(−1,1)之间。什么时候ρ∈(−1,0)之间存在着负相关变量。当ρ∈(0,1),之间存在着正相关变量。越接近|ρ| 1,变量之间的相关性越强,反之亦然。它可以从相关系数表的最后一列4tunneling-specific能量、推力系数和平均土压力与地层高度相关。刀盘扭矩和隧道的速度与地层强烈相关。

由于隧道的埋深平均土压力有很大的影响,一般的土压力将被忽略。隧道之间的关联度参数可以通过皮尔森相关分析。tunneling-specific能源与推力因素高度相关,具有强烈的共线性。很难准确区分每个变量的影响形成识别结果通过。因此,tunneling-specific能源与形成更高的相关性被选中。最后,隧道参数向量(T, ),(T,SE),( ,SE)和(T, ,SE)由刀头扭矩T,施工速度 ,和隧道具体能源SE形成,用作数据基于再依据地层识别算法。

3所示。再形成识别模型基于算法

3.1。再算法

作为一个在线分类技术,再(资讯)算法首先应用于文本分类研究因为它的简单理论,精度高,好公差异常值和噪音。现在广泛应用于分类和识别人脸识别等领域和网络舆论分析(23,24]。本文应用资讯地层识别算法模型。

定义U作为训练集数据,n作为训练集数据量,训练集是由刀盘扭矩U1= {u11,u12、…u1n},隧道的速度U2= {u21,u22、…u2n},隧穿特定的能量U3= {u31日,u32、…u3n}。X测试集的数据,测试集的数据量,测试集是由刀盘扭矩X1= {x11,x12、…x1},隧道的速度X2= {x21,x22、…x2},隧穿特定的能量X3= {x31日,x32、…x3}。设置训练集数据点之间的距离U(u1,u2,u3)和测试集数据点X(x1j,x2j,x3j)是Dij=D(U(u1,u2,u3),X(x1j,x2j,x3j)),∈(1,n),j∈(1,),选择欧几里得距离作为距离度量,见以下方程:

C相对应的分类属性吗U(u1,u2,u3),即地层。附近的距离D之间的元素x的测试集X和训练集U被定义为ε,数量nε的社区ε定义在以下方程:

为了使nε至少有k添加以下所示的约束方程:

如果要求社区的数量ε′不到ε不大于k所示,添加约束方程如下:

两个约束条件(6)和(7)的距离nε最近xU完全k

的集合k样品最接近xU被定义为一个k

c最多的成员一个k最终的分类,分类结果是由准备好了吗P

3.2。选择的K基于正交试验法的价值

训练集的数据U根据类别标记C每个数据点,然而算法用于标记类别中每个数据点的测试集X反过来。不同类别之间的边界X形成决策边界。决定边界变得平滑、流畅的增加K价值。如果K值太小,分类精度将降低。如果K太大,样品在吗X是不平衡的,它会增加噪音和减少分类的效果。一般来说,用于选择适当的正交试验方法K值(25]。

测试集的数据不能用于指导模型的训练。因此,训练集数据进一步划分为训练集和验证集(训练集数据分为训练集和验证集根据7:3摘要)。从选择一个小的K价值,价值的K不断提高,计算验证组的方差。验证集是用来评估资讯模型在不同的识别率K值。如图6,当K= 273,验证集的识别率R93.3%,根据资讯和随后的地层识别算法需要吗K= 273。

3.3。参数敏感性分析

形成识别模型的参数敏感性分析是识别结果的变化引起的参数变化,这是模型参数的不确定性分析的重要内容之一,也是不可或缺的一部分的研发和评价模型26- - - - - -28]。不失一般性,地层识别的概率密度函数所示以下方程: 在哪里是地层识别的概率密度,x是第i个影响因素,n影响因素的数量吗(n摘要= 3),x1,x2,x3是刀盘扭矩T,施工速度 ,和隧道具体能源SE,分别。

当所有的因素的变化x1,x2,x3 , ,Δ及其变化x1x2,和Δx3分别 =x1x1, =x2x2, =x3x3地层识别的概率密度函数也改变′,Δ=′-可以用来代表的变化所有的因素引起的。如以下所示方程,Δ多元函数的泰勒展开:

如果因素x变化,其他因素不变,即Δx≠0,Δxl= 0,l,那么概率密度的变化用Δ地层的认可,如以下公式所示:

灵敏度的定义年代如下:

每个隧道的敏感性参数的响应结果资讯算法层识别模型所示以下方程:

年代> 0表明Δ的改变方向和Δx都是一样的。大|年代|,越敏感的概率密度地层识别参数x。刀盘扭矩的敏感性T,施工速度 ,隧道具体能源,和多个隧道的敏感性参数(T, ),(T,SE),( ,SE)和(T, ,SE),如图7

从图可以看出7第450届环之前,数据点的增加,每个组通道参数的敏感性地层变得越来越高,灵敏度和第450届环后趋于稳定。的敏感性 ,SE和[ ,SE总是低,不适合随后的资讯算法的输入参数地层识别模型。隧道参数向量(T,SE灵敏度最高地层识别。在随后的计算,T,SE)作为数据验证和改善资讯的基础模型。

3.4。验证层识别模型的基础上,然而算法

铣刀头转矩T和隧道具体能源SE构成了隧道参数向量(T,SE),这是用作输入资讯模型的基于TBM隧道地层识别参数。图8显示了该地层对比识别结果基于资讯模型和实际的地层。

从图可以看出8识别错误主要集中在第277届环和344之间。三个变化区间后,识别资讯模型误差相对较大。第351届环后,有错误的识别5号的形成,和错误的数据都集中在相同的部分。主要原因是后计算K最近的距离在资讯模型中,数量最多的地层的层类型对应于这些K距离作为识别结果。然而,隧道参数的数据量对应的1层和2层相对较小,多次和地层变化较少的数据量。它有一定的局限性仅仅依赖欧几里得距离,确定地层的基础。

12936年测试数据,通过资讯模型,11765数据点被正确识别,1171是错误的识别,识别率为90.95%。虚假的数据,1171年为了提高识别率的间隔形成频繁变化,再形成识别模型的算法,提出了基于熵权的方法。

4所示。地层识别模型的基础上再熵权方法的算法

然而,算法计算K欧几里得距离接近测试集的数据,但是的密度和分布类型的重要性K样品是不同的。只有把类型最多的K距离的最终判决结果将会导致巨大的错误。考虑密度的影响和重要性抽样分布的地层识别,它是作为距离的重量。现有数据的前提下,更可靠的进行重量分析中包含的信息数据本身。因此,然而算法提出了基于熵权的方法。针对样本不平衡的问题,重量是由样本之间的差异信息内容和提高地层识别的准确性。

4.1。地层识别模型的基础上再正常的熵权方法的算法(EWM-KNN)

熵权法(EWM),作为一种方法来确定重量的信息量,具有较强的客观性和适应性。主要用于解决评估问题和避免错误引起的人工权重(29日]。本文主要用于重量分析中包含的信息K点最接近测试集。K点,每层的数据分布类型是由熵权法、加权得分和地层类型得到最高的分数(30.,31日]。

事件的信息熵X所示如下方程: 在哪里x表示可能发生的事件X,p(x)是每一个发生的概率,−lnp(x)表示包含的信息量在每种情况下,他们的关系如图9。−p(xln)p(x)是信息内容的期望值。因此,信息熵的本质是代表信息的期望值。的最大价值H(x)是ln (n)。

th距离信息K然而算法获得的距离,除以一个常数ln (n范围是[0,1]。所示的信息熵计算以下方程:

信息熵值越大,越小的信息量。因此, = 1−eij作为信息的实用价值。正常化后,距离信息的熵权。计算公式如下:

作为一个在线分类技术,EWM-KNN包括资讯算法的优点,选用双曲正切的激活函数(32),改善地层识别的准确性通过熵权方法(EWM)。

4.2。验证基于熵权的地层识别模型再算法(EWM-KNN)

(T,SE)隧道参数向量作为输入,在12936年和1171年的数据识别错误发现基于传统的资讯模型的测试数据。reidentifying, 1171测试数据与地层识别模型基于熵权再算法(EWM-KNN),识别的目的更频繁的变化形成的间隔是实现,以提高识别形成率。图10显示了该地层对比识别结果基于EWM-KNN模型和实际的地层。

从图可以看出10 (b)EWM-KNN模型的识别误差主要集中在第277届环和341环,实现了识别的二号形成最少的样本大小,但仍主要集中在识别形成1 - 5号。识别错误的可能原因是层核心的样本量小,地层数据的拟合误差和隧道参数很大。

1171年测试数据,通过EWM-KNN模型,984数据点被正确识别,187数据错误的识别,识别率为84.03%。结合前面的识别结果,12936年12749数据点被正确识别测试数据,和改进的识别率为98.55%。熵权法用于解决低识别率的问题在地层变化的频繁的时间间隔,和EWM-KNN模型用于改善地层的识别率。

5。讨论

一般资讯算法已广泛应用于分类和识别人脸识别等领域和网络舆论分析。然而,作为惰性学习算法,然而算法构造的模型在最后一刻给定测试集的分类和有一定要求的计算时间和存储空间(部分设备3所示。1)。因为该算法是基于欧氏距离,但欧几里得距离不是尺度不变的,也就是说,计算距离可以根据元素的单位倾斜。一般来说,数据在使用前需要规范化这个距离测量。与数据维数的增加,欧几里得距离失去物理意义,使得在高维度的距离非常不直观。然而,除了欧几里得距离,其他常用的测距方法(余弦相似性,曼哈顿距离,切比雪夫距离,Jaccard指数和半正矢距离)都有自己的应用领域和适用条件,不适合本文的研究方法。因此,当资讯算法本文采用欧氏距离的测量内容是改善23,24]。

还有一个重要的参数资讯算法,即选择的K价值。多少分应该提取最接近测试集作为最终分类设置对最终的识别结果是至关重要的?因此,用于选择交叉验证方法K值(部分3所示。2)。常用的交叉验证形式包括抵抗验证,K-fold交叉验证,分析卖空(LOOCV)。其中,抵抗验证不是一个严格的交叉验证,因为数据不是cross-used。随机选择初始样本形式交叉验证数据的一部分,剩下的数据作为训练数据。这使得测试集提前使用,导致后续的识别结果中的错误。LOOCV使用最初的样本之一作为验证数据,和其余变量作为训练数据。这使得结果没有充分考虑影响因素,它也很容易导致识别错误(25]。因此,K-fold选择交叉验证,和30%的训练集作为验证集的确定K价值。K值的选择和模型识别的准确性在图所示6

当资讯算法改进的距离度量,熵权法用来权衡欧几里得距离(部分4.1)。TBM隧道的过程中生成的数据是随机的。主观权重要求重量setter方法有丰富的经验和过分依赖人为因素(30.,31日]。目标加权法确定的重量参数根据每个参数属性的关联度,或每个参数所提供的信息量。它具有较强的客观性和理论基础。不仅仅是局限于同一项目或TBM,还可广泛应用于TBM隧道的地层识别,并具有较强的普遍性。事件发生的概率之间的关系,如图的信息量9。然而,重量由客观权重确定方法可能与实际情况不符。因此,当选择识别地层的隧道参数相关,相关分析(13(部分2.3、表3)和敏感性分析26- - - - - -28(部分3所示。3,图7)是用来消除冗余参数与重叠的信息,减少地层识别模型输入参数的维数,并避免之间的干扰信息。

6。结论

本文提供了一种新方法确定地层盾构隧道通过机器学习使用参数。其步骤包括隧道数据的预处理和特征提取,数字化地质特征,地层识别模型的优化。模型是由盾构隧道的隧道参数测试项目在广东。下面的结论是通过比较两个模型的识别效果:(1)的参数T最好和SE可以反映地层复合地层中提取,从而降低地层识别特征的维数,减少冗余特性的影响在模型识别的准确性。(2)然而模型决定了地层测试数据所属通过比较测试数据与训练数据之间的距离。整个地层的识别率为90.95%,和单一地层的识别效果很好。(3)部分大型土壤粘度和巨石,两个模型的识别率高于8%资讯模型的孤独。EWM-KNN模型地层识别准确率高于资讯模型,识别准确率可以达到98.55%,适用于复合地层的识别。

数据可用性

(txt)数据用于支持这项研究的结果已经存入(4你ResearchData)库(DOI: 10.4121 / 19672173)。

的利益冲突

作者宣称没有利益冲突。

作者的贡献

W·W。,J. G., and J. L. conceptualized the study; W. W. developed methodology and formally analyzed the data; J. S., H. Q., and X. C. collected data resources; W. W. prepared writing of the original draft; W. W., J. G., and J. L. reviewed and edited the manuscript; J. G. supervised the study All authors have read and agreed to the published version of the manuscript.

确认

这项研究的部分资金由河北省研究生创新研究基金(批准号CXZZBS202111)和国家重点研究和发展计划(批准号2020 yfb1709504)。