文摘
介绍了一种有效的方法来预测reservoir-triggered地震的大小(RTE),基于支持向量机(SVM)和模糊支持向量机(FSVM)的方法。RTE的主要影响因素,包括岩性、岩体完整性、断层特征,构造应力状态,和在库区地震活动背景,分为11个参数,利用层次分析法(AHP)量化。在100年中国水库数据集,包括RTE的48个证据确凿的情况下,收集并用于训练和验证预测模型建立SVM和FSVM,分别。通过数值试验,结果表明,SVM和FSVM模型是有效的预测与高精度RTE的大小,提供足够的样本收集。虽然FSVM的结果从SVM通过引入模糊扩展会员减少噪音或发现异常值的影响略少比SVM在当前准确分析RTE病例。原因可能是由于高离散性的样本数据在当前的研究中。
1。介绍
Reservoir-triggered地震(RTE)或水库地震(重新)在短暂的1- - - - - -3),也称为水库诱发地震(RIE),是由在水库蓄水水由跨河大坝的建设。RTE的第一例被梳刷指出,发生在美国的米德湖(4]。在过去的几十年中,约130例疑似病例的RTE已报告在世界上包括美国、印度、希腊、埃及和新西兰(3]。其中,大约100例RTE举世公认,因为他们很难区别于自然地震。中国是最容易发生地震的国家之一,大约40 RTE病例报告。他们带来了重大威胁大坝的安全,因此是伟大的危害当地居民的生命和财产5),特别是在西部的四川省和云南省的西北部,在大坝已经建成或正在建设高密度。水坝工程师有必要知道合理预测RTE的大小来评估大坝行为受到这种类型的地震荷载。有效预测RTE的可能性及其大小的发生是必不可少的大型水坝的设计相关领域的生命和财产的安全。
像天然地震、RTE的机理非常复杂,地震学家仍然几乎完全不知道。自从RTE的发生时间预测是非常困难的,以前的研究主要集中在RTE的预测位置和大小。通过广泛的地震学家的研究,它已被广泛承认,RTE密切结合影响因素包括岩性、深部岩体力学参数,岩体的应力状态和孔隙水的分布6]然而,由于难以测量和量化的因素,构成巨大挑战一直在分析RTE [7,8]。
尽管如此,各种分析方法提出了RTE的研究在过去的几十年中,如力学模型方法(7)、地质类比法(7),概率和统计方法8- - - - - -10),人工神经网络方法(ANN) (11,12),和人工智能技术(13]。其中,力学模型的方法是有限的,岩石的非线性,参数变化和孔隙水分布以及边界条件不能充分考虑。因此,地质类比法,提出了基于类比RTE病例,在水文、工程地质和渗透条件。RTE的可能性,以及它的大小和位置的情况下发生,因此能够进行分析。然而,基本的机械原理像力平衡条件不能被包括在这个方法。概率和统计方法8),提出了基于贝叶斯定理,也可以用来评估RTE的发生概率。它是基于统计分析以前RTE的情况下,因此结果的准确性是强烈依赖于样本数据和RTE的先验概率。人工神经网络方法具有较强的非线性映射能力,从而显示了巨大的优势在处理复杂非线性关系复杂的问题,而网络结构和过度拟合问题的不确定性和underfitting有限在RTE的分析中的应用。
支持向量机(SVM)是一种强大的机器学习方法在1995年首先提出Vapnik [14]。它来源于统计学习理论,具有较强的泛化能力。最好的折中模型的复杂性和学习能力能够达到的就业结构风险最小化(SRM)原则,这是由传统的经验风险最小化(ERM)方法(14- - - - - -16]。SVM数据后来最初应用于模式分类和回归问题。通过引入核函数,最初的支持向量机应用于线性可分的最优分类数据扩展到非线性问题。他们可以得到解决,通过转移到二次规划(QP)约束条件的问题16]。以其优良的性能在处理非线性、高维问题,支持向量机已经广泛应用于多个领域,如图像识别、分类、时间序列预测、岩土参数的反分析,和水文预报17- - - - - -21]。然而,传统的支持向量机对噪声或野值非常敏感。因此,林和王22]提出了模糊支持向量机(FSVM)通过应用模糊成员每个输入点,以减少噪声或异常值的影响。为了减少依赖隶属函数对样本数据的几何形状,唐et al。23和Du et al。24)引入了一个新的隶属函数基于一个样本之间的距离和FSVM的类超平面。进一步减少不支持向量的会员和增加的支持向量,丁和顾25)提出了一种新的算法,基于超球面的双重会员使用。对于多类分类问题,曾荫权et al。26)定义了一个样本的隶属程度不同的类通过引入模糊会员每个训练样本,而安倍(27)分类样本到multilabel类的成员函数是最大的。
在这项研究中,我们试图扩展应用SVM和FSVM预测RTE的大小,根据数据集收集水库和RTE案件在中国。Habibagahi [12和苏梅和金13)也使用人工智能技术来预测诱发地震的大小。在他们的模型中,只有有限等因素对储层参数综合参数和最大储层深度考虑。虽然地质因素,触发地震的重要意义,不考虑。因此,努力取得了开展这项研究涵盖多个库区的地质因素和储层参数提供研究RTE的一步。数据集100年大中型水库,占地48 RTE情况下,收集来自知名企业和文献发表。计算模型建立了基于SVM和FSVM。层次分析法(AHP) [28是用来量化地质因素的地质分析的基础上,提供输入数据的计算模型。三个数值测试进行测试的性能建立模型。结果从SVM和FSVM详细模型进行了分析和比较。讨论了SVM和FSVM的适用性,它提供了一个有效的方法在RTE预测。
2。数学模型和数值程序
2.1。SVM和FSVM模型
FSVM分类的解决方案也可以转换成一个二次规划(QP)问题像传统的支持向量机。通过求解对偶问题的QP,我们可以很容易地获得FSVM的解决方案。提出的计算算法Vapnik [15)和邓田(16),可以概括为以下步骤:(1)假设一个训练集 ,在那里 。引入模糊隶属 (22),它可以被视为相应的训练点的态度向一个类。如果 ,它表明,训练点不绝对属于一个类;相反, 表明,训练点完全是在一个类中。的方法确定的价值训练点将在稍后介绍。对于这个二进制分类(BC)的问题,它可以转换成QP问题与约束条件包括模糊成员。可以表示为相应的对偶问题 在哪里正则化参数,是拉格朗日乘子,是一个核函数,是模糊的会员。当 ,这个对偶问题相当于标准支持向量机。
在多个内核、多项式内核和径向基函数(RBF)内核通常用于模式分类。虽然在大多数情况下,RBF内核发现表现得更好(27),它可以表示为 在哪里输入向量和吗RBF核函数的参数。
通过求解上述QP,对偶问题的最优解可以表示为 的组件对应于样品 。(2)建设基于最优解的最优超平面以上QP,可以实现最优超平面 在哪里 样品的重量吗 ,和可以计算通过选择一些积极的吗不到 ,根据下面的公式 (3)的决心决定功能二进制分类决策函数可以表示为
模糊的会员的决心对FSVM的性能是至关重要的。目前,主要是基于隶属函数决定的,其价值是由样品和它的类中心之间的距离(22]。但这种方法是不合理的数据集nonspherical-shape分布。在当前的研究中,我们将使用一个新的隶属函数提出的Du et al。24)和丁和顾25),基本思想是引入类超平面来代替集群中心。类超平面的定义是通过集群中心和垂直于线在积极和消极集群中心,如图1。然后模糊成员表示样本之间的距离和类超平面。这样,隶属函数的依赖,极大地减少了样本数据的几何形状,因此FSVM的泛化是显著增强。
这种新方法的基础上,对非线性分类问题,样本之间的距离类超平面,用 为样本,分别在正、负类,如图1,可以通过使用内核技术,如下: 在哪里表示正类样本的数量表示负类样本的数量,是内核函数。
正样本和类之间的最大距离超平面是表示 ,为负样本来标示 。
因此,每个类的样本隶属度可以被定义为: 在哪里是一个非常小的正数,以避免情况 和保证 。
它可以看到从(8),变小,当样品位于远离类超平面,反之亦然。然而,如果一个样本远离它的类超平面,而不是在自己的类,它将最有可能成为噪声或异常点,会严重影响标准支持向量机的最优超平面的位置。在FSVM,通过引入模糊成员 ,这对噪声或离群值变得很小,噪声或离群值的影响可以消除最优超平面的位置。
此外,与支持向量机最优超平面的位置获得明显受到核函数的选择、正则化参数,需要优化和松弛系数,先应用(17,18,29日]。
2.2。数值计算过程
2.2.1。定量分析参数和分级RTE的大小
RTE的地质影响因素包括岩石的成分和结构底部的储层,分布,态度,机械特性,增长水平,和目前的活动断层,以及水文条件(30.]。然而,这些因素很难量化,在RTE的定量分析带来很大的困难。在目前的研究中,层次分析法(AHP) (28),这是一个有效的方式来处理无法量化的参数,采用量化这些影响因素。这些地质因素是采用AHP后由自然数。
2.2.2。数据归一化
防止模型输入变量的统治与较大的值在不同的维度,样本数据的原始值归一化由以下方程。 在哪里是样品的原始值,样本的比例值,样本的期望,样本的标准偏差。
2.2.3。SVM和FSVM模型的建立
因为有多个类RTE的预测模型,SVM和FSVM模型涉及多个分类。多个分类,SVM和FSVM模型可以建立“one-against-all”和“one-against-one”方式(16]。
根据以往的数学模型和数值程序,算法的SVM和FSVM图的流程图所示2,可以通过编程计算代码。
3所示。RTE的预测模型基于SVM和FSVM级
3.1。数据建设
数据集在100年在中国大中型水库,覆盖RTE的48个证据确凿的情况下,收集来自知名企业和当前研究的文献发表。基于他们,11个影响因素,包括地质因素和储层参数,考虑到在RTE的分析,如下面所讨论的。
3.1.1。坝高度和储层的能力
通过统计分析RTE的情况下,人们已经发现了江et al。30.]RTE没有明显关系坝高度和储层的能力。这意味着RTE可能发生在任何库区不管其能力。例如,Dengjiaqiao水库,位于中国中部的湖北省,引发了地震2.2女士,而水库的容量只有400×103米3(6]。
3.1.2。在储层岩性或中心
研究影响库区的岩性或震中,我们在48 RTE病例进行统计分析。发现震中是广泛分布的岩性,虽然足够数量的样本来提高支持向量机分析的准确性至关重要。因此,岩石与岩性特征被归类在一起。例如,石灰石和白云石一起被认为是碳酸盐岩、片岩和板岩分为一类,火成碎屑岩、凝灰岩被归类为火山岩。这样,超过10的岩石类型为岩性定义在库区或震中基于这些RTE病例。岩性的代表值如表所示1,这些岩石完整性如表所示2。
3.1.3。故障的类型和特征
联合的条件和故障具有较强影响岩体的完整性,因此RTE的大小。众所周知,表面岩层与发达的关节和破碎岩石渗透率高,微地震或ultra-microearthquake可能被触发。在相对深岩层,活跃的地区或张力的断层渗透率高,从储层和水渗透到深层岩体可能改变孔隙水的压力分布。在这种情况下,地震引发的大多是软弱和温和的人。通常有大量的库区存在的缺点。因此,只有一些主要缺点是选为分析对象考虑他们的规模和影响程度。相关的代表值类型,开发程度、活动水平和断层的磁导率如表所示3- - - - - -6,分别。
3.1.4。在库区构造应力状态
发现RTE没有明显关系在库区构造应力状态(30.]。这意味着RTE可能不仅在构造活动活跃地区,而且在不活跃的地区。然而,巨大的弹性应变能可以存储在高地区岩体局部应力。岩体的状态可能会接近破裂或滑脱,这可能导致地震相对强劲。不同地区的代表值应力状态表中列出7。
3.1.5。在库区地震活动的背景
基于RTE的统计分析,发现RTE往往发生在弱地震地区,很少RTE相对强劲的地震地区已报告(30.]。这是由于这样的事实,释放的应变能可以很容易地通过常见的地震在地震区域相对强劲。然而,RTE仍可能发生在那些领域,特定条件下的地质结构。地震活动的代表值与背景如表所示8。
3.1.6。RTE的大小分级
有必要RTE的大小进行分类,以获得足够的样本在每个类。RTE的监测数据,发现RTE的最大震级为6.1,用面波震级(Ms)表示。结合王等人的研究。10],RTE的大小分为5个等级,这是强烈的地震活动(Ms≥6.0),中等地震活动(4.5 < 6.0),女士≤弱地震(3.0≤女士< 4.5),微震动(0.0 < < 3.0),和女士没有地震活动(Ms = 0.0)。5的成绩是用5自然增长数字,分别从1到5。
应该注意的是,因为RTE病例的数量是非常有限的48人在中国目前,因此成绩的数量应该被控制获得足够数量的样本在每个类,以便开发模型的准确性可以得到保证。
一些样品(从数据库中100水库)量化数据的地质因素和储层参数如表所示9,包括地震等级分类。
3.2。数值实验和结果
因为RTE的大小分为5年级如上所述,SVM和FSVM模型参与一个五级分类的问题。考虑到有限数量的样本,“one-against-one”的方法,可以减少强烈不平衡样本对分类器的影响,选择构造SVM和FSVM模型。10因此,二元分类器,即公元前1 - 2,公元前1 - 3,公元前1 - 4,公元前1 - 5,公元前2 - 3,公元前2 - 4、2 - 5公元前公元前3 - 4、3 - 5公元前公元前4 - 5,需要构造。
来验证和验证数值模型建立SVM和FSVM,三个数值进行检测。在每个测试,随机选择90水库总数的数据集提供的数据训练集的建设SVM和FSVM模型。数据然后使用剩余的10水库作为预测组测试SVM和FSVM模型的准确性。
第一个训练集是用来训练SVM和FSVM模型建立。通过输出结果的分析和比较,发现RBF核函数的工作。相应的值的参数在(3)和正则化参数在(2),它能有效地影响SVM和FSVM模型的性能,确定通过三倍交叉验证方法(15]。
优化后的参数最优参数值和BCs,获得第一个训练集的SVM和FSVM模型,如表所示10。三倍交叉验证的过程中,SVM和FSVM模型的准确性的训练集和验证集和比较表所示11。精度的定义是预测的匹配百分数的标签和标签的真正设置每个BC。光学参数的基础上,支持向量机模型的输出是完全相同的示例数据的训练集,验证集,精度仍然高于85%,除了公元前3 - 4的准确性为61.97%。同时,FSVM的准确性与训练集的光学参数仍在85%以上和87.59%以上验证设置除了公元前3 - 4的准确性为64.74%。因此,在这个数据集下,SVM模型的性能略优于FSVM模型。
基于上面的最优参数,应该再次训练SVM和FSVM模型训练集;结果表明,没有错误发生的10 BCs训练集,而对于FSVM模型,只有2 BCs不存在错误,最大错误率达到14.29%,平均误差率达4.67%。
然后我们使用训练SVM和FSVM模型来预测RTE的大小10储层的预测设置如上所述。FSVM和SVM模型的结果如表所示12。
从表可以看出12除了安康水库和水库Liujiashan,预测的结果10水库是相同的SVM和FSVM模型在当前实验。其中,Chongbahu水库、Fengjiashan水库和碧口水库没有RTE的报告病例(用5根据RTE的量化级如之前所述)。两个模型的RTE预测水库提供准确的结果。此外,两个模型还提供了准确的预测的年级RTE的水库与先前RTE情况下,包括乌江渡水库,三峡水库,紫坪铺水库,如表所示12。而安康水库和刘家峡水库,没有监控,RTE预测年级三年级(3.0≤女士< 4.5)前FSVM模型和支持向量机模型,后者,高于实际的数据,这表明地震活动较弱;而支持向量机模型的预测是五年级前FSVM模型后,相同的监控数据。丹江口水库,先前RTE女士4.7发生的大小。相对应的预测是三年级,年级RTE女士≤3.0 < 4.5。两个模型的预测成绩也是3 Wuxijiang水库,在实际观察RTE女士的大小2.8。总结7样品已经被SVM和FSVM模型准确预测在10预测在当前的实验样品。左3样本的错误是在小范围内。
为了测试模型的鲁棒性,另一个两个培训过程与数据进行选择以同样的方式如前所述,称为组2和3。的值和保持相同的优化过程与第一SVM和FSVM模型训练集,分别。
应用后第二个训练集对支持向量机模型,训练过程的结果表明,不存在公元前错误总数的10 BC。训练集的精度达到100%。然后训练SVM模型用来预测RTE的大小10储层的预测集,结果如表所示13。可以看出8结果正确预测,准确率达到80%。结果的误差保持在一个小范围的1级。
虽然FSVM的模型,在培训过程中,只有2 BCs 10 BCs中不存在误判。最大和平均错误率分别为14.29%和4.74%,分别。预测集的预测结果与FSVM也表所示13,可以看出,只有两个结果(Shenwo水库和东风水库)是由一个年级,不同于支持向量机的FSVM提供了准确的预测的准确性80%,尽管有点低精度比与SVM模型训练集。
基于训练集在3组,没有错误被发现的10 BCs训练支持向量机模型。而在FSVM模型,在2 BCs没有错误被发现。最大和平均错误率分别为14.29%和4.97%,分别为左8 bc。结果训练SVM和FSVM模型应用于预测10 RTE预测集的大小如表所示14。可以看出,精度是90% SVM和FSVM为80%,错误限制在1 ~ 2年级的两个模型。
通过与SVM和FSVM模型获得的结果在三个测试,可以看出,两种模型都是有效的预测与高精度RTE的大小。通过比较,进一步发现,支持向量机模型略优于FSVM在当前研究的预测RTE的大小与数据集在RTE在中国。这是在矛盾的结果24]。理论上,FSVM模型优于SVM在减少噪音或异常值的影响,通过引入模糊成员。然而,它不能断定FSVM模型优于SVM。如果训练样本的高可靠性和高离散性,引入模糊成员可能会降低数据的离散性和低估的影响样本远离最优超平面,从而降低分类器的准确性。这也许可以解释的原因发现在当前的研究中两个模型之间的比较。因此,选择SVM和FSVM模型的应用分类问题应根据数据的离散性。样本的离散性高、支持向量机可能优于FSVM,反之亦然。
4所示。结论
在这项研究中,我们应用SVM和FSVM方法作为一种有效的方法在预测RTE的大小。数据集在中国100年水库,占地48 RTE情况下,收集和使用的数据库。RTE的主要11个影响因素,包括岩性、岩体完整性、断层特征,构造应力状态,和地震活动背景,总结和量化与层次分析法(AHP)。多个数值测试进行测试的性能建立SVM和FSVM模型预测的RTE的大小。获得的主要结论总结如下。
SVM和FSVM模型发现有效的预测与高精度RTE的大小。此外,获得的结果通过SVM的轻微的精度高于那些FSVM当前RTE病例的分析问题。这可能是由于模糊加入FSVM的引入。这是最小化的有效噪声或离群值的影响在一些问题,但在处理样品高离散性不利。因此,样本的离散性需要考虑在选择SVM和FSVM模型在实际问题。基于当前的研究中,发现略优于SVM模型领域的FSVM RTE预测。
应该注意,RTE的大小分析的最大价值在目前的研究。一般来说,除了主要的冲击,可能会有多个前震和余震RTE的过程中,其震级和震中与主要的冲击有很大的不同。预测前震和余震的大小,也可以采用SVM和FSVM;然而,数据必须建立基于新的数据收集故障的特点和位置前震和余震。此外,SVM和FSVM模型预测的RTE的大小构造基于质量数据的工程地质和水文地质条件。因此,为了获得预测结果精度高,有必要收集可靠数据足够的样本在RTE相关的主要因素,包括库区的地质条件和水从水库渗透到深岩的特点。
此外,当前的工作不是在预测时间RTE的历史,在工程实践中发挥着重要作用。然而,从理论上讲,如果我们能够收集和监测足够的水文参数的进化数据和岩石在某库区的地质属性,通过数值分析的手段获取他们的趋势,并使类比RTE时间序列的情况下,RTE的演化和预测在这个领域可以深入研究。因此,当前的研究也提供了一个创意的预测时间RTE的历史,而面临的主要挑战在于获得可靠的进化趋势的多个水文和地质因素。
数据可用性
使用的数据来支持本研究的发现可以从相应的作者。
的利益冲突
作者宣称没有利益冲突。
确认
作者感谢评审人员非常有用的意见和建议。这项研究是由中国国家自然科学基金资助(批准号51669008)。