文摘

死于自然灾害的主要原因在过去的50年里目睹的不是别人,正是地震事件的负面经济影响世界,夺去了数千人的生命,造成破坏的性质。摘要小说整体地震预测方法(EEPM)提出和实施产生强烈的学习者(合奏方法)有更好的预测精度,减少方差,和更少的错误。(参数),本质上都是连续型数据来自两个国家,印度和尼泊尔,五年了,和检验数据(前体),在本质上是绝对的收集来自三个国家印度、尼泊尔,和肯尼亚五年具体地震多发地区。结合生成的预处理数据参数和前兆数据。EEPM关注检测地震的准确和更好的早期迹象,发现地震的发生概率在指定的地区,即。,更好的预测和鲁棒性。EEPM产生更好的结果 和更少的方差和更少的错误相比,个别机器学习方法以及更好的准确性为87.8%,而先进的整体方法。地震的预测将报警不仅社会的人们也解释的不同组织的适当范围的大小和动态发生的地震。

1。介绍

地震预测的含义意味着简洁预测时间,大小和位置的同位素和地球化学前兆地震的地震和火山爆发。研究者表示,地震预测在不同地区考虑当地的地质条件等因素,考虑地面运动和动物行为的地震人员伤亡。已搜索了地震前兆,解决方案在过去的研究中,恰恰在美国,日本,中国,以色列,等等,监督区域研究基于参数特性。研究者另一方面在印度、美国、巴基斯坦、尼泊尔、使用参数等对地震预测的调查是基于假设所有区域因素,可以过滤掉,一般信息关于地震模式基于参数可以提取。当能量存储在弹性应变岩石突然释放,这种的能量释放导致激烈地动造成附近发生地震的区域地震的来源,产生能量波的形式在整个地球上,弹性性质称为地震波。地震可以生成许多地理等因素突然矿物体积变化,突然沿着断层滑移,地面运动,炸弹爆炸,火山喷发,暴雨,岩床材料、区域构造、和高度注意到气象学家,地震学家和地质学家。基于80年系统地选择,高质量的同行评议的研究论文,使用数据挖掘方法,实现地震预报是彻底的阅读和分析。不同的数据挖掘方法进行了数据集生成准确预测地震的发生概率。

在本研究论文中,参数和前兆与地震有关的数据收集从不同的来源,然后结合得到一个独特的预处理器数据预测所需的所有功能。分类数据转换为数值,这样一个通用的数值数据集格式被认为有必要的属性。这种独特的预处理数据可以利用不同的个人方法进行分析和逻辑回归的结果。皮尔逊相关系数通过特征选择和选择适当的数据分割比例,配备了一个贡献的方法,然后训练最小化训练错误降低维数,提高计算效率。这种独特的数据集用于应用资讯等不同的数据挖掘方法,支持向量机,XGBoost,决策树,随机森林生成单个方法的结果相比,然后使用性能的措施 ,调整 ,方差、均方误差(MSE)和均方根误差(RMSE)和显示了高的预测方差和错误(1]。小说整体法、整体地震预测法(EEPM),使用推动通过一个贡献方法框架结合一组弱学习者变成一个强的学习者在每个迭代中,这样整体方法抵消的行为,以便推广新数据集的方法。提升整体的方法用于基础学习者所生成的顺序不同的个人方法以这样一种方式,这样弱学习者每次迭代后消除。目前基础学习者总是比上一个更有效,为应用决策树有一个单一的功能以适应训练数据集通过选择正确的决定在每个树的分裂。从树上预测结合使用一个随机森林有重叠的结果平均申请回归。生成的整体方法的准确性产生与以前相比发达合奏的方法预测地震的发生概率。

2。文献调查

数据集的正确选择中起着重要作用的一些研究人员使用地质观察和历史数据一个特定的地区或国家,属性是合理的和有强烈的与地震活动的关系。文学,文件处理参数的选择和前体与不同的数据集,获得一个强大的逻辑预处理数据拥有独立和依赖属性。预处理数据结果变成一个强大和一个新的数据集,应用回归,等不同的技术资讯,支持向量机,决策树,随机森林(2,3]。

在特定地区的历史地震预报是基于确定断层的位置等参数特征或深度、大小、长度、纬度、经度、和时间和运动等前兆的动物,树木,植物改变温度、压力,和氡气估计地震的发生。确定地震的震级估计同时使用所有可用的故障参数和前体通过排除不一致的可能性估计数据挖掘技术预测[申请4]。

2.1。比较研究结果与参数、前兆和先前的整体方法

在文献中,得出预测地震,许多研究人员宣称通过观察多个参数基于观测数据和发展模式和关系和一些使用多个前体和观察该地区的地震活动性的变化模式。已经观察到的数据挖掘技术能够提供更好的准确性预测短期和中期地震相比,大地震。文献综述的分析使用参数数据如表所示1,使用前兆数据如表所示2。分析早期的整体方法如表所示3

许多研究人员致力于整体方法在不同的应用领域。提出了一个系统和整体设计的方法,结合不同的数据挖掘技术和网络技术,可以检测一个意想不到的电压泄漏一些电气设备,为了挽救人民的生命和资源(17]。在这篇文章中,该模型通过嵌入一个安全特性来实现完整性椭圆曲线数字签名算法(ECDSA)预测区域的水体有助于安全关键和检测水体在传输通道使用整体方法通过结合数据挖掘技术如网络XGBoost和随机森林18]。本文提出的模型的有效性使用各种机器学习算法,如随机森林, - - - - - -最近的邻居,和决策树年代使用和测试使用实际IoT-based数据集显示更好的准确性使用整体方法(19]。

3所示。数据收集的来源

统一,nonredundant地震目录数据被编译。参数数据来自两个国家,印度和尼泊尔,五年了。前兆数据收集从实际经历过地震的人年龄从18岁到75岁来自三个国家,如印度,尼泊尔,和肯尼亚,五年了。有些人经历了多次地震。参数数据没有零记录,没有异常值作为数据源的数据库是打扫房子。地震目录包括四区东,西,南,北两个不同国家的表4

3.1。参数数据的数据源

(1)印度气象部门提供的数据库和灾害研究今天的(印度)(2)国家中长期天气预报中心位于Sector-50,诺伊达(3)印度气象部门位于块M,卢迪,德里,扩展了他们的支持,利用历史数据。有许多来源作为历史数据收集来自两个国家。下面提到的几个(源链接文件:https://en.wikipedia.org/wiki/Geology_of_India,https://www.ngdc.noaa.gov/nndc/struts/form?t=101650&s=1&d=1,https://en.wikipedia.org/wiki/National_Geophysical_Data_Center,https://www.indiatoday.in/diu/story/300灾害- 80 - 000 -死亡- 100卢比的影响-印度-两个十年幽会- -自然灾害- 1767202 - 2021 - 02年- 08年)

3.2。前兆数据的数据源

通过谷歌形式调查分析,一些调查显示,人们在地震的经历不止一次在一生中也考虑。从调查数据删除重复数据,准确的数据库用于相关性和实时地震事件(参考表5

3.3。数据集描述

参数数据,输入值和属性从X1到×8和目标价值观从Y1日元。类型的目标在本质上都是整型值。关键参数大小之间的时间间隔是p波和s波的到来,和其他相关的属性和参数的依赖属性。属性的细节参数数据集列表如下表6

前体的输入值和属性从P1 P10及目标值Q1 Q10如下列表在表7。目标价值转换为数值。调查的分类数据的价值是用一些非常高的温度是由高、2-low, 3低,不确定,和5-magnitude依赖属性,和其他人是独立的属性。

3.4。预处理程序数据

预处理结合生成的数据参数和前兆数据集。参数收集了来自两国印度和尼泊尔,和前体是收集来自三个国家印度、尼泊尔,和肯尼亚。图形表示这是容易识别提供了不同元素的过程,了解各个步骤之间的相互关系。的顺序步骤开发一个预处理器的数据被放在一个逻辑顺序,数据挖掘技术可以应用在未来预测地震的发生,如图1

3.5。数据集成

数据预处理涉及不同的操作,可以组织基于规则的应用程序和数据库中的数据驱动转换成适当的格式在数据挖掘过程中为了更好的解释。数据集成是数据预处理的一部分结合参数和前兆,派生的标准化应用于正常化的例程将数据转换为其首选的和一致的格式。体积减少表示获得数量的属性,属性值,元组的数量产生相同或相似的分析结果。

3.6。特征选择

数据集成后,属性选择和提取新的预处理数据开发,这是两个变量之间的线性关联强度测量所需运用皮尔森系数。预处理数据的特征选择伙伴独立和依赖属性。

一些属性的特性不是很重要的模型建设和预测,而他们提高特性集的维数,这很难分析和需要更多的时间来训练数据,从而使复杂的决定。较小的属性给更好的准确性;因此,不那么重要的属性不能被视为在属性数据集。选择在逻辑上是合理的和解释表8

皮尔逊相关系数的:在这里,获得相关的皮尔森相关系数通过测量统计和测量数据为连续变量使用协方差的方法。关联关系定义如下:(我)它已经建立了一个重要关系数值数据编码数字的字符数据也更强的关系和相关性(2)较高的相关系数和属性紧密相关,其中一个可以被丢弃(3)如果相关常数是0,那么属性是独立的,如果它是负的,那么一个属性阻碍;即。,if the value of one attribute increases, then the value of the other decreases(iv)相关系数是衡量,“+ 1”,“1”之间的不同(v)当一个变量增加和其他变量也会增加,是正的相关性;当你降低,另增加时,它是负的。完全没有相关性是由0。所有相关属性的值在图所示2

4所示。使用回归实现现有的地震预测技术

支持向量机技术,然而,XGBoost,决策树,随机森林基于监督机器学习应用于数据集生成的结果。数学方程为监督学习技术如表所示9。最满意的结果是生成的随机森林方法随机森林分割预处理数据的节点,然后选择分裂导致均匀的子节点。然而,压力与动物行为是观察到的关系;在大多数的情况下,时间已经或多或少的范围内。在SVM深度交叉验证,虽然时间监控是不同的,即,morning and evening, but there is a relation between falling of leaves and temperature. Applying XGBoost gradient and values shows that the relationship between the atmospheric pressure and temperature is within a range of closer depth of the occurrence magnitude and the different ranges of depth. The findings of decision tree are constructed suggesting that there is a strong relationship with the possibility of occurrence of earthquake having ranges of magnitude with temperature and animal behaviour. The creation of subnodes like temperature, atmospheric pressure, location, and magnitude in random forest shows the relationship with falling of leaves of the tree, water movement in water bodies, pressure, and temperature having specific ranges of magnitude. The graphs generated by all five techniques showed more and less similar results, i.e., attributes among all five techniques which are compared and the factors which are resulting a closer proximity also reflecting the accuracy of findings of the individual existing technique. Once the mapping is done with regression, using linearly on preprocessor data generating a relationship and correlations on attributes in most cases, a consolidated magnitude range is found between 4.1 and 5.14, and the findings of implementation of existing techniques are shown in Table10

5。小说整体地震预测方法

许多早期的研究工作进行地震预测参数,即。在历史数据,以及许多研究工作只在前兆,即。根据调查数据,只有通过实现一个或多个数据挖掘方法。只有少数研究工作进行结合参数和前体以及使用多个数据挖掘技术。有限的事实相结合的研究动机是生成一个预处理数据结合参数和前兆。感兴趣的数据集相结合的原则一直使用回归预测地震发生的可能性,一定会产生更好的结果。虽然个人技术所产生的结果具有较高的方差和错误,只局限于线性数据集作为第五节中讨论,因此,积极开发一个方法结合个人方法有效,结果预测低方差和低不仅错误而且比早些时候发达合奏方法有更好的精度。合奏的新方法将是一个精确的、健壮的方法,减少培训错误和维度以及可用于非线性数据集在未来。也会作用于两个可见的组件,发现个人的平均平方误差模型,和其他量化的预测与个人预测由个人交互技术。

5.1。小说整体地震预测模型的工作流程(EEPM)

这部小说整体地震预测方法(EEPM)逐步逻辑方式,讨论了已被描述在不同的步骤数据收集、数据预处理、数据分割、实现和衡量工作表现的评估。EEPM如图的工作流程8

5.2。工作的EEPM
5.2.1。第一步:数据收集

参数,如位置、日期、时间、大小、深度、温度、经度和纬度收集两国印度和尼泊尔五年(参考表1)。前体的地点、日期、时间、温度、大气压力、水运动,动物行为,飘落的叶子,和降雨中收集到的实际经历过地震的人年龄从18岁到75岁来自三个国家,如印度,尼泊尔,和肯尼亚五年来表所示2。数据收集的细节部分中解释3

5.2.2。步骤2:数据预处理

预处理程序生成的数据准确、一致和完整性通过结合参数收集了来自两国印度和尼泊尔和印度三个国家的前兆,尼泊尔,和肯尼亚如图所使用不同的技术2解释上面的部分4。在这一步中,相结合的过程参数和前兆将阐述和图所示1。这里,参数X1和Y1和前兆P1和Q1的依赖数据结合得到预处理数据集所使用的个人技术。

5.2.3。步骤3:将数据

数据集分成两个部分;训练数据和测试数据估计参数的衬底,比较模型,和所有其他活动需要达成最终的算法。分割是进行训练数据的70%,和30%的测试集是用于估计最终的、公正的评估算法的性能。

5.2.4。第四步:整体地震预测模型的框架(EEPM)

提高被定义为的组合算法在弱学习者多次迭代后转换为一个强大的学习者。个人新模型生成一个强烈偏见较低的学习者在每个过程将其努力集中在最困难的观测,以适应降低方差。整体模型的加权和 弱的学习者。预处理数据初始化,和同等重量为每个数据点分配。增加将继续执行,直到得到正确的结果。的步骤如下(见图9)。(1)(a)在训练数据集,构建基本模型预测的观测记录训练集( ),一个微分损失函数” ”,这是用来识别模型以一个恒定值,迭代次数是用来寻找一个“ ”(预测值)损失函数的最小值

(b)作为目标列是连续的,接下来的损失函数与损失函数的迭代的数量 而“ ”定义为输入变量的向量 ; 从“输出变量或观察到的变量 ; “损失函数;” “预测价值;“argmin”参数最低;” ”的迭代次数;” “DT(决策树)的迭代次数( 第一个DT 意味着去年DT);” “数量的记录;” “前面的模型;” “拟残余DT生成;和“ “DT的剩余工资。

初始化的概率分布 ,在哪里 是数据点的数量,什么时候 数据点 正在寻找的函数生成的输出几乎等于什么 但在现实情况下,是有区别的预测输出和实际输出 这种差异被称为残余 现在,在梯度增加,另一个模型训练数据点 目标变量 ,在训练模型 最终的模型。和目标变量模型表示为

一个算法拟合训练数据使用各自的概率。发现拟残余 适应一种新的模式的残余。做出改变的模型,计算损失函数。

新模型添加到旧模型,并继续下一次迭代。(2)(一)拟残余计算迭代记录的数量;所有数据点都在同一预处理数据,和数据转换为数字

(b)的输出值为每片叶子DT计算的残差通过平均数字一片叶子,请参考上面的表格变量 (3)多个“ “通过解决以下优化计算问题 (4)该模型框架 (5)输出

EEPM导致以下结果出现的概率地震更在早上和动物的异常行为和树叶的下降与上升主要在水中运动,主要是在寒冷的温度。东使用梯度算法拟合许多模型的样本预处理数据集,涉及到许多不同的技术使用另一种方法的拟合和学会最佳组合由不同的决策树预测和随机森林,如果包含任何额外的树或树。训练模型可以表示为TM1,TM2 构造模型,运用数据挖掘技术像线性回归模式,这是一个全面的技术,通过不同的算法结合,生成图表,和建立关系有TF预测模型1,特遣部队2 (参考图10)。合奏的泛化能力通常远远高于一个学习者,所以整体方法非常有吸引力和肯定,被认为是如图的整体模型9

5.2.5。第五步:比较分析EEPM不同个体基于线性回归的方法

EEPM与现有技术的比较分析将基于性能的措施 ,调整 ,均方误差(MSE),均方根误差(RMSE)和方差。本文以上重要措施在不同的个人方法导出使用回归进行比较,以确定结果的正确性以及与EEPM更好地理解的整体方法的结果相比,个人的方法。绩效指标的价值 在SVM是0.64,然而,是0.76,XGBoost是0.74,决策树是0.80,随机森林是0.82,EEPM最大是0.88。不同的等测量值调整 ,方差、MSE和RMSE也计算,分别(参考表11)。的图形分析结果如图11

5.3。与早期的合奏EEPM方法的比较分析

最前面的整体方法使用回归或进行分类和执行通过叠加的乐团最好的预测从多个良好运行的机器学习方法。所有先前的整体方法比较表12基于不同的措施。,EEPM利用提高弱学习方法转换成强大的和预测的准确性是一个重要的测量用于与其他先前的整体方法比较,结论是(参考图12)。

个人技术在更大程度上不会显示精度的数据模式和关系有偏差和方差高使用训练数据集和测试数据集,而导致整体方法考虑模式使用训练数据和关系数据集的低偏差错误和低方差。EEPM通过独特的加工数据集成不同的方法(参数和前体),结合许多弱学习者生成一个强的学习者。压力和温度的关系与动物行为更为突出,发生地震的可能性更早上在寒冷地区拥有特定大小范围在4.1和5.8之间。生成的 是0.88,调整 是0.85,方差为0.19,均方误差是0.20,RMSE是0.44和87.8的准确性通过EEPM得出EEPM可以预测更好地预测地震多发地区有更好的精度。也得出结论,必须有一个定期检查由地震,计量,或不同的机构与地震相关研究在早晨,在温度下降,不同寻常的动物运动,压力下降,和不寻常的行为树和水体在地震多发地区,这可以给更高的预测地震的可能性。

6。贡献的工作

在该地区地震的巨大威胁,易发地震的位置,显然是非常重要的开发一个有效的风险评估系统,和预防地震的负面影响是非常必要的。在这方面,应该说,自然灾害的预测是很有问题的,但是,毫升的应用方法与适当的数据集,然后通过合奏给一个机会来预测位置的地震发生的可能性,有一个愤怒的大小和观察一些外部特性,比如动物的反常运动,飘落的叶子,虽然没有快速上升和下降的温度和压力的准确日期和时间的定义一场灾难。然而,可以预测地震在几个月内,例如,让人们更多的准备自然灾害考虑以上提到的;可以得出结论,大学地区经常发生地震,因此,他们代表一个严重威胁人们生活在该地区。EEPM可以诱发地震学家和研究人员应用新技术的兴趣以及其他毫升技术和不同的系综方法使用这个作为基础,得到更准确的结果。

这项研究的新颖性是真正的数据集记录从实际发生的地震的位置。人经历地震的数据也记录下来,然后,一个独特的数据集是基于数据集。这部小说为个体预测数据集应用于毫升,然后,整体技术是应用于个人技术得到更好的和准确的预测。

研究的局限性的突破未能经得起审核寻找可靠的前兆。发生地震的不可测的是高度敏感的细节的地球大量不仅仅是在爆心投影点的附近。

7所示。结论和未来的范围

研究的结论指出,必须有一个定期检查,地震学家,计量,或不同的机构与地震相关研究在早上,在温度下降,不同寻常的动物运动,压力下降,和不寻常的行为树和水体在地震多发地区,这可以给较高的预报地震的可能性。

独特的预处理程序生成的数据可以使用其他数据挖掘方法回归以及分类。这个预处理器数据可以通过添加一个或多个属性修改为更好的结果和预测,可以利用不同的数据挖掘方法。

这部小说EEPM当然是要充实人员,地震学家和计量部门单独理解不同的数据挖掘方法的应用以及整体的力量更好的方法和准确的预测。EEPM可以更强的应用回归的重要性以及分类结合更多的个人数据挖掘方法,更多的迭代,也可以使用多个决策树和利用非线性数据。EEPM支持使用叠加和应用更多的个人方法在神经网络和其他系统从分散的起源。

数据可用性

使用的数据来支持本研究的发现可以从相应的作者。

的利益冲突

作者宣称没有利益冲突。

确认

我感谢喜欢通过我的感谢我的上司Prinima Gupta博士和cosupervisor教授(博士)Felix Musua专家的建议和鼓励。我还要感谢Vobbani先生Venkateswarlu,先生Atharva Kulkarni Nikhil Sahu先生和Saikat Das的诚实的支持与合作。