研究文章|开放获取
Zi-Ke张,你们的太阳,Chu-Xu张矿方,湘,壮族Liu Xueqi Wang亏, ”诊断和预测地球的健康通过生态网络分析”,离散动力学性质和社会, 卷。2013年, 文章的ID741318年, 10 页面, 2013年。 https://doi.org/10.1155/2013/741318
诊断和预测地球的健康通过生态网络分析
文摘
生态平衡是一种最具吸引力的主题在生物、环境、地球科学等。然而,由于生态系统的复杂性,很难找到一个完美的方式最终解释所有的潜在影响。在本文中,通过考虑几个重要的元素,我们寻求建立一个动态网络模型来预测地球的健康,试图识别和解释人类行为和政策如何影响模型的结果。我们首先实证分析节点的拓扑特性和时间特性,提出一个基于香农熵。地球的健康指数其次,我们确定了每个元素的重要性,通过机器学习的方法。第三,我们使用扩散模型来预测地球的健康。最后,我们结合拓扑属性,提出健康指数识别影响观察生态网络中的节点。实验结果表明,海洋是影响地球健康的关键节点,节点和大国也很重要影响地球的健康。此外,研究结果表明一种可能的解决方案,返回更多生活的土地可能是一个有效的方法来解决生态平衡的两难境地。
1。介绍
生态平衡是一种最具吸引力的主题在生物、环境、地球科学和许多其他相关学科(1),特别是工业化已经经历了约二百年。为了更好地理解生物圈如何回应的越来越大的压力(例如,人口爆炸,水和空气污染,气候变化),有一个巨大的研究致力于探索可能的解决方案在缓解疼痛。然而,由于生态系统的复杂性,这是不容易找到一个完美的方式最终解释所有的潜在影响2)负责生态脆弱性(3,4]。在不同的研究中,生态网络分析(ENA) [5,6)被认为是很有前途的方法来评估地球的健康7]。
可以从各种信息中提取生态网络,导致不同类型的网络,其中每个节点代表一个国家,一个大陆,海洋,栖息地,或一个公园,和一个边缘存在两个节点直接或相互影响时,不同的经济影响,人口流动环境污染、经济水平,等等5,8]。
自从网络信息没有显式地提供,我们开始我们的研究通过构建全球生态网络通过提取节点和链接从世界地理地图(见图1)。我们认为每个国家或海洋作为一个节点,和一个链接存在如果两国/海洋地理上邻近的(或国家和海洋)。例如,两个节点,连接中国和俄罗斯,因为它们是邻国。此外,还有一个太平洋和中国之间的联系,因为他们也相互连接。图2显示了构建网络。此外,我们还要考虑五每个节点的时间因素,包括人口规模、经济水平、栖息地面积大小、能源消耗、空气污染,可能会影响全球生态环境。
生态网络构建时间后,我们开始我们的研究如下。(我)首先,我们看到网络节点拓扑属性通过制定本地的特性和全球网络的拓扑结构。(2)其次,我们研究如何发展动力因素以及它们是如何影响地球的健康。(3)第三,我们使用机器学习算法来确定生态网络的影响因素。(iv)第四,我们设计一个传播模型来预测地球的健康和执行敏感分析,测试它的鲁棒性。(v)最后,我们使用生水起沉积法(9)来识别影响力的节点通过考虑因素的权重。
许多研究采用行动研究(或)方法,如最小生成树(MST),发现数学的解决方案(例如,最低成本/最大流量)。希尔提出了一个矩阵的解决方案来解决有一定长度的路径数目从任何两个节点(10]。芬恩提出了三个重要指标来评估生态系统流动,包括整个系统贯流式(TST)平均路径长度的流入(APL)循环索引(CI),广泛采用在讨论质量和能量流机制(11]。然而,研究从网络科学(NS) [12- - - - - -19)考虑生态问题从一个非常新颖的观点。它不仅抽象节点和附属属性,但也考虑到各种相互作用和功能。因此,NS-based方法,包括链接预测和导航,介绍了,试图通过分析发现潜在的全球拓扑局部结构和动力学(20.,21]。
2。方法
在本文中,我们采用网络科学分析生态网络主要因为它的鲁棒性和可辩解的解决方案在模拟图的静态和动态特性。在本节中,我们将描述网络模型的建设,包括节点和边信息,财产配方,以及动态演化。特别是,我们开始我们的研究基于几个必要的假设。(我)生态网络的所有数据和信息收集的可靠统计数据库;(2)属性和拓扑网络中一个节点的位置是很重要的对地球的健康评估的影响;(3)空间网络有相似的结构和功能与真正的生态网络。
2.1。静态属性
在构建网络图用于描述其结构,在哪里是节点集和是边组(表吗1显示了观察到的生态网络的基本信息)。在这里,我们考虑四个各自的指标来分析生态网络的静态属性。
|
||||||||||
|
表示节点的数量,表示边的数量分别表示网络密度。 |
||||||||||
指数(i)学位。度指数(22]表明一个国家有多少个节点/海洋连接。当然,节点的度指数被定义为 在哪里如果有一个节点之间的联系和;否则。
(2)中间状态指数。中间状态(22)被定义为有多少目标节点最短路径通过。中间性越大越多,连接目标节点扮演的角色。在一个给定的网络,中间性来标示 在哪里如果有一个节点之间的最短路径和通过节点。
(3)亲密指数。亲密关系(22)被定义为相反的目标节点和其他节点之间的距离。亲密是越大,越接近他们,反之亦然。在一个给定的网络,亲密来标示 在哪里表示节点之间的最短路径的长度和。
(iv) 生水起指数。生水起(23),表示为是核心的节点数量是最大的价值的生水起包含该节点。这是获得如下:(i)删除所有节点图的程度小于和(2)然后移除这些顶点反复,直到没有进一步去除是可能的。剩下的结果,如果存在,是生水起。因此,网络被组织为一组先后封闭核心。
2.2。动力因素
除了静态网络属性,我们收集各种数据从世界银行(http://data.worldbank.org/)调查中的所有节点的动态因素生态网络。数据集包括人口规模、人均GDP、陆地和海洋领域,单位国内生产总值能源消耗和二氧化碳排放的每一个国家从1962年到2011年。具体来说,我们观察后的五个因素为每个节点。(我)人口规模,表示节点的总人口在今年。(2)经济水平,表示的人均GDP节点在今年。(3)栖息地面积,表示是节点的土地和海洋的面积在今年。(iv)能源消耗,表示,单位国内生产总值能源消耗节点在今年。(v)空气污染,表示,是二氧化碳排放的总量的节点在今年。
图3显示了五个因素变化从1961年(HA从1990年开始,电子商务由于数据缺失)从1980年开始到2011年。可以看出,一般来说,所有的值逐年增加的因素。它还表明,人口规模与经济水平高度积极的关系。例如,中国的人口规模(中文)和美国都在前五名的国家,和他们的平均国内生产总值还高的所有126个国家之一。与此同时,空气污染是最严重的五个国家排名,这可能表明经济的发展将会对环境产生负面影响。此外,我们列出了前20节点静态属性和动态因素表2。可以看出,大西洋(ATO)拥有最重要的角色在维护生态网络的鲁棒性,因为它连接最多的节点(表3)。俄罗斯(俄文)具有较高的网络属性,与学位等级数,中间性等级数和亲密等级号码,但同时有一个相对糟糕的空气质量(排名第3)。其他国家,比如中国(中文),有类似的情况。美国相对不是排名在前网络结构列表,但是却有一个很大的人口数量(等级3)和高经济水平(等级6)数量,这可能促进其影响在影响全球地球的健康。
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
表示程度指数,表示中间状态指数,表示亲密指数表示生水起指数,分别。PS、EL、HA、EC和AQ,分别表示人口规模、经济水平、栖息地面积大小、能源消耗、空气污染在2011年。 |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||
(一)
(b)
(c)
(d)
(e)
2.3。地球的健康指数的定义
灵感来自之前的分析,我们认为地球的健康不仅仅是单一因素的影响,但共同影响造成很多复杂的因素。在本文中,我们使用香农熵(24- - - - - -26)将所有可能的影响因素描述地球的健康,用,因为 在哪里因素的标准化分数吗为节点,表示节中定义的所有因素的集合2.2,最终地球的健康价值,呃,运行在所有节点的总和。根据原始的定义香农熵熵值越大,更平等的分配。因此,是一个较大的值表明良好的生态平衡这两个国家之间情况和因素,因此表明地球的身体好,反之亦然(表4)。
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
2.4。识别影响因素通过机器学习的方法
2.4.1。随机森林
我们使用随机森林(27评价因素的重要性。随机森林是一个整体回归量/许多决策树分类器,由然后输出值模式个人/类输出值的树。在这个场景中,我们应用此方法在一个回归的方法和用它来评估每个特性的重要性。与其他回归模型相比,我们选择后的随机森林模型,因为它的优势为我们的解决方案:(我)它可以解决高阶变量交互或相关预测变量;(2)不仅可以用于预测,但也评估变量的重要性;(3)它可以部分地克服过度拟合的问题。
2.4.2。基础学习:分类和回归树(CART)
给定一个训练向量,和一个标签向量,决策树递归分区空间的样本具有相同标签可以归类在一起。让数据节点由,对于每个候选人分裂组成的一个特性和阈值;数据分割成两个部分: 不洁的使用一个杂质函数计算,选择哪一种取决于任务得到解决: 然后,选择减少杂质的参数: 这个递归后的子集和直到达到最大允许深度,。在回归问题中,一个节点,代表一个地区与观察,我们选择的标准均方误差(MSE)作为杂质的功能:
2.4.3。随机森林建设
让培训案例的数量让变量的回归量的数量。我们被告知这个号码用于确定输入变量决策树的一个节点;应该小于多少。(我)这棵树通过选择选择一个训练集次,更换所有培训情况(即可用。,引导样本)。使用其余的树的情况下估计错误。(2)树的每个节点随机选择变量的基本节点的决定。基于这些计算的最佳分裂在训练集变量。(3)每棵树是成年的,而不是修剪(可能在构建一个正常树分类器)。预测新样本在树下推。训练样本的价值分配在最终的终端节点。
2.4.4。Out-of-Bag(OOB)评价
评估随机森林模型中,我们使用2/3的数据作为训练集,剩下的1/3(说Out-of-Bag)被视为测试集,当学习者构建基础。我们计算的平均结果50-round模拟来减轻随机波动。对于每一个树,Out-of-Bag(OOB)模拟测试,详细如下。(我)考虑相关的样本。(2)表示由犯错一棵树t的错误样本。(3)随机排列的值在交换样品用预测的误差摄动示例: 在哪里代表每个数据的变量。然后我们可以得到为每一个和规范化。越大是,更重要的是变量。图4显示了结果所有五个功能。可以看出,在所有的功能,栖息地面积大小的值是最大的,因此对地球的健康最重要的因素,这是与公共媒体所报道的协议的人,尤其是人类居住城市,现在比以前占据越来越小的空间,导致相对更糟的生活条件。
2.5。预测地球的健康生态网络
我们使用一个动态扩散模型(28)来预测地球的健康通过考虑观察生态网络结构。模型运行如下。(我)在第一步,每个节点设置一个健康值平均地球的健康指数(定义为(4从最近五年)。(2)然后我们选择10%的节点作为“种子”节点并添加每个种子节点。的计算了平均增量最近五年的价值观。(3)在每个时间步,每个节点将会影响所有相邻节点的地球的健康指数 在哪里地球的健康影响节点吗来和和可调参数。(iv)然后,该节点在时间步的地球的健康指数求和所有的邻居, 在哪里如果有一个节点之间的联系和节点,否则。(v)最后,全球地球的健康,在时间步总结了在所有节点:
3所示。结果
3.1。性能比较
为了测试我们的传播模型的性能,我们集和预测全球计算机仿真地球的健康。此外,我们也使用高斯拟合与我们的模型进行比较。图5给出了比较结果。可以看出,我们的模型能更好地适应实际数据,进行比较高斯拟合。此外,该呃指数显示,从2008年地球的健康状况恶化,这给我们的警告,我们应该把更多的关注我们的环境。相应地,结果部分2.4.4建议我们一个可能的解决方案,恢复更多生活的土地可能是最有效的方法来解决这个难题。
3.2。敏感性分析
然后我们进行敏感性分析来测试我们的模型的鲁棒性。我们随机删除的链接,看看是否我们的模型是可靠的。图6报道不同的预测模型对各种价值观的结果。可以看出,模型的预测结果是相当强劲,即使大部分的链接,例如,60%是移除。因此,可以得出结论,我们的模型是可靠的预测地球的健康。
3.3。识别影响节点生态网络
我们的地球的健康指数试图诊断和预测全球地球的健康状况。此外,为了找到哪个节点(说国家或海洋)中扮演最重要的角色在影响着地球的健康,我们另外执行分析节点重要性排序。我们整合生水起的价值,(见部分2.1),地球的健康指数评估节点的重要性,因此定义为
图7说明了节点重要性在影响着地球的健康与相应的排名,一些典型节点标记。海洋(最高等级)的确是关键节点在影响着地球的健康;美国、俄罗斯和中国也很重要国家影响地球的健康。一些小国,如马达加斯加(MDG)和伊拉克(IRQ),对地球的健康扮演更重要角色。
4所示。结论和讨论
在这篇文章中,我们收集各种数据,构建一个145个国家(包括126个国家,海洋19 /海洋,403边缘)世界上生态网络,每个节点代表一个国家或一个海洋和每条边代表地理邻近相应的两个节点之间的关系。首先,我们分析的节点拓扑属性和荷载特性。其次,我们提出一个基于地球的健康指数香农熵。第三,我们确定元素的重要性,通过机器学习的方法(随机森林)。第四,我们设计一个传播模型来预测地球的健康和执行敏感分析,测试它的鲁棒性。最后,我们把拓扑属性(生水起指数)和健康指数来确定观察到的有影响力的国家生态网络。
模型结果表明,海洋(最高等级)的确是关键节点在影响着地球的健康。的大国家,例如,美国、俄罗斯和中国,也很重要的国家影响地球的健康。相应地,我们建议一个可能的解决方案,恢复更多生活的土地可能是最有效的方法来解决这个难题。拓扑属性的组合和地方因素导致性能良好的好的和坏的趋势预测地球的健康。模型可以很容易地扩展,考虑更多的因素。然而,我们的模型需要更充分的数据的实证支持。此外,增量机制可能会阻碍长期预测。
确认
这部分工作是由中国国家自然科学基金(批准号。11105024,1147015,1147015,11205040),611272(项目GROWTHCOM)欧盟FP7格兰特之下,和创业基金会和Pandeng项目杭州师范大学。
引用
- l . v . Berkner l·c·马歇尔,“地球的大气中氧的浓度的历史,”法拉第的社会讨论37卷,第141 - 122页,1964年。视图:出版商的网站|谷歌学术搜索
- d·b·安东尼,a·h·伊丽莎白,b .乔迪et al .,“接近地球的生物圈,状态转变”自然卷。486年,52-58,2012页。视图:出版商的网站|谷歌学术搜索
- r . v .鞋底和j·m·蒙托亚“生态网络的复杂性和脆弱性,”《皇家学会学报B,卷268,不。1480年,第2045 - 2039页,2001年。视图:出版商的网站|谷歌学术搜索
- j·m·蒙托亚、s l·皮姆和r . v .唯一的“生态网络和他们的脆弱,”自然,卷442,不。7100年,第264 - 259页,2006年。视图:出版商的网站|谷歌学术搜索
- r·e·Ulanowicz“生态网络分析,定量方法”计算生物学和化学,28卷,不。5 - 6,321 - 339年,2004页。视图:出版商的网站|谷歌学术搜索|Zentralblatt数学
- b . d .英寻,m . Scharler r . e . Ulanowicz和b . Hannon“生态网络分析:网络建设、”生态模型,卷208,不。1,49-55,2007页。视图:出版商的网站|谷歌学术搜索
- m·凯勒·d·s .丢弃w·w·Hargrove f·m·霍夫曼,“大陆全国生态观测站网络战略,”生态与环境前沿》第六卷,没有。5,282 - 284年,2008页。视图:谷歌学术搜索
- c . Kazanci和问:妈,“扩展生态网络分析措施动态生态系统模型,”生态模型卷,242年,第188 - 180页,2012年。视图:出版商的网站|谷歌学术搜索
- m . Kitsak l·k·盖洛s Havlin et al .,“识别复杂网络的影响力的传播者”自然物理》第六卷,没有。11日,第893 - 888页,2010年。视图:出版商的网站|谷歌学术搜索
- j·希尔,组织结构的影响:一个理论系统(博士论文)美国佐治亚大学,雅典,Ga, 1981。
- j·t·芬恩”措施的生态系统结构和功能来源于流动的分析,“理论生物学杂志》上卷,56号2、363 - 380年,1976页。视图:谷歌学术搜索
- d·j·瓦和s . h . strogat small-world9网络”的“集体动态自然,卷393,不。6684年,第442 - 440页,1998年。视图:谷歌学术搜索
- A.-L。巴巴斯和r·阿尔伯特”出现随机网络的扩展,“科学,卷286,不。5439年,第512 - 509页,1999年。视图:出版商的网站|谷歌学术搜索|Zentralblatt数学|MathSciNet
- r·艾伯特和A.-L。巴斯”统计力学的复杂网络,“现代物理学的评论,卷74,不。1,47 - 97、2002页。视图:出版商的网站|谷歌学术搜索|Zentralblatt数学|MathSciNet
- s . n . Dorogovtsev和j·f·f·门德斯,“进化”的网络,物理学的进步,51卷,不。4、1079 - 1187年,2002页。视图:出版商的网站|谷歌学术搜索
- m·e·j·纽曼,“复杂网络的结构和功能,暹罗审查,45卷,不。2、167 - 256年,2003页。视图:出版商的网站|谷歌学术搜索|Zentralblatt数学|MathSciNet
- s . Boccaletti诉Latora,莫雷诺y、m·查韦斯和D.-U。黄”:复杂网络的结构和动力学”,物理的报告,卷424,不。4 - 5,175 - 308年,2006页。视图:出版商的网站|谷歌学术搜索
- l·f·科斯塔f·a·罗德里格斯g . Traviesor和p·r·博厄斯,“复杂网络的特征:一个测量,调查”Physiscs进步卷,56号1,第242 - 167页,2007。视图:出版商的网站|谷歌学术搜索
- j . jonkleinberg“社会和技术的融合网络,”ACM的通信,51卷,不。11日,第72 - 66页,2008年。视图:出版商的网站|谷歌学术搜索
- z . k .张和c .刘“社会化标签网络的超图模型”杂志的统计力学:理论和实验文章ID P10005卷。2010年,2010年。视图:出版商的网站|谷歌学术搜索
- l . l . Lu和t .周”,在复杂网络链路预测:一项调查,”自然史一,卷390,不。6,1150 - 1170年,2011页。视图:出版商的网站|谷歌学术搜索
- l·c·弗里曼,”中心在社交网络概念澄清,“社交网络,1卷,不。3、215 - 239年,1979页。视图:谷歌学术搜索
- s . n . Dorogovtsev a . v . Goltsev和j·f·f·门德斯,“K-core组织复杂的网络,”物理评论快报,卷96,不。4、文章ID 040601, 2006。视图:出版商的网站|谷歌学术搜索
- c·e·香农”通信的数学理论,贝尔系统技术》杂志上27卷,第423 - 379页,1948年。视图:谷歌学术搜索|Zentralblatt数学|MathSciNet
- n .鹰m·梅西,r·邓肯“网络多样性和经济发展,”科学,卷328,不。5981年,第1031 - 1029页,2010年。视图:出版商的网站|谷歌学术搜索|Zentralblatt数学|MathSciNet
- z江,w . j .谢m . x, b . Podobnik w . x,和h e . Stenley”模式在人类交流动态,称为“美国国家科学院院刊》上的美利坚合众国,卷110,不。5,1600 - 1605年,2013页。视图:出版商的网站|谷歌学术搜索
- l . Breiman“随机森林”,机器学习,45卷,不。1,5-32,2001页。视图:出版商的网站|谷歌学术搜索|Zentralblatt数学
- 刘和Z.-K。张“动态社会网络,信息传播”非线性科学与数值模拟通信,19卷,不。4、896 - 904年,2014页。视图:出版商的网站|谷歌学术搜索|MathSciNet
版权
版权©2013 Zi-Ke Zhang et al。这是一个开放的分布式下文章知识共享归属许可,它允许无限制的使用、分配和复制在任何媒介,提供最初的工作是正确引用。