研究文章|开放获取
Maritza Arganis, Rafael Val, Jordi Prats, Katya Rodríguez, Ramón Domínguez, Josep Dolz, "水温模型的遗传规划与标准化”,土木工程进展, 卷。2009, 文章的ID353960, 10 页面, 2009. https://doi.org/10.1155/2009/353960
水温模型的遗传规划与标准化
摘要
在没有标准化数据和有标准化数据的情况下,提出了遗传规划(一种进化计算工具)的应用,目的是根据易于测量的气象变量来模拟河流中水温的行为。探讨它们的解释能力,并强调变量标准化的效用,以减少那些有大方差的影响。与西班牙埃布罗河(Ebro River)的水温行为相对应的记录数据被用作分析案例,当数据标准化时,该模型的性能有所改善。这一改进反映在均方误差的减少。最后,利用本文所得到的模型对2004年的水温进行了估算,以证明其对预测目的的适用性。
1.介绍
进化计算已被广泛应用于水力学和水文,例如savic等人的研究[1, Madsen等人[2, Dorado等[3.,与降雨径流过程有关,如Hong和Rosen所讨论的城市含水层模型[4,或者修改遗传规划算法,试图与Keijzer和Babovic所应用的自然和复合渠道中的问题维度达成一致[5, Harris等[6, Keijzer等[7].另一方面,水温是一个需要考虑的重要参数,因为人类活动会导致水温的变化。在过去的三十年里,人们对天气变化进行了各种各样的研究,这些研究与洪水和干旱等极端事件的增加有关。8)上升的空气和海水温度(例如:Seguí [9];韦布和诺比利斯[10)、冰融化和温室效应(如Greve [11]),以及它们对周围生态系统的所有影响(例如,Schindler [12, Álvarez Cobelas等[13])。
动机与模型,允许水温的表示行为每年是因为每一次可能的异常增加该参数发生,后果和影响水的理化性质与相应的影响在水生生物有很多。一些模型已经通过空气温度和水温之间的非线性关系应用于最高水温(Caissie et al. [14),但在某一特定时期内,与水温变化有关的还有其他重要变量。为了保持生态平衡,对这条河的那一段水质进行持续监测是非常重要的。淡水生物大多是变温生物,因此在很大程度上受水温的影响。水温升高的一些预期后果是生命周期的变化(Hellawell [15];温菲尔德及尼尔森[16]),随着外来物种的到来,物种分布发生了变化(Walther等人[17]),以及流行病的蔓延(Harvell等人[18)作为可能的结果。水生动植物依靠溶解氧生存,水质参数也是水温的函数。
2.研究网站
本研究使用的实地数据取自西班牙埃布罗河下游。这条河的流域长8万5千公里2年平均入水量1.7万hm3.在自然的政权。沿河有三座水坝(图)1),从而改变水温状况(Val [19Mequinenza (1534 hm .3.), Ribarroja (210 hm3.)和弗里斯(11 hm3.).在弗里克斯大坝下游五公里处,水是从用于冷却的河中提取的,位于核中心Ascó。水被送回温度更高的河流,向下游流向米拉维特。在这个区域安装了几个气象测量站,包括一些测量水温(图1).这些数据应用于Val [19和Prats等[20.].此外,最近还进行了一项重要的工作,以获得易于测量的气象变量(以Ribarroja站为中心)相关的水温预测方程(Arganis等人。[21,22])。
3.方法
3.1.进化算法
进化算法,也被称为进化计算(EC),在本工作中使用的优化工具,在基于计算机的问题解决的设计和实现中使用进化过程的计算模型。这些进化技术的一般定义和分类载于Bäck [23].他将EA定义为一种搜索和优化算法,受自然进化过程的启发,它维持一个根据选择规则和其他操作(如重组和突变)进化的结构种群。在这里,所有基于进化的算法的结构在算法中显示1.
|
||||||||||||||||||||
与自然进化和遗传的方式类似,这些算法适用于一个种群N个人,表示给定问题的潜在解空间中的搜索点。每个人适应每一代t被调查的问题是由一种叫做“健身”。种群通过遗传过程,一代一代地向更好的搜索区域进化,例如选择,重组,和突变.选择过程使用适合度测量来选择上一代的个体被复制的,倾向于高质量的。重组操作促进了亲本个体之间的遗传信息交换,从而产生后代。突变操作通过在种群中引入一些变化来改变遗传信息。评估过程重复进行,直到满足预定义的终止标准,或者直到达到最大的生成(迭代)次数。这种人工进化过程是本文使用的基于进化的算法——遗传规划的基础。
3.2.遗传规划算法
典型的遗传规划算法是由一组函数组成的,其中包含了运算符,超越函数,甚至关系运算符或条件运算符(IF),以及带有变量和常量的终端集.初始种群是随机创建的,由之前根据问题域(图中给出了GP个体的一个例子)定义的节点(操作符加上变量和常量)组成的解析树个体2).必须定义一个目标函数来评估每个个体的适应度(在这种情况下,每个个体将是节点随机组合的结果模型或程序)。然后将选择、交叉和变异操作应用于最优个体,并创建一个新的种群。整个过程重复进行,直到达到给定的代数(Cramer [24], Koza [25])。
3.3.物理现象及其相关变量的简要描述
来自河流的水与它周围的大气和河床进行着持续的热交换。这个过程可以达到平衡,使水损失的热量等于吸收的热量。正常情况下,随着海拔的降低,整个河流的水温在自然状态下会升高。在这种空间变异上,还叠加了两个时间变异。在河段中,温度按日和年的周期变化。
在Val进行的研究中[19],对弗里斯水力发电中心下游的埃布罗河五公里的河段进行了分析;在这个范围内,每小时的温度测量数据可用于不同的路段。据观察,在夏季温度为9°弗里斯中心区的温度与建坝前的温度可能存在差异。此外,在弗里斯中心的下游,水温恢复了,试图达到与周围环境的热平衡。为了估计河水在经过某一河段时所吸收的热量及其相应的温度变化,在该河段所接收的热量和所散发的热量之间建立了一个能量平衡。这可以根据Edinger等人提出的热平衡来完成[26].这个差额可以表示为 在哪里水沿河段移动时吸收的总热量,以自由水面的平方米计算,单位是W/m吗2.这是水沿着河段运动时不同的热量输入和输出平衡的结果。水面所吸收的每平方米自由表面的短波总太阳辐射(入射-反射)是以W/m来计算的吗2.这是入射太阳辐射的函数r年代和反映,它与,这个比例是由常数给出的也被称为反照率。水吸收的大气长波辐射(入射减去反射)是否以自由表面平方米计,单位为W/m2.水的长波辐射是以自由表面平方米计,以W/m计吗2,是平均地表水温度的函数,.通过蒸发损失的热量是否按自由表面面积计算,单位为W/m2,由风速的函数决定,,饱和蒸汽压和空气的蒸汽压。相对湿度也是影响水-大气热交换的一个变量。大气和水之间通过传导而交换的敏感热是否以自由表面平方米计,以W/m计2,取决于空气温度还有水.为每平方米河段与底物(河床)交换的热量。
水团沿经度河流流动时所储存的热量l据估计,,在那里为水吸收的热量,单位为(W/m2),水温增量是否为(°),循环流量,单位是(m3./秒),水的比热是(千卡/°公斤),是水的密度,单位是Kg/m3.),所研究区域的经度是(m)和吗为河流的有效宽度,单位(m)。
另一方面,通过对连续年水温时间变化的历史行为进行分析,在周期变化和增减趋势上均发现了相似的结果。这就导致了对气温变化在年之间的相关性的预期和前几年的温度。
这种背景的描述导致了在预测模型中使用的测量变量的选择。
此外,当用遗传规划方法拟合物理变量时,可以提出几个关于问题维度的问题。但考虑到计算模型中得到的常数可能存在维数,这个问题是可以解决的。通过分析模型项,可以对相关变量作出新的物理解释。
在本文中,为了简单起见,只考虑了四个算术运算符:.
选取了12个自变量、1个因变量和一个实常数向量。因此,在非标准化情况下,终端集为
在哪里和是1998至2000年录得的每小时平均相对湿度值,以小数表示,和1998年、1999年和2000年的平均气温值是°吗,和为1998年、1999年和2000年的平均风速,单位为米/秒,和1998年、1999年和2000年的平均太阳辐射是W/m2,从2000年开始每小时的平均水温是否以°计,是一个实常数向量。
测试采用了1小时、每日和每周的平均水温。
在标准化的情况下,最后的变量都是无量纲的。
3.4。目标函数
本问题所考虑的目标函数定义为计算数据与实测数据均方误差的最小化:
在哪里测量数据,计算数据,计数器从1到数据数.
遗传规划算法在MATLAB (MathWorks [27])。
3.5.标准化
通过减去平均值并除以标准差对变量进行标准化:
在哪里为标准化变量,无量纲化;为标准化前的变量;的平均值是,单位相同(使用算术平均数);的标准差是,单位相同.
具有大方差的变量往往比具有小方差的变量对结果模型的影响更大。标准化变量可以是有利的,因为它们的均值是零,而它们的第二个矩(方差)是1。
3.6。输入数据
气象和水温数据是在安装在埃布罗河上的测量站采集的。数据包括每分钟测量的10分钟平均值。水温是在弗里斯水电站下游测量的。气象变量是在位于Ribarroja大坝的测量站测量的。计算各变量的小时平均值,作为输入数据:相对湿度()、气温()、风速()及太阳辐射()作为自变量,而水温()为因变量。
第一次实验使用原始数据,第二次实验使用标准化数据。两种实验的GP参数设置如表所示1
|
||||||||||||||||||||
3.7。线性模型
为验证该方法的适用性,得到实测数据与计算数据之间的相关系数:
在哪里是变量之间的协方差吗和的标准差是和,分别。
4.结果与讨论
4.1。小时的平均数据
遗传规划算法倾向于产生相对简单的模型。在两个实验中得到的方程是
在哪里2000年平均水温的估计值是°吗;1998年的水温是°吗;1999年的水温是°吗;2000年水温的标准差估计值是°吗;1998年水温的标准差是°吗;表示1999年水温的标准差,单位为°.表格2显示了两种模型得到的均方误差(MSE)。
意思是()及标准差()的残差,以实测水温与计算水温之差计算,见表3..测量数据和计算数据,包括两个实验的差异,如图所示3.和4.
在数据5和6,用(6)和(8)与恒等函数绘制,得到相关系数(),检查配件的线性度。数据结果3.- - - - - -6采用标准化后,计算数据有了改善;残差略有减少,波动变软,这一点通过相关系数得到验证。均方误差降低约30%,数据离散度降低(残差标准差降低17%)。
4.2.每日平均数据
在这种情况下,未标准化和标准化得到的方程为:
在哪里2000年的日平均水温值是用°估计的吗;,为1998年录得的日平均相对湿度值,以小数表示;1998年和1999年的日平均气温是°吗;1998年的日平均太阳辐射是°吗;前缀标准化变量。
通过应用反向标准化过程,
在(13), 2000年的数据是根据(9)和(10),但考虑到每天的测量。使用(11)和(13)详列于附表4.意思是()及残差标准差()的结果见表5.
水温随时间的变化,并将得到的差异绘制在图上7和8.数据9和10用恒等函数比较实测和计算的日平均水温。日常分析的结果显示,使用标准化数据得到的方程的均方误差减少了近40%。在这种情况下,残差的标准偏差也更小(比使用非标准化低12%)。数字11给出了应用遗传规划算法时每一代最优个体的性能实例。
4.3.每周平均数据
在最后的实验中,得到了未标准化和标准化的方程
分别在哪里2000年的周平均水温值是用°估计的吗;和为一九九八年及二零零零年录得的周平均相对湿度值,以小数表示;,1998年、1999年和2000年的每周平均气温是°吗;,为1998、1999、2000年的周平均风速,单位为米/秒;和,为1998年和1999年的周平均太阳辐射值,单位为W/m2;前缀表明标准化变量。
方程(15)必须非标准化,以获得平均每周温度方法:
均方误差和残差统计出现在表中6和7.数据12,13,14和15在这周的分析中显示水温的行为。
每周分析的结果显示,当数据之前标准化时,均方误差减少了52%,残差的标准偏差减少了约31%。相关系数也接近于1。
5.获取二零零四年的每日水温
2002年至2003年在弗里斯和米拉维特站测量的每日气候数据被用来估算2004年的水温,以检验(11), (12)和(13).模型所需要的2004年气候数据被假定为2002年和2003年的平均值。假设2004年的平均水温°标准差为°.
应用(11),如图所示16和17,在残差上有重要的变化;相比之下,与…13),均方误差为13.027,相关系数为0.7445;残差取之间的值°,几乎°(数据18和19).因此,最后一款车型在今年的日常数据上有更好的表现。
用这两个方程,在估计的一年中的一些日子里得到了很大的水温残差。
6.结论
不同的模型,允许水温度的估计在给定的埃布罗河了,考虑气候变量测量同年,还考虑前两年来的变化,试图解释可能的进化水温的行为。
GP算法考虑输入每小时、每天和每周的平均测量数据,没有和有标准化,以便分析当输入数据的形状从一种形式到另一种形式变化时的结果方程。
本质上,水温和气候变量的测量数据在小时平均数据中比在日或周平均数据中有更多的振荡。特别是在逐小时数据的实验中,GP算法放大了水温振荡,这可能是因为在实际的物理过程中,对气候变量的振荡进行了过滤。然而,标准化数据的均方误差低于未标准化数据,且数据离散度较低。类似的情况也发生在日常数据的情况下。
根据均方误差、残差标准差和相关系数,当考虑周数据时,GP算法生成的模型更能跟踪水温的变化。对于那些用标准化数据得到的模型来说尤其如此。
因此方程如获得本可以用作第一近似预测水温的变化更改时发生在气候变量如空气温度、风速、相对湿度、太阳辐射,所有这些影响水温度以及物理和化学条件下,包括一条河流的动植物群。
当将每日数据的模型应用到另一个年份时,测量数据和预测数据之间的相关性较低,尤其是不考虑标准化变量的模型。
根据这些结果,在引入标准化过程的情况下,利用遗传规划方法对水温模型的生成进行改进是可行的。
结果也显示了本文所建立模型的局限性;模型产生的水温振荡与实测数据不符;从2004年开始的预测结果只是公平的。这可能是由于物理现象中的一些变量被消除了,在自然界中发生的过滤不会被复制;然而,这些结果被认为是有用的,作为一个复杂过程的一阶解释。然而,该方法还有待进一步研究,以与基于物理的方法进行比较。
参考文献
- D. A. Savic, G. A. Walters和J. W. Davidson,“降雨径流模型的遗传规划方法”,水资源管理,第13卷,第2期3,页219-231,1999。视图:出版商的网站|谷歌学者
- H. Madsen, M. B. Butts, S. T. Khu, S. Y. Lyong,“降雨径流预测的数据同化”,刊于第四届水文信息学会议论文集,第1-8页,美国爱荷华州锡达拉皮兹,2000年7月。视图:谷歌学者
- J. Dorado, J. R. Rabuñal, J. Puertas, a . Santos,和D. Rivero,“通过遗传编程预测和建模典型城市盆地的流量”,在欧洲进化计算应用研讨会论文集(evoworkshop’02)年第2279卷计算机科学课堂讲稿,页190-201,2002。视图:谷歌学者
- Y.-S。Hong和M. R. Rosen,“使用进化自组织模型识别城市破裂岩石含水层动力学”,《水文号,第259卷。1-4页,89-104页,2002。视图:出版商的网站|谷歌学者
- M. Keijzer和V. Babovic,《基于gp的科学发现中的陈述性和优先偏向》,遗传编程与可进化机器, 2002年第3卷第41-79页。视图:谷歌学者
- E. L. Harris, V. Babovic,和R. A. Falconer,“利用基因程序设计的植被泛滥平原复合河道的流速预测”,国际流域管理杂志, vol. 1, no. 12,页117-123,2003。视图:谷歌学者
- M. Keijzer, M. Baptist, V. Babovic,和J. R. Uthurburu,“利用遗传规划确定植被诱导方程”,刊于遗传与进化计算会议论文集(GECCO’05),页1999-2006,华盛顿特区,美国,2005年6月。视图:出版商的网站|谷歌学者
- B. Lehner, P. Döll, J. Alcamo, T. Henrichs,和F. Kaspar,“估计全球变化对欧洲洪水和干旱风险的影响:一个大陆的综合分析,”气候变化,第75卷,第5期3,页273-299,2006。视图:出版商的网站|谷歌学者
- j . SeguiAnálisis de la Serie de temperature atura del Observatorio del Ebro 1894-2002,西班牙罗盖特斯埃布雷天文台,2003年。
- B. W. Webb和F. Nobilis,《20世纪多瑙河的水温行为》,Hydrobiologia第291卷第291期2,第105-113页,1994。视图:谷歌学者
- R. Greve,“关于格陵兰冰盖对温室气候变化的反应,”气候变化第46卷,第46期3,页289-303,2000。视图:出版商的网站|谷歌学者
- D. W. Schindler,“气候变暖对北美淡水生态系统的广泛影响”,水文过程,第11卷,第5期。8,第1043-1067页,1997。视图:谷歌学者
- M. Álvarez Cobelas, J. Catalán,和D. García De Jalón,“影响清醒的los ecosistemas acuáticos大陆”,在Evaluación初步影响文件España por del Cambio Climático, J. M. Moreno, Ed., 113-146页,西班牙马德里,2005。视图:谷歌学者
- D. Caissie, N. El-Jabi,和M. G. Satish,“利用空气温度模拟小河流的最高日水温”,《水文第251期1-2,页14-28,2001。视图:出版商的网站|谷歌学者
- j·m·海勒威尔淡水污染与环境管理的生物学指标,爱思唯尔,伦敦,英国,1986。
- I. J.温菲尔德和J. S.纳尔逊,鲤科的鱼类。分类学、生物学与开发,查普曼和霍尔,伦敦,英国,1991年。
- G.-R。沃尔特,E.波斯特,P.康威等人,《对近期气候变化的生态反应》自然,第416卷,第2期。6879页,389-395页,2002。视图:出版商的网站|谷歌学者
- C. D. Harvell, C. E. Mitchell, J. R. Ward等人,“气候变暖和陆地和海洋生物的疾病风险,”科学,第296卷,第2期。2002年。视图:出版商的网站|谷歌学者
- s r·瓦尔我们的遗体将保存在térmico del río。Caso del sistema de embales Mequinenza-Ribarroja-Flix el río Ebro,博士论文,Politècnica de Catalunya,巴塞罗那,西班牙,2003。
- J. Prats, R. Val, J. Armengol, and J. Dolz,“重建Escatrón中埃布罗河1949-2000年水温序列的方法”,Limnetica第26卷第2期2,页293-306,2007。视图:谷歌学者
- M. L. Arganis, S. R. Val, V. K. Rodríguez, M. R. Domínguez, and R. J. Dolz, " Comparación de curvas de adjust a la temperature atura del Agua de un río usando programación genética, " in墨西哥大会Computación进化大会(COMEV '05),第1-8页,Universidad Nacional Autónoma de aguascaliente, 2005年5月。视图:谷歌学者
- M. L. Arganis, S. R. Val, M. R. Domínguez, V. K. Rodríguez, R. J. Dolz,和J. Eaton,“通过多元线性回归和遗传规划方法获得的方程的比较,以接近测量的河流气候数据,”在IWA Watermex,第1-8页,美国华盛顿特区,2007年5月。视图:谷歌学者
- t .回来,进化算法的理论与实践,牛津大学出版社,英国牛津,1996。
- 克拉默,“简单顺序程序的自适应生成的表示”遗传算法及其应用国际会议论文集, J. J. Grefenstette, Ed.,第183-187页,1985。视图:谷歌学者
- J. R. Koza,“在计算机程序的群体上运行的分层遗传算法”第11届国际人工智能联合会议论文集,第1卷,768-774页,摩根考夫曼,1989。视图:谷歌学者
- J. E. Edinger, D. K. Brady和J. C. Geyer,“环境中的热交换和传输”,技术代表14,电力研究所,帕洛阿尔托,美国加州,1974。视图:谷歌学者
- MathWorks,“MATLAB参考指南”,MathWorks, Inc., 1992。视图:谷歌学者
版权
版权所有©2009 Maritza Arganis等人。这是一篇发布在知识共享署名许可协议,允许在任何媒介上不受限制地使用、传播和复制,但必须正确引用原作。