应用遗传编程(一个进化计算工具)没有和标准化数据与建模的目的提出了水温的行为在一条河的气象变量很容易测量,探索其解释力和强调的标准化的工具变量,以减少那些有大量方差的影响。记录数据对应于在埃布罗河水温行为,西班牙,作为分析案例,显示性能改进开发模型在数据标准化。这种改进是反映在均方误差的减少。最后,在本文档中获得的模型进行估计水温在2004年,为了提供证据对其适用性的预测目的。
进化计算已广泛应用于液压和水文,例如,研究ofSavic et al。
动机与模型,允许水温的表示行为每年是因为每一次可能的异常增加该参数发生,后果和影响水的理化性质与相应的影响在水生生物有很多。一些模型已经应用于最高水温通过非线性空气温度与水温之间的关系(Caissie et al。
本研究中使用的字段数据来自埃布罗河越低,西班牙。这条河流域85 000公里<年代up>2年代up>,平均每年流入17 000嗯<年代up>3年代up>在自然的政权。三个水坝位于沿江(图
在埃布罗河站位置,西班牙。
进化算法,也称为进化计算(EC),这项工作中使用的优化工具,使用进化过程的计算模型的设计和实现基于计算机的解决问题。这些进化的一般定义和分类技术是在回
程序
以类似的方式的自然进化和遗传,这些算法在人口工作<我t一个lic>
N我t一个lic>个人<我nline-formula>
一个典型的遗传规划算法由一组函数,可以涉及算术运算符<我nline-formula>
一个数学表达式层级结构的解析树表示。
一条河的水是在与周围环境不断的换热:大气和河床。这个过程可能会达到平衡,这样水就等于失去的热量被吸收。通常,水温增加整个河流自然状态的高度降低。这个空间变异双时间变化是叠加的。在河里达到温度变化后日常和年度周期。
在这项研究中由瓦尔(
由水热存储质量,因为它沿着一条河的经度<我t一个lic>
l我t一个lic>据估计,<我nline-formula>
另一方面,通过分析历史行为的水温在连续两年的时间变化,也观察到类似的结果,在周期性的变动和增加或减少的趋势。这导致一个期望的温度变化之间的相关性<我nline-formula>
这个背景描述导致测量变量的选择用于预测模型。
此外,当物理变量是用来安装通过遗传编程,几个问题的维数问题。但是这个问题可以解决考虑可能存在的维度得到常数的计算模型。新的物理解释相关的变量可以通过分析模型。
在本文档中,为简单起见,只有四个算术运算符被认为是:<我nline-formula>
十二个独立变量,因变量,选择一个真正的常数向量。因此,在列举了情况下,终端设置
测试是用一个小时,每天和每周的平均水温。
在所有的最后一个变量是无量纲的标准化情况。
目标函数考虑这个问题被定义为最小化之间的均方误差计算和测量数据:
在MATLAB中实现了遗传规划算法(MathWorks [
变量被减去均值和标准除以标准差:
变量与大方差往往有更大的影响产生的模型比小差异,可也有关。标准化变量可以是有利的,他们的意思是零,他们的第二个时刻(方差)。
气象和水温数据测量站安装在埃布罗河。所测量到的数据包含10分钟平均每一分钟。水温测量只是下游的水电站毛皮。气象变量测量的测量站位于Ribarroja大坝。每小时平均计算的变量作为输入数据:相对湿度(<我nline-formula>
第一个实验进行了原始数据,并与标准化的第二个。医生对实验参数设置如表所示
GP参数设置。
| 参数 | 价值 |
|---|---|
| 许多个人 | 250年 |
| 最大数量的节点 | 30. |
| 最大数量的代 | 3000年 |
| 交叉概率 | 0.9 |
| 变异概率 | 0.09 |
| 节点的变异概率 | 0.03 |
为了验证该方法的适用性,得到测量和计算数据之间的相关系数:
遗传规划算法倾向于生产相对简单的模型。在这两个实验产生的方程
为了得到<我nline-formula>
预测的目的,平均值和标准偏差估计如下:
均方误差值。
| 方程 | MSE,°<我nline-formula>
|
|---|---|
| ( |
9.4336 |
| ( |
6.4763 |
意思是(<我nline-formula>
统计数据的残差。
| 方程 |
|
|
|---|---|---|
| ( |
|
3.0716 |
| ( |
0.0230 | 2.5449 |
水温值和残差,实验没有标准化(每小时平均值)。
水温值和残差,试验标准化(每小时平均值)。
在数据
对比测量和估计数据(
对比测量和估计数据(
在这种情况下,没有获得的方程和标准如下:
通过应用逆标准化过程,
在(
均方误差值。每日平均数据。
| 方程 | MSE,°<我nline-formula>
|
|---|---|
| ( |
8.279 |
| ( |
4.978 |
统计数据的残差。每日平均数据。
| 方程 |
|
|
|---|---|---|
| ( |
0.0762 | 2.8802 |
| ( |
0.0213 | 2.2342 |
水温度变化与时间和获得的差异数据绘制
水温值和残差,实验没有标准化(日均值)。
水温值和残差,试验标准化(日均值)。
对比测量和估计数据(
对比测量和估计数据(
遗传规划的收敛。
在最后的实验中,没有获得的方程和标准化
方程(
均方误差和残差统计出现在表
均方误差值。每周的平均数据。
| 方程 | MSE,°<我nline-formula>
|
|---|---|
| ( |
4.538 |
| ( |
2.176 |
统计数据的残差。每周的平均数据。
| 方程 |
|
|
|---|---|---|
| ( |
0.0186 | 2.1509 |
| ( |
0.0239 | 1.4892 |
水温值和残差,实验没有标准化(每周一次的平均值)。
水温值和残差,试验标准化(每周一次的平均值)。
对比测量和估计数据(
对比测量和估计数据(
每周分析的结果显示均方误差减少52%当之前数据标准化,并减少约31%的残差的标准差。相关系数也接近1。
气候每日数据测量了从2002年到2003年,毛皮和Miravet电台被送往估计水温在2004年,为了检查模型的准确性由(
均方误差为49.549和0.6744的相关系数得到应用(
测量和预测水温为2004,模型没有标准化(日均值)。
对比测量和估计数据(
测量和预测水温为2004,模型标准化(日均值)。
对比测量和估计数据(
与两个方程非常大的残差水温度得到一些天的估计。
不同的模型,允许水温度的估计在给定的埃布罗河了,考虑气候变量测量同年,还考虑前两年来的变化,试图解释可能的进化水温的行为。
GP算法作为输入每小时、每天、每周平均测量数据没有标准化,为了分析得到的方程,当输入数据的形状变化从一种形式到另一个地方。
本质上,水的温度和气候变量的测量数据有更多的振荡在每小时平均数据比每日或每周的平均数据。特别是在实验中使用每小时的数据,GP算法放大水温度振荡,可能是因为在实际的物理过程中,振荡的气候变量过滤。然而,通过使用标准化的数据,均方误差低于那些没有标准化,并在数据可以获得较低的色散。类似的情况发生在每日数据的情况下。
根据均方误差,残差的标准差和相关系数,在每周的数据被认为是,GP算法产生的模型更有能力遵循水温的行为。这尤其适用于那些模型和标准化的数据获得。
因此方程如获得本可以用作第一近似预测水温的变化更改时发生在气候变量如空气温度、风速、相对湿度、太阳辐射,所有这些影响水温度以及物理和化学条件,包括植物和动物。
当日常数据的模型被应用于一年,得到了较低的测量和预测数据之间的相关性,特别是在模型中没有考虑标准化变量。
根据这些结果,它是可行的获得一些改进生成水温模型中通过遗传编程,当标准化过程。
结果也显示限制模型所开发的;模型产生振荡的水温不对应的测量数据;从2004年只有公平的结果预测。这可能是由于这一事实所包含的一些变量物理现象的消除,过滤,发生在自然不是复制;然而,这些结果被认为是有用的作为一个一阶的解释一个复杂的过程。然而未来的工作建议比较该方法与基于物理的。