文摘

本研究调查的能力提高分布式水文模型性能通过同化流速及流水量观测。错误地估计模型状态将导致观察和估计河流之间的差异。因此,流速及流水量观测可以用来更新模型,和改进的模型状态最终会受益的流速及流水量预测。本研究测试这个概念上淮河流域。我们吸收流水量观测顺序进入土壤和水评估工具(SWAT)使用集合卡尔曼滤波(EnKF)来更新模型状态。合成实验和实际数据应用程序用于演示这个数据同化方案的好处。实验表明,同化的流速及流水量观察内部网站显著提高流速及流水量预测整个盆地。同化排水出口流速及流水量提高流域出口附近的流速及流水量的预测。在实际数据情况下,估计在流域出口流速及流水量显著提高了同化的原位测量流速及流水量内部指标。同化原位流域出口流速及流水量也提高了一个内部的流速及流水量预测位置的主要范围。 This may demonstrate that updating model states using streamflow observations can constrain the flux estimates in distributed hydrological modeling.

1。介绍

流域水文模型是至关重要的水资源管理和规划(例如,控制洪水和干旱监测)。然而,水文建模的准确性和可靠性通常受到各种各样的不确定性迫使输入相关的模型,模型参数,模型结构(1,2]。数据同化(DA)技术,拥有共同合并建模和观察的能力,考虑到不确定性,在水文改善常用的降雨径流模拟和预测(3- - - - - -6]。先前的研究已经表明,同化遥感数据,例如,卫星土壤水分的产品(4,7,8),为水文建模可以改善水文过程。

吸收排放在降雨径流观测有更多优势改进,由于放电观察更可靠,更直接关系到河流建模。这个概念是集中进行集中水文建模(9- - - - - -12]。在分布式建模,研究水流同化近年来持续增长。克拉克et al。13]采用流速及流水量观测更新状态的分布式模型(TopNet)提高流速及流水量预测和证明,将流速及流水量转换为日志空间计算协方差改善之前的过滤性能合奏卡尔曼滤波器(EnKF) [14]。谢和张5]证明了能力的EnKF改善参数估计,从而提高了水文建模在斯瓦特的同化的流速及流水量观测合成实验。李等人。15)验证更新土壤水分状态的潜在的分布式模型的同化流速及流水量和原位土壤水分数据使用变分同化方法的预测流速及流水量和土壤水分。水流同化有潜力提高分布式水文模型模拟和预测通过更新状态模型中传播过程中,但迄今为止,这种潜在的不充分利用;还很少有研究评估这个预测的改进可能的分布式水文模型改进估计的盆地州通过同化流速及流水量观测。然而,从理论上讲,分布式模型预计将比集中的降雨径流模型,因为它可以解释的空间变异性气象输入和底层地表排水的条件(16]。不同于块模型,只能产生在流域出口流速及流水量预测,分布式模型有能力提供内部的流速及流水量预测的位置。这使得水流同化在分布式模型不仅造福于上游的水流模拟和预测观测站点也可以试图改善周边或下游地区。这个属性是特别重要的流速及流水量预测的ungauged盆地。考虑河流的意义同化改进的分布式水文模拟和预测,目前还很少有研究在这方面,研究水流同化在分布式模型需要加强,其潜在的改善分布式水文模型需要进一步探讨。

此外,分布式模型的状态变量具有空间变异性,这通常是由底层控制流域的地表特征(如地形、土地覆盖和土壤类型)。这使得国家更新可能受到潜在地表条件;因此提高降雨径流流速及流水量同化的性能建模也受到影响。有一个好的理解这些因素在改善水流同化性能很重要。然而,据我们所知,有关地表条件的影响因素流速及流水量同化在分布式建模很少报道。

在这项研究中,我们调查的流速及流水量同化能力提高上淮河流域的分布式水文模型通过更新盆地。这个调查是基于水土评估工具(SWAT)和集合卡尔曼滤波(EnKF)方法。合成实验和实际应用程序被认为是;合成实验评估了上界无偏的理想化条件下水流同化性能模型参数和著名的建模和观察错误,而真正的应用程序提供了一个更现实的流速及流水量同化性能。除此之外,我们还分析潜在地表条件的影响(例如,斜坡)流速及流水量同化的性能。

2。方法

2.1。土壤和水评估工具(SWAT)

斯瓦特是一个基于物理的盆地规模分布式模型由USDA(美国农业部)农业研究服务。它已广泛应用于预测土地管理实践的影响水、沉积物、和农业化学产量大,复杂的集雨不同土壤、土地利用和管理条件长时间(17]。在斯瓦特,流域地理位置划分为不同的次盆地;然后每个次盆地进一步划定为几个水文响应单元(HRUs)根据土壤、土地覆盖和斜坡。HRUs的基本计算单元模型,对地表径流、土壤水、横向流和地下水。生成的水从HRUs聚合在次盆地和排放通过河流域的出口路由过程。

地表径流在特定的一天( 数量修改SCS)是模拟的曲线方法: 在哪里 是降水(毫米),在给定的一天 是保留参数(mm)所描述的,可以吗 CN是SCS曲线对于一个给定的数天;它是由最初的CN曲线号码2(17)和剖面土壤含水量在同一天。

土壤剖面的降雨量减少了地表径流充电是重新分配使用存储路由技术在各土层根区 在哪里 土壤含水量在一天的开始和结束(mm)层ly,分别 从覆盖层渗流(毫米)层ly, 是实际蒸散来自层ly白天,然后呢 是产生横向流层ly计算 在哪里 是土壤剖面的层数, 是层的土壤含水量ly在田间持水量(毫米) 饱和导水率(毫米/小时)的层ly,二是斜坡(m / m), 土壤的总孔隙度层ly(毫米/毫米), 层的孔隙度是在田间持水量时,然后呢 小山斜坡长度(米)。

地下水建模、斯瓦特包含两个地下蓄水层在每一次盆地:浅(无限制)和深(限制)含水层。只有浅含水层中的水会导致流次盆地的主要通道,水平衡的描述 在哪里 中存储的水浅含水层在一天的开始和结束(毫米) 在白天充电进入浅含水层(毫米) 是白天地下水流向的主要通道(毫米) 水进入土壤带的水不足一天(毫米),然后呢 从浅含水层水去除白天泵(mm)。

地表径流( )和横向流( )的主要通道计算了在给定的一天(6)和(7)。一个人 在哪里 是地表径流滞后的前一天(毫米),surlag是滞后系数、地表径流和 地表径流是浓度的时间。一个人 在哪里 横向流滞后于前一天(毫米)和 横向流旅行时间(天)。

英吉利海峡的水平衡达到一般可以表示为 在哪里 在达到水的体积分别为一天的开始和结束(m3), 是水的体积流进和流出达到白天(m3), 计算(9在变量存储路由方法)(见[17): SC在哪里存储系数的上限1.0计算了吗 在哪里 是时间步的长度(s)和TT到达旅行时间(s),这是一个结果的主要通道长度除以放电率。

2.2。卡尔曼滤波器EnKF ()

基于线性卡尔曼滤波器的理论(18],合奏卡尔曼滤波器(EnKF)结合了蒙特卡罗方法生成状态整体具有一定概率分布来表示。生成的状态整体向前传播使用模型 ,迫使输入 ,模型参数 和系统不确定性 作为 在哪里 的预测模型状态集合时间吗 和状态变量包括部分将详细介绍4.1 代表SWAT模型在这项研究中,模型的不确定性 被认为是一种高斯分布系统增加。

观察可用时,预测模型状态 有关观察合奏 使用一个操作符 作为 在哪里 代表了观测误差被认为是零均值和协方差的高斯分布 。状态更新了 在哪里 国家整体和更新吗 是卡尔曼增益,它决定了建模的重量和观察的状态更新和计算预测误差协方差和观测误差协方差吗 在哪里 之间的交叉误差协方差预测状态 和测量预测 是测量的预测误差协方差的预测19]。

2.3。评价方法

为了评估河流的性能同化,均方根误差,Nash-Sutcliffe效率系数,皮尔逊相关系数和归一化误差减少使用索引。

均方根误差(RMSE)可以表达的20.] 在哪里 总时间步和吗 测量和模拟水流在时间吗

Nash-Sutcliffe系数表达的(研究)(21] 在哪里 表明中值测量流速及流水量的整个时期。

皮尔森相关系数是通过(22] CC代表了相关系数, 模拟状态在时间吗 , 表明模拟状态的平均值为整个时期。

归一化误差减少指数(尼珥)表达的是(23] 在哪里 变量的均方根误差在EnKF和烯醇(详细节吗4.3),分别。尼珥的大的值意味着EnKF优于烯醇。尼珥= 1.0表明EnKF重叠真相或观察结果。

3所示。研究区和数据使用

研究流域位于113°15之间E′~ 116°00′E和31°30′N ~ 33°00′N上淮河流域在中国,面积16005公里2从25米,海拔1117米(图1)。它是由平原地区除了西部和西南部主要覆盖的山脉和丘陵。盆地北部之间的过渡区位于亚热带与暖温带;年平均降水量为900毫米,年平均温度约为15°C。在汛期降雨量相当受季风的影响从6月到9月,所以降水下降50%到80%。该流域的主要土地覆盖农业、森林和刷。农业是主要的土地利用类型,其中大部分是大米(34.98%)和小麦(32.49%)。

SWAT模型所需的输入数据主要包括气象迫使数据和底层地面数据。气象输入数据包括降水、最大/最小温度、太阳辐射、风速、相对湿度。降水是由106个地方的雨量在盆地,而对于每一次盆地降水输入的插入值106降雨站使用Thiessen多边形的方法。上述5种后续气象数据收集从2气象站(信阳和Guangshui站)或附近流域(图1)。地表数据包含地形数据(数字高程数据、DEM)、土壤类别,和土地覆盖数据。DEM数据从航天飞机雷达地形测绘任务下载(SRTM)空间分辨率为90米(http://srtm.csi.cgiar.org/SELECTION/inputCoord.asp)。土壤数据从土壤地图重新取样规模1:100000来自河南省土壤手册。根据土壤手册,有7种土壤在这个盆地;面积比例、土壤质地和相应的美国农业部(美国农业部)分类表中1。此外,土地利用数据重新取样一年- 1995年尺度的土地利用图1:信阳城市的政府提供的210000年。

有6集水的流速及流水量指标(图1),它提供了每日河流排放模型校准,验证和数据同化。所有6流水量站的位置设置为次盆地出口。和流域划分为28次盆地(图1)总基于DEM数据。然后,进一步划定为82 HRUs根据斜率,土壤和土地利用信息。此外,土壤剖面分为4层最大。

4所示。水流同化在斯瓦特的实现

4.1。选择状态变量更新在斯瓦特

考虑到复杂的物理模型和结构和大量的状态变量在斯瓦特,有可能虚假的相关性存在高维状态向量,因此,带来很大的自由度流速及流水量同化的状态更新。为了减少自由状态更新,只有强烈依赖的状态变量(即流速及流水量测量预测。水流模型状态变量敏感)将被更新。基于状态变量的物理意义在斯瓦特,这五个变量是初步选择(表2)。然后,目标是初步选定五个变量的相关性分析与模拟水流六径流仪表(图1)最终确定变量更新同化。

分析结果呈现在图2,十五计算单元(HRU)和第六次盆地为例。它可以发现,相对于地表径流存储( ),达到流水量存储( ),相关系数(CC)的横向流存储( ),浅含水层储存( )和土壤贮水( )的4层相对较低。其他81计算单位和27次盆地,分析结果类似于上面的结论。因此,在这项研究中, 将会被更新。值得注意的是预测流速及流水量测量地点也包括在状态向量,但他们不是更新诊断变量而非状态变量(13]。随着预测流速及流水量测量地点包括在状态向量,有一个精确匹配观测和模型之间的等价的。因此,状态转移矩阵 从建模到观察EnKF (12)可以构造有一个元素的值为1,有一个模型预测的观察和0没有相当于观察[24]。

4.2。建模和观测误差

在这项研究中,水文建模的不确定性来自气象迫使输入的错误(例如,降水),模型参数,模型结构。使用假设每个乐团成员在EnKF摄动总结表3。降水的错误被认为是不相关的两个时间尺度之间的连续时间步骤和空间规模不同的车站。这个设计的系统上的降水误差考虑了先前的研究降雨在中国降水指标的测量误差25]。小误差设计预测模型(即状态。,the surface runoff storage and the reach flow storage) is to avoid rapid changes between continuous time steps in the modeling process. The assumed error on the measurement prediction of streamflow flux is to account for the errors of model structure. Besides, the ranging standard deviation (SD) for the sensitive parameters (Table4)是确保参数扰动后仍然留在身体阈值。假定流速及流水量观测误差考虑流速及流水量测量的不确定性的特点12和以前的研究中采用的错误的假设13]。

4.3。合成和真实的数据同化

在合成实验中,一个引用字段从高斯分布随机挑选出与给定的模型输入。然后,传播期待获得一个参考模型建模过程,这被认为是合成的事实。随机扰动所产生的合成流水量观测合成真实流速及流水量来自参考使用高斯模拟乘法误差的标准差一样的流水量观测误差。一个与200个成员SWAT模型的集成与已知错误(表执行3)的模型输入、模型参数和状态,这被认为是开环(烯醇)运行。EnKF来看,同化集成是通过引入合成执行的流水量观测的随机建模过程的错误一样,烯醇。这里,设计两种情况:(1)吸收合成流水量观察5(即内部网站。Zhuganfu Dapoling Changtaiguan,息县,潢川田野);(2)吸收合成排水出口流速及流水量观察(Huaibin)。水流同化了比较的性能预测流速及流水量EnKF和烯醇合成得到的真理作为参考对整个盆地。

在现实数据同化中,烯醇的误差的模型和观察,EnKF相同的合成实验。类似于合成实验中,我们考虑以下两种情况:(1)五个内部放电的流速及流水量测量仪表是同化和原位测量水流流域出口用于验证;(2)流域出口的流速及流水量测量同化,测量流速及流水量五内部网站采用的验证。

5。结果

5.1。合成实验
5.1.1。同化的流速及流水量观察内部网站

3比较均方根误差(RMSE)估计河流的所有次盆地网点(位于不同地点到达)的同化下水流观察五个内部网站,没有水流同化整个同化期从1月1日,1996年12月31日,1997年。它可以发现RMSE减少EnKF次盆地网点。然而,对于不同的次盆地,水流同化性能显示大不同。这可以更好的说明了标准化减少RMSE(即。,NER), the distribution of which on the whole basin is present in Figure4。明确尼珥分布在盆地,尼珥价值在次盆地出口次盆地,它位于。我们可以看到,估计在次盆地河流渠道得到不同程度的改善,EnKF尼珥范围从5.43%到64.05%。看来,这个进步显示了一个增加的趋势从上游到下游的主要达到的排放指标Dapoling, Changtaiguan,息县(DPL, CTG和XX)。预测河流的流域出口获得显著改善而不执行数据同化的事实。

5介绍了时间序列的估计水流通过EnKF和烯醇在流域出口。图中可以看到5(一个),出口流速及流水量显著提高了EnKF整个同化。的系综均值模拟水流,EnKF得到显著改善的准确性是合成接近真理的RMSE从62.18减少323.24 m / s3/ s(尼珥= 63%);研究和相关系数(CC)从0.97和0.98增加到大约1.0,分别。在烯醇的不确定性模拟水流由EnKF显著降低,EnKF合奏传播在很大程度上是降低了。此外,在数据很明显5 (b)5 (c)这个改善高流量是重要的,模拟的流速及流水量超过10003/ s, RMSE减少从189.7 m370米/秒3/ s与尼珥接近63.1%。虽然改善低流显然不是如图5(一个)由于高流量和低流量差距巨大,它仍然是重要的模拟水流不到1000米3/ s的RMSE却降低了从49.4 m318.6 m / s3/ s尼珥达到62.3%。

流速及流水量预测的改进EnKF应该受益于地表径流的实时更新存储( ),达到流存储( )观察到的流水量的基础上,根据设计,因为EnKF和烯醇是唯一的区别 在烯醇EnKF但不更新。 在EnKF与烯醇合成真理作为参考。图6显示的RMSE分布 82年HRUs EnKF和烯醇。它可以发现的RMSE 被EnKF显著降低为均值和RMSE的传播都大大降低了。图7礼物的RMSE 在烯醇EnKF和规范化减少RMSE(尼珥) 在28次盆地。通过比较数据7(一)7 (b),我们可以看到的RMSE 在大多数次盆地由EnKF大幅减少,尤其是在次盆地6,8、12和14。这可能是更好的图所示7 (c),尼珥次盆地都高于零,这些次盆地6,8日,12日和14都超过70%。总的来说, 更新EnKF显著方法合成的真理。

对不同次盆地和HRUs,更新的流速及流水量同化的影响 (图7), (图6)是明显不同的,计算出的净减少 和规范化的减少RMSE (18) 在不同的次盆地和RMSE分布显示大不同 状态更新后变化显著。这种差异可以部分相关的潜在地表条件。

8显示斜坡的影响,土壤分类和土地覆盖在地表径流的更新存储( )三个因素确定HRU描述。图8(一个)表明, 在HRUs斜坡较低(< 5°)获得大净减少的RMSE ( ),这对降雨径流模型的贡献显著改善。数据8 (b)8 (c)说明大减少RMSE发生在土壤类别的HRUs Huanghetu (s - 1), Shuidaotu (s)和Shajiangheitu (S-7)(所有三个土壤属于粉砂壤土美国农业部土壤分类)和土地覆盖水稻(大米)和混合农业主要是由小麦和玉米(AGRC)。

9给出了次盆地的主要通道长度的影响达到流动状态更新的存储( )的标准化减少RMSE(尼珥) 。这表明重要的状态更新 (尼珥< 25%)主要发生在次盆地主要通道长度较短(< 18公里)。这可以解释从通道路由方程(8),(9)和(10)在斯瓦特。主要通道较短长度减少了通道流旅行时间(TT),一个相对较小的值,这使得存储系数(SC)方法的上限1.0 (10)。因此, 下降到零值(8)和(9)经常在模型运行过程,导致这个变量的更新没有意义。因此,较短的次盆地主要通道往往不那么重要的更新 在同化。此外,尼珥似乎显示一个增加的趋势与主要通道长度的增加,这表明国家的强烈依赖性达到流的更新存储在达到本身的长度。

5.1.2中。同化的流速及流水量观察排水出口

10比较均方根误差(RMSE)估计河流的所有次盆地网点(位于不同地点的)的同化的排水出口流速及流水量观察(HB,即。,Huaibin站),如果没有水流同化整个同化。可以看出,估计出口流速及流水量的几次盆地(如次盆地1、5、6、9和14)被同化改进排水出口的流速及流水量RMSE减少。整个盆地的出口流速及流水量(次盆地6)的出口获得最重要的改进的RMSE减少的程度。这可以更好的说明了标准化减少RMSE(即。,NER), the distribution of which for all subbasin outlets is present in Figure11。明确尼珥分布在盆地,尼珥值在次盆地插座放在整个次盆地,它位于。似乎改善水流建模显示下降趋势从下游到上游通过同化排水出口流速及流水量的观察,尤其是对位于主要达到的网站。这一趋势是一致的,模拟的流速及流水量之间的相关系数在流域出口,次盆地(图12),因为他们也呈现一个下降趋势从下游到上游整个盆地。因此,可以推断,同化的流速及流水量观察往往是有效改善集雨的水流的流速及流水量估算建模是密切相关的测量预测流速及流水量。

5.2。实际数据的应用程序
5.2.1。同化的流速及流水量测量五个内部指标

13比较的估计河流流域出口获得的烯醇的同化和EnKF五内部的流速及流水量的测量仪表。可以看出模拟水流的烯醇大幅提高(如一天约260,320年和450年)的基于EnKF状态更新整个数据同化的时期,可以充分减少RMSE从271.58所示3204.7 m / s3/秒减少25%(尼珥= 25%),增加了无从0.62到0.78,相关系数从0.79到0.9。然而,它也可以发现从数字13 (b)13 (c)这种同化显示了一些有限的能力在流速及流水量预测的误差修正模拟之间存在很大的偏见和观察到的流水量。这种限制的流水量同化性能可能与不满意(或可能有偏见)模型参数,参数标定中很难避免,特别是与复杂的物理模型和分布式模型结构和大量的参数。此外,偏置参数会恶化的状态更新水文建模同化过程中(10]。

5.2.2。同化的排水出口流速及流水量的测量

5总结了统计估计河流的同化流域出口的流速及流水量测量(Huaibin站)与不执行数据同化的事实。它可以发现在息县车站流速及流水量得到相当大的改善排水出口流速及流水量同化,RMSE却降低了,增加了EnKF了无和CC。然而,模拟水流Zhuganfu和黄山比没有水流同化。这可能是由于在更新模型的状态变量之间的相关系数测量的流速及流水量网站(Huaibin站),内部指标的模型模拟相对高于观察(图14)。这可以与水文过程的空间可变性建模的不足,由于模型输入参数的空间变异性不足(13]。此外,同化排水出口流速及流水量的不重要的对水流的影响建模Dapoling Changtaiguan,可以部分解释他们的模拟水流之间的相关系数相对较低,测量地点(Huaibin站)。

6。结论

本研究使用合成实验和实际数据应用调查河流同化能力的提高上淮河流域的流速及流水量预测通过更新流域分布式水文建模过程。(即两个敏感的模型状态变量。,the surface runoff storage and the reach flow storage) in SWAT are updated using the streamflow observations (1) at the five interior sites and (2) at the catchment outlet.

合成的实验表明,该预测流速及流水量次盆地网点是提高吸收合成五内部流速及流水量观察网站。这个进步显示了一个增加的趋势从上游到下游的主要范围,和预测河流流域出口获得最重要的改进。这个改善流域河流建模是受益于地表径流的更新存储和达到流存储整个盆地的两个状态变量显著方法同化后合成的真理。发现地表径流的显著改善存储通常发生在斜坡上的计算单位少于5°。我们还发现的主要通道长度次盆地有相当大的影响达到流的更新存储( ),如 与短主要通道会显著改善而长主要通道。此外,同化的排水出口流速及流水量观察改善估计河流流域出口附近的几次盆地的出口。流速及流水量的改善建模显示下降趋势从下游到上游,尤其是位于主要的网站,这是一致的,模拟的流速及流水量之间的相关系数在流域出口,次盆地。

实际资料应用表明,大量改进估计河流的流域出口是通过更新盆地州使用原位测量流速及流水量在降雨径流的五个内部指标建模。同化的原位排水出口流速及流水量测量提高了水流在息县建模,产生轻微的恶化对水流的影响估计Zhuganfu潢川田野,并无意义的影响建模Dapoling和Changtaiguan上游的水流。在这项研究中,模型和观测误差参数估计的方法是主观和经验在某种程度上它通常依赖于经验和从其他先前的研究结论。更严格的量化模型和理论基础方法和观测误差参数,例如,自适应同化方法(2,26)和最大后验的方法(27),应尝试在未来的研究。除此之外,河流同化性能在分布式水文模型依赖于能力的分布式模型描述的空间变异性实际水文过程,通常由空间变异性控制模型的输入和参数。应该支付更多的工作改善的空间变化模式迫使数据,新的参数估计和最优方法和校准需要生产更加准确和可靠的模型参数空间规模(28]。

相互竞争的利益

作者宣称没有利益冲突。

确认

这项研究得到了国家自然科学基金项目,流域水文过程的响应机制下气象干旱(41371050),专业研究基金会对中国高等教育的博士项目(20130094110007),中央大学的基础研究基金(2015 b05514),普通大学和研究生的研究和创新项目的江苏省,中国(CXZZ13_0248)。作者感谢Susan-steel邓恩从代尔夫特科技大学的宝贵建议。