文摘

本地化normal-score集合卡尔曼滤波显示工作non-multi-Gaussian分布式液压导率的表征状态观测数据同化。类型的流态的影响,观察压强计,和之前的模型结构评估合成含水层。稳态观测数据并不足以确定传导渠道。瞬态数据是必要的一个很好的描述水力传导率曲线模式。这样的描述很好密集网络的观察数据,它恶化随着观察压强计数量的减少。也显著,即使之前模型结构是错误的,本地化normal-score合奏卡尔曼滤波器可以产生可接受的结果足够致密观测网络。

1。介绍

参数识别是一个关键的步骤,构建一个可靠的模型。识别模型参数的过程也称为反问题或数据同化;即同化系统状态数据确定模型参数。在水文地质参数描述地下水运动的可以在几个不同程度的大小在同一含水层,和空间变异性的特征是非常重要的。出于这个原因,逆建模一直是一个活跃的研究课题,旨在国家最大利用观测数据对模型参数的表征,如液压导率。逆方法之一,吸引了更多的关注最近在水文地质是合奏卡尔曼滤波器对其不同的实现。

在本文中,我们专注于建立地下水流模型,模型参数的液压导率(也称为渗透率)和模型响应量压头(代表的海拔含水层中的水上升穿孔钻)。地下水流动状态方程是由(1] 初始和边界条件, 散度算子( ), 是梯度算子 , 导水率( ), 是液压压头 ), 是特定的存储 ), 是时间( ),而 是源或汇 ]。方程在空间和时间离散和数值求解。

在实际情况下,modeler将地质信息的主要含水层的特性,它允许有一个最初的想法渗透系数的变化范围和类型和建立含水层边界条件;modeler也可能有一些当地的测量导水率(这些测量是昂贵的,这就是为什么它们通常缺乏),水压头的一些测量(这些测量是便宜,因为他们只需要插入一个小管在含水层)。捕捉大含水层的异质性,其离散化一定很好,结束了数值模型与成千上万的细胞,有时,数以百万计的细胞。必须告知每个模型细胞渗透系数值,一个特定的存储系数、和一个初始测压管水头。特定存储不是那么异构水力传导率,所以我们将只专注于水力传导率的异质性。水压顺利在空间上的变化,他们可以很容易地插入他们的价值观在可用的压强计。描述的问题存在于如何将渗透系数的值分配给模型细胞的异质性观测领域是受人尊敬的模型,和模型预测与观测相一致。这个描述问题变得严重时液压导率(或其对数)不能被multiGaussian分布统计描述。

逆建模通常用于解决这个描述的问题。渗透系数值(模型参数)是来源于观察(空间和时间)水压头(系统状态)。我们将展示一个新的集合卡尔曼滤波的实现合成含水层显示复杂的曲线特性,无法统计multiGaussian分布的特征。我们将展示如何将复杂的异质性可以从瞬态信息检索参考含水层系统的状态,状态记录在一个压强计的数量分布在含水层域。

卡尔曼滤波是一种同化过程基于重复应用的两个步骤:预测和分析。在预测步骤中,水压头的空间分布的预测是基于当前的渗透系数,然后,在分析步骤中,修正的电导率值和水压头是由基于测压管水头之间的差异的预测和观察测量位置。这一分析步骤的计算依赖于一个非稳定的协方差函数参数值和系统状态在整个系统领域。随着时间的推移,更多的测压管水头数据同化,渗透系数分布的特性得到改善。

合奏卡尔曼滤波器是一个变种的卡尔曼滤波器设计与非线性预测模型。合奏卡尔曼滤波器(EnKF)广泛应用于多个学科如气象学、海洋学、石油工程、水文(例如,2- - - - - -6])。合奏的卡尔曼滤波器,生成参数的多个实现,所有这一切视为合理的表示现实;这些实现逐步(随着时间的推移和状态观测数据获得)修改与观测相一致。实现最终的结果应该是一个整体,所有具有相同模式的可变性,但不完全相同的价值观,他们所有人一致的状态观测。参数和状态变量通过系综的可变性的实现将使预测的不确定性度量。

的流行EnKF可以归因于其计算效率相对于其他蒙特卡罗逆方法(7),它的简单实现,简单适应不同的转发模式。EnKF是最佳的模型参数和状态变量multiGaussian时,和他们相关的线性状态方程8]。EnKF仍然非常有效的状态方程不是线性的,但是不能当参数和/或状态变量不遵循multiGaussian分布(9]。这就是从冲积含水层存款的情况下,在液压导率和水压头可以multiGaussian分布的特征。我们建议使用normal-score合奏卡尔曼滤波器(NS-EnKF)提出的周et al。10]。他们介绍了normal-score参数和状态变量转换为标准EnKF。这种转变并不确保multiGaussian产生的变换,只有他们的边际分布是高斯因此EnKF是应用于变量,至少,边际高斯分布。将显示,这种转变,使参数和状态变量multi-Gaussianity更近一步,已被证明非常有效的描述非常异构,non-multiGaussian导率。

NS-EnKF已经证明执行在描述双峰含水层的水力导率10- - - - - -12]。在这里,我们提出一个NS-EnKF的本地化版本。本地化消除虚假的相关性在不同的协方差的计算将在稍后见。本文的目的是评估在一个合成的含水层,本地化NS-EnK对状态观测地点的数量(压强计),分析不同类型的流条件下其性能(稳定和瞬态状态),并看看会发生什么之前结构模型的偏离真实的一个。(因为我们使用的是完全已知的合成含水层,我们可以分析之前的影响模型,即。,使用正确的参考。)

2。本地化Normal-Score集合卡尔曼滤波

标准由Evensen EnKF算法(13和汉堡等。14由Evensen[]和详细描述15]。NS-EnKF算法是由周et al。10]。NS-EnKF和标准之间的差异EnKF驻留在引入预处理和后处理步骤进行联合状态向量。本地化NS-EnKF方法主要包括以下步骤。

(1)生成初始模型
本地化NS-EnKF从一开始的实现之前给定后生成随机函数模型。在我们的示例中,液压导率是确定的未知参数。生成多个水力传导率实现作为数据同化过程的起点。有许多算法的生成空间相关参数,可以抬头在地质统计学或空间统计文学。

(2)正常的分数转换的液压导率
计算当地的累积分布函数(CDFs)在每个细胞的整体实现(16]。这些地方CDFs服务构建每个log-conductivity normal-score变换函数,用于变换实现 到一个新的认识 ,也就是说, , 作为一个矢量函数有不同的normal-score变换函数为每个细胞。在分析转换实现的新乐团,在每个网格单元组件的新乐团遵循边际与零均值高斯分布和单位方差。

(3)提出模拟(预测步骤)
为每一个合奏和给定的边界条件,实现了状态向量 在时间 基于状态向量的计算时间吗 使用状态转移方程 而参数向量 在正向模拟假定不变。在我们的例子中, 代表液压log导率和水压头的时间 分别为, 是解决地下水流动模型,即数值解(1.1)数值离散含水层。

(4)正常水压头的分数转换
同样作为液压导率,是整体的预测量压头,当地CDFs时间 在每个网格构建,指出 。然后CDFs都用于将模拟量压头和观察到单变量高斯分布空间,也就是说, ,在那里 观察头时间吗 。(回想一下, 是一个矢量函数为每个网格单元有不同的表情,为简单起见我们假设观测数据在网格单元中心测量,因此同一normal-score变换可用于预测和观察;否则它将有必要构建特定normal-score转换函数附近观察基于插值的预测量压头)。

(5)更新状态向量(分析步骤)
分析步骤是应用于normal-score变换的参数和状态变量。

(我)建立增广状态向量转换
这个向量包含所有实现的。的 增广状态向量的集合可以表示为 在哪里 分别normal-score转换日志导率和水压头。(它被称为增广,因为它还包含状态变量,但模型参数。)

(2)计算局部卡尔曼增益
为了简单起见下标 将被忽略。卡尔曼增益计算 在哪里 协方差模型合奏, 观测矩阵, 观测误差协方差。假设观察与网格节点位置一致, 矩阵将包括只有0和1。在这种情况下,我们不需要计算协方差的所有组件 明确地,而是直接计算 的协方差对应哪一个 分别(EnKF的标准实现,这些协方差计算untransformed增广向量)。然后,卡尔曼增益的表达式可以写成 在哪里 normal-score转换向量之间的协方差,测压管水头(后者仅在测量位置)和 之间的协方差normal-score转化量压头(在测量位置)。这些协方差计算的整体实现 在哪里 是整体的实现。这些数值计算协方差通常显示大于零距离的值之间的位置;这些虚假的相关性最显著的合奏时大小很小或异质性大,应该删除之前更新增广向量。为了这个目的,我们使用本地化的协方差作为推荐Franssen和Kinzelbach [7]。两个定位矩阵( )修改合奏协方差矩阵估计使用舒尔产品,导致以下卡尔曼增益的表达式(17,18]: 一个距离函数用于定位矩阵(19),值,减少从1到0作为距离的函数;超过一定距离定位矩阵系数等于零。(用于合成的例子中,函数距离是径向对称;这是对任何方向图1距离80米,它的值为零距离大于80米。)

(3)更新状态向量(如标准EnKF)
考虑 在哪里 是向量更新状态变量的时间吗 向前是向量的计算模拟,然后normal-score转变; 是normal-score改变观察向量的时间吗 ; 是一个观测误差的特点是一个零均值和对角协方差正态分布

(6)变换
每个组件的更新状态向量 back-transformed使用先前构造的当地CDFs对应液压日志电导率和测压管水头,也就是说,

重复这个过程从步骤3到步骤6,直到所有可用的观测是同化。

3所示。合成实验

3.1。引用字段

合成双峰含水层组成的砂页岩是用来评估的性能在不同的场景中局部NS-EnKF。域的大小是300×240×10米离散成100列80行1层。假设含水层厚度的限制10 m。生成参考相场多点地质统计算法,使用训练图像如图2。然后填充每一相连续log-conductivity值由GCOSIM3D [21与参数列于表1。参考ln 字段及其直方图呈现在图3。日志电导率的直方图双峰,模式与手段的沙子和页岩分布,2.1 ln ( )和−1.4 ln ( ),分别和全球平均0.33−ln 和全球标准偏差1.68 ln 。这个领域显然non-multiGaussian,无论是在其单变量统计曲线模式空间的连续性。

地下水流动方程解决参考字段使用MODFLOW计算机代码(22]下如下边界条件:不透水边界北部和南部的一条河流水位在2 m和异构河床厚度和电导率在西方,规定流量的270.5米3沿着东边界/ d。东部边界的流率分布取决于其供水能力;也就是说,大流量对应区大电导。最初的头是0 m /域。总模拟离散段500天到100步与步长增加比率为1.05。特定的存储是假定常数和等于0.003−1

3.2。初始模型和调节数据场景

测压管水头数据的同化是由局部NS-EnKF执行的。观察水压头60压强计的时间步骤(67.7天)作为训练数据。在合成实验中我们将测试下列条件的影响。(1)流态:稳态流和瞬变流动。瞬态压强计观测中包含的信息量远远大于稳态中观察。这将意味着更大的瞬态表征能力的正面而非稳态的,将如下所示。(2)压强计的数量的影响。与压强计的数量的增加,越来越多的观测数据收集和导率的结构特征。检查压强计的数量的影响在这个实验中,即压强计减少到低于本地化NS-EnKF不工作。图4显示了压强计的位置在四个场景。(3)之前的模型选择。缺乏数据可能导致使用之前离开真正的一个模型。这个问题已经解决由Li et al。11),他们表明,即使前一个错误的模型,识别是可以接受的,如果观察网络的密度就足够了。在这里,我们专注于压强计的数量对电导率的影响结构识别正确的和错误的先验模型。之前错误的模型是完全被李et al。11];我们这里只提到,之前错误的模型与正确的共享相同的直方图和两点协方差,但所有其他高阶力矩方法multiGaussian模型(“图4”(11])。图5显示了系综均值和方差对正确和错误的日志之前电导率模型。之前的正确和错误的模型是用于生成第一批导电性实现并建立本地CDFs用于normal-score转换。

九个场景(表2)被认为是在这个实验中。

4所示。结果和讨论

6显示更新后的液压的合奏意味着日志导率在不同的场景中(列在表中2)的参考。系综均值应该反映含水层的主要模式参考。图7显示日志导率对应的总体方差合奏意味着在图6。方差字段是用来评估的不确定性估计。图8是进化的平均绝对偏差 和系综平均扩散 随着越来越多的观测数据同化。的 分别定量评价准确性和不确定性的估计。他们被定义为 在哪里 估计日志电导率为时间步吗 、网格 和实现 , 是参考log-conductivity节点 , 网格细胞的数量, 是实现的数量,和 在时间步方差在乐团吗 和位置 。图9显示了水头随时间进化在观察压强计(没有之一。21)。图10是水头随时间进化在另一个压强计(没有。103),作为观察的数据只有在场景2和6;后者压强计用于验证更新模型的剩余的场景。头进化如图910结束过去的66.7天(同化)服务评估的能力更新电导率字段进行预测。

4.1。稳态流和瞬变流动

系综均值和方差的更新日志电导率的稳态流贴上场景1的图像数据67,分别。比较系综均值和参考我们几乎看不到任何渠道模式,并比较总体方差和方差之前,这种不确定性降低到一个很小的程度。我们认为,水力传导率识别目的,稳态信息显然是不够的,甚至是最基本的,一个非常密集的网络使用的观察(111井,如图4(一))。相反,瞬态数据是极其宝贵的用于识别目的在比较可以看出场景的总体均值和方差数据1和267。场景1和2共享相同的压强计的模型和相同的配置之前,但在稳定状态,另一个是在瞬态。场景2的系综均值划定的渠道几乎完全参考,总体方差是完全降低了对先验方差,也显示出一些山脊,可以用来识别通道边界。

4.2。数量的压强计

这里我们将测试的影响瞬变流动条件下观察压强计的数量:压强计减少逐渐从111年到63年,32岁和10如图4。前合奏的日志电导率几乎是统一的,没有通道压强计观测同化之前(图5)。在图6正如预期的那样,我们发现,电导率识别本地化NS-EnKF恶化的能力随着压强计数量的减少,对正确的先验模型(场景2 - 5)和错误的先验模型(场景6 - 9)。当111年观测井,系综均值与密切的引用和整体不确定性大幅减少;当压强计的数量减少到63,渠道不连接;当调节压强计的数量进一步减少到32岁,两相之间的边界不明显;当只有10压强计,更新的合奏的意思是无法捕捉的主要渠道结构无论是否使用了正确的模型。同时,估计的不确定性(图7)增加随着压强计数量的减少。通过比较我们发现保持一个密集的观察压强计确定日志导率是很重要的因为每个观测的影响区域是有限的。也为参数识别,我们认为是非常重要的,观察压强计位于两相、高导电通道和电导率越小背景页岩;因此,在设计一个采样网络,无论地质信息应该用于帮助压强计的配置。在这个实验中,当32压强计,最长的信道特性参考含水层被系综均值(场景4和8图6)。如果我们的压强计分布(图重叠4 (c))参考log-conductivity球场上我们可以发现,在每一段通道存在压强计,这解释了模糊但辨认合奏的意思。当压强计的数量进一步减少到10,压强计观测网络太稀缺,捕获底层的总体结构参数(日志导率)。

我们计算出 定量评估的性能逆方法对于不同的场景(图8)。我们发现这两个的值 减少时间和数量的数据。两个值接近一个高原60年底的时间步骤。

数据910显示水头进化的两个压强计(没有。21也没有。103),这两个作为调节观测井111压强计,没有使用。103年仅用于模型验证,当63年,32岁或10空调井是可用的。我们发现井头都预测不确定性减少所有更新模型与结果之前的模型相比,在不进行数据同化。此外,不确定性传播的压强计111例(S2和S6),正如所料,窄比其余的场景。

是非常重要的注意,没有用于水力传导率数据的生成之前整体实现。唯一的水力传导率信息使用随机函数模型之前,也就是说,之前的双峰直方图和训练图像。

4.3。之前之前正确的和错误的

之前的影响模型的性能NS-EnKF已讨论了李et al。11),这里的重点是测试压强计的数量的影响对正确和错误的先验模型。在图6,左边最后一行第二列显示结果与正确的模型之前,和正确的列显示结果与之前错误的模型。我们发现的系综均值更新log-conductivity场展览之前总是在错误的情况下更多的噪声模型,但它仍然能够识别的主要模式参考。在图8我们发现的值 正确的先验模型小于之前错误的模型。此外,的大小 比较没有明显指示过滤器近亲繁殖的应用程序本地化NS-EnKF。注意,水头(数据预测910)之前使用正确的模型相媲美之前错误的模型虽然导电性结构的表征由前者比后者。这可以归因于逆问题解的非唯一性和平滑作用的地下水流动方程(23,24]。

5。结论

本文的目的是探讨不同因素对性能的影响的局部NS-EnKF识别ln 模式的同化液压头。ln 在合成含水层的特征是双峰分布。主要结论如下:(1)信息从稳态流动条件不足以确定渠道结构;为此瞬变流动的信息是至关重要的;(2)数据同化算法能够描述水力传导率在使用瞬态压力计的数据,至少有32个压强计在含水层均匀分布。含水层应该考虑的地质观测网络的设计,它是将所需的最小数量的压强计;(3)瞬态数据包含足够的信息,这样即使一个错误的模型之前,导电通道的识别是可以接受的。

确认

作者欣然承认金融支持通过西班牙科技部创新项目cgl2011 - 23295。作者想感谢审稿人的评论帮助提高论文的质量。