文摘

与重要的传感器和物联网的发展,研究人员现在可以很容易地知道发生了什么在物理空间通过收购时变值的各种因素。本质上,越来越多的数据类别和规模大大有助于解决问题发生在物理空间。在本文中,我们的目标是解决一个复杂的问题,影响城市和村庄,即。、洪水。为了减少洪水引起的影响,从物理空间和数据驱动模型获得的水文因素在网络空间采用准确预测洪水。考虑水文因素中建模的注意能力的意义,我们相信有识别力的水文因素的提取不仅反映在物理空间自然规则,但也最优模型迭代的因素在网络空间预测径流值。因此,我们提出一种新颖的数据驱动的模型称为STA-LSTM通过整合长期短期记忆(LSTM)结构和时空关注模块,它能够预测中小河流洪水。拟议中的时空关注模块首先探讨空间关系输入水文因素从不同的位置和径流输出,将时变权重分配给各种因素。之后,提出了关注模块分配temporal-dependent权重隐藏输出每个LSTM细胞,用于描述状态输出最终的预测结果的意义。以莱赫和彰化流域为物理空间的情况下,几组对比实验表明,STA-LSTM能够优化数学建模洪水在网络空间的复杂性。

1。介绍

随着越来越多的传感器应用于获得从物理空间变异数据,研究人员设法建立一个相应的网络空间来描述固有的传感器获得的因素和结果之间的数学关系,它提供了极大的方便用户在现实世界中找到新的解决方案问题。然而,数学和技术复杂性和挑战在这两个过程,即。,transforming problem-related data from physical space to cyber space, and utilizing models to solve problems in cyber space. Inspired by data-driven and artificial intelligent idea to solve problem in physical space, we intend to smartly solve the problem of flood forecasting by means of complexity modeling and optimization.

洪水经常发生突然的和毁灭性的自然,人类社会造成巨大的生命和经济损失。因此,它是重要的提前预测洪水灾害。洪水带来的影响降到最低,研究者提出数量的方法来准确预测在过去的十年里(1,2]。基于核心理念预测,我们将他们提出的方法分为两类:物理模型(3,4)和数据驱动模型(5,6]。物理模型与概念解释了水文过程的数学方程,如降雨、蒸发和流浓度。之后,一个高度非线性函数构造系统模型复杂的洪水过程从水文线索大型径流值的结果。我们可以找到精心设计物理模型在风扇等。7和连接部分等。8,9),他们的模型适合在特殊领域处理洪水预报的复杂性。

数据驱动模型直接模型数学不同的水文因素之间的相互作用和径流基于历史观测值。换句话说,数据驱动学习洪水线索和流速之间的映射模型没有考虑详细的物理过程,这是物理模型和数据驱动的模型之间的主要区别10]。由于机器学习技术的快速发展,提出了许多新颖的数据驱动的预测方法和实践,包括贝叶斯网络(1),支持向量机模型(11),神经网络(6),他们的变化和集成。

有人指出他们的内部物理和数据驱动的模型都是敏感参数,这需要数量的相信数据和大量的手工工作人员调整。换句话说,主要困难模型适用于中小型流域在于没有足够的数据来支持精确的预测。此外,中小流域通常缺乏专门研究在大多数发展中国家,导致在设计合适的物理模型预测的困难。基于这些讨论,我们的目标是优化的复杂性在中小流域洪水预报方法的数据驱动的模型。

最近,深度学习结构获得了很多关注的重要视觉任务分类和回归结果的文本检测、对象分类,语言翻译,等等。大后的深度学习技术进展的准确性,我们专注于LSTM网络更准确的洪水预报结果的目标。从本质上讲,LSTM了递归神经网络(RNN)的基础上,可以处理与特殊设计的盖茨长期连续的数据。基于其高潜力属性预测时变变量,我们应用LSTM模型固有的和复杂的水文因素和径流值之间的关系。

注意机制被广泛用于预测任务,由于其新颖性借用想法从人类视觉注意力,即人类有意的视图部分环境或图片与上下文信息或高级的语义知识。灵感来自核心理念的关注机制,我们研究中小流域的洪水的形成首先收集相关水文数据不同的地点和时间。之后,小说LSTM嵌入一个时空关注模块结构,命名为STA-LSTM,构造动态选择水文特性准确的预测。

STA-LSTM需要原始LSTM结构的优点,能够处理长期时变数据。同时,嵌入式时空关注模块动态分配spatial-wise重量输入水文因素从不同的位置获得的。之后,它将temporal-wise权重分配给隐藏每个LSTM单元的输出,这是理解上下文信息在刘et al。12]。这样的空间——和temporal-wise权重导致能力动态地描述水文因素的重要性在任何时间和地点了。根据案例研究实验莱赫在欧洲和中国彰化流域,STA-LSTM可以通过构建contexture-based加权实现准确的洪水预报方案。

我们得出两个本文的贡献如下:(我)面对cyber-physical交互建模的复杂性,小说LSTM模型嵌入时空关注模块,提出了能够准确预测径流值在网络空间中基于从物理空间获得的水文数据。(2)我们设计一种新颖的时间关注模块,它是建立在上下文信息来计算重量为每个LSTM细胞输出。将时空上下文信息,提出关注模块有助于描述水文因素相互作用形成洪水等物理空间和适当的构建过程在网络空间中通过构造加权STA-LSTM方案。

在本节中,我们介绍相关的方法有两类,即。,data-driven model for flood forecasting and introduction to attention model.

2.1。数据驱动模型进行洪水预报

早,Juliang et al。13]提出加速遗传算法(AGA)。他们的方法利用反向传播神经网络(摘要)来优化初始参数,更好、更快的收敛性能的优点。灵感来自支持向量机(SVM)的发展,Yu et al。11)比较性能之间的洪水预报人工神经网络(ANN)和支持向量机。执行一系列对比实验后,他们得出结论,支持向量机是略优于ANN预测洪水。后,明华et al。14]着重比较实验结果通过Xinanjiang模型(一个著名的物理模型)和ANN模型。之后,他们的结论是,安能反映水文过程的时变特性,由比较优势与Xinanjiang水文过程模型的抽象表示。

在分析各种洪水预报模型之后,程et al。15)利用量子粒子群优化方法来解决安的复杂性定义参数,由实验来预测后检查每日水库径流值。利马et al。16)与层次贝叶斯框架进行洪水频率分析,估计广义极值分布参数(GEV)在当地对显式地建模和减少不确定性。最近,王et al。10)提出了一个Bayesian-based方法,建立了后验分布每日流量预测和量化的不确定性。

的想法与耦合物理模型和数据驱动模型的强度,O 'Connel et al。17]使用古水文信息约束在洪水频率分析有效地减少不确定性。这样的想法后,他满et al。18)首先模拟水文响应由rainfall-run-off模型称为渗透和饱和过剩(上升),然后利用提取的水文信息后确定的贝叶斯预测。最近,吴et al。5)成功地通过Xinanjiang模型描述水文过程变成实体和贝叶斯网络的连接,提供一个解决方案集成专家知识在一个数据驱动的模型。为了提供一个task-specified计算服务,数据驱动的模型现在已经发展伴随着物联网(19,20.],cloud-edge计算[21- - - - - -23),大数据(24,25),和其他技术(26- - - - - -28]。

2.2。注意模型简介

注意模型背后的核心理念是为任务目标选择信息和重要信息,它伴随着人类选择性视觉机制的原则。现有的注意模型的深度学习可分为两组:软硬的注意。努力关注可以理解为空间选择突出的地区,导致输入领域处理不同部分的值为0(忽略区域)或1(集中区域)。同时,软注意力分配灵活的重量值在0和1之间的输入数据。

Mnih et al。29日]介绍大意的注意力的最佳选择凸区域输入图像基于预定义的选择规则。他们提出的方法执行识别任务选择突出小说RNN的地区结构。后的想法努力的注意,他et al。30.)提出一个卷积神经网络,命名为Text-CNN,涉及注意方案场景文字检测。具体地说,他们的计划不仅提取显著区域作为信息的部分输入图像,而且还特别从特征选择信息特征池更准确的检测。

软注意灵活高效是一个额外的深度学习网络和功能部分。例如,歌曲等。31日]提出空间关注模块准确和强劲承认人类活动。方法首先构造一个spatial-wise体重计划关注信息在每个RGB-D关节骨骼框架上,然后分配空间关注权重来指导功能映射相应的建设框架。利用全球关注信息准确性和鲁棒性更高,一个全球环境敏感注意LSTM [12)修建,这成功地构造和优化全球关注信息为每个RGB-D人类行为序列数据集(32]。

最近,Yeung et al。33]利用软注意力模型权重分配frame-wise帧捕捉到一个滑动窗口,这有助于融合多帧信息识别任务。陈等人。34)模型的基础上,构建一个关注一种新型网络体系结构结合CNN和RNN的优点,成功地提取信息并为人类活动识别modality-specific特性。他们声称他们的提取特性是能够代表高层视觉信息,甚至训练和有限大小不均衡数据集。安德森et al。35)构建一个自底向上和自顶向下的注意模型更快R-CNN之上,这是能够分配权重对象或突出的图像区域的水平。一些公共数据集上进行实验之后,他们取得了最先进的表现形象说明的任务。受以上关注模型,我们设计了该时空注意模型分配注意时间和空间维度的权重。

3所示。该方法

我们首先介绍实验小河流流域,即。,莱赫,彰化流域。然后,我们介绍STA-LSTM提出的整体网络结构模型。最后,小说时空关注模块提出了显示上下文信息提取。

3.1。介绍实验流域

我们取两个流域,即。,Lech and Changhua, as experimental areas, due to their small and complex nature for flood formation. Due to significant development of remote sensing and sensor technologies, we build our prediction model on data collected from remote sensing imageries and sensors. Specifically, data about Lech river basin are achieved from European Centre for medium-range Weather Forecasts (ECWMF), which is free to download worldwide weather and hydrological information. Meanwhile, we get hydrological data about Changhua river basin from cooperation China government.

1(一)莱赫流域指的是地图,我们假设纬度和经度范围莱赫流域从(47.65 10.68 e, n) (48.73 10.94 e, n)与0.01×0.01半径精度。来自西北的斜率Lysitar山,莱赫河最后流入多瑙河在奥格斯堡北部40公里。总长度、流域面积和莱河河口的年平均流量是263公里,4126公里2,1203分别/ s。莱赫流域地区的天气是温暖和潮湿。

1 (b)显示了彰化流域的地图,我们可以发现,彰化河源于鸡西县最后流入Xinanjiang河。总长度、流域面积和河口年均彰化流河96公里,905公里2,146.651米3分别/ s。每日彰化河径流值从0.58米不等32100米/秒3/ s。

对流域是实现我们的目标的表面径流预测收敛的位置(表示为图红圈1通过提出STA-LSTM模型)。具体地说,该模型采用多个水文因素作为输入,包括降水、蒸发、土壤水张力、温度、风。

3.2。网络架构设计

我们首先提供简要介绍LSTM细胞的数学理论。然后,我们解释注意计划提高洪水预报精度。后来,我们设计一种新的LSTM网络架构涉及洪水预报的上下文信息来完成任务。最后,我们为读者提供STA-LSTM伪代码的方便。

3.2.1之上。的数学理论LSTM细胞

由于难以维护长距离依赖信息,LSTM修改RNN设计门结构保持长期的状态。LSTM细胞的典型结构如图2,我们可以观察到输入门、输出门o、输入调制门 ,忘记门f,存储单元c。每个LSTM细胞负责更新其隐藏的输出表示h在每一个国家t使用以下功能: 在哪里x代表输入信号和功能σ()是指操作的乙状结肠。

LSTM引入了一个长期记忆结构c保持长期的信息对于每一个细胞。此外,它决定是否忘记信息在内存根据以下方程: ⊙指element-wise乘法。从方程(3),我们可以注意到内部存储单元ct会更新,如果忘记门f被激活。激活后f,ct将分配信号输入控制的门和输入调制门 后来,LSTM细胞将更新隐藏输出ht门的基础上输出o和当前存储单元ct中所描述的,这是方程(4)。以上设计的存储单元和不同的盖茨,输出LSTM可以与之前的输入信号来记住长期连续信息(36]。

3.2.2。函数的关注在洪水预报方案

经过多年的研究,采用数据驱动的模型来预测洪水,我们发现采用所有水文数据预测不能帮助实现令人满意的预测结果,因为一些水文特征与径流是无用的,甚至独立的预测。例如,土壤水张力是初始状态的一个重要因素在潮湿地区洪水。当土壤水张力增加,价值超过最大,土壤可以保持在下雨,它不会影响径流的变化值。此外,土壤水张力不影响河流量值与沙质土壤干燥的位置,由于能力维持水的沙质土壤。所有这些事实可以在水文模拟研究或物理模型37]。

由于高空间和时间变化的水文过程,强烈建议收集水文因素密集网络的水文气象电台。足够的基础建立在站收集水文特性,建模信息量程度的水文特性将有助于准确预测。换句话说,有选择地利用信息因素获得重要的时间和地点是关键的想法采取关注洪水预报方案。关注关键特性的能力,忽略不相关的特性,数据驱动的模型可以适当整合不同的因素以适应洪水的过程,而不是专业知识用于物理模型。此外,无关紧要的因素可能会带来噪音减少预测的准确性。

基于上面的讨论,我们因此建立动态特性选择机制,即。,attention mechanism, to describe informativeness degrees of flood factors, so that different combinations or weights can be applied on input hydrological features based on context information, i.e., inherent characteristics of river basin for flood formation. It is noted that there exists a trend in deep learning domain that researchers should design all functions by one single network, which brings advantages of less computation and high optimization efficiency. Following such trend, we aim to design a novel LSTM network, i.e., STA-LSTM, to complete task of choosing variables by attention module, which works with the same function of Principal Component Analysis (PCA) indeed.

3.2.3。STA-LSTM结构

网络结构的提出STA-LSTM如图3,建议关注模块分配动态权重STA-LSTM细胞使用的输入和输出信息特征的选择。在构建关注模块之后,隐藏的输出所有STA-LSTM细胞连接形成F预测径流值的增加或减少。指出,我们倾向于预测基于所有隐藏的输出,因为LSTM结构被限制在保护全球上下文信息通过设计忘记门。考虑洪水预报作为全球回归问题,我们因此更愿意执行预测所有隐藏的输出,而不是隐藏的最终输出状态。

如图3,我们首先获得从一个小型或中等流域水文原始数据构建的输入数据集X= {x= 1,2,…n},n参考指数和总数量的样本。存在n洪水记录输入数据集X。后来,原始样本x规范化建设相应的水文特性集吗 : 在函数f规范()表示归一化函数,τ代表总数的状态在整个网络H×W指大小的输入特性为每个州和水文因素是由变体。

在国家t指的是部分标记为蓝色矩形图3,相应的tth LSTM细胞计算隐藏当前状态的输出ht 在函数flstm,t()代表处理tth LSTM细胞维持长期的信息,t代表加权输入功能模块计算空间的关注年代,ĥt−1指加权前隐藏计算时间关注模块T。有人指出LSTM细胞的数量是相同的与总数的状态τ

具体来说,加权输入功能t在方程(6)是由提出处理模块空间的关注年代 在哪里αt是指空间注意体重的状态t、⊗表示element-wise操作和功能 意味着内部操作t−1日空间关注模块计算αt。它指出,空间或时间关注模块的数量τ−1。

与此同时,隐藏的输出ĥt提出处理的时间关注模块T 在哪里t−1t原始输入特性状态吗t−1和t分别βt是指空间注意体重的状态t−1⊙操作代表element-wise乘法和功能 代表业务内t−1日时间关注模块计算βt−1

3.2.4。的伪代码STA-LSTM

描述步骤之后建立STA-LSTM网络的数学函数,我们提供详细的算法伪代码1,读者可以很容易地理解实验的过程和STA-LSTM模型的实现细节。

输入:输入数据集Xn样本,每个样本是指收集的水文特性集τ州,输入初始super-parametersθ
输出:径流值预测Y
(1) 初始化初始super-parameters STA-LSTM模型θ和随机网络权重W1
(2) 样指数= 1;
(3) n
(4) 设置当前状态t= 2,隐藏在第一状态输出 ,加权隐藏输出在第一状态 ;
(5) tτ
(6) 输入 t−1日空间关注模块计算空间注意体重 ;
(7) 完善当前的输入 与空间注意体重αt通过 ;
(8) 输入 tth LSTM细胞来计算当前隐藏输出 ;
(9) 输入 t−1日时间关注模块计算时间注意体重 ;
(10) 完善当前隐藏输出 与空间注意体重βt通过
(11) t+ +;
(12) 结束了
(13) 增加或减少的价值流失Y=支出( ,…, )
(14) 计算RMSE与Y和真实价值。
(15) 如果RMSE减少然后
(16) 更新模型权重: ;
(17) 其他的
(18) 继续;
(19) 如果
(20) + +;
(21) 结束了
(22) 训练过程结束并保存模型参数。
(23) 输入测试样本输出相应的预测价值Y
(24) 计算RMSE特区和日军来测试样品。
3.3。时空关注模块

提出了时空结构的关注模块如图4。相比与传统的物理模型,依赖于专家知识和经验手动分配因子权重,提出关注模型可以自动选择的因素来预测基于收集的数据的固有特点,为不同的应用场景更灵活。

3.3.1。空间关注模块

从ECWMF网站获得的数据收集与网格结构受纬度和经度,提供详细信息输入水文因素的空间分布。然而,小半径精度,即。,0.01 × 0.01 radius, could greatly increase computation burden of the proposed model. Therefore, we reconstruct organization form of the acquired data to keep balance on precision and effectiveness, where the reconstructed data structure is shown in Figure5。我们可以注意到图5(一个)抽象的图1翻转操作和大空间网格。后从原始积累数据和小网格大电网,我们终于达到新颖有效的表示输入水文因素图5 (b),每一个因素可以被视为一个3 d维向量和特征,位置,时间值里面。

信息量输入水文因素在不同位置变化很大。例如,莱赫河附近地区应该比地区远更重要,因为河附近的降雨可以迅速聚集增加径流值。利用空间属性的输入水文因素,构造空间关注模块分配权重从不同的位置获得的水文特性的网格。本质上,空间关注模块探索河道间特性从不同位置之间的关系,帮助STA-LSTM更多关注于凸网格对准确预测。

如图4、输入特性t是由一个完全连接处理层和乙状结肠函数输出spatial-wise体重吗αt: 在函数f年代()是指乙状结肠操作,W年代b年代代表权重矩阵和偏差参数完全连接网络,分别。

3.3.2。时间关注模块

考虑到普遍存在一种趋势在连续的数据,研究人员设计Holt-Winters双指数平滑滤波器来描述现任和前任的观察值之间的关系。后这样的假设与动态更新的体重和实施方案,我们利用时间关注模块分配权重隐藏STA-LSTM电池的输出,它充当观察在不同时间之间的关系建模功能。

如图3,我们利用隐藏的输出当前状态和前国家构建时间关注模块,它探讨了两国之间的差异决定是否当前输入的信息。提出了时间模块的详细结构显示在右图的一部分4,我们计算时间的重量βt−1国家t−1 在函数fR()代表ReLU函数,Wt−1t−2Wt−1t−2引用参数矩阵需要定义培训期间,和bt−1是偏差向量。事实上,temporal-wise重量是控制的关键信息通过网络从前隐藏输出到下一个细胞。因此,时间关注模块是一个有益的补充空间关注模块。

4所示。实验

在实验部分,我们首先介绍数据集和测量。然后,我们设计两组消融实验讨论感性的水文特性和该注意模块的有效性。后来,我们用几种洪水预报方法进行比较研究比较的有效性。最后,我们提供STA-LSTM的实现细节。

4.1。数据集和测量

我们利用两个数据集来证明STA-LSTM的有效性,即。、好色、彰化流域。指出,他们有不同的特性,因为它们是ECWMF和政府部门合作,收集的分别。具体来说,我们利用ECWMF提供的工具来收集7360水文莱赫流域不同的实例从5月1日,2002年,2018年1月1日。这些实例表明径流值的显著增加,提供原始数据为径流系数检测的变异模式。与此同时,我们从1月1日收集8555个样本不同,1998年12月31日,2010年,代表40从降雨洪水和手工记录水文数据,蒸发,测量站在彰化分水岭。有人指出莱赫数据集包含足够的信息采用水文特性,即。紧张、降水、蒸发、土壤水、温度、风。与此同时,彰化信息的数据集是短暂的温度和风力。缺少这两个小水文因素没有一个伟大的对洪水的结果精度的影响。此外,我们实现数据的土壤水张力根据Xinanjiang计算模型(简称XAJ模型),这是一个著名的物理模型来预测洪水semihumid地区。

1提供了描述性统计和降雨量数据流从莱赫彰化流域,我们可以观察到两个数据集数据表示是不同的。这是由于他们独特的数据集合操作,莱赫的数据集是由遥感意象和数据在彰化手动收集数据集。从表1的数据分布,我们可以注意到明显区别莱赫和彰化河流,因为河不同数据集的特征差别很大从一个到另一个地方。这种现象带来很大困难准确预测河流径流值,因为它需要模型来描述输入水文特性和径流值之间的函数关系没有overfit性能。

由于ECWMF的本质,即。,they collect hydrological data every 3 hours, we refer each state in STA-LSTM as 3 hours for modeling. As represented in Figure5,我们利用这些3 d功能通过定义时间价值(状态值)为6,结果在一个输入特征来描述水文因素18个小时。训练后,我们执行回归任务STA-LSTM径流值下1、2和3州根据输入的前6个国家的水文特征。

我们使用标准的质量度量,即。,Root米ean Square Error (RMSE), Mean Absolute Percent Error (MAPE), and Deterministic Coefficient (DC) to measure the quality of flood forecasting. These three measurements are formulated as 在哪里y真实是指预测径流值和相应的径流值, 是指真实的平均径流值,n是数量的测试实例。指出,较高的直流值意味着更相信洪水预报结果。同时,RMSE和日军被用来量化和groud-truth值相似性预测结果,在较小的RMSE值和日军表示对洪水预报质量精度高。

4.2。性能分析

我们设计三个STA-LSTM对比实验来分析性能。具体地说,第一个实验的目的是估计感性的输入水文特性,第二个是用来比较的有效性STA-LSTM有或没有注意模块,最后实验的目的是比较STA-LSTM与比较方法的性能。本文所有实验、输入时间是解决形式T5到T,这使得输入数据包含6个州之前的水文特征T

4.2.1。准备功能敏感性实验

我们显示相关实验数据表的感性特征2。在每种情况下的实验,我们消除一个输入水文特性和保持其他投入保持相同,这可能显示特殊的情感功能获取准确的预测结果。由于缺少两个水文特征在彰化的数据集,我们喜欢莱赫敏感性实验数据集完成特性。为了更好的对比结果,我们提供两个更多的统计数据表,也就是说。均值和偏差值代表的下标一个σ,后者计算结果之间的差值在当前运行的条件下,通过STA-LSTM。

从表2,我们可以注意到RMSE最小值是通过Wo-Temperature,和最佳的性能在日军和直流通过Wo-Wind。换句话说,消除温度或风有一个小的因素对预测结果的影响。在此基础上观察,我们可以得出这两个水文因素不太相关格式的洪水。同时,最糟糕的表现在三个测量值都是通过Wo-Precipitation,这证明了降雨是准确预测洪水的最重要因素。

Wo-Evaporation的实验,我们可以发现偏差值在三个测量增加更大的预测时间。相反,我们可以发现偏差值对应于Wo-ST-Water减少更大的预测时间。在此基础上观察,我们可以知道,蒸发的重要性逐渐成为更大的长期预测,虽然Wo-ST-Water大多导致短时预测。从本质上讲,ST-Water定义了初始状态之前形成的洪水,这使得它显著的短期预测。同时,蒸发影响洪水的形成在洪水的整个过程。最后但并非最不重要,我们应该注意到,这两个因素的蒸发和ST-Water不是主要功能准确预测,当与降水进行比较。

4.2.2。烧蚀实验

比较关注模块的有效性实验的细节如表所示3。具体来说,我们执行三个案例与空间注意模块的实验,与时间关注模块,分别和两个模块。

从表3,我们可以观察到measurement-related STA-LSTM较大时获得的性能比较与空间或时间关注模块,这证明注意模块的有效性涉及水文特征增强的上下文信息。我们也可以注意到,大多数情况下,第二个最好的性能和最佳的性能与时间偏差值是通过方法模块,这证明时间注意力信息对预测比空间注意的信息。从本质上说,洪水径流生成是一个复杂的程序,分离,和路由,定时为洪水预报是一个重要因素。因此,时间从序列数据中提取的上下文信息更有助于准确预测洪水。

4.2.3。实验与比较方法

45提供详细的统计比较的方法,通过测试STA-LSTM莱赫和Chuanghua数据集,分别。具体来说,我们实现支持向量机,LSTM, 10层FCN(完全连接网络)作为比较的方法。公平比较,结构和参数LSTM结算与STA-LSTM是相同的。此外,我们实现XAJ模型作为表的比较研究5提供的数据比较数据驱动模型和物理模型。理由放弃使用莱赫XAJ模型数据集在于XAJ模型是专门为彰化流域或其他semihumid地区,不适合莱赫流域下我们的假设。

所证明的R一个,一个,D一个在表4数据集,STA-LSTM达到最佳的性能在莱赫。与此同时,表5表明STA-LSTM达到最佳的性能在直流和RMSE第二最佳性能和日军在彰化的数据集上进行实验。通过比较XAJ模型和STA-LSTM在表之间的关系5,我们可以注意到,专门设计的物理模型,即。,X一个J model, is capable of obtaining a higher accuracy on flood forecasting, especially in long-time period forecasting. Such phenomenon can be explained by the truth that flood is a complex process for data-driven modeling under a limited size of data. Therefore, utilizing insufficient data to fit flood process without building inherent and knowledge-embedded relations could not work well for long-time period forecasting. Furthermore, errors and noise for data-driven are easy to accumulate without appropriate means of error optimization during forecasting process.

与其他数据驱动模型通过比较STA-LSTM表45,我们可以注意到FCN执行比STA-LSTM预测T+ 3莱赫的数据集。然而,它未能取得一致的长期周期预测的性能,例如,T+ 6和T+ 9。事实上,十层结构FCN有限大小的参数使它适合适合在相对简单的情况下短时预测。然而,复杂性的增加很大程度上预测较长的时期,导致性能下降不足FCN参数模型和优化的复杂性。支持向量机被广泛用于处理有限的情况下学习的数据的大小。然而,传统的支持向量机不适合进行回归推断基于复杂和连续的数据,从而导致性能下降比STA-LSTM通过SVM。原始LSTM执行比STA-LSTM在所有情况下,证明注意模块的意义在提高精度通过关注信息水文因素和时间,特别是在预测小数据集。

很明显观察到所有数据驱动方法执行更好的短期预测,也就是说,T+ 3,因为短时预测数据驱动模型的核心任务是适应数据与合适的参数和防止过度学习。由于不确定性和积累错误来自模型和输入因素,比如天气预报、存在与长期预报性能下降。处理复杂的长期预测,提出STA-LSTM LSTM结构的基础是建立在解决长期依赖,设计细胞记忆代表和记忆长期依赖。此外,STA-LSTM固有模型上下文信息来更好地描述长期记忆和输入减少噪声带来的影响。因此,STA-LSTM能够预测洪水与更高的精度和更长的时间比其他数据驱动模型,证明的最佳性能T+ 6和T+ 9。

我们采用一个实例在径流值的测试数据集比较预测性能通过STA-LSTM和其他比较方法在图6。根据情节T+ 3,我们可以发现FCN表现最好,STA-LSTM接近LSTM性能,支持向量机实现了最糟糕的预测结果。从本质上讲,通过SVM预测曲线太光滑,配合真实的时变特征径流值,由于其固有的建模假设,输出值应该是在一定程度上光滑的。由于平滑输出属性,我们可以发现,支持向量机预测的结果低RMSE,但未能配合时变径流预测情节。通过比较预测曲线之间的短期和长期预测,我们可以注意到明显的扭曲T+ 6和T+ 9由于大幅增加的复杂性和难以预测的任务。在长期预测方法,STA-LSTM表现最好,LSTM和SVM实现稍差的结果,FCN表现最差。最重要的是,总体预测性能的STA-LSTM比比较更准确和一致的方法在这个案例研究中。同时,情节通过SVM和LSTM视觉效果较近,我们能找到一个和明显的失真度。最后但并非最不重要,FCN获得预测情节严重失真和大偏差在几个关键的时间。

4.3。实现

实验进行一个服务器(2.4 GHz Xeon处理器,6-core 60 GB的RAM和一个Nvidia GeForce GTX 1080 Ti卡)。莱赫和彰化的数据集,我们利用4倍交叉验证测试STA-LSTM和其他比较方法。隐藏状态,在网络设计、尺寸和总状态STA-LSTM网络被定义为128和32岁的分别。在训练、学习速率、体重减少,和迭代次STA-LSTM网络被定义为0.0025,10−6分别,500。我们每100次,更新学习速率和相应的下降率是0.01。

5。结论

面临的困难问题数据从物理空间转换为网络空间和利用模型来解决问题在网络空间中,我们首先定义洪水的问题从两个物理和网络空间的观点,然后提出STA-LSTM通过嵌入时空关注洪水预报信息。STA-LSTM可以选择性地利用信息从重要位置和时间获得的水文特性。莱赫和彰化流域实验证明的有效性STA-LSTM通过比较比较研究。我们未来的工作包括建设一个轻量级的洪水预报模型通过消除无用的水文特性,这不仅提高了洪水预报系统的运行速度,但也很大程度上减少在收集数据和建模复杂性特征的关系。

数据可用性

图像和获得传感器数据用于支持本研究的发现是由宇凯叮在许可证,所以不能免费提供。请求访问这些数据应该Yirui吴((电子邮件保护))

的利益冲突

作者宣称没有利益冲突。

确认

这项工作是由中国国家重点研发项目支持下拨款2018 yfc0407901,自然科学基金在拨款61702160,江苏省自然科学基金资助下BK20170892。