文摘
降雨径流模拟水文使用人工智能提出了利用神经网络的非线性关系。在这项研究中,一种混合网络作为前馈模块化神经网络(FF-MNN)开发预测每日Roodan流域的降雨径流伊朗的南部。这个FF-MNN有三个layers-input、隐藏和输出。隐藏层有两种类型的神经专家或模块。流域的水文气象数据收集了21年。启发式方法用于开发探索的内容每天流泛化。两种训练算法,即反向传播势头和Levenberg-Marquardt,。乙状结肠和线性传递函数是用来探索网络的最优行为。交叉验证和预测不确定性评估进行了保护过度劳累和overparameterization,分别。结果表明,FF-MNN可以令人满意地预测流量测试期间。 The Nash-Sutcliff coefficient, coefficient of determination, and root mean square error obtained using MNN during training and test periods were 0.85, 0.85, and 39.4 and 0.57, 0.58, and 32.2, respectively. The predictive uncertainties for both periods were 0.39 and 0.44, respectively. Generally, the study showed that the FF-MNN can give promising prediction for rainfall-runoff relations.
1。介绍
水文模型可分为数学(我),(2)物理,(iii)模拟。物理模型是一种小型的一个真正的现象。模拟模型用于观察一个进程创建另一个身体上类似的自然过程。数学模型包括明显的一系列数值逻辑步骤和公式,传递数值输入数值输出(1,2]。发展的进步和改进降雨径流建模出现在1950年代和1960年代(3]。的一个分类水文建模是归因于人工智能(AI)的概念。人工神经网络的人工智能大致可以比作大脑的结构(4]。安研究迄今为止,三个时期的广泛活动。第一次是在1940年代,由McCulloch和皮特的先驱。第二次发生在1960年代Rosenblatt感知器的收敛理论和明斯基,风笛手的工作显示一个简单的感知器的边界和限制。在1980年代早期,ann开始收到相当大的重新关注(5]。近年来,神经网络已经变得非常接受预报和预测等各种学科的降雨径流关系,完成水文(6- - - - - -12]。人工网络用于解决问题的可能的多层感知器,径向基函数和广义前馈网络。事实上,每个网络都有自己的优势。一个完整的讨论人工神经网络等水文基本文献中可以找到(5,7,8,13]。
在这个研究中,提出了前馈模块化神经网络(FF-MNN)发展的降雨径流模型的神经网络作为新一代Roodan分水岭。一个简短的文献回顾等混合结构模块化神经网络显示一些有趣的研究。例如,吴14]预测降雨通过模块化的径向基函数神经网络(M-RBF-NN)方法来预测以接近实时的方式。结果表明,预测更一致和准确。在另一项研究中,吴邦国委员长和桥(15]研究了最优预测降雨径流通过模块化神经网络(MNN)和人工神经网络(ANN)。结果表明,精度比一个简单的安提供的内容。在印度在一项研究中,四种类型的前馈模块化神经网络被用来识别每小时降雨径流模式识别;这项研究是由德斯穆克和Ghatol16]。结果表明,前馈模块化神经网络在季风气候承诺为水资源管理。科尔索和Solomatine17]分离他们的基流使用模块化神经网络预测流动。结果表明,模块化神经网络比传统的ANN模型更准确。Parasuraman et al。18]发达飙升模块化神经网络(SMMN)预测河川径流和蒸发。结果表明,SMNNs可以给更好的泛化预测的高流动和蒸发比前馈神经网络(FFNNs)。金等。19使用模块化模糊神经网络(MFNN)对气候的预测。他们发现MFNN模型有一个有利的结构简单,没有隐藏层,和他们的结果表明,不仅可以MFNN给更好的预测,还可调参数的数量明显低于常见的多层神经网络。Almasri和Kaluarachchi20.硝酸)使用模块化模糊神经网络来模拟在一个农业流域地理信息系统(GIS)是用来准备输入数据。模拟结果显示,长期为未来水资源管理的内容是有效的。张和Govindaraju [21]月径流预测使用贝叶斯的概念和内容。他们的主要目标是开发模块化拓扑克服降雨径流建模的复杂性。他们收集了月平均降雨量和温度作为输入和输出产生放电。结果发现令人满意的预测径流。
这项研究中,另一方面,是为了执行通过前馈模块化神经网络模式识别(FF-MNN) Roodan流域位于伊朗南部。作者而言,没有类似的研究使用的内容曾经上述排水。本研究的内容是开发模拟每日流量通过培训、交叉验证和测试。
2。引入前馈模块化神经网络
前馈模块化神经网络(FF-MNN)是一类特殊的多层感知器(MLP)和多层感知器通常被定义为一个扩展。这也意味着,其假设和培训规则是一样的延时(5]。一般来说,FF-MNN认为其输入使用两个平行mlp网络然后重组结果生成输出。王等人。22多神经网络)表示,从神经专家或结构化模块,每个模块(神经专家)是专为个人投入产出对。调整模块的权重通过应用同时认为算法在训练阶段。这个过程可以提高功能专业化发展的每个模块生成更多的选择拓扑(架构)。
一般来说,内容可以学习模式识别和加速训练时间。的一般表示FF-MNN图所示1。FF-MNN有几个模块在隐藏层神经元的数量和传输功能,但所有学习规则是相同的。模块学习模式对不同输入输出对使用传递函数和神经元的数量。在这项研究中,FF-MNN有两个模块,这是足够的配置非线性。多神经网络动力应用中可以找到张和Govindaraju [21]。
3所示。方法
3.1。案例研究
研究区位于伊朗南部Hormozgan和科曼地毯之间的省份,这是Roodan分水岭。流域的面积是10570公里2北部和谎言之间地理北纬26度57分钟28度和31分钟56度的东部经度和47分钟(图57度和54分钟2)。期间的1978年到2008年,平均年降水量为215毫米。一般来说,Roodan是较短的干旱,半干旱的气候和高强度降雨。最重要和占主导地位的土地使用Roodan分水岭的作为灌木(范围刷)混合草原,和Minab大坝位于流域的出口,在收集对下游地表水开发是很重要的。降水和排水收集Roodan分水岭在日常时间步从1988年到2008年。
(一)
(b)
3.2。构建FF-MNN
一般而言,一个人工神经网络等FF-MNN函数通过学习变量关系培训,然后延伸到测试条件(23]。数据的数量和质量,即建模(信息内容,是最重要的24]。一般来说,训练数据的收集代表盆地和水文气象模式的特征是非常重要的在神经网络所认为Yapo et al。25]。在这项研究中,水文气象数据,即降水和河川径流,从IRIMO获得从1988年到2008年在日常时间尺度的Roodan分水岭。每日平均降水(毫米)和平均每日流量流(m3/ s)作为可用的预测因子。
模块化的前馈网络选择由德斯穆克首次引入,Ghatol [16]。FF-MNN包括两个模块的隐藏层,这意味着有两种并行计算的输入向量。每一个模块都有特定数量的神经元和转移函数,和每一个层都有训练算法。每一个模块的输出总结在输出层计算。重要的是选择一个理想的数量的神经元隐层的每个模块的优势转移函数和优化训练算法;层的数量,在这种情况下,可以选择一些通过试验和错误26]。整个过程要求modeler是病人在神经网络。传递函数为每个流程元素是一个必需的组件(神经元)因为一个神经元的输出向量的生成与传递函数类型(27]。在降雨径流建模、乙状结肠和线性传递函数是最受欢迎的功能,所(28]。表1这项研究表明应用传输函数。
一般来说,学习规则决定输入的相对重要性权重过程元素。最流行的训练算法是反向传播(动力),已由梯度下降规则(22]。Levenberg-Marquardt算法,与数值优化技术作为学习规则,正在经历更多的降雨径流关系评价(29日]。在我们的研究中,两种训练算法选择,这些都是如表所示2。
在神经网络中,数据必须根据培训标准化的算法,然后需要分为训练数据集和测试。的数据应该规范化(标准化),因为平等考虑在训练阶段。在这项研究中,因为乙状结肠和线性函数被使用,数据比例分别为乙状结肠是在0和1之间;这个方法是由德et al。30.]。
三个数据集参与开发过程—该训练集,交叉验证集和测试集(验证)。首次应用于训练数据集训练FF-MNN模型配置。交叉验证数据集被应用来决定培训的停止时间,防止过度拟合(27]。最后,测试集应用于评估选择的模型与独立的数据。一般来说,约70%的投入产出对被用于学习和剩余30%的投入产出对用于验证(测试)。10%的训练数据用作Roodan交叉验证集的分水岭。
几个体系结构(拓扑)是在这项研究中开发的训练算法找到最优泛化,转移函数和神经元的数量。在第一步中,一系列的配置测试结合训练算法和隐层和输出层的转移函数。表3显示了Roodan分水岭的设计架构。没有明确的算法,可以显示所需的最优数量的神经元隐层,但这可以通过尝试和错误决定(26]。在这方面,隐层神经元的数量为两个模块是逐渐增加的。在这里两个进化方案涉及模块1:(1)增加神经元的模块1和模块2固定两个神经元在模块2和(2)增加神经元的模块2而神经元最优固定模块1(最佳神经元意味着更多的神经元不进一步改善泛化)。相同的步骤是重复模块2(1)神经元模块2的数量增加了,而两个神经元在模块1固定和模块1(2)神经元的数量增加,而优化神经元模块2是固定的。总体目标是获得一个一致的泛化。
3.3。通用方法的FF-MNN Roodan分水岭
FF-MNN的发展是由第一选择模型学习和验证的数据集。其次是确定输入和输出变量和扩展数据。之后,网络拓扑结构的细胞的数量和规格设置隐藏层。然后,原油FF-MNN训练和测试来找到最优的结果。这个FF-MNN有三层,输入,隐藏层和输出层。隐藏层有两个模块(神经专家)。
很明显在这一点上,输入层细胞的数量与输入数据向量和输出层之间的相同的关系被发现和它的向量。通常情况下,一个隐藏层由ann足够的降雨径流建模。然而,找到最优网络结构是高度依赖于一个任务隐藏层的数量。在这项研究中,各层一层一层地进行评测,并使用启发式方法,这样做是视为一个通常的方法,所提出的鲍登et al。7]。这是一个逐步的方法增加输入(转发方法)逐步减少输入(落后的方法)。在这方面,建模者应该考虑复杂的神经网络的输入变量(即。,由于滞后和各种变量)。在这项研究中,输入对测定在转发的方法找到最优泛化。被训练使用的FF-MNN模型产生的径流和降雨的日常数据。输入向量是由降雨(PCP)和径流(前五天)值。选择为期5天的延迟的原因是由于降雨事件的存在之前五天(即,,,,,)[28]。FF-MNN模型也可以显示在紧凑的格式如下:
通过使用方法将输入变量,FF-MNN架构被训练来捕获动态、复杂,非线性Roodan流域降雨径流机制与和谐的传递函数和归一化数据。在此阶段,FF-MNN是由输入数据,结合转移函数和训练算法(表隐层和输出层3)。如前所述,最优隐层神经元的数目决定使用试错过程通过两个进化方案建议(7]。特殊考虑也采取这一事实更小的细胞数量可能不足以捕获困难的预测和计算输出之间的关系(31日]。最后,结果相比,计算各种绩效评估指标(即。、MSE、和NS)之前的训练和测试数据集最优拓扑决定发展。
4所示。模型性能评估
水文模型的准确性可以使用很多方法评估,例如,世界气象组织(WMO)提出的方法通常可以分为图形评价和数值评估(32]。世界气象组织(33)提出了两个指标作为观察和模拟数据的图形化的评价,这是(我)线性预测的情节和测量数据,(2)双质量块估计和实际数据。
数值评估可以在两种形式进行的,也就是说,绝对的拟合优度和相对拟合优度34]。相对拟合优度是一个无量纲准则,提供了一个相对比较观察和模拟数据(35),表示为确定系数()和Nash-Sutcliffe效率系数(NS)。绝对的拟合优度统计有尺寸35),表示为均方根误差(RMSE)。
(一)确定系数是presentd 在哪里的观测值的时间吗;预测的值在时间吗;是观测的数量之和;和和分别观测值和预测值的平均水平。范围在0和1之间,和更高的值表示更高程度的和谐或协议。
(b) Nash-Sutcliffe (NS)提出 在哪里是时间步的数量;和模拟和观测流量在时间步吗;和是在仿真期间的平均观察流量。当NS = 100%,这意味着一个完美的观测值和预测值之间的依赖已经达到的成就。通常,Nash-Sutcliffe系数是开发/ correlation-based措施由于其响应的测量和预测的平均值和方差(35]。
(c)均方根误差(RMSE)提出 在哪里测量值在时间吗;估计价值在时间吗;和测量数据的总数。RMSE尺寸测量,表明模拟结果与实际观测值之间的协议数据。当RMSE接近于零,这意味着模型的性能好。
一般来说,预测的不确定性(PU)安的评估使用noise-to-signal比率指数(6]。在这种情况下,它被计算为公正的标准错误(见)。上交所是一个无法解释的方差与标准差的观测值为因变量(STD)。因此,看到比性病(见/ STD)命名为noise-to-signal比率或预测的不确定性指数。它表明,在很大程度上,噪音隐藏的信息。模型可以提供正确的预测,如果看到的是小于性病。另一方面,模型估计不会是正确的如果比率大于1。看到的是作为 在哪里自由度和等于观测在训练集的数量-参数的数量。和分别是流动的观测值和预测值。预测的不确定性(PU)是这样计算的
5。结果和讨论
最优开发FF-MNN被发现通过挑战性的启发式方法,考虑(i)不同的拓扑培训;(2)输入变量的组合;(3)增加和减少隐层的神经元数量为两个模块;和(iv)探索学习速率和动量项通过试验和错误带来更好的泛化。图3显示了行为的最小均方误差(MSE)对数据集的训练和交叉验证图谱的规范化数据优化体系结构。最佳的细胞数量有增加和减少整个启发式程序38和26个模块1和2,分别在隐藏层。一般来说,神经元的增加导致了更好的泛化可以归因于模块1的乙状结肠传递函数。然而,传递函数模块2中未能产生任何重大的改变。结果并不令人满意自神经元数量短于52。
表4礼物最后开发了FF-MNN模型与相关组件的隐层和输出层Roodan分水岭。总之,线性传递函数在输出层和乙状结肠隐层传递函数的类型(模块)已导致更好的泛化。此外,Levenberg-Marquardt在隐藏层和输出层的反向传播算法被发现适合提高泛化。
在这项研究中,合适的动力和步长(学习速率)值被发现通过试错。势头加快培训非常平坦区域的表面误差。应用学习速率增加的可能性,防止陷入局部最小值作为替代的全球最小值(5]。动量值应小于1.0(一般在0.1和0.9之间)进行融合网络中。调整步长通常是与更新权值空间。徐et al。36]发现势头值的0.85和0.23是合适的学习速率。此外,Nourani和Kalantari [26提出了动量的值0.9和0.1和学习速率,分别。在这个研究中,动量和步长设定在0.8和0.1,分别考虑培训后时间和最优结果的稳定性和文学的建议。
NS-coefficients校准和验证周期分别为85%和57%,分别为最佳FF-MNN。校准期间给了良好的性能,验证时期是温和的,根据Tombul和Oĝul定义(37]。的系数获得校准和验证时间分别为85%和58%,分别。在最近的一项研究在巴基斯坦一个前馈神经网络模型开发的月径流预测干旱大分水岭(9391公里2)的年降水量191毫米38),NS值校准和验证时间分别为0.88和0.63,分别;这些都是在与本研究相当不错的协议。很明显,降雨径流过程非常非线性。训练和测试之间的差异(验证)可以来源于降雨径流关系的复杂性已成为更重要的在大型流域干旱气候。因此,这种非线性关系模型未能捕获在一个完美的方式。德斯穆克和Ghatol16)报道,一个令人满意的相关系数介于0.5和0.8之间(4000公里)2在印度的排水;这是通过降雨径流的前馈模块化神经网络开发的每小时的时间步长。表5显示了开发模型的精度标准。
每天流流动3/ s (CMS)是通过图形可视化和统计分析来评估提供一个良好的认知评估观察和模拟日常流流动。数据4和5显示对比测量和模拟流流在CMS的训练和测试时间,分别。图4描述了一个可接受的峰值流量的模拟FF-MNN培训。1993年2月5日的事件有最大的流记录Roodan分水岭,最有前途的引人注目。相反,最大的流记录测试时间2005年2月14日,但是内容显然低估了这个问题。在图52008年3月29日,每日流量显然是高估了。一般来说,流量预测是鼓舞人心的时期,和他们的预测来衡量流流动遵循了类似的趋势。
数据6和7说明了累积每日流量Roodan校准和验证阶段。图6显示,模拟日常流量在1991年到2002年期间被低估了。从1989年到1990年,模拟日常流动令人满意。测试期间,FF-MNN预测两个类似的趋势为高估(图7)。总之,模拟累积每日流量一直高估了试验周期,但2005年初的相似性是可以接受的。
一般来说,每日累计流量趋势是类似的观测和模拟之间的每日流量的训练时期,尽管有一个轻微的可持续的低估。此外,有一个过高的测试段除了在2005年初。观察和预测流之间的异同的时期可能是由于网络的功能和意义的非线性大规模流域降雨径流关系与干旱气候。
观测和模拟流之间的百分比绝对错误如表所示6训练和测试时间。95%的数据有差异的10 m3在测试期间和19.73在培训期间/ s。一般来说,百分位数的绝对误差小于50%比训练小测试段时期。他们一直以粗体显示版本表6。
预测的不确定性得到训练和测试时间是0.39和0.44,分别(图8)。一般来说,PU统一下被认为是令人满意的(6]。研究Tokar和约翰逊(24),涉及学习数据的神经网络的预测不确定性评价包括湿和干燥或潮湿,平均年。他们认为这样可以提供更多的可接受预测精度相比,网络训练使用的组合干燥和/或年平均数据。也许令人满意的多神经网络的预测不确定性的原因Roodan分水岭是由于大数据的应用阶段,涉及湿,干燥,平均年训练。
6。结论
本研究提出了一种前馈模块化神经网络对于大型流域降雨径流预测与干旱气候。FF-MNN发达通过培训,交叉验证和测试。LevenbergMarquardt和反向传播势头被用来开发训练算法。乙状结肠和线性传递函数应用于计算神经元的输出。发达FF-MNN把良好和公平的预测进行训练和测试。绝对错误根据50百分位数值试验周期不到那些在训练期间。不确定性预测获得令人满意的时期。最后,模块化神经网络前馈神经网络可以作为新一代的有前途的流量预测。
利益冲突
作者宣称没有利益冲突有关的出版。
确认
欣赏作者的合作,帮助部门液压和水文中心的信息和通信技术(CICT)马来西亚各种大学;顾问工程师Ab万岁Saz Shargh公司在伊朗;组织和区域水、农业组织和自然资源组织Hormozgan省、伊朗。