Lion算法优化的长期短期记忆网络在印度乌杜比地区地下水位预测中的应用

抽象

地下水是一种宝贵的自然资源。地下水水位预测是水资源管理领域的关键问题。观测井GWL的测量是含水层信息的主要来源，对含水层的评价至关重要。印度卡纳塔克邦Udupi区的大部分地区由地质构造组成:红土地形和片麻状杂岩。由于地形的粗大和降水的不一致性，乌迪普地区的GWL值不断下降，大部分裸眼井在夏季都处于枯井状态。因此，本研究旨在利用混合长短期记忆狮子算法(LSTM-LA)建立地下水水位预测模型。利用印度卡纳塔克邦Udupi地区观测井的历史GWL和降雨数据，建立了该模型。混合LSTM- la模型的预测精度优于前馈神经网络(FFNN)和孤立LSTM模型。基于混合lstm - la的预测模型有望用于更大的数据集。

1.简介

《新印度快报》2018年报道的地下水（GW）调查显示，南印度各州的地下水位（GWL）非常低。调查报告称，在卡纳塔克邦调查的1421口油井中，985口显示了全球变暖潜能值的下降。调查还报告说，乌杜比地区的全球变暖持续下降[1]。这是能够利用先进的算法，一个合适的模型来预测GW资源是至关重要的。GWL预测系统拥有超过六个十年的历史[2]。在文献中发现了大量的研究工作，已达到一定的成熟程度。

水文地质GWL预测模型具有概率性、确定性和随机性。传统的GW水流模型是一个偏微分方程，它包含了对含水层性质和边界条件的简化假设[3.]。这些天然的地下水系统是复杂的，并且具有大量的，在整个时间和空间是高度可变的，如象地层的水力传导率，地下水存储，含水层的尺寸，以及与地质结构中的其他参数含水层参数的参数。为了简化GWL预测，研究人员一直试图探索各种参数，开发GWL预测模型[4]。

随着城市化和气候变化，水文模型在环境和水资源管理中的重要性与日俱增。水文模型大致分为概念模型、物理模型和数学模型[5]. 数学模型又分为经验集中概念模型和物理模型。基于物理的模型使用物理上可测量的静态输入变量，并且需要关于研究领域的大量信息。测量物理性质是困难的，特别是对于预测模型，其中输入值随时间变化[6]。物理模型虽然预测准确，但不太实用，因为它们在预测不规则变化的数据模式方面效率较低[7]。为了克服这个限制，并与计算能力的快速增长，最近数据驱动模型采用使用定量历史数据来预测未来的发展趋势[8]，已成为水资源管理部门的标准工具[9]。机基于学习的方法是有希望的水文时间序列预测。然而，许多技术都依赖于人工神经网络（ANN）的权重或体系结构的优化。数据驱动模型与现有的数据和关于输入和输出参数之间的关系的信息开发的。这些模型具体位置，与在那里开发的输出值只有位置是适用[10]。统计，模糊，回归和人工神经网络通常在这些数据驱动模型使用的数学方法。人工神经网络模型已经在最近的文献中获得多大的兴趣[11]。研究人员已经实现了人工神经网络的功能模型地表水和地下水量[12]。Backpropagations（BP）被广泛用于神经网络训练。然而，ANN方法的结果被发现是不太一致的和不稳定的[8]。因此，需要用于更精确地预测实时GWL替代和先进的数据驱动模型。

文献中使用多层前馈、递归网络和径向基网络开发了不同类型的ANN架构和算法[13]。Rani Sethi等人[14]研究了多层前与BP学习算法开发地下水位深度预测模型。探索影响地下水位波动的重要参数，它们采用月降雨量，蒸发，和地下水位深度作为输入参数。他们提前在坚硬的岩石含水层预测地下水位深度一个月。该模型用在研究期间监测的有限输入数据集进行校准。该模型的性能还可以与足够的数据集，并用不同的体系结构的改善。传统的人工神经网络不能有效地处理顺序数据，这是主要的缺点之一[15]。较长的交货时间预测模型需要已使用具有多个隐藏层深学习技术的发展。

与输入和复发性神经网络（RNNs）之间的多个隐藏层深度学习技术被广泛应用，近年来[16,17]。然而，由于渐变消失和爆炸问题，标准的RNN架构在捕捉变量之间的长期依赖关系方面存在困难，这可以通过一种称为长短时记忆(long short term memory, LSTM)的RNN变体来克服。LSTM最近才被用于水文时间序列预测[18]. Bowes等人。[19]在弗吉尼亚州诺福克市，比较了RNN和LSTM对洪水多发沿海城市GW表的预测。他们探索了两种机器学习算法LSTM和RNN来建模和预测GW表对风暴事件的响应，使用GW表、降雨量和海平面作为2010年至2018年的输入参数来训练和测试模型。根据他们的研究，发现LSTM网络比RNN的Kratzert等人具有更多的预测能力。[20.]探索了LSTM作为区域降雨径流模型在可自由获得的骆驼数据集集水区的应用。他们测试了他们的方法，并将结果与著名的萨克拉门托土壤水分核算模型(SAC-SMA)进行了比较，取得了更好的模型性能，这突出了LSTM在水文模型应用方面的潜力。LSTM RNN具有内部状态，可以学习预测不同序列，具有良好的长期记忆，是传统前馈神经网络最吸引人、最强大的特性之一。

有几个缺点在隔离使用LSTM网络。学习LSTM型号为大量的存储单元的计算变得昂贵。这也从缺乏解释最终决定，该模型获得的能力[遭受21]. 为了克服这一限制，采用了一种混合方法。Mohd Nawi等人。[22]通过使用杜鹃搜索混合技术使用上RNN重量优化研究数据分类问题。收敛速度，局部极小的问题得到解决的杜鹃搜索算法。此模型的性能是使用BPNN算法与ABC相比以及其它混合变体。结果表明，当与混合方法耦合传统RNN的计算效率大幅度提高。钟和Shin [23]利用现有的金融数据研究一种新型的股市预测模型。他们用遗传算法整合LSTM采取混合方法的深度学习技术。他们用一种系统的方法来确定使用遗传算法（GA）的LSTM网络的时间窗口的大小和拓扑结构。实验结果表明，混合LSTM网络优于基准模型。拉希德等人。[24开发了一个结构良好的LSTM来解决传统RNN网络的困难。他们使用了四种不同的基于元启发式算法的优化器，和谐搜索(HS)，灰狼优化器(GWO)，正弦余弦算法(SCA)和蚂蚁狮子优化算法(ALOA)。研究了由于长期依赖于LSTM的学习速度和准确性，并与RNN体系结构进行了比较。他们认为，LSTM的分类精度优于传统的RNN结构，并且可以通过使用替代的、强大的、自然的算法来解决训练这些网络时增加的复杂性。

有需要具有可预测与参数化最低水位有效的计算模型。同时，这样的模式应该能够对付预计气候的变化。为了克服弱点和改善的传统方法的收敛速率（预测精度），更高级的，简单的，需要坚固的，高效和精确的模型。狮子算法（LA）是费道宜在2012年开发的自然灵感的算法，它模仿社会领土狮子繁殖及其辩护游牧狮子。这LA可以与LSTM一起使用，以找到最佳的解决方案。目前的研究旨在发展使用LA优化LSTM网络的权新的混合启发式方法。这项研究还旨在通过与标准前馈结构比较来分析对所选数据集所提出的混合LSTM-LA方法的性能。

2。材料和方法

本研究开发并测试了一个混合LSTM-LA模型。本节描述了研究区域和使用的数据集，FFNN模型的描述，提出的模型的体系结构及其实现。

2.1。学习区和数据集

一个在GWL预测所面临的挑战是，地下水的流向是独特的地质构造。因此，GW分析是区域特定的网站。没有标准的基准测试可用于GWL的预测构建模型的优势。它通过从特定区域收集数据制定区域GWL预测是必要的。这项研究是基于对政府机构从观测井位于印度卡纳塔克邦的乌杜皮区（图收集的辅助数据1）。卡纳塔克邦的地质是非常复杂的从红土在其结构改变的参数，片麻岩花岗岩，辉绿岩堤坝和沿海沉积岩类型[25]。在这项研究中充分考虑观察位于红土地形[26]。

2.2。基于网络的前馈神经地下水水位预测方法

该FFNN结构预测GWL已在GW研究中广泛应用。在神经网络域地下水模型最常用的算法是梯度下降算法。在这项工作中，FFNN的权重使用梯度下降的方法进行了优化。传统的基于梯度的下降的算法在单个权重向量进行操作。该FFNN结构具有两个输入，三隐藏并用梯度下降训练一个输出节点在图中示出2。

FFNN配置是按随机顺序学习的，信息只在网络的每一层正向流动。由于没有循环，它只预测连续的目标变量。因此，为了逐步学习深度学习算法，我们实现了一种特殊的RNN，称为LSTM方法，它在隐层具有自连接的门。

2.3条。混合长短期记忆狮子算法（LSTM-LA）方法

由Hochreiter和Schmidhuber介绍的LSTM[][21]，是特殊的学习能力长期依赖RNNs的。LSTMs选择性记忆模式的时间较长的时间与传统FFNN相比。LSTMs能够通过仔细调节的门，例如忘记栅极移除或将信息添加到小区状态的F，输入栅极一世，输入调制栅极 ,和输出门（图3.）。

该忘记门有助于处理以前的状态的输出H_Ť-1通过遗忘不必要的信息来做决定。具有s形函数的遗忘层表示为(1）。输入栅添加具有适当的缩放新的信息，乙状结肠激活函数的更新的值，和双曲正切函数创建新的候选值（公式（2）和（3.))。更新后的具有适当尺度的新候选值如式(4）：

最后，S形函数的相关输出被表示在下面的等式：

基本LSTM神经元有一个跟踪的长期序贯信息的单独细胞状态。然而，学习LSTM型号为大量存储单元的计算变得昂贵。因此，混合LSTM-LA方法是在目前的研究中采用如图所示的流程图中（图4）。

在混合LSTM-LA模型，狮子的配合特性数学模拟来优化网络LSTM的权重。随机生成一套名为狮子的解决方案的人口被初始化。可能的解决方案是LSTM网络的权重和偏见。

2的人口ñ狮子被分为两组作为候选种群。最佳权重和偏差在第一个epoch用LA初始化，并传递到LSTM网络。算法的第二步是交配过程，确保狮子的生存，以及不同成员之间的信息交流平台。利用配种算子，利用亲本的线性组合选择雌狮和雄狮，得到如下公式: 其中NRM =狮群和α = 随机生成的数字和

用0.2的突变率的突变操作者对后代的每个基因随机应用。在洛杉矶的最后一个阶段是防守运营商，其中包括对新的成熟的男性居民防御和防御游牧民族的狮子。这种辩护运营商通过帮助它保持强大的雄狮作为解决方案起着LA重要的作用。游牧狮子以同样的方式作为领土狮和新的生存领土狮子和执行游牧狮子之间打生成。雄狮卫冕和保护幼崽，然后将新的解决方案被用于攻击雄狮占领的领土。如果漫游狮子是优于骄傲其他的解决方案中，雄狮由游牧狮子取代。领土接管是最后一步，这是一样的，在遗传算法的选择过程。在该步骤中，最优解是发现，以取代下一个，并且重复该配合过程直到达到100个历元的终止条件。洛杉矶将更新在下一个周期最佳的解决方案的权重，并继续搜索过程。

因此，权重和在LSTM模型所有层的阈值被初始化随机，和LA搜索最佳权重。如果终止标准，即达到最大迭代次数，最佳参数获得或者重复最优化的步骤，直到满足条件。然后，最优化LSTM模型被用于预测GWL。

采用混合LSTM- la模型、LSTM模型和FFNN模型对GWL的未来趋势进行了预测。利用2000-2018年的数据集，对LSTM-LA模型进行不同预测水平的训练和测试。80%的数据设置为训练集，其余20%设置为测试集。将混合LSTM- la模型对2018年GWL结果的月度预测与LSTM和FFNN方法进行比较。

3。结果与讨论

使用混合LSTM-LA、LSTM和FFNN方法对2018年的全球变暖预测如下所示（图5）。预测结果对观测结果进行了验证。在premonsoon期间基于FFNN预测显示大的误差与混合LSTM-LA方法相比。据观察，混合LSTM-LA模型结果关联与LSTM和FFNN和其他方法相比，与原始数据更好。因此，LSTM-LA的方法与传统的前馈方法相比更准确地预测。

我们考虑了两种性能指标来评估预测的准确性。数字6显示了三个软计算的所有性能接近使用统计指标根均方误差（RMSE）和平均绝对误差（MAE）。的RMSE是平方误差这是为了预测和实际值之间的大的偏差更为敏感。在另一方面平均绝对误差MAE的是一种更加适合的措施。的MAE和RMSE值如与FFNN相比的用于混合动力车LSTM-LA方法下部和接近LSTM，表明混合LSTM-LA方法优于独立接近，LSTM和FFNN。

使用混合LSTM- la、LSTM和FFNN方法对2019年GWL的月度预测如图所示7。由于降雨量的不一致性，该图显示出与季节无关的增长趋势。

时间序列图（图8）显示未来的使用提出的混合LSTM-LA模型预测GWL。该模型是使用数据，为期216个月（18岁）开始从2000年1月至2017年十二月模型能够预测未来趋势准确最多一年的筹备时间训练。

交叉验证重复采样过程用于在有限的数据样本评估不同的机器学习算法。交叉验证主要是用来估计对看不见数据的机器学习算法的精度。在5倍交叉验证，我们划分原始训练数据集到5点相等的子集称为折叠。机器学习算法的准确性通过平均在所有5例交叉验证的来源的精度估计。盒须图（图9)显示每个算法的每个验证折叠上的预测准确度分数的分布。

预测精度，表示由中间值，为FFNN，LSTM和混合LSTM-LA接近是72％，88％，和97.5％之间。的混合LSTM-LA基于模型与传统FFNN网络基于结构的模型进行比较。从图上面的曲线图9，可以看出LSTM-LA方法比基于ffnnn的模型具有更高的精度。

4.结论

纯净饮用水的短缺是一个全球性的问题。GWL为评估地下水资源提供了有用的信息。本研究发展了一种新的混合元启发式方法，利用lion算法优化LSTM网络的权值来预测GWL。之前的2000-2018年GWL和降雨数据是从政府机构获得的。该观测井位于印度卡纳塔克邦乌杜皮地区的红土地带。将提出的LSTM- la模型与基本的FFNN和LSTM模型进行了比较。FFNN模型学徒采用随机顺序，而LSTM中的反馈循环能够逐步学习。利用独立的LSTM网络有几个缺点。与训练数据相比，它在测试集中的输入变量分布不正常。因此，采用lion算法对LSTM的权值进行优化，建立LSTM- la模型。 The lion algorithm looks for optimal point through different strategies by balancing exploration and exploitation. The hybrid LSTM-LA model is preferred over traditional FFNN and LSTM on its own, in terms of prediction accuracy and convergence rate. This research work concludes that GWL forecasting with systematically configured LSTM model surpasses the traditional FFNN model with higher efficiency.

数据可用性

支持本研究结果的数据可根据要求从通信作者处获得。

的利益冲突

作者声明本论文的发表不存在利益冲突。

致谢

作者感谢Nagaraj饶，统计学系，乌杜皮县，卡纳塔克邦政府和NIRANJAN先生和谢蒂Dinakar先生，资深地质学家，乌杜皮区，对于研究期间提供了宝贵的降雨和GWL数据。笔者也为他们的这项研究工作的支持表示感谢，以高等教育马尼帕尔学院（马赫）和马尼帕尔理工学院（MIT）。

参考文献

A. M.思里帕，卡纳塔克邦地下水水位下降，新印度快报，印度钦奈，2018。
M. N. Eienen和M. Arshad，地下水问题的规模，地下水综合管理，美国地质调查局，弗吉尼亚州雷斯顿，美国在2016年。
地下水水文学:在变化的气候中，可持续的整体水资源管理，>，2017年第4.1-4.26页，Jain Brothers，新德里，印度。查看在：谷歌学者
C. P. Kumar和S.辛格，“概念和地下水系统的建模，”国际创新科学、工程与技术杂志卷。2，没有。2，第262-271，2015。查看在：谷歌学者
G. K. Devia, B. P. Ganasri和G. S. Dwarakish，《水文模型综述》，水产Procedia，第4卷，第1001-1007页，2015。查看在：出版商网站|谷歌学者
《地下水数值模拟作为干旱地区水资源管理的有效工具》，水文科学杂志，第59卷，no。6，第1259-1274页，2014。查看在：出版商网站|谷歌学者
M. kno和M. F. P. Bierkens，“地下水位深度时间序列模型的物理基础”，水资源研究，第36卷，no。1，页181-188,2000。查看在：出版商网站|谷歌学者
五、 Nourani，A.A.Mogaddam和A.O.Nadiri，“基于人工神经网络的时空地下水位预测模型”水文过程卷。22，没有。26，第5054-5066，2008年。查看在：出版商网站|谷歌学者
B、 Shirmhammadi，M.Vafakhah，V.Moosavi和A.Moghadamnia，“几种数据驱动技术在预测地下水位中的应用”水资源管理，第27卷，no。2，第419-432页，2013年。查看在：出版商网站|谷歌学者
J.田，C.栗，L. Jia等人，“使用数据地下水深度预测驱动模型用γ测试的协助下，”可持续发展，第8卷，第1076号，第1-17页，2016年。查看在：出版商网站|谷歌学者
P. Coulibaly, F. Anctil, R. Aravena，和B. Bobee，“水位深度波动的人工神经网络建模”，水资源研究，第37卷，第4期，第885-8962001页。查看在：出版商网站|谷歌学者
R.陶尔米纳，K.-W.洲和R.塞西，“在威尼斯泻湖的滨海含水层系统每小时地下水水位的人工神经网络模拟”人工智能的工程应用卷。25，没有。8，第1670年至1676年，2012。查看在：出版商网站|谷歌学者
Y、 Gao和M.J.Er，“NARMAX时间序列模型预测：前馈和递归模糊神经网络方法”模糊集与系统，第150卷，第2期，第331-350页，2005年。查看在：出版商网站|谷歌学者
R、 Rani Sethi，A.Kumar，S.P.Sharma和H.C.Verma，“用人工神经网络预测硬岩盆地的地下水位深度”国际水资源与环境工程杂志，第2卷，第4期，第95-102页，2010年。查看在：谷歌学者
O、 I.Abiodun，A.Jantan，A.E.Omolara，K.V.Daba，N.A.E.Mohamed和H.Arshad，“人工神经网络应用的最新技术：调查”Heliyon卷。4，第1-41，2018。查看在：出版商网站|谷歌学者
A. Shrestha和A. Mahmood，“深度学习算法和架构回顾”，IEEE接入，第7卷，第53040-53065页，2019年。查看在：出版商网站|谷歌学者
R.塔拉勒，Z.塔里克和Z. T.穆罕默德，“由混合PSO-杜鹃搜索算法的问题，优化培训递归神经网络”国际计算机应用，第159卷，第3期，第32-38页，2017年。查看在：出版商网站|谷歌学者
肖元和尹，“短期交通流生产的LSTM混合神经网络”，信息，第10卷第1期。105页，1-22页，2019年。查看在：出版商网站|谷歌学者
B、 Bowes，J.M.Sadler和M.M.Morsy，“Madhur behl和jonathan L.goodal，用长期短期记忆和递归神经网络预测一个易发洪水的沿海城市的地下水位，”水，第11卷，第1-38页，2019年。查看在：出版商网站|谷歌学者
F. Kratzert, D. Klotz, C. Brenner, K. Schulz，和M. Herrnegger，“使用长短时记忆(LSTM)网络的降雨径流建模”，水文和地球系统科学卷。22，没有。11，第6005-6022，2018。查看在：出版商网站|谷歌学者
S. Hochreiter和J.施米德休，“长短期记忆，”神经计算卷。9，没有。8，第1735至1780年，1997。查看在：出版商网站|谷歌学者
N. Mohd Nawi, A. Khan, M. Z. Rehman, and Haruna Chiroma and Tutut Herawan，“混合元启发式布谷鸟搜索技术用于数据分类的递归神经网络中的权重优化，”工程数学问题卷。2015年，文章编号868375，12页，2015年。查看在：出版商网站|谷歌学者
钟h和k.s。遗传算法优化股票市场的长期短期记忆网络可持续发展，第10卷第1期。3765，第2-18，2018。查看在：出版商网站|谷歌学者
T. A.拉希德，P.法塔赫和D. K. Awla，“使用精确度量提高LSTM与启发式算法的训练，”Procedia计算机科学卷。140，第324-333，2018。查看在：出版商网站|谷歌学者
B. P. Radhakrishna和R.维迪弥敦道，卡纳塔克邦地质，印度地质学会，班加罗尔，印度，2011年。
印度政府，卡纳塔克邦乌杜皮区地下水资料册，印度政府，水利部，中央地下水委员会，德里，印度，2013年。

应用计算智能与软计算