文摘

全球太阳辐射(GSR)是一个关键变量设计光伏电池、太阳能锅炉、太阳能收集器,和其他被动式太阳能的应用程序。在尼泊尔,高初始成本和后续维护成本所需的仪器来测量GSR限制其适用性在全国各地。目前的研究比较了六种不同的temperature-based实证模型,人工神经网络(ANN),和其他五个不同的机器学习(ML)模型估算每日GSR Biratnagar机场利用现成的气象数据。在temperature-based模型,该模型由风扇等人执行比其余的 0.7498和RMSE 前馈多层感知器(MLP)是利用模型日常GSR利用外星太阳辐射、日照时间、最大和最小的环境温度、降水、相对湿度作为输入。ANN3执行比其他的ANN模型 0.8446和RMSE 同样,逐步线性回归比其他毫升模型的执行 0.8870和RMSE 因此,该模型由风扇等人建议估计每天只GSR的地区环境温度数据是可用的。同样,一个更加健壮的ANN3建议和逐步线性回归模型来估计每日GSR地区日照时间数据,最大和最小的环境温度、降水、相对湿度是可用的。

1。介绍

遇到的一些重要的全球问题目前人类文明包括全球变暖和环境污染尤其是煽动化石燃料的过度使用石油产品、天然气和木材和木材等传统燃料(1]。尼泊尔,一个发展中国家,60%的整个人口参与农业有一个不成比例的对传统燃料的依赖(2]。然而,清洁和永久的太阳能是获得越来越多的关注从政府以及私营部门近年来。全球太阳辐射(GSR)数据服务的一个关键变量应用程序涉及水文、气象、农业、能源和可再生能源。GSR是重要的可再生能源部门的预测能力和效率的设备基于太阳能应用,比如光伏电池、太阳能炉,太阳能收集器。然而,与常规气象参数,数据与日常GSR不是现成的在世界各地的许多地方3]。这特别适用于尼泊尔这样的发展中国家。缺乏测量GSR数据导致了几种方法来估计GSR的发展,即神经网络(4,5),实证模型(6,7[],随机算法8),和卫星的方法(9]。尽管当前发展的新方法和技术,利用气象数据实证方法是首选的,因为成本和技术约束对新方法和技术3,6,7,10]。

根据水利和气象部门(DHM),目前只有284个气象站在尼泊尔。这些,只有64个气象站配备日常GSR日射强度计来测量,而只有34个气象站逐日日照时数(拥有必要的基础设施来衡量11]。日常GSR的数据并不容易获得的大部分位置。因此,可以使用各种气象参数而不是日常GSR的估计。

截至2019年,超过294的实证模型可用于估计GSR采用现成的气象数据(7]。一些主要的类别的实证模型包括sunshine-based模型(12],temperature-based模型[13],cloudiness-based模型[14),和复杂的模型。埃开创了GSR采用线性经验模型估计后来修改普雷斯科特(15]。简单的Angstrom-Prescott (p)模型和强烈的日照时间相关性GSR的原因是其在世界各地广泛应用(12,16,17]。p模型的发展后,一个或多个气象参数已经包含在原始模型改善估计(15]。Sunshine-based模型执行更有效地比基于其他气象参数模型由于日照时间是强烈与GSR [18- - - - - -20.]。然而,高初始投资和高维护成本的工具约束sunshine-based模型的广泛应用。因此,开发经验模型,利用现成的气象参数,比如环境空气温度,相对湿度,和降水广泛者优先。

环境温度范围是最现成的气象参数。最简单的一个temperature-based模型组成的月平均最高和最低温度作为输入,提出了由哈格里夫斯和萨马尼(21]。H-S模型的介绍后,几个修改由合并其他气象参数改善模型性能。哈桑等人修改了H-S模型通过引入降水术语,表现好于两种最有效的sunshine-based模型从文献[13]。质的等人最近开发出两种新的准确的多项式模型,表现几个temperature-based模型从文献[3]。尽管所有temperature-based模型都是派生的经验,环境温度的变化被认为是在很大程度上依赖于太阳辐射到地球表面的(22]。

尽管实证模型被广泛的分析和评估,发现这些模型的性能根据地理位置和当地气候变化6]。最近,几个机器学习(ML)模型被用来估计GSR在几个不同的地方(4,5]。概括的能力和优化时间和解决问题的能力,难以用一个显式算法的最大优点毫升模型(23,24]。主要ML模式目前在实践中包括人工神经网络(ANN)、支持向量机(SVM),遗传规划(GP),随机森林(RF)和自适应模糊推理系统(简称ANFIS)。的一些主要应用ANN模型包括径向基函数网络(RBFN)和多层感知器(MLP)。Behrang et al。4中长期规划)得出结论,比RBFN更准确的估计GSR伊朗。被设置和Mellit25]应用SVM与不同的输入组合,得出的结论是,它需要更少的输入参数提供更好的准确性比安。

目前的研究提出了一种temperature-based实证模型和ML模型之间的比较。最常见的一种前馈网络,即。,MLP, is employed in the current study to estimate the GSR at Biratnagar Airport, located in the Eastern Terai Belt of Nepal. Hence, the objectives of the study include the following:(1)六种不同的性能分析日常GSR temperature-based实证模型来估计(2)安的应用和其他日常GSR毫升模型来估计(3)上述模型的比较分析,推荐最好的GSR的估计模型

2。材料和方法

2.1。研究位置和数据

尼泊尔位于之间的 °N和 °N纬度在温带。尼泊尔经历300天的年度阳光的年平均太阳辐射 (26]。Fourteen-month每日数据的各种气象参数Biratnagar机场(26.4840°N纬度,经度87.2662°E,和236米海拔)是从DHM获得的。Biratnagar的年平均温度 °C平均年降雨量 (27]。

CMP6日射强度计是用来测量每日GSR水平表面上。黑的日射强度计由热电堆,吸收的太阳辐射转换成热能。产生的电压输出热电堆然后校准指示GSR。利用数据记录器来记录日常GSR测量。Campbell-Stokes日照计是用于测量日照时间。水银和充满酒精气味的气象温度计用于测量,湿球温度和正常环境干球温度和环境温度低,分别。同样,数据计算相对湿度使用干球和湿球温度。

2.2。Temperature-Based实证模型

有几个模型相关的环境空气温度与GSR经验。两个最广泛使用的经验模型估计的GSR只使用环境空气温度数据是哈格里夫斯和萨马尼(HS)模型和布里斯托和坎贝尔(BC)模型。因此,上述两个模型以及其他四个最近开发高度准确的模型是在本研究中选择。

哈格里夫斯和萨马尼(21)提出了一个简单的模型使用一个月平均最高温度和月平均最低温度作为输入日常GSR的估计: 在哪里 是经验常数。

陈和李28)开发和分析了20多个不同的temperature-based实证模型的性能。的两个表现temperature-based模型结合环境温度范围和月平均最高温度和月平均最低温度作为输入当前的研究。一个模型包含一个额外的常数项原始H-S模型指数的“1”(缩写为陈和李(模式1)): 在哪里 是经验常数。

另一个模型是一个多元回归模型,月平均最高和最低温度作为输入(缩写为陈和李(模型2)): 在哪里 , , , 是经验常数。

布里斯托和坎贝尔29日)开发了一个模型考虑到GSR指数相关环境温度范围: 在哪里 , , 是经验常数。

质的et al。3)提出了一个考虑多项式模型相关的GSR环境温度范围: 在哪里 , , , 是经验常数。

风扇等。6)修改了质的模型通过使用一个不同的环境温度范围内指数,将额外的平均温度项改善模型性能: 在哪里 , , , , , 是经验常数。外星GSR计算使用以下方程(30.]:

赤纬角是由使用下列方程(31日]:

一天的长度计算如下:

日落时角计算如下:

2.3。机器学习模型

采用多层感知器(MLP)模型在当前的研究在文献中出现的其他几个安拓扑。延时是特别有用的建模要解决一个复杂问题。图1说明了中长期规划的结构,由一个输入层、隐藏层和输出层。输入信号乘以权重的一组发送通过隐层到输出层。

典型的延时一个隐藏层可以建模如下(32]: 在哪里 是偏见隐藏层。非线性激活函数(通常是乙状结肠)用于计算输出的神经元(33]

支持向量机(SVM)是一种强大的监督学习技术和良好的泛化能力,因为它广泛用于解决问题关于模式识别、分类、回归和预测34]。SVM函数可以用于各种内核函数实现其回归的学习者。高斯内核是受欢迎的应用SVM分类和回归。可以建立非常复杂的边界和关系的帮助下Gaussian-based SVM。介质高斯和细高斯定义基于高斯函数的细长。不错的高斯使用非常薄的高斯函数与非常低的标准偏差。由于这些薄分开界限,细高斯容易过度拟合。线性回归学习者执行一组输入数据的多元线性回归。另一方面,逐步线性回归只利用高度相关的变量线性回归消除冗余的弱相关变量。

2.4。模型的训练和测试

fourteen-month数据分为两个数据集,初始85%的数据利用发展的ML模型或经验模型的校准,其余15%是用于模型评估。本研究采用外星太阳辐射 ,日照时间、最大环境温度 ,最低环境温度 ,降水、相对湿度作为输入毫升的发展模式。

神经网络的性能,分析了不同隐层神经元的数目并记录相应的统计指标。神经网络拟合(35),一个隐式应用程序在MATLAB中,用来设计和训练神经网络。最知名的前馈网络,即。,MLP, is employed in the current study to model the GSR. Levenberg–Marquardt backpropagation algorithm is utilized to train the network. Training terminates when generalization stops improving, as demonstrated by an increase in the mean square error and the corresponding decrease in 回归学习者(36),一个隐式应用程序在MATLAB中,用来分析和评估性能的线性回归,逐步线性回归,中高斯SVM matern 5/2高斯过程回归(GPR),探地雷达和指数。

2.5。统计Indicatives

四个统计指标,即确定系数 ,调整 ,均方误差(MSE)和均方根误差(RMSE)是利用各种模型的性能进行评估。模型的性能评估使用以下方程: 在哪里 代表了测量和预测价值,而 代表平均测量和平均估计的值, 数据点的数量, 是独立的解释变量的数量。

RMSE值提供了一个指示的短期模型的性能。低RMSE值对应于更好的性能。 表明解释因变量的变化由独立变量。

3所示。结果与讨论

3.1。Temperature-Based实证模型的校准

2说明了测量值之间的相关性和日常GSR的估计价值为校准数据集。GSR的估计价值相当的测量值与GSR的所有模型。从统计指标(表1),模型由风扇等人与其他temperature-based更好的相关模型 0.6435和相应的 0.6373。关于RMSE,再次模型由风扇等人开发的执行比其他的RMSE temperature-based模型 陈和李(模型2)temperature-based模型中排名第二 , ,和均方根误差为0.6248,0.6200, ,分别。模型由风扇等人是合理的应用数据用于修饰或说明在该地区,只有环境温度范围是可用的。

最小二乘方法以适应temperature-based模型的经验系数。经验系数获得所有temperature-based模型是包含在表2

3.2。ANN模型的训练和验证

数据34说明每日GSR估计安之间的相关性和测量每日GSR 6和10在隐藏层神经元,分别。表3提供了一个总结统计指标的ANN模型。训练集,10个隐层神经元的模型(缩写为ANN5)执行比其他的ANN模型 0.8485和RMSE 同样,ANN3其他ANN模型中排名第二的训练集 0.8341和RMSE 比较表明,统计指标 和RMSE有时遵循不同的趋势。类似于训练集, 和RMSE有时遵循一套验证不同趋势。尽管ANN5而言是最好的模型 ,将会呈现出一种相对的RMSE更高 在模型中发展,ANN模型训练数据中占更大的方差相比,temperature-based实证模型。

3.3。培训和验证其他毫升模型

5说明了每日GSR估计之间的关系通过各种日常GSR毫升模型和测量。为了防止过度拟合的模型中,5倍交叉验证期间执行模型的发展。这些模型是包含在表的统计指标4

介质高斯比其他模型的支持向量机性能更好 0.79和RMSE 同样,探地雷达matern 5/2排名第二的 0.79和RMSE 探地雷达指数降低的性能广泛的交叉验证可能归因于数据集的过度拟合。相反,交叉验证有很少或没有影响性能的线性回归和逐步线性回归模型。在模型开发中,大多数这些毫升模型与temperature-based实证模型相比表现得非常好。相反,ANN5模型训练数据中占更大的方差相比,在ML模式。

3.4。实证和ML模型的性能比较

模型进行评估后,15%看不见的数据模型的发展。RMSE和 的经验和ML模型数据的测试数据进行了说明67,分别。所有的temperature-based实证模型对测试数据执行相当不错。在实证模型,该模型由风扇等人有优于其它模型 0.7498和RMSE 比较表明,统计指标 和RMSE有时遵循不同的趋势。HS模型实证模型中排名第二的RMSE而表现出一个 0.7323。同样的,提出的模型与一个质的等人的表现也相当不错 0.7356和RMSE

安的性能测试数据不一致的性能在模型开发。在ANN模型ANN3执行与一个比其他模型 0.8446和RMSE ANN1排名第二的 0.8134和RMSE ANN4的性能,并会显著降低ANN5模型评估相比,模型中的发展。发展的过度拟合训练数据在模型性能的退化的主要原因。

类似于ANN模型,其他毫升模型的性能测试数据也不符合性能在模型开发。比较表明,统计指标 和RMSE有时遵循不同的趋势。有关 ,逐步线性回归比其他毫升模型的执行 0.8870和RMSE 同样,关于RMSE,线性回归学习者执行比其他毫升模型 0.8102和RMSE 介质高斯SVM的性能,探地雷达matern 5/2,并会显著降低GPR指数模型中评估相比,模型的发展。发展的过度拟合训练数据在模型性能的退化的主要原因。

4所示。结论

本研究分析和评估六个不同temperature-based实证模型,安,和其他五个不同毫升模型来估计每日GSR Biratnagar机场。最初,六种不同temperature-based实证模型与环境温度范围和每日平均温度作为输入校准。评估模型,模型由风扇等人进行更好地与一个与其他temperature-based模型相比 0.7498和RMSE 安的性能更高的隐层神经元的数量会显著降低模型中评估因为大量的神经元overfit数据集。在模型中评估,ANN3执行比其他的ANN模型 0.8446和RMSE 同样,ANN1排名第二的 0.8134和RMSE 五个不同的ML模型中可用MATLAB回归学习者进行了分析和评估,以确定表现最好的ML模式。介质高斯SVM的性能,探地雷达matern 5/2,并会显著降低GPR指数模型中评估由于过度拟合训练数据在模型的发展。有关 ,逐步线性回归比其他毫升模型的执行 0.8870和RMSE 同样,关于RMSE,线性回归的学习者比其他毫升模型的执行 0.8102和RMSE

考虑temperature-based实证模型的泛化能力,提出的模型风扇等人建议估计每日GSR在该地区,只有与环境温度有关的数据是可用的。地区日照时间数据,最大和最小的环境温度、降水、相对湿度和可用,一个更加健壮的ANN3建议和逐步线性回归模型来估计每日GSR。

命名法

第三期: 全球太阳辐射
简要: 多层感知器
支持向量机: 支持向量机
安: 人工神经网络
DHM: 水利和气象部门
简称ANFIS: 自适应neurofuzzy推理系统
医生: 遗传规划
射频: 随机森林
RBFN: 径向基函数网络
探地雷达: 高斯过程回归
: 测量太阳辐射全球
: 地球外的太阳辐射
: 太阳常数
: 今年的一天
: 一天的长度
: 纬度
: 太阳赤纬角
: 阳光时角
: 最大环境温度
: 最低环境温度
: 环境温度范围
: 日平均温度。

数据可用性

使用的数据来支持本研究的发现是由水文和气象部门提供的,尼泊尔政府,包括在文件的补充信息。

的利益冲突

作者宣称没有利益冲突有关的出版。

确认

作者感谢水利和气象部门,尼泊尔政府协助完成研究提供必要的数据。本文的研究和出版物是由作者。

补充材料

补充1:原始数据的日常全球太阳辐射、日照时间、最大和最小的环境温度、相对湿度和降雨量的Biratnagar机场,Morang,尼泊尔,用于研究包含在文件的补充信息。补充2:太阳辐射数据文件包含平均太阳辐射测量每秒为特定的一天。所以, 补充3:日照时间文件包含每天的日照时间数据 补充4:T马克斯T最小值文件包含每天的最大和最小的环境温度数据 补充5:降雨文件包含每日在毫米雨量数据 补充6:RH文件包含的数据相对湿度计算一天几次。(补充材料)