文摘

试图预测每日最大表面臭氧浓度在接下来的24小时,在大雅典地区(棉酚)。为此,我们应用多元线性回归(高)模型对预测模型基于人工神经网络(ANN)方法。基本气象参数的可用性是非常重要的为了预测臭氧的浓度水平。造型是基于记录气象和空气污染十三个监测站点的数据中的棉酚(希腊的网络环境、能源和气候变化)在5年内从2001年到2005年。评估的性能构造模型,使用适当的统计指标,清楚地表明,在各个方面,到目前为止是ANN模型的预测模型。这表明,ANN模型可用于一般人群发出警告,主要敏感组。

1。介绍

空气质量已成为一个主要的因素影响城市生活的质量,特别是在人口密集和发达地区。空气污染控制是必要的,以防止空气质量的恶化。空气质量的同时,短期预测是必需的,以预防和清除行动期间的大气污染(1]。增加表面臭氧的浓度,在最近几十年,已经成为世界范围的一个主要担忧由于对人体健康的负面影响(2- - - - - -6]。

长期人类暴露于臭氧引起胸痛,持续咳嗽,呼吸道刺激,肺功能受损、干燥的喉咙,恶化之前的呼吸道疾病,如哮喘,严重的肺部炎症,甚至不可逆的肺损伤。所有这些会导致过早衰老和慢性人类呼吸道疾病。这些担忧更多的人群中某些敏感的群体,如儿童、哮喘病患者,老年人7- - - - - -11),因此,很明显,臭氧对人类的预测是非常重要的。

在过去,有许多科学家试图预测臭氧浓度以及其他污染物的浓度在两个城市和nonurban地区(12- - - - - -24]。具体来说,Ziomas et al。16)提出了最大臭氧浓度在雅典面积相关的分析模型与各种气象变量。为此,54污染时期,1987年- 1990年期间,选择和分析。发展关系的评估显示,他们的成功程度相当有前途的。首位[18)开发的ANN模型,能够预测表面臭氧浓度在五个不同的地点在伦敦,温暖的时期。在任何情况下,评估结果由发达ANN模型,这些模型表明,超越与回归模型相比较。Gomez-Sanchis et al。19)建立了一个预测模型来预测对流层臭氧利用ANN模型。为此,周围的臭氧浓度估计使用表面气象变量和汽车排放作为预测变量。Corani [20.)应用前馈神经网络,神经网络修剪,懒惰学习为了预测上午九点浓度对臭氧和点估计当前的一天10在意大利米兰。Heo和金21)在他们的论文中描述的方法预测每日最大臭氧浓度四个监测站点在首尔,韩国。预测是模糊和神经网络专家系统开发工具。空气污染物和气象变量的每小时的数据,获得表面和高海拔(500 hPa)站在首尔城市1989 - 1999年期间,进行了分析。两种类型的预报模型。第一个模型,第一部分,使用模糊专家系统和预测的可能性高臭氧水平(等于或超过80磅的)第二天发生。第二个模型,第二部分,使用神经网络系统来预测每日最大浓度的臭氧第二天。预报系统包括一个回调函数,这样可以更新现有模型,每当一个新臭氧插曲出现。预测的准确性通过验证和增加系统不断改进。

此外,Elkamel et al。22),以预测表面臭氧的浓度在科威特,开发和训练有素的ANN模型通过使用气象参数和其他污染物浓度。最后发达ANN模型与线性和非线性回归模型导致安至上模型在任何情况下。此外,Slini et al。25]利用气象参数,如空气温度、风速以及表面臭氧浓度的前一天,接着在预测表面臭氧浓度未来24小时,应用多元回归分析的方法。他们到达的结论是,统计学家和环保人士合作,导致,而空气质量预测问题的重要成果。最后,Moustris et al。23)开发的ANN模型预测空气质量在棉酚在许多不同的领域,一个,两个,三天前。他们用气象数据,空气污染数据,和空气质量指数。结果令人鼓舞,并表明,ANN模型能够提供更多可靠的预测在未来涉及环境质量的环境。

本研究的目的是执行和比较高的模型对预测模型基于人工神经网络(ANN)方法,以预测对未来24小时臭氧的浓度水平,在棉酚。

2。数据和方法

2.1。区域和数据

多元线性回归模型和ANN模型被用于本研究的最大程度上的每日表面臭氧浓度预测即将到来的24小时,在棉酚。这项研究是基于最大程度上的每日表面臭氧浓度的值(μg / m3),记录在5年内(2001 - 2005)。每小时表面臭氧浓度数据和气象变量被希腊的网络环境,能源和气候变化(HMEECC)。空气温度的气象变量(°C)和风速(米/秒)获得的八个不同的网站站HMEECC监测网络。因为棉酚(内表面的臭氧含量差异很大16),八个郊区和城市监测站被选为分析5。的详细描述HMEECC网络中找到相关的出版物(e, g。,(26])。

在目前的研究中,数据集收集包括5年最大平均每小时每天长时间的观察臭氧浓度(μg / m3),HMEECC 13站的监控网络,最高每小时空气温度(°C),和平均风速(米/秒),8个气象观测站的HMEECC同一时期。根据科学文献[16,25,27)选择适当的气象数据是基于他们的可用性和对塑造地表臭氧浓度的影响。空气温度中扮演一个重要的文件,因为增加空气温度有关,与表面的臭氧浓度上升。此外,另一个基本气象参数确定空气污染物的水平运输和分散的平均风速。

最后构建数据集,从2001年到2005年,被分为两个子集。第一个问题四年期间,从2001年到2004年,2005年第二年时期。第一子集的数据被用于应用模型的训练。第二个数据子集并不是用于训练模型只申请评估的预测能力。

2.2。方法

第一步是在当前分析日常观察最大的调整意味着每小时臭氧值要求应用程序涉及的多元线性回归分析。因为这种方法要求数据服从正态分布,自然对数转换可能应用于臭氧值(28),为了实现这个前提假设。原始的分布(图1(一))和(图转换1 (b))臭氧值,表示酒吧,与正态分布相比。很明显,改变了臭氧值,符合正态分布。

各种统计方法一直以开发利用技术,这将使定性或定量的短期预测。最常见的方法是使用一种多元统计方法,广泛用于操作臭氧预测和研究面向统计模型(例如,14,25])。多个(多元)线性回归分析是最受欢迎的这些技术,和它的一般形式: 在哪里 是截距项。 回归系数, 响应变量(表面臭氧浓度), 独立预测变量, 是一个残差。当回归方程用于预测模式,e(实际值和预测值之间的区别不占的模型)是省略了,因为它的期望值为零29日]。

在多元回归分析中,一个重要的假设是,解释变量是相互独立的(30.]。然而,在某些应用程序中回归,解释变量是相互关联的。这个问题被称为多重共线性问题31日]。非多重共线性项多元回归分析意味着在任何情况下,任何独立变量之间的相关性都不应存在。为了这个目的,一个多重共线性索引称为方差膨胀因子(VIF) (30.]。VIF指数计算了以下方程: 在哪里 预测变量和的数量吗 的多个相关系数的平方是吗 剩下的th变量 变量,根据侯赛因et al。30.),如果0 < VIF < 5,没有证据的多重共线性问题。如果5≤VIF≤10,这是一个温和的多重共线性问题,最后如果VIF > 10,存在严重的多重共线性问题的变量。

ANN模型试图模仿和模拟人类大脑中的神经元的功能通过数学函数。在1940年末,”赫(32,33)做了一个世界第一的理论机制和人类大脑神经元的能力,比如他们的学习能力。安开始成长的分支McCulloch和皮特(34创建第一个ANN模型。1958年,Rosenblatt [35)发明了人工perception-cognition模型(感知器模型),创造了更大的兴趣在科学界ANN模型和解决至少一些简单问题的能力。很明显,最简单的ANN模型是由一个神经元。当然,在这种情况下,“网络”这个词是不公平的,因为没有其他人工神经元彼此连接,以最终形成一个网络。之间唯一的联系是输入 和人工神经元。一个感知器模型,本质上是一个单一的人工神经元是非常有限的。这样一个网络,例如,只能代表平面。这种限制已经不复存在,当使用一个以上的人工神经元。这导致了多层感知(MLP)。中长期规划由一个输入层,有人工神经元对应于输入数据(输入)。后输入层有一个或多个隐藏层与一个或多个人工神经元。每个人工神经元在每一个隐藏层的连接和交换信息的其他神经元前和下一层。最后,输出层,有“目标”的人工神经元。由于人工神经网络中的数据流从一层到另一个没有任何返回路径,这样的ANN模型被定义为前馈人工神经网络模型。 The structure of a feedforward MLP ANN can be found in relevant publications (e.g., [23])。

权重因素称为“突触”对应每个神经元之间的连接。输入的突触权重是一个数字,当增加输入给出了加权输入。这些加权输入然后加在一起,如果他们超过预设的阈值,神经元被激活并给出响应结果。当安层之间传输信息这些突触权重的值不断变化。结果达到输出层后,与目标值相比,计算误差。在这一过程中,安返回适当修改突触权重的值。误差在可接受范围时,突触权重的值是冻结。ANN模型现在已经正常训练,能够复制并应用其“知识”或“体验”的新数据和信息,这是未知的。这个培训安process-algorithm称为误差反向传播算法。

评估的结果和开发模型的预测性能,适当的统计指标如确定系数(R2)、均值偏移误差(MBE),均方根误差(RMSE)和使用的协议(IA)的指数(29日,36- - - - - -40]。RMSE是一种常用的测量预测值之间的差异的预测模型和real-observed值。RMSE被用作一个措施,表明模型的预测能力和有相同的单位的预测价值。RMSE总是积极和零值是理想的。MBE提供信息的长期性能。MBE低是可取的。理想情况下一个零MBE应获得的价值。正值给过高的平均数量的计算和消极的低估。使用确定系数在统计模型的情况下,其主要目的是预测未来结果的基础上,其他相关信息。在数据集的比例变化所占的统计模型。 It provides a measure of how well future outcomes are likely to be predicted by the model. The coefficient values range from zero to one ( )。值越接近于1,更好、更准确的预测。协议是一个无量纲指标指数0和1之间的值(0≤IA≤1)。当IA = 0,之间没有协议预测和观察,而IA = 1表示一个完美的协议之间的预测和观察(37]。

3所示。结果与讨论

2描绘了年度变化意味着最高月度温度的城市和郊区检查区域,分别。

根据图2,有一个大约2°C的永久性差异,城市和郊区之间。结果预期,符合城市热岛热岛效应,导致更高的温度比外围在这座城市的中心。均值最大年度气温约为22.1°C有关检查城市郊区和20.1°C,分别。温暖的期间(5月至9月),平均最高气温约29.6°C有关检查城市郊区和27.5°C,分别。最后,感冒期间(10月至4月),平均最高气温约16.8°C有关检查城市郊区和14.7°C,分别。

类似于上面的分析,简要分析风速。图3介绍了年度的月平均风速变化的城市和郊区检查区域,分别。

结果表明,风速的城市和郊区中棉酚是足够低。有相对不同的风速为0.3米/秒,在城市和郊区之间。年平均风速为2.0米/秒检查市区和郊区2.4 m / s,分别。今年在温暖期(5月至9月)平均风速2.1米/秒检查市区和郊区2.4 m / s,分别。最后,今年冷期间(10月至4月)平均风速约为2.0 m / s检查市区和郊区2.3 m / s,分别。

的特点和日常最大表面臭氧浓度的差异在郊区和城市地区分别进行了分类和分析检查期间2001年至2005年。图4显示了最大的年度变化意味着每月的臭氧浓度。有一个永久性差异约为15μg / m3城市和郊区之间。平均最大年度臭氧浓度约为89μg / m3的城市和105年μg / m3分别为郊区。温暖时期的臭氧浓度约为115μg / m3的城市和132年μg / m3分别为郊区。最后,在冷战期间的臭氧浓度约为70μg / m3的城市和84年μg / m3分别为郊区。

根据HMEECC,臭氧浓度阈值(最大白天每小时值)的公众意识是180μg / m3和警报阈值是240μg / m3,分别。为城市和郊区检查区域内的棉酚,天的百分比超过上述阈值进行了分析。在一年一度的基地,结果表明,至少在研究城市12.3%的的一天超过阈值的公众意识和95.5%的这些天出现温暖的时期,只有4.5%的人在寒冷的时期。温暖时期超过数点天,最大程度上的每日平均温度约为31.9°C和平均每日风速约为1.7 m / s。考虑到郊区,15.8%的天在全年超过阈值的公众意识。从这些天,85.5%的比例出现在今年温暖期,其余14.5%在寒冷的时期。在温暖期超过数点天在郊区,是最大程度上的每日温度是30.0°C和平均每日风速约为1.9 m / s对21.5°C和1.9 m / s,分别为冷期超过数点天。

关于警报阈值在年度基础,至少1.6%的天超过阈值的检查城市地区。所有这些超过数点天(100%)提出了温暖的时期。此外,在这些天的意思是最大程度上的每日温度约33.6°C和平均每日风速约为1.6 m / s。郊区,发现4.1%的天在全年超过报警阈值。从这些天,86.7%出现在温暖期,其余13.3%在寒冷的时期。温暖时期警报超过数点天在郊区,是最大程度上的每日温度是31.3°C和平均每日风速约为1.7 m / s对23.7°C 1.5 m / s,分别为寒冷的时期。在一般情况下,观察到的气温高、低风速促进空气污染,特别是高臭氧浓度。

的最大小时表面臭氧浓度预测未来24小时内棉酚,预后模型使用多元线性回归和ANN模型开发。因此在这个工作,每天最大的值每小时空气温度(°C)和平均每日风速(米/秒)内的棉酚以及每日价值最大小时臭氧浓度(μg / m3)的前一天。

从本质上讲,已被选定(表三个独立变量1),因变量是24小时表面臭氧的浓度(表1)。具体地说,独立变量 是最大的自然对数每天观察臭氧浓度的前一天,从13个研究领域。独立的变量 是前一天的最大观察每天的空气温度,从8个气象站检查。独立的变量 是指日常观测风速的前一天,从8个气象站检查。最后,因变量 最大程度上的每日的自然对数表面臭氧浓度在接下来的24小时,和关注的最大臭氧浓度检查13个地区中的棉酚提前一天。

臭氧浓度使用他们的自然对数转换的应用,为了满足线性多元回归分析要求,即自变量的值遵循正态分布。因此,因变量是现在表面上的自然对数臭氧浓度提前24小时。的“常态”的价值观臭氧浓度和臭氧浓度的自然对数的值被检查的应用Kolmogorov-Smirnov测试(统计D)和结果如图所示1。基于Kolmogorov-Smirnov统计指数的值D,很明显,在最初的臭氧浓度( )残差不遵循正态分布(图1(一))。在臭氧浓度的自然对数 )残差似乎遵循正态分布(图1 (b))。

一般来讲,我们可以说,在任何情况下有三个自变量和一个因变量。表1介绍了所有应用的变量预测模型,对于每个开发的模型都是相同的以及他们的缩写。

三个独立变量之间的nonmulticollinearity调查多重共线性指数VIF的应用。研究的结果发表在表2。根据表2,这个术语之间的nonmulticollinearity三个独立变量 完全实现。

看不到估计多元线性回归(MLR)模型

ANN预测模型而言,一个多层感知神经网络与时间滞后的建筑结构周期性网络(TLRN)合理开发和培训。大部分的真实数据包含的信息显示时间的结构,也就是说,数据如何随时间变化。然而,大多数纯粹是静态神经网络分类器。TLRN神经建筑结构在线性时间序列预测技术的发展,系统识别,和时间模式分类41,42]。

开发了ANN模型由一个隐藏层和四个人工神经元。选择的类型和结构的体系结构开发了ANN预测模型是通过试错的方法完成的。为了培养ANN模型,独立变量 , (表1)作为输入数据。独立的变量 , 被选为输入训练数据,以便开发了ANN模型的结果相媲美的高开发模型(3)。安的输出是因变量 的自然对数,最大程度上的每日表面臭氧浓度在接下来的24小时,在棉酚。换句话说,输入训练数据是独立的变量 , 发达高预测模型以及ANN模型的输出是因变量 开发了高预测模型。

如前所述,使用数据集被分为两个子集。第一个是包括2001 - 2004年期间的数据和用于安训练,和第二个子集是2005年,这绝对是未知的模型,用于评价的预测能力开发的安。同样的步骤之后的所有发达国家儿童高模型。

3礼物的价值评价统计指标的高钙和ANN模型。在这一点上,应该注意的是,这些评价统计指标的值关注real-observed之间的相关性和预测2005年验证臭氧浓度,他们已经收回后出现的预测价值的自然对数表面臭氧浓度每个模型的价值观。

5显示了最大程度上的每日臭氧浓度的观测值与相应的预测模型值,在2005年的棉酚。根据表3和图5,似乎所有发达的预测模型是在一个非常满意的水平( )。总之,每日最大表面臭氧浓度预测未来24小时是最可靠的利用ANN方法相比,使用高模型的预测。非常接近的ANN预测是预测多项式回归模型。

4所示。结论

本研究的目的是检查每日最大的单日预测表面臭氧浓度在棉酚,通过开发预测模型基于多元回归分析的方法对人工神经网络的方法。进行的分析表明,确定系数(安高:0.653:0.666)和协议的指数(安高:0.887:0.892),观察和预测之间的臭氧浓度为2005年,对高钙和ANN模型,统计学意义( )。最后,它应该提到,ANN模型预测能力确实有限优先级与高钙模型。此外,提高构造ANN模型的预测能力可以达到使用的其他一些参数,如氮氧化物浓度、太阳辐射的强度,和阳光持续时间,基于这些数据在时间和空间的通用性。