jps. 概率与统计杂志 1687 - 9538<我年代年代npub-type="ppub"> 1687 - 952 x 印度发布公司 864965. 10.1155 /864965分之2014 864965. 研究文章 尼日利亚环境污染监测的概率模型研究 Oguntunde P. E. 1 Odetunmibi O. A. 1 Adejumo A. O. 2 b Zhidong 1 数学系 约大学 在线旅行社 Ogun状态 尼日利亚 Covenantuniversity.edu.ng 2 部门统计 台大学 尼日利亚 unilorin.edu.ng 2014年 5 5 2014年 2014年 29. 01. 2014年 17. 04. 2014年 18. 04. 2014年 5 5 2014年 2014年 版权所有©2014 P. E. Oguntunde等。 这是在Creative Commons归因许可下分发的开放式访问文章,其允许在任何介质中不受限制地使用,分发和再现,只要正确引用了原始工作。

在拉各斯州,尼日利亚,污染物排放量在全州监测,以检测可能在大致危害人体健康和环境的任何变化显著。在这项研究中,三个理论分布,Weibull分布,对数正态分布和伽玛分布,检查对一氧化碳的意见,以确定最合适的。的污染物观察建立的特征和超过拉各斯州环境保护局(LASEPA)和联邦环境保护局(FEPA)在可接受的范围已经被成功预测的概率。提高车辆的使用和建立产业增加已经发现不显著在拉各斯州高水平的一氧化碳浓度为研究期间作出贡献。

1.介绍

众所周知,人口增长和全球化已经成为污染的主要驱动因素。在各种形式的污染中,大量研究空气质素与健康影响关系的研究指出,空气污染是社会关注的主要环境问题。住院、急诊和肺功能下降与以下常见空气污染物有关:一氧化碳(CO)、氮氧化物(NO .)<年代ub> x),可吸入颗粒(测量为PM<年代ub>10.),光化学氧化剂(测量为臭氧),和二氧化硫所以<年代ub>2

空气污染的定义是存在一个或多个室外大气的污染物的数量和持续时间,可能会损害人类,植物,动物的生命或财产或可能不合理干扰舒适享受的生命或财产或业务的行为 1 2].

在这项研究工作中,重点将放在这些标准污染物之一,即一氧化碳,因为它对人类健康构成主要威胁。

一氧化碳是一种无色、无味、剧毒的气体,由于矿物燃料的不完全燃烧而大量产生。据了解,一氧化碳的主要来源是机动车尾气(车辆排放);约三分之二的污染物排放来自交通运输来源,其他来源包括工业过程和露天燃烧活动[ 3. 4].

空气中一氧化碳的自然浓度约为0.2 ppm,这一浓度对人体无害,而暴露在污染物排放浓度为100 ppm或更高的环境中,则会对人体健康造成危险。一氧化碳对人体的危害主要是由于它容易与血液中的血红蛋白结合。它们的结合产生羧基血红蛋白(COHB),从而降低血液携带氧气的能力[ 5].表中给出了通过暴露于一氧化碳(百万分之内)产生的急性效应 1

一氧化碳中毒:症状和症状[ 15.].

浓度 症状
35 ppm (0.0035%) 在六到八小时的持续接触范围内的头痛和头晕。
100 ppm (0.01%) 两到三个小时的略微头痛。
200 ppm (0.02%) 两到三个小时内轻微头痛;判断损失。
400 ppm (0.04%) 一到两个小时内的前头痛。
800 ppm (0.08%) 45分钟内出现头晕、恶心和抽搐;2小时内失去知觉。
1600 ppm (0.16%) 在20分钟内头痛,心动过速,头晕和恶心;死亡不到2小时。
3200 ppm (0.32%) Headache, dizziness, and nausea in 5 to 10 min. Death within 30 minutes.
6,400 ppm(0.64%) 一到两分钟内出现头痛和头晕。抽搐呼吸停止不到20分钟就会死亡
12,800 ppm(1.28%) 经过2-3次呼吸,神志不清。死亡不到三分钟。

概率模型已成功地应用于许多物理现象,如风速、降雨、河流流量和空气质量。它已被用于拟合印度钦奈的车辆排放数据,用于预测周围大气中的一氧化碳浓度[ 6 7].在他们的研究中,10个标准概率模型对数据进行了拟合,并用Kolmogorov-Smirnov检验和Anderson-Darling检验评估了拟合优度。

当正确选择空气污染物的母概率分布时,具体分布可用于预测平均浓度和超过临界浓度的概率[ 5 8].

本文的目标是将上述三种概率分布与尼日利亚拉各斯州的一氧化碳浓度拟合,以确定描述数据的“最佳”分布,并建立一氧化碳浓度的分布,以预测浓度将超过临界或可接受浓度的概率。

为此,在2004年至2010年期间收集了污染物浓度的观测数据(如有)。由于汽车尾气(排放)是一氧化碳的主要来源,我们还收集了拉各斯州2004年至2010年期间新登记的车辆数量和新登记的行业数量的信息。

2.方法论

威布尔分布.让<我nline-formula> X 表示随机变量;双参数威布尔密度函数[ 9] 是(谁)给的 (1) f x α β α β x β α - 1 e - x / β α α > 0 β > 0 在哪里<我nline-formula> α 形状参数是和吗<我nline-formula> β 是比例参数。

对数正态分布。一个随机变量<我nline-formula> X 是日志 - 通常是分发if<我nline-formula> LN. X 通常是分布式的。其概率密度函数[ 10.] 是(谁)给的 (2) f x μ σ. 2 1 x 2 π σ. 2 e - LN. x - μ 2 / 2 σ. 2 x > 0 - < μ < σ. 2 > 0 在哪里<我nline-formula> μ 是位置参数以及分布的平均值和<我nline-formula> σ. 是尺度参数,也是分布的标准差。

伽玛分布。让<我nline-formula> X 表示一个随机变量,这两个参数伽玛密度函数[ 11.与参数)<我nline-formula> α 和<我nline-formula> β 是(谁)给的 (3) f x α β 1 Γ α β α x α - 1 e - x / β x > 0 α > 0 β > 0 在哪里<我nline-formula> α 形状参数是和吗<我nline-formula> β 是比例参数。

2.1。参数估计方法

分布的参数可以用各种方法估计,如最大似然估计法(MLE)和矩量法(MOM)等。由于似然估计是一种常用的估计方法,且常给出参数的最小方差估计,因此本文将采用似然估计方法。

MLE具有许多令人满意的性能,因此得到了广泛的应用;极大似然估计是一致的,渐近正态的,渐近有效的。让<我nline-formula> x 1 x 2 ... x n 是一个随机的大小样本“<我nline-formula> n "从p.d.f,<我nline-formula> f x θ ,在那里<我nline-formula> θ 是一个未知的参数。该随机样本的似函数是“”的关节密度函数“<我nline-formula> n 随机变量,它是未知参数的函数[ 12.].因此,<我nline-formula> l π 1 n f x θ 是可能的函数。最大似然估计器(MLE)<我nline-formula> θ 说,<我nline-formula> θ ,就是价值<我nline-formula> θ 最大化<我nline-formula> l 或者,等价地,对数<我nline-formula> l .的MLE<我nline-formula> θ (4) d 日志 l d θ 0

根据 [ 12.],最大似然估计<我nline-formula> α 和<我nline-formula> β 威布尔分布的形状和尺度参数是联立方程的解 (5) α n 1 / β σ. 1 n x α 日志 x - σ. 1 n 日志 x (6) β 1 n σ. 1 n x α 1 / α

对于对数正态分布,最大似然估计<我talic> μ和<我nline-formula> σ. 2 是由 (7) μ 1 n σ. 1 n 日志 x (8) σ. 2 1 n - 1 σ. 1 n 日志 x - μ 2 最后,最大似然估计<我nline-formula> α 和<我nline-formula> β 伽玛分布是立方程的解 (9) 日志 α - ψ α 日志 x - π 1 n x 1 / n β x - α 在哪里<我nline-formula> ψ α 是一个有争论的digamma函数<我nline-formula> α 定义为 (10) ψ α d d α 日志 Γ α d Γ α / d α Γ α

2.2.加权最小二乘

加权最小二乘是一种有效的方法,可以良好地使用小数据集。WLS优于其他方法的主要优点是能够处理数据点质量变化的回归情况。如果数据中随机误差的标准偏差在解释变量的所有级别上不是常量,则使用WLS<我talic> 与方差成反比的权重在解释变量的每一级上,都能产生最精确的参数估计。考虑 (11) w α 1 年代 2

由于样本大小<我nline-formula> n 其中的数据也各不相同,本研究工作中所用的权重为 (12) w n 年代 2

的WLS估计<我talic> β是(谁)给的 (13) β X 1 W X - 1 X 1 W Y

的矩阵<我nline-formula> W 是(谁)给的 (14) W w 1 0 0 w n

拟合这个模型等价于最小化 (15) 年代 年代 E σ. 1 n w y - β o - β 1 x 1 - β 2 x 2 2

2.3。拟合优度检验

为了验证模型对一氧化碳数据观测的拟合性,使用了Kolmogorov-Smirnov (K-S)和Anderson-Darling (A-D)检验。这些统计值越低,所拟合的分布似乎越符合数据。检验的假设如下:

H o:数据遵循指定的分发

H 1:数据不符合指定的分布。

鉴于“<我nline-formula> N ”有序数据点<我nline-formula> X 1 X 2 ... X N ,对于柯尔莫哥洛夫 - 斯米尔诺夫测试的测试统计给出 (16) D 最大限度 1 ≤. ≤. n F X - - 1 N N - F X

安德森 - 达林检验统计量由下式给出 (17) 一个 2 - N - 年代 在哪里 (18) 年代 σ. 1 n 2 - 1 N LN. F X + LN. 1 - F X N + 1 - F · 连续分布的CDF正在被测试吗<我nline-formula> X 为有序数据。

2.4.的概率超过数

一氧化碳观察将超过特定标准或限制的概率基于所选择的分布作为所研究期间的Lagos状态中的一氧化碳浓度最佳分布。

在数学上,超过临界浓度的可能性[ 13. 14.] 是(谁)给的 (19) PR. X > x 1 - PR. X ≤. x 1 - - x f x d x

3.收集的数据摘要

在本节中,我们提供并描述了在一氧化碳集中,新注册车辆数量和行业收集的信息。

3.1。关于一氧化碳浓度的数据

本节提供了收集在一氧化碳的百万分之几(PPM)测定拉各斯州浓度辅助数据从2004年8月至2010年的数据收集为每日数据八月信息(可用的),但我们只能收集412data points for the years considered (e.g., there was no record at all for the year 2007, as shown in Table 7).数据汇总于表中 2给出记录的测量,标准偏差,平均值,和观测值的模式的最大值和最小值。

一氧化碳浓度(ppm)。数据来源:拉各斯州环境保护局(LASEPA)。

最小值(ppm) 最大值(ppm) 平均值(ppm) 模式(PPM) 标准偏差 总观察
0.00 249.00 12.79 0.00 33.43 412.

上一氧化碳浓度(ppm)中的数据的图解表示在图中给出 1

一氧化碳浓度数据的直方图。

它可以从数字推导出来 1一氧化碳浓度的信息(收集到的)是正倾斜的,模式发生在0 ppm。这就证明了我们在本文中使用正偏态理论分布来模拟数据集的原因。

3.2.登记车辆资料

在本节中,我们提供每年登记在拉各斯州的2004年和2010年的数据提供在表之间的车辆(卡车,客车和汽车)的数量信息 3.

注册车辆的数据。资料来源:机动车管理机构(M.V.A.A.),Ikeja章节,拉各斯州。

一年 2004 2005 2006 2007 2008 2009 2010
注册车辆数量 67376年 81078年 57,379 160134 244810 230,822 239954年

新登记的车辆的数目的图形表示在图中给出 2

新注册车辆数量的条形图。

从图中可以看出 22006年登记车辆数目略有下降,2007年则急剧上升,而2008年则是登记车辆数目最高的一年。

3.3。注册行业的数据

桌子 4节目收集了2004年至八月,2010年期间新注册的行业(制造业)在拉各斯州的数量的信息汇总。应当指出,在拉各斯州越来越多的行业除了在本文中拍摄的那些,但我们只考虑制造业已登记的行业。

估计新注册行业数量。资料来源:尼日利亚(M.A.N)的制造商协会,Ikeja章节,拉各斯州。

一年 2004 2005 2006 2007 2008 2009 2010
新注册行业预计数量 21. 28. 41. 47. 70 49. 144.

新注册的行业的数目的图形表示在图中给出 3.

新注册行业数量的条形图。

从图中可以看出 3.只有少数制造业都注册。此外,除了2009年,记录与2009年的2010年度继续增加,除了2009年,那里有一点跌幅。

4.分析和结果

所研究的分布(威布尔,对数正态分布,和γ)的参数是由分布拟合到一氧化碳浓度的数据估计使用Easy-拟合统计软件包收集。

4.1.拟合优度检验

在试图选择“最好”的概率模型来描述在拉各斯州一氧化碳的浓度研究期间,配合测试的柯尔莫哥洛夫 - 斯米尔诺夫优度进行。分析汇总表中给出 6

三个分布的累积密度函数(CDF)的图表如图所示 4

显示拟合分布的累积分布函数的图。

这个图显示了威布尔分布、对数正态分布和伽马分布与数据的吻合程度。可以看出,伽马分布的CDF更接近一氧化碳浓度的真CDF。

4.2.超过临界浓度的概率

由于伽玛分布符合剩余拟合分布的数据,即一氧化碳浓度将超过拉各斯国家环境保护局(LASEPA)标准(5ppm)和联邦环境保护局(FEPA)标准(10ppm)将基于伽马分布的累积密度函数(CDF)来计算。

伽马分布与参数的概率密度函数<我talic> α和<我talic> β是(谁)给的 (20) f x α β 1 Γ α β α x α - 1 e - x / β x > 0 α > 0 β > 0

和累积密度函数(CDF)是 (21) F x PR. X ≤. x - x f x d x

从表格 5,形状参数<我nline-formula> α 0.1463 ,尺度参数<我nline-formula> β 87.378 , 和 (22) P X ≤. 5 0.699181.

拟合概率模型的参数估计。

分布 参数估计
威布尔 α 0.6386 ,<我nline-formula> β 12.766
对数正态 σ. 1.4615 ,<我nline-formula> μ 1.777
γ α 0.1463 ,<我nline-formula> β 87.378

拟合分布类型及拟合优度统计量。

分布 柯尔莫哥洛夫 - 斯米尔诺夫检验 安德森 - 达林检验
威布尔 0.3473 0.3692
对数正态 0.3711 0.3904
γ 0.3471 * 0.3466 *

注:*表示最合适的。

平均每年一氧化碳浓度(<我nline-formula> Y ),新注册车辆(<我nline-formula> X 1 )及注册行业(<我nline-formula> X 2 )六年了。

一年 2004 2005 2006 2008 2009 2010
Y (ppm) 33.90 38.96. 84.00 10.99 14.13 4.82
X 1 67376年 81078年 57,379 244810 230,822 239954年
X 2 21. 28. 41. 70 49. 144.

因此,概率的一氧化碳浓度会超过LASEPA标准IS (23) P X > 5 1 - P X ≤. 5 1 - 0.699181. 0.300819

同时, (24) P X ≤. 10. 0.768379

那么,一氧化碳浓度超过FEPA标准的概率是 (25) P X > 10. 1 - P X ≤. 10. 1 - 0.768379 0.231621

4.3。线性回归建模

一氧化碳年平均浓度<我nline-formula> Y (以ppm计)将在(新登记的车辆的数量进行回归<我nline-formula> X 1 )及新注册行业数目(<我nline-formula> X 2 ).2007年,没有可用于一氧化碳集中的数据;因此,2007年在回归分析中自动忽略。桌子 7示出了用于回归分析的数据的摘要。

使用Minitab统计包,回归<我nline-formula> Y 在两个变量上<我nline-formula> X 1 和<我nline-formula> X 2 给出了如表所示的结果 8

回归分析结果的表格。

预测 Coeff。 圣开发。 T P 价值
持续的 70.58 17.66 4.00 0.028
X 1 -0.0002757 0.0001405 −1.96 0.145
X 2 0.0491 0.2912 0.17 0.877

回归方程为: (26) Y 70.58 - 0.000276. X 1 + 0.049 X 2

方程( 26.)如下解释。

将减少0.000276<我nline-formula> Y 对于单位的变化<我nline-formula> X 1 当变量时<我nline-formula> X 2 保持固定,并会有增加0.049<我nline-formula> Y 对于单位的变化<我nline-formula> X 2 当变量时<我nline-formula> X 1 固定固定。

方差分析

假设

H o β 1 β 2 0

H o β 0 1 2 至少一个<我nline-formula>

决策规则。拒绝<我nline-formula> H o 如果<我nline-formula> P 价值小于重要程度<我nline-formula> α 0.05

的决定。我们不拒绝<我nline-formula> H o 因为0.171不小于0.05。

推理。从表格 8,考虑到<我nline-formula> P 参数的值<我nline-formula> β 1 和<我nline-formula> β 2 ,则表示回归参数与0无显著差异<我talic> R-SQ = 69.2%和<我talic> R-sq(调整)= 48.7%。

此外,从表 9,基于<我nline-formula> P 价值(0.171),我们得出结论,回归模型并不重要<我nline-formula> α 0.05

方差分析表。

变异来源 DF 平方和 均方 F P 价值
回归 2 2943.0 1471.5 3.37 0.171
剩余 3. 1308.1 436.0
全部的 5 4251.1
结论

在本文中,我们已经能够建立(基于所收集的数据),所以在所研究的时期之间的Lagos状态下的一氧化碳观测的分布是正面的,如图所示 1.Gamma分布被认为是由表柯尔莫哥洛夫 - 斯米尔诺夫和安德森 - 达林测试,证实了在拉各斯州造型一氧化碳浓度的最佳分配 6.拉各斯国家的一氧化碳浓度分别超出了拉各斯国家环境保护局(LASEPA)和联邦环境保护局(FEPA)标准,分别为0.300819和0.231621。增加车辆的使用和增加的Lagos状态的行业的增加不会显着促进高碳一氧化物浓度水平。也许,进一步的研究可以专注于汽车发动机的年龄,用于车辆和机器的燃料的质量,然后是国家的吸烟活动。

利益冲突

作者声明本文的发表不存在利益冲突。

f . I。 Unachukwu g . O。 尼日利亚的车辆排放和空气质量标准 欧洲科学研究杂志 2009 34. 4 550. 560. 2-S2.0-69749127691 慢跑 L. W. 环境影响评估 1996 2 美国纽约 麦格劳山 Kanyode e . L。 测量的污染物排放[LUMES论文] 2004 瑞典隆德 隆德大学 易卜拉欣 C. A. 马来西亚空气质量管理概述 2004 马来西亚科技大学 Fellenberg G。 污染的化学 2000 牛津,英国 约翰·威利父子公司 》。 B.-H. 上海市大气污染物的统计分布 生物医学与环境科学 2004 17. 3. 366. 372. 2 - s2.0 - 8444241911 Harikrishna m 阿伦 C。 m·J。 SURESH. 诉M。 库玛 t . V。 城市道路车辆排放随机分析 - 以钦奈为例 第三届环境与健康国际会议诉讼程序 2003年12月 金奈,印度 H.-C. f GC。 预测一个关键PM的超越<年代ub>10.集中 - 台湾的案例研究 大气环境 2003 37. 25. 3491. 3499. 2-S2.0-0038693437 10.1016 / s1352 - 2310 (03) 00453 - 9 林雷 Y。 三种方法评价估计中国松Weibull分布参数(<我talic> Pinus tabulaeformis. 林业科学杂志 2008 54. 12. 566. 571. 2 - s2.0 - 57549086829 金斯 b·F。 Lognormal分布的参数估计[M.S.论文] 2009 美国犹他州普洛佛 杨百翰大学 福布斯 C。 埃文斯 m 黑斯廷斯 N。 孔雀 B。 统计分布 2011 4. 霍博肯,NJ,USA 约翰·威利父子公司 MR2964192 斯蒂芬斯 m·A。 EDF统计拟合优度和一些比较 美国统计协会杂志 1974 69 347. 730 737 10.1080 / 01621459.1974.10480196 雅屋 答:S。 南利 n。 马来西亚主要城镇一氧化碳浓度的建模 - 以槟城,古晋和吉隆坡为例 项目报告 2008 马来西亚理科大学 Zaharim 一个。 Najid S. Razali 一个。 Sopian K. 分析马来西亚风速数据使用统计分布 第四届IASME/WSEAS能源与环境国际会议论文集(EE’09) 2009 363. 370. 一氧化碳中毒;症状和体征 http://en.wikipedia.org/wiki/Carbon_monoxide_poisoning