监测尼日利亚环境污染概率模型的研究

抽象的

在尼日利亚拉各斯州，对全州的污染物排放进行了监测，以发现任何可能对人类健康和整个环境造成损害的重大变化。在这项研究中，三种理论分布，威布尔分布，对数正态分布和伽马分布，检查一氧化碳观测，以确定最佳拟合。建立了污染物观测的特征，并成功预测了超过拉各斯州环境保护局(LASEPA)和联邦环境保护局(FEPA)可接受限度的可能性。在研究期间，车辆使用的增加和工业建设的增加并不是拉各斯州一氧化碳浓度高的主要原因。

1.介绍

人口增长和全球化已成为污染的主要驱动因素是常识。出于各种形式的污染，大量研究调查了空气质量和健康效果之间的关系，引用了空气污染作为社区关注的主要环境问题。增加住院治疗，急诊室出勤和肺功能下降与以下常见空气污染物有关：一氧化碳（CO），氮氧化物（不_x)、可吸入颗粒物(以PM计₁₀)、光化学氧化剂(测量为臭氧)和二氧化硫SO₂．

空气污染被定义为在这种数量的一种或多种污染物的室外气氛中的存在，并且这种持续时间可能往往对人，植物或动物生命或财产有害，或者可能无理地干扰舒适的生活享受或财产或业务的行为[1，2］．

在这项研究工作中，重点将放在这些标准污染物之一，即一氧化碳，因为它对人类健康构成主要威胁。

一氧化碳是一种无色，无味的，并且由于化石燃料的不完全燃烧而大量生产的高毒气体。众所周知，一氧化碳的主要来源来自机动车排气（车辆发射）;大约三分之二的污染物排放来自交通来源，而其他来源包括工业流程和开放的燃烧活动[3.，4］．

空气中的一氧化碳的天然浓度约为0.2ppm，并且该量对人类无害，同时暴露于100ppm或更大的污染物排放可能对人类健康有危险。一氧化碳危及人类的倾向于与血液中的血红蛋白结合的趋势。它们的组合产生羧基血红蛋白（COHB），从而降低血液携带氧气的能力[5］．暴露于一氧化碳(以百万分之一计)所产生的急性影响见表1．


浓度	症状

35 ppm（0.0035％）	持续接触6到8小时内会出现头痛和头晕。
100 ppm (0.01%)	两三小时后轻微头痛。
200 ppm (0.02%)	2 - 3小时内轻微头痛;失去了判断力。
400 ppm (0.04%)	一到两个小时内的前头痛。
800 ppm (0.08%)	45分钟内出现头晕、恶心和抽搐;2小时内失去知觉。
1,600 ppm（0.16％）	20分钟内出现头痛、心动过速、头晕、恶心;两小时内死亡
3200 ppm (0.32%)	5 - 10分钟内出现头痛，头晕，恶心。30分钟内死亡
6400 ppm (0.64%)	一到两分钟内出现头痛和头晕。抽搐呼吸停止不到20分钟就会死亡
12800 ppm (1.28%)	呼吸2-3次后失去知觉。不到三分钟就会死亡

概率模型已成功地应用于许多物理现象，如风速、降雨、河流流量和空气质量。它已被用于拟合印度钦奈的车辆排放数据，用于预测周围大气中的一氧化碳浓度[6，7］．在他们的研究中，使用Kolmogorov-Smirnov试验和Anderson-Darling测试评估了十个标准概率模型。

当正确选择空气污染物的母概率分布时，具体分布可用于预测平均浓度和超过临界浓度的概率[5，8］．

本文的目标是将上述三种概率分布与尼日利亚拉各斯州的一氧化碳浓度拟合，以确定描述数据的“最佳”分布，并建立一氧化碳浓度的分布，以预测浓度将超过临界或可接受浓度的概率。

为此，在2004年至2010年期间收集了污染物浓度的观测数据(如有)。由于汽车尾气(排放)是一氧化碳的主要来源，我们还收集了拉各斯州2004年至2010年期间新登记的车辆数量和新登记的行业数量的信息。

2.方法

威布尔分布．让表示随机变量;双参数威布尔密度函数[9是由在哪里是形状参数和为尺度参数。

Lognormal分布。随机变量是否为对数正态分布通常是分布式的。其概率密度函数[10是由在哪里是位置参数以及分布的平均值和是尺度参数，也是分布的标准差。

伽马分布。让表示随机变量，两个参数密度函数[11与参数)和是由在哪里是形状参数和为尺度参数。

2.1。参数估计方法

分布的参数可以用各种方法估计，如最大似然估计法(MLE)和矩量法(MOM)等。由于似然估计是一种常用的估计方法，且常给出参数的最小方差估计，因此本文将采用似然估计方法。

MLE广泛且常用，因为它具有许多所需的性质;最大似然估计器是一致的，渐近的正常和渐近效率。让是大小的随机样本""从p.d.f，，在哪里是一个未知的参数。该随机样本的似函数是“”的关节密度函数“随机变量，它是未知参数的函数[12］．因此,为似然函数。的最大似然估计(MLE)，说，就是价值最大化或者等价的，对数．的大中型企业是一个解决方案

根据(12，即最大似然估计量和威布尔分布的形状和比例参数是同时方程的解决方案

对于对数正态分布，最大似然估计μ和是由最后，最大似然估计和对于分布是联立方程的解在哪里是带参数的二格函数吗定义为

２.２.加权最小二乘

加权最小二乘法是一种有效利用小数据集的方法。与其他方法相比，WLS的主要优点是能够处理数据点质量不同的回归情况。如果数据中随机误差的标准差在所有水平的解释变量中不是恒定的，使用WLS与方差成反比的权重在每个级别的解释性变量下，产生最精确的参数估计。考虑

因为样本量数据也有所不同，本研究工作中使用的重量是

WLS估计β是由

的矩阵是由

拟合这个模型等价于最小化

２.３.拟合优度检验

为了验证模型对一氧化碳数据观测的拟合性，使用了Kolmogorov-Smirnov (K-S)和Anderson-Darling (A-D)检验。这些统计值越低，所拟合的分布似乎越符合数据。检验的假设如下:H_o:数据遵循指定的分布与H₁：数据不遵循指定的分发。鉴于“有序数据点，则Kolmogorov-Smirnov检验统计量为

Anderson-Darling的检验统计量由在哪里是正在测试的连续分布的CDF为有序数据。

２.４.的概率超过数

一氧化碳观测值超过指定标准或极限的概率，是根据所研究期间拉各斯州一氧化碳浓度的最佳分布而确定的。

数学上，超过临界浓度的概率[13，14是由

3.收集的数据摘要

在本节中，我们提供并描述收集到的一氧化碳浓度、新登记车辆数量和行业的信息。

3．1.一氧化碳浓度数据

本节提供2004年8月至2010年8月在拉各斯州收集的一氧化碳浓度(ppm)二级数据的信息。数据是按日收集的，但我们只收集了考虑年份的412个数据点(例如，2007年根本没有记录，如表所示7）.数据汇总于表中2给出记录的测量值的最小值和最大值、标准偏差、平均值和观测值的模态。


最小值(ppm)	最大值(ppm)	平均值（ppm）	模式(ppm)	标准偏差	总观察

0．00	249.00	12.79	0．00	33.43	412

图中给出了一氧化碳浓度(ppm)数据的图解1．

它可以从图中推导出来1关于一氧化碳浓度（如收集）的信息是正偏斜的，并且在0 ppm处发生模式。这证明了我们使用带正偏斜的理论分布来模拟本文中的数据的原因。

3.2。注册车辆的数据

在本节中，我们提供了拉各斯州2004年至2010年间每年注册的车辆(卡车、公共汽车和轿车)数量的信息。数据如表所示3.．


一年	2004	2005	2006	2007	2008	2009	2010

登记车辆数目	67376年	81,078	57379年	160134年	244810年	230822年	239954年

新登记车辆数目的图示见图2．

从图中可以看出22006年登记车辆数目略有下降，2007年则急剧上升，而2008年则是登记车辆数目最高的一年。

3.3。注册行业的数据

表格4显示2004年至2010年8月拉各斯州新注册工业(制造业)数量信息汇总。值得注意的是，拉各斯州除了本文所描述的行业外，还有更多的行业，但我们只考虑已经注册的制造业。


一年	2004	2005	2006	2007	2008	2009	2010

新注册行业预计数量	21	28	41	47	70	49	144

新注册行业数目的图示载于图中3.．

从图中可以看出3.只有少数的制造业注册了。2004 - 2010年，除2009年略有下降外，其余年份均呈上升趋势。

4.分析和结果

所研究的分布参数(威布尔、对数正态和伽玛)是通过拟合分布到使用Easy-Fit统计软件包收集的一氧化碳浓度数据来估计的。

4．1.拟合优度检验

为了选择描述所研究时期拉各斯州一氧化碳浓度的“最佳”概率模型，进行了Kolmogorov-Smirnov拟合优度检验。分析总结如表所示6．

三个分布的累积密度函数（CDF）的图表如图所示4．

这个图显示了威布尔分布、对数正态分布和伽马分布与数据的吻合程度。可以看出，伽马分布的CDF更接近一氧化碳浓度的真CDF。

4.2。超过批判浓度的概率

由于gamma分布比其他的拟合分布更适合数据，一氧化碳浓度超过拉各斯州环境保护局(LASEPA)标准(5ppm)和联邦环境保护局(FEPA)标准(10ppm)的概率将根据伽马分布的累积密度函数(CDF)计算。

带有参数的伽马分布的概率密度函数α和β是由

累积密度函数(CDF)为

从表5，形状参数，尺度参数,


分布	参数估计

威布尔	，
对数正态	，
伽玛	，


分布	Kolmogorov-Smirnov测试	Anderson-Darling测试

威布尔	0.3473	0.3692
对数正态	0.3711	0.3904
伽玛	0.3471 *	0.3466 *

注:*表示最适合。


一年	2004	2005	2006	2008	2009	2010

(ppm)	33.90.	38.96	84.00	10.99.	14.13	4.82
	67376年	81,078	57379年	244810年	230822年	239954年
	21	28	41	70	49	144

因此，一氧化碳浓度超过LASEPA标准的可能性是

另外，

那么，一氧化碳浓度超过FEPA标准的概率是

4．3．线性回归模型

一氧化碳年平均浓度(以百万分之百计)将会回归新登记车辆的数目(）和新注册行业的数量（）.没有2007年一氧化碳浓度的数据;因此，在回归分析中自动忽略2007年。表格7显示用于回归分析的数据摘要。

使用MINITAB统计软件包，回归在两个变量和给出了如表所示的结果8．


预测指标	多项式系数。	圣开发。		价值

常数	70.58	17.66	4.00	0.028
	−0.0002757	0.0001405.	-1.96	0.145
	0.0491	0.2912	0.17	0.877

回归方程为

等式（26)的解释如下。

将减少0.000276单位变更当变量是固定不变的，会增加0.049单位变更当变量保持固定。

方差分析（ANOVA）

假设H_o 与H_o 至少一个．

决策规则。拒绝如果值小于显著性水平．

决定。我们不拒绝因为0.171不小于0.05。

推理。从表8，考虑到参数值和，则表示回归参数与0无显著差异R-Sq = 69.2%和R-Sq(调整后)= 48.7%。

此外，来自桌子9，基于值(0.171)时，我们得出回归模型在．


的变异来源	DF	平方和	均方		价值

回归	2	2943.0	1471.5	3．37	0.171
剩余	3.	1308.1	436.0
总计	5	4251.1.

5.结论

在本文中，我们已经能够建立(基于收集的数据)，拉各斯州的一氧化碳观测数据在研究期间的分布是正偏态的，如图所示1．表中的Kolmogorov-Smirnov和Anderson-Darling检验证实，Gamma分布被认为是对拉各斯州一氧化碳浓度建模的最佳分布6．拉各斯州的一氧化碳浓度超过拉各斯州环境保护局(LASEPA)和联邦环境保护局(FEPA)的标准，概率分别为0.300819和0.231621。在拉各斯州，车辆使用的增加和工业建设的增加并没有对一氧化碳的高浓度造成很大的影响。也许，进一步的研究可以集中在汽车引擎的年代，车辆和机械使用的燃料的质量，然后是国家的吸烟活动。

利益冲突

提交人声明没有关于本文的出版物的利益冲突。

参考文献

F. I. ABAM和G. O. Unachukwu，尼日利亚的车辆排放和空气质量标准，“欧洲科学研究杂志第34卷第3期4, pp. 550 - 560,2009。视图:谷歌学者
l . w .慢跑环境影响评估， McGraw Hill，纽约，纽约，美国，第二版，1996。
E. L. Kanyode，测量的污染物排放[LUMES论文]，隆德大学，隆德，瑞典，2004。
c·a·易卜拉欣马来西亚空气质量管理概述马来西亚科学大学，2004年。
g . Fellenberg污染的化学， John Wiley & Sons，牛津，英国，2000。
高清。kan和b.-h.陈，“中国上海环境空气污染物的统计分布”，“生物医学与环境科学，卷。17，不。3，pp。366-372，2004。视图:谷歌学者
M. Harikrishna和C. Arun，“城市道路上车辆排放的随机分析——钦奈的一个案例研究”，刊于第三届环境与健康国际会议论文集，M. J. Bunch，V. M. Suresh和T. V.Kumaran，EDS。，钦奈，印度，2003年12月。视图:谷歌学者
H.-C。陆和G.-C。预测一个关键PM的超越₁₀专注——台湾的一个案例研究大气环境，卷。37，不。25，pp。3491-3499，2003。视图:出版商的网站|谷歌学者
3种估算油松威布尔分布参数的方法评价(油松），“林业科学杂志第54卷第5期12，页566-571,2008。视图:谷歌学者
b·f·基诺对数正态分布的参数估计[M.S.。论文)杨百翰大学，美国犹他州普罗沃，2009。
C.福布斯，M. Evans, N. Hastings，和B. Peacock，统计分布， John Wiley & Sons，霍博肯，新泽西州，美国，第四版，2011。视图:Mathscinet.
M. A.斯蒂芬斯，《EDF拟合优度统计和一些比较》，美国统计协会杂志，第69卷，第2期347页，730-737,1974。视图:出版商的网站|谷歌学者
a . S. Yahaya和N. a . Ramli，《马来西亚主要城镇一氧化碳浓度的模拟:槟榔屿、古京和吉隆坡的案例研究》，项目报告，马来西亚圣大学，2008。视图:谷歌学者
A. Zaharim, S. Najid, A. Razali，和K. Sopian，《利用统计分布分析马来西亚风速数据》，刊第四届IASME/WSEAS能源与环境国际会议论文集(EE’09)，第363 - 370,2009年。视图:谷歌学者
“一氧化碳中毒;症状和体征,”http://en.wikipedia.org/wiki/carbon_monoxide_poisoning.．视图:谷歌学者

概率与统计杂志

抽象的