文摘
傅里叶变换红外(FTIR)光谱技术是一种快速、无损的大气质量监测技术。每个组件的识别的红外光谱谱是一个气态污染物的精确定量分析的先决条件。由于不同的气体吸收峰的重叠和水蒸气在实际测量的干扰,现有的气体光谱识别方法识别率低的缺点,无法进行实时在线分析大气质量监测。在这个工作中,独立分量分析(ICA)是应用于光谱严重重叠光谱的气态污染物的分离。分析验证了该方法的混合光谱实验室和实际获得的大气光谱从固定来源收集。分离过程的平均消费时间小于0.2秒,并实验气体的识别速度100%,如图所示由峰值搜索的结果和修正系数的分析分离光谱与标准光谱数据库。实际大气光谱的识别结果表明,该方法可以有效地识别的气态污染物浓度测量光谱的变化,它是一种很有前途的质谱分析工具,可以缩短识别时间,以及提高识别速度。因此,这种方法可以是一个有用的替代传统的定性识别方法用于实时在线大气污染物检测。
1。介绍
空气是地球上生命体的基础,和大气环境的质量是与人类活动密切相关。随着现代工业化的发展和人类生活水平的提高,燃烧化石燃料和排放的汽车尾气造成严重的大气污染,近年来引起了更多的关注。典型的气态污染物包括氮氧化物(NOX)、二氧化硫(X)[1),挥发性有机化合物(挥发性有机化合物的仪器)2),和臭氧(O3)[3]。这些气体污染物作为大气中痕量气体存在,但对人类健康和环境产生不利影响(4]。健康影响包括癌症,住院治疗,减少了平均寿命从心脏和肺部疾病。例如,即使短暂接触2会导致严重的呼吸道疾病,如哮喘和支气管炎5]。此外,三分之二的挥发性有机化合物的仪器是致癌和有害的中枢神经系统和造血系统,尤其是免疫系统(6]。环境影响主要体现在温室效应,臭氧层破坏,酸雨7]。日益严重的大气污染事件,地方政府将更多地关注大气污染,和法律法规针对控制这已经公布。尽管如此,一些工业化学品公园仍然偷偷有毒和高浓度废气直接排放到空中的时候。因此,建立和完善一个实时连续气态污染物监测系统,可以确定特定污染物的来源和浓度对大气污染的控制至关重要。
先进的在线大气监测技术,包括气相色谱分析-质谱法(gc - ms) [8),质子转移反应物料光谱仪(ms) [9),反应和化学电离质谱(这个)10,11]。其中,气相是最广泛应用于商业监测仪器,它可以迅速识别和量化污染物从大气样品12]。ms和cirm改进质谱和高灵敏度的优点和连续检测。尽管这些技术已经被证明能够准确检测气体污染物,它们的实现是复杂的,需要试剂援助。免费试剂,无损,并提供连续、同时多组分测量,光学检测已成为一个新的趋势在大气监测的发展13]。
傅里叶变换红外(FTIR)光谱是一个功能强大的光谱检测技术,已经被美国环境保护机构推荐监测空气污染物。红外光谱是由吸收峰产生红外辐射吸收振动过渡期间不对称偶极矩多原子分子,和各种气态污染物可以通过红外光谱测量技术由于其物理结构。红外光谱具有较高的敏感性,允许检测气体浓度的变化在磅(十亿分之几、体积浓度)的水平。大道红外光谱已经被应用于在线检测微量气体排放从森林火灾14)和土壤在春季解冻(15沿着高速公路[],从交通排放16和在港口17]。红外光谱谱中每个组件的识别准确定量分析的关键。在红外光谱谱识别的早期阶段,图书馆搜索(LS)方法(18)采用光谱组件是单身或吸收峰值时很少重叠。Lavine et al。19)使用模式识别的方法作为图书馆的搜索预搜索和识别更准确和更快。由于强烈的曲线拟合和抗干扰能力的人工神经网络(ANN),各种ANN-based红外光谱谱识别算法。杨和格里菲思(20.)编码参考5醇原型向量的红外光谱谱Hopfield网络和正确识别五醇来自100多个不同的化合物的光谱通过这个网络。目前,最常见的方法在实践中结合光谱数据库的校准光谱和化学计量学方法定量以及定性分析。格里菲思(21)计算高分辨率的校准光谱传输分子吸收HITRAN数据库和检索气体红外光谱光谱信息的非线性最小二乘算法。传统大道组件识别方法的红外光谱谱是一个人工识别,需要一个专业的光谱学家确定可能观察到光谱中包含的组件,然后减去相应的组件从观察到的光谱,直到产生一个相对平坦的基线(22]。这些定性识别方法及其改进可以有效地识别光谱在特定的场合;然而,在严重的光谱重叠的情况下,样本规模小,缺乏参考光谱和高的实时要求,很难准确识别从红外光谱光谱痕量气体。
独立分量分析(ICA)是一种基于模型高阶统计信号处理方法,可以从一组独立的统计独立的源信号的观测信号没有任何先验知识(23]。ICA已经广泛应用于盲源分离(BSS)等领域语音分离(24),生物医学信号分析(25),和面部识别26,27]。作为一种新型分离方法,从观察到的可以恢复原来的信息重叠的混合物,光谱分析化学(ICA吸引了极大的兴趣28]。Pasadakis和Kardamakis29日]ICA用于识别商业汽油组分的红外光谱谱。Al-Mbaideen和本30.]研究了ICA结合多元线性回归确定近红外光谱的葡萄糖的浓度。Yu et al。31日利用ICA和小波分析区别水污染物的三维荧光光谱严重重叠。Monakhova et al。32]提出了四个不同的ICA反褶积算法的有效性重叠核磁共振光谱八个组件的混合物的食品及相关产品。研究显示,恢复ICA方法的准确性和鲁棒性重叠光谱。然而,由于大气气体成分的复杂性和水蒸气在实测光谱干扰,很少有研究应用ICA组件大气气态污染物光谱的识别。
2。材料和方法
在这项研究中,我们进行了识别实验光谱收集在实验室和实际的大气。提取红外光谱气体光谱仪收集的红外光谱是独立开发的由安徽光学和力学研究所中科院、多通道气体细胞10米内光路。光谱仪的测量带宽为500厘米−1-5000厘米−1和光谱分辨率1厘米−1。的输出光谱谱仪是16扫描后的平均值。
2.1。材料
甲烷(CH4)、乙醇(C2H5哦),乙炔(C2H2)和乙烯(C2H4)是常见的空气污染气体。因为他们的低成本、简单的制备,严重重叠的红外吸收带,我们选择这四个气体实验气体。实验气体的红外光谱与标准光谱数据库如图1;从图中,我们可以看到实验气体的吸收光谱重叠严重的波段860 - 1500厘米−1和2800 - 3200厘米−1。合肥Ningte天然气公司生产的纯气体和分别存储在4 L密封空气缸。四个气体的初始浓度65 ppm (CH4),207 ppm (C2H5哦),506 ppm (C2H2)和609 ppm (C2H4)。我们获得目标不同浓度的气体通过一个四通道高精度气体分布系统独立开发合肥体育科学研究所,中国科学院(CAS)。天然气分销平台可以同时发布四个气体和获得所需的体积比浓度通过调整辅助气体(氮气)和纯气体。总的来说,我们得到了12个样品的混合气体,四个气体的浓度变化在不同的样本是相互独立的,这是一个必要条件ICA分离。为了模拟大气中污染物的组成,气体的浓度是控制60 ppm以下。
2.2。红外光谱实验气体光谱采集
光谱采集之前,储气钢瓶被放置在通风的房间里,以防止损伤危险气体泄漏,造成实验系统和连接管道是完全密封的,和紧密性试验。四个气体浓度和氮被配置为所需的软件内置气体销售平台。时记录的光谱被气流,气压稳定。气体混合物光谱采集的实验装置如图2。从光谱仪获得光谱不仅包括目标气体的吸收信息,还随机噪声;在这个实验中,Savitzky-Golay平滑滤波器被用于原始光谱去噪。图3是12组的去噪光谱实验气体混合。
除了实验气体的吸收峰,水蒸气和二氧化碳在原始光谱也有很强的吸收带。H2O (g)和有限公司2产生严重的干涉大气红外光谱的分析。从图我们可以看出3H2O (g)有强烈的和宽吸收峰在1350厘米−1-1800厘米−1和3500厘米−1-3900厘米−1、有限公司2强吸收峰在2280厘米的范围−1-2385厘米−1。当使用红外光谱分析气体成分,H的常见的方法,以避免干扰2O (g)是分析气体成分的“红外大气窗口”远离H2O (g)吸收波段。基于这个想法,我们删除H的强吸收带2O (g)和有限公司2从光谱波段的其余部分和连接在一起。消除干扰的水蒸气和二氧化碳之前实现识别过程可以大大减少分析的复杂性。
2.3。红外光谱光谱采集的实际大气
大气光谱测量的屋顶上学生公寓(3层)合肥科技大学;这个区域附近的中心城市。没有大型化学工业源,和大气气态污染物主要来自机动车的废气。汽车尾气含有各种有毒、有害气体,包括有限公司有限公司2和挥发性有机化合物的仪器,如苯、烯烃和芳香碳氢化合物。因为这些挥发性碳氢化合物都含有债券官能团,他们有明显的吸收峰在2800厘米−1-3200厘米−1,这些吸收峰相似光谱剖面;因此,传统的识别方法很难有效区分特定的组件信息重叠光谱。在这项研究中,光谱数据在该地区从2800厘米−1到3200厘米−1被用于识别组件。图4是一种测量大气光谱。
图5显示12测量光谱在2800厘米的范围−1到3200厘米−1。我们可以看到,实际的大气光谱吸收的变化幅度相对较小,,很难区分具体除了甲烷气体的吸收峰。
2.4。消除背景光谱
背景光谱是由外部辐射红外探测器的反应,这是一个相对缓慢的变化过程,可以看作一种缓慢改变基线叠加在吸收光谱。在红外光谱应用程序中,背景光谱可以通过测量获得没有目标组件的吸收光谱。很容易实现这一在实验室条件下,但它是困难的在污染气体监测大道红外光谱。为了抑制背景光谱的影响,蒙特卡罗模拟执行新的光谱实验样本光谱。两个光谱是随机选择的,和一个被从其他生产一个新的频谱。12组的混合气体光谱获得的在实验室里,我们总共有66种不同的光谱。然而,12个光谱足以形成一个样本集。最后,12光谱实验气体和12光谱获得的实际大气背景光谱消元法。不同于普通的红外光谱背景去除的过程,我们不寻求纯背景,和新的光谱不仅消除非线性背景的一部分,但也保持目标气体的有用的信息。
2.5。ICA
ICA是一个强大的信号处理工具,它可以恢复原始信号的观测到的混合信号;它旨在寻找分离矩阵,可以观察到的信号转换成一个线性组合的相互独立的组件,这是接近源信号。
无噪声的ICA模型可以表现出下列线性关系: 在哪里代表观察到的米维信号矢量,是一个n维源组件向量,表示未知的混合矩阵。ICA试图找到最优分离矩阵W的组件尽可能独立。
因为源信号和混合信息未知,ICA的实现需要两个重要的限制(33]:(1)组件需要统计独立的源信号。(2)最多一个组件的源信号服从高斯分布。
不同气体的浓度和存在污染物在大气中很少出现的比例,和光谱信号不受高斯分布。因此,ICA可用于大气气态污染物的光谱信号的分离。
在各种ICA方法,定点ICA (FastlCA)已经成为一个最经典的算法由于其运算速度快,精度高。提出了FastICA Hyvarinen和Oja [34]1997年,它采用了定点迭代方案,使分离过程10到100倍比传统ICA优化算法。传统ICA的优化算法是基于随机梯度方法,它可以通过神经网络学习(35]。神经网络学习的主要问题是缓慢的收敛性和高度依赖学习速率的选择参数。相比之下,FastICA得到立方收敛速度和不依赖于任何自定义参数。在这项研究中,采用FastICA的ICA方法快速光谱分离过程。
3所示。结果与讨论
3.1。线性模型的建立
ICA可以有效地分离原始信号从混合系统,它是线性的。我们需要确保系统在线性混合模型的假设之前我们所做的分析。比尔-朗伯定律和吸光度可加性描述多组分光谱的吸收强度之间的关系和每个吸光物质的浓度。基本原则可以描述如下: 在哪里是总吸收光谱强度在一定的波长 , 吸收系数,是组件的浓度在波长 ,和是光程长度。根据吸光度可加性,多组分的吸光度光谱吸光度之和每个组件,组件的和浓度的变化只会导致吸光度的变化幅值但不吸收峰的位置和光谱概要文件。从上面的分析,我们可以知道大气光谱的吸收强度符合线性模型,和ICA算法可以用来分离混合气体的光谱。
节2从红外光谱分光计,我们获得的透射光谱。透光率的信息应该转化为吸光度信息以便分离算法对实验数据进行分析。比尔-朗伯定律还指出透光率之间的关系和吸光度 :
因此,我们得到了吸收光谱通过倒数的对数透光率数据。计算12实验气体的吸收光谱图所示6将被用作输入的离散后的分离算法波段彼此相连。计算12实际大气的吸收光谱波段2800厘米−1-3200厘米−1如图7,可直接用作分离算法的输入。
3.2。实验气体光谱识别结果
所有的计算进行Matlab R2016(数学作品,纳蒂克,妈,美国)。我们把12计算实验气体吸收光谱数据分成三组,每组和ICA分解进行了分离的光谱;组件识别结果分析的光谱分离。
图8显示三组的光谱分离。分离光谱恢复到原始波段位置。
(一)
(b)
(c)
分离光谱的识别是通过峰值搜索和比较分离光谱之间的相似性和标准光谱数据库。表1列出了四个实验气体的红外吸收特征与标准光谱数据库。
由于光谱可能产生漂移波数在实际测量过程中,有必要设置一个偏移量峰的峰值位置搜索。一般来说,波数漂移不会大于1厘米−1,因此,我们设置了峰值位置偏移量为1厘米−1。
表2分离光谱显示了峰值搜索的结果;峰值的位置得到最大价值的吸收带。通过排序吸收峰,前两个峰值的位置在表中列出。气体(或气体)光谱可能对应于由最强的峰的位置,歧视和sub-strong峰值是用来帮助这种歧视。
峰值搜索结果表明,大多数可能的气体可以被最强大的吸收峰的光谱分离,特别是一个吸收峰的光谱像C2H2和CH4。在第一组(b)的频谱分离,有两个吸收峰类似的振幅,相应的两种可能的气体。在这种情况下,光谱的比较准确的识别是必要的。
基于峰值搜索的结果,最终识别完成后通过分析可能的组件之间的相似性和相应的标准光谱。相关系数是衡量两个列向量之间的亲密程度和在这里用于光谱相似性歧视。相关系数r标准吸光度光谱之间的关系x和光谱y确认如下: 在哪里N在光谱数据点的数量,然后呢和的平均值吗x和y。−1≤r≤1可以得到定义。根据前面的研究(36),当两个光谱匹配良好r> 0.9。进一步的标准是光谱识别时所必需的r≤0.8。给出了相关系数的计算结果表3。
所有的值r大于0.8,这意味着分离光谱与标准光谱相匹配。最高的相关性观察与CH4,他的r值都大于0.98。与此同时,最低的相关性观察C2H5哦,其r的值在0.8259 - -0.9213的范围。这可能是因为CH的吸收带4不重叠的吸收带H2O和有限公司2,而C的吸收带2H5哦,是复杂的,其中部分重叠的吸收带H2啊,这是移除在分离之前。第一个谱图8 (b)有两个相应的气体根据峰值搜索和光谱可以通过计算确定这个光谱和标准光谱之间的相关系数的两种可能的气体。的r值是0.4126 CH4和0.8259 C2H5哦;因此,很容易判断频谱C强烈相关2H5哦。峰值搜索和相关系数计算结果表明,所有四个实验气体可以正确认识到在三组实验中,和混合气体光谱的鉴别率是100%。
从提供的数据,我们可以看到,分离结果不完全符合源光谱标准数据库,和分离光谱可能有多余的吸收峰与干扰气体有关。这可能是由于不完全切除H2O吸收波段。虽然多余的吸收峰存在,他们的振幅很小,因此,不影响识别结果。
3.3。实际大气光谱的识别结果
源的数量,也被称为独立的组件(ICs)的数量,需要评估在ICA分解。观测到的信号的数量,作为ICA的输入,应该等于或大于混合组件的实际数量;否则,ICA的结果会有误差。有许多研究如何评估化学混合物的组件数量(37- - - - - -39]。实际大气中存在组件的数量可以评价去噪光谱矩阵的奇异值分解,和组件的数量等于与奇异值的数量高于某个阈值。因为奇异比奇异值向量包含更多有用的信息,更准确的判断源数量通过奇异向量。因此,特定来源的大气光谱可以确定通过比较奇异向量分解后波形。图9是第一个八奇异向量获得大气光谱矩阵的奇异值分解;我们可以看到,前五个奇异向量有明显的波形,但从第六奇异向量,它们波动有点接近于零。根据奇异值分解的结果,大气光谱可以确定组件的数量是5。
(一)
(b)
(c)
(d)
(e)
(f)
(g)
(h)
我们选择10 12计算吸收光谱数据的光谱实际大气和10光谱分为两组;每组进行ICA分解得到分离光谱;图10显示两组的光谱分离。
(一)
(b)
因为具体实际大气中气体是未知的,组件识别的大气光谱可通过计算和比较分离光谱之间的相关系数和气体的光谱波段的吸收峰值2800厘米−1-3200厘米−1。气态污染物的测量网站主要是汽车尾气,所以我们比较常见的光谱与标准光谱分离挥发性有机化合物的仪器在汽车排气,并记录气体类型对应相关系数的最大值。表4列表识别分离光谱的结果。
根据识别的结果之间的相关系数分离光谱和标准光谱,可以得出结论,五个气体存在于大气中o二甲苯(C8H10),甲烷(CH4)、甲苯(C7H8),p二甲苯(C8H10),n己烷(C6H14),分别。与光谱仪的内置软件的分析结果,基于经典的最小二乘算法,所有的五个气体存在于大气光谱。同时,根据软件的分析结果,有大气中苯和苯乙烯的痕迹,并非由ICA分离。这样做的原因可能是两种气体的浓度在选定的光谱样本没有改变,所以两种气体的吸收峰是消除背景光谱消除过程中部门操作。
从分离的结果,我们可以看到,ICA算法可以独立的单一气体光谱严重重叠光谱;它可以将光谱集转换为独立的吸收峰。结果还表明,序列和振幅ICA算法获得的结果的不确定性。
3.4。ICA光谱分离的效率
总有6831的目标波段光谱数据点实验气体光谱,和实际的大气光谱的号码是830。表5列出迭代次数和光谱分离FastICA算法的运行时间。
表5显示了FastICA算法的运行效率。ICA分离的平均运行时间小于0.2秒,并有利于信号分离算法的应用与高实时在线监测的要求。分离光谱的识别结果表明ICA算法是一个了不起的工具在定性识别红外光谱光谱严重重叠的混合气体。它可以快速检索从复杂的多组分光谱定性信息。
虽然ICA算法具有良好的性能在源信号,提取分离信号扩展不确定因素。此外,气体的吸光度并不是它的浓度成正比。因此,建立一个定量光谱多元线性回归模型的获取各污染物的浓度信息的必要条件。常见的定量光谱方法包括部分最小二乘(PLS),经典最小二乘(CLS),逐步回归分析(SRA)和支持向量机(SVR)。
值得注意的是只有几个光谱样本需要完成整个识别过程的分离算法。相反,神经网络算法等其他识别方法CLS需要多个样本进行建模。因此,该方法是在实践中更适合当参考物质不可用或者是昂贵的。此外,光谱分离过程不依赖于现有的光谱数据库。当光谱光谱数据库中不包括分离,他们可能属于新物种。我们可以丰富光谱数据库通过添加新物种的光谱到现有的数据库。
实际大气光谱的识别结果表明,ICA方法可以有效地识别的气态污染物浓度测量光谱的变化。因为气体的光谱常数浓度的吸收峰将被消除背景光谱方法在这项研究中,我们需要关注背景光谱消去法,可以消除背景光谱,同时保留所有目标气体的信息在接下来的研究中,和选择合适的波段ICA分离可以减少光谱识别的难度。
4所示。结论
因为不同的气体红外光谱的吸收峰重叠广泛,传统的大气光谱快速检测方法有困难,准确区分特定的气体类型从重叠光谱监测大气气态污染物。在这项研究中,我们使用ICA算法的源信息恢复能力分离单一气体光谱严重重叠,多组分红外光谱谱。提出了一系列的方法应对光谱采集过程中产生的噪声和干扰,在实验室和实验获得的光谱与实际大气光谱验证混合光谱分离ICA算法的有效性。该方法可以提高识别速度和识别速度和丰富的光谱库相比,传统的气体光谱识别方法。整个分离过程只需要几个混合光谱样本,和它可以使大气光谱在线监测和其他线性系统分析具有高实时要求更简单、更有效。
数据可用性
使用的数据来支持本研究的发现可以从相应的作者。
的利益冲突
作者声明没有潜在的利益冲突与此相关的手稿。
确认
这项工作是国家重点支持的科学仪器和设备开发项目中国没有。2013 yq220643)和中国国家863项目(没有。5702014 aa06a503)。