文摘

提出了一种气体分类方法对于电子鼻子(电子鼻)系统,结合的特性,通过使用判别分析配置。首先,每个全局特征是从整个测量的数据中提取样本,而相同的过程应用于地方特色的部分对应于稳定,暴露,清洗阶段。个人特性的区别的信息数量然后测量基于判别分析,随后由选择和组合特性特性,有大量的歧视信息。关于各种挥发性有机化合物的数据,实验结果表明,在嘈杂的环境中,该方法展品分类性能相对优秀的相比其他类型的特性。

1。介绍

电子鼻子(电子鼻)是一个电子系统,它使用一个传感器分类指定的类型的气体(1- - - - - -4]。当它变得容易疲倦,人类的嗅觉功能不断不承认不同的气味,和因此有限类型的气味,它可以识别。相比之下,一个电子鼻可以不断监测气味,这个功能尤其有利于人类的有害气体的检测5,6]。对早期的电子鼻系统,量热传感器是用来表达测量气体值的形式一个颜色数组(7];此外,本系统需要完成许多复杂的分析,以及精密设备如气体色谱法系统分类或质谱相结合的复杂机器智能,从而限制了服务环境(8,9]。的现实的应用程序中,calorimetric-sensor-based系统,因此局限于特定的应用程序;然而,随着电化学传感器的发展(包括硬件和软件),电子系统变得更加智能和便携式10,11]。由于这些技术的发展,越来越多的电子鼻应用程序继续逐渐出现,包括医疗检查(12)、污染和气体泄漏搜索(13)、环保(14),和化妆品行业4,15,16]。

电子鼻系统由传感器阵列由多个频道和计算系统(2,17]。由于传感器阵列的每个通道都有不同的特点,它响应不同取决于气体的类型(类),和电子接口将传感器阵列响应转换成向量类型数值数据。计算系统的特性,可用于气体从转换中提取数据,和一个分类器是用来辨别气体类。传感器阵列的敏感性、特征提取和分类器的性能都是重要的因素在电子鼻系统的性能评估。

在多种类型的传感器阵列在电子系统中,使用导电聚合物复合材料,本质上导电聚合物,和金属氧化物通常用于检测物质的电导率传感器(6,16,18,19]。尽管聚合物复合材料传感器漂移等缺点,限制传感器的生活,和对温度或湿度的敏感性,他们的使用更加频繁与其他物质(20.因为相应的等优点广泛可用的polymetric材料、廉价的成本,在室温下稳定运行能力,较小的电力消耗。传感器测量主要包括以下三个阶段:稳定,暴露和清洗。每个传感器通道显示不同的反应取决于气体的类型,和每个阶段的反应被记录作为一个单独的向量(2,11]。

计算机系统使用多种模式识别技术来识别输入的数据类通过传感器阵列。气体分类过程可以分为以下两个阶段:提取有用的特征气体的分类和提取的使用特性来设计分类器。由于数据样本,通过电子系统的传感器阵列是高维数据,包括每个采样点的测量值为每个通道,可以使用各种不同的降维方法提高分类精度的程度和有效,同时减少数据处理(2,11,21,22]。主成分分析(23),一个典型的降维方法,执行分类预测数据样本的低维特征空间,允许最大分散的数据样本。LDA (24,25)是一种方法,主要用来寻找一个最优的线性判别函数,通常显示了一个更有效的性能比PCA当它应用于分类问题。LDA组成特征空间缩小分布在同一类和扩大之间的距离的不同的类通过使用训练数据的类信息。在[21,22),两个亚奥理事会CC-PCA变体和CC-CPCA被使用,分别在电子鼻系统。在[6,11],CLDA方法,用于开发LDA方法这样高的高维数据之间的相关性实现输入变量,用于气体进行分类。

上面的方法代表整个气样的测量值稳定阶段的净化阶段作为一个单独的向量,通过统计分析组成特征空间。然而传感器阵列的测量值,根据测量的每个部分都包含不同的信息,所以它可以有效的利用本地信息与全球信息。本文结合全球特征提取整个测量部分和当地特性提取每个当地部分因此用于气体分类分级机。为此,ReliefF方法(26)是用来评估个人的局部和全局特征而言,不仅每个特性分类的有效性气体还结合特性,用于电子系统的分类器,即只有这些功能筛选有用的分类信息。

该方法大大有利的特性在嘈杂的环境中,因为只有保持识别信息从各种各样的部分通过特征选择过程是筛选和使用,即使在数据测量过程中发生问题或者噪声和测量值。实验结果为各种挥发性有机化合物的类型(20.)确认提出的结合特性表现出良好的分类性能比较与其他特性获得的特征提取方法。

本文是由如下:部分2解释了判别特征提取方法,该方法可用于电子鼻系统,提出了一个方法配置的特性,基于判别分析相结合,即基本特征的识别,从整个测量中提取部分以及本地测量样品的部分;部分3介绍了气体分类实验结果;最后,部分4给出了结论。

2。建设天然气分类结合特性

2.1。气体测量

1电子鼻系统的原理图,本文中使用;此外,微型机械传感器阵列芯片被用于(20.)是用于气体测量。本文的传感器阵列由16通道是由通过(CB)聚合物复合传感器互相交叉电极,microheater,在每个通道和加工膜;在表1,16种CB聚合物复合材料。观察每个聚合物复合膜的电阻变化的化学气体组合,并记录每0.1秒和测量,持续200秒。整个测量部分可以分为以下三个部分:稳定(30秒),暴露(60秒),清洗(1100秒)。首先,如果一个电阻信号稳定后,传感器阵列放置在室,气体排放之前就介绍60秒的残余气体,在剩下的110秒通过系统性的流控制(27]。测量数据是存储在一个电脑使用DAQ6062E数据采集(采集)董事会和虚拟仪器(美国国家仪器)。一个分压器从−10 V V和16相同的放大器的增益设置为10,这大约是最大采集分辨率(20.]。

2.2。判别特征提取

那些适合分类的特征提取采用LDA方法,这也是一个典型的降维方法的分类,即气体通过传感器阵列的数据有关。当 维数据样本 属于其中的一个 类,LDA构成特征空间,减少了样品的散射在同一个班,同时进一步类之间的距离。为此,在课堂散射矩阵 和类间散布矩阵 首先定义如下(24]: 在哪里 指的是 属于类的示例 ; 是整个的数量和类样品,分别;和 示例意味着属于类 分别和整个样本。然后,LDA方法计算出投影矩阵 这是由投影向量( ) ,满足以下目标函数定义: 在哪里 年代满足 这是通过计算特征向量 (24]。在高维数据的情况下如气体数据(在这篇文章中, 然而,) 通常比的变大 ,这是对SSS(小样本大小)的问题(24), 变得奇异。作为一个方法来解决这个问题,PCA + LDA方法(25降低数据的维数 通过执行PCA方法开始前LDA方法。如果总散射矩阵 被定义为 的投影矩阵,PCA + LDA方法 ,在那里 。如果 投影向量的 选择根据投影向量之间的大型特征值由吗 ,气体数据样本 是表示为 维特征向量 由判别特性 的如下:

2.3。功能配置基于判别分析相结合

在拟议的方法中,当地的样品等 , , 首先通过分别分离测量值,只有对应唯一的稳定,曝光,和清洗部分从全球样品吗 包含所有的测量值。等基本特性集 ( , 4)有一个元素 然后由数量提取全局特征 和当地的特色 , , 使用(3)。测量每个基本特性的有用性的分类模式,ReliefF [26)方法,该方法是有效的在选择有用的特性认识到一个高维的脸图像像电子鼻数据(28),使用。ReliefF方法可以区分有益和有效nonuseful特性取决于每个特性可以分辨彼此附近的样本;为此,加权向量 这是定义每个特性的值。对于一个随机选择的 th样本( ),让 最近的样品在同一个班 ,让 从最近的样品在不同的类 在特征空间是“打击”( )和“小姐”( )[26),分别。如果 th特性 有不同的价值在这两个 、特性 分离 ,即使他们属于同一个类。这种情况下很难分辨,所以 th元素值的加权向量 减少了。另外,如果 是在 、特性 彻底分离 属于不同的类和增加的价值 。的初始值 设置为零,特性的加权值吗 更新与训练数据样本通过以下过程:(1)随机选择样本 (2)找到 (3)找到 年代 在课堂上, ,这是不同的 在类的 (4)考虑 / 在( )上述过程, 指类的先验概率 (26,29日]。

重复这个过程之后的所有训练数据样本 ,最终的联合特征向量( ),它将用于气体分类、组成特性 对应于大 。通过前面提到的过程,我们可以获得强劲的结合特性分类气体即使噪声生成气体的测量过程中,由于噪声部分不必要的信息删除,只有有用的特性选择从全局特征和局部特征的高度洞察力可用于分类的过程。该方法的整个流程是呈现在图2

3所示。实验的结果

3.1。实验条件

确保该方法是否有效地将气体在一个,电子鼻VOC-measurement的分类性能数据包括评估以下八个气体类型:丙酮、苯、环己烷、乙醇、庚烷、甲醇、丙醇,甲苯20.]。共有160个样本的实验中使用包含20对每种类型的气体收集样品。每个样本的测量值在2000年的时间点在200秒10 Hz每个通道的采样率。16通道的测量值被保存2000年的矩阵 前16大小词典排序操作符用于将其转换成一个32000维向量(6]。确定该方法的有效性,当噪声发生在传感数据,原始数据样本与高斯混合噪声标准差的2、3和4,性能评估(图3)。160年的样本数据的分类性能评估使用8倍交叉验证策略30.),即一个seed-value-based随机数发生器是用来把160个样本之前,他们被分为八个部分包含相同数量的样本。每组一个样本,共计16个样品,用作测试数据,剩下的140个样本作为训练数据。执行实验八次后以同样的方式,使所有的每个部分的数据样本作为测试数据,至少一次分类率计算的平均值作为最终结果。本文增加8倍交叉验证的可靠性统计方法,分类性能评估结果的平均值,通过执行过程获得8次反复使用的八个不同的随机种子数。所有的数据样本归一化与训练数据的平均值和标准偏差产生一个零均值和标准差。当PCA + LDA方法被用来提取判别功能,尺寸( )降低了主成分分析;PCA方法显著影响结果判别特征的分类性能。在这个实验中, (= 105)将占用 的全部特征值 据调查,不同的绩效评估 值。神经网络(最近邻)方法作为分类器 规范用于计算两个样本之间的距离(6]。

3.2。分类率评价

首先,地方特色的分类率( ),从三种类型的本地样本( )进行了比较。如图4,无噪声的原始数据显示多分类率高 在所有的当地特色。在数据4 (b)- - - - - -4 (d)当地的特点,传感器气体集中暴露部分显示一个相对良好的性能比其他部分;然而,随着噪声的所有地方特色的程度加剧,分类率迅速下降。图5显示了该组合特征的分类性能的比较( )、FF特性( )[2],PCA + LDA的全球特性( ),CC-PCA特性( )[21),CPCA特性( )[22]。主成分分析方法应用于 后再次CC-PCA和CC-CPCA方法进行。如图5(一个)每个方法,显示了良好的性能超过 在无噪声的数据;然而,随着噪声的程度越来越严重,而其他方法的分类性能迅速下降,该方法比维护 的分类率,即使有高斯噪声标准差4(数字5 (b)- - - - - -5 (d))。这维护级别是由于噪声的影响,直接反映在分类器的输入,当只使用全局特性或局部特性,然而,该方法,各种各样的判别功能通过使用全局特征结合各种地方特色。通过特征选择过程,只有特性影响较小的噪音和声音识别是有选择地作为分类器的输入,尽管相对受噪声污染的一些特性。通过使用该方法,在噪声的存在比其他方法更强劲,因此配置组合特征。

4所示。结论

气体在电子鼻数据测量,使用传感器系统可以分为几个阶段根据过程。传感器的响应在每个阶段都有不同的信息,从各种各样的特性分类可以提取。在这篇文章中,三种类型的局部特性提取的部分分为稳定,曝光,和清洗;这些功能被用于分类,合并后的特征与全球配置特征提取的整个部分。基于判别分析涉及个人全球特色和地方特色,只有这些功能选择大量的识别信息,即每个特性的识别评估为目的的选择;所选特征被用来构造组合特征。该方法不受限于一个特定的特征提取方法。它可以用于各种各样的功能和可以有效地利用每个特性的优点。的8种气体传感器阵列由测量数据的16通道,该方法显示出良好的分类性能;特别是,当噪声是传感过程中生成的,该方法显示的分类性能比其他方法更有效。 Given the capability to test for a variety of complex data, experiments that combine different types of features will be conducted in the future.

相互竞争的利益

作者宣称没有利益冲突。

确认

这项工作得到了韩国研究所的人力资源项目能源技术的能源技术评估和规划(KETEP)授予金融资源的贸易、工业和能源、韩国(没有。20154030200830),也支持的基础科学研究项目通过国家研究基金会(NRF)韩国科技部资助的ICT和未来规划(没有。2015 r1a1a1a05001065)。