文摘

三聚氰胺是一种含氮量较高的物质和被非法用于增加明显的食品如牛奶的蛋白质含量。因此,当务之急是开发敏感和可靠的分析方法来确定人类食品中三聚氰胺。目前的分析方法对三聚氰胺主要是chromatography-based方法,耗时和昂贵的,需要复杂的预处理和训练有素的技术人员。本文研究的可行性,利用近红外(NIR)光谱技术和化学计量学的识别和量化酒中含有三聚氰胺牛奶。总共有75个样本准备。不提供信息的变量elimination-partial最小平方(UVE-PLS)和偏最小squares-discriminant分析(PLS-DA)是用于构造定量和定性模型,分别。基于性能比标准的偏离(RPD) UVE-PLS与3组件模型导致了更好的解决方案。PLS-DA模型实现了100%的准确性和表现的最佳参考模型软独立建模的类类比(SIMCA)。这种方法可以作为一个潜在的工具快速检测牛奶中三聚氰胺的产品。

1。介绍

三聚氰胺或2 4 6-triamino-1 3 5-triazine是一种含氮量较高的化合物,已广泛应用于工业生产三聚氰胺甲醛树脂(1]。这种物质包含大量的氮,66.7%的质量,因此形成的驱动力掺假的牛奶三聚氰胺的产品获得高蛋白质含量读数。这也是因为传统凯氏或小仲马测试分析总氮含量的方法,没有确定其来源(2,3]。它使蛋白质含量的表象,而不是真正的蛋白质含量,因此无法区分氮的三聚氰胺和其他蛋白质。

尽管三聚氰胺并非天生就是一个致癌物质,但口服急性毒性较低(4]。大剂量摄入的三聚氰胺或慢性管理可以产生尿结石并急性肾功能衰竭,甚至导致死亡,尤其是在婴儿和儿童(5- - - - - -7]。口服摄入的三聚氰胺造成的毒性研究人类是不存在的。LD50,给定的化合物导致死亡的致死剂量测试动物的50%,是3.1克/公斤体重的三聚氰胺在老鼠8]。目前,美国食品和药物管理局(FDA)国家限制的三聚氰胺的牛奶不超过2.5 ppm (9]。严重掺假事件,2008年,也就是说,掺入三聚氰胺奶粉,公开在中国和许多其他国家10]。掺假产品导致肾脏疾病不同程度影响了约294000人,6人死亡(11]。这已经引起全球发病率三聚氰胺和食品安全的担忧。因此,发展快速、可靠的分析方法来确定人类食品中三聚氰胺是至关重要的。

这些事件后,各种方法已经开发领域的三聚氰胺的检测,包括气相色谱法(GC) (12),高效液相色谱法(HPLC) [13)、质谱(MS) (14),matrix-assisted激光解吸/电离飞行时间质谱、酶联免疫吸附剂测定(ELISA) [15)和毛细管电泳(CE) [16]。然而,消除强干扰组件矩阵,一般需要复杂的仪器和复杂的样品处理上述技术,严重阻碍了速度场分析。此外,这些方法也许需要训练有素的技术人员操作仪器。目前,分光光度法结合化学计量学似乎是一种有吸引力的方法,分析化学(17- - - - - -19]。一方面,光谱仪器中广泛使用普通分析实验室;他们也远远高于一般的技术,提供良好的准确度和精密度,并无损,样品制备相对简单的过程。另一方面,化学计量学可以帮助化学家解决复杂的化学计量学的选民通过引入计算机和统计技术20.,21]。特别是,拉曼、红外和近红外(NIR)光谱技术已经成功地用于掺假检测各种食品,如牛奶和蜂蜜。一些研究主要集中在奶粉中含有三聚氰胺的检测这些技术(22- - - - - -24]。牛奶中三聚氰胺相关预测的一个好的审查振动光谱学是可用的(25]。

在光谱方法,近红外光谱法具有明显的优势,因为它无损伤,需要最少的样品制备,并能产生响应。近红外光谱对应的吸收电磁辐射在780 - 2500海里(26- - - - - -28]。与近红外光谱定量和定性分析很大程度上依赖于回归/分类模型与微妙的光谱变化的某些成分浓度变化或歧视样本类别样本矩阵。模型的准确性和鲁棒性直接决定其适用性在大多数情况下。即使许多建模方法已经被开发出来,毫无疑问,最常用的多元技术仍偏最小二乘(PLS) (29日]。传统上,请被认为是基于潜变量和无需执行之前的变量选择。然而,越来越多的证据表明,变量选择仍然是非常重要和必要的吝啬的和健壮的模型(30.]。与许多其他的变量选择方法相比,不提供信息的变量elimination-PLS (UVE-PLS)是一种方法,变量选择请根据回归系数的分析,已广泛应用于光谱分析并提供了令人满意的结果。

在这项研究中,识别和量化的可行性酒中含有三聚氰胺牛奶的近红外光谱结合化学计量学研究。几个算法,请,UVE-PLS偏最小square-discriminant分析(PLS-DA),和柔软的独立建模的类类比(SIMCA),被用来构造定量和定性模型和最优结果。

2。材料和方法

2.1。材料和试剂

5-triazine-2三聚氰胺(1,3日,4日,6-triamine)(99%)从阿拉丁试剂有限公司购买和使用前未经纯化。雀巢奶粉从双城雀巢有限公司,从当地超市购买。它被证实是melamine-free。根据制造商提供的数据,蛋白质、脂肪和碳水化合物含量在奶粉23.2%,28.2%,和37%,分别。奶粉是用于制备白酒牛奶,然后掺假的三聚氰胺以提高蛋白质含量明显。总共有45个样品酒牛奶准备。每个获得的第一个30样品溶解15克100毫升去离子水的奶粉。这些样品有相同的蛋白质含量为3.48%,用于模拟纯酒含有三聚氰胺的纯粹的牛奶。其他15个样本是由第一次11克奶粉溶解在去离子水(蛋白% = 2.55%)获得100毫升白酒牛奶样品,然后添加0.01,0.03,0.05,0.07,0.09,0.11,0.13,0.15,0.17,0.19,0.21,0.23,0.25,0.27,0.29克的三聚氰胺。三聚氰胺浓度的范围是将从0.01%降至0.29%(即。0.1 - -2.9 g / L)。 Such an upper limit set is based on the consideration of the solubility of melamine in water (3.1 g/L at room temperature). In the market, the popular protein concentration of liquid milk is 3.0–3.5%; the adulteration of melamine is to improve the apparent protein content of liquid milk. Each 0.01 g melamine in 100 mL can only improve 0.04% of apparent protein content, below which it will lose driving force for counterfeiters. Apparent protein concentration of the adulterated samples varies from 2.59% to 3.76%. Each time, melamine was added to a milk sample independently so as to ensure appropriate variations in all samples. For constructing quantitative models of melamine, only later were 45 spectra used. Also, these samples with melamine concentration of 0.03%, 0.07%, 0.13%, 0.15%, 0.19%, 0.23%, and 0.27% constituted the test set. For constructing an identification/classification model, all samples/spectra were divided into the training/calibration set and the test set by alternative sampling.

2.2。仪器和测量

光谱收集每一个纯粹的样品在3光谱收集每个掺假的牛奶样品。为了测量环境条件的影响,相邻的测量时间间隔设置为20分钟。75 NIR光谱获得在傅里叶变换近红外光谱仪(美国热费希尔)配备一种特殊的光纤探针。收集过程是由结果控制软件的热费希尔。波数范围被设置为4000 - 10000厘米−1。每个谱平均32扫描以1557分的结果。只有489点在该地区的4000 - 5882厘米−1被用于建模。图1显示所有实验牛奶样品的近红外光谱。所有计算和建模进行了在MATLAB 7.0为Windows使用请工具箱。

2.3。偏最小二乘

偏最小二乘(PLS) (31日),作为一个典型的多元校正,通常用于光谱学,尤其是近红外光谱学,关联光谱数据( 与相关参考数据() )。它是基于潜在变量,因此可以处理所谓的共线的问题,但对于请的分解 指导下的变化吗 :解释之间的协方差 是最大化,这样的变化 直接关联 提取。请分解为变量的矩阵 和零均值的矩阵变量 的形式 在哪里 矩阵的谱数据; 得分矩阵; 可变荷载矩阵和 剩余矩阵; 响应矩阵; 得分矩阵; 载荷矩阵;和 剩余矩阵。的 代表信息删除后最噪音。根据它们之间的相关性,可以给出的线性回归模型 在哪里 在校准是回归向量待定。获得一个良好的估计 ,它可能需要收集一个跨度的变化的训练集 好,一般来说,代表未来的样本。从数学的角度来看,一个向量 意味着一个校准模型即使几个版本的实现请算法是可用的。

2.4。不提供信息的变量Elimination-PLS (UVE-PLS)

如今,在光谱中,许多研究人员利用请,因为它是一个基于全光谱的方法。然而,使用全光谱范围并不总是产生最优的结果,因为它可能包括变量包含噪音比相关信息模型。因此,消除高方差的变量,但小协方差与因变量,所谓不提供信息的变量,可能有利于改善模型。在此基础上,中心提出了一个算法称为不提供信息的变量elimination-partial最小二乘(UVE-PLS)算法(32]。与其他变量选择的算法相比,它是用户独立,因此不会引起任何配置问题。它由以下步骤组成:(1)使用leave-many-out过程谱矩阵 ( )确定最优模型的复杂性,RMSEP最低的标准。(2)建立一个矩阵( )人工变量相同的大小 ,兰德生成的命令。这些变量乘以常数(10−10),使他们明显小于不精确的仪器;这样一个操作保留变量的变化而使他们的影响最终的模型可以忽略不计。(3)相结合的 形成一个扩展矩阵变量的两倍 。由此产生的矩阵可以表示为 ( ), 第一列的 去年的那些 (4)建立PLS模型 根据分析过程。的复杂性,即潜变量的数量平方discriminan,设置一样 。这将导致 请模型,每个的系数向量 元素。它们都收集在一个矩阵 ( )。(5)计算可靠性因子( )为每一个变量的系数向量的平均值除以它的标准差。(6)设置截止极限一定比例( )最大的 人工变量和构造 由高的变量 而截止限制。这意味着所有人工变量和所有原始变量假定只包含噪声消除。(7)建筑最后请分析模型的交叉验证过程。

考虑到计算成本,列的数目 矩阵是固定在200年。

2.5。PLS-DA

请回归最初开发连续目标变量的预测。但这似乎是有用的分类问题中一个预计预测离散属性的值。通用名称是偏最小square-discriminant分析,也就是说,PLS-DA,常用在文献[33]。作为一种特殊形式的请建模、PLS-DA旨在找到变量和方向多元空间,这是已知的类数据集的歧视。如果只有两类分开,请使用一个哑变量模型,编码类成员如下:1 0 A类的成员和成员类b .回归判别模型的光谱数据( )对分配的哑变量( )。基于实验数据建立的模型,将未知样本分配给一个之前定义的类基于模式的测量功能。中设置的阈值模型,样本被认为是分类正确,如果预报值位于同一侧的分配值的中点。样本被确定为A类如果其预测价值低于阈值,B类如果其预测价值高于阈值。

2.6。SIMCA

SIMCA是一个流行的分类方法基于主成分分析(PCA) (34]。SIMCA,执行一个单独的PCA在每个类数据集,和一个足够数量的主成分保留(pc)占大多数的变化在每个类。电脑保留的数量为每个类通常是由交叉验证,为每个类模型可能是不同的。在SIMCA分类是由比较样本的剩余方差的平均剩余方差类。这种比较提供了一种直接测量样本的拟合优度为一个特定的类模型。SIMCA可以分类未知样本到类的概率很高。

2.7。统计评估

请和UVE-PLS的性能评估使用三个措施,也就是说,标准误差的预测(9月),确定系数 ,性能比标准偏离(RPD)。 可衡量的变化响应的比例可能归因于模型而不是随机误差也记录下来。RPD措施的参考标准偏差值的比值均方误差(RMSE)的预测。通常,RPD价值观分为四个水平的预测精度:RPD < 1.5意味着非常糟糕的模型/预测;1.5和2.0表明穷人之间RPD模型/预测;RPD在2.0和2.5之间表明好的模型/预测;和RPD > 2.5意味着很好/优秀的模型/预测(35]。

3所示。结果和讨论

3.1。光谱分析

即使光谱采集的4000 - 10000厘米−1,只有4000 - 5880厘米的光谱区−1被选来构造模型因为其他地区明显包含有用的信息。图2(一个)给的意思1 st-derivate NIR光谱掺假牛奶、纯/纯粹的牛奶,在该地区和三聚氰胺样品,在一个垂直转移是用来防止叠加;即频谱对应于三聚氰胺是下降了0.01个单位。我们可以看到在图1掺假,存在光谱差异和纯牛奶,但是差异太小,肉眼发现。此外,图2 (b)放大这种差异通过只显示一个小地区的4230 - 4340厘米−1,这表明差异仍然存在,可以用于定量和定性。丰富的三聚氰胺分子由NH债券,这些样本的关键光谱差异的范围4230 - 4340厘米−1主要来自北半球的组合模式与其他能源传输振动吸收。建立最优定量/定性模型,几种预处理方法包括1号衍生物和mean-centering和标准正态变量(SNV)尝试。结果,1 st-derivate光谱是构建最优量化模型,而原始的光谱,也就是说,没有任何预处理,是最佳的定性模型。

3.2。定量模型

基于原始的光谱,请和UVE-PLS方法被用来构建校准模型。获得一个健壮的模型、校准/训练集必须捕获可能的变化。至关重要的校准设置涵盖了三聚氰胺的浓度范围的预测。所以,如上所述,8组样本作为校正集和七组构成了测试集样本。通过这种方式,可以覆盖的测试集设计空间PLS-related校准设置。在应用程序的算法,通常知道潜在变量的数量(lv)是决定性的。最多15个lv进行了测试。选择最优的lv是基于交叉验证的最小均方误差(RMSECV)。图3显示了RMSECV情节的功能与潜变量的数量请和UVE-PLS模型。可以看到从图3,RMSECV减少首先初始lv和达到最低点,然后基本上仍是lv的增加。最优数量的lv似乎5和3请和UVE-PLS模型,分别利用以来超过这个数字并不能提高的结果。请模型相比,使用UVE-PLS模型原始变量产生lv越来越少,这意味着一个更加简洁的模型。事实上,可以解释为lv的PLS模型的复杂性。

根据上述UVE-PLS过程,稳定指数( )的所有变量进行了计算。图4显示的情节 为原始变量在该地区的4000 - 5882厘米−1和200年人工变量。虚线显示上下边界确定 。内变量对应于稳定边界将被淘汰,和稳定的变量的点线用于请建模。UVE的变量选择方法也集中在一个广泛的地区约5300厘米−1和三个狭窄区域的范围4000 - 4700厘米−1。保留变量的数量调查,因为它可能有影响请模型的稳定性和准确性。一般来说,当保留变量的数量太小,请模型的鲁棒性和准确性可能由于信息的损失变量的影响。相反,如果保留变量的数量太大,不提供信息的变量可能包含在模型中,使其性能差。在这项工作中,不同 价值观是未遂。作为一个结果, 被选中后,只保留89变量UVE过程。

5显示了实际的三聚氰胺浓度之间的关系,从PLS模型预测的散点图。同样,图6显示了UVE-PLS散点图模型。在这些情节,预测浓度根据实际的和点值绘制将落在对角线只有在模型预测浓度。如数据所示56训练集,没有明显的区别请和UVE-PLS模型从这些点对应训练集(表达的红色三角形)也有类似的分布在对角线。然而,测试集(表达的蓝色恒星),UVE-PLS模型优于全方位请模型。同样清楚的是数据56相同的模型能提供不同的预测相同的样品由于光谱多样性。表1总结了最优量化的性能比较请和UVE-PLS模型基于三个指标。很明显,UVE-PLS不仅可以压缩光谱数据在一个非常高的比例还提供优秀的模型/预测对应RPD = 6.23。

3.3。定性模型

构建PLS-DA模型识别/分类牛奶样品,所有75光谱被分成训练集和38个光谱和37个光谱的测试集。分类/识别目的,每个样本或频谱被分配一个类标签(1为纯粹的和2掺假牛奶三聚氰胺)。掺假的三聚氰胺的浓度为0.01 -0.29%和0.03% - -0.27%的训练集和测试集,分别。lv的数量在2 - 10的范围进行优化。发现变量的数量大于4时,所有的样本分类正确,如图7显示,暗示的敏感性100%,特异性100%。圆圈表示预测类标签,而点实际的标签来标示在图7。因此,校准PLS-DA模型可以被认为是可靠的和稳定的,因为它的性能对未来预计将样本与训练样本上的实现。为了证明PLS-DA的能力,柔软的独立建模的类类比(SIMCA)也使用和最优模型包含4个主成分。我们可以看到在图8掺假的浓度较低,存在四个样本并被错误地归类为纯样本训练集和测试集。最优SIMCA模式,即使特异性为100%,敏感性为82.6%和81.8%的训练集和测试集,分别。分类模型基于PLS-DA和近红外光谱法可以作为一个潜在的牛奶中三聚氰胺的方法识别产品。

4所示。结论

fast-screening方法对近红外光谱检测白酒中含有三聚氰胺牛奶。两个定量UVE-PLS模型和定性PLS-DA模型构造和显示令人满意的性能最优参考模型相比,也就是说,请和SIMCA。它可以作为一种很有前途的互补方案传统方法用更少的干扰和降低投资,可以适当应用于牛奶产品的现场质量控制。即便如此,降低检测极限,仍需要进一步的研究。

相互竞争的利益

作者宣称没有利益冲突有关的出版。

确认

作者感谢中国国家自然科学基金(批准号21375118),应用基础研究项目中国四川省科学技术厅(2013 jy0101),宜宾大学的创新研究和教学团队项目(Cx201104),中国四川省教育部科学研究基金会(13 zb0300),实验室开放基金的关键过程的分析和控制中国四川大学(2015006)支持这项工作。