自动辨别牛奶的地理起源Excitation-Emission荧光光谱法和化学计量学

文摘

介绍了自动歧视的地理起源的牛奶来自中国云南高原西部地区和东部excitation-emission荧光光谱法和化学计量学。真正的高原牛奶(从中国东部),牛奶()扫描的区域180 - 300吗?励磁和200 - 800 nm吗?海里排放。不同选项的数据分析研究和比较的性能在辨别牛奶不同的地理起源:(1)双向偏最小二乘判别分析(PLSDA)基于激发和发射光谱,分别;(2)双向PLSDA基于融合的激发和发射光谱;(3)三方基于excitation-emission PLSDA矩阵谱。双向PLSDA方法激发光谱、发射光谱、和正确的激发和发射光谱分类融合91.3%,88.6%,和95.3%的牛奶样品,分别;而总三方PLSDA精度96.0%。结果表明双向数据结合是充分的激发和发射光谱特征和识别高原牛奶。考虑模型的准确性和分析所需的时间,双向PLS-DA融合的激发和发射光谱建议作为一个可靠和快速的方法来区分高原牛奶从普通牛奶。

1。介绍

最近中国发生了一些粮食危机,其中的一个最严重的掺假牛奶三聚氰胺的产品(1]。假冒伪劣食品不仅仅是一种商业欺诈行为但也调用相当大的公共安全和利益的担忧。消费者越来越要求食品与环境友好的生产条件和/或保证产品质量从感官,营养,或安全的观点2]。

牛奶,等生产条件的地理区域或牛草喂养被赋予特定的感官和营养品质牛奶产品(3- - - - - -5),从而提供一个产品附加值并证明其更高的价格。在中国,主流的牛奶生产和原材料的来源都位于人口稠密的东部地区。牛奶产量在这些领域可能受到各种不利条件的影响,如潜在的快速工业化造成的环境问题,质量不确定性在购买和储存的原材料1]。相反,西部云南高原地区(约2000 ?米一个ltitude), located in the southwest of China, has a unique geographical position and a sparse population. The place also enjoys a temperate climate with plenty of rainfall and sunshine. All the above factors contribute to the high quality of plateau milks, including rich nutrition, particular flavor, and more reliable safety guarantee [5,6]。此外,牛奶在云南高原西部的产量远远低于中国东部;因此,吸引错误表示奶制品制造商的起源,并有必要开发快速、可靠的方法来歧视的牛奶的起源。

传统方法对歧视的食物来源取决于化学成分分析和感官分析。因为许多食品如牛奶是高度复杂的化学系统,全面的成本分析,化学成分通常是禁止的。此外,牛奶的质量通常不能充分描述的内容仅仅通过一个或几个组件。感官分析是一种expert-dependent技术和被认为是一个可靠的方法,食品认证的目的,但它受高成本的缺点,缺乏客观性。与传统方法相比,各种光谱法的组合(如近红外(7- - - - - -9和荧光光谱法10])和最优化方法为食品控制提供了有前途的替代方法(11]。在光谱分析中,复杂的化学样品可以通过测量多元光谱特征,然后使用多元统计方法提取有关食品质量信息。谱分析的优点包括:(1)不需要或更少的样品准备;(2)分析时间很大程度上减少了与传统方法相比,所以非常适合批量样品分析;(3)它是一种无损分析方法,可用于在线分析;(4)与化学计量学相结合时,它提供了一个食品控制的自动和快速分析方法。

在各种光谱技术,荧光光谱法是广泛使用在分析实验室,其高灵敏度一系列广泛的潜在的食品分析(分析物使其成为一个强大的工具10]。牛奶产品,不同的荧光乐队可以归因于不同的成分(荧光分析物如芳香族氨基酸,核酸,和色氨酸)和属性(例如,抗氧化活性和酸度)的样本。这种形式的基础荧光分析不同种类和来源的牛奶。随着最优化数据融合和多路技术的发展像平行因子分析(PARAFAC) [12和多路偏最小二乘(PLS)13),excitation-emission荧光光谱法已越来越多地应用于食品分析(11]。与传统的激发和发射荧光数据相比,excitation-emission矩阵数据不仅提供了更多的信息,也使更多的选项的数据融合和分析方法。

本文提出一种自动歧视的案例研究高原牛奶从普通牛奶的荧光光谱法和化学计量学。不同选项的数据融合和分析研究:(1)双向偏最小二乘判别分析(PLSDA) [14)基于传统的激发和发射光谱,分别,(2)双向PLSDA基于融合的激发和发射光谱和(3)三方PLSDA [11,13基于excitation-emission矩阵)的数据。目标是开发一种快速而可靠的分析方法来区分的高原牛奶牛奶生产在中国东部地区。以后的工作将更多细节。

2。实验和方法

2.1。准备的牛奶样品和荧光光谱分析

一组60纯粹和真实的西方云南高原地区的牛奶样本收集的国内市场。样品包括三个品牌,包括欧雅(20),Laisier(20)Butterflyspring(20)。从中国东部地区89个牛奶样品收集五个主流品牌蒙牛(20),伊利(20),光明(20),乳品饮料(17),Wangzai(12)。所有的牛奶样品是由巴氏灭菌技术和存储在阴凉黑暗区域之前谱分析。

荧光光谱测量mc - 960由上海Xianke荧光分光光度计仪器有限公司,有限公司试验实验演示了纯牛奶应该被稀释,以反映在激发光谱吸收特征。然后excitation-emission矩阵数据测量,没有进一步的除了一个稀释的牛奶样品预处理1 ?:?500年与蒸馏水。扫描激发和发射波长区域180 - 300吗?纳米(间隔5 ?海里)和200 - 800吗?n米(with an interval of 1?nm), respectively. Therefore, for each sample, a 25-by-601 excitation-emission matrix is obtained for each sample. A typical fluorescent matrix data set is shown in Figure1。

(一)

(b)

2.2。双向偏最小二乘判别分析(PLSDA)

如果每个样本所描述的一个向量,例如,多波长发射光谱测量的最大激发波长,可以获得一个矩阵(一个双向的数据集)包括波长变量样本。对于两种问题,样本包含两个不同的类。一个向量包含每个样本的类别变量一个元素,例如,上课1 A和1 b的目标是预测基于类的新样品和。上述问题可以通过双向PLSDA解决。

PLSDA分类方法是基于偏最小二乘(PLS)回归。化学计量学的关键方法,请已被广泛用于解决回归问题。请的目标是找到一组正交的潜在变量的线性组合变量和潜变量之间的协方差一些约束下最大化在哪里潜变量和的数量吗是权重向量的原始变量

上述目标函数可以通过拉格朗日乘子法来解决。在所有的潜变量计算,有关通过潜在的变量在哪里包含潜变量的列和包含相应的权重向量。回归系数最小二乘回归可以解决吗

然后,有关通过PLS回归系数作为在哪里是误差向量,因变量可以预测未知样品从相应的预测变量

PLSDA,而不是一组连续的值,包含一个二进制向量1和1(或1和0)表示类a和B,分别。新样本的预测值高于0意味着样本预测模型属于A类的,反之亦然。

2.3。三方PLSDA

在这里,简要介绍三方请将得到。如果每个样本是由一个矩阵描述,例如荧光excitation-emission光谱,可以获得一个立方矩阵为样品包括荧光强度扫描激发波长和发射波长。三方数据集如图2。

三方请是双向的扩展请解决三方数据。三方请最大化潜变量之间的协方差和。样本的得分在可以计算为在哪里和是权重向量为潜变量,是一个矩阵包含荧光excitation-emission数据样本吗。可以推导出权重向量展开立方矩阵和解决一个特征值问题13]。当潜变量三方请得到,三方PLSDA可以在执行(3)- (6)。

2.4。蒙特卡洛交叉验证(MCCV) [15,16]

判别模型的基于双向和三向偏最小二乘法,一个重要的问题是选择潜在变量的数量或确定模型的复杂性。包括太少的潜在变量将失去一些有用的信息在数据结构中,不能充分样本进行分类,而模型与太多的复杂性将包括class-uncorrelated数据方差和预测性能不好。因此,一个完善的交叉验证方法,MCCV [15,16),用于确定分类模型的复杂性。

MCCV最初提议,用来降低选择太多的风险请组件(15),然后修正模型误差估计(16]。由多个重采样和扣除一定比例的训练样本,MCCV已被证明是一种有效的方法来估计模型的复杂性(17]。与一个预定义的模型复杂性、MCCV的均方根误差(RMSEMCCV)可以计算在哪里和忽略时样品的重采样时间和大小,分别;和代表了引用和忽略时样本的预测值分别th重采样。请选择组件的数量得到RMSEMCCV值最低。忽略时样品的比例可以调整根据训练集的大小。

3所示。结果与讨论

消除基线,所有数据被减去光谱校正矩阵的蒸馏水。此外,减少计算负担,波长通道没有显著的信号与背景(水)的信号消除。双向方法,发射光谱和融合中演示了激发和发射光谱图3。选择激发和发射光谱的最大荧光强度。

让模型性能可靠的数据分析和比较,潜在的离群值必须被删除。与149年的牛奶样品,稳健的主成分分析18执行,没有检测到异常值。选择具有代表性的训练和测试样本进行模型构建和验证、Kennard和石头(KS)算法(19)用于将样本分为训练集和测试集代表。KS算法选择的训练样本集覆盖整个样本域基于他们互相距离(欧氏距离)。四个模型,KS算法进行双向融合数据,如图3(b)。因此,80个样本的训练集(40真正的高原牛奶+ 40 nonplateau牛奶)和一组测试的69个样本(20真正的高原牛奶+ 49 nonplateau牛奶)。

双向PLSDA模型开发与激发光谱、发射光谱,分别和融合的激发和发射光谱。三方PLSDA是建立在excitation-emission矩阵数据。考虑训练集的规模不是很大,所有的四个模型,MCCV 20百分点的忽略时用于确定样本的数量请组件和采样时间是100年。不同模型的结果列在表中1。


模型	双向PLSDA¹	双向PLSDA²	双向PLSDA³	三方PLSDA

模型的复杂性	4	4	5	5
分类错误的数量⁴	7/6	7/10	4/3	2/4
总准确率	91.3%	88.6%	95.3%	96.0%

¹双向PLSDA激发光谱,
²双向PLSDA发射光谱,
³双向PLSDA融合的激发和发射光谱,
⁴分类错误的样本训练/预测的数量。

从表1,双向PLSDA激发光谱和发射光谱的精度为91.3%(136/149)和88.6%(132/149),分别,这远不及其他两种方法。这可以部分解释为化学信息的不足由纯粹的激发和发射光谱,因为之间的差异不同的牛奶样品的激发和发射光谱是非常微妙的。另一方面,与数据融合和三方PLSDA双向PLSDA矩阵数据,请组件的数量都是5,这可以归因于信息中包含的数据的相似性。此外,两个模型的出错率为4.7%(7/149)和4.0%(6/149),分别表明双向PLSDA的性能与数据融合与三方PLSDA与矩阵的数据。双向的详细结果请与数据融合进一步如图4,分类错误的样本进行训练和预测的数字4和3,分别。从图4,双向PLSDA模型充分训练,没有发现过度拟合,因为同样的预测结果与训练的结果。

(一)

(b)

4所示。结论

为了实现自动识别真正的高原牛奶样品,excitation-emission荧光光谱测量矩阵,不同的数据分析和融合方法。结果表明,双向请与纯粹的激发和发射光谱不是很足够的牛奶样品进行分类,同时双向PLSDA融合的发射和激发光谱和三方PLSDA矩阵数据有效区分牛奶样品中不同的地理起源。

与三方PLSDA相比,双向请与数据融合一些优势。首先,充分excitation-emission荧光的测量矩阵是耗时的,特别是当样本容量较大或批处理的样品。相反的,一个是激发和发射光谱的测量更加方便。其次,在三方PLSDA有些常规使用复杂的数学工具,双向PLSDA是化学计量学的和易于使用的工具。因此,双向PLSDA发射和激发光谱数据融合的建议作为一种快速、可靠的方法进行身份验证的高原牛奶。我们未来的工作将集中在定量分析通过荧光光谱法和化学计量学的牛奶质量参数。

承认

这项工作是在自然科学基础研究计划支持的财务教育部门的河南(2008 a150001和2011 a430001号)。

引用

ACS,”中国婴儿食品危机的扩大,“2008年,http://www.nhlbi.nih.gov/meetings/workshops/cardiorenal-hf-hd.htm。视图:谷歌学术搜索
e·恩格尔,a . Ferlay a角et al .,“同位素和分子生物标志物的相关性验证的牛奶根据生产区域和类型的喂养的牛,”农业与食品化学杂志》上,55卷,不。22日,第9108 - 9099页,2007年。视图:出版商的网站|谷歌学术搜索
J.-B。Coulon, a . Delacroix-Buchet b·马丁和a . Pirisi“奶酪的反刍动物管理和感官特征之间的关系:一个评论,”牛奶,卷84,不。3、221 - 241年,2004页。视图:出版商的网站|谷歌学术搜索
b·马丁Verdier-Metz, s . Buchin c . Hurtaud J.-B。Coulon”,饲草和牧场的多样性的本质如何影响乳制品感官品质的牲畜产品?”动物科学,卷81,不。2、205 - 212年,2005页。视图:出版商的网站|谷歌学术搜索
a·卢卡斯,c . Agabriel b·马丁et al .,“牛”的条件之间的关系牛奶产量和营养成分的内容兴趣原料奶农舍奶酪,”牛奶,卷86,不。3、177 - 202年,2006页。视图:出版商的网站|谷歌学术搜索
m·a . De La葡萄酒和m . Juarez”乳制品真实性的评估。”食品科学与营养的关键评论,45卷,不。7 - 8,563 - 585年,2005页。视图:出版商的网站|谷歌学术搜索
a . Alishahi h . Farahmand、n -普列托和d . Cozzolino“转基因食品的标识使用近红外光谱学:复习一下,”Spectrochimica学报一,卷75,不。1、1 - 7,2010页。视图:出版商的网站|谷歌学术搜索
h, h, h .徐,y,“近红外光谱学/在线监测质量的食品和饮料:复习一下,”《食品工程,卷87,不。3、303 - 313年,2008页。视图:出版商的网站|谷歌学术搜索
d到墙边,g·唐尼,t·b·墨菲“基于模型的比较和回归分类技术应用于近红外光谱数据在食品认证的研究中,“化学计量学和智能实验室系统,卷89,不。2、102 - 115年,2007页。视图:出版商的网站|谷歌学术搜索
j . Sadecka和j . Tothova荧光光谱和化学计量学在食品分类系统审查,”捷克食品科学杂志》上,25卷,不。4、159 - 173年,2007页。视图:谷歌学术搜索
l . Munck l . Nørgaard s . b . Engelsen r .兄弟和c·a·安德森,“化学计量学在食品公民演示一个高度的可行性探索,归纳评价策略的基本科学意义,”化学计量学和智能实验室系统,44卷,不。1 - 2,31-60,1998页。视图:出版商的网站|谷歌学术搜索
PARAFAC r .兄弟。”教程和应用程序”,化学计量学和智能实验室系统,38卷,不。2、149 - 171年,1997页。视图:出版商的网站|谷歌学术搜索
多路校准r .兄弟。”多重线性请。”化学计量学杂志》,10卷,不。1,47 - 61、1996页。视图:谷歌学术搜索
m·巴克和w·Rayens”歧视的偏最小二乘化学计量学杂志》,17卷,不。3、166 - 173年,2003页。视图:出版商的网站|谷歌学术搜索
Q.-S。徐和Y.-Z。梁:“蒙特卡洛交叉验证,”化学计量学和智能实验室系统卷,56号1、1 - 11,2001页。视图:出版商的网站|谷歌学术搜索
Q.-S。徐,Y.-Z。梁和Y.-P。杜”,蒙特卡洛交叉验证选择模型和预测误差估计的多元校正,”化学计量学杂志》,18卷,不。2、112 - 120年,2004页。视图:出版商的网站|谷歌学术搜索
s . Gourvenec j·a·费尔南德斯Pierna d l .设计学院和d·n·拉特里奇,“波兰平滑的评价回归和蒙特卡洛交叉验证的决心请模型的复杂性,“化学计量学和智能实验室系统,卷68,不。1 - 2,41-51,2003页。视图:出版商的网站|谷歌学术搜索
m·休伯特·Rousseeuw和t . Verdonck“健壮的PCA对倾斜的数据及其例外地图,”计算统计和数据分析,53卷,不。6,2264 - 2274年,2009页。视图:出版商的网站|谷歌学术搜索
r . w . Kennard和l .石头,“计算机辅助设计的实验中,技术计量学,11卷,不。1,第148 - 137页,1969。视图:谷歌学术搜索

分析方法在化学杂志》上

文摘