文摘

近红外(NIR)光谱被记录为商业苹果果汁。分析这些光谱使用偏最小二乘(PLS)回归显示定量光谱之间的关系和质量,taste-related果汁的性质:含糖量(SSC),滴定酸度(TA)和可溶性固形物含量的比值可滴定酸度(SSC / TA)。各种光谱预处理方法被用于优化模型。最优光谱变量选择使用jack-knife-based方法和不同的变体间隔请(ipl)方法。模型旨在和评估的基础上确定系数(R2),交叉验证(RMSECV)的均方根误差,相对误差(RE)。SSC的最佳预测模型(R2= 0.881,RMSECV = 0.277°白利糖度,RE = 2.37%)得到的一阶导数预处理光谱和中间呈v形弯变量选择。助教(最优模型R2= 0.761,RMSECV = 0.239 g / L, RE = 4.55%)获得平滑的光谱范围6224 - 5350厘米−1。SSC / TA(最好的模型R2RMSECV = 0.113 = 0.843, RE = 5.04%)得到的光谱没有预处理的范围6224 - 5350厘米−1。目前的结果表明近红外光谱的潜力筛查的重要质量参数苹果果汁。

1。介绍

在过去的几年中,应用近红外(NIR)光谱结合化学计量学在不同领域已得到了广泛的接受,包括食品和农产品(1- - - - - -6]。

近红外光谱分析是基于电磁辐射的吸收范围12500 - 4000厘米−1(2,7]。近红外光谱包含广泛的重叠的乐队带来色彩和色调组合的基本振动涉及碳氢键,地和h化学键。这些债券是有机分子的主要结构组成;因此,近红外光谱的测量是非常有用的生物和有机系统,包括食物。由于丰富的化学信息提供的近红外光谱,它们允许同时测定几种成分和/或不同的样本属性(4,7]。

近红外光谱技术的主要优势之一是其无损性格和简单和快速测量。不同的计量模式使两液体和固体样品直接分析没有任何准备。由于它的优点,近红外光谱技术结合化学计量学提供了一种快速、有效和节约成本的替代常规的传统方法,高通量分析的食品。近红外光谱被用来评估两种食物的性质和浓度组件、过程监控也是一个行之有效的工具。

使用近红外光谱质量控制需要最优化的方法来提取有用信息的复杂产品的光谱研究[8]。实际应用通常需要发展多元校正,定义测量光谱之间的关系和感兴趣的化合物或财产的内容,通过各自的参考方法。多元回归方法是用于开发定量模型,用偏最小二乘(PLS)回归被使用最广泛的。很多因素影响性能的标定模型,其中一个重要的问题是一个合适的选择和应用最优化方法。收集到的光谱通常预处理来降低噪声,提高数学分析的信息。这提高了后续数据分析的结果,导致更好的校准模型(9]。回归分析可能会使用整个执行近红外光谱。然而,许多研究表明改进校准时选择的光谱区域开发的全光谱模型相比(10]。几种方法已经发展客观识别重要的变量(光谱区域),比传统方法更高效的基于样本的光谱性质的知识和/或分析的回归结果进行整个光谱(10,11]。

近红外光谱的应用程序的一个重要领域是水果和蔬菜的分析和产品的加工5,12- - - - - -14]。相当大的注意力一直致力于研究苹果的属性使用近红外光谱(12,15]。苹果很受欢迎因为他们愉快的味道和有益健康的影响,是一个有关饮食的植物化学物质来源,包括酚醛树脂(16]。

近红外光谱学已经成功地用于评估一系列完整的苹果质量属性,如可溶性固形物含量、可滴定酸度,糖含量,维生素C、总多酚、淀粉指数、叶绿素含量,坚定,绵软17- - - - - -19]。使用变量选择方法的可行性苹果质量等参数的测定含糖量也证明(17,20.,21]。

尽管大量的研究到目前为止使用近红外光谱评价属性的完整的苹果,发表论文的数量研究苹果汁相当有限。光谱在近红外光谱范围内被用来预测糖含量在苹果汁22),检测掺假(23],区分苹果果汁的基础上苹果品种(24]。启用的结合近红外光谱和荧光检测的质量恶化的苹果汁在存储和加热(25]。应用该方法测定苹果酒的质量参数也是近日报道(26]。

苹果汁的重要特征直接关系其质量是含糖量(SSC)和可滴定酸度(TA)。这些参数的限制销售苹果果汁是由实践的代码开发的欧洲果汁协会,它提供了参考欧盟市场上果汁质量的控制。SSC的主要特点之一是用于指示甜蜜的新鲜和加工过的水果产品(13]。可滴定酸度是有机酸相关内容;这些化合物有助于酸味和稳定颜色和延长保质期的新鲜水果及其加工产品。总体味道的水果更密切相关的比率SSC和助教比单个参数;因此,这一比率作为一个索引的感官可接受性的水果味道27]。

本研究的目的是测试的可行性发展中校准的近红外光谱预测模型的主要质量参数苹果果汁:SSC,助教和SSC / TA。我们还探讨了利用中间呈v形弯可能性优化模型变量选择、间隔的不同变体请变量选择、和预处理方法。

2。材料和方法

2.1。苹果果汁

苹果果汁市场上可用在本研究评估。样品包括清晰的和多云的果汁浓缩重组,直接巴氏杀菌的果汁,和鲜榨果汁。共有30果汁从15个不同的生产商进行了研究;所有这些样本在重复学习,使用两种不同的生产批次。

2.2。近红外光谱测量

分光光度计使用FT-NIR光谱(MPA;力量光学,Ettlingen,德国)。仪器性能验证测量之前,根据制造商的程序运行自动测试。光谱采集和仪器控制进行使用作品的软件(v . 5;力量光学,Ettlingen,德国)。光谱是在12500 - 4000厘米的范围−1的分辨率8厘米−1和64扫描coadded获得平均频谱。使用透光率进行了测量技术在比色皿的光学路径长2毫米。比色皿放入温控电池座,和测量进行了恒温35°C,由作品软件控制。离心后的光谱记录(5分钟15000 rpm),有六个复制光谱采集的果汁。

2.3。测定的化学参数

果汁的可溶性固形物含量(SSC)测定用阿贝折射仪(模型DR-A1 Conbest)在20°C,校准和蒸馏水。SSC表示为白利度(°白利),所有的测量进行了一式三份。

可滴定酸度(TA)用酸度计测定(S220 SevenCompact™;梅特勒-托利多),通过滴定25毫升果汁样品与pH值0.1 M氢氧化钠端点为8.1。苹果酸的结果表示为克每升的果汁(g / L)。这些测量进行了一式三份。

2.4。数据分析
2.4.1。回归方法

偏最小二乘(PLS)回归是用于建立近红外光谱(之间的校准模型X矩阵)和苹果汁的质量参数Y矩阵)。同时请方法模型X- - -Y同时矩阵,找到潜在的变量X最能预测潜在的变量Y(28]。我们所有三十汁样品用于开发和优化校准模型。中使用的平均光谱分析。

2.4.2。回归模型的验证

完整的分析(厕所)交叉验证应用于所有的回归模型。回归模型评估使用决定系数(R2),交叉验证的均方根误差(RMSECV)和相对误差(RE),计算的百分比比RMSECV平均值的研究参数的校准设置。最优的组件被选为最低数量的情节RMSECV的组件的数量。

2.4.3。光谱预处理

我们使用不同的预处理方法,以消除噪声、基线,从光谱和散射的影响。Savitzky-Golay平滑滤波宽度的15个数据点被用来消除光谱噪声,基线校正时使用基线偏移和第一和第二衍生品。涉及的基线偏移线性补偿减法,它改变了光谱以最小值设置为0。一阶导数通常是用来消除基线不断改变,和二阶导数也消除了基线斜率(9]。衍生品使用Savitzky-Golay算法来计算,与滤波器的宽度15的数据点。乘法散射校正(MSC)和标准正态变量(SNV)申请光散射效应的校正(9]。MSC估计加法和乘法散射效应的校正系数回归谱的修正参考光谱(9]。的平均频谱校正集被用作参考。SNV纠正的光谱,首先计算平均频谱,随后减去这意味着从频谱修正。然后,这个值除以标准差的光谱9]。每个单一光谱预处理使用方法和/或其组合:平滑和基线,平滑和SNV,平滑和MSC, MSC和一阶导数,MSC和二阶导数,SNV和一阶导数,SNV和二阶导数。应用的顺序不同的预处理方法是显示在前面的描述。

预处理是进行平均近红外光谱。请分析之前,所有的光谱mean-centred。

2.4.4。变量的选择

变量选择方法应用于这项工作包括中间呈v形弯方法和不同的变体间隔请(ipl) [29日]。

中间呈v形弯是一个方法用于计算的标准错误请回归模型的回归系数估计(30.]。然后回归系数除以他们估计标准误差,给t以及值用于测试模型中使用的变量的重要性(11]。这些计算进行了使用整理机v . 9.8软件(照片背面,挪威)。

ipl的方法将数据转换为不重叠的部分,获得本地请模型在每个部分中,为了确定最有用的变量范围。所有当地的模型之间的比较通常是基于RMSECV值,得到的验证(11]。最优数据范围可能发现通过减少或增加现有的试验范围,或通过删除或添加新变量(20.]。目前,我们使用的不同变体ipl方法在作品中实现软件优化变量的选择范围(31日]。

ipl (NIR)变体使用近红外光谱(12500 - 11263厘米−1和5349 - 4779厘米−1范围除外),分为五频率范围,每个对应于特定的吸收光谱。当地请模型测试的每一个选择范围在自己和所有可能的组合。这个过程伴随着协同区间请(SiPLS) [10]。

ipl (A)和ipl (B)变体使用整个NIR光谱(在12500 - 4000厘米−1范围,5349 - 4779厘米−1范围除外)分为十子范围。ipl(一)开始计算下先后排除所有的十子范围和附属的区域之一。这个过程一直持续到RMSECV值没有任何进一步的改善。这个过程伴随着向后ipl (BiPLS) [10]。

ipl (B)开始计算找到最优光谱范围与附属的区域之一。找到最好的子范围后,第二个附属的区域是补充道。后发现两个子范围的最佳组合,第三个附属的区域是补充道,等等。因此子范围的最佳组合是通过添加和除去进一步搜索子范围。这个过程伴随着向前ipl (FiPLS) [10]。

变量的选择进行不同的预处理光谱。算法在作品中实现软件可以自动寻找最优组合预处理方法的光谱范围基于RMSECV准则的最小值。5349 - 4779厘米−1光谱范围被排除在计算由于高吸光度值,明显超过仪器的实用范围。

最后,所有请模型的不同组合预处理方法和变量范围计算使用整理机v . 9.8(照片背面,挪威)。

3所示。结果与讨论

3.1。近红外光谱的苹果汁

三十苹果汁样品研究包括不同果汁类别市场上可用。他们包括果汁浓缩重组,明确和添加果肉,和直接的果汁、巴氏杀菌和鲜榨的。

1显示了苹果果汁收集到的近红外吸收光谱进行了研究。

非常相似的特征光谱模式中观察到的所有测量光谱,视觉上无法区分。一般来说,主要吸收带的位置正好与那些获得完整的苹果(32和其他果汁33]。

吸光度光谱是由水吸收,这是苹果果汁的主要成分。对水的吸收波段被报道在10309厘米−1(第二次泛音地伸展带),8403厘米−1(第一泛音的组合地拉伸和弯曲地乐队),6896厘米−1(第一泛音的地伸展带和一个乐队组合),5154厘米−1(组合地伸展带和地弯曲带),和4444厘米−1(12,13,34]。

的主要成分是糖和有机酸苹果果汁,除了水。最主要的糖苹果果实果糖、葡萄糖和蔗糖紧随其后。苹果酸是主要的有机酸中发现的苹果。苹果汁的其他组件包括多酚类化合物、维生素、氨基酸和一些(35]。所有这些部件应该有助于在不同的NIR光谱范围;然而,他们的乐队主要由占主导地位的抑制吸水。6896年吸收乐队在果汁,5587年,4413厘米−1是由蔗糖、果糖和葡萄糖(2]。事实上,葡萄糖的吸收光谱,果糖,和蔗糖在水非常相似的解决方案,与特征乐队在6301 - 6317,4716 - 4710,和4403 - 4397厘米−1(36]。

第一、第二、第三色彩的碳氢键伸展振动(CH组),分别在5550 - 6250厘米的范围内−1,8100 - 9100厘米−1,11000厘米−1。色彩的乐队带来哦,CH, CH2变形振动观测到低于5400厘米−1(13]。碳氢键的组合乐队糖和有机酸被报道在4323厘米−1(32]。

羧酸的吸收光谱特征出现在6222厘米−1从羧基(切断),8873厘米−1从羧酸(地),6959厘米−1(C = O从饱和和不饱和羧酸)(15]。

3.2。多元校正
3.2.1之上。化学特性的校准设置

所有的三十苹果汁作为校正集样本用于开发和优化校准模型。化学特性的校准设置包括平均值、范围、内容和标准差的可溶性固体(SSC),滴定酸度(TA)和SSC / TA比例展示在表1

研究苹果果汁的固体含量在11.0到13.6°白利糖度。平均可滴定酸度为5.25 g / L,范围从4.51 g / L为6.09 g / L。这些值范围内建立了苹果果汁的代码实践(37]。

SSC和TA的比率下降的狭窄范围1.84 - -2.71在所有的果汁,是关键参数确定水果产品的味道。

3.2.2。发展和优化校准模型

多元请回归用于近红外光谱之间的关系模型和果汁的性质(SSC,助教和SSC / TA)。不同的预处理方法和变量选择进行测试。预处理方法包括平滑、乘法散射校正(MSC),标准正态变量(SNV)和基线校正技术,而后者包括第一和第二光谱的基线偏移量和计算衍生品;单一的方法和他们的一些组合进行了测试。

最优为原始变量范围和不同的预处理光谱测定使用中间呈v形弯方法和三个ipl方法的变体。中间呈v形弯方法应用于请回归模型的回归系数获得整个NIR光谱分析。ipl模型开发十光谱子范围相同的宽度,或5子范围,选择包括特定的吸收光谱。这五个光谱间隔是11262 - 9407厘米−1,9406 - 7498厘米−1,7497 - 6225厘米−1,6224 - 5350厘米−1,4778 - 4000厘米−1。变量选择的想法是确定数据的一个子集产生最低的预测误差对感兴趣的参数。预处理和变量选择方法的不同组合进行评估,以便找到最佳的过程。我们比较这些局部模型的预测性能与全球全光谱模型。我们评估模型交叉验证的基础上,R2,RMSECV和价值(12]。

2提出了最优校准模型获得使用每个测试的变量选择方法的参数进行了研究。模型开发的特点,充分利用原始光谱也提出了比较。

最后,每个参数的研究,我们发现了一个组合预处理方法和光谱范围,这为模型提供了最好的预测性能。预测和衡量情节和这些模型的回归系数块的每个参数的最佳性能研究如图2

(1)SSC校准模型。中列出的参数表2具备良好的近红外光谱预测能力的SSC苹果果汁。事实上,SSC获得相对较好的模型分析整个NIR光谱没有任何预处理。预处理和变量选择提高了模型参数。因此,最好的SSC模型预测得到第一光谱导数和变量选择的中间呈v形弯方法;这些变量在图所示2(一个)。各自的模型的特点R2的再保险值0.881和2.37%。

ipl还导致模型的变量选择改进full-spectra模型相比。最优间隔选择使用ipl (NIR) 9406 - 7498厘米−1和6224 - 5350厘米−1,结合二阶导数预处理对模型与再保险的价值略高2.65%。最优间隔选择使用ipl (A)和ipl (B)是相同的(10109 - 8516厘米−1和6137 - 5334厘米−1),加上SNV和一阶导数光谱预处理给比另一个稍高的误差模型变量选择方法测试(RE = 2.77%)。

SSC模型的结果与文献数据比较;典型值的RMSEP完好的苹果是约0.5°白利甚至更高(1 - 1.5°白利),外部验证时使用水果执行测试集收集在不同的季节和果园12]。

(2)助教校准模型。校准模型和助教全程光谱范围使用原始数据显示较低的表现R2价值和高RMSECV(表2)。光谱预处理结合变量选择明显增加了这些模型的预测能力。然而,应该注意的是,即使是优化模型在相当低的特征R2值介于0.713和0.761之间。

助教的最佳模型预测得到的光谱范围选择的ipl (NIR)方法(6224 - 5350厘米−1为平滑的谱(图)2 (b))。该模型的特点R20.761和再保险的4.55%的价值。ipl的应用(A)和ipl (B)方法导致的选择更广泛的光谱范围比ipl (NIR)。除了6137 - 5334厘米的范围−1选择由ipl (A)和ipl (B)方法,10904 - 10106厘米−1和9314 - 7722厘米−1地区之间选择了ipl (A)和10109 - 8516厘米−1地区选择ipl (B)。模型与一个类似的预测能力的结合引起ipl (a)与平滑和SNV和ipl (B)平滑和MSC。这些模型有一个较低的预测能力比ipl (NIR)模型。模型与一个中间预测能力(4.80%)重新获得了平滑和SNV-corrected光谱分析的变量选择中间呈v形弯。

较低的预测能力获得助教模型相比SSC模型是按照文献数据。这个结果可以解释为低浓度的糖酸比12),和/或近红外光谱对酸的敏感性较低,由于每个分子的官能团数量较低。

(3)SSC / TA校准模型。SSC的回归分析/ TA原始光谱进行全程光谱范围的模型R2等于0.707和6.88%(表2)。同时,在这种情况下,请通过应用适当的组合模型显著提高光谱预处理和变量选择方法。性能优化模型SSC / TA预测中间的SSC和TA模型相比。

最好的模型为分析进行了光谱预处理,使用选择的变量ipl (NIR)方法,在6224 - 5350厘米−1(图2 (c))。该模型的特点是5.04%的再保险。稍微差性能是由所使用的模型光谱没有任何预处理和变量选择使用ipl (A)或ipl (B)方法的范围6137 - 5334厘米−1。平滑的结合使用中间呈v形弯方法和变量选择提供了一个模型与中间性能(R20.835和再保险的5.18%)。

总结、预处理和变量选择对模型性能的影响显著。ipl的两个变量方法,版本(A)和(B),每一个基于相同的十个间隔,选择相似的光谱范围和PLS模型提供了一个类似的性能。相反,使用间隔参数的研究,基于近红外光谱的化学知识的ipl (NIR)变体产生更好的执行模型相比ipl (A)或ipl (B),中间呈v形弯方法的应用使得选择变量,给模型的相似或更好的性能比ipl的方法。

iPLS-based模型与最佳性能的化学参数研究使用6224 - 5350厘米−1范围(或类似的6137 - 5334厘米−1范围),表明光谱波段包含化学参数研究存在重要信息在这个光谱区。TA和SSC / TA的模型只使用这个范围给好的校准结果,而SSC的校准模型需要额外的光谱范围。

4所示。结论

在目前的研究中,我们发展和优化校准模型的特征参数预测苹果果汁。我们表明NIR加上多元校正是一种适当的方法来确定参数,这是至关重要的质量评估(SSC和TA)和另外甜酸口味(SSC / TA)评估苹果果汁。光谱的数学预处理的最优组合和选择的变量范围必须单独为每个参数研究,发现导致显著改善模型的性能。客观变量选择方法的使用可能会加速模型优化的过程中,识别重要的化学信息的光谱范围。识别重要的光谱变量可能导致近红外光谱检测传感器的开发质量和sensory-related苹果果汁的性质。这样的应用程序需要进一步扩展研究样本集。

数据可用性

可用的数据要求(电子邮件保护)

的利益冲突

作者宣称没有利益冲突。

确认

格兰特2016/23 / B / NZ9/03591从美国国家科学中心、波兰。