文摘
估计食品产品的质量是至关重要的在确定食物的属性和有效性有关发酵等生产过程。本文考虑的质量评估标准条件下的小麦面包烤。感觉数据实时采集,获得数据分析使用有效数据分析预测产品的质量。获得的数据集包括300个面包样品准备在15天内的重要物理、化学和感觉到流变措施。读的措施是通过感官收集工具和数据集。获得的数据通常是原始,因此,所需的功能是通过降维使用线性判别分析(LDA)。处理数据和属性作为分类器的输入来获取最终的评估结果。有效的模糊加权关联向量机(FWRVM)分类器模型实现这一目标。提出了质量评估模型,使用MATLAB编程实现环境所需的设置FWRVM分类器。模型的训练和测试输入数据集与数据分析的步骤。 Some state-of-the-art classifiers are also implemented to compare the evaluated performance of the proposed model. The estimation accuracy is obtained by comparing the number of correctly detected bread classes with the wrongly classified breads. The results indicate that the proposed FWRVM-based classifier estimates the quality of the breads with 96.67% accuracy, 96.687% precision, 96.6% recall, and 96.6% F-measure within 8.96726 seconds processing time which is better than the compared Support vector machine (SVM), RVM, and Deep Neural Networks (DNN) classifiers.
1。介绍
提供优质食品是全球监管和食品生产商已经指向与建立过程有专门的实验室,确保质量和安全的食品1]。世界卫生组织(世卫组织)和世界贸易组织(WTO)提供了法规监督食品的生产和存储(2]。有许多组织在每个国家,确保食品的质量。主要的通用标准,分析了食品质量必须有足够坚持消费者的需求3]。面包是一种高度消耗食品在大多数国家。面包的烘焙行业被认为是一个重要的部分在食品行业。面包的质量取决于许多参数,最重要的是原材料和他们的准备4]。烘烤的时间和预计消费时间面包还取决于面包从原始产品的准备。然而,有时由于消费者需求,某些标准可能不是有效的。这导致面包质量的变化,导致消费者的不满5]。因此,烘焙面包行业正试图实现先进技术来平衡之间的权衡面包质量的消费者满足组织的利润(6]。同时,面包质量的提高可以避免浪费面包的联合国的一个主要的景象。
小麦面筋的数量和质量是至关重要的在确定面包质量(7]。另一个主要因素是水和水分在面团中,混合属性和密不可分的添加剂在决定面包质量(8]。面包制造商经常考虑更好的原材料来获取高质量的面包。但在这个现代世界,相当于原材料的可用性总是不放心。在这种情况下,制造商倾向于使用可用的原材料和生产最好的面包。在这种情况下,估计的面包成品在分析和reboosting面包质量至关重要9]。定义的面包质量也使用小麦基因组选择使用。尽管它是一个有效的过程,它是一个耗时的过程。因此,它建议只使用小麦材料的流变学。近年来,感觉工具用于分析和监控质量指标。面包的颜色和地壳被认为是检查质量。它被认为是一个重要的分析方法。然而,颜色和地壳面包可以根据各种不同的组件和外部因素,但仍提供足够的质量。然而,所有面包的质量分析是一个耗时的过程,需要很高的人力。因此,自动、高效的质量评估模型很大程度上需要提高面包的生产此类产品的质量。 Based on these suggestions, this study focuses on developing data analysis methods to estimate the bread quality.
利用数据挖掘和机器学习算法可以有效确定面包质量(10]。许多研究应用fuzzy-based算法来提高预测精度。Fuzzy-C-Means (FCM)聚类和自适应神经模糊推理系统(简称ANFIS)是两种最常见的和高效的fuzzy-based分类器。这些算法的集成深度学习算法(11)可以提高时间序列数据的预测精度通过深功能学习。类似的软聚类技术利用了作者(12,13)最近的研究对预测疾病的临床数据和更高的准确性和更少的复杂性。出于这些技术,本研究已开始模糊加权分类器的设计和开发预测小麦面包的质量。
本文设想这一目标,介绍了FWRVM分类器模型改善面包样品的质量评估。面包在实时收集的数据集预处理,LDA用于降低维数。然后,执行分类使用基于面包FWRVM特性获得好的和坏的面包。实验进行评估提出FWRVM模型和比较它与最先进的方法。本文的其余部分的结构相关的部分2。解释的面包质量评估部分3紧随其后的是部分的评估结果4。部分5总结这篇文章。
2。相关的工作
面包质量分析是最重要的研究课题之一,在食品行业。许多研究已经发展估计面包的质量。大多数研究采用物理方法来记录面包属性和分析它们的质量。最近,Adebayo-Oyetoro et al。14)采用物理方法评估制成的面包小麦和面粉发酵香蕉。Selivanov和Voronina15)开发了一个物理感官系统监控从小麦面粉面包的质量。Eshetu et al。16]介绍了近似composition-based面包质量分析埃塞俄比亚面包。这些方法非常实用,最有效的。然而,它是非常耗时,并且需要大量的劳动力。
自动分析模型已经开发使用机器学习算法对面包图片和面包数值数据集。Oury et al。17)提出了面包小麦质量评估使用表型信息和部分最小二乘(PLS)回归。Mutlu et al。18)开发的人工神经网络(ANN)基础面包质量预测与近红外光谱的帮助。尽管更便宜和有效的,这个模型的复杂性增加了时间消耗。Bouachra et al。19]介绍了面包小麦烘焙品质预测模型使用一个优化GlutoPeak-Test方法。这个测试方法提高面包质量估算的准确性,但它需要广泛的工具来执行这个操作。
古et al。20.)开发了一种预测模型来预测小麦面团的流变和化学性质使用深层神经网络(款),每一层都是训练有素的贪婪地使用限制玻耳兹曼机遏制网络。作者使用了一种新的算法,每一层调谐使用遏制,最后网络调整使用深层神经网络(款)估计面包面团质量。然而,这种方法很复杂,需要广泛的培训和测试产生的结果。Giefer et al。21)使用光学传感器和深度学习方法检测质量的面包面团。通过使用机器学习和super-ellipsoid模型拟合实例面团对象分割和参数估计方法是评估质量。然而,使用深度学习模型的复杂性大大降低了其使用对小排量车型。初级et al。22)提出了一种多目标面包小麦质量预测模型使用近红外光谱和机器学习算法。结果表明,拟议中的multitarget-based机器学习算法提供了更好的结果。Isleroglu和Beyhan23)提出了烘焙质量预测模型使用非线性多项式模型(PLN)和非线性人工神经网络(ANN)模型。这种方法改善了面包的烘烤质量,但在处理大样本这个模型有一定的局限性。从文献研究,可以明白物理方法耗时,需要大量的劳动力。建议包括自动的机器学习算法和有效的质量评估似乎有希望。因此,本研究提出了和发展了基于FWRVM质量评估模型。
3所示。方法
面包质量评估框架使用了模糊加权相关向量机。拟议的框架的工作模型如图1。这是利用。这些数据将预处理过滤噪声数据和数据集的结构稳定。维度是减少删除无关紧要用LDA和复制的数据样本。这些数据样本的特点然后美联储的分类器权重分配给他们,fuzzy-based分类执行产生的评估结果。
3.1。数据收集
面包烘焙面包实时评价数据收集从产业15天。15天,20个样品的面包每天都准备包含同等数量的好的和坏的面包。因此,共有300个面包样本准备,收集到的数据进行评估。面包形成材料是白色的面粉(250克)、糖(45克)、脂肪油(17.5 g),酵母在潮湿形式(8 g),盐(5克)、羟丙基methylcellulose-HPMC (3.75 g),脱脂牛奶powder-SMP(5克)和水(150 - 165毫升)。首先,面粉混合成分(糖、盐、酵母、HPMC和SMP)。然后,添加水和混合10分钟完成。然后,添加脂肪油和发酵是在24 - 28摄氏度120分钟完成的。面团是打2分钟,再次发酵20分钟。发酵后,面团是塑造成所需的形状,最后打样完成了20分钟30摄氏度。最后,烘焙执行在150摄氏度45分钟,depanned允许它在室温下冷却为60分钟。 This results in the required bread samples.
面包估计样本的属性制定通过传感器的特性分析中使用的行业。执行近似分析得到碳水化合物、蛋白质、粗纤维,脂肪含量,灰分和水分的面包。使用得分的感觉和统计分析测试和方差分析方差分析。地壳的感官属性,如颜色,瓤的颜色,质地,味道,香气估计1 - 3小时烘烤,确保新鲜的面包是免费的外部因素。从分析结果,总共9特性(属性或变量)使用。质量属性是含水量(%),温度(摄氏度),饲料率(g /分钟),麦芽、产品水分(%)、水平膨胀率,吸水指数、水溶性指数(%),体积密度(g / l)。其他功能、面粉、盐、酵母、原材料和其它因素。这些原材料不视为因素,因为他们被用在一个固定的数量。例如,小麦面粉,脂肪油,等在指定的数量和不同的使用在整个过程。类(好/坏)也用数据集表示。 A subset of the dataset is given in Table1。
完整的数据集包含150个好,150坏面包样品。300面包样品的总数据集分为训练和测试数据集。培训/测试比率设定为7:3,即。,70%训练样本和测试样本的30%。因此,210个样本用于训练,而90个样本用于测试。好/坏面包样品的数量的训练数据集是105,在测试数据集是45。这个输入数据集可能包含噪声或缺失值。因此,作为预防措施执行预处理。
3.2。预处理
在预处理步骤中,噪声去除和冠之缺失值是至关重要的任务执行改善面包的数据分析。嘈杂的数据形成中由于低级错误数据导致形成高度无关或不完全数据。随着面包收集数据集没有这样的错误,噪音的可能性非常低。因此,噪声去除是选择性利用。的 - - - - - -基于近邻的归责是用来解决缺失值问题,计算出缺失值作为其最近的邻居一个相关值值。因此,形成数据平衡和完美的降维与分类。
3.3。用LDA降维
大量的特性是一个比较有挑战性的问题在模式识别和机器学习技术的任务。降维是可行的解决方案,以实现更高的分类精度。高维特征的降维是表示在低维空间,即在数据集,减少的数量特征。面包数据集包含9个特性对其中一些可能不会提高准确分类由于高计算和时间复杂度。因此,减少执行降维特性和降低计算的复杂性。为实现这一专业目标,LDA (24]。LDA检测的线性特性,有更高的性能效率最大化类间样本分离和最小化在类分布。
考虑到训练数据集X N样本 和每一个样本被表示为一个列向量的长度 。训练样本可能属于的类之一 。让在课堂上表示样品的列表与 在课堂上代表样本的数量 。在类分布矩阵在LDA估计
同样,类间分布矩阵是由
在这里,的意思是数据集是由哪一个 和的意思是th类的 。
的线性变换 最大化类间方差的相关性在类方差,在哪里是 矩阵与ed所需数量的维度。在LDA降维,显示的列的最优估计综合特征向量,条件是 。这对应于最大的特征值的ed代表特征值。这种情况最常见的结果是也同时横向分布矩阵和 。这意味着LDA断开数据两类间的关系和在类。
LDA面包数据集的维数降低了删除数据集的低方差列。维度降低数据集只包含9相比高信息特征的输入数据集。含水量(%)、质量温度(摄氏度),饲料率(g /分钟),和容重LDA降维后的保留特性。表2显示了LDA降维后的数据集的子集。
3.4。模糊加权相关向量机分类器
最重要的一个统计学习方法的相关向量机基于贝叶斯学习模型和有效的内核函数。因此,它更适用于质量评估的任务。使用RVM-based分类模型的主要优点是适应性解决方案利用稀疏的模型,提高了概率预测不需要广泛的参数调整。FWRVM是一种改进模型的模糊隶属度向量的RVM用于最优权重向量的选择调整加权特性。不同样有效的所有特性,特性得到了LDA和权重值分配给提高FWRVM的分类。
面包的数据集,FWRVM模型来预测每个面包样本的后验概率。考虑到训练数据集, 与样品属于类 。由FWRVM采用统计分析和综合使用线性模型通过引入物流乙状结肠函数 估计的决定 。采用该函数和伯努利分布函数概率 对面包的概率样本,得到以下方程。
在这里, 。 表示FWRVM的适应性参数表示基于径向基函数(RBF)在FWRVM分类。采用RBF核函数的FWRVM主要是由于它的效率比其他内核功能分类。
在这里, 。
模糊隶属度函数获得了两个输入(培训和测试)的模拟数据集的饼图所示2。
采用模糊隶属向量后,最优权重向量是需要被发现。确定的值相当于找到最优权重,它最大化的可能性 。在这里, 表示的向量 hyperparameters。分析确定的权重是不合适的,封闭函数边际概率 或重量后验概率 是可以避免的。因此,权重是通过拉普拉斯近似的方法。
目前稳定的值 ,最好的可行的权重使用后的位置估计的方法。作为 是可行的,重量相当于这个条件的最大化:
在这里, 和 。
拉普拉斯近似是基于简单的高斯近似的log-posterior模式权重从情商。6),分化获得以下:
在这里,B是对角矩阵给出 和 。 表示 政策矩阵 和 和 。使用否定和反演Eq。(7),协方差矩阵 可以制定。
的hyperparameters可以通过迭代更新re-approximation函数。最初,随机估计,然后,估计 就完成了。在这里,表示协方差矩阵的对角组件。然后,是reapproximated
在这里, 。分配 reapproximating下一和将继续,直到收敛。
4所示。结果与讨论
FWRVM-based面包的性能评估数据质量评估数据集在MATLAB R2016b收集到的面包。FWRVM的性能与现有的算法相比,支持向量机(SVM) [26),区和深层神经网络(款)20.]。
4.1。支持向量机
支持向量机是最著名和精通分类算法。它被用在许多应用程序在不同的领域。然而,支持向量机的缺点限制其在预测模型中使用。支持向量机需要系数的错误选择降低了精度。支持向量机是一种歧视的分类器正式定义的分类超平面。鉴于标签的训练数据(监督学习),该算法输出的最优超平面分类数据样本到歹面包面包。在二维空间,这超平面是两部分的分界线飞机在每个类躺在两侧。
4.2。数位视讯
区也为相同的函数作为支持向量机的开发和遵循相同的结构。然而,它是基于贝叶斯算法和采用贝叶斯推理的功能来执行概率预测。这使得基于RVM更适合预测分类。
4.3。款
深度学习算法是最新的和改进的分类器。款基于安和先进的架构。这种深架构提高了款的学习速率,增加准确性。
4.4。性能比较
提出FWRVM的性能评估和比较与现有模型的精度,精度,还记得,F-measure,时间,和卡方统计数据。表3显示FWRVM的混淆矩阵测试数据与真阳性(TP),真阴性(TN),假阳性(FP),和假阴性(FN)。
从90年测试样品(45好45坏),FWRVM分类器正确估计87个样本。预测结果表明,该数据集有48个好的面包和42个坏面包。
FWRVM提出的性能评估的准确性、精密,记得,F-measure,处理时间,和卡方统计数据。这些参数计算使用以下方程。
百分比差异提出和现有方法对所有参数包括时间值可以计算使用以下方程。
在这里,和代表现有的和拟议的方法。公式选择这样较小的值总是从大的值减去无关的方法。当有高价值被认为是更好的方法,不同之处在于计算从该方法通过减去现有方法,反之亦然。
表4显示了性能结果FWRVM以及现有方法相比。
从上面的表中,可以看出该FWRVM相比具有较高的性能比其他方法的所有参数。FWRVM具有较高值的精度,精度,还记得,F-measure,卡方统计数据。表5显示了处理时间和培训/推理时间比较。
从表5,很明显,该模型具有更高的性能比现有模型包括深度学习款。FWRVM花了2.33秒较小的处理时间,较小的训练时间,0.9988秒和0.09秒小推理时间比基于SVM的分类器相同的面包数据分类。比较图也策划说明性能结果。
图3显示的精度评估建议FWRVM模型与当前模型。从比较,很明显,建议FWRVM比现有的模型具有较高的精度。FWRVM的精度0.96667,3.3%,8.9%,和16.6%大于款,区,分别和支持向量机模型。
图4显示的精度评价建议FWRVM反对现有的模型。FWRVM高精度的0.96875 2.7%,6.7%,和11.1%大于款,分别区和支持向量机模型。
图5显示了召回评估建议FWRVM与当前模型。结果表明,FWRVM比其他模型具有较高的召回。FWRVM召回0.96667,3.3%,8.9%,和16.6%大于款,区,分别和支持向量机模型。
图6说明了F-measure评估建议基于FWRVM面包质量评估现有的模型。情节结果表明FWRVM F-measure高为0.96663 3.3%,9.1%,和17.5%高于款,区,分别和支持向量机模型。
图7说明了处理时间评估建议FWRVM模型与当前模型。本研究的主要评价降低时间复杂度。从图,证明了提出的时间复杂度FWRVM大大降低。FWRVM消耗8.96726秒0.16秒,1.83秒和2.33秒不到款,区,分别和支持向量机模型。
图8说明了卡方统计的建议FWRVM-based面包质量评估对现有的模型。卡方统计数据说明了观察到的结果和预期的结果之间的关系。情节结果表明FWRVM高卡方统计值为78.75时这是非常高于现有的模型。这种增强的主要原因是使用模糊会员区和加权参数。这些改进能够显著提高面包质量FWRVM估计的性能。
5。结论
一个高效的面包质量评估模型开发本文使用FWRVM分类器。本研究致力于开发一个自动面包样品质量估计模型使用有效的机器学习算法。模糊逻辑来加权RVM的集成分类器提高了整体的精度。同时,LDA的使用降维增加了质量评估结果。评估数据集300面包样品说明提出的基于FWRVM模型实现了精度0.96667和8.96726秒的时间更少。这个结论提出面包质量评估模型具有更好的效率和更适合烘焙面包行业。在未来,包括更多的流变特性的可能性估计面包质量检查。同样,使用的可能性提出了其他食物FWRVM数据集将调查。
数据可用性
使用的数据来支持本研究的发现可以从相应的作者。
的利益冲突
作者宣称没有利益冲突。