文摘
研究测试如何烹饪过程可以改变水稻谷粒的尺寸。设置时间烹煮或蒸过程的影响等特征长度,宽度,和高度两个水稻品种,即长白色和速煮了。获得的测量维度的特征在不同时间的烹饪过程转化为功能数据。不同的多元功能数据分析方法,即功能多元方差分析,功能判别坐标,和聚类分析,发现两个品种之间的差异以及两种热处理方法。
1。介绍
1.1。背景
健康饮食的基础是各种产品的消费特点是高质量和低程度的处理,确保供应身体的必要营养([1]、[2])。大米是在产品越来越多地应用于各种各样的食物。国家的远东地区,水稻占在食品的等级对应的面包在欧洲文化(维基亚(3])。
大米是最广泛的全球规模的粮食生产。获得一些作物每年意味着它的流行的国家的气候适合种植在不断地成长。由粮农组织的图表显示了世界生产的数量在1994 - 2019年呈现在图1。有一个连续的每公顷产量和生产率的上升趋势。在过去的十年里,世界水稻产量增加了不到15%。水稻生产主要集中在亚洲,超过90%的作物从何而来,和无与伦比的领导人在中国生产http://www.fao.org/faostat/en/数据/ QC /可视化)。
增加农业生产的食品总是由给定产品的消费量的增加。大米、消费增加了约17%在过去十年(2010 - 2020)。
烹饪是最重要的单元操作进行准备的食物消费。它涉及的传热传质在这几个组件的烹饪材料发生相变([4])。而烹饪米饭,最重要的变化发生的粘淀粉由于气温升高和湿度增加。淀粉的凝胶化造成的破坏分子间的氢键增加其吸水([5])。
磁共振成像允许表征的变化发生在热量和水分分布而烹饪米粒在水里。已经表明,生成的三维图像显示热量和质量分布在谷物煮5-32分钟表明一个更深入进步烹饪过程裂缝和微孔隙([6]、[7])。详细研究温度和含水量分布在烹饪的米饭内核进行栽培稻金银花对简历。Nipponbare使用核磁共振。观察,含水量的增加从烹饪的开始到12分钟是由于自由水的吸收的谷物,而含水量的减少15 - 25分钟后的进步上胶是由淀粉([8]、[9])。
研究烹饪和多余的水分的影响在不同的温度下(80、100、120、140°C)和压力(0,0.1,0.3,和0.5 MPa)的结构和形态属性芬芳的茉莉花大米谷物泰国品种KDML 105显示全糊化大米煮熟在80、100、120和140°C 22日14日8日和6分钟的烹饪。烹调过程中温度和压力的增加伴随着柔软和孔隙度的增加,由于更多的空间的形成复杂的内部层的谷物淀粉矩阵。与温度相反,更高的压力降低了孔隙度的外层煮熟的谷物([10]、[11])。
根据物种,大米的特点是多样化的直链淀粉含量(15 - 27%),这是与谷物的长度有关。长品种直链淀粉含量最高,和这个内容是指出减少减少粮食长度。高直链淀粉含量会延长烹饪时间、增加的吸水程度的烹饪原料([12]、[13])。米粒包含一个更高层次的直链淀粉显示大小,增加更明显更大的凝聚力,烹饪后硬度相比low-amylose品种([14]、[15])。Low-amylose水平与水稻谷粒的软结构有关,与烹饪时间([直链淀粉降解过程16]、[17])。
煮熟的米粒的质量是由水吸收的程度和体积变化的程度。这些参数都直接影响营养和口感特性影响消费者的可接受性([18]、[19])。
现代方法应用于烹饪大米主要用沸水,过热蒸汽和微波。达到相应程度的烹饪,有必要定义的参数基于最佳煮熟的谷物将确定。分析行列式的烹饪的大米淀粉的粘性程度它包含。实现粘合,除了正确的温度,需要适量的水,将吸收膨胀淀粉。米粒的最强烈的吸水发生在最初的烹饪阶段和减慢20分钟后的烹饪([20.]、[21])。据报道,最佳煮好的米饭淀粉20分钟后显示,90%粘的烹饪和多余的水([22]、[23]、[24])。获得最好的煮熟的米饭,质量应该是烹饪后立即冷却。冷却后的大米做饭和多余的水已被证明改善大米的质量,但它大大扩展技术操作时间([12]、[25]、[13])。
食品工业的远东地区(中国、日本和泰国),自动行做饭饭有能力高达600公斤/小时(http://satake-group.com,http://www.diytrade.com)。这些线使用系统的容器部分大米是用一组正确的水。烹饪是通过提供大米和水的混合物与热气体或电加热或微波场的影响下(http://www.made-in-china.com,http://www.acesystem.co.jp)。对于高科技的电饭煲,热提供使用几种方法在一个单位(http://www.aiho.co.jp)。等有效的操作设备,有必要从个人获得数据给大米和水的容器([26),http://www.daneng.com.sg)。由于经济原因,大米煮的最常用方法是多余的水做饭。通过这种方式,在一个相对短的时间内得到一个产品以适当的工艺参数;然而,观察个人粒大米煮熟以这样一种方式,我们可以看到大量的赔偿和变形引起的快速软化颗粒接触到水和温度。个体结构的谷物被摧毁和获得的质量具有非常高的可消化性。米粒的治疗与水汽在大气压力是一个微创的方法。在这种方法中,淀粉粒膨胀慢得多,这样全谷物不分解([27];(26];(28])。定义相关的特征维度的变化谷物的水稻品种是设计的一个重要方面假设烹调新设备的米粒在连续系统中,将执行的烹饪过程流(http://www.daneng.com.sg,http://n.leying.cn)((29日])。
1.2。发现
在这项研究中,我们考虑两个水稻品种:长白色和速煮。这些品种的谷物蒸或煮水,因此,我们有四个水稻研究团体。谷物在这些群体的特点是三个参数:长度,宽度和高度。这些特性测量之前烹饪和之后5,10、15、20、25日和30分钟的烹饪,分别导致时间序列数据。这些系列转化为连续函数的时间的时间间隔 。处理过的数据被称为功能数据([30.])。
研究问题如下:均匀的子组可以区别米粒的四组中所描述的功能数据?在这项工作中,我们提出一个研究方法,使我们能够回答这个问题。讨论了统计方法是通用的,可以用于研究对象以多维功能数据组,不仅不同水稻品种的谷物。目前,对于功能正在开发的数据统计方法,因为功能数据有许多有用的特性。
有许多理由模型时间序列作为一个连续函数(元素的某些功能空间),其中一个是功能数据更有优势比其他的时间序列表示方法。特别是,多元函数判别坐标分析(MFDCA)派生在目前的研究有以下统计优势。
首先,功能数据通常被用来应对缺失观测的问题,这是不可避免的在许多领域的应用研究。不幸的是,大多数方法与数据分析需要一个完整的时间序列。消除时间序列从一个数据集只是缺少观察的一个流行的解决方案,但这可能导致,而且在大多数情况下,严重的数据丢失。另一种可能性是使用的许多方法之一缺失的数据预测,但是在这种情况下,结果将取决于插值方法。这些方法相反,在功能数据的情况下,缺少观测的问题是通过表达时间序列的形式来解决连续函数集。
其次,MFDCA统计的发展,观察自然的结构保持使用功能的数据时,即时间保持联系和考虑任何测量信息。因此,结果的鲁棒性。
第三,观察的时候不必等距的在一个特定的时间序列,可以在线应用程序的一个主要优势。
第四,使用功能数据时,可以避免维度的问题。当时间点的总数,观察的,超过了时间序列数据的数量,大多数统计方法不提供令人满意的结果由于误导错误的估计。然而,这个问题是可以避免的功能数据,因为时间序列函数,取而代之的是一组连续的代表是独立的时间点观察。
1.3。结果和目的
统计方法包括四个步骤。在第一步中,我们将原始时间序列数据转换为功能数据。在第二步中,我们使用功能多元方差分析(FMANOVA),验证该假设没有差异意味着函数的向量代表的四个研究小组。后拒绝这一假说,在下一步中,我们构建功能判别坐标,使我们能够想象这四个研究团体的相对位置如何看起来像在飞机上。在最后一步中,确认均匀子组的存在,我们使用聚类分析的基础上,建设一个树突(最小生成树)连接的研究团体。
本文的主要目的是找出水稻品种之间的相同点与不同点在烹饪过程使用功能数据分析的统计方法。
本文组织如下。部分2描述了材料,介绍了统计方法的研究。部分3包含结果和讨论。最后,部分4提供了一个研究进行总结。
2。材料和方法
2.1。实验项目的概述图
这项研究是按照开发计划进行的调查呈现在图2。两种类型的大米。,parboiled and long-grain white, were used in the study. The selection criteria applied for the study material were as follows: high quality, high degree of size and color uniformity, and the lowest percentage of impurities. The parboiled rice was produced by Müller’s Mühle GmbH, and the long-grain white rice was purchased from Sawexs. The materials used in the study were qualified as class I products. No signs of infestation with microorganisms or pests were detected in the rice, and it was not pretreated to shorten the cooking time.
2.2。样本收集和准备
采10粒每个样本的学习材料描述内核大小的变化造成的进步在各种条件下烹饪过程。谷物的极限尺寸进行测量,然后大米煮5、10、15、20、25、30分钟多余的水或水蒸气气氛在大气压力(约1020 hPa)。烹饪后,谷物冷却空气流在15°C,和主要尺寸测量。尺寸参数测量使用奥林巴斯BX61自动显微镜加上PC, DP12相机和奥林巴斯DP软软件(所有设备的详细参数都可以在制造商的网站https://www.olympus-lifescience.com)。使用光学软件支撑允许精确的非接触测量方法测量高粘度的元素和微妙的一致性。极端点之间的距离确定稻谷或其横截面的精度0.001毫米以下使用奥林巴斯UIS2-Series生物客观镜头:“10 x U计划0.30 FL n - NA”和“20 x U计划0.50 FL n - NA。“极端的尺寸是由图像分析程序“DP软。”
2.3。统计方法
2.3.1。功能数据
我们假设被分类的对象的描述 - - - - - -维随机过程 ,在哪里是精确性的希尔伯特空间功能,代表一个换位的 ,和是一个区间 , 。希耳伯特空间配备以下内积:
此外,我们假设th组件的向量可以表示为一个有限数量的标准正交基函数 : 在哪里 是未知系数。
让 和 在哪里 , 。
使用上面的矩阵表示法,过程可以表示如下:
这表明的实现过程在有限维子空间的 。
我们可以估计向量从独立的实现 的随机过程(功能数据),我们表示这个估计量 。
通常,数据被记录在离散时刻。让表示一个观测值的特性 , 在个时间点 ,在哪里 。然后,我们的数据的双 。这些可以平滑离散数据连续函数 ,和是一个紧集,这样 ,为 。
离散数据转换为功能的过程数据所描述的拉姆齐和西尔弗曼30.)和Gorecki et al。31日]。
2.3.2。功能多元方差分析
MANOVA功能数据,我们的测试向量的平等意味着函数人群。让 , 是从这些人口组成的独立样本 - - - - - -维与平均向量随机过程 。让 总样本大小。因此,在FMANOVA,我们验证以下零假设: 对备择假设 ,这是它的否定。对于这个统计假设检验的问题,我们将使用基于基函数表示形式排列测试和测试基于随机预测Gorecki和Smaga[提出的32,33]。实现它们的R包fdANOVA ([33])。
基于基函数表示形式排列测试使用的表示组件中引入部分2.3。1,即,我们有 在哪里 , , 和 , , , 。
让 在哪里 和 总样本均值函数和样本均值函数,分别。然后,类似于MANOVA ([34]),下面的矩阵被用来构造测试统计数据(5):
使用(6),我们得到 和 ,在哪里
因此,矩阵和只表示系数表达的基础。以下测试数据(5)构建基于这些出现在古典MANOVA:(1)威尔λ (2)Lawley-Hotelling跟踪 (3)皮拉伊跟踪 (4)罗伊最大根 在哪里是一个矩阵的最大特征值 。构建基于这些测试数据,我们使用排列方法。因此,我们有四个排列测试根据基函数表示。傅里叶基础和1000排列计算中使用的样本。
现在,让我们关注测试基于随机预测。假设是一个高斯分布 ,和它的每一维预测非简并。假设 ,在哪里以下组件: , , 。如果零假设(5)是真的,然后为每一个 ,这是适用的: 另一方面,当不是真的,对吗几乎每一个 , 失败。因此,测试MANOVA问题可以应用于分析FMANOVA问题通过使用以下测试过程:(1)选择的数量预测 (2)选择,与高斯分布函数 , , (3)计算预测 为 , , , 。(4)为每一个 ,应用选择MANOVA测试向量 , , 。让 表示结果值(5)计算下面的最后值(5) 在哪里 是命令步骤4中获得的值。
第四步,我们使用上述MANOVA测试,即。,威尔λtest, the Lawley-Hotelling trace test, the Pillai trace test, and the Roy maximum root test. We denote them as Wp, LHp, Pp, and Rp tests, respectively. We also consider their permutation versions as well as different Gaussian distributions ,即。,the Gaussian white noise and the Brownian motion. The number of random projections was set to ,建议在文献[32,35]。
2.3.3。功能判别协调分析
让我们考虑这样一种情况样本来自的地方组。我们常常喜欢图形化呈现它们,看到它们的配置,或消除边远的观察。然而,它可能很难产生这样一个演讲,即使只有三个特性。判别的空间坐标是方便使用各种分类方法判别分析(方法)。
我们的目的是构建一个基于多元判别协调功能数据: 这样他们的类间方差最大与总方差相比, 。更准确地说,第一个功能判别坐标 定义如下: 受到以下限制: 在哪里 和 分别是类间方差和总方差的判别协调 。条件(15)确保第一个判别坐标的独特性 。
现在,让我们假设的过程和向量加权函数可以表示如下: 在哪里 , , ,和 。
因此,类间方差的内积 如下: 和总方差如下: 在哪里 和 分别是平方和的矩阵和产品类间方差和总方差。第一功能判别过程的协调 ,我们有 在哪里
同样,我们可以构造th功能判别坐标: 向量加权函数在哪里定义如下: 受到以下限制: 在哪里 , 。表达式 将被称为判别系统的过程 。
现在让我们定义经典判别随机向量的坐标 。的这个向量的判别组成部分满足 受到以下限制:
这一对 将被称为随机向量的判别系统 。
我们可以扩展这些考虑第二判别系统等等。因此,下面的定理是正确的。
定理1。的th判别系统 的随机过程有关th判别系统 随机向量的通过 在哪里 , 。
在给定的时间点 ,更大的组件的绝对值向量加权函数,贡献越大在给定的结构功能判别坐标,从流程相应的组件。原始的总贡献一个特定的过程在一个特定的结构功能判别坐标等于模块下的面积加权函数对应于这个过程。
在实践中,矩阵和是未知的,必须根据样本估计。让 是一个样本属于th类, 。这个函数有以下形式:
让
然后,我们有 在哪里 。
接下来,我们发现非零特征值 和相应的特征向量 矩阵的 ,在哪里 。此外,判别系统的随机过程有以下形式:
因此,系数的投影th实现过程的属于th类的功能判别坐标是相等的 为 。
的情节对 允许可视化组织在二维空间的相对位置。因为配置获得被认为是最佳的组间的歧视,宽应该被视作一个信号重叠的涉及任何或小群体之间的差异。
2.3.4。基于最小生成树的聚类分析
在这里,我们简要讨论基于最小生成树的聚类分析方法。根据图论,树突树的同义词。树突或树图(每两个顶点相连的路径),不包含周期。最低树突是一个边的权重之和最小。最常见的重量是距离。树突的建设被一群Wrocław数学家([36])。两个非常简单的程序是用来构造一个最小的树突。第一个是克鲁斯卡尔算法:(1)选择边缘的最短长度(2)从剩下的边缘,选择最短的长度并不导致循环(选择任何连接的长度)(3)重复前面的步骤以完成建设的最小的树突
第二个是拘谨的算法从树组成的一个顶点,不断添加树的最短边。
最短的树突可用于聚类分析。这种方法背后的理念是删除从最低树突边缘,它的长度大于临界值 。我们计算出平均值和标准偏差从所有边的长度最短的树突和假设 。保持联系的顶点,最小的树突形成一个集群。
3所示。研究和讨论
在这项研究中,我们考虑水稻谷粒的四组:(1)长白色(蒸)(2)长白色(沸腾)(3)速煮(蒸)(4)速煮(沸腾)
在第一步中,原始数据,记录在时间序列的形式,变成了连续函数(使用方法所描述的拉姆齐和西尔弗曼30.)和Gorecki et al。31日])。我们认为这些函数在区间 因为7个时间点(之前烹饪和之后5、10、15、20、25、30分钟的烹饪),的值观察米粒的三个特征,即。长度,宽度,高度,躺在这个范围内。这个转换使用前五傅立叶基函数的形式 在哪里 , 。
图3数据显示了连续函数(功能)获得了水稻标记平均函数的四组每组。图3还表明,相比最大的区别特征的组观察到20 - 25分钟后热处理,但是最小的差异在5 - 10分钟后观察。
(一)
(b)
在第二步中,我们测试了一般零假设(5)的平等意味着函数向量的四组大米。每个变量的样本均值函数呈现在图3。为了这个目的,我们应用FMANOVA测试部分中描述2.3。2。的的所有排列测试值都等于零,与标准(即投影测试。,the Wp, LHp, Pp, and Rp tests with the Gaussian white noise and the Brownian motion) were close to zero, i.e., the largest值等于 。因此,所有FMANOVA测试拒绝零假设(5),即使在一个非常低的显著性水平。这表明水稻的四组意味着功能明显不同。
在第三个步骤中,三个功能判别坐标建立了四个杰出组的米粒。根据这些坐标的理论建设,他们的数量等于 ,在哪里 , 是观察到的变量的数量,是著名的数量。在我们的例子中, , , ,因此, 。因此,我们获得的判别功能的三维空间坐标。每个三个坐标都有不同的区分能力(方差)四个研究团体。连续的坐标都有一个区分电力(表示为一个百分比)的92.0,7.3,和0.7,分别。因此,最重要的是第一个坐标代表总变异的92%,和前两个坐标一起占了99.3%。第三个坐标是无关紧要的,因为它的判别能力是低于1%。相对应的权重函数数值系数在经典判别坐标为前两个函数判别坐标图所示4。
(一)
(b)
所做的贡献三个观测变量的结构前两个判别坐标(表示为一个百分比)如表所示1。这些代表的值字段下的权函数模块。在经典判别坐标,数值系数发生在线性组合的模块代表协调考虑。它可以指出,在建设的第一和第二个判别坐标,最大的贡献是占水稻谷粒的高度(分别为65.3%和50.6%)。
40米粒的相对位置,代表四组,前两个判别系统的坐标如图5。
正如前面提到的,这两个坐标的区分能力是99.3%。在图5,你会发现第二组(长米饭煮水)是非常远离其他三组。它证明长白米的沸腾水有不同的影响维度当我们比较维度长长的白大米后蒸或煮或蒸后蒸谷米。
最后,我们进行了基于最小生成树的聚类分析。在我们的计算中,我们利用克鲁斯卡尔算法和距离Mahalanobis构造三维判别坐标空间的树突。四组的向量的平均值如表所示2。在两组之间的距离见表3。树突的关系如表所示4。
然后,平均长度树突的边缘,这些长度的标准偏差 ,和关键的价值 计算。
前两个函数判别系统的坐标,树突是传播意味着代表四个大米组,和它的部门是由标记边缘超过临界值虚线(图6)。
从图可以看出,两个集群是有区别的:一个元素组成的集群组2和三元素组成的集群组织1,3,4。Mahalanobis组1和2之间的距离是24.52的四倍组1和4之间的最大距离属于第二个集群。组1、3和4属于一个集群均匀的长度,宽度,和米粒(表的高度5)。
4所示。结论
本文描述了晶粒尺寸的变化的影响蒸谷米,长在水和蒸米饭煮处理时间。实验结果的随机过程转化为多维数据功能。应用FMANOVA允许拒绝零假设的向量函数意味着相比组没有显著差异,在显著性水平为0.05。这证实了假设研究水稻组有显著差异的维度谷物。另一方面,MFDCA显示系统中给出的实验分的前两个判别坐标(解释超过99%的变异性)形成四组,确认检查维度的米粒分化组。此外,应用聚类分析表明,长白色的水稻种子的尺寸在水中煮显著差异的蒸长米饭煮和蒸蒸谷米。这些结论从集群分析将允许引入额外的设计假设为新技术的水稻烹饪与定期或连续操作。他们也表明使用两种方法来烹饪米粒的可能性在个人技术行不需要深远的现代化或降低效率。显著差异的大小变化进行的分析结果证明了修改的蒸谷米谷物在生产过程中,当浸泡和热气腾腾的高压下修改组件(主要是淀粉)的胚乳。使过热引起的尺寸变化和热气腾腾的米粒在烹饪小得多比由浸烹饪谷物的白色品种,在放松结构在更大的程度上比其他变异的实验。
数据可用性
数据集可以从第三作者。
的利益冲突
作者宣称没有利益冲突。