基于关键直径预测山药形状的贝叶斯方法

摘要

提出了山药形状估计的贝叶斯方法(薯蓣属opposita)用几个关键直径的山药。摘要山药形状预测可用于确定山药生产种子山药的最佳切断位置。我们的贝叶斯方法是贝叶斯估计模型和预测模型的结合，实现了对山药的自动、快速和低成本处理。在使用日本的样本数据集构建模型后，该模型仅基于几个关键直径提供了薯蓣的整体形状预测。贝叶斯方法在形状预测方面表现良好，最大限度地减小了被测形状和预测形状之间的均方误差。其中，两个固定位置的关键直径的多元回归方法获得了最佳的形状预测性能。我们开发了基于贝叶斯估计模型和预测模型的自动、快速、低成本的薯蓣加工机。这种形状预测方法的发展，包括我们的贝叶斯方法，可以帮助减少食品加工的成本和时间。

1.介绍

山药(薯蓣属opposita)是日本出口最多的作物之一。2013年，山药出口额达到18.9亿日元[1]．2012年，日本山药总产量的90%来自北海道(45.8%)和青森(44.0%)两个县[2]．在这两个县，机械耕作被用来迅速扩大生产。然而，种子山药(山药的种子块茎)，它是均匀地切断山药(图1)，人工生产，需要300人·h/ha的努力。为了降低生产成本，提高薯类产量，需要种子薯类生产的机械化。

(一)

(b)

种薯机械化生产中存在的问题是如何确定每个种薯的切断位置。预计山药被均匀地切割成所需的重量，不会有太多的损失。因此，在等密度的假设下，需要测量山药的形状，因为每个种子山药的重量可以通过形状和截止位置来计算。

测量山药形状的一个简单方法是用传感器扫描山药。然而，这包括三个问题:()传感器的成本，()处理速度，及()扫描的准确性(例如，山药的毛状体会降低扫描的准确性)。另一种方法是利用薯蓣的图像来确定形状。这种方法已广泛用于水果/作物的分级、分类和装运前的清除[3.- - - - - -6]．已提供计算及统计方法[7- - - - - -16]．在生产种子山药的情况下，问题比上述水果和作物的一般问题简单得多;我们可以假设一个规则的番薯模式(见图)1)，而不必严格检查山药的破损情况，因为这里的目的是在不使用许多设备(即一种低成本的方法)的情况下快速了解山药的形状。

在本文中，我们提出了一个贝叶斯框架来解决以下问题()和()，为山药的形状预测提供一种低成本、高速的方法。我们假设山药的形状可以用一组直径来表示，在这个假设下，山药的形状可以通过在固定位置的几个关键直径来预测。为了检验这一假设，我们需要建立一个模型，给出预测直径和可测量的关键直径之间的关系。模型构建的一个难点是对每个样品直径的测量是不充分的和不稳定的。因此，我们引入了贝叶斯框架来缓解这种困难。

贝叶斯方法是一种统计推断技术，它根据先验概率更新基于观测的模型中随机参数的概率。通过贝叶斯推断，我们可以根据预先得到的先验信息建立参数的先验分布，从而在缺乏观测数据的情况下获得参数的稳健估计，因此贝叶斯方法在观测数据不具备估计能力的情况下尤其有用。因此，贝叶斯数据分析方法被广泛应用(例如，[17])。贝叶斯推理在时间序列分析中尤为重要。例如,[18]提出了一种分析动态系统时变结构的贝叶斯平滑先验方法;在时间序列中有一些缺失数据的情况下，它是有用的。本文将平滑先验技术应用于山药形状预测问题。

该方法通过对山药关键直径的一些测量来估计山药的整体形状。该方法克服了纱线形状测量中存在的两个问题，即无需任何传感器即可测量纱线直径。我们通过最小化形状预测的误差来估计要测量的直径的最佳位置。我们还演示了该方法在使用样本数据集(包含长度、重量和直径的间隔为10至50 mm)估计纱线形状方面的高性能(图)2，请参阅2.2)， 111份来自日本北海道的山药。利用样本数据集构造该方法后，在不使用扫描仪和图像的情况下，基于几个关键直径给出了薯蓣的整体形状预测。

本文的其余部分组织如下;部分2讨论了实现所提出方法的步骤，从一组样本数据中获得的结果显示在本节中3.，所提出的方法的结果和性能将在本节中讨论4．最后,部分5总结了纸。

2.材料和方法

2．1．基本的考虑

在本节中，我们将介绍我们的样本数据集和提出的方法。该方法在利用样本数据集构造方法的基础上，根据预先测量到的几个关键直径，预测出薯蓣的整体形状，该形状可以用薯蓣茎轴长度上的所有直径表示。

我们开发了贝叶斯方法来预测山药的形状分为三步。

步骤0．将所有山药放入时间间隔(图3.）.

步骤1．应用贝叶斯估计模型估计缺失直径(图)4）.

步骤2．构建贝叶斯预测模型进行形状预测(图)5）.

首先，作为步骤在我们的贝叶斯方法中，所有的番薯被排列成时间间隔(图3.）.例如，在Figure中3.，是实际的观察结果吗（ ),也就是说,是失踪。我们需要一个模型来估计所有遗漏的直径。但问题是，预计的漏失直径数超过了观测值。因此，我们采用贝叶斯模型来解决这个问题(Step）.在步骤，我们建立了一个基于观测直径和步进估计直径的预测模型．下面的小节将详细解释样本数据集和提出的方法。

2．2．样本数据集

在这项研究中，我们使用的数据来自111日本北海道的山药，以构建贝叶斯模型。每个山药都有长度(mm)、重量(g)和直径(mm)的测量值(图)2和下面的描述)。所有纱线在直径为25mm的位置自动切断(见图)2）.平均长度、重量和直径为(±64.31)毫米,783.24 g(±205.67),和44.30(±14.43)毫米。分别以25毫米和50毫米的间隔测量87个和24个纱的直径。在87个山药中，有60个在山药前端每隔10毫米有直径的详细测量。本研究中111种薯蓣的长度和重量散点图见附录一个．体长与体重高度相关(Pearson相关系数) ， )，意味着构建模型所需的数据质量高。

2．3.步骤1:用贝叶斯估计模型估计缺失直径

为了品尝甘薯，我们考虑模型的直径观测在-第一点如下: 在哪里，,分别为直径、真直径和测量误差，样品中薯蓣的数量，和为待估计的真实直径的等间距点的数目。注意，当有一个观察接近-第一点，我们认为它是衡量；否则我们认为不见了。

估计未知数的困难为和需要估计的未知量的数量大于观测值的数量;也就是说，我们有太多的直径缺失值。为了减轻这个困难，我们使用了贝叶斯模型。这里，从贝叶斯方法的角度来看，作为随机变量处理。假设该变量的分布可以用称为平滑先验的随机差分方程([18])。对于给定的样本，表示的平滑先验由一个-nd阶随机差分方程为在(1)和(2)，和白噪声序列开启了吗，它们是相互独立的和是未知参数。通过引入平滑先验(2)进入模型(1)，我们可以构造一组柔性贝叶斯线性模型．

现在,我们把然后，(1)和(2)可以用以下状态空间模型表示: 状态空间模型中包含(4),参数包含在状态向量中，则其估计可由的估计得到．此外,差异和可以用极大似然法估计。上述估算薯蓣直径的贝叶斯模型最早在[19申请另一份申请。

当参数和，我们可以得到采用卡尔曼滤波算法。参数的估计和通过最大化基于卡尔曼滤波定义的似然函数得到。见附件B给出了卡尔曼滤波的算法及附录C用于参数的估计和在细节。参见[18，20.]．

２.４.步骤2:使用关键直径的贝叶斯预测模型进行形状预测

在这一节中，我们提出了三个模型来预测山药的形状，基于从一组样本估计的结果。让在位置上成为关键的直径(mm)从尖端(参考图5）.同时,让和成为职位的关键直径(毫米)(mm)从尖端山药。

2.4.1。加权平均(WA)

我们的目标是预测所有点的直径对山药的关键直径．

定义和，则为归一化直径的后验分布是由 ,在那里由?的第一个元素给出,是由的元素，通过上述的定区间平滑得到。直径的加权平均值然后被计算哪些可以看作是标准形状的平均山药。

然后是有价值的番薯对于关键直径，点处的预测直径值是由

2.4.2。回归模型(RM)

单回归模型(S-RM)．估算值的直径以及键直径的值，构建单一回归模型为然后，我们可以得到估计和回归系数的和点用最小二乘法。对于给定直径的山药，即该点处直径的预测值获得的是．

多元回归模型(M-RM)．根据估计的价值的直径以及和，建立多元回归模型为然后，在点直径的预测值是通过关系得到的吗与，,为回归系数的估计值，,,分别。

2．5．评估贝叶斯方法的性能

如上所述，我们构建了三种预测模型。这些预测模型有两个问题。一个是如何确定位置参数，也就是说，在WA和S-RM模型或和M-RM模型中。另一个问题是如何评估这些不同的模型。解决这些问题的一个有用方法是使用均方误差(MSE)作为评估预测模型的标准(见，例如，[21])。

具体来说，对于WA和S-RM模型，MSE定义为在哪里直径的预测值是多少第一点带有位置参数的yam，为指标集使用索引集对于丢失的值(因此，指出的实际观察th山药), 为具有度量的指标总数。因此，直径预测值和观测值之间的均方差可以表示出来。因此，我们可以确定位置参数通过最小化的值然后根据最小值对预测模型进行评价．

同理，对于M-RM模型，MSE定义为在哪里直径的预测值是多少第一点番薯的位置参数和．

的最小值的一种预测模型和被认为是最好的模型。

3.结果

首先，作为步骤在所提议的方法中，直径的测量是按等间距布置的．例如，对于，直径的测量值为,（ )失踪。然后应用贝叶斯估计模型对每一处的直径进行估计为一步建议的方法。在步骤，利用参数估计值构建预测模型。实际上，用WA、S-RM和M-RM三种方法预测山药形状，得到直径的预测结果。我们设置了位置钥匙直径的mm是，计算每个值的MSE值．对于M-RM，有两个位置和用于定义关键直径和被设置为和 ,分别。WA、S-RM和M-RM的最小MSE值为18.62(在 (15.71毫米), 毫米)和11.48(在毫米, 分别毫米)。因此，M-RM的最小MSE值为毫米, 毫米。数字6显示了三种方法的MSE值的变化。数字7表示估计系数，,为M-RM 毫米, 毫米。直径的预测价值点获得的是．我们测量两种直径和一种新的山药的整体形状预测。数据8和9用M-RM对每个点的直径进行观测和预测，M-RM的两个关键直径在形状为255.0 mm本研究的样本。

(一)

(b)

4.讨论

首先，根据贝叶斯估计模型的结果，构建了三种预测模型WA、S-RM和M-RM，对山药形状的预测进行了MSE比较。虽然与其他方法相比，WA是一种简单的方法，但它导致的MSE值很小，在18.62 毫米。回归方法的效果优于WA方法;S-RM的MSE为15.71 mm和11.48的M-RM在毫米, 毫米。根据图7M-RM的系数，直径在 mm对范围内的预测产生了积极和消极的影响和 ,分别。另一个直径 mm对范围的估计作出了贡献．两种直径可以通过两种系数来提高估计的性能。

利用本研究的样本数据集构造M-RM后，M-RM可以用于两个直径在固定位置的整体形状预测和毫米。样本数据集的质量对形状预测的性能至关重要。在我们的数据集中，山药长度和重量是相互关联的( ， ,附件一个）.这意味着山药形状一致，没有不规则形状的异常值;如果有厚的(短的和重的)和薄的(长的和轻的)山药，它们可能分别在散点图的左上或右下，相关性可能较低。用于构建M-RM的样本数据集的质量在模型构建中似乎较高。

根据MSE值，M-RM方法表现良好(图)6)和目视检查实际形状预测(图8和9）.为了根据预测的形状来评估薯片的权重，我们假设(a)每个薯片的横截面是圆形的，(b)形状在每对位置之间线性变化。然后根据假设(a)和(b)估计权重(图)10）.M-RM成功地预测了薯蓣重量。通过适当处理异常值可以获得相对较高的精度(例如，去除重薯重量> 1200g = mean + 2SD)。我们认为，本文的贝叶斯方法不仅适用于山药的形状预测，也适用于其它农业形状预测问题。

5.结论

摘要提出了一种将贝叶斯估计模型和预测模型相结合的形状预测方法。我们采用的三种预测模型分别是加权平均(WA)和单、多元回归方法(分别为S-RM和M-RM)。采用双直径固定位置的M-RM预测模型和mm在MSE值方面达到了估计的最高性能。在使用本研究的样本数据集构建M-RM之后，M-RM基于两个关键直径预测了山药的整体形状。在这些位置测量两个直径是相当容易的，这种方法不需要任何传感器的形状估计。这种形状预测方法的发展，包括我们的贝叶斯方法，将需要减少食品加工的成本和时间。

附录

样本Yam数据的详细数据

数字11显示了111种薯蓣的长度和重量的散点图。体长与体重高度相关(Pearson相关系数) ， )，意味着构建模型所需的数据质量高。

B.直径估计算法

对于给定的样本,让表示状态的初值，令表示到该时间点的一组观测结果为th样本。假设．这是众所周知的分布为国家有条件地在是高斯分布，所以只需要得到均值还有协方差矩阵的关于．

当和，初始分布，和一个观察集到目前为止，那么状态的估计呢可以使用著名的卡尔曼滤波器(对于 )和定区间平滑(为 )递归如下(参见，例如，[18，20.])。

卡尔曼滤波(步骤1):一步预测

卡尔曼滤波(步骤2):滤波

固定间隔平滑 在这里,表示单位矩阵。注意，过滤步骤中的计算将被跳过是一个缺失的值。

的后验分布可以由和，然后是参数的估计的状态空间模型。4)的主要文本合并在状态向量中．此后，估计是用．

C.方差估计算法

当观测数据为的样本，一个方差的似然函数和被近似定义为在哪里条件密度函数是鉴于过去的历史．假设是空集吗．取对数，则得到的对数似然为如由[18，利用卡尔曼滤波，得到条件密度法向密度是多少在哪里提前一步的预测是什么和预测误差的方差，由分别。

因此，估计和可以用极大似然法得到。具体来说，对于给定的值，我们可以得到估计的为通过最大化在(C.2)数值。然后,估计为同样通过最大化

通过应用的结果和再对上述算法进行卡尔曼滤波和固定区间平滑，就可以得到最终的估计和相应方差的结果和．

的利益冲突

作者声明本文的发表不存在利益冲突。

参考文献

日本贸易统计。http://www.customs.go.jp/toukei/info/index_e.htm．
日本官方统计门户网站。http://www.e-stat.go.jp/SG1/estat/eStatTopPortalE.do。
G. P. Moreda, J. Ortiz-Cañavate, F. J. García-Ramos, M. Ruiz-Altisent，“水果和蔬菜尺寸测定的非破坏性技术综述”，食品工程杂志，第92卷，第2期2，页119 - 136,2009。视图:出版商的网站|谷歌学者
水果和蔬菜分级系统和食品可追溯性自动化食品科技发展趋势， vol. 21, pp. 145-152, 2010。视图:谷歌学者
X. Liming, Z. Yanchao，“基于图像处理的草莓自动分级系统”，农业中的计算机与电子学，第71卷，第71期1, pp. S32-S39, 2010。视图:出版商的网站|谷歌学者
C. Costa, F. Antonucci, F. Pallottino, J. Aguzzi, D. Sun，和P. Menesatti，“农产品形状分析:最近的研究进展和计算机视觉的潜在应用综述，”食品和生物加工技术，第4卷，第4期。5, pp. 673-692, 2011。视图:出版商的网站|谷歌学者
S. Goto, H. Iwata, S. Shibano, K. Ohya, A. Suzuki, H. Ogawa，“用椭圆傅里叶描述符表征水曲柳(Fraxinus mandshurica var. japonica)果实形状变化及其对飞行时间的影响”，生态研究，第20卷，第2期。6，页733-738,2005。视图:出版商的网站|谷歌学者
M. Z. Abdullah, J. Mohamad-Saleh, A. S. fathinl - syahir，和B. M. N. Mohd-Azemi，“使用自动化机器视觉系统对鲜切星果(Averrhoa carambola L.)的鉴别和分类”，食品工程杂志，第76卷，第76期4, 2006年。视图:出版商的网站|谷歌学者
S. Borah, E. L. Hines, M. Bhuyan，“基于小波变换的图像纹理分析用于茶叶颗粒分类的尺寸估计”，食品工程杂志，第79卷，第5期。2，页629-639,2007。视图:出版商的网站|谷歌学者
K. Moon Sung, C. yu - ren, C. Byoung-Kwan等，“苹果缺陷和粪便污染在线检测的高光谱反射和荧光线扫描成像，”食品质量与安全的传感与仪器，第1卷，151-159页，2007。视图:谷歌学者
4 . H. Sadrnia, A. Rajabipour, A. Jafary, J. Arzhang, Y. Mostofi，“基于图像处理的长型西瓜果实形状分类与分析”，国际农业与生物工程杂志， vol. 1, pp. 68-70, 2007。视图:谷歌学者
P. Menesatti, C. Costa, G. Paglia等人，“基于形状的意大利榛子品种多元鉴别方法”，生物系统工程，第101卷，第1期。4，第417-424页，2008。视图:出版商的网站|谷歌学者
C. Costa, P. Menesatti, G. Paglia等，“使用光电椭圆傅里叶分析定量评价塔罗科甜橙果实形状”，采后生物学与技术第54卷第5期1，第38-47页，2009。视图:出版商的网站|谷歌学者
C. B. Singh, R. Choudhary, D. S. Jayas, J. Paliwal，“农业和食品质量检测信号的小波分析”，食品和生物加工技术，第3卷，第2期。1，页2-12,2010。视图:出版商的网站|谷歌学者
A. Mizushima和R. Lu，“一种使用支持向量机和Otsu方法进行苹果分类和分级的图像分割方法”，农业中的计算机与电子学， vol. 94, pp. 29-37, 2013。视图:出版商的网站|谷歌学者
M.-H。胡,Q.-L。盾,B.-L。Liu, P. K. Malakar，“双k-means聚类在香蕉图像分割中的潜力”，食品加工工程学报，第37卷，第2期1, pp. 10-18, 2014。视图:出版商的网站|谷歌学者
A. Gelman, B. John Carlin, S. Hal Stern, B. David Dunson, A. Vehtari, B. Donald Rubin，贝叶斯数据分析，第2卷，CRC出版社，Boca Raton，美国佛罗里达州，2014。
G. Kitagawa和W. Gersch，时间序列的平滑先验分析，第116卷，施普林格，1996。
K. Koki和M. Hachiya，“一种识别中国山药形状特征的关键指标的统计方法”《智能系统进展》，Ford Lumban Gaol, Zenon Chaczko, Kiyota Hashimoto， T. Matsuo和W. Grosky, Eds。，第27-34页，WIT出版社，2014。视图:谷歌学者
布莱恩·安德森和约翰·摩尔，最优滤波，普伦蒂斯-霍尔公司，1979年。
D. Hrishikesh, V. Ullah和A. Ullah，回归方法的最新进展， Marcel Dekker, Inc, 1981。

农业的发展

摘要