研究文章|开放存取
广义最大熵和贝叶斯方法的比较研究,估计在这四个参数威布尔增长模型
抽象
威布尔增长模型是描述增长不稳定性的重要模型;因此,本文提出了三种方法,即广义最大熵法、贝叶斯法和最大后验法来估计威布尔增长模型的四个参数,并对这三种方法进行了比较。为了实现这一目标,有必要使用模拟技术来生成样本并执行所需的比较,使用不同的样本大小(10、12、15、20、25和30)和基于标准差(0.5)的模型。计算结果表明,贝叶斯方法给出了最优估计。
1.简介
生长曲线模型描述了重量、高度、长度或其他参数的增加,这取决于所研究的与时间相关的现象类型。这些模型根据曲线的形状和它包含的参数的数量而变化。其中最重要的是具有1、2、3和4个参数的Weibull增长模型。当研究符合曲线增长方向的现象时,最新的模型是大多数研究人员的首选。在此基础上,研究了四参数Weibull增长模型的估计方法:Bayes法、最大后验概率法和广义最大熵法。
生长曲线和应用程序的性能是许多研究人员详细研究的重要课题,以及它们的优点和缺点。Shafii等。[1]提出了一套包括威布尔曲线在内的增长模型。利用这些曲线表示洋葱种子的累积发芽率,并将其作为数学模型和实验模型进行评价,同时避免了矩量法的相关约束。四参数Weibull模型通过不同的种子种类和萌发条件给出了最佳拟合模型。Fekedulegn等人。[2]提出的一些非线性生长模型的偏导数,包括维泊尔模型。这些偏导数被表示来估计使用与顶部高度从Bowmont挪威云杉变薄实验挪威云杉的年龄非线性回归的马夸特迭代方法不同的模型的参数。提供的参数的良好的初始值的公式指定。在系统建模的背景下,非线性模型的参数清晰的定义是发现在参数估计的过程非常重要。Narushin和Takma [3]进行了一项研究,以选择蛋鸡的平均群生长的准确描述以及用于在生产期间由层产生的日产蛋量是最好的预测模型。计算是与体重增长,日产蛋量广义的数据,由剃须刀白蛋鸡饲养的羊群商业生产的进行。该Narushin-Takma模式不同的增长模式,包括威布尔增长模式进行了比较。另一个是高度精确和收敛,并在身体生长曲线的研究其它车型相比威布尔模型是最准确的;此外,物流的增长模式是在研究卵块生产曲线是最好的。塔巴塔巴伊等。[4研究了模型物流、Gompertz、Richards和Weibull在医学和生物医学研究中的应用。这些数学模型描述了生长动力学,这对于预测许多生物学现象,如肿瘤体积、疾病进展速度和确定最佳的放疗和/或化疗计划非常重要。采用牛顿-拉夫森法对参数进行估计。建立了一种新的预测多细胞肿瘤球体体积生长行为的模型,该模型具有较高的预测精度。该研究的结论是,双曲线模型家族可以在生物医学和流行病学研究的许多领域成为有价值的预测工具,如癌症或干细胞生长和传染病暴发。Eruygur [五]提出在他的论文两部分,其中第一个是新的技术(广义最大熵)的制剂。第二个是蒙特卡洛仿真结果GME的结果与那些在非正常的干扰的上下文中OLS方法的比较。研究者的结论是,当与OLS估计量的比较的GME估计器的性能是非常好的,特别是对小样本大小。此外,在非正常干扰的情况下,这种性能变得更好的显着位置。Ciavolino [6]讨论了两个主要部门。第一部分介绍了两种估计方法,即广义最大熵(GME)和偏最小二乘(PLS),并概述了两种方法的主要特点。第二部分通过仿真对工作满意度模型进行了简要介绍,并将估计结果与已有的多重共线性问题进行了比较,发现GME方法给出了最优估计。西瓦利诺和纳赛尔[7]旨在同时应用广义最大熵(GME)和基于在两个不同的采样技术,以改善贡佩尔茨的模型,其示出的死亡率和年龄的力之间的关系的估计的最大似然(MLE)方法。该模拟使用了前两个方法之间进行区分,并且发现GME比使用MSE MLE更好。高柏灵参赞和Helie [8]用于描述估计使用最大后验方法的参数的技术的教程程序。这些估计是基于贝叶斯分析的后验分布的模式。后验估计,最大似然估计,贝叶斯估计最大之间的关系进行了探讨;然而,示例仿真所使用的Weibull分布呈现。它表明,对于Weibull分布,模式产生参数大于平均或后验分布的中值的较小的偏置,并更可靠的点估计。该研究还讨论了最大后验估计的优点和局限性。的Raji等。[9]比较了7种生长模型,对300个来自日本鹌鹑(生活在尼日利亚)亲本的后代进行了体重测量。这项持续了20周的研究是在迈杜古里大学畜牧教学研究农场进行的。威布尔增长模型给出了[R2与其他机型相比,而最低值给出均方误差,标准偏差和Akaikes信息标准。Mahanta和博拉[10个]讨论了一些的威布尔增长模式的两个,三个,四个参数及其对林木的应用特性。使用用于胸高数据和顶部高度生长数据平均直径牛顿 - 拉夫逊迭代法源自Bowmont挪威云杉变薄实验这些模型的参数估计。种植在华盛顿12哭泣的彼岸樱树的平均高度,也可用于直流。研究发现,在这四个参数威布尔增长模式是最好的林业数据集的增长。
本研究的目的是本并估计四个参数Weibull生长模型作为非线性模型的参数;所以我们采用广义最大熵,贝叶斯和最大后验方法的参数进行比较的估计;此外,我们使用模拟技术获得的结果。
为了达到研究的目的,本文共分为五个部分:第一部分介绍了介绍,包括文献综述,以澄清其目的和方法,而第二部分提供四个参数Weibull增长模式。第三部分提供的方法用来估计维泊尔模型的参数。第四部分描述了模拟实验,研究的结果被在第五部分中讨论。最后,六节给出结论。
2。材料和方法
2.1条。威布尔增长模型
四参数威布尔增长模型是非线性模型的一种,因此对它的处理并不缺乏这些模型所具有的复杂性。此模型可采用以下形式[2]: 哪里是生长在时间的大小 , 最大的增长规模是 , 是初始值的相关尺度参数,是相对生长曲线,为形状参数,和是随机误差。
在生物应用中,除了 。
威布尔生长模型是在S形对称的生长曲线 ;否则,它没有拐点[11个,第48-49页],和类似的S形对称的增长模式,它有一个部分,其中的曲线呈指数增加,然后活用在某一点到下降的形状,从而产生S形的形状,其中的两侧曲线是对称的,而在生物生长分析中,和总是积极的[10个]。
即在公式解释Weibull成长模型(1)可重新编制为回归公式,如下所示: 哪里 表示在等式说明非线性响应函数(1),和响应变量是一世,其中一世 = 1, 2, …,ñ。
假设随机误差不相关且服从多元正态分布,即平均ε∼ ,通过使用阶乘为泰勒级数的非线性响应的是在方程解释(2),并减少它在一阶导数产生[德意志北方银行,第2281至2296年]
假设 , ,和 。
此外,还可以得到以下方程式:
方程(五)是一个线性公式,可以重写为矩阵,如下所示: 哪里 ,秩的矢量(ñ × 1) for the response variable ; ,矩阵的秩的(ñ×4)为解释变量; ,秩的矢量(4 × 1) for unknown parameters; ,秩的矢量(ñ × 1) for random errors, as∼ 。
2.2条。Bayes法(BAY)
我们可以找到变量的联合函数(似然函数)取决于方程(6) 如下:
取自然对数,然后使参数向量的部分推导和求解方程,我们得到如下公式估算:
方程(8)是参数的最大似然估计(MLE)那是等价的最小二乘法( ),因此增加在方程估计器(8)方程中非线性模型参数极大似然估计的初步估计(2) ,此外迭代技术可以得到的参数的最终MLE 。
使用贝叶斯方法,我们可以估算出在等式说明线性模型参数(6),取决于等式中所示的似然函数(7);因此,概率密度函数可按比例写成: 哪里
为了得到提取Bayes估计的后验概率密度函数,需要知道前验概率密度函数。采用自然共轭先验概率密度函数。这类先验分布有一个适当的概率密度函数,它取决于参数的可用信息[13个页。97。
假定在等式中描述的多重线性回归模型(6),当我们让关于该表示的下限和上限标准偏差的参数简单的理论信息,由杰弗里提出的第二规则可用于获得以下分布[14个]: 其中的参数的向量是多元正态分布:
我们可以得到参数的联合先验概率密度函数和从方程式(10个)和(11个),也就是说,
乘法方程(德意志北方银行),在方程中所示的似然函数(7),我们得到的参数的联合后验概率密度函数和 ,也就是说,
参数的联合后验概率密度函数可由积分方程(13个) 关于 ,也就是说, 哪里
方程(14个)是多元的Ť自由分配ñ与手段 ,其表示Bayes估计为参数使用方损失函数: 其中向量的值取决于参数的默认值被确定 ;此外,矩阵的值具体如下:
按方程估计(15个)加入到初始估计中,得到非线性模型参数的Bayes估计在式所示(2),因此,我们到达了参数的最终估计基于重复的规则。
2.3条。最大后验概率法(MAP)
这种方法是一种基于参数后验分布的贝叶斯估计形式(6)。这种方法是基于数据而不是平均,找到估计和假设已知,可以得到以下方程: 哪里 ,先验分布为已知 ,它不包含任何值和 ,似然函数。是观察到的数据的概率分布函数是独立的并提取如下:
方程(19个)将初始分配时相当于MLE的方法。
按方程估计(19个)加入到初始估计,以获得最大的非线性模型的参数的后验估计在式所示(2)基于重复规则,我们可以得到参数的最终估计 。
虽然最大后验估计比一般的Bayes估计有更大的方差,但它的特点是易于处理非线性增长模型,因为它不需要获得完全形式的后验分布,而只是作为近似,这意味着我们不需要进行数值积分。
2.4。广义最大熵值法(GME)
根据这种方法,我们对线性回归模型进行了重新参数化和重构(6)在预期值的形式写入它的参数 ,Ĵ = 1、2、3、4和随机误差 ,一世 = 1, 2, …, n in the form of convex combination with a finite support variable whose dimensions usually range from 2 to 7 according to Ciavolino [6]. 因此,为每个参数确定了五个支持变量dĴ = (dĴ1,dĴ2,dĴ3,dĴ4,dĴ五)并且对于每个误差项[R一世 = ([R一世1,[R一世2,[R一世3,[R一世4,[R一世五)。需要注意的是参数的支持变量不一定等于随机误差。
的凸组合(6)的定义如下: 其中概率和 ,然后根据Shannon熵函数的最大化,我们可以估计 。
方程(20个)可以以矩阵的方面被重写为如下: 哪里d,对角矩阵,支持变量的秩为4 × 20,由等式定义(20个)。P一世s the vector with rank 20 × 1 of the probabilities that were defined by equation (20个)。
也, 哪里C是零附近,恒定对称其中增加C导致增加均方误差(MSE)[五], 以便C被选为1。
类似地,可以应用于随机误差相同的步骤如下: 其中概率和 ,然后根据Shannon熵函数的最大化,我们可以估计 。
方程(23个)可以以矩阵的方面被重写为如下: 哪里[R,秩对角矩阵ñ × 5ñ由公式定义的支持变量(23个)。中号是秩为载体5ñ × 1 of the probabilities that were defined by equation (23个)。也,
利用方程(21岁)和(24个)在威布尔生长模型(6),我们可以重写如下:
注意,模型中参数和随机误差的概率值向量(26个)是未知的,所以我们必须估计参数(的值估计基于离散型随机变量的数学期望法 。估计向量中号和P,在确定以下约束条件后,我们使用拉格朗日乘子将香农熵函数最大化: 哪里 是香农熵函数。
也, 哪里 ,一(1 1 1 1 1)和矢量 ,定义为 (20个)。
利用矩阵的Kronecker积在方程(29个),我们得到参数约束的最终形式如下:
以及使用所述先前的步骤的威布尔增长模式的随机误差约束(28个) - (30个),我们得到随机误差约束的最终值如下:
另外,最后一个约束是定义在(26个)。
香农熵函数可以写成拉格朗日函数: 其中λ,Ť和Γ是拉格朗日系数。
通过取大号,可以导出(32个)相对于(Γ,Θ,λ,M、 第页)和等于零,以及数值技术应该被用来计算估计[7]。注意,此方法是困难的,并与偏导数更复杂,所以Ciavolino [6],直接与方程处理(27个),重写如下:
根据在Matlab下面的函数, 哪里磅和乌兰巴托分别是下限和上限p0是初始化值的向量,其元素介于0和1之间,并且
功能(34个)当两个连续估计量有收敛性时,用迭代法求出最终值。估计矢量后中号和P是输出函数(34个),我们必须用公式来表示(26个)得到的预测值 。
三。结果和讨论
我们使用Matlab生成1000个实验数据,用以表示正态分布的随机误差,平均值为零,标准差为0.5,模拟了2003-2015年伊拉克石油产量[15个]. 为了达到这一目的,我们使用了六个实验,其基础是找到Mahanta和Borah假设的初始值的方法[10个],如表所示1。
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
用Bayes(BAY)、Maximum A posterori(MAP)和广义最大熵(GME)对Weibull增长模型的参数估计结果进行了比较。因此,表2示出了所估计的参数的值;此外,表3和4给出了基于均方误差(MSE)和总偏差(TD)的估计方法对估计参数的比较结果,即, 哪里β是默认的参数和是通过使用将在本研究中使用的方法之一的估计的参数。
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||
通过表3和4,可以看出,贝叶斯与其他方法相比是最好的,因为它给了大多数实验的最小均方误差和总偏差;不过,我们也注意到,广义最大熵表现出较好的结果时,样本量只有10和12。
四。结论
实证结果表明,对于四个参数Weibull生长模型的参数的贝叶斯方法估计是与其他方法相比是最好的,基于平均平方误差和总偏差。此外,结果还表明,后验方法的特征在于所述易处理该多参数非线性生长模型;此外,它不需要以获得完整的形式的后验分布,但只作为一个近似值。相对于广义最大熵,结果已经给四个参数Weibull生长模型的估计优于其他方法,在样品的尺寸非常小的情况下,和这些估计被减弱作为样品尺寸的增大。
数据可用性
用于支持该研究的数据是可用阿拉伯石油输出国组织欧佩克,组织(网站上http://oapecdbsys.oapecorg.org:8080/顶点/f?p=101:23:::否:::). 本研究中所进行的六个实验基于文献[10]中假设的初始值的确定方法,如表所示1。
的利益冲突
作者声明他们没有利益冲突。
参考文献
- B. Shafii,W. J.价格,J. B.斯文森和G. A.默里,“发芽的数据分析增长曲线模型的非线性估计,”在第三论文集学术年会论文集,应用统计在农业年会,第19-42页,堪萨斯州立大学,曼哈顿,纽约,美国,1991年。查看在:谷歌学者
- D. Fekedulegn,M. P.苹果Siurtain和J. J.科尔伯特,“在林业非线性生长模型参数估计,”席尔瓦·芬尼卡卷。33,没有。4,第327-336,1999。查看在:发布者网站|谷歌学者
- 五、 G.Narushin和C.Takma,“评估蛋鸡生长和生产曲线的乙状结肠模型”生物系统工程,第84卷,第3期,第343-3482003页。查看在:发布者网站|谷歌学者
- M.塔巴塔巴伊,D. K.威廉斯和Z. Bursac,“Hyperbolastic增长模式:理论与应用”理论生物学与医学建模,第2卷,第14期,第1-13页,2005年。查看在:发布者网站|谷歌学者
- H、 O.Eruygur,“广义最大熵(GME)估计:公式化和蒙特卡罗研究”,in全国计量经济学与统计学研讨会论文集,土耳其伊斯坦布尔,2005年5月,https://mpra.ub.uni-muenchen.de/12459/1/mpra_paper_.pdf。查看在:谷歌学者
- 在E. Ciavolino,“建模GME和PLS估计方法,用于评估在公共部门工作满意度”赫尔辛堡大学QMod 07学报林克平大学电子出版社,瑞典赫尔辛堡,2007年6月。查看在:谷歌学者
- E、 Ciavolino和A.D.Al-Nasser,“基于排序集抽样的非线性gompertz模型的信息论估计改进”。应用定量方法,第5卷,第2期,第317-330页,2010年。查看在:谷歌学者
- 柏灵D.和S.Hélie,“使用先验概率提高最大似然估计:上最大的教程后验估计和威布尔分布的检查,”心理学定量方法教程,第9卷,第2期,第61-71页,2013年。查看在:发布者网站|谷歌学者
- A、 O.Raji,S.T.Mbap和J.Aliyu,“描述日本鹌鹑生长的不同模型的比较”TRAKIA J.科学。卷。2,第182-188,2014。查看在:谷歌学者
- D. J. Mahanta和M.博拉,“在林业威布尔生长模型参数估计,”国际数学杂志趋势和技术的卷。8,没有。3,第157-163,2014。查看在:谷歌学者
- Grosjean博士,“养殖海胆的生长模型利维杜斯副中心(Lamarck,1816年),“农艺科学与生物工程,布鲁克塞尔大学,布鲁塞尔,比利时,2001年,博士论文。查看在:谷歌学者
- J. K.孙某和S. G.康“在多处理器的非线性动态模型的广义贝叶斯估计过程,”在理论与方法:在统计通讯,第25卷,泰勒和弗朗西斯集团,伦敦,英国,1996年。查看在:谷歌学者
- G、 朱杰、格里菲斯、希尔和李,理论和计量经济学的实践,John Wiley和Sons,纽约,NY,USA,1980年。
- E、 F.Halpern,“贝叶斯方法的多项式回归”美国统计协会杂志,第68卷,第341号,第137-1431973页。查看在:发布者网站|谷歌学者
- 阿拉伯石油输出国组织欧佩克的组织,年度统计报告阿拉伯石油输出国组织欧佩克,贝鲁特,黎巴嫩,2017年的组织,http://oapecdbsys.oapecorg.org:8080/apex/f?p=101:4:943634539090::NO::P4_COUNTRY:106。
版权
版权所有©2020 Saifaldin Hashim Kamar和Basim Shlaibah Msallam。这是一篇在知识共享署名许可,其允许在任何介质无限制地使用,分发和再现时,所提供的原始工作正确的引用。