研究文章|开放获取
郭Xueqiang Bingjun,李, ”河南省蔬菜供应的预测基于PSO-GM (1,N)模型”,数学杂志, 卷。2021年, 文章的ID7874564, 7 页面, 2021年。 https://doi.org/10.1155/2021/7874564
河南省蔬菜供应的预测基于PSO-GM (1,N)模型
文摘
GM (1,N)模型是一种灰色预测模型考虑多种因素的影响。本文改进了GM (1,N)模型和构造PSO-GM (1,N)模型。首先,使用套索方法选择的影响因素,然后影响因素的优先级的值参数N在GM (1,N确定)模型,最后使用PSO方法优化GM (1,N)模型。以河南省蔬菜供给为研究对象,本文实证测试通过使用PSO-GM (1,N)模型。结果表明,影响河南省蔬菜供应的关键因素是农村的员工的数量,公路通车里程,农药的应用。河南省蔬菜供应将继续表现出稳定增长的趋势在未来三年。
1。介绍
蔬菜是必不可少的农产品在城乡居民的日常生活。有效地确保蔬菜的供应已成为有关民生的一件大事。蔬菜供应受到自然气候等多种因素影响,生产能力和运输。有效地识别关键影响因素蔬菜供应和准确预测未来蔬菜供应带来了巨大的实际意义稳定蔬菜市场供应,稳定蔬菜价格波动。
学者们研究了影响因素的分析和预测模型从不同的角度建设蔬菜供应。吴和μ1)发现,城市人口的最大影响蔬菜的流通;胡锦涛et al。(2]分析了农业信息化对蔬菜产量的影响;于(3)发现,影响蔬菜生产的主要因素是种植区域,蔬菜消费,和农业财政支出;杨和太阳4)发现,影响蔬菜的产量的主要因素是经济发展、技术投资、和土地;李和μ5]分析了金融资本对农民的影响意愿继续种植蔬菜;阴(6)建造了一个小波神经网络预测模型,并预测番茄产量;刘巧广告(7]分析了老化的影响蔬菜的农民对蔬菜产量。金等。8)详细分析了物流服务提供者的角色。从现有的研究成果,学者们主要集中在蔬菜生产领域,不能完全反映整个过程的蔬菜供应。学者很少甚至没有考虑一些已知的灰色特征信息,一些未知的信息,和穷人的蔬菜供应的影响因素的信息。此外,当构建预测模型,影响因素之间的多重共线性和过度拟合不考虑。在考虑多种因素的影响,套索(至少绝对收缩和选择算子)方法可以消除那些不重要的因素从许多影响因素,选择一些重要的系统上产生重大影响的因素,并有效地消除多重共线性和过度拟合的问题。GM (1,N)模型是一种灰色预测模型考虑多种因素的影响。针对大型灰色预测模型的误差在实际应用中,本文提出了一种改进的PSO-GM (1,N)模型,它提供了一种研究蔬菜供给的预测的新方法。
2。PSO-GM (1,N)模型
对于一个多因素预测问题,让 系统特征数据序列, 影响因素的顺序。为了消除多重共线性问题的相关影响因素,PSO-GM (1,N)第一个屏幕套索方法相关的影响因素,然后确定影响因素的优先级的值参数N在GM (1,N第二选择)模型,相关的影响因素,最后优化GM (1,NPSO)模型的方法。
2.1。套索方法
拉索是一个正规化压缩统计学家罗伯特Tibshirani 1996年提出的估算方法。正则化是一种战略方法,可以限制模型的特点,防止过度拟合。基于损失函数的最小二乘(普通最小二乘法(OLS)),套索使用回归系数的绝对值之和作为罚函数对回归系数进行压缩的。当回归系数的绝对值之和足够小,一些回归系数可以被压缩至零,然后用零系数的变量可以被消除,从而达到变量选择的影响(9]。假定的线性回归模型 ,在哪里X0是系统行为特征向量,X是影响因素变量矩阵,β是系数向量,然后套索的系数估计方法如下:
在这里, 。 在哪里损失函数,是正则化函数,然后呢λ调整参数,有时也称为正则化参数;它主要是用来平衡损失函数和正则化函数。当λ(λ≥0)正逐渐增加,从0,正则化函数可以设置一些系数的估计价值为零,以消除相应的变量和变量选择的目的实现。的价值λ是由交叉验证,选择影响因素的一个部分样本数据作为训练集,另一部分被选中作为验证集,和不同的模型是在同样的训练集生成的。当这些模型的验证集误差是最小的,在这个时候,λ被选中。使用套索方法,如果米选择的主要影响因素年代影响因素,即。,the influencing factor set is screened for the first time, it can be recorded as 。
2.2。优先级的影响因素
基于影响因素的集合选择第一次,邓小平的灰色关联分析模型用于确定每个影响因素的优先级。由于不同的无量纲处理原始数据的方法,它有不同的效果影响因素的灰色关联顺序。在这里,本文使用六个处理方法,即。,① initial value, ② average value, ③ minimization, ④ maximization, ⑤ centralization, and ⑥ difference.
因为相关订单的差异反映在对系统行为的影响因素,更明显的区别是,更好的合理选择相关秩序是基于以下原则。假设6个无量纲处理方法用于得到影响因素的关联度 。在少量的计算的前提下,提出了两个原则来判断合理的相关订单(10]:
影响因素的顺序 ,根据上述原则,合理的相关影响因素可以确定的顺序。为了方便表达,这里记录如下:
2.3。GM (1,N)模型及其N值测定方法
2.3.1。GM (1,N)模型
GM (1,N)模型是一个一阶微分方程预测模型N变量,反映的影响N1影响因素变量的一阶导数系统行为变量。为了符合传统的GM (1,N)模型表示方法,相应的系统行为特征序列和影响因素的顺序选择和确定第一次reexpressed如下:
影响因素序列 可以表示为
让的1-AGO序列 ,和最近邻的意思是生成的序列 ,然后
被称为GM (1, N)。
当振幅的变化 ,很小,近似时间响应的GM (1,N)如下: 在哪里被认为是 。
系统行为变量的预测值如下:
2.3.2。的决心N在GM (1,N)模型
目前,GM (1,N)模型已广泛应用和创新。马和刘11)提出了离散GM (1,N)模型和分析石油产量下降的基本法律和相关因素的影响;风扇(12)提出了一种改进的GM (1,N)大豆价格预测模型;谢et al。13)提出了GICM模型,筛选复杂产品的关键指标,并提高了预测的准确性GM (1,N)模型;任(14)使用GM (1,N)方法模拟厌氧消化系统和预测甲烷生产;曾庆红et al。(15)提出了一种新的多变量灰色预测GM (1,N)模型;熊等。16)改进的GM (1,N)模型并提出AWGM (1,N)模型来预测住房需求;杨和刘17)使用GM (1,N)模型来预测中国的粮食产量;程等。18)建立了灰色GM(1,3)模型来模拟和预测清洁能源消费的主要影响因素;张(19]分析了生姜种植面积的影响因素方面的经济、输入和输出,建立了灰色预测模型。
从现有的研究结果,没有学者研究了参数的值N在GM (1,N)模型。本文提出了一种方法来确定参数的值N在GM (1,N)模型:根据相关的系统行为的影响因素,选择影响因素变量来建立模型。
为了测试模型的预测结果的准确性,最后三个样本的选择n示例系统的模型的预测结果的比较值,并通过建立的模型n3示例数据。通过测试的预测效果,最优N价值决定。具体步骤如下:
在步骤1中,基于影响因素的reexpression序列的关系(5),2.3。1中,选择 ,建立GM(1,2)模型,预测的三个时期n2,n1,n。通过比较实际值和平均相对误差,计算结果记录 。
在步骤2中,根据上述方法和相关影响因素的顺序确定的关系(5),GM(1,3)模型、GM(1, 4)模型,…,GM (1,N分别)模型建立和计算平均相对误差记录 。
在步骤3中,当 是最小的,模型的预测精度是最高的。在这种情况下,价值的我是最优解,即GM (1,我)模型是最优预测模型。
这个过程可以被称为第二选择影响因素集。
2.3.3。PSO-GM (1,N)预测模型
粒子群优化(PSO)初始化一群随机粒子,然后通过多次迭代最优值。在每个迭代中,每个粒子的更新速度和位置通过个人的极端p最好的和全球的极端最好的。计算公式如下: 在哪里是当前粒子的速度,是粒子的当前位置,是最优值的位置目前发现的粒子,然后呢是目前发现的最优值的位置,整个人口。惯性权重,c1,c2是加速度系数,通常 。r1,r2是(0,1)之间的一个随机数。通过不断更新粒子最终达到全局最优值的位置。
根据通用汽车的基本原理(1,N)模型,让 ;计算公式是 ,在哪里
可以看出的代表性GM (1,N)模型取决于矩阵B。参数的估计值u根据上述方法获得,但它不一定是最优的。摘要PSO-GM (1,N)模型提出了:添加其他参数矩阵B,然后利用粒子群优化算法获得最优参数u。矩阵B与参数reexpressed如下:
然后,参数根据公式重新估计 ,的参数是一个函数的 ,和GM (1,N)的函数 。
根据最优预测模型GM (1,N)确定2.3。2的相对误差模型的三个时期n−2,n−1,n分别计算: , ,和 。这三个时期的最小平均相对误差作为目标函数的粒子群优化算法,这是明确表示如下:
3所示。预测河南省蔬菜供应
3.1。数据来源和影响因素
由于缺少一个完美的农产品物流统计指标体系,本文选择的产品数量的城市居民和城市居民的人均购买新鲜蔬菜在从2007年到2019年河南省蔬菜供应(X0),并使用蔬菜供应(的预测价值X0),以反映河南省蔬菜供应的发展和变化。根据现有的研究成果和全面性的原则,代表性,和可操作性的指标选择、9选择影响因素:蔬菜种植面积(X1)(千公顷),应用程序的农药量(X2)(1万吨),塑料薄膜的使用(X3)(1万吨),塑料薄膜覆盖区(X4)(千公顷),农村的员工的数量(X5)(1万人),投资在运输、存储、和邮政行业(X6)(1亿元)、公路里程(X7)(1万公里),道路的吨位卡车(X8)(1万吨),公路运输行业的员工的数量(X9)(人)。本文中的数据都来自河南省统计年鉴。
3.2。数据处理和结果分析
3.2.1之上。第一个影响因素集的确定
基于选定的影响因素集3.1,本文以影响因素从2007年到2016年的样本数据作为训练集,并使用套索方法来确定影响因素与MATLAB软件的帮助。最小误差值可以通过迭代程序为8倍。相对应的因素非零项回归系数的选择套索方法的结果。具体结果如表所示1。
|
||||||||||||||||||||||
3.2.2。第一次优先选择的影响因素
根据影响因素集选择第一次建立的方法2。2用于处理,具体计算结果见表2。根据判断标准(3)和标准(4),获得理想的相关影响因素的顺序是在初始值处理方法:
|
||||||||||||||||||||||||||||||||||||||||
3.2.3。的决心N在GM (1,N)模型
对表达式(13),该方法在确定2.3。2用于处理,结果见表3。因为ε4(4.93%)的最小值 ,所以N= 4,第二个选择的影响因素是农村的员工的数量,公路通车里程和应用程序数量的农药。
|
|||||||||||||||||||||||||||||||||
3.2.4。预测的结果PSO-GM (1,N)模型和影响因素的分析
PSO-GM (1,N)模型建立2.3。3用于预测蔬菜供应从2017年到2019年,河南省的粒子数是100,惯性权重是1,加速度系数是2,和迭代的数量是1000。经过多次实验和基于样本数据从2010年到2016年,河南省蔬菜供应的平均相对误差是最小的,从2017年到2019年达到了2.38%。
为了比较预测结果的合理性,PSO-GM(1、4)模型、GM(1, 4)模型、GM(1, 1)模型和多元线性回归方法用于预测河南省蔬菜供应。河南省蔬菜供应的实际价值从2017年到2019年被认为是标准。结果如表所示4。从表可以看出4平均相对误差由高到低是PSO-GM(1、4)模型中,GM(1, 4)模型、GM(1, 1)模型和多元线性回归。它可以得出的结论是,相比之下,传统的GM (1,N)模型,PSO-GM (1,N)模型大大提高了预测精度和远高于其他预测模型。它具有较强的合理性,可以有效地预测未来蔬菜供应。
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||
根据的结果3.2。3PSO-GM(4)模型用于预测河南省蔬菜供应在未来三年。结果如表所示5。影响因素的数据在未来三年通过GM(1,1)模型,结果如表所示6。
|
|||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||
从表可以得出结论5河南省蔬菜供应仍将显示一个稳定增长的趋势在未来三年,并在2023年有望达到635万吨。影响河南省蔬菜供应的关键因素是农村的员工的数量,公路通车里程,农药的应用程序。其中,农村的员工的数量和公路里程有积极影响蔬菜供应,而应用程序数量的农药对蔬菜供应产生负面影响。
蔬菜生产是一个劳动密集型的行业;劳动力的数量直接影响蔬菜生产。随着社会经济的发展,农业机械极大地提高了劳动生产率,但在蔬菜生产中,由于植物类型和地形的限制,农业机械很难得到有效的应用程序仍然需要很多劳动为手动操作。因此,农村就业对蔬菜供应的影响是积极的。
货运的方式包括公路运输、铁路运输、水路运输和航空运输。由于短距离运输蔬菜的特点,公路运输是广泛应用于蔬菜运输。交通基础设施建设在促进蔬菜运输中起着重要的作用。完善的交通网络可以加快血液循环的蔬菜和蔬菜市场的规模扩张。公路通车里程是区域交通基础设施的一个重要指标。因此,公路通车里程对蔬菜供应的影响是积极的。
过多的农药残留在蔬菜是一个重要的任务在蔬菜质量安全的监督。在蔬菜生产过程中,由于病虫害发生频繁,农民在蔬菜生产过量,以确保蔬菜产量。由于政府部门的严格控制,蔬菜市场供应明显减少。为了稳定蔬菜市场的正常供应,迫在眉睫的是减少农药的使用。因此,农药对蔬菜供应的影响是负的。
4所示。结论
蔬菜供应受到多种因素的影响,和影响因素之间的关系是复杂的。在这篇文章中,当使用PSO-GM (1,N)模型预测河南省蔬菜供应,首先,套索方法用于选择许多因素影响蔬菜供应第一次,消除多重共线性的问题和因素之间的过度拟合。然后,基于灰色关联分析,影响因素的优先级排序,参数的确定方法N在GM (1,N)提出,第二次选择的影响因素。最后,PSO方法用于优化GM (1,N)模型,大大提高了预测精度。基于PSO-GM (1,N河南省)模型,蔬菜供应预计在未来三年。结果表明,河南省蔬菜供应继续表现出增加的趋势。影响河南省蔬菜供应的关键因素是农村的员工的数量,公路通车里程,农药的应用。PSO-GM (1,N)模型提出了多因素灰色预测提供了一种新的方法。然而,这项研究没有考虑相邻省份对河南省蔬菜供应的影响,尤其是空间自相关。接下来,蔬菜供应的时间和空间演化规律河南省将探索两个维度的时间和空间。
数据可用性
使用的数据来支持本研究的发现可以从第一作者。
的利益冲突
作者没有利益冲突。
作者的贡献
李Bingjun负责提出的整体概念和框架的手稿。郭Xueqiang负责数据处理和写作初稿的手稿。
确认
这项工作得到了河南省软科学研究重点项目(202400410051)。
引用
- 吴和y yμ,“中国蔬菜流通及其影响因素的分析基于时间和空间特征,“商业经济学杂志,没有。2、年龄在18岁至25岁之间,2016页。视图:谷歌学术搜索
- 美国x, l . Chong光l .魏胡安z春杨和美国湘Cheng”实证研究对农业信息化的影响湖北省蔬菜产业的发展,“河南农业科学杂志》上,46卷,不。7,154 - 160年,2017页。视图:谷歌学术搜索
- y s . Yu”的建立与相关分析的灰色预测模型GM(1,1)对广西蔬菜产量,”广东农业科学杂志》上,45卷,不。7,157 - 164年,2018页。视图:谷歌学术搜索
- x l·杨和z l .太阳”实证研究黑龙江省蔬菜产业生产的影响因素,”北方园艺,没有。1,第182 - 177页,2019。视图:谷歌学术搜索
- h·r·李和y yμ,“金融资本的影响研究农民愿意继续种植蔬菜。”中国的蔬菜11卷,第69 - 63页,2019年。视图:谷歌学术搜索
- y z阴”,预测温室番茄产量的基于小波神经网络,”钟郭卦蔡,33卷,不。8日,53至59页,2020年。视图:谷歌学术搜索
- z . x乔和刘,”老菜农对蔬菜生产的影响——渝中区县的一个案例研究,甘肃”《中国农业机械化第41卷。。6,231 - 236年,2020页。视图:谷歌学术搜索
- f·f·金、曹m . j . Liu l·马丁内斯和h·陈,“一致性和信任关系建立社交网络群体决策方法和概率语言信息,“应用软计算,103卷,2021年。视图:出版商的网站|谷歌学术搜索
- l . j .张“套索回归:从解释预测。”心理科学进展,28卷,不。10日,1777 - 1788年,2020页。视图:出版商的网站|谷歌学术搜索
- b·j·李”影响的无量纲处理原始数据的灰色关系,“河南农业大学学报,36卷,不。2、199 - 202年,2002页。视图:谷歌学术搜索
- 刘马x和z B”,预测油田生产使用小说离散GM (1,N)模型”,灰色系统杂志,27卷,不。4、63 - 73年,2015页。视图:谷歌学术搜索
- z粉丝,“分析和预测中国大豆价格的基础上改进的GM (1,N)模型”,大豆科学,35卷,不。5,847 - 852年,2016页。视图:谷歌学术搜索
- 谢n、c·胡和s .阴”关键指标选择方法的复杂设备的开发成本基于灰色发病率集群模式,”灰色系统理论和应用》第六卷,没有。1,第123 - 110页,2016。视图:出版商的网站|谷歌学术搜索
- j .任“GM (1,N)方法对厌氧消化系统的预测和影响因素敏感性分析,“生物资源技术卷,247年,第1261 - 1258页,2018年。视图:出版商的网站|谷歌学术搜索
- 周曾b、h段和y”一种新的多变量灰色预测模型与结构兼容性,”应用数学建模卷,75年,第397 - 385页,2019年。视图:出版商的网站|谷歌学术搜索
- x Xiong, h .郭,x,“房地产的住房需求分析和预测基于AWGM (1,N)模型”,灰色系统理论和应用,11卷,不。2、222 - 240年,2020页。视图:出版商的网站|谷歌学术搜索
- w·杨和李,“中国粮食供需结构平衡的预测灰色模型的基础上,“灰色系统理论和应用,11卷,不。2、253 - 264年,2020页。视图:出版商的网站|谷歌学术搜索
- j·n·m·l . Cheng Li y, b·刘,“中国清洁能源消费预测到2025年:使用改进的灰色模型GM (1,N),“可持续性,12卷,不。2,p。698年,2020年。视图:出版商的网站|谷歌学术搜索
- k >,“姜种植面积预测基于GM (1,N)模型”,《中国农业机械化第41卷。。10日,139 - 143年,2020页。视图:谷歌学术搜索
版权
版权©2021郭Xueqiang Bingjun李。这是一个开放的分布式下文章知识共享归属许可,它允许无限制的使用、分配和复制在任何媒介,提供最初的工作是正确引用。