研究文章|开放获取
Anil Kumar Mahto, M. Afshar Alam, Ranjit Biswas, Jawed Ahmed, Shah Imran Alam, "基于人工神经网络的印度可持续农业市场农产品短期预测",食品质量杂志, 卷。2021, 文章的ID9939906, 13 页面, 2021. https://doi.org/10.1155/2021/9939906
基于人工神经网络的印度可持续农业市场农产品短期预测
摘要
对市场信息的准确预测,特别是对农产品价格的短期预测,是农业社会可持续发展的必要条件。这些预测大多是借助时间序列模型来实现的。本研究将软计算方法应用于基于时间序列数据的农产品价格短期预测,利用人工神经网络(ANN)。葵花籽和大豆籽的时间序列数据被认为是农产品。本研究收集了印度马哈拉施特拉邦阿科拉地区市场5年(2014年1月- 2018年12月)的大豆种子时间序列数据。向日葵时间序列数据收集了6年(2011年1月- 2016年12月),针对印度安得拉邦Kadari地区市场。数据集可以在印度政府网站www.data.gov.in上找到。在预测方面,采用神经网络模型对上述数据集进行预测。将该模型的性能与传统ARIMA模型的结果进行了比较。将平均绝对百分比误差(MAPE)和均方根百分比误差(RMSPE)作为预测模型的性能参数。 It is observed that the ANN is a better forecasting model than the ARIMA model by considering the two forecasting performance parameters MAPE and RMSPE.
1.介绍
在印度,总人口的三分之二直接或间接依赖农业[1,2].根据2011年“印度农业普查”的调查,大约62%的印度农村人口直接或间接地依赖农业。对这部分人口来说,农业是主要的收入来源。在农产品产量方面,印度排名第二。农业对印度GDP的贡献接近18% [3.].从收入的角度看,农产品是重要的收入来源。因此,商品价格的影响[4对印度经济至关重要。农产品价格预测将对农民、政策制定者和各行政部门发挥重要作用。例如,如果一个农民提前知道在不久的将来(短期)作物的价格,那么他就可以决定该作物的种植面积。除了农民,政府机构也需要提前知道商品的可能价格,以便顺利实施政府计划(补贴计划和进出口活动)。
农产品预测对后代的可持续发展至关重要。随着农产品需求的不断增加和农业用地的减少,这种预测方法对农民的可持续发展具有重要意义。印度经济主要是以农业为基础的经济。这种预测方法可以帮助农民和其他利益相关者使其持续更长的时间。这种预测方法的优点包括为消费者提供健康和经济的食品,从而改善健康参数。这可以导致农业土地和产品的可持续性。
农产品预测对我们的日常生活至关重要。当前农产品价格波动加剧,导致人们对粮食支出管理不善。为了农产品的美好未来,农学家需要解决这一问题。
农产品价格波动和上涨是导致全球减贫斗争的主要因素之一。许多模型被用来预测哪种统计方法最常用。但目前还没有建立有效的模型来解决这一问题。
农产品价格预测主要分为结构性和非结构性两部分。结构方法[5主要考虑供给需求比。在计算上,很难估计发展中国家的消费者需求和这种作物的产量。非结构方法[6]可归类为统计技术[7,8和机器学习技术。对于非结构化方法,历史数据作为时间序列数据收集。时间序列数据在本质上可以是线性的或非线性的。有多种方法[9用于基于时间序列数据的预测。对于非线性时间序列数据,人工神经网络是比统计模型更好的选择[10,11].
对印度等发展中国家的农产品价格预测进行了一些研究。根据(12,13,神经网络具有一些特殊的特性,如非线性、适应性和映射过程,为使用神经网络作为一个良好的预测模型提供了强有力的支持。
在[14],采用ARIMA模型和时延神经网络(TDNN)对农产品价格进行时间序列预测。他们的结论是,由于时间序列数据的非线性特性,神经网络模型表现得更好。最后,他们提出了一个混合模型进行预测。令人惊讶的是,混合模型对大豆数据的效率低于人工神经网络,而对芥菜数据的效率更高。
根据在[15],神经网络是“短期”预测的一个很好的替代方案,而Box-Jenkins方法在非常短期的预测中表现更好。他们还讨论了没有隐藏层的神经网络可以类似于Box-Jenkins方法。
[16]采用支持向量机对金融时间序列数据进行预测,在效率方面优于反向传播神经网络。
在[17,作者提出了多元时间序列数据的神经网络方法。他们使用了三个城市的面粉价格数据集,根据训练和测试的结果,他们得出结论,神经网络模型可以很好地用于预测。
在[18此外,人工神经网络模型也被用于电力负荷预测。他们利用人工神经网络的特性,从过去的数据、现在的和未来的温度之间的关系中学习。根据试验数据,结果令人满意。
在[19, Jordan神经网络用于基于时间序列数据的通货膨胀预测。他们使用了宏观经济变量,如金融变量、滞后通胀和劳动力市场变量。在工作中[20.,人工神经网络用于服装零售连锁店的销售预测。他们观察到的模型的MAPE为8.79%。神经网络模型在基于时间序列数据的预测中的一些应用如下:(1)电力负荷预测[21,22](2)财务预测(10,23](3)月平均雨量预测[24]
本研究共分为五个部分。第一部分和当前部分包含了问题陈述和学者给出的各种解决方案的简要介绍。第二部分阐述了ARIMA和ANN的计算模型。第三部分为第二部分讨论的计算模型效率度量的实现和结果分析。第四部分阐述了本研究的结论。
2.材料和方法
本研究采用了向日葵时间序列数据和大豆时间序列数据。数据的统计描述见表1.大豆时间序列数据描述如下:(1)摘自印度政府网站data.gov.in(2)5年(2014年1月- 2018年12月)(3)印度马哈拉施特拉邦阿科拉地区市场相关数据
|
||||||||||||||||||||||||||||||||||||||||||
向日葵时间序列数据描述如下:(1)摘自印度政府网站data.gov.in。(2)为期五年(2011年1月- 2016年12月)。(3)印度安得拉邦卡达里地区市场相关数据。
2.1.预测技术
预测是指根据历史数据和供求数据,经过科学计算而作出的预测。预测技术的分类[25如图所示1.预测技术主要分为两类:“定量技术”和“定性技术”。在定性方法中,我们使用不能用数值衡量的事实。它也被称为判断性预测[26在这种情况下,预测是基于调查、事件和许多非计算参数进行的。定量技术[27研究数值数据或计算数据。它也被称为统计技术或时间序列技术。时间序列预测可分为两部分:(a)经典的Box-Jenkins模型[15,28,29]和(b)机器学习模型[30.,31].经典模型适用于线性数据,而机器学习模型适用于广泛的数据。ARIMA模型和ANN模型将在本节的后面进一步讨论。
预测技术的选择取决于各种参数。其中一些是需要的精度水平,预测的目的,可用的数据类型,预测的期限,等等。农产品预测的定性模型非常昂贵,不适合发展中国家。印度是一个发展中国家,时间序列预测模型适用于农产品价格预测。农业时间序列数据本质上是非线性的;因此,“人工神经网络模型”自然是最合适的模型[32- - - - - -35用于农产品价格预测。
2.2.利用ARIMA预测
ARIMA为自回归(AR)综合(I)移动平均(MA)。它遵循Box-Jenkins的原理[5,29,36,37].华宇电脑(38]与三个重要参数有关,即:p,d,问如图所示2.
ARIMA的工作模型如图所示3..时间序列数据的可视化是ARIMA的基础,也是最基本的。在可视化之后,我们可以对数据进行预处理,如去除异常值和处理缺失数据。通过可视化,我们还可以得出数据是否平稳。如果序列是非平稳的,那么首先,我们应该使时间序列是平稳的。在平稳时间序列之后,我们需要借助ACF图和PACF图找到ARIMA模型的最优参数[39].
2.3.利用人工神经网络进行预测
采用单隐层前馈神经网络,如图所示4.反向传播概念用于学习目的。让“米为神经网络的输入大小(输入层的神经元),n为隐藏层的节点数。输入 缩放到区间[0,1]。激活函数整流线性单元(ReLU) [1]用于求输入层神经元对隐层神经元的激活值。Sigmoid用于计算中间层到输出层的激活情况。ReLU函数在数学上定义为
网络的最终输出将由下式给出: 在哪里f1和f2分别为隐层和输出层的激活函数。
2.4.学习方法
网络类别的培训课程分为两部分。在训练的第一部分,网络将根据选定的输入窗口产生输出。第二部分根据实际值和预测值计算误差。现在,这个错误通过输出层传播回来,更新下一轮隐含层神经元的权值,如图所示5.
为了训练的目的,误差是通过比较实际值来计算的yt用预测值计算。误差被反向传播到神经网络,用于更新隐藏层和输出层之间的连接权值。
神经元的输出由下式计算: 在哪里是神经元的输出吗我在lth层,(偏见)我是偏向于lth层,是来自我th层神经元来jth层的神经元l,的输出我th在层神经元l.
及时更新的权重T将由下式给出: 在哪里η为学习速率,α是动量,还是δ[40]可以通过神经元输出函数的梯度来计算。
3.结果与讨论
3.1.使用ARIMA的结果
3.1.1。分析时间序列数据
实现部分在R.数据6和7分别显示2014-2018年大豆月平均价格图和2011-2016年葵花籽月平均价格图。
请看图中大豆时间序列数据的箱线图8, 2月、3月和4月的价格均值和方差都较高。同样,在向日葵时间序列数据的箱线图中,如图所示,价格在3月和4月的均值和方差都较高9.
3.1.2。时间序列数据的组成
通过对图中时间序列数据的分析8和9,我们可以清楚地说,有成分,如季节性,趋势和周期显示在图中10和11.
3.1.3。寻找ARIMA模型的参数
通过“增强Dickey-Fuller检验”来检验时间序列数据的平稳性,如图所示12.大豆时间序列数据的ADF检验如下:数据:大豆" Dickey-Fuller " =−2.2649,"滞后顺序" = 3,"值= 0.4683”
作为值>0.05,因此,该序列不是平稳的。为得到平稳数据,对数据进行差分运算,再次进行ADF检验。现在,ADF检验结果如下:数据:diffSoyabeanDickey-Fuller =−3.4255,滞后顺序= 3,值= 0.04386备择假设:固定
同样,对向日葵时间序列数据进行ADF检验的结果如下:数据:diffSunflowerDickey-Fuller =−3.829,滞后顺序= 3,值= 0.02325
3.1.4。预测价格
“汽车。使用arima()”函数根据输入的时间序列数据自动拟合模型,为arima模型找到最优参数。选择ARIMA(0,1,0)作为向日葵时间序列数据和大豆时间序列数据的最优预测模型,如图所示13和14.数据15和16分别展示大豆时间序列数据和向日葵时间序列数据的线性模型图。
3.2.结果用神经网络
神经网络的实现是在Python中执行的。以大豆价格和向日葵价格两个时间序列数据作为实验数据集。收集了印度马哈拉施特拉邦Akola地区市场60个月(2014年1月- 2018年12月)的大豆时间序列数据[41].向日葵时间序列数据收集了60个月(2011年1月至2016年12月),针对印度安得拉邦Kadari地区市场。
3.2.1之上。数据预处理
在数据预处理中,我们主要对数据进行分析,去除噪声,对缺失值进行处理,并将输入值转换为所要实现的模型所需的尺度。数据预处理的第一步是绘制序列。数字17图中为2014年1月至2018年12月大豆月平均价格。同样,图18显示向日葵的时间序列数据。
3.2.2。训练数据集和测试数据集
我们使用了监督学习的概念。前80%的预处理数据用于训练模型,最后20%的数据用于测试模型,按照各学者接受的标准[42].数字19显示了大豆数据集划分为训练数据和测试数据。同样,图20.显示向日葵数据集划分为训练数据和测试数据。
3.2.3。预测价格
在实际预测中,将训练好的模型应用于测试数据。数据21和22分别表示农产品大豆和向日葵的实际价格和预测价格的比较。神经网络模型的预测结果如表所示2和3.大宗商品分别为大豆和向日葵。
|
||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||
3.3.评估预测的准确性
我们使用两个参数“平均绝对百分比误差(Mean Absolute Percentage Error, MAPE)”和“均方根百分比误差(Root Mean Square Percentage Error, RMSPE)”来预测精度。
3.3.1。日军
日军[43,44]是衡量预测系统质量的重要参数之一。其定义为: 在哪里一个t是当时的实际价格吗t,Ft预测价格是否适时t,n为预测值的个数。The MAPE by using the ANN for the forecasted sunflower time series data is 2.4 and for soybean time series data is 7.7% as given in Table4.
|
||||||||||||||||||||||||||
3.3.2。RMSPE
RMSPE可以通过以下步骤计算:第一步:用以下公式计算残差百分比: 在哪里一个t是“实际价格”,还是Ft是“预测价格”。第二步:计算残差平方第三步:将残差平方相加除以,计算残差平方的均值n第四步:计算第三步得到的平均值的平方根
4.结论与未来工作
目前,印度的农产品产量居世界第二,占印度GDP的18%。虽然,这些商品的市场价格在地理上波动。为了让利益相关方更好地理解这些波动,在本研究中,我们提出了一个短期价格预测模型,该模型最终将为不同的利益相关方带来更多的可持续性。为此,我们比较了ANN和ARIMA模型对价格的预测。我们考虑了从印度政府门户网站收集的向日葵时间序列数据和大豆时间序列数据,以进行预测模型的训练和测试。采用MAPE和RMSPE参数对模型进行精度测量。对于大豆和向日葵的价格时间序列数据,ANN的平均绝对百分比误差(MAPE)分别为2.4%和7.7%。而在ARIMA中,大豆和向日葵时间序列数据的MAPE分别为19.76%和15.2%。同样,ANN对大豆和向日葵时间序列数据的均方根百分比误差(RMSPE)分别为3.15%和8.92%,而ARIMA对同一时间序列数据的均方根百分比误差(RMSPE)分别为19.84%和15.9%。结果表明,与ARIMA模型相比,人工神经网络模型是一种更好的农产品价格预测模型。 As per the literature review, the ANN model is suitable for nonlinear time series data and the ARIMA model is suitable for linear time series data. Hence, future work will be focused on developing the hybrid model for forecasting of agriculture commodity price to overcome the limitation of the ANN model.
数据可用性
支持这项研究结果的数据来自网站"http://www.data.gov.in“由印度政府管理。
的利益冲突
作者声明他们没有利益冲突。
参考文献
- A. Das, M. Senapati, J. John,“农业信贷对农业生产的影响:印度的实证分析”,印度储备银行临时文件,第30卷,第2期2, pp. 75-107, 2009。视图:谷歌学者
- J. Ahmad, D. Alam, M. S. Haseen,《气候变化对印度农业和粮食安全的影响》,国际农业、环境和生物技术杂志,第4卷,第4期。2, pp. 129-137, 2011。视图:谷歌学者
- K. M. Sabu和T. K. M. Kumar,《农业预测分析:喀拉拉邦槟榔价格的预测》,Procedia计算机科学,第171卷,第699-708页,2020。视图:出版商的网站|谷歌学者
- D. Hellerstein和M. Scott,商品价格上涨对保护区计划的影响,经济研究局,华盛顿特区,美国,2011。
- a . C.哈维和P. H. J.托德,《用结构和Box-Jenkins模型预测经济时间序列:案例研究》,商业与经济统计杂志, vol. 1, no. 14,第299-307页,1983。视图:出版商的网站|谷歌学者
- F. X. Diebold,《宏观经济预测的过去、现在和未来》,经济展望杂志,第12卷,第2期2,页175-192,1998。视图:出版商的网站|谷歌学者
- J. E. Hanke, A. G. Reitsch和D. W. Wichern,业务预测,第9卷,普伦蒂斯-霍尔,美国新泽西州霍博肯,2001年。
- R. Gupta, A. Kabundi,和S. M. Miller,《预测美国实际房价指数:有和没有基础的结构性和非结构性模型》,经济模型第28卷第2期第4页,2013-2021,2011。视图:出版商的网站|谷歌学者
- C. Deb, F. Zhang, J. Yang, S. E. Lee, K. W. Shah,“建筑能耗时间序列预测技术综述”,可再生和可持续能源评论, vol. 74, pp. 902-924, 2017。视图:出版商的网站|谷歌学者
- A. Tealab, H. Hefny,和A. Badr,“使用神经网络预测非线性时间序列”,未来计算和信息学杂志,第2卷,第2期1,第39-47页,2017。视图:出版商的网站|谷歌学者
- J. H. Stock和M. W. Watson,预测宏观经济时间序列的线性和非线性单变量模型的比较,国家经济研究局,剑桥,马萨诸塞州,美国,1998。视图:出版商的网站
- 张光,B.艾迪·帕图沃,胡明颖,“人工神经网络预测:最先进的技术”,国际预测杂志第14卷第2期1,第35-62页,1998。视图:出版商的网站|谷歌学者
- B. Sharma, S. Kumar, P. Tiwari等,“基于人工神经网络的不分割双车道公路短期交通流预测,”大数据杂志,第5卷,第5期。2018年,第1 - 16页。视图:出版商的网站|谷歌学者
- G. K. Jha和K. Sinha,“使用神经网络模型的农产品价格预测:一个创新的信息传递系统”,农业经济研究综述第26卷第2期2, pp. 229-239, 2013。视图:谷歌学者
- Z. Tang, C. De Almeida, P. A. Fishwick,“使用神经网络与Box-Jenkins方法的时间序列预测”,模拟(第57卷)5,第303-310页,1991。视图:出版商的网站|谷歌学者
- K.-J。Kim,“利用支持向量机进行金融时间序列预测”,Neurocomputing,第55卷,第55期1-2,第307-319页,2003。视图:出版商的网站|谷歌学者
- K. Chakraborty, K. Mehrotra, C. K. Mohan, S. Ranka,“使用神经网络预测多元时间序列的行为”,神经网络,第5卷,第5期。6,第961-970页,1992。视图:出版商的网站|谷歌学者
- D. C. Park, M. A. El-Sharkawi, R. J. Marks, L. E. Atlas, M. J. Damborg,“使用人工神经网络的电力负荷预测”,IEEE电力系统汇刊,第6卷,第2期2,第442-449页,1991。视图:出版商的网站|谷歌学者
- T. Šestanović,“通货膨胀预测的乔丹神经网络”,克罗地亚业务研究报告,第10卷,第5期。1,第23-33页,2019。视图:出版商的网站|谷歌学者
- N. Caglayan, S. I. Satoglu和E. Nisa Kapukaya,《服装零售连锁店的人工神经网络销售预测》,大数据分析与决策中的智能与模糊技术瑞士Cham,施普林格,2019。视图:谷歌学者
- S. Singh, S. Hussain,和M. Abid Bazaz,“使用人工神经网络的短期负荷预测”,刊于2017第四届图像信息处理国际会议论文集2017年12月,印度西姆拉。视图:出版商的网站|谷歌学者
- 吴林,“基于GRU-CNN混合神经网络模型的短期负荷预测方法”,工程数学问题, vol. 2020, Article ID 1428104, 10页,2020。视图:出版商的网站|谷歌学者
- E. Dobrescu, D. I. Nastac,和E. Pelinescu,“使用级联神经网络自适应预测器的短期金融预测”,国际过程管理和标杆管理期刊,第4卷,第4期。4, pp. 376-405, 2014。视图:出版商的网站|谷歌学者
- M. P. Darji, V. K. Dabhi, H. B. Prajapati,“使用神经网络的降雨量预测:一项调查”,刊于2015年计算机工程与应用进展国际会议论文集2015年3月,印度加济阿巴德。视图:出版商的网站|谷歌学者
- G. Mahalakshmi, S. Sridevi和S. Rajaram,“时间序列数据预测的调查”,刊于2016计算技术与智能数据工程国际会议论文集(ICCTIDE’16)科维尔帕蒂,印度,2016年1月。视图:出版商的网站|谷歌学者
- N. R. Sanders和K. B. Manrodt,“实践中使用判断和定量预测方法的有效性,”ω第31卷第1期6,页511-522,2003。视图:出版商的网站|谷歌学者
- W. W. S. Wei,《时间序列分析》,牛津心理学定量方法手册,第二卷,牛津大学出版社,英国牛津,2006。视图:谷歌学者
- 答:Pankratz说道,单变量Box-Jenkins模型的预测:概念和案例,第224卷,John Wiley & Sons,霍博肯,美国纽约,2009。
- S. Makridakis和M. Hibon,“ARMA模型和box-jenkins方法论”,杂志的预测,第16卷,第5期。3,页147-163,1997。视图:出版商的网站|谷歌学者
- B. Krollner, B. J. Vanstone,和G. R. Finnie,《金融时间序列预测与机器学习技术:调查》,刊于第18届欧洲人工神经网络研讨会论文集2010年4月,比利时布鲁日。视图:谷歌学者
- S. Makridakis, E. Spiliotis,和V. Assimakopoulos,“统计和机器学习预测方法:关注和前进的方向,”《公共科学图书馆•综合》,第13卷,第2期3, p. 0194889, 2018。视图:出版商的网站|谷歌学者
- 张国平,“非线性时间序列预测的人工神经网络模拟研究”,中国科学(d辑),计算机与运筹学第28卷第2期4,第381-396页,2001。视图:出版商的网站|谷歌学者
- A. Maravall,《非线性时间序列预测的应用》,商业与经济统计杂志, vol. 1, no. 11,第66-74页,1983。视图:出版商的网站|谷歌学者
- K. W. Hipel和a . I. Mcleod,“用前馈神经网络预测非线性时间序列:加拿大山猫数据的一个案例研究,”杂志的预测,第24卷,第2期2,页105-117,2005。视图:出版商的网站|谷歌学者
- H. Do, K. U. Nam和A. Mano,“利用人工神经网络进行洪水预测的全球天气预报输出降尺度”,应用数学学报, 2011年第4期,文章编号246286,14页,2011年。视图:出版商的网站|谷歌学者
- T. H. Naylor, T. G. Seaks, D. W. Wichern,《Box-Jenkins方法:计量经济学模型的替代》,国际统计评论/国际统计杂志,第40卷,第5期。2,第123-137页,1972。视图:出版商的网站|谷歌学者
- Y. Lu和S. M. AbouRizk,《自动化box-jenkins预测模型》,自动化建设第18卷第2期5,第547-558页,2009。视图:出版商的网站|谷歌学者
- A. KumarMahto, R. Biswas, M. af沙尔·阿拉姆,《利用ARIMA:基于印度市场的农产品价格短期预测》计算和数据科学的进展,施普林格,新加坡,2019。视图:谷歌学者
- D. a . Dickey和W. a . Fuller,“具有单位根的自回归时间序列估计量的分布”,美国统计协会杂志第74卷第1期366页,427-431,1979。视图:出版商的网站|谷歌学者
- T. Kolarik和G. Rudorfer,《使用神经网络的时间序列预测》,ACM SIGAPL APL报价四,第25卷,第2期1,页86-94,1994。视图:出版商的网站|谷歌学者
- https://data.gov.in/resources/variety-wise-daily-market-prices-data-soyabean-2018(2019年7月8日生效)。
- 我。Cira, R. Alcarria, M.-Á。Manso-Callejo和F. Serradilla,“一种基于深度学习的解决方案,用于从高分辨率航空正射影像中大规模提取次级道路网络,”应用科学,第10卷,第5期。20,第7272页,2020。视图:出版商的网站|谷歌学者
- J. S. Armstrong和F. Collopy,“关于预测方法的概括的误差度量:经验比较,”国际预测杂志,第8卷,第2期1,第69-80页,1992。视图:出版商的网站|谷歌学者
- S. Kim和H. Kim,“间歇性需求预测的绝对误差百分比的新度量”,国际预测杂志,第32卷,第2期3,第669-679页,2016。视图:出版商的网站|谷歌学者
版权
版权所有©2021 Anil Kumar Mahto等。这是一篇发布在知识共享署名许可协议,允许在任何媒介上不受限制地使用、传播和复制,但必须正确引用原作。