利用自回归综合移动平均模型预测印度奥里萨邦水稻生产力和产量

摘要

利用单变量自回归综合移动平均(ARIMA)模型，对奥里萨邦的水稻面积、产量和生产力进行了预测，并与所有印度的预测数据进行了比较。自回归()及移动平均线(根据不同时间序列的偏自相关函数(partial autocorrelation function, PACF)和自相关函数(self - correlation function, ACF)图中的显著峰识别参数。ARIMA(2,1,0)模型适用于印度所有的水稻产量和产量，而ARIMA(1,1,1)模型最适合于奥里萨邦的水稻产量和产量预测。根据选择准则的最小值，即Akaike信息准则(AIC)和Schwarz-Bayesian信息准则(SBC)，采用最优拟合ARIMA模型，对紧接着的3年即2007-08、2008-09和2009-10进行预测。通过与实际值的百分比偏差和平均绝对百分比误差(MAPE)的比较验证了模型的性能，发现在奥里萨邦和印度的水稻种植面积分别为0.61和2.99%。同样，在奥里萨邦和印度，预测水稻产量和生产力的MAPE不足6%。

1.介绍

水稻是印度最重要的谷类作物之一，占地4192万公顷，年产量8909万吨，平均产量2.13吨^-1(2009 - 10) (http://www.agricoop.nic.in/）.它在国家粮食安全中发挥着至关重要的作用，并将继续保持这种作用，因为它具有更广泛的适应能力，可以在不同的生态系统下生长。大米占粮食总量的40.8%，仍是58%以上人口的主要生计来源。稳定的水稻面积约4200万公顷,停滞不前的状态,和/或生产率下降的趋势,尤其是在北部和南部区域和减少自然资源基地,维持当前水平的充分性的唯一机会是在旱作印度东部的巨大underexploited潜力(1］.

正确分析和预测这一重要作物在潜在的东部地区的产量趋势，具有多方面的意义。对生产和生产力的批判性分析是获得适当的生态学知识基础和获得最大可能潜力的适当研究/开发努力的先决条件。一些作者试图对木瓜和大蒜等作物进行趋势分析[2-4.］.生产的意外减少可降低农民的市场盈余和收入，并导致价格上涨。同样，生产的增加可能导致价格的急剧下降，对农民收入具有不利影响。对基本商品价格的影响在确定通货膨胀率，工资，工资和经济中的各种政策方面具有重要作用。适当的预测将为适当的盈余和赤字管理铺平方式，以稳定价格并确保农民的利润。

模拟建模和遥感等几种技术主要用于作物产量和面积的预测。但有时，在作物收获甚至播种之前就需要预测。这只能通过对过去的数据建模和获得预测来实现。利用自回归综合移动平均法(ARIMA)建立了基于过去数据的模型并进行了预测。ARIMA模型用于预测泰米尔纳德邦各种作物的可耕种面积、产量和生产力[5.那6.]和巴基斯坦的小麦生产[7.]及加拿大[8.］.各种作者使用Arima Models的各种作者也制造了单变量预测农业生产[9.-12］.

鉴于上述要求，本研究旨在（i）分析Otisha，东方印度州的稻米下的生产，生产力和面积，并与所有印度情景和（ii）预测和验证进行比较稻田，生产和生产力使用Arima模型。

2.材料和方法

2．1．数据收集

关于奥里萨邦水稻可耕种面积、产量和生产力的数据来自印度布巴内斯瓦尔奥里萨邦政府农业和粮食生产局发布的《奥里萨邦农业和统计》年度报告。印度的相同数据来自印度农业和合作部的经济和统计局。模型的建立和预测采用1950-1951年至2006-2007年的农业年数据。采用2007-08、2008-09和2009-10年的数据对模型进行验证。

2．2.趋势分析

利用Mann-Kendall趋势检验对奥里萨邦和印度的水稻面积、生产力和产量的时间序列数据进行了分析，以评估数据中存在的趋势。最初，这个测试是由Mann [13]和肯德尔[14]，然后得出检验统计量分布[15那16］.这个假设检验是非参数的，基于排名的方法来评估时间序列数据中趋势的存在。根据时间对数据进行排序，然后将每个数据点依次作为参考数据点，并与在时间上跟随的所有数据点进行比较。与参数统计检验相比，非参数检验被认为更适合于非正态分布数据[17］.由于研究中使用的时间序列数据大多是非正态分布，从表中给出的偏度和峰度值可以明显看出1，在研究中使用非参数测试。


参数	的意思是	中位数	标准偏差	Kurtosis.	偏态	Mann-Kendall趋势（值)	森的斜率（的）

全印度
区(百万公顷)	38.63	39.42	4.33	−0.83	−0.46	9.59	０．２６
生产力(公斤公顷^-1的）	1351.90	1234.55	435.12	−1.28	0．32	9.64	25.32
生产(几百万吨)	53.94	48.74	22.42	−1.27	0．31	9.81	1.31
Odisha
区(百万公顷)	4.29	４.３８	0．25	−0.62	−0.65	5.29	0.01
生产力(公斤公顷^-1的）	990.35.	967.00	305.89	−0.76	0.29	6.79	16.39
生产(几百万吨)	4.30	4．17	1.47	−0.76	0．24	6.98	0.08

Mann-Kendall检验统计量由在哪里和是顺序数据值，数据集记录的长度，和 Mann-Kendall测试有两个参数对趋势检测非常重要。这些参数是表示趋势的强度和斜坡幅度估计的重要性水平，其表示方向以及趋势的幅度。

对于独立的，相同地分布无随机变量，没有绑定数据值，我们有; 当某些数据值绑定时，校正是在哪里表示范围关系的个数．为大于10，测试统计量服从标准正态分布[14］.趋势斜率的大小也可以计算(Sen, 1968)。Sen对斜率的估计与Mann-Kendall检验相关如下: 在哪里和在时间被认为是数据值和（），相应地。这些中位数的值表示为斜率的Sen估计，给出的是的正值表示上行趋势，而负值代表着下行趋势。

2.3。阿玛玛模型

ARIMA模型分析和预测等间距单变量时间序列数据。ARIMA模型将响应时间序列中的一个值预测为其自身过去值的线性组合。ARIMA方法最初是由Box和Jenkins推广的[18， ARIMA模型通常被称为Box-Jenkins模型。在这项研究中，ARIMA进行的分析分为三个阶段[19］.

２.４.纯ARIMA模型的符号

考虑在哪里索引,为响应级数或者是响应级数的差值，是均值项，为倒移运算符，即:那为自回归算子，在逆移算子中表示为多项式:是否移动平均算子，表示为一个多项式的倒移算子,为独立扰动，也称随机误差。对于简单的差分,,在那里是微分的顺序。

识别阶段．对时间序列数据进行了平稳性检验，结果表明，除奥里萨邦水稻种植面积外，印度和奥里萨邦的水稻面积、产量和生产力均为非平稳性。nonstationery时间序列数据由一阶差分平稳,最适合ARIMA模型使用数据从1951年到2007年,开发用于预测可耕种的区域,生产和生产力的大米Odisha和印度未来三年,也就是说,2007 - 2008,2008 - 2009,和2009 - 10所示。

通过寻找非季节性参数阶数的初值，识别候选ARIMA模型。”和““这些数据是通过寻找自相关和部分自相关函数的显著峰值而获得的。在鉴定阶段，初步选择一个或多个模型，这些模型似乎能在统计上充分表示现有数据。然后利用最小二乘法对模型参数进行精确估计。

评估阶段．在诊断统计的基础上对ARIMA模型进行拟合并检验模型的准确性。

诊断检查．根据以下诊断选择最佳模型。

（i）低Akaike信息标准（AIC）．另类投资会议(20.的估算值,在那里和是可能的函数。

有时，SBC [21]也使用和估计．

(ii)残差自相关不显著．如果一个模型能够充分地表示一个时间序列，那么它应该能够捕获序列中的所有相关性，并且白噪声残差之间应该是相互独立的。

（iii）参数的意义．参数估计的显著性检验表明模型中的某些项可能是不必要的。

预测阶段．预测了时间序列的未来价值。

2．5．模型评价

使用如下定义的平均绝对百分比误差(MAPE)作为模型精度的衡量: 是预测变量,实际是可变的吗为变量的个数。

使用SAS 9.2软件(SAS Institute, Inc.， Cary, NC)进行时间序列分析，并开发ARIMA模型和预测。

3.结果与讨论

3.1。趋势分析

表中给出了奥里萨邦和印度水稻面积、产量和生产力的时间序列数据的描述性统计1．时间序列数据绘制在图中1．水稻面积、产量和产量的时间序列数据是非正态的，可以从它们的概率密度图和偏度和峰度值进行评估。因此，采用趋势分析的非参数Mann-Kendall检验来检验趋势的显著性。从曼-肯德尔的价值观就可以看出统计数字及森氏斜率估计()，所选取的所有分析参数的时间序列数据均呈现显著的正趋势。的Mann-Kendall值以及斜率的幅度表明，与所有印度情景相比，Otisha的面积，生产和生产率的增加率较低。

(一)

(b)

(c)

对1950-51年至2006-07年的长期时间序列数据进行趋势分析，发现水稻种植面积为正奥迪沙和印度的价值分别为0.01和0.26。低由于从城市化和工业化的竞争，稻米下的面积在过去10年内仍然或多或少不持续的价值。1997 - 98年和2006年至2006 - 07年，印度稻米下米的地区分别为4345万公顷，43.81亿公顷，而在同田稻米下的同一期间，从4.5亿公顷减少到4.45亿公顷。显而易见的是，在过去十年中，在稻米下的地区有平台，唯一可以增加水稻生产的选择是垂直扩张。

趋势分析还显示，印度所有水稻的平均产量都有了相当大的提高，从668公斤公顷^-11950-51年增至2131公斤公顷^-1在2006-07年和同一时期，奥里萨邦的水稻产量从520公斤公顷增加^-1至1557公斤公顷^-1．奥里萨邦的生产率增长率低于印度所有地区的平均水平，这从森25.32公斤公顷的斜率估计值就可以看出^-1年^-1和16.39千克哈^-1年^-1这表明，在奥里萨邦，水稻的生长潜力尚未开发。为了挖掘这一潜力，印度政府自2010-11年以来启动了“在印度东部带来绿色革命”项目。

3．2．建立ARIMA模型

自回归()及移动平均线()参数的识别是基于不同时间序列的PACF和ACF图的显著峰。在确定最佳拟合ARIMA模型时，适当的那,对应于选择准则的最小值，即AIC和SBC。表中给出了奥里萨邦和印度水稻面积、产量和生产力的最佳拟合模型以及AIC和SBC2．归属化和移动平均参数以及常数项的估计显示在表中3.．从"“所有的参数估计都是显著的，这是ARIMA模型的基本标准。从图中可以明显看出2（a）印度水稻种植面积的ACF在滞后1有一个显著的峰值，PACF逐渐下降(图1)3(一个))，表示为一阶移动平均模型。


参数	ARIMA模型	另类投资会议	南方浸信会

全印度
Area, million hectare	Arima (0,1,1)	165.33	169.38
Productivity, kg ha^-1	Arima (2,1,0)	674.76	680.84
生产几百万吨	Arima (2,1,0)	339.82	343.87
Odisha
Area, million hectare	Arima (2,0,0)	-46.67	−40.54
Productivity, kg ha^-1	阿里马（1,1,1）	746.61	752.69
生产、百万音调	阿里马（1,1,1）	144.27	150.34


参数	华宇电脑参数	估计	标准错误	价值

印度
Area, million hectare	μ	0．24	0.07	3.46
Area, million hectare	MA1	０．５２	0.12	4.46
Productivity, kg ha^-1	μ	25.14	3.99	6.31
	AR1	25.67	6.14	4.18
	AR2	−0.79	0.13	−6.10
生产、百万音调	μ	−0.36	0.13	−2.74
	AR1	−0.76	0.13	-5.76
	AR2	−0.30	0.13	−2.22
Odisha
Area, million hectare	μ	3.85	0.14	27.53
	AR1	0．50	0.12	4.18
	AR2	0.49	0.12	4.06
Productivity, kg ha^-1	μ	17.50	8.38	2.09
	MA1	0．56	0.16	3.54
	AR1	−0.33	0.18	−1.87
生产、百万音调	μ	0.085	0.04	2.17
	MA1	0.54	0.16	3.41
	AR1	−0.38	0.17	−2.25

重要,．

(一)

(b)

(c)

(d)

(e)

(f)

图2

^-1 ^-1 奥里萨邦和印度的面积、生产力和产量的自相关函数(ACF)。(a)印度面积(百万公顷);(b)生产力(公斤公顷)）在印度;（c）印度的生产（百万吨）;（d）Odisha的区域（百万公顷）;（e）生产力（kg ha）在Otisha;（f）Odisha的生产（百万吨）（图中的阴影区域为5％级别）。

(一)

(b)

(c)

(d)

(e)

(f)

图3

^-1 ^-1 奥里萨邦和印度的面积、生产力和产量的偏自相关函数(PACF)。(a)印度面积(百万公顷);(b)生产力(公斤公顷)）在印度;（c）印度的生产（百万吨）;（d）Odisha的区域（百万公顷）;（e）生产力（kg ha）在Otisha;（f）Odisha的生产（百万吨）（图中的阴影区域为5％级别）。

印度水稻生产力和产量的PACF在滞后2时出现同样显著的峰值，这表明ARIMA的二阶自回归模型，这是最适合的模型。PACF的滞后2有显著的峰值(图3 (d)）ACF逐渐下降（图2 (d))表示一个二阶和ARIMA的纯自回归模型并被发现是最适合的。图中滞后1的显著峰值2 (e)和2 (f)和数字3 (e)和3 (f)，对于ACF和PACF，表明Odisha的生产力和产量均为一阶自回归和移动平均模型。将拟合模型的残差绘制为ACF和PACF，均在限定范围内，表明ARIMA模型拟合良好。

3．3.使用ARIMA模型进行预测

米区，生产和生产力的观察和预测值以及偏差百分比的百分比4.．奥里萨邦2007-08、2008-09和2009-10年的水稻可耕面积预测值分别为4.46、4.45和444万公顷，偏差分别为- 0.22、0和- 1.60%。%偏差为负值，表示预测值高于实际值。同样，2007-08年、2008-09年和2009-10年印度平均耕地面积的预测值分别为43.88万公顷、44.12万公顷和4435万公顷，与实际偏差分别为0.07%、3.12%和−5.80%。


参数	多年的预测	实际值	预测的值	预测误差% (的）	日军在预测

印度
Area, million hectare	2007 - 08年	43.91	43.88	0.07	2．99
	2008 - 09	45.54	44.12	3.12
	2009 - 10	41.92	44.35	-5.80
Productivity, kg ha^-1	2007 - 08年	2202	2121.24	3.67	2.32
	2008 - 09	2178	2173.59	0.20
	2009 - 10	2125	2190.89	−3.10
生产、百万音调	2007 - 08年	96.69	92.22	4.62	5.41
	2008 - 09	99.18	95.26	3.95
	2009 - 10	89.09	95.92	−7.67
Odisha
Area, million hectare	2007 - 08年	4.45	4.46	−0.22	0.61
	2008 - 09	4.45	4.45	0.00
	2009 - 10	4.37	4.44	−1.60
Productivity, kg ha^-1	2007 - 08年	1720	1503.89	12.56	5.17
	2008 - 09	1529	1544.61	−1.02
	2009 - 10	1585.	1554.45	1.93
生产、百万音调	2007 - 08年	7.66	6.77	11.62	4.90
	2008 - 09	6.81	6.95	−2.06
	2009 - 10	6.92	6.99	−1.01

MAPE:平均绝对百分比误差。

奥里萨邦2007-08、2008-09和2009-10年的水稻产量预测值分别为1503.89、1544.61和1544.45公斤/公顷^-1偏差分别为12.56、−1.02和1.93%。奥里萨邦水稻产量的较大偏差(12.56%)是由于2007-08年水稻产量的跃升高于平均产量(见表)1）.印度2007-08年、2008-09年和2009-10年的水稻产量预测值分别为2121.24、2173.59和2190.89公斤/公顷^-1预测偏差分别为3.67、0.20和−3.10%4.）.

2007-08年、2008-09年和2009-10年，奥里萨邦水稻总产量预测分别为6.77万吨、6.95万吨和699万吨，预测偏差分别为11.62、−2.06和−1.01%。这是由于2007-08年的平均生产率较高。同样，印度的平均生产偏差分别为4.62、3.95和−7.67%。在印度和奥里萨邦，水稻种植面积的预测误差分别为0.07 ~−5.80和−0.22 ~−1.60。印度和奥里萨邦的水稻产量预测偏差分别为0.20 ~ 3.67和−1.02 ~ 12.56%。印度和奥里萨邦对水稻产量的预测偏差分别为3.95 ~−7.67和−1.01 ~ 11.62%。奥里萨邦和印度的所有预测参数的MAPE都在6%以内。

4.结论

水稻数据的趋势分析表明，奥里萨邦和印度的产量和产量都呈上升趋势;奥里萨邦的增长率低于全印度的平均水平。这可能是由于该州在农业经营和其他生物和非生物因素方面投入较少而未充分开发其潜力造成的。为了弥补现有生产力和潜在生产力之间的差距，可以在农民田间引入适合不同生态环境的水稻品种，同时引入营养和农艺管理措施。根据预测和验证结果，可以得出结论，ARIMA模型可以成功地用于预测奥里萨邦和印度接下来几年的水稻面积、产量和生产力。

突出了

(我)根据1950-51年至2008-09年的历史数据，对奥里萨邦相对于印度的水稻面积、产量和生产力进行了趋势分析。(2)利用ARIMA模型对奥里萨邦和印度的水稻面积、产量和生产力进行了预测。

利益冲突

作者声明本文的发表不存在利益冲突。

承认

作者感谢印度奥里萨邦卡塔克中央水稻研究所所长为开展这项研究提供了所有帮助。

参考文献

《弥补印度水稻产量的差距》，E. A. Siddiq主编缩小亚太地区水稻产量差距P. K.米纳斯、J. D.弗兰克和J. H.爱德华。那pp. 84–111, Food and Agriculture Organization of the United Nations Regional Office for Asia and the Pacific Bangkok, 2000.视图:谷歌学者
P. K. Sen，“基于肯德尔tau的回归系数估计”，美国统计协会杂志，第39卷，1379-1389页，1968年。视图:出版商的网站|谷歌学者
S. C. Srivastava, U. C. Sharma, B. K. Singh, H. S. Yadava，《印度大蒜生产概况:事实、趋势和机遇》，国际农业、环境和生物技术杂志，第5卷，第5期。4，第477-482页，2012。视图:谷歌学者
M. Mahesh和B. C. Jain，“切蒂斯加尔邦Raipur区木瓜面积、产量和生产力的复合增长率(CGR)”，国际农业、环境和生物技术杂志，第6卷，第2期1，页139-143,2013。视图:谷歌学者
D. Balanagammal，C.R. Ranganathan和R. Sundaresan，“泰米尔纳德邦的农业场景预测”时间序列分析“印度农业统计学会杂志，第53卷，第53期3，页273-286,2000。视图:谷歌学者|MathSciNet
P. Balasubramanian和P. Dhanavanthan，“作物产量的季节性建模和预测”，统计和应用，第4卷，第4期。2，页107-118,2002。视图:谷歌学者|MathSciNet
N. Saeed, A. Saeed, M. Zakria，和T. M. Bajwa，“使用ARIMA模型预测巴基斯坦的小麦产量”，国际农业生物学杂志，第2卷，第2期4，页352-353,2000。视图:谷歌学者
V. K. Boken，“利用时间序列分析预测春小麦产量:加拿大草原的一个案例研究”，农学期刊，第92卷，第2期6，页1047-1053,2000。视图:出版商的网站|谷歌学者
R. Indira和A. Datta，“州一级农业生产的单变量预测”，经济政治周刊第38卷第2期18，页1800-1803,2003。视图:谷歌学者
K. P. Chandran和Prajneshu，“用跳跃点方法描述国家油籽产量数据的非参数回归”，印度农业统计学会杂志，第59卷，第59期2，页126 - 130,2005。视图:谷歌学者|MathSciNet
K. K. Suresh和S. R. K. Priya，“利用ARIMA模型预测泰米尔纳德邦甘蔗产量”，糖技术，第13卷，第2期1，页23-26,2011。视图:出版商的网站|谷歌学者
Sarika, M. A. Iquebal，和C. Chattopadhyay，“使用自回归综合移动平均法建模和预测木豆(木豆)产量”，印度农业科学杂志第81卷第1期6，第520-523页，2011。视图:谷歌学者
h·b·曼恩，《反趋势的非参数测试》费雪，第13卷，第245 - 259,1945页。视图:出版商的网站|谷歌学者|MathSciNet
m·g·肯德尔等级相关措施， Charles Griffin，伦敦，英国，1975年。
R. M. Hirsch和J. R. Slack，“具有序列依赖的季节性数据的非参数趋势检验”，水资源研究，卷。20，没有。6，PP。727-732,1984。视图:出版商的网站|谷歌学者
T. Y. GaN，“加拿大大草原中的水皮趋势和可能的气候变暖”，水资源研究，卷。34，不。11，pp。3009-3015，1998。视图:出版商的网站|谷歌学者
窦磊，黄敏，洪勇，“黄土高原流域生态保护措施对径流响应影响的统计评估，中国，”水资源管理，第23卷，第2期。第10页，1935-1949,2009。视图:出版商的网站|谷歌学者
g.e. Box和g.m. Jenkins，时间序列分析。预测和控制， holden day，旧金山，加利福尼亚，美国，1970年。视图:MathSciNet
E. P. Box和G. M. Jenkins，时间序列分析：预测和控制， Prentice-Hall, Englewood Cliffs, NY, USA, 1976。
H. Akaike，“统计模型识别的新观点”，IEEE自动控制交易第19卷第2期6，第716-723页，1974。视图:谷歌学者|MathSciNet
A. Hirotsugu，“可能性和贝叶斯手术”贝叶斯统计，J. M.Bernardo，M. H. Rogoot，D.V. Lindley等，EDS。，PP。143-166，大学出版社，瓦伦西亚，西班牙，1980年。视图:谷歌学者

农业进展

摘要

1.介绍

2.材料和方法

2．1．数据收集

2．2.趋势分析

2.3。阿玛玛模型

２.４.纯ARIMA模型的符号

2．5．模型评价

3.结果与讨论

3.1。趋势分析

3．2．建立ARIMA模型

3．3.使用ARIMA模型进行预测

4.结论

突出了

利益冲突

承认

参考文献

版权

更多相关文章

相关文章