文摘

基于文献综述为粮食生产的影响因素和预测方法,实证分析中国粮食产量影响因素的回归方法,充分利用子集执行岭回归方法,套索回归方法。结果表明,(1)粮食作物的播种面积增加的主要原因是增加粮食产量,(2)农业化肥的使用和农村用电量的增加粮食产量的增长的驱动因素,(3)农业机械总功率的影响是有限的,和(4)自然灾害对粮食生产有一定的负面影响。

1。介绍

食品不仅是人民生存的基础,也是一个国家发展的基础。目前,中国的经济活动是稳定的,但外部环境是复杂和严重,经济面临下行压力,风险和困难有显著增加。如果有问题的食物供应和重要的农业产品,它不仅会导致物价上涨,这将导致经济发展陷入被动的情况下行增长和物价上涨,但也会影响社会稳定。因此,它是特别重要的,深化农业供应经济改革和提高粮食生产能力。有一些关键的策略降低农产品生产成本,并提高农民收入是提高农业生产力。农民收入水平是影响他们的动机和国家的食品供应的安全。的主要目标的结构性改革农业供应方面,如上所述2017年中央1号文件,是提高农民收入,保证充足的供应。农民收入的话题和减少城乡居民之间的收入差距作为一个“14日五年”时期在2019年和2021年中央1号文件中讨论再一次(1]。一般来说,每个人都明白土地是农民获得大部分收入。当粮食价格不变,提高效率和降低生产成本费用实际和有效的策略来增加农民的收入1,2]。

自改革开放以来,特别是家庭联产承包责任制的实施,由于农业相关政策的不断优化,农业技术的不断改进,市场经济改革的深化,以及红利发布的中国整体宏观经济的发展,中国的粮食产量大大提高3]。以2019年为例,该国的粮食总产量是6638.4万吨,实现“十六个连续丰收。”然而,由于不确定的影响因素,如产业结构的变化,增加粮食生产的限制因素,国际粮食市场的波动,中国粮食产量的进一步提高的空间逐渐缩小。因此,为了“确保粮食基本自给自足和绝对安全的口粮,“有必要澄清影响粮食生产的重要因素,确定进一步提高粮食产量的有效方法,继续做好稳定农业生产和保障供给和增加农民收入,促进高质量的农业发展,维护农村社会的和谐与稳定(4,5]。

基于先前的研究的总结粮食生产影响因素和预测方法,本文使用完整的子集回归方法,岭回归方法,套索回归方法进行实证分析的主要影响因素从1991年到2018年中国的粮食产量。

2。文献综述

粮食产量影响因素的研究主要从六个方面进行。首先,农业资源如耕地和水是硬约束对粮食安全。消食等人之间的关系分析了耕地数量和质量的变化和粮食生产,认为经济发展和工业化过程中,大量的农业用地被deagriculturalized,而负面影响粮食安全(1,6,7]。艾哈迈德Melesse和韩寒等人认为,耕地资源是农业生产最基本的物质条件,和数量的变化直接影响粮食生产和粮食安全7,8]。第二,人口规模和人口结构将影响食品安全。魏等人与冯认为人口增长和消费扩张,中国的未来耕地规模和人均耕地面积将进一步下降,人均粮食消费水平和粮食总需求将进一步增加2,9]。Yuqiu和雷认为,中国未来的人口结构的调整将进一步减少粮食总需求的增长速度(4]。在某种程度上,人口结构的变化对粮食安全产生积极的影响。消食等人,滔滔等人探讨了人口结构的变化对中国粮食安全的影响从供给和需求的角度。结果表明,人口老龄化和人口城市化的进步,消食等人都认为中国的食品安全受到了一个持久的负面影响1,10]。

与nonhealthy工人相比,健康的工人有优势在“理性”的选择。一方面,作为输入因素,健康人力资本参与劳动与其他生产要素和形成合理的总分配(7]。另一方面,由于劳动强度的适应性强,可以避免无条件的过度。消食等人的研究和魏等人指出,人力资本在农业生产效率的影响将改变与耕地的规模。然而,也有一些文献的贡献人力资本在农业生产并不重要1,2]。镜泊湖,元湘和钟山发现,人力资本的积极作用促进农村经济增长,但贡献率很低(3,11]。甚至一些学者像撒努斯和辛格Xuejiao海峰表明人力资本对农村经济增长的影响不显著,有时甚至起到了负面的作用。第三,研究了城市化与粮食安全之间的关系(12,13]。王上进行了一次实证研究城市化与粮食安全之间的关系用31个省的面板数据,从1997年到2015年的城市。结果表明,城市化的发展有不利影响的食品安全(14]。Cai以河南省为研究对象,发现快速城市化对粮食生产施加约束,和大量的农村劳动力搬到了城市。城市和城镇的扩张引起了大面积的农田转化为非农业用地,这导致了增加粮食安全压力(15]。四是农业技术进步如何影响粮食安全。杜消食等人,认为农业技术进步对粮食安全的影响,并有必要增加投资农业技术进步和提高了使用先进的农业技术,提高食品安全水平(1,16]。第五,气候变化对粮食安全的影响已经被考虑。陈和谢Chih-Ming相信气候灾难将严重影响粮食生产和粮食生产的平衡系统,需要建立一个农业气象灾害防御系统来改善中国的食品安全级别(17,18]。Chih-Ming和秋等人认为,气候变暖将威胁到中国的粮食安全。它也将改变全球粮食贸易模式和增加不稳定的因素18,19]。除了上述因素外,现有文献还从更微观的角度研究,如干旱、如何使用生物质能,基因改造影响食品安全。

从主要影响因素的角度,研究主要集中在回归和灰色关联分析。例如,阴等人使用数据从1991年到2005年和2006年至2010年进行灰色预测和灰色关联分析。结果表明,灌溉面积,农业生产资料、农业产品价格和粮食播种是影响粮食生产的主要因素20.];哉等人使用逐步回归进行回归分析12日河南省粮食生产影响因素,确定主要影响因素是施肥,农药应用程序,和农业是三个费用施肥,农药应用、农业技术和种植面积(21];Qiling和张还利用逐步回归方法对六个影响因素进行实证分析中国的粮食生产在2000 - 2015年。面积是影响粮食产量的一个重要因素22]。考虑到存在多重共线性,许多学者也用岭回归减少共线性问题对参数估计的影响,使回归结果更具有经济意义。例如,黄的定量分析中国粮食生产的影响因素基础上修订CD生产函数和岭回归和使用数据从1990年到2008年。结果表明,增加机械输入和改善灌溉条件可以提高粮食产量,而劳动力投入和化肥输入没有粮食产量的增加,驱动因素和自然灾害对粮食生产仍有很强的负面影响,和食品生产规模收益递增(23]。

从粮食产量预测的角度来看,除了上述理论和模型,时间序列模型,支持向量机和BP神经网络的主要研究热点。张等人使用数据从1978年到2009年,移动平均模型ARIMA来分析和预测中国粮食生产。结果表明,光滑的ARIMA模型的精度高于ARIMA模型(24]。过滤器分析方法分离从1949年到2008年中国粮食生产的时间趋势系列和波动。多项式模型建立了时间序列的趋势系列、频谱滤波法估计和粮食产量的波动周期。上述两个模型叠加预测中国的粮食产量在未来10年25];李使用粮食生产系统的灰色关联分析来确定主要影响因素的复杂性和不完备的粮食生产体系,结合支持向量机建立一个预测模型(26]。此外,许多学者结合灰色关联理论和逐步回归方法与BP神经网络,前者决定了所使用的指标,后者是用来预测粮食产量27,28]。套索的思想方法是绝对的和系数不能太大。在这个前提下,运用普通最小二乘法,残差的平方和最小(28]。为了确保中国居民的膳食平衡,谷物消费的影响因素研究是有价值的。他们第一次使用套索方法选择谷物消费的主要影响因素,然后,他们建造了一个部分线性半参数模型预测中国居民的谷物消费。结果表明,人均消费影响因素的大米,小麦和玉米不同于另一个和三个谷物的共同影响因素和有区别;人均可支配收入是一个线性正相关关系的共同因素三种谷物的消费;本文构建的模型是安装和可以准确预测谷物的消费;的人均消费大米、小麦和玉米预计78.56公斤/年,62.73公斤/年和6.64公斤/年,分别在2025年,这是过度,饮食结构不合理造成的,食物浪费、加工损失(29日]。

其他模型使用整个信息所产生的光谱测量,介绍了岭回归等Tikhonov和广义马尔和Kennard30.,31日]。这种类型的多元线性回归包括多元模型回归系数的收缩和减少他们相同的程度(25]。埃尔南德斯等人的研究评估能力的树冠反射率光谱范围从350到2500海里预测粮食产量在一个大型面板(368基因型)的小麦(小麦l .)通过多元岭回归模型。植物治疗三个政权在地中海水条件下的智利中部:严重水分胁迫;轻度水分胁迫;和完整的灌溉意味着1655年的粮食产量,4739,和7967公斤·哈−1,分别。模型由反射率数据在开花期和灌浆期在77%和91%之间的所有的水机制解释粮食产量变化,在严重水分胁迫条件下最高的值。当个体模型被用来预测收益率在其余的试验评估,模型安装在开花期在轻度水分胁迫下表现最好。结合模型使用数据从不同的水政权和每个物候阶段被用来预测粮食产量,以及确定的系数( )开花期和灌浆期增加到89.9%和92.0%,分别。生成的模型在开花期在轻度水分胁迫是最好的预测收益率时应用于其他条件。比较与常规反射指数,显示较低的预测能力。得出结论,一个岭回归模型使用一个数据集基于光谱反射率在开花期和灌浆期是一种有效的方法来预测粮食产量的基因型在不同水政权(32]。

一般来说,研究粮食生产的主要影响因素,逐步回归只能减少变量没有真正解决多重共线性下的参数估计偏差。岭回归有一定的主观性在变量选择,它只适用于减少多重共线性。在粮食产量预测方法的研究,结合机器学习相关模型方法和模型被研究人员青睐,但在一个小的数据量的前提下,很容易产生训练误差和大型泛化误差小,及其multiperiod预测的结果不如多元线性回归的方法。因此,在考虑各种理论和方法之后,本文选择相关解释变量尽可能全面和使用完整的子集回归,套索回归,和岭回归分析进一步实证分析选择变量,以减少共线性的影响,找出主要的影响因素。

3所示。变量的选择

从输入和输出的角度来看,影响中国粮食生产的主要因素可分为四类:(1)自然条件,(2)劳动力投入,(3)技术,和(4)政策和其他因素12,20.,21,27,33- - - - - -35]。

自然条件的限制主要体现在三个方面:土地,水,和气候。粮食生产、土地的对象是劳动力和生产资料的人是“财富之母。“它的面积和土壤类型将直接决定食物的输出。中国地域辽阔,南北跨度大。地理和环境差异导致水资源时空分布不均,以及气候条件的差异很大。在许多地方水资源相对匮乏,干旱和洪水是无穷无尽的,这就极大地限制了食品生产(21,27,34,35]。

劳动力投入和技术水平需要考虑在一起。一方面,劳动力投入,也就是说,实际数量的劳动力投入在生产过程中,随着社会经济水平和其他因素不变,增加劳动力投入会导致粮食产量的增加。一方面,科技的进步意味着劳动生产率的提高,土地利用率的提高,还是资源经济效率的提高,因此,当其他因素保持不变,用更少的劳动力投入获得更大的输出(22]。

基于上面的分析和数据的可用性,本文选择10个变量影响粮食生产,播种面积、受灾地区,受灾地区在考虑自然条件。第一产业的从业人员数量在考虑劳动力投入,有效灌溉面积、施肥、农村用电、农业塑料薄膜的使用和农药的使用在考虑技术。见表12获取详细信息。

所有的研究数据来自国家统计局的官方网站和数据中心,和时间跨度从1991年到2018年。此外,为了消除维度并解释最终结果的影响,本研究也进行对数处理所有数据。数据的描述性统计如表所示2

4所示。相关分析

1变量的散点图被选中为当前的研究。从图可以看出1有一个清晰的粮食产量和所选变量之间的线性关系。除了粮食作物的播种面积,也有明显的其他变量之间的线性关系,表明可能存在多重共线性问题时直接进行回归。值得注意的是,与就业人数增加的主要产业,粮食的产量表现出下降的趋势。这并不意味着减少第一产业的就业人数,导致粮食产量的增加。这意味着农业产业技术的进步在很大程度上弥补劳动力投入的减少,表明在分析食品生产的问题时,可以暂时忽略劳动力投入的解释变量(27]。进一步,可以看出它是灾区和灾区的影响从而影响生产的国家,有不同的影响在中国选定的变量。还可以看到,除了灾区和灾区,所有其他变量相互之间有直接的联系。粮食作物的播种面积显示季节性关系所有选中的变量和季节性的起伏。

2变量的相关系数矩阵。从图2,我们可以看到,(1)之间的相关系数的绝对值所选自变量和因变量是大于0.7,表明线性关系是显而易见的。(2)除了粮食作物的播种面积,也有明显的其他独立变量之间的线性相关性,表明可能存在严重的多重共线性问题时直接执行回归(28]。

关于共线性问题的测试,除了使用相关系数来帮助判断,目前有两种主要方法:(1)判断是否存在共线性问题基于条件数和(2)判断是否存在共线性问题基于方差膨胀因子(22]。

条件数的数学表达式如下: 在哪里 特征值和 是自变量矩阵。一般来说,当 ,多重共线性的程度被认为是小;当 ,多重共线性是存在;当 ,严重的多重共线性是存在的。删除后的独立变量 ,自变量矩阵的条件数由剩下的独立变量为3984.441,远远大于1000 (7,8,34]。

通货膨胀因素方差计算公式如下:

代表 使用变量通过线性回归 作为因变量和其他 变量作为独立的变量。一般来说,我们认为存在多重共线性问题当通货膨胀因素方差大于5或10。当通货膨胀因素方差大于100年,存在严重的多重共线性问题[3,7,25]。

计算后,各种变量的方差膨胀因子如表所示3。从这个表中,我们可以清楚地看到,除了 ,其他变量的方差膨胀因子都是高于10,其中大多数均高于100年,这表明自变量之间存在严重的多重共线性问题,和线性回归不能直接执行。

5。实证分析

5.1。完整的子集回归分析

逐步回归模型意味着会增加(或减少)一个变量一个接一个,直到它达到一定停止准则。然而,在实践中,虽然逐步回归分析可以找到一个好的模型,它不能保证模型是最好的。因此,本文使用完整的子集回归分析来分析可能的组合的变量(34,35]。结果如图所示3

从图3,我们可以看到,基于调整 - - - - - -平方,最佳子集包含五个变量,它们 , , , , 在此基础上,建立了回归方程,结果如表所示4

从上面的表中,我们可以看到五个解释变量的回归系数都显著非零,但总功率的回归系数代表的农业机械 变量是负的(25,28]。的主要原因是存在的多重共线性13,16]。

5.2。套索回归分析

套索回归是一个带有偏见的估计回归方法可用于共线的数据分析。它与普通最小二乘回归的不同之处在于,它添加了一个1-norm惩罚项在估计过程中(14,28,29日),它是用数学公式表示如下:

使用R操作套索回归,Cp值计算结果如下表所示。

5显示的值Cp统计变量选择的每一步。其中,可以看出步骤10的Cp值是最小的,也就是4.6649。每个变量的相应系数表6可以看到,只有吗 , , , , 不为零,系数是1.420427,0.196403,0.043928,-0.03694和-0.0474。这表明粮食作物的播种面积对粮食生产产生重大影响,和纯施肥数量,农村用电量,灾区也可以影响粮食生产。

5.3。岭回归分析

岭回归也是一个有偏见的估计回归方法可用于共线的数据分析。回归系数更实用和可靠的代价是失去了一些信息和降低精度,和它适合大量的条件(病态数据)(31日,32]。其他模型使用整个信息所产生的光谱测量,介绍了岭回归等由李任和广义李et al。27,28]。这种类型的多元线性回归包括多元模型回归系数的收缩和减少他们相同的程度(25]。

与套索回归相比,岭回归估计过程中添加一个2-norm惩罚项,它是用数学公式表示如下:

使用R操作直接岭回归,结果如表所示7:

从上面的表可以看出变量 的系数是积极的(27),这是符合经济规律,但系数并不显著非零。因此, 变量被排除在外,我们再次进行岭回归。最后的岭回归结果如表所示8

删除后的岭参数 变量是0.03450807。它相对较小,这表明,尽管估计是有偏见的,最小二乘估计的偏差结果并不大。标准化回归系数的比较,我们可以清楚地看到,粮食作物的播种面积对粮食生产有更积极的影响,其次是纯农业化肥和农村电力消耗的应用程序,和灾区对粮食生产的负面影响相对较大,这与套索回归结果基本上是一致的。

6。结论

考虑前面的回归分析的结果,我们可以得出以下结论:(1)粮食作物的播种面积增加的主要原因是增加粮食产量。后全面回归三个回归结果的分析,我们发现变量的弹性系数 上面都是1,这表明播种面积的增加可以显著增加粮食产量的增长(2)农业化肥的使用和农村用电量的增加粮食产量的增长的驱动因素。从实证分析中,我们可以看到,除了播种面积,大量的肥料应用于农业和农村用电量明显积极的三个模型,和回归系数比其他变量相对较大,表明他们确实有效地促进了粮食产量的增加(3)农业机械总动力对粮食产量影响有限。农业机械的总功率的影响籽粒产量是不一样的在这三个模型。农业机械的总功率的弹性系数是负的全子集回归,和弹性系数是正的岭回归和套索回归但不显著。这个结果意义的主要原因可能是由于合适的变量选择过程图中列出3在哪里运行完整的子集回归只有5变量选择显示对因变量的影响。第二,它可能是数据的时间跨度太长,导致机械投入对粮食产量的影响不明显(4)自然灾害对粮食生产有一定的负面影响。从上面的三个回归模型,我们可以看到在灾区每增加1%,粮食产量将减少0.05%左右,表明自然灾害对粮食生产仍有一定的负面影响。它仍然需要巩固农业生产抵御自然灾害的能力

数据可用性

所有的数据、模型和代码生成或使用在研究出现在提交文章。

的利益冲突

作者宣称没有利益冲突。

确认

本研究支持的中央大学基础研究基金(批准号。HIT.HSS。202233年,HIT.HSS。20.2118,和HIT.HSS.201851).