文摘

企业财务管理是一项乏味的工作,它是一个复杂的事情仅仅依靠财务人员的人力资源管理。与智能算法和机器学习算法的不断发展,新的想法被带到企业财务风险评估。这种方法不仅能节省大量财力、物力也提高企业财务风险评估的准确性。与机器学习算法相比,随机森林和支持向量机等极端的梯度提升(XGBoost)算法是更广泛的使用,它有独特优势的速度和精度。本研究选择XGBoost学习算法来预测企业财务的风险评估。在这项研究中,数据预处理方法用于预处理和分类有效的企业财务数据来源,然后XGBoost算法是用来评估企业财务数据的风险,并最终建立一套企业财务风险评估模型。XGBoost模型的研究结果表明,本文中选择具有较高可靠性预测企业的财务风险评估和预测误差都在3%以内。预测的最大误差仅为2.68%,来自企业的利润和亏损的财务状况。最小的误差仅为0.56%,这是一个值得信赖的公司财务预测误差。之间有高度的相关性的类型企业财务风险评估和风险的实际类型。 At the same time, this paper also has a good dependence on the preprocessing method of enterprise financial data.

1。介绍

公司的经营状况和发展趋势的财务公司发展的重要步骤。随着经济全球化的发展和电子商务的发展,公司的财务状况是特别重要的,这关系到公司的发展和未来1- - - - - -3]。传统企业融资仅依靠财务经理利用专业知识来解决乏味的企业融资,这是不仅效率低下,而且出错率较高。与此同时,传统的企业财务管理方法不能有效预测未来金融发展的公司,这限制了公司制定的商业策略。同样,与随机经济的不断发展,公司的业务并不局限于自己的财务,甚至可能面临国际商务或电子商务业务,这将产生各种繁琐的财务数据。这些公司财务数据是重要的担保公司风险评估(4,5]。公司的金融风险评估是非常重要的公司的长期发展。如果一个合理的预测和风险评估可以基于公司的金融发展,这将非常有利于公司的财务和长期操作。因此,使用该公司日常财务信息合理地评估公司发展风险是极其有意义的工作和研究。近年来,随着机器学习算法的不断发展和计算机硬件设备的不断进步,算法能够处理高度非线性、高维数据的出现,这非常有利于企业财务数据的智能风险评估(6- - - - - -8]。由于公司财务数据之间复杂的非线性关系,很难找到这些财务数据之间的相关性仅依靠财务人员的专业知识,也是一项艰巨的任务来预测该公司风险通过这些公司财务数据9]。机器学习算法可以找到一些数据之间的映射关系和复杂的非线性关系,从而解决公司财务数据之间的关系和公司的风险水平。有很多种机器学习算法,它可以找到合适的算法根据数据的性质和公司财务数据之间的关系和风险水平。如果公司财务数据可以结合机器学习算法,它将很好的为更好地评估公司风险水平(10,11]。

许多经济研究人员已经做了很好的工作研究和评估企业融资和风险水平,产生了许多有价值的研究。这些研究将会有一个好的指导意义的操作公司财务和风险水平的评估。在供应链金融业务信用风险,Zhang et al。12建立了供应链风险评估模型运用KMV模型和相关函数,有效量化信用风险。结论表明,该风险评估模型可以预测供应链的污染风险,这对商业银行是一个有意义的研究。Aisaiti et al。13)进行有效的金融业务和风险评估对中国农村的农民。他们使用的知识依赖的变量和中介变量有效地评估金融业务的利润和风险的观念。这项研究的结果表明,模型的强化因素之间的正相关影响感知利益和风险评估。这是有价值的对农村金融业务的风险评估。徐et al。14)建立了一个复杂的网格评价模型与网络金融的风险评估任务为研究对象。他们把互联网金融网络分为子系统模型如subsupervision金融网络和子网监督,研究了传播不同的风险因素之间的关系。他们得出的结论是,整个互联网的中心点是风险传播的主要因素,这对网络金融的发展是有价值的。(15)进行有效的分析和预测在贸易信贷融资风险评估任务(TCF)和信用担保(PCG)融资。他们提出一个条件风险价值系统和最小二乘方法来评估决策者的风险态度。结果表明,平衡风险评估模型和初始投资成本会影响零售商的风险态度。王等人。16)主要进行充分研究模型滞后和高信息风险水平的问题银行和企业之间的供应链金融业务。他们使用物联网技术和存款和贷款融资模式建立供应链风险评估模型。结果表明,本文建立的风险评估模型基于物联网技术有利于降低企业的经营风险。同时,该模型具有一定的参考意义,为企业减少金融危机。朱和华17)认为,当前的互联网金融行业有一定影响银行和宏观经济的发展,金融行业和互联网有一定的风险。他们使用系统性未定权益分析(SCCA)模型来评估和预测财务风险在银行业。通过这个模型,他们评估了互联网对银行业的影响,得出的结论是,银行业的风险在未来将继续上升。Wulandari et al。18)生产风险评估基于金融产品风险和融资提供商之间的相关性在园艺农场。他们介绍了变异系数等参数,偏斜度和峰度衡量风险银行商业贷款和生产之间的关系。他们的发现可以帮助农民充分理解风险融资和生产之间的关系。Qi et al。19)使用随机森林(RF)方法分析和分类在互联网金融和金融风险有效使用BP神经网络方法预测风险。王旭和刘刚(20.)提出了一个创新的金融风险预测模型基于物联网技术和反向传播神经网络(摘要)的方法。结论表明,基于物联网技术的风险评估模型和神经网络技术具有较高的精度。

企业融资的风险评估是非常重要的一个公司的长远发展。目前,大量的研究人员已经进行了许多研究企业融资的风险水平和公司财务的预测(21]。从上面的文献综述,可以看出有很多的研究数学模型对企业财务数据的使用,但是有风险评估相关的研究相对较少,而且有更少涉及机器学习算法的模型(22,23]。基于XGBoost模型,执行高效的分类任务对企业财务数据和企业财务数据的风险评估。从时间和成本的角度来看,它具有一定的价值和意义的公司的财务预测和风险评估。

本研究的目标是有效地公司财务数据,进行分类,本文需要完成公司基于公司的财务风险水平评估分类信息。本文组织如下。部分1主要介绍了公司融资的发展现状和公司的风险评估。部分2介绍了连接和公司融资的必要性,风险评估,和机器学习算法。部分3主要介绍了XGBoost算法和分类方法。部分4说明了XGBoost算法的可行性和准确性的分类和风险预测企业财务数据。本研究主要使用一些统计参数来预测XGBoost算法在预测企业财务管理的因素,如企业的利润和亏损,企业贷款,和其他因素。这些统计参数主要是预测误差、分类率,和预测热点分布地图。最后一部分是本文的总结。

2。XGBoost算法的重要性,公司的财务风险评估和财务风险预测的数据源

2.1。XGBoost算法进行财务风险预测的意义的公司

机器学习算法可以将非线性映射关系公司的财政和金融风险,这是一种传统的金融方法无法实现(24,25]。公司财务数据包括公司销售业绩、员工绩效、银行贷款和其他数据。这些数据是一个复杂的关系,但这些数据也会影响公司的发展,而且还可以为公司提供一个良好的风险评估(26]。如果公司的财务风险评估可以做得很好,它可以帮助公司避免一些财务风险,从而确保公司的长远发展和正常运行27- - - - - -29日]。传统的金融方法是财务人员总结和分析公司的财务记账和其他方法,然后做一个粗略的预测公司的风险水平根据财务数据的发展趋势。这种预测方法很难保证公司风险水平的准确性。财务人员往往依赖于财务分析等软件Excel和金融专业知识来分析公司的财务整合,这是一个非常困难的任务发现的非线性和复杂的公司财务状况之间的关系。机器学习算法是一种算法,专门处理复杂的数据之间的关系(19]。它不仅可以完成财务数据的分类也完成回归预测公司的财务数据。此外,这些机器学习算法节省时间和财力。XGBoost是成熟的算法预测精度较高的机器学习算法。与决策树、支持向量机相比,它也是一种很好的体现集成学习的想法30.]。XGBoost算法不仅可以有效地分类公司财务数据还地图公司财务数据和公司之间的关系风险水平,以完成风险评估任务无法完成财务人员。

2.2。一个公司的财务风险评估所需的数据集

本研究的主要目的是对公司财务数据的类型进行分类,并将使用XGBoost算法完成公司风险级别评估基于这些公司财务数据。本研究选择大公司的财务数据进行研究和分析风险评估模型研究。根据本文的研究目的,首先,五金融数据公司的损益数据,银行贷款,员工绩效,电子商务损益和跨境业务被用作数据源的研究(31日]。也有巨大差异的大小和类型的这些数据。很难评估公司风险水平仅依靠财务人员的专业知识基于这五个类型的财务数据。这五个类型的公司财务数据前需要预处理和分类可以作为输入数据为公司风险等级评估模型。XGBoost算法是一种处理算法,它使用多路径决策树分类和回归数据源。在这项研究中,该公司财务数据输入到XGBoost算法作为一个整体数据源,和五分类类型的公司融资是通过该算法完成的。映射的算法就完成任务的公司财务数据对公司的风险水平。最后,本文将预测该公司风险水平基于这五个类型的公司财务数据。一旦XGBoost模型训练,只有五个类型的企业提供财务数据来预测企业财务风险水平和风险的趋势。

3所示。介绍公司财务数据分类和风险评估预测算法和数据预处理

3.1。介绍XGBoost算法

XGBoost算法的全名是极端的梯度增加,它通常用于一些比赛和实际工程应用,及其分类和回归效果显著。这是一个大规模并行提高工具的树木,它主要是一个多路径决策树的计划。它可以用于分类任务和复杂的数据,它也可以用于回归任务复杂的数据。此外,它有一个更高层次的准确性和鲁棒性比其他机器学习算法。图1显示XGBoost的工作流模式采用在这项研究中,主要分成两个工作流:分类和预测。在第一步中,这项研究需要进行预处理的五个类型的数据源收集在公司的财务方面的大小和类型。在第二步中,这五种类型的公司财务数据需要由XGBoost分类算法。在这些公司财务数据准确XGBoost模型分类,分类公司财务数据将被用来预测公司的风险水平,通过XGBoost回归性能的发展趋势。在这个回归预测过程中,给定的输入和输出标签数据预测模型是必需的。本文将选择五个类型的公司的财务数据作为输入XGBoost预测模型和使用公司的财务风险模型的趋势和水平作为输出。一旦这个模型训练,一些最优权重和偏见适合预测公司的财务风险。XGBoost模型训练时,本文将选择一些金融数据的公司并没有参加训练预测测试模型的准确性和可行性。一般来说,左边的XGBoost用于企业管理的分类任务数据,这是这个模型的第一步。右边的XGBoost用于预测企业财务数据的任务。 The input of this XGBoost comes from the classified data.

3.2。XGBoost算法的描述和介绍回归预测

机器学习算法的发展受限于计算机硬件的发展。早期的机器学习算法,决策树等一些优秀的算法,随机森林,支持向量机出现。这些算法各有自己的优点和缺点,他们也有自己的优点和缺点不同的问题。集成学习是一种新的学习理念,充分结合了这些算法的优点和丢弃他们的缺点。同样,这些算法更适合于分类和回归的任务。摘要XGBoost选择也是一种机器学习算法,主要用于各种大型比赛项目和实际工程应用,表明该模型比其他机器学习算法具有更好的精度。GBDT算法只使用损失函数的一阶导数的计算,而XGBoost算法使用的损失函数二阶导数的操作,和一个正则化项添加到目标解决方案功能,可避免过度拟合。合并后的现象相比GBDT算法。与GBDT算法相比,XGBoost算法匹配算法的计算复杂度和过度拟合的发生。决策树方法是XGBoost的基本算法之一。 The decision tree continuously divides the data to be classified or returned according to the number of nodes. It is only divided in the case of a tree. The XGBoost method is a bunch of decision trees, and the comprehensive results of these decision trees are output as the final predicted value.

2显示了应用程序的过程中的XGBoost方法公司财务风险评估。图2只是为了说明XGBoost申请过程的企业财务数据的分类,所以只有3类型的企业财务数据列在这里,和决策树的分支用于本文是5。类似于决策方法,它首先将原始数据划分为不同的节点按照一定的权重。不同的决策树方法,决策树只依赖于分类或回归原理划分节点,它只是分裂的一棵树。但XGBoost是一个集成的理念,将决策树划分为多个树根据不同的划分原则,最后结合这些分裂节点输出的预测价值。这个XGBoost方法可以提高预测精度与一台机器学习算法相比,但该方法的计算复杂度将大大提高。之间存在着复杂的关系公司财务数据和公司风险,且仅依赖一个分类的原则将导致不准确的结果。因此,本文选择XGBoost的分类和风险预测方法。企业财务数据往往巨大,如此之深的学习方法不适合企业财务数据预测风险的任务。因此,深入学习策略需要大型计算机系统的培训与学习。考虑到时间成本和材料成本以及模型的准确性,XGBoost更适合公司的财务风险预测的任务。

XGBoost类似于神经网络方法,该方法还需要非线性操作重量和偏见,这些计算值需要总结。方程(1)代表一个公司的财务风险的预测价值评估。

方程(2)代表XGBoost的损失函数模型,根据不同的研究对象可以选择。本文选择的形式均方差分方程所示(2)作为财务风险预测的损失函数。

解决XGBoost实际上是一个最小化损失函数的过程,也就是说,寻找的过程真值之间的误差最小,预测的平均价值。方程(3)显示了损失函数最小化的过程。

从前面的描述,我们可以明白XGBoost算法的核心是一个集成算法的概念。方程(4)显示的过程决策树分支整体操作。它解决了多个决策树和平均的预测价值。

XGBoost的核心是集成的想法,也就是说,每棵树不断添加到这来获得最好的促进效果。方程(5显示第一个决策树的操作方法。

方程(6)显示了第二棵树的集成过程,可以看到,它是集成的第一决策树操作的结果。

通过方程(5)和(6)的操作XGBoost一体化进程可以被理解的细节,和n决策树是参与XGBoost操作过程。方程(7)显示的一体化进程K树的情况。

它类似于神经网络方法,XGBoost方法是学习样本数量的增加,模型容易过度拟合,这很容易导致贫穷的准确性测试集。方程(8)和(9)罚函数添加到原来的基础限制损失函数的过度拟合。

减少损失函数的过程需要损失函数的推导,其中包括许多衍生品业务。方程(10)和(11)显示最小化损失函数的推导规则。

解决方程求导后(10)和(11),它需要带回损失函数来解决目标价值。方程(12)显示了这个过程。

3.3。对公司财务数据的预处理操作

通过部分2。2,它可以清楚地理解,本文选择了公司的财务数据对该公司的风险评估和预测。同时,数据,如公司的损益状态,员工绩效,银行贷款被选为学习本研究的数据。可以看出,这些数据有一定的大小和类型的差异,这些数据也可能空缺或离群值,这就需要这些数据的预处理。本文将使用标准的处理方法规范化这些公司的财务数据和财务数据将被加工成正态分布的数据。收集财务数据预处理后,他们将进入XGBoost模型矩阵形式的分类和预测任务。本研究主要预测五因素,如利润和损失,贷款情况,并在企业财务管理员工绩效。因此,分类的数量(5)和学习因子(0.001)在本研究选择。决策树分支是选为3。

4所示。企业财务数据分类的准确性和可行性分析和风险评估预测

本文包括两个过程的风险评估和预测公司的财务数据,财务数据的分类任务类型和风险评估的预测水平。图3显示了错误的分类XGBoost公司财务数据的方法。一般来说,XGBoost分类算法适用于分类任务的企业财务数据类型。可以清楚地看到,分类误差都在3%以内,这是一个可以接受的误差范围为企业财务数据分类任务。最大误差为2.48%,最小误差为0.56%。其他三个财务数据的分类错误类型这两个误差范围内。最大的错误来自于公司的利润和亏损状态。相对较大的误差的原因可能是公司的产品的变化多变,以及它们之间的复杂性是更复杂的比其他四种类型的财务数据。最小的误差主要来自员工的性能因素,因为这部分财务数据相对稳定,变化很小。我们可以提高这部分的分类误差的增加样品的数量这部分财务数据通过XGBoost算法。图4更直观地显示了错误的热量分布地图预测和实际值的金融企业的损益状态数据。从图可以看出4分类误差分布相对均匀和误差都在2.5%以内。同时,从图很明显4误差分布的差异是相对较小的对不同类型的企业财务数据。从上面的描述,我们可以看到,XGBoost能有效公司财务数据进行分类,有助于评估公司的财务风险水平的性能。

后公司的财务数据进行分类和处理XGBoost算法,这些数据将被再次使用的形式输入层使用XGBoost算法来预测公司的财务风险水平。图5展示了公司的财务风险水平的预测价值。它可以清楚地看到从图5的预测价值风险级别是在良好的协议与实际风险水平,和财务数据风险水平的趋势变化随着时间的推移也与实际的变化趋势一致。实际风险水平变化有很好的一致性。通过这两个点,它可以表明XGBoost模型适用于预测公司的财务风险水平,而且准确率相对较高。图6展示了公司的财务风险水平的预测价值偏离均值和最小值。可以看出之间的偏差距离的预测价值风险水平和每一时刻的平均值较为接近,这表明XGBoost相对权重的相似,而且没有严重的偏差,这证明XGBoost适合公司的财务风险水平的评估任务。从最小值的角度来看,风险水平在每一刻相对接近最小值的平均偏差。从这个角度看,也可以看到XGBoost算法更准确预测公司的财务风险水平。

为了进一步直观地分析公司的财务数据的准确性和可行性分类预测和风险水平,本文选择框情节和扇形饼图分析结果。从图可以看出7的预测价值风险水平随着时间的推移,在良好的协议与实际风险水平值,但风险水平的预测价值大于实际的风险水平值,但整体偏差范围相对较小。此外,预测风险水平值是在良好的协议与实际风险水平值的分布趋势。图8显示比例分配后公司财务数据的分类XGBoost模型。可以看出,五种金融数据的分布相对均匀,这表明权重的比例也相对统一。这进一步说明了XGBoost模型分类的可行性的企业财务数据,也为企业的风险评估提供了一个保证财务数据。

5。总结公司的财务风险水平预测的一部分

与经济全球化的不断发展和各种电子商务业务的发展,公司的财务状况已经变得越来越复杂。很难完成风险水平的评估公司的财务完全依赖金融人员,,很难保证风险水平预测的准确性。机器学习算法的不断进步和计算机硬件设备已经可以使用智能算法来评估公司的财务风险水平,这不仅会提高风险预测的准确性也大大提高预测的效率。

本文主要使用XGBoost算法在机器学习算法来有效地分类公司财务数据和准确地预测这些财务数据的风险水平。从公司财务的角度分类错误,分类误差都在3%以内,最大误差仅为2.48%。这表明XGBoost模型具有良好的精度在公司财务数据的分类任务。这部分主要从公司的错误。的损益状态需要增加这部分的数据集来提高精度。从公司的财务风险评估的角度来看,风险水平的变化趋势随着时间的推移和风险水平的价值是在良好的协议与实际风险水平。的时间和准确性,XGBoost相对传统的财务处理方法有明显的优势,和这个模型是可靠的企业财务风险评估的任务。

数据可用性

使用的数据来支持本研究的发现可以从相应的作者。

的利益冲突

作者宣称没有利益冲突。

确认

这项研究支持了2021年度教育部科学研究基金会项目中国湖北省(应用程序识别上市公司财务欺诈的研究基于AI)(项目号Q20213102)。