文摘

全球经济已经进入了一个新的正常,快速发展的经济环境。这需要建立一个金融危机预警系统,可以动态地分析了基于历史数据信息。解决这一研究目标,本研究提出了一个k倍随机森林算法结合时间序列分析模型作为企业财务危机预警算法。算法利用时间序列分析模型的能力做出短期预测的历史数据和使用时间序列分析模型的预测新建财务指标数据。的k -褶皱随机森林是用于分析财务状况的预测财务数据,实现动态金融危机预警的目的。实验结果表明,金融危机预警模型的预测精度基于随机森林算法和时间序列是89%,这表明该模型是有效的和可行的。

1。介绍

与中国的经济发展进入一个新的正常和政府鼓励“质量创新与企业家精神,竞争日益激烈的市场环境对企业经营和发展创造了越来越多的困难。与此同时,“互联网+”的想法是不断发展的,应用于各种行业的产品和服务,促进互联网和传统产业的深度集成。站公司在快速发展的市场环境下,每个企业必须加强其风险控制能力,实时掌握公司的财务状况,提高管理控制水平。

此外,大多数的两个国内证券交易所上市的中国公司选择的地方,和保护投资者的权利和减少暴露于上市公司已经经历了金融危机或其他异常情况,证券交易委员会(SEC)推出了一个特殊的处理系统对股市(特殊待遇,ST)和退市风险警示 )系统,有助于优化资本市场的资源配置。圣或 公司将受到更严格的监管,更完整的信息披露在未来几年将受到更严格的监管和更多和更完整的信息披露,这将有一个巨大的对公司的股价产生负面影响,融资成本,和图像1]。如果公司未能改善其现状和扭转金融危机之后,它将面临退市警告,美国证券交易委员会(SEC)的危机,它可能会导致公司面临破产危机。对大多数公司来说,将会有大量的当前债务公司之间,当其中一个金融危机,无法及时偿还债务或失去支付能力,它会影响公司的财务安排或资产结构。防止失去中小投资者来说,影响相关企业或金融机构和金融市场的稳定,投资者、企业决策者、和金融机构应加强金融危机对企业的控制信息。

一个公司的金融危机必然会从一个小问题发展到另一个公司的金融危机。还有其他非金融因素除了金融的。通常,财务数据的变化反映了这种渐进的过程信息,所以它可以分析财务数据通过一定的算法和设计一个系统,能科学地反映公司的财务状况,从而指导企业决策者制定正确的方针改善业务活动和预防这类问题的时间2]。

随着人工智能和机器学习技术的发展,数据挖掘的理论和应用变得越来越成熟,和及时的信息采集和分析在金融危机发生之前已逐渐成为主要方式使金融危机预测,及相关数据分析算法逐渐用于各个行业,取得了很好的应用效果。因此,本研究的主要研究方向是数据挖掘的方法应用于企业财务危机的预警和设计一个动态企业财务危机的预警模型。

其余的杂志是根据以下组织模式。相关作品中讨论部分2。方法在讨论部分34。实验和结果部分中提到5,这项研究得出的结论部分6

在20世纪初,在欧洲和美国学者开始研究财务预警模型,由于资本主义国家的市场比全球市场更加完整,取得了许多有影响力的结果在财务预警研究和实践的方向。

1932年,卢卡et al。3)单变量分析模型用于财务预警的研究,这是最早的金融预警模型的研究,并有一定的研究意义。这项研究表明,唯一的指标,最能辨别公司的财务状况在选定的样本是股东权益净利率和股权比例。金布罗et al。4]提出营运资本/总资产指标可以预测财务风险。Dimitrios et al。5)提出,财务指标的三双,股东权益/资产和负债、营运资本/总资本和流动资产/流动负债,有金融危机的预测能力最强。魏et al。6]提出三对财务指标的预测能力最强:净利润/总资产、总负债/总资产和现金流量/总负债。

Gladwin [7)公司1998年的财务报表数据进行了一项研究使用单变量分析模型和四个财务比率指标相比,显示当前比率和债务比率有最好的预警效果。

1968年,南和应8)第一次使用多元分析财务预警模型的研究,他选择33破产公司和33个正常公司进行实验,并提取5个财务指标和22个财务指标的预测能力,所有这些都在选择最低的误判率,从而建立z分数模型。奥特曼的z分数模型已广泛应用。

在一项由Appiahene et al。9],z分数模型是否能有效地确定上市企业的金融危机在中国的调查,结果显示,z分数模型有一个突出的预测效应对于某些类型的企业。2015年,横条和格兰姆斯(10)建立了一个多元概率比回归模型在金融危机进行的一项研究预测。同年,Burlon et al。11)提高了基于人群的z分数模型搜索算法,和实验结果表明,该模型可以预测金融危机更好、更理想。2018年,唐et al。12结合改进的果蝇优化算法和z分数模型建立财务预警模型,结果表明,该模型具有良好的预测能力。

1977年,李et al。13]使用第一个多元逻辑回归模型来预测金融危机的银行系统。2058年正常的公司和105年破产公司选择Ramos-Perez et al。14提取),9个财务指标和预测模型。最终确定了四项指标预测力最高的:金融结构、流动性、公司规模和操作性能。

玫瑰等。15)进行了一项研究使用70年财务数据组的公司在过去的五年,分析了这些指标的变异性21,最后得出结论,净资产收益率有最好的预测效果。科恩和克伦(16]添加非金融指标研究金融危机的早期预警和使用物流模型测试金融危机和公司治理之间的关系。

与数据挖掘技术和人工智能技术的发展,许多学者开始使用数据挖掘和机器学习方法在财务预警模型的研究,可以考虑相比,传统的统计方法。徐et al。17)使用神经网络模型进行企业财务危机预警的研究,比较了神经网络模型,多元判别分析模型,结果表明,神经网络模型预测效果显著高于多元判别分析模型。李等人。18)选择从台湾企业数据预测研究和构建多元判别分析模型,逻辑回归模型,神经网络模型,分别和结果表明,神经网络模型优于其他两个模型如果样本数据不满足一个特定的假设。在一项由唐et al。19),BP(反向传播)神经网络算法被用来预测136年上市公司,这是表明,输入变量的改进,有效地提高了功效系数法神经网络模型的精度,提高了预测精度。

遗传算法是模拟遗传选择和法律进化的方法在自然界中寻找最优解在一个大而复杂的概念空间。遗传算法提供了一个通用框架,解决问题,不依赖于问题的具体领域和预测企业危机可以基于参数优化的多个方面,可以习惯于区分和提取规则基于定性变量。程(20.)进行了一项研究在金融危机预测模型基于适度的财务指标和遗传算法,结果表明,这种模型具有很高的预测精度。

Haardle schaaf构建预警模型相比,基于支持向量机和神经网络模型和多元判别分析模型,结果表明,支持向量机的预测性能与其他模型相比要好。在他们的研究中,田et al。21]分析了中国a股上市公司的财务数据的帮助下SVM模型和最近的域的方法和容易overwarning表明,支持向量机模型,而最好的域方法是相对强劲的。陈(22)金融危机早期预警模型构建基于自适应PSO-SVM模型在他们的研究中,研究表明,该方法是擅长处理可伸缩性问题,能力也不错。

张,胡23]装袋和提高方法用于研究构建财务危机预警模型并与神经网络模型,结果表明,集成学习算法优于神经网络算法。王先生和王24)使用了多个投票的方法将多个分类器集成到构建财务危机预警模型,和他们的实验结果表明,集成模型的准确性高于单一分类器。之后,春赵研究金融危机早期预警使用关联规则和时间序列在他的博士论文,和元王,杨Jianhui结合支持向量机和演算法的方法来构造一个基于SVM-AdaBoost LCFC预警模型具有良好的预测结果。Mozeika [25)进行了一项研究制造业上市公司的财务预警基于随机森林和人工神经网络,和结果表明,该模型具有更好的准确性与神经网络模型相比,多变量逻辑回归模型和单变量模型。

3所示。改进的随机森林算法基于财务数据

3.1。随机森林算法

自从out-of-bag (OOB)数据的随机森林不能达到36%的原始数据在实践中,实际上是用来测量预测错误,缺乏试验数据计算out-of-bag错误将导致低精度特性的重要指标,从而导致分裂属性在创建决策树不是最好的选择,因此,算法的分类精度是不够的。因此,out-of-bag数据的数量需要改进提高功能重要性度量的准确性,提高分类精度的随机森林。在这项研究中,我们提出一个k倍随机森林(KRF)算法相结合的思想k倍交叉验证改善样本抽样的随机森林。

KRF算法流程描述如下:步骤1:将样本集NK相等的部分,画的一组Kout-of-bag数据样本集,并绘制l从剩下的训练样本集K−1集的抽样方法,随机偷袭得手,每个样本集的数量是一样的原样品集的数量。步骤2:随机选择属性(<属性设置)样本和训练的决策树的分裂基于最好的特征变量的选择变量步骤3:选择的学习l训练样本集,生成一个购物车为每个样本,并生成l决策树的总目的:结合的分类结果l决策树,并确定最终的分类结果的简单多数投票方法

3.2。算法分析
3.2.1之上。算法性能分析实验

为了不失去普遍性,改进算法的性能检查使用的强度指数分类随机森林算法的性能评价标准。在这项研究中,三个不同的数据集从独特的客户端标识符(UCI)数据库是数据库和数据生成器的集合作为实验数据集(表1)来模拟随机森林算法和KRF算法。

更准确地反映算法的实际性能,在仿真实验中,每个数据集的实验重复500次,4/5的原始数据集的样本数据集和1/5作为测试集。结果是由500年的意思是实验结果。

3.2.2。实验结果分析

在三个数据集测试后,每个算法的分类精度表2

下表2三个数据集上的实验结果表明,KrF算法改进的准确性与传统随机森林算法相比,这表明,改进算法具有更好的分类性能和分裂属性选择特性集的最优结果。Out-of-bag数据时达到最佳分析效果给出了表3

从表可以看出3KrF算法的准确性是略高于传统的随机森林算法当精度达到最高的价值。的基础k倍随机森林算法是合理的,同时也表明,特征重要性KrF算法更准确的测量结果。

4所示。基于随机森林的金融危机预警算法和时间序列

4.1。算法流程图

通常,在金融危机的早期预警,我们应该首先判断企业的财务危机,最后进行具体的预警操作根据判断结果。早期预警指令通常是发行的上层形成系统。根据特定需求,各种预警操作,如发送警告邮件的管理和发送短信的人员负责。因此,这项研究没有指出应该选择什么样的预警方法但做出判断是否在一个金融危机。结合之前的研究内容,研究金融危机预警的想法如下。

首先,通过改进的随机森林算法k倍随机森林算法。重要性指数计算财务数据通过实际数据的错误率(直接支付,可能是也可能不是报销后从3理查德·道金斯党源),该指数排名是意识到重要性,和排名结果验证。最后,财务状况进行分类实验是不同数量的指数特性集,和指数特性集的数量分类效果最好的判断根据精度的变化。

第二,根据时间序列建模的步骤,选择的样本数据的平稳性和随机性测试,非平稳的系列(统计特性随时间变化)转换为平稳性(统计特性不随时间差分法通过不同的连续观察,然后再次验证了不同系列的平稳性,和时间序列模型和相应的订单确定。最后,选择模型的合理性证明测试模型数据拟合的美好。

第三,通过多个建模,确定所选六个财务指标的时间序列模型,分别预测的值在2018年第三和第四季度,最后测试六个指标的预测结果的准确性证明预测结果是有效的。

最后,我们继续分类的预测结果k倍随机森林算法来判断企业的财务状况是好的实现动态预警的目的。算法流程图如图1

4.2。实验分析

在完成时间序列的建模和预测模型,它仍然需要进一步改善预测结果达到金融危机预警的目的。根据2018年第三和第四季度的数据6个财务指标预测的部分4.2,再加上k倍随机森林算法,进行财务状况分析。每个企业的财务状况分析的准确性从实验获得给定的表4。结果表明,最准确的预测精度的基于随机森林的金融危机预警算法和时间序列是89.312%,而结果是合理的。预测的能力可以作为一个方法来判断企业的金融危机预警。

5。实验

危机通常是一个掠射角系数(90°恭维入射角)函数与企业经济作为参数,如图2。这样的曲线显示了一个典型的行为,也就是说,它增加迅速在一个非常低海面回波反射角度,然后在中间的角度,在高原地区,最后上升迅速掠射角方法90°。为了说明这种行为的新提议的实证模型中,一些结果,已经被证明是重复的,但作为一个掠射角的函数。验证这些结果使用不同分布时,经验模型是基于不同分布表示,只有两个表在30°、60°。因此,一个更好的匹配可能会在一个较低的角度。

企业危机预测服务评估基于反向测试执行。这个测试已经应用到选定的活动根据标准,如前一节所述。此外,为了避免偏见的结果和过度拟合,整个评估过程运行仿真的形式。在此基础上,预测企业危机之间的差异和实际企业危机的平均绝对误差(MAE) [17]。具体来说,梅措施一组错误预测没有考虑他们的方向,在错误的起源。的平均值之间的绝对差异样本,预测和实际观察到的个体差异有相同的重量。相应的数学公式是由以下方程:

在这里,n观测值和总吗Y是实际值和预测值。美值范围从0到∞,独立于错误的方向,如前所述。这些都是负面的结果取向(即。,价格越低越好)。

结果是基于上面的描述性分析,平均美计算多个活动的指标部分,尤其是经济数量大于100,200,400,470,1000,到2000年,如图3。图3表明,最小误差值大约是2.4%点,达到400多个经济活动参加活动40场。

6。结论

本研究提出了一种基于企业财务危机预警算法的结合k倍随机森林算法和时间序列分析模型。该算法使用时间序列分析模型的能力做出短期预测的历史数据,采用时间序列分析模型预测新建财务指标数据。使用k倍随机森林预测财务数据的分析财务状况,动态金融危机预警的目的是实现。实验结果表明,金融危机预警模型的预测精度基于随机森林算法和时间序列是89%,这表明该模型是有效的和可行的。

数据可用性

使用的数据来支持本研究的发现可以从相应的作者。

的利益冲突

作者宣称没有利益冲突。

确认

这项工作是由哲学和社会科学研究的一般项目在江苏省高校建设制造基于价值链理论的成本管理模式系统(2020 sja2258)。