文摘

与中国经济的持续快速发展,上市公司的经营环境越来越复杂,国际企业之间的竞争和越来越大的压力使上市公司的财务风险问题更加严重。如果你不关注企业的财务风险状况,它会导致金融风险积累,最终导致金融危机,这将标志着圣因此,本文提出了企业财务预警模型账户结合模糊集和随机森林树木,具体包括以下步骤。首先,分析了数据集,选择和最初由训练样本的预测。进一步解释数据标签,标签是否被指控的圣。然后,模糊数学方法用于fuzzify训练样本数据,和两分的标签转换为多级标签;然后,随机森林模型用于火车上述fuzzified示例数据。获得训练随机森林模型。最后,预测样本数据输入训练随机森林模型决策在现场应用。同时,本发明应用于企业财务风险预警,这表明发明性和科学性的实用性和有效性。本发明的显著优势是两级决策转化为多级决策结合模糊集和随机森林模型,大大提高了预测精度,效率和数据合理性。

1。介绍

自2009年以来,创业板、主板市场作为补充,在资本市场推出以来,发展迅速。它极大地发展中国的资本市场,也为一些中小创业公司提供了更多的机会。然而,尽管它带来了机遇,也带来了挑战。近年来,已经有实例的宝石公司因管理不善导致金融危机。上市公司频繁的金融危机不仅会导致公众逐渐失去对上市公司的信心,也影响中国资本市场的发展1- - - - - -9]。

因此,本文以上市公司为例,分析它们的流动性风险,并找出他们的金融危机的根源。我们进一步分析其流动性风险管理上的漏洞,在此基础上,提出建议改善其流动性风险管理的公司,并建立适当的流动性风险评估和预警模型,加强风险意识,提高风险管理的公司10- - - - - -15]。公司金融危机如图1

公司突然不会爆发金融危机。危机的发生必须是一个周期性特征。可能有很多内部原因。这表明,计算机技术的快速发展也带来了更多的解决方案。企业财务风险预警领域的专家和学者也在努力找到更多有用的预警模型算法更适合于实际的企业财务风险的特点。内部和外部因素的组合使得金融危机非常复杂,同时也决定了,使用一个简单的线性函数,预警将会非常差。这表明企业金融危机和影响因素之间的关系并不是线性关系,而是非线性关系受到很多方面的影响。从一开始,前辈学者的使用一个简单的单变量来描述企业的金融风险,而现在他们使用一组全面的指标体系使用随机森林算法评估,这是该方法的不断创新和持续改进的准确率。目前,随机森林是一个非常常用的和非常灵活的算法。它的优点使它被应用在许多领域。 It can be used in the marketing field to predict the source of users, and it can also be used in the medical field by extracting diseases. The characteristics and modeling of these data can predict the probability of contracting the disease and classify patients. In recent years, in various data mining competitions at home and abroad, the players who use the random forest algorithm to build data mining models accounted for a large proportion. This shows that the random forest algorithm has a very wide range of actual data mining scenario applications. Random forest is composed of a set of decision trees with the same properties, so it is still subject to ensemble learning in essence. Random forest is a very flexible algorithm. It can process sample data of high-dimensional features without reducing its dimensionality. It can also evaluate the importance of each vector feature in the classification results. It also handles default values. Good results can be obtained. Compared with other classification prediction algorithms used, the random forest algorithm is not only accurate but also suitable for more scenarios. Many experts and researchers apply it in various fields, which has proved that random forest has a very significant effect on the description of multidimensional complex functions. Therefore, this article applies the algorithm of random forest to the early warning of corporate financial risks. There have been a large number of applications in other fields before this. Compared with other algorithms, random forest will have a more prominent performance in the early warning of financial risks [16- - - - - -22]。

阿黛尔和Hutchiso建造了一个财务风险问题和财务风险评估量表使用实际公司为例来评估他们的财务风险水平。奥特曼使用多元判别分析方法来分析房地产公司的案例研究,从1969年到1999年经历了金融危机。研究发现,它是不完美的使用Z模型来确定公司的金融危机。因此,金融危机预测模型是进一步改善。Charitou等人使用在英国上市公司为例,选择英国破产公司的1988 - 1994和1995 - 1997两个时期进行比较分析,利用神经网络和逻辑模型寻找企业的现金流的风险基金。杜阿尔特触发器的重要性被认为是分析比率分析方法的基础上,并通过历史数据计算财务比率指标体系只能反映企业过去的交易或者事项的状态,无法对未来做出预测。基于这种情况,评价体系由依赖财务指标不能为企业的未来发展。莎莉建造了一个联合预测模型有效结合四个独立的财务风险预警研究方法。实证研究表明,在相同条件下,该模型比单一方法研究模型23- - - - - -27]。

随机森林(RF)是一个代表算法领域的数据挖掘。它可以从有限的数据挖出很多信息。RF算法使用引导重采样方法来获取训练样本。的基本思想是构造一个multidecision树模型。预测精度高的优点,可控泛化误差、收敛速度快,并且没有调整参数可以有效地避免过度拟合的发生,尤其适合高级数据计算。已经有研究将RF算法与支持向量机和ANN算法进行比较,证明了RF算法的优越性。目前,只有两种类型的决策对各种场景通过随机森林树算法,这也是随机森林算法的缺点。

模糊数学是一个新的主题,已开始应用于各个方面如模糊控制、模糊识别、模糊水果分析、模糊决策和模糊判断,系统理论、信息检索等等。通过模糊数学的模糊表示训练样本,两分的标签转化为multicategory标签通过类别界定价值特性,和multicategory决策结合随机森林树木大大提高决策的准确性和广度和适合决策在不同的场景。这也是本文的重点。模糊数学研究的应用领域也非常广泛,如医学、生物学、工程、人工智能、社会心理学等学科。

随着中国经济的快速发展,资本市场体系越来越完美。目前,中国正处于经济转型的关键时期,有必要总是意识到金融风险带来的外部环境和企业内部的。只有通过控制风险企业更好的运作。改善企业财务风险的预警是一个不可缺少的控制阶段,企业的持续发展。许多研究人员已经进行了长期的研究和探索如何提高金融风险预警的准确性。与此同时,本文使用金融风险预警的场景来演示的可行性,有效性,本文的科学性28,29日]。

2。模糊综合评价和随机森林

2.1。模糊综合评价

模糊意味着边界不清楚,不能区分边界领域的理论。在现实生活中,许多概念是模糊的。例如,高和矮之间没有明确的边界。有些人认为170 - 180厘米是一个中等身材,但有些人认为180厘米为一体的高度。可以看出,这样的限制通常是不清楚。模糊综合评价方法是一种基于模糊数学的数学方法。这种评价方法是定量处理定性问题,和量化处理的过程是基于隶属度理论。通过这种方式,一个复杂的事物或系统可以分解成许多因素和水平,最后可以进行一个全面的综合评价。

模糊数学是由美国专家陈守煜教授首次提出。他发表了他的研究结果发表论文的形式,因此模糊数学正式诞生了。这个著名的学术论文的题目是“模糊集”,首次提出的概念模糊,也做了相关介绍定量表示。模糊数学是研究模糊现象的方法。这是一个相对较新的数学的主题。它扩展了数学的应用范围从确定性领域模糊领域,也就是说,从精确的现象模糊现象。在各个科学领域,各种数量可分为两类:确定性和不确定性。可分为随机和模糊不确定性。模糊数学是一种数学方法来研究模糊不确定性。模糊数学的想法是使用精确的数学方法来描述模型,计算大量的模糊概念和模糊行为在现实世界中,并合理地处理这些问题。 In these years, the applications of fuzzy mathematics research are also very wide, such as medicine, biology, engineering, artificial intelligence, society, psychology, and other disciplines.

模糊综合评价方法是利用模糊数学的一些概念来提供一些实际的综合评价问题的评价方法。具体地说,模糊综合评价是基于模糊数学,应用模糊关系合成的原理量化一些不清楚边界和难以量化的因素,全面评估主体的地位从多个因素的关系。它有明确的结果和强大的系统的特点。它可以解决模糊的、难以量化的问题。适用于各种非确定性问题的解决。基本原理如下:首先确定的因素(指标)评估对象和评估(等级);然后确定每个因素的权重和隶属度向量得到模糊评价矩阵;最后,模糊评价矩阵和权重确定的因素。向量进行模糊计算和归一化,和综合模糊评价的结果。

2.2。随机森林模型

决策树模型的学习方法是基于归纳学习算法,其重点是如何找到的特性,形成一个决策树从一组例子在一个不规则的秩序。这些特性规则通常用来构造一个分类模型或预测模型,然后通过这个模型中,一些未知的数据可以预测或分类。建立决策树模型,您需要经过以下步骤:第一步是选择一个合适的训练样本数据集,然后利用这些数据建立一个决策树模型通过一定的训练算法。构建决策树模型的过程可以被理解为内部规则挖掘样本通过一定的算法。培训主要是在两个阶段进行:第一阶段是树,第二阶段是修剪。决策树模型训练后,进行第二步。这个过程是使用建立的决策树模型进行判断分析新样品。随机森林模型(RFC)是一个强大的决策树模型的分类模型由一组具有相同属性通过一定的组合策略。参数集的向量是相互独立的。在输入变量X,每个决策树在一组有权投票表决结果基于一个特定的策略。RFC模型的基本思想如下。第一步是使用引导方法形成的样本数据用于训练。有两个样本集,在每个样本集的数据量是一样的。第二步是决策树训练样本集分别为每个样本集。第三步是使最终投票结果的基础上这群决策树分类来决定最终的分类预测结果。

决策树是一种算法,可以分类和预测新数据(或测试数据)通过测量训练数据(历史数据)。这些数据分析发现特征或规则的数据,这些是作为基础来预测新数据的结果。简言之,建立决策树的目的是构建一个合适的模型基于多个输入变量的值来预测目标和输出变量的值并将其呈现在一个树结构。决策树的算法主要包括ID3、C4.5和CART算法。ID3选择子树的属性使用信息增益,即熵的变化值;C4.5算法使用信息增益率,而马车算法和基尼指标选择和本文中使用。

随机森林是一个集成了多个树的算法通过整体学习的想法,如图2。其基本单元是一个决策树,其本质属于learning-ensemble机器学习方法的重要分支。在机器学习中,随机森林是一个包含多个决策树分类器和输出类别确定的模式类别输出由个人树。使用相同的培训数量建立多个独立的分类模型,然后做最后的分类决定基于少数服从多数的原则通过投票。例如,如果火车5树,4人是真的,其中1是错误的;然后,最后的结果将是正确的。一个标准的决策树将基于每个特性对预测结果的影响程度进行排序来确定的顺序不同的特性是由上到下。这样,所有决策树的随机森林里将受此影响策略和构建完全相同,因此失去了多样性。因此,在构建随机森林分类器,每个决策树会放弃这个固定排序算法和随机选择特性。

射频的基本核心理念是提高模型的内部差异通过构造一些独立和相关决策树。这些内部差异允许随机森林复杂数据做出正确的判断。获得集团数据集通过引导抽样法,然后火车行中的数据组数据集获取一组决策树。这些决策树构成一个组合分类模型系统。系统的最终结果由投票决定少数。

与传统的分类算法相比,随机森林有很多优势,如更少的参数需要调整,这意味着它能有效地处理大样本数据,不需要担心过度拟合或强噪声宽容,可有效地防止数据稀疏问题的决策树。

3所示。基于模糊综合评价的企业财务预警模型和随机森林模型

模糊数学是一个新的主题,已开始应用于各个方面如模糊控制、模糊识别、模糊水果分析、模糊决策和模糊判断,系统理论、信息检索等等。以下是详细描述本文应用技术解决方案的财务风险预警,参照图3。应该注意的是,这里的描述只需要上市公司的财务风险预警为例。本发明适用于在各种场景中决策。本文的步骤应用上市公司财务风险预警如下。

步骤1。分析和选择企业3000多家上市公司发布的季度数据在上海和深圳证券交易所在过去的7年,最初建立一个培训和预测样本集;进一步,数据包括损益表、现金流量表,总资产和负债。的马克twenty-six-dimensional数据显示是否被圣。

步骤2。使用模糊数学fuzzify训练样本数据,并将圣两个标记是否低风险(文件),轻微的风险(B文件),中度风险(C文件)和极高的风险。风险(D文件),模糊表转换方法进一步包括以下步骤:(1)对于一个给定的样本,每个样本都有维原始输入,输入样本数据构成行和N数组。这些的特点N维度包括利润业绩资金流量表和资产负债表的财务指标。(2)由于大型的区别金融特点,为了获得更准确的培训模式,财务比率的计算公式是需要规范的财务数据不同的数值类型到一个统一的比例。财政使用包括但不限于,资产回报率,总资产的回报率,等等。的 维矩阵计算通过计算 上面提到的矩阵。样品代表的数量代表的数量上面的财务比率计算的特点,和最后的数据特征显示是否被圣。(3)总样本包括80多个行业,不同的行业有不同的财务比率分析的特点。这篇文章需要进行相应的模糊表示通过模糊数学对这些行业,然后把超过80一个行业为例,详细描述模糊表示的过程。假设行业一个K件的数据,这个行业的样本矩阵的大小 ,和每个维度特征需要fuzzified。让样本集被表示为 在哪里年代是一个样本,每个样本的数据维度特征表示为 在哪里T是特征值。
在这里你需要对每个特性执行模糊计算获得相应的模糊值。采取特殊的T1作为一个例子,选择所有T1在公式(特性值1),按升序排序功能设置: 假设这个特性与金融风险负相关,也就是说,值越大,财务风险程度越低。根据特征值排序,零边界点的标记T1大于这个值被发现non-ST,所以公式(3)可分为集T11,T12,T13、…T1( −1)T1;根据T1,设置 ,假设设定的上下极限一个1一个2分别;semi-trapezoidal分布用于确定隶属程度,和隶属函数如下。提升semi-trapezoidal地理分布: 在哪里一个1一个2的下限和上限设置,分别。降半梯形分布: 通过这个隶属函数,每个维度的成员价值特性公式(2)可以计算。假设样本一个获得会员价值(一个1,一个2一个3、…一个x]的所有特性的样本计算后,增加一维样品总会员价值维度,和表达式 其中,一个样例,总会员价值选择功能,和功能设置的上限和下限吗b1b2分别和提升梯形分布是用来确定其最终成员值。成员函数 通过模糊数学的模糊表示训练样本,两分的标签转化为multicategory标签通过类别界定价值特性,和multicategory决策结合随机森林树木大大提高决策的准确性和广度和适合决策在不同的场景。这也是本文的重点。总会员价值特性可以被转换成低风险(一个文件),轻微的风险(B文件),中度风险(C文件)和极高的风险(D文件)通过执行上述模糊化处理和特征标记为新数据。收敛比较图4

步骤3。使用随机森林模型训练上述模糊处理样本数据获取训练随机森林模型:随机森林模型的施工方法进一步解释说,包括以下步骤:(a)给定的训练样本的属性年代,这个数字毫米是一个整数大于0小于;(b)使用引导方法fuzzified训练样本数据,样本和随机生成k训练子集(年代1年代k];用引导的方法来减少训练样本的维数,并重新取样数据,这是进一步说年代包含n不同的样本,X1Xn从集合中提取样本年代更换和吸引n次,总结了提取的样本,形成一套新的 ;使用每个训练子集生成相应的决策树: 在每个non-port子节点上选择一个属性之前,随机选择属性的属性的分裂属性设置当前节点,将节点的最佳分割方法的属性,和生长在整个森林。的价值的过程中保持不变。评估数据如图5。(d)每棵树生长完全没有减少分支,直到训练完成。测试样本(e)X,使用决策树每个测试来获取相应的决策树: 购物车()意味着一个投票策略的结果n决策树,得到最终的预测乡结果对应于测试样本。最后的预测结果是进一步表示为: 在哪里H(x)是预测输出,k是决策树的数量1 =树,然后呢h(x)的模型th决策树。

步骤4。预测样本数据输入到训练随机森林模型并预测相应的测试数据,输出的是金融风险的预测数据。分析并选择数据,影响企业的财务风险,如表所示1
原公司财务数据具体分析现金流量表,资产负债表和损益表发表了超过5000在上海和深圳上市公司从2013年到2017年,共有180多名货币资金,应收账款,等等,除以季度特征值。从一些财务指标表所示1不难看出,不同指标之间存在巨大的差异,和特征维度是相对较高的。有必要使用财务比率的计算公式来规范金融数据不同的数值类型到一个统一的百分比,可有效减少训练数据的维数,从而提高了计算效率。图6显示财务比率指标的例子。
图分析6,不难得到标准化后数据计算财务比率。尺寸减少来自180多个维度在处理之前22维度,和财务比率指标能够更好地描述金融风险的特点,这一步可以显著降低模型的大小和模型的运行时间。介绍了模糊数学方法来转换数据。具体数据模糊化是指步骤的过程2以上。图6显示部分数据模糊化后的结果。已经有研究将RF算法与支持向量机和ANN算法进行比较,证明了RF算法的优越性。目前,只有两种类型的决策对各种场景通过随机森林树算法,这也是随机森林算法的缺点。
如图7原始财务数据后,以模糊的方式表达,二进制数据转换成一个多类问题,这也反映了渐进的金融风险的特征。随机森林模型用于上述模糊训练样本,训练和训练模型做出预测。给定的训练样本的属性的数量年代是一个大于0的整数。在模型训练之前,初始设置Ntree = 30,代表决策树的数量。它可以调整根据未来的预测误差: 其中,试一试表示当决策树的节点数分裂和实验期间不会改变。首先,引导方法用于样品原始财务数据。通过这个过程,K数据集是随机生成的年代1年代k];用这个训练数据集生成相应的决策树CART1。CARTn,决策树模型被定义为h(x),x表示输入向量;在每个非叶节点选择属性之前,它是随机选择的从属性。在培训期间,每个决策树会变得完全,没有修剪操作将被执行在这个过程,直到完成培训。与数据X用于测试,数据输入每个决策树进行测试,而结果。采用这些投票策略k结果,最终的预测结果 在哪里ttth决策树。为了评估模型的优缺点,平均相对误差是用于分析预测的结果。平均相对误差 在哪里yf代表了预测值,t代表实际值,N代表训练数据的总量。日军是用来评估预测值和实际值之间的偏差。值越小,更好的预测效果。为了分析预测的效果,本发明,本发明使用模糊数学处理由原始财务指标和模型训练样本预测结果进行比较。预测的值显示在图8
表中的数据分析,可以知道,上市公司的财务风险预测结果使用本发明基本上是符合实际的结果,也显示了本发明的可行性;比较模糊数学的预测结果是否和表中财务风险的特征基本相似,和模糊数学模型可以进一步完善金融风险在某种层面上,这充分体现了本发明的有效性。总之,本发明的应用可以更好地预测财务风险,具有较高的工程使用价值。评估数据数据所示910。预测精度高的优点,可控泛化误差、收敛速度快,并且没有调整参数可以有效地避免过度拟合的发生,尤其适合高级数据计算。

4所示。结论

与中国经济的持续快速发展,上市公司的经营环境越来越复杂,国际企业之间的竞争和越来越大的压力使上市公司的财务风险问题更加严重。如果你不关注企业的财务风险状况,它会导致金融风险积累,最终导致金融危机,这将标志着圣因此,本文提出了企业财务预警模型账户结合模糊集和随机森林树木,具体包括以下步骤。首先,分析了数据集,选择和最初由训练样本的预测。进一步解释数据标签,标签是否被指控的圣。然后,模糊数学方法用于fuzzify训练样本数据,和两分的标签转换为多级标签;然后,随机森林模型用于火车上述fuzzified示例数据。获得训练随机森林模型。最后,预测样本数据输入训练随机森林模型决策在现场应用。同时,本发明应用于企业财务风险预警,这表明发明的实用性和有效性。本发明的显著优势是两级决策转化为多级决策结合模糊集和随机森林模型,大大提高了预测精度,效率和数据合理性。

数据可用性

使用的数据来支持本研究的发现可以从相应的作者。

的利益冲突

作者宣称没有利益冲突。

确认

这项研究得到了山东青年政治学院的Science-Level项目(研究现代服务业的建设和实践路径内部审计人员培训系统)(没有。xxpy-yyx-yb13)。