研究文章|开放获取
Yajiao Tang,Junkai Ji,Yulin朱,Supmics Gao,郑堂,Yuki Todo那 “破产预测的差分演化导定神经网络模型",复杂性那 卷。2019那 文章ID.8682124那 21 页面那 2019. https://doi.org/10.1155/2019/8682124
破产预测的差分演化导定神经网络模型
抽象的
金融破产预测是金融机构评估企业和个人财务健康状况的关键。这些工作对于金融机构建立有效的预测模型,做出适当的贷款决策是必要的。近几十年来,各种破产预测模型被开发出来,供学者和从业人员预测贷款客户破产的可能性。其中,人工神经网络(ann)在破产预测中得到了广泛而有效的应用。受生物神经元机制的启发,我们提出了一个用于财务破产分析的进化剪枝神经网络(EPNN)模型。该神经网络具有动态树突结构,并通过全局优化学习算法JADE (Adaptive Differential Evolution algorithm with Optional External Archive)进行训练。该神经网络通过去除结构中多余和无效的突触和树突来降低计算复杂度,同时能够达到较好的分类精度。简化结构后,可以用一个包含比较器和逻辑非、与、或门的逻辑电路来完全替代EPNN。这种机制使EPNN在硬件实现中应用于破产分析成为可能。为了验证EPNN的有效性,我们在实验中采用了两个基准数据集。 The experimental results reveal that the EPNN outperforms the Multilayer Perceptron (MLP) model and our previously developed preliminary pruning neural network (PNN) model in terms of accuracy, convergence speed, and Area Under the Receiver Operating Characteristics (ROC) curve (AUC). In addition, the EPNN also provides competitive and satisfactory classification performances in contrast with other commonly used classification methods.
1.介绍
压倒性的2007/2008金融危机导致了许多大型金融机构的破产,并由其政府接管了一些受试者。因此,破产风险管理已成为全球的重要研究领域。公司破产表示,本公司经营现金流及其负净资产的情况表示不平衡。这总是导致公司盈利能力的实际削弱。破产预测的目的是通过在市场长期运营的角度来评估公司的现状和未来财务状况。
各种定量统计方法被用于改进破产预测模型。判别分析被用来对好的和坏的付款人之间的观察结果进行分类[1]并且逻辑回归适用于确定借款人的默认概率[2].但是,认为这些流行的模型是不准确的[3.].因此,探索了几种机器学习工具,以利用计算机技术评估破产风险。由于破产风险分析类似于模式识别任务,因此大多数方法都可以适应对金融机构的潜在客户的信誉进行分类[4.那5.].其中,人工神经网络在预测金融危机等应用中表现突出[6.],得分信用[7.]并建立信用分析模型[8.].自20世纪90年代以来,人们就开始研究人工神经网络在破产预测中的应用[9.那10].事先研究表明,由于其非线性和非参数自适应 - 学习属性,ANNS是强大的,用于模式识别,因为它们的非线性和非参数自适应学习属性11].此灌输超过传统的统计算法和电感的学习方法,明显的优势人工神经网络特别是与判别分析和Logistic回归[比较12].因此,人工神经网络在财务会计领域的应用成为研究的重点。
ANNS是灵活的和非参数建模工具,能够执行任何具有任意所需精度的复杂功能映射[13-15].在这些不同类型的人工神经网络的,MLP是最简单和最广泛应用的模型,其中,所述隐藏层确定输入和输出层之间的和的关系存储为连接链接的权重[神经元之间的映射关系的一个16].MLP的学习算法实现了梯度搜索,以最小化已实现输出和期望输出之间的平方误差。这种类型的三层MLP是一种常用的神经网络结构,用于解决二元分类问题,如破产预测[11].虽然ANN合奏,如效率,鲁棒性和适应性强的特点,让他们进行分类,决策支持,财务分析和信用评分的有价值的工具,应该指出的是,一些研究已经表明,多个神经网络的合奏分类并不总是优于单个最佳神经网络分类[17].因此,我们专注于将单个神经网络模型破产预测。
在生物神经元模型中,树突计算机制可以为突触输入在适当连接处的定位提供具体的解释。这意味着多余的突触和树突最初会留在神经网络中,而无用的突触和树突会被迅速删除,剩下的会被加强。最终,这个过程创造了一个增强的神经网络功能形式。受到这些组织学理论的启发,Koch等人注意到兴奋性和抑制性输入之间的相互作用具有明显的非线性。一旦抑制性输入和兴奋性输入位于通往躯体的同一路径上,抑制性输入就可以明确地消除兴奋性输入。然而,兴奋性或抑制性突触是否应该保留,它应该位于哪里,以及哪个树突分支应该加强,这些问题在这个模型中没有得到解决[18].后来,Koch等。注意的是,在连接节点突触之间的相互作用和响应可被视为逻辑运算[19],需要一种基于树突可塑性的专门学习算法来训练模型[20.].
在我们以前的研究中,提出了一种PNN模型,其中通过学习制定了DendRite分支上的特定位置和突触类型的突触,并且消除了无用和多余的突触和树突连接。因此,模型的效率增强了[21那22].与大多数其他ANN类似,PNN采用BESTPROPAGAGAGE(BP)算法作为其学习方法。然而,学习算法被广泛认为对ANNS的性能产生重大影响[23那24].BP算法及其变化[23那25]被认为是相当效率低下,因为他们显而易见的缺点,例如他们缓慢的收敛[26],对初始化的敏感性[27],倾向于陷入局部最小值[28那29].具体地,首先,在学习过程中,错误通常保持大,因为学习算法将ANN导向到局部最小值而不是全局最小值。这个问题在基于梯度的学习方法中非常常见。其次,BP算法的收敛强烈取决于学习率和动量的初始值。这些变量的不适合值甚至可能导致发散。第三,当数据集变大时,学习时间基本上增加[30.].许多研究人员致力于改进以解决这些BP的这些缺点,但每个方法都有其缺点[31那32].这些缺点使得风险分类应用程序不可靠,并激励我们采用其他算法来培训神经模型,以避免计算效率低下和地方最低问题。
在这项研究中,我们提出了一种具有树突结构的EPNN模型,作为称为玉算法的全局优化算法[33].关于EPNN,其他神经元的轴突将输入信号传输到突触层;然后,突触信号转移到树突的每个分支的相互作用。接下来,收集相互作用并送到膜层,然后转化为SOMA主体。此外,神经元修剪功能可以去除额外的突触和树突,同时实现高精度。具体地,在训练过程中,消除了多余的输入和树枝状体,而保留有用和必要的输入。然后,神经元修剪函数可以产生简化的树突形态,而不会损失分类精度。此外,简化的拓扑形态可以类似地运行到仅仅是比较器和逻辑的逻辑电路,而不是,和或栅极。因此,可以轻松地将EPNN应用于破产分析。据我们所知,我们注意到,如果通过硬件实现实现,与其他方法相比,这种技术将达到最高的计算速度。 This demonstrates an excellent adoption possibility for financial institutions. JADE is a state-of-the-art variant of the differential evolution algorithm and uses a self-adaptive mechanism to select suitable parameters for each optimization problem. This imbues JADE with a better balance between exploration and exploitation compared to other heuristic algorithms [34].在培训EPNN时,翡翠可以避免当地最小值并在优化过程中加速培训过程。因此,玉允许EPNN获得令人满意的结果并为每个破产预测问题产生有效的逻辑电路。
除了避免误导和矛盾的结论,四个关键组成部分被仔细定义,让一个人可以从实验结果中得出有根据的结论。首先,本研究采用了基准和面向应用的数据库,即来自UCI机器学习数据库库的定性破产数据集和来自Kaggle数据集的Distress数据集。其次,在仿真中,将两个数据集按50%的比例分成训练集和测试集。第三,以平均准确率、灵敏度、特异性、收敛速度和AUC作为评价指标框架;这样的指标可以用来有效、高效地分析破产的可能性。第四,采用了一种称为Wilcoxon秩和检验的非参数检验,使我们能够断言观察到的性能结果差异在统计上是显著的,而不是简单地由随机分裂效应引起的。
为了得出结论,我们的主要贡献如下:首先,在本文中提出了一种新的EPNN模型,可以采用突触和树突修剪来简化其在训练过程中的神经元形态。其次,EPNN的简化模型可以被逻辑电路完全取代,该逻辑电路很容易地在硬件上实现。逻辑电路可以保持高分类精度并同时获得极高的计算速度。最后但并非最不重要的是,已经实施了全面的比较实验,以证明EPNN优于MLP,PNN和其他常用的分类器对破产预测问题。
本文的其余部分构造如下。部分2提出了破产分析中相关理论的概述。部分3.详细介绍了所提出的EPNN模型。此外,描述了EPNN的学习算法玉。部分4.给出了采用EPNN的实验结果,并与采用定性破产数据集和Distress数据集的其他算法进行了比较。部分5.本文总结道。
2.提出的模型
我们建立了EPNN,具有树枝状结构和由JADE的训练,实现了高破产分类精度。所述EPNN的形态学结构显示在图1.该网络具有4层,即,一个突触层,树突层,薄膜层,和一个胞体层。投入从现有的神经元输入的突触层的轴突;然后,突触信号的相互作用发生在树突的每个分支。之后,交互被收集并且被发送到膜层;最后,他们被送到索玛体。在训练过程中,必要的输入和有用的树突被保持,而不必要那些被过滤掉。所述细胞将是动机,当胞体的输入超过其阈值将随后通过轴突终端发送的输出信号到其他神经元。该EPNN模型的形态学结构呈现在下面详细。
2.1.突触层
神经元的突触层代表神经冲动在神经元之间传递的特定区域,从而通过神经元的轴突末端,在那里神经递质对冲动作出反应[35].使用特定离子的某个图案来实现脉冲。当离子透射到受体时,改变受体的电位,并确定突触的兴奋性或抑制性能[36].突触层的流动方向是前馈,通常从突触前神经元开始,然后传递到突触后神经元。在EPNN中,这些连接由一个单输入单输出的s形函数表示。方程( )突触层接收( )输入表示如下: 在哪里是一个正常数,和是需要通过学习算法优化的突触参数,以及突触的输入是否有一个范围 .有四种类型的连接状态对应于不同的值和 :直接连接,反向连接,恒定1连接,和一个恒定0连接,如图所示2.表示突触层的阈值;该阈值可以由以下等式定义,
2.1.1。直接连接
那例如。, 和 那对应于直接连接。一次 那输出当接近1时,突触变得兴奋,并使躯体层去极化。当 那相应的输出趋向于0,突触变得有抑制性,并以一种短暂的方式使体细胞层超极化。一般来说,不管输入值是多少,输出总是近似于输入。
2.1.2。反向连接
那例如。, 和 那导致反向连接。一次 那输出约为0,突触变得抑制性。此外,它将在瞬态方式超极化体层。相反,当 那输出大约是1,突触将变为兴奋,并且它将SOMA层解耦。简而言之,无论输入的输入值如何 那输出将接收由输入触发的反向信号。这可以被看作是一个逻辑非。
2.1.3。常数,连接
常量-0连接中有两个状态: 那例如。, 和 那和 那例如。, 和 .不管输入的值,则输出总是近似0。
2.1.4. 常数-1连接
在constant-1连接中有两种状态: 那例如。, 和 那和 那例如。, 和 .无论输入信号无论是否输入信号如何,相应的输出都往往是1超过阈值 .这意味着突触层的信号对树突层的影响很小。每当兴奋性输入信号传输进来时,下一层膜就会发生去极化。
的值和在-1.5和1.5之间随机初始化。这表示输入随机连接到四个突触连接状态之一中的每个树突分支。当值和变化,突触层的连接状态而变化。在图中3.四个标记被采用来表示四种连接状态:一个直接连接(•),逆连接(■),恒定1连接(①),和恒定0连接(⓪)。
(一)
(b)
(c)
2.2.枝晶层
树突层表示树突中每个分支上的突触信号的典型非线性相互作用。乘法操作在运输和处置神经信息的过程中起着至关重要的作用[37那38].因此,突触层的非线性计算可以用典型的乘法运算来代替求和运算。树突分枝的相互作用相当于逻辑与操作。当且仅当所有输入变量同时等于1时,输入变量的操作将生成1。树突层对应的方程定义如下:
2.3。膜层
膜层将来自上层树突层的树突信号的线性总和积累起来。它类似于二进制情况下的逻辑或操作。当至少一个变量为1时,这个逻辑或操作生成1。其方程如下:
2.4。索玛层
膜层的输出被传送到体细胞层。一旦膜电位超过阈值,神经元就会兴奋。用s形运算来描述躯体层的功能:
2.5.神经修剪函数
EPNN具有执行神经修剪功能以简化其拓扑形态的能力。神经修剪技术代表通过学习和培训神经网络来省略额外节点和权重[39].在EPNN中,修剪功能可以去除不必要的突触和树突,从而对给定的问题形成独特的神经结构。该功能包括突触修剪和树突修剪两部分。
突触修剪:当接收轴突输入的突触层处于常数-1连接状态时,突触输出始终为1。由于乘法运算,任意值乘以1的结果将等于树突层本身。很明显,恒定-1连接中的突触输入对树突层输出的影响很小。因此,这种类型的突触输入可以完全忽略。
树突修剪:当接收输入信号中的突触层处于恒定0连接的情况下,输出始终为0。其结果,在相邻的枝晶层的输出为0,因为乘以0的任何值的结果等于0。这意味着这整个枝晶层应该被忽略,因为它的躯体层的结果影响最小。
突触和树突修剪程序的一个例子如图所示3..神经结构由四个突触输入,两个枝枝蔓,一个膜层,和一个胞体层,如图3(a).输入的连接情况①在分支1中;可以根据突触修剪的机制省略该突触层。此外,输入的连接情况是⓪在分支2;可以基于树突修剪机制完全删除分支2。不必要的突触输入和树枝状分支,其在图中以虚线显示3(b),应该被删除。最后,可以获得简化的树突形态,如图所示3(c).只有分支1上的突触层保留在结构中,因为只有输入可以影响躯体的最终输出。
3.学习算法
实际上,PNN遭受了维度的诅咒。当尺寸大大增加时,由于乘法操作,一个树突分支上的重量的任何小变化都会产生最终结果的差异。这是EPNN的主要限制。因此,它需要我们提出更强大的优化算法来弄清楚。传统的分类器使用BP调整权重和阈值。然而,BP遭受了固有的局部最小诱捕问题,并且在实现其权重和阈值的全局最佳值方面具有困难。BP的这种缺点在很大程度上限制了我们神经模式的计算能力。为了提高EPNN的表现,我们采用玉培训模型。
翡翠被认为是2011年发布的重大审查中的一些“差分进化(de)”的重要变体之一[34].De Algorithms的广泛普及导致越来越兴趣地发展其变体[46-48].众所周知,许多成胸型方法的性能受到控制参数的选择的影响[49那50].玉可以使用自适应机制来选择合适的参数和对于不同的优化问题并实现“de / current-to”具有可选外部存档的最佳“变异”策略。实验结果表明,JADE算法在进化过程中取得了较好的勘探与开发平衡,在求解质量和收敛速度上优于其他优化算法[33].玉遵循进化算法的一般程序。初始化后,DE执行进化操作的循环:突变,交叉和选择。此外,玉石动态更新控制参数作为进化搜索所得款项。
初始化:初始种群中的每个代理 是根据均匀分布随机产生的。 在哪里是问题的维度和是人口规模。
突变:每一代 那变异向量是根据当前父群创建的。 指数在哪里 那和从集合中均匀地选择不同的整数吗 ; 被选中为顶部之一目前人口中的个人,概率 ;和是个体的突变因素吗这将通过适应机制在每一代进行再生。
交叉:采用二项式交叉操作生成最终子代向量 . 在哪里是在间隔的均匀随机数 . 是从集合中随机提取的整数 那在每个单独的有自己的交叉概率 .交叉概率 大致对应于从突变矢量继承向量的成分的分数。
选择:选择操作比较父向量随着试用载体根据他们的健身价值观 那它为下一代选择了更好的向量。例如,如果给定最小化问题,则由以下等式生成所选的向量:
另外,如果试验矢量比父母更好的载体 那控制参数和个体的成功变异因子和成功交叉概率分别称为成功变异因子和成功交叉概率。
参数适应性:对参数值的控制越好,个体生存的可能性越大,这些值应该保留到下一代。在每一代 那交叉率根据平均值的正常分布独立形成和标准偏差0.1,然后归一化到范围 那这可以描述如下: 在哪里是记录所有成功交叉率的集合在一代 .初始价值设置为0.5;然后,在每个代文结束时由以下等式更新: 在哪里这个区间是正的常数吗和中的代理的算术平均数 .
同样,突变因子也根据具有位置参数的Cauchy分布而独立生成和尺度参数0.1,随后被归一化以 .这可表示如下:
此外,该集合包含一代中的所有成功的突变因素 .初始价值的柯西分布设定为0.5,然后,它们在每一代的由下式的末端更新:
4.申请破产分类
4.1。破产数据集介绍
为了评价EPNN的性能,我们在实验中采用了基准和面向应用的数据库。每种选择都有其优点和缺点。基准数据库允许未来的实验在不同的预测模型之间进行广泛的比较,但它不能代表当前的社会经济状况。因此,实验可能是过时的,并导致无意义的结论。相比之下,面向应用程序的数据库能够解决实际问题,但难以用于进一步的比较。因此,通常最好同时使用基准和面向应用的数据库[51].本研究采用来自UCI机器学习数据库存储库,并从Kaggle数据集遇险数据集定性破产数据集来绘制一个显著和有意义的结论。在本文中,假设一个公司的财务状况的状态是通过定性变量表示,如二元变量,其中“1”代表一个财务健全的公司,“0”表示公司陷入破产。
定性破产数据集是从UCI库中,已在文献中几个以前的作品成功地申请破产分类。该数据集是由基于6个属性250个的实例,与每个相应的关于质参数破产,即,行业风险,经营风险,财务灵活性,信誉,竞争力和经营风险。输出有两类名义类型的,其描述了实例作为“破产”(107例)或“非破产”(143例)。遇险数据集是从Kaggle数据集,可以发现https://www.kaggle.com/shebrahimi/financial-destress..此数据集满足了对公司采样的财务困境预测。第一列代表了包括422家公司的示例公司。第二列显示了数据所属的不同时间段。时间序列长度为每家公司的1到14个。命名为目标变量的第三列是“财务遇险”。如果这个值高于-0.50,该公司应该被视为健康;否则,它被视为经济困难。第四个键列表示表示为的功能来 ;他们所代表的样本公司的一些金融和非金融的特点。这些功能都属于前一段时间,它应该被用来预测该公司是否会陷入财务困境的(分类)。到现在为止,还没有相关文献采用这些数据集来解决破产预测的问题。
4.2。数据预处理
一般来说,数据预处理是数据分析的初始和基本步骤。由于人工神经网络要求每个数据样本都用实数向量表示,所以我们需要将数据样本的标称属性转换为数值,然后再将其输入分类器[52].
在定性破产数据集中没有缺少值,但所有属性都是标称的。该数据集包括250个样本,每个样本具有6个功能。6个功能全部由3个标签表示:“p”,“a”和“n”。我们分别将定性功能转换为值1,2和3。
原始的Distress数据集是一个广泛的数据集;它包括422家公司,每个公司在不同的时间序列中表现不同。此外,这个数据集是不平衡和倾斜的;有136家公司陷入财务困境,286家公司状况良好,136家公司年度观察结果为财务困境,3546家公司年度观察结果为财务状况良好。为了使观察到的困境数据集的结构与定性破产数据集相似,我们进行了一些预处理。首先,从时间序列第1期到第14期选取所有陷入困境的公司,陷入困境的公司总数为126家。在每个时间序列期间,随机选取15家健康企业,健康企业数量为210家。因此,在新生成的数据集中还有336个样本。由于每家公司提供83个特性,这个数据集仍然相对较大。我们采用了最小冗余最大关联(mRMR)准则生成特征选择。 The mRMR criterion offers an excellent way to maximize the dependence of the results on the input features by combining the max-relevance criterion with the min-redundancy criterion. Moreover, mRMR can not only enhance the appropriate feature selection but also achieve high classification accuracy and high computation speeds [53].mRMR的最大关联机制定义如下: 在哪里是既包含了组个人的特性并且对目标类中最可观的依赖 .如果根据最大相关准则选择的特征具有高冗余度,则这些特征之间存在很大的依赖性。为了增加各自的类别识别能力,添加了最小冗余(min redundancy)条件以选择非交互特征[54],
mRMR通过运算符结合了这两个约束条件 通过采用一种简单的形式,以优化和同时。 使用MRMR,我们对此数据集的功能进行排序。 那 那 那 那 那 那 那 那 那和是前10个最大相关和最小冗余特征,并用于我们的实验。更新的遇险数据集包括336个样本,每个样本有10个特征。
4.3.最优参数设置
为了在训练数据集中实现特定的准确率和快速收敛,必须选择一组最优的参数。采用Taguchi方法,利用正交阵列减少实验运行次数[55].在这种方法下,我们的仿真也可以有效地控制时间成本、人力成本和材料需求。选择适合于仿真的正交阵列是关键步骤。首先,三个参数, 那被认为是重要的EPNN。为枝晶层的分支数,表示突触层中s形函数的参数表示SOMA的阈值。桌子1和3.显示两个数据集的参数值范围。有3个参数试验,每个参数包含4个值。的两个数据集的正交阵列在表中呈现2和4..为了获得一个可靠的平均测试精度,每个实验重复30次。种群大小设置为50,最大代数设置为1000。Qualitative Bankruptcy数据集和Distress数据集的准确率结果如表所示2和4..
|
|||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
从表格2,很明显,通过参数的组合实现了定性破产数据集的最高分类准确性 那和 .此外,从表4.,遇险数据集的最佳性能是 那和 .这些参数集可用于获得可接受的性能,并且它们是与其他算法进一步比较的最佳比较。
此外,由于MLP和PNN都被用作我们的实验中的竞争对手,所以这些算法的其他几个参数被认为是谨慎的。桌子5.列出相关参数。
|
|||||||||||||||||||||||||||||||||||||||||||||
接下来,为了进行公平的比较,需要在阈值和权值数量大致相等的情况下对EPNN、MLP和PNN的性能进行比较。同时,将反向误差传播算法训练的PNN和MLP的学习率设置为0.01。PNN中树突的数量应该在这个模拟中定义,就像MLP的隐藏层和神经元的数量一样。MLP的参数数主要取决于隐层神经元的数量。因此,我们将MLP表示为a -维矢量,它由重量和偏见。维数可以计算如下: 在哪里 那 那和在MLP的输入,隐藏和输出层中表示神经元数。和表示隐藏层和输出层中的偏差[56].
同时,在PNN和EPNN中,突触输入数为 那和树突分支编号是 .维数PNN和EPNN的计算公式为:
MLP和EPNN的结构描述如表所示6..两个模型对于两个数据集具有几乎等于的参数编号。
|
||||||||||||||||||||||||||||||||||||||||||||||||||||
为了评估的分类方法的性能,每个数据集随机地分成两个子集:训练集和测试集。训练集用于建立分类模型,以及测试数据集采用测试模型的准确性。分裂的策略是显著相关,以实现可靠的模型评估,因为情况下的数据通常是非常稀缺的。根据之前的实验,一个更大的训练集在一个更好的分类结果[57].在这种模拟中,将50%的样品随机选择进行培训,而剩余的50%是用于测试以保证高测试精度。分类精度率超过30个运行的平均值被认为是整体分类性能。
4.4。性能的措施
一般来说,大多数性能评估指标都试图估计已学习的模型预测新输入样本的正确类别的程度;然而,不同的指标产生不同的模型性能排序[58].分类精度已经由文献中的表现到目前为止最常采用的指标[51].可以突出显示灵敏度和特异性作为直接指数。AUC并不隐含地承担平等的错误分类成本,对应于作为经验所选择的阳性观察等级的经验概率计算的最优选的分数对应于随机选择的阴性样本[59].因此,整体准确率,灵敏度,特异性和AUC用于构建性能评估系统。
桌子7.表明一个分类器的结果可以通过2维矩阵的应急来测定。准确率是在评估分类算法的关键指标;精度分析的另一指标是有关破产误分类的可能性。分类准确率是通过下面的公式测量: 其中TP、TN、FP、FN分别为真阳性、真阴性、假阳性、假阴性。真阳性(TP)表示该公司被检测为健康,教师目标标签也是健康的。真负(TN)表示输入和教师目标标签同时被检测为不健康。假阳性(FP)表明输入被检测为健康的,而教师目标标签是不健康的。假阴性(FN)表示检测到输入不正常,而教师目标标签显示相反的情况, 其中敏感性和特异性分别称为真阳性率和真阴性率。灵敏度测量正确识别的真实阳性的百分比。这个指标显示了分类器识别常规记录的成功程度,这意味着公司在破产分析方面是健康的。因此,金融机构可以采用灵敏度较高的分类器进行正确高效的分析。特异性表示分类器区分异常记录的成功程度;也就是说,它是真实负的比例。因此,更高的专一性可以帮助金融机构减少对健康企业进行错误分类的可能性。AUC代表的是没有破产危险的公司的比例。换句话说,得分为100%表示该分类器可以正确区分两个类,而得分为50%则表示该分类器对公司的正确分类能力不显著。
|
|||||||||||||||||||||||||||
除了比较不同的分类算法之外,比较两个模型,EPNN和MLP的收敛性能。当平均平方误差(MSE)实现预定的最小值时,学习趋于完成。训练错误计算如下(21), 在哪里和是所需的输出和实际输出;表示申请培训的实例数目;和表示模拟运行的次数。
4.5。性能比较
对于公平的比较,EPNN和PNN配备相同的参数,PNN和MLP的学习速率是相同的。所有三种算法都独立运行30次。桌子8.和13展示了这些算法获得的分类性能。此外,为了检测结果之间的显著差异,采用了一种称为Wilcoxon秩和检验的非参数检验[60在此研究中被采用。在文献中综述总结的是,优选使用非参数检验,而不是参数测试的,以实现高统计精度,特别是当样本大小是小[61].因此,计算出的 -Wilcoxon Rank-Sum测试的值也在表格中呈现。在以下比较表中,N / A表示“不适用”,这表明相关算法无法与测试中的自身进行比较。在我们的实验中,重要性水平设定为5%。作为一个例程,有实质性证据拒绝零假设 -值小于0.05。为了进一步验证EPNN的优越性,我们将其与其他普遍应用的分类方法进行比较,例如k最近邻算法(KNN)[62],激进的基函数(RBF)[63],随机森林(rf)[64]决策树(DT)[65],支持向量机(SVM)[66],以及判别分析(DA)[67].每个方法独立运行30次。每个方法的初始参数总结在表中9..
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||||||||||||||||||
4.5.1。定性破产数据集
对于定性破产数据集,如表8.,所提出的EPNN获得的平均测试精度为99.57%,高于PNN获得的98.11%,并通过MLP获得的94.59%。此外,统计结果还表明,EPNN比PNN和MLP实现明显更好的性能。此外,EPNN在敏感度和特异性方面也比PNN和MLP更好地表现得更好。相对较高的灵敏度值表明EPNN在识别健康的公司方面的强大能力。更高的特异性值代表EPNN无法错误分类不健康公司的能力。此外,在我们的实验中,还比较了三种模型,EPNN,PNN和MLP的收敛速率在图中的实验中4..如图所示,与PNN和MLP相比,EPNN实现了最高的收敛速率。而且,数字5.显示了EPNN的ROC的PNN和MLP。所述EPNN的相应AUC值比PNN和MLP的大。它强调的是,EPNN是解决定性破产数据集的问题优于PNN和MLP。此外,表演的EPNN等常用的分类之间的比较示于表10.很明显,EPNN还以定性破产数据集的平均精度率显示其优越性。
|
|||||||||||||||||||||||
由于有许多所提出的方法,以便在相对文献中对定性破产数据集进行分类,因此我们总结了分类性能,并将它们与EPNN的分类进行了比较。具体来说,表格11呈现一些单一分类方法和表格12分别展示了一些混合分类方法。从表格11,可以观察到EPNN的精度率仅略低于基于RBF的SVM,蚂蚁矿工和随机林。作为表12结果表明,与其他混合分类方法相比,EPNN的平均准确率仅略低于logistic回归-朴素贝叶斯混合分类方法。因此,可以得出结论,虽然EPNN采用了50%-50%的训练-测试比,但在定性破产数据集上仍然表现出了较好的性能。值得一提的是,基于上述实验结果,混合分类方法并不总是优于单一分类方法。
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
4.5.2。痛苦的数据集
关于Distress数据集,如表所示13,EPNN获得76.41%的平均测试精度,高于PNN获得的54.03%,并通过MLP获得的66.15%的精度。除此之外 -Wilcoxon测试的值显示EPNN与其他两种方法之间存在显着性差异。尽管并非所有EPNN的敏感性和特异性大于PNN和MLP的敏感性和特异性,但PNN对敏感性更差,并且MLP是特异性最差的。EPNN对敏感性和特异性的表现更好。EPNN,PNN和MLP的收敛曲线在图中比较6..这张图显示了在EPNN达到最高的收敛速度相比,PNN和MLP。此外,图7.呈现EPNN,PNN和MLP的ROC。另外,EPNN的相应AUC值大于PNN和MLP的相应AUC值。这意味着,与PNN和MLP相比,EPNN是遇险数据集上的更有效的分类器。此外,将EPNN的分类性能与KNN,RBF,RF,DT,SVM和DA进行比较,并且相应的结果显示在表中14.作为表14插图,EPNN比RF除外的所有其他分类方法更好。由于没有应用于在文献中对遇险数据集进行分类的其他分类方法,因此无法满足该数据集的水平比较。
|
|||||||||||||||||||||||
4.6。树突形态重建
4.6.1。终极突触和树突形态学
如上所述,EPNN在训练过程中可以实现突触修剪和树突修剪。因此,多余的突触和树突可以被去除,然后,一个简化和独特的拓扑形态为每个问题形成。数字8.显示了学习后EPNN在定性破产数据集上的特殊树突结构。图中显示了PNN不必要的树突(分支2、分支4和分支9)9.和多余的突触层如图所示10.最后,简化的结构形态在图中描述11.可以观察到,在结构中保留7个树枝状分支和4个特征。这意味着功能和对EPN不至关重要,并没有贡献解决定性破产数据集问题。此外,图12在学习之后说明了遇险数据集上的EPNN的独特树枝状形态。数字13表明所有无效的树突都被移除,图14排除所有无效的突触层。最终的结构形态如图所示15.只有四个树枝状的分支是剩下的,并且特征是删除。如表所述15中,可以观察到,突触修剪和树突修剪机制可以在很大程度上简化EPNN的结构。因此,它能够明显地加快由简化EPNN破产预测分析。
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||
4.6.2。在经过学习形态的简化逻辑电路
除了神经修剪功能,其他的功能值得强调的是,EPNN的简化结构能形成适用于硬件实现的近似逻辑电路。数字16和17结构形态的本进一步简化的逻辑电路。我们使用模拟数字转换器,其可以被看作是“比较”,以输入与该阈值进行比较 .一旦输入小于阈值 那“比较器”将输出0;否则,它将输出1.使用逻辑电路,我们可以将公司对定性破产数据集和遇险数据集进行破产和不破产。逻辑电路的准确性如表所示16.显然,逻辑电路的测试精度没有降低,并且高于EPNN的测试精度。请注意图中的逻辑电路16和17从任意选择的实验中随机选择,并且它们对每个问题并不唯一。形成逻辑电路可以进一步提高EPNN的分类速度,从而为预测金融破产来创造更强大的方法。
|
||||||||||||||||||
结论
人工智能算法,如神经网络方法,在破产分析中得到了广泛的应用。在本文中,我们引入了一个更现实的神经模型,称为EPNN,以便于破产分析。该技术采用JADE算法对模型进行训练,以获得满意的分类性能。与PNN和MLP相比,建议的EPNN在基准数据集和面向应用的数据集(即定性破产数据集和遇险数据集)的平均精度和AUC方面表现最好。此外,与KNN、RBF、RF、DT、SVM和DA等其他分类方法相比,EPNN还提供了具有竞争力和令人满意的分类性能。注意,神经元修剪机制是EPNN的一个重要方面。经过突触剪枝和树突剪枝后,两个数据集中的输入特征数量都减少了,神经网络的结构也简化了。此外,简化的结构形态可以形成一个逻辑电路,也可以作为解决破产预测问题的有力工具。因此,本文的贡献可以概括为三个方面:首先,我们通过比较不同分类模型对破产预测问题进行了全面的研究。尽管许多新算法不断涌现,但大部分方法仍然只关注破产预测模型提高分类精度的能力。与其他一些模型相比,EPNN在平均精度和AUC方面具有一定的优势。其次,EPNN可以实现突触和树突修剪,以实现模式提取和重建更紧凑的神经元形态。EPNN具有较大的初始神经元拓扑结构,这使得它对初始条件不太敏感,但它可以利用学习后的神经元修剪,这提高了神经网络的效率,加快了收敛速度,避免陷入局部极小,并减少了运算时间和计算量。第三,简化后的模型可以用逻辑电路代替,这样可以提高分类精度,并且易于在硬件上实现。因此,这些发现为理解和追踪单个神经元的运作机制和结构提供了细节,并为技术发展提供了见解。此外,研究结果还表明,所提出的EPNN分类器具有很好的潜力,可以应用于其他二元分类问题。EPNN使绘制破产公司的标准剖面图成为可能,并为破产现象提供理论贡献。人们相信,EPNN不仅适用于破产预测,还适用于财务分析范围内的其他应用领域,如绩效分析。
数据可用性
没有数据用于支持这项研究。
利益冲突
作者声明他们没有利益冲突。
参考
- E·I·奥特曼,“财务比率,判别分析和企业破产的预测,”金融杂志,卷。23,不。4,pp。589-609,1968。查看在:出版商的网站|谷歌学术
- J. A. Ohlson,“财务比率和破产的概率预测”会计研究杂志第18卷第2期1,第109-131,1980。查看在:出版商的网站|谷歌学术
- J. Begley,J. Ming和S. Watts,“20世纪80年代破产分类错误:对奥特曼和Ohlson的模型进行了实证分析”会计研究回顾,卷。1,不。4,PP。267-284,1996。查看在:出版商的网站|谷歌学术
- J克虏伯,A。施瓦兹,G。阿明格和A。齐格勒,“消费者信贷风险:使用机器学习的个人概率估计,”具有应用的专家系统,卷。40,不。13,第5125-5131,2013。查看在:出版商的网站|谷歌学术
- R. Pal, K. Kupka, A. P. Aneja, J. milky,《商业健康特征:混合回归和支持向量机分析》,具有应用的专家系统,卷。49,第48-59,2016。查看在:出版商的网站|谷歌学术
- A. E.Celik和Y. Karatepe,“通过神经网络模型评估和预测银行危机:土耳其银行业的应用,”具有应用的专家系统第33卷第3期4,第809-815页,2007。查看在:出版商的网站|谷歌学术
- M.佩雷斯(M. Perez),《人工神经网络与破产预测:最新进展》(Artificial neural networks and bankruptcy forecasting: A state of the art),神经计算与应用,卷。15,不。2,第154-163,2006年。查看在:出版商的网站|谷歌学术
- H. A. Abdou和J. Pointon,“信用评分,统计技术和评估标准:对文献进行审查,”会计,金融和管理中的智能系统第18卷第2期2-3,页59-88,2011。查看在:出版商的网站|谷歌学术
- M. D. ODOM和R. Sharda,“破产预测的神经网络模型”神经预测网络国际联合会议记录(IJCNN'90),页163-168,IEEE, 1990。查看在:谷歌学术
- 麦基和M. FelleStein,“预测破产使用递归分区和现实地比例的数据集”,“杂志的预测,卷。19,没有。3,页219-230,2000。查看在:出版商的网站|谷歌学术
- G. Zhang,M. Y. Hu,B.E.Patuwo和D.C.Indro,“破产预测中的人工神经网络:一般框架和交叉验证分析”欧洲运筹学研究杂志,第116卷,第116期1,第16-32页,1999。查看在:出版商的网站|谷歌学术
- T. Bellotti和J. Crook,“支持向量机器获得信用评分和发现重大功能”,“具有应用的专家系统第36卷第2期2, pp. 3302-3308, 2009。查看在:出版商的网站|谷歌学术
- K. Hornik,“多层前馈网络的近似能力”,神经网络,第4卷,第4期。2,pp。251-257,1991。查看在:出版商的网站|谷歌学术
- K. Hornik,“神经网络近似的一些新结果”,神经网络,第6卷,第2期8,第1069-1072页,1993。查看在:出版商的网站|谷歌学术
- K. Hornik,M. Stinchcombe和H. White,“多层前馈网络是普遍的近似器”,“神经网络,卷。2,不。5,PP。359-366,1989。查看在:出版商的网站|谷歌学术
- W. Chen和Y.杜,“使用神经网络和数据挖掘技术的财务困境预测模型,”具有应用的专家系统第36卷第2期2期,第4075-4086,2009。查看在:出版商的网站|谷歌学术
- H.王,徐问,和L.周,“使用套索回归合奏大型不平衡信用评分,”《公共科学图书馆•综合》,第10卷,第5期。2、文章编号e0117844, 2015。查看在:出版商的网站|谷歌学术
- C. Koch,T. Poggio和V.Torre,“树突树中的非线性交互:信息处理中的本地化,时间和角色”,“美利坚合众国国家科学院学会,卷。80,不。9 I,PP。2799-2802,1983。查看在:出版商的网站|谷歌学术
- C. Koch,T. Poggio和V.Torre,“视网膜神经节细胞:树突形态的功能解释,”皇家学会的哲学交易B:生物科学,第298卷,第1090号,第227-263页,1982年。查看在:出版商的网站|谷歌学术
- C.科赫,《计算和单个神经元》自然(2002年第1期)第2 - 3页,1997。查看在:出版商的网站|谷歌学术
- J.JI,S. GAO,J. Cheng,Z. Tang和Y. Todo,“具有树突结构的近似逻辑神经元模型”神经古脑,卷。173,pp.1775-1783,2016。查看在:出版商的网站|谷歌学术
- Y.唐,J.冀,S皋等人,“修剪信用分类分析神经网络模型,”计算智能和神经科学,卷。2018年,文章编号9390410,22页,2018。查看在:出版商的网站|谷歌学术
- S. Piramuthu, M. J. Shaw和J. A. Gentry,“一种使用多层神经网络的分类方法”,决策支持系统,第11卷,第5期。5,pp。509-525,1994。查看在:出版商的网站|谷歌学术
- S. Gao,M. Zhou,Y.王,J. cheng,H. Yachi和J. Wang,“树突神经元模型,具有有效的学习算法,用于分类,近似和预测,”神经网络和学习系统的IEEE交易,第30卷,第2期2,页601-614,2019。查看在:出版商的网站|谷歌学术
- R. R. Trippi和E. Turban,神经网络在金融和投资:使用人工智能提高现实世界的性能,麦格劳 - 山,Inc,1992年。
- T. P.福格尔,J. K. Mangis,A. K. Rigler,W. T.辛克和D. L. ALKON,“加快反向传播方法的收敛,”生物控制论,卷。59,没有。4-5,pp。257-263,1988。查看在:出版商的网站|谷歌学术
- S. Mirjalili,S. M. Mirjalili和A.刘易斯,“让一个生物地理学基于优化训练你的多层感知”信息科学,卷。269,第188-209,2014。查看在:出版商的网站|谷歌学术|Mathscinet.
- M. Gori和A. Tesi,“关于反向传播中的局部极小问题”,图案分析和机器智能的IEEE交易,卷。14,不。1,pp。76-86,1992。查看在:出版商的网站|谷歌学术
- Y.李,S.哦,M. W.金“在反向传播学习过早饱和度的分析,”神经网络,第6卷,第2期5,第719-728页,1993。查看在:出版商的网站|谷歌学术
- M. S. Hung和J. W. Denton,“用GRG2非线性优化器培训神经网络,”欧洲运筹学研究杂志,第69卷,第2期1,第83-91页,1993。查看在:出版商的网站|谷歌学术
- M. K. Weir,“反向传播中自适应学习速率的自我决定方法”,神经网络,第4卷,第4期。3、1991年第371-379页。查看在:出版商的网站|谷歌学术
- A. Van Ooyen和B. Nienhuis,“改进反向传播算法的收敛性”,神经网络,卷。5,不。3,第465-471,1992。查看在:出版商的网站|谷歌学术
- J. Q. Zhang And A. C. Sanderson,“Jade:具有可选外部档案的自适应差异演变”,IEEE进化计算汇刊,卷。13,不。5,pp。945-958,2009。查看在:出版商的网站|谷歌学术
- S. Das和P. N. Suganthan,《差异进化:最先进的研究》,IEEE进化计算汇刊,卷。15,不。1,第4-31,2011。查看在:出版商的网站|谷歌学术
- M莫雷,S。K是,T。赫尔曼,A。尼恩,E。布兰科和S。LZipursky,“感光神经元突触层特异性和视紫红质的协调控制,”自然,卷。456,没有。7223,第795-799,2008。查看在:出版商的网站|谷歌学术
- c·科赫计算生物物理学:单一神经元中的信息处理,牛津大学出版社,2004年出版社。
- E. SalinaS和L.F. Abbott,“Parietal Cortex中的乘法神经反应模型”,美利坚合众国国家科学院学会第93卷第5期21,页11956-11961,1996。查看在:出版商的网站|谷歌学术
- F. Gabbiani, H. G. Krapp, C. Koch,和G. Laurent,“对隐现敏感的视觉神经元的乘法计算,”自然第420卷第2期第2 - 3页,2002。查看在:出版商的网站|谷歌学术
- J. Sietsma和R. J. Dow,“神经净修剪 - 为什么以及如何,”1993年关于IEEE神经网络国际会议的诉讼程序(ICNN'93), vol. 1, pp. 325-333, IEEE, San Diego, CA, USA, 1988。查看在:出版商的网站|谷歌学术
- K. Nagaraj和A. Sridhar,“使用机器学习技术检测破产的预测系统”https://arxiv.org/abs/1502.03601.查看在:谷歌学术
- E. K.Kornoushenko,“基于成对特征比较的分类算法”自动化和遥控器第78期11, pp. 2062-2074, 2017。查看在:出版商的网站|谷歌学术
- J. Uthayakumar, T. Vengattaraman, P. Dhavachelvan,“基于群体智能的分类规则归纳(cri)定性和定量方法框架:破产预测和信用风险分析的应用”,沙特国王大学学报-计算机与信息科学,2017年。查看在:谷歌学术
- J. Uthayakumar, N. Metawa, K. Shankar, and S. K. Lakshmanaprabu,“使用机器学习技术的金融危机预测智能混合模型”,信息系统和电子商务管理学报,第1-29页,2018年。查看在:谷歌学术
- 陈永强,“关于分类的混合逻辑回归-朴素贝叶斯模型的构建”,载《中国科学(d辑)》第1期在概率图模型的会议论文集,第523-534,2016。查看在:谷歌学术
- N. Wang,“使用机器学习的破产预测”数学金融杂志,卷。7,不。04页。908,2017年。查看在:出版商的网站|谷歌学术
- R. Storn和K. Price,“微分进化—连续空间上全局优化的一个简单而有效的启发式”,全球优化杂志,第11卷,第5期。4,页341-359,1997。查看在:出版商的网站|谷歌学术
- Q.林,刘S.,问:朱等人,“有许多目标优化问题的一个平衡的适宜推定粒子群算法”IEEE进化计算汇刊,卷。22,没有。1,第32-46,2018。查看在:出版商的网站|谷歌学术
- Q. Lin,S. Liu,K. Wong等,“基于聚类的进化算法,用于多目标优化问题”IEEE进化计算汇刊,卷。23,不。3,pp。391-405,2019。查看在:出版商的网站|谷歌学术
- A. E. Eiben和S. K. SMIT,“用于配置和分析进化算法的参数调整”群和进化计算,第一卷,第一期,第19-31页,2011年。查看在:出版商的网站|谷歌学术
- A. Zamuda和J.布雷斯特,“自适应控制参数?随机化的频率和在微分进化的传播,”群和进化计算,卷。25,第72-99,2015。查看在:出版商的网站|谷歌学术
- 五,加西亚,A。一马尔克斯和J. S.桑切斯,“见识到了实验设计,信用风险和企业破产预测系统”智能信息系统杂志,第44卷,第5期。1, pp. 159-189, 2015。查看在:出版商的网站|谷歌学术
- 厘米。王和y.-f.Huang,“基于进化的特征选择方法,具有数据挖掘的新标准:信用审批数据的案例研究,”具有应用的专家系统第36卷第2期3, pp. 5900 - 5908,2009。查看在:出版商的网站|谷歌学术
- 彭海鹏,龙飞,丁辰,“基于互信息的特征选择:最大依赖、最大关联和最小冗余准则”,图案分析和机器智能的IEEE交易,卷。27,不。8,pp。1226-1238,2005。查看在:出版商的网站|谷歌学术
- C.丁和H.peng,“微阵列基因表达数据中的最小冗余特征选择,”生物信息学与计算生物学杂志,第3卷,第2期。2,页185-205,2005。查看在:出版商的网站|谷歌学术
- R. _ _ _·斯皮乌什等人。,基于计算机的健壮工程:DFSS的要点,ASQ质量出版社,2004年。
- Z.贝赫什提,S. M. H.苏丁,E.贝赫什提和S. S. Yuhaniz,“人工神经网络使用用于医疗诊断疾病心加速的粒子群优化学习的增强,”软计算第18卷第2期11,pp。2253-2270,2013。查看在:出版商的网站|谷歌学术
- I. H. Witten,E. Frank,M. A. Hall和C. J. Pal,数据挖掘:实用机器学习工具和技术,摩根Kaufmann,2016。
- D. J. Hand,《评估分类方法的性能》,国际统计审查,卷。80,不。3,pp。400-414,2012。查看在:出版商的网站|谷歌学术
- N. M. Kiefer,“低默认投资组合的默认估计”,经验金融杂志,第16卷,第5期。1,页164-173,2009。查看在:谷歌学术|Mathscinet.
- F. Wilcoxon,“通过排名方法的个人比较”生物识别公报,卷。1,不。6,pp。80-83,1945。查看在:谷歌学术
- J. Demšar,“分类器在多个数据集上的统计比较,”机器学习研究杂志,第7卷,第1-30页,2006。查看在:谷歌学术|Mathscinet.
- T. M.封面和P. E. HART,“最近的邻居模式分类”IEEE信息理论汇刊,卷。13,不。1,pp。21-27,1967。查看在:出版商的网站|谷歌学术
- Y. Lu,N. Sundararajan和P. Saratchandran,“序列最小径向基函数(RBF)神经网络学习算法的性能评估”神经网络和学习系统的IEEE交易,第9卷,第5期。2, 1998。查看在:出版商的网站|谷歌学术
- V. Svetnik, a . Liaw, C. Tong, J. Christopher Culberson, R. P. Sheridan,和B. P. Feuston,“随机森林:用于复合分类和QSAR建模的分类和回归工具”,杂志的化学信息与计算机科学,卷。43,不。6,PP。1947-1958,2003。查看在:出版商的网站|谷歌学术
- S. R. Safavian和D. Landgrebe,“决策树分类器方法的调查”,IEEE系统、人与控制论汇刊,卷。21,不。3,第660-674,1991。查看在:出版商的网站|谷歌学术|Mathscinet.
- M. M. Adankon和M. Cheriet,“支持向量机,”生物识别技术的百科全书,pp.1303-1308,2009。查看在:谷歌学术
- S. Mika,G. Ratsch,J. Weston,B. Scholkopf和K.-r.Muller,“Fisher判别分析与核,”第九IEEE信号处理社会动态动态动态信号处理协会研讨会(NNSP '99),第41-48,麦迪逊,威斯康星州,美国,1999年8月。查看在:出版商的网站|谷歌学术
版权
版权所有©2019唐雅姣等人。这是一篇发布在知识共享署名许可协议如果正确引用了原始工作,则允许在任何媒体中的不受限制使用,分发和再现。