文摘
小型和微型企业在经济增长起着非常重要的作用,技术创新、就业和社会稳定等。由于缺少可靠的财务报表和可靠的小型和微型企业的业务记录,他们正面临着融资困难,已成为一个重要因素阻碍小型和微型企业的发展。因此,信用风险度量模型集成算法的基础上改进的静止(萤火虫群优化)和榆树(极端学习机)提出。首先,根据小型和微型企业的增长和发展特点的大数据环境下,信用风险的形成机制分析了小型和微型企业从粒度的角度扩展,跨境协会和全局视图由大数据驱动,和信贷指标体系全面建立测量通过总结和分析影响信用评价指标的因素。其次,新算法基于并行集成的点集自适应萤火虫群优化算法和极端的学习机器。最后,基于改进的静止和榆树的集成算法应用于小型和微型企业的信用风险度量模型,和一些中国的小型和微型企业样本数据收集,并进行仿真实验与MATLAB软件工具的帮助。实验结果表明,该模型是有效的,可行的,准确的。本文的研究成果为解决信用风险度量问题提供一个参考的小型和微型企业,也打下坚实的基础的理论研究信用风险管理。
1。介绍
近年来,中国经济保持了良好的发展势头。国内企业的数量稳步增长,特别是小型和微型企业,这已经成为大量动态的市场经济主体的企业集团。所以小型和微型企业是中国经济的一个重要组成部分。然而,小型和微型企业也面临严重的融资困难,生存和发展的过程。因为自己的原因,政治、经济、法律、和其他外部因素,他们进退两难的一些融资渠道,融资成本高。从宏观的角度来看,中国的市场经济体制还不完善,信用体系缺陷,小型和微型企业集团不能全面、客观的信用评估,和金融投资行业并没有足够的关注,导致狭窄的融资渠道。从微观的角度来看,小微企业轻资产,规模小,和未知的财务状况,所以很难合理评估信用风险。同时,私人贷款利率和成本很高,这使得融资困难的问题。
小型和微型企业信用风险的测量是国内外学者的研究热点。在中国,男人et al。1)构造套索物流模式识别的关键指标,影响小微企业的信用风险基于496年数据的小型和微型企业违约未上市的过程中,银行贷款。汉(2]使用积分的模糊支持向量机算法构建信用风险评估模型的小型和微型企业贷款模式的观点,企业的财务状况和特征。苏(3)使用软信息和硬信息的混合分析方法测量信用风险的小型和微型企业。Zhang et al。4)提出了一种基于模糊聚类的动态组合评价模型和SOM-k算法评估信用风险的小型和微型企业。基于信息不对称理论,吉野和Taghizadeh-hesary5)建立了一个理论模型的中小企业的信用和实证分析了影响因素的最优保证企业的比例。Hanggraeni et al。6)提出了一个更合适的中小企业信用风险度量方法,它使用默认概率测度的方法改善Z值和估计其重要价值。基于模糊物元的欧几里德贴近度模型,周et al。7]阐述了内在规律的工业园区企业的信用风险评估和提供了一个实用方法研究工业园区企业信用等级的评估。施等。8)发现与高档中小企业贷款的违约将导致回收率低,所以他们使用三个信用数据集测试信用风险的方法,以帮助中小企业解决不匹配的问题。
总之,目前的研究状态的小型和微型企业信用风险度量的方法从不同的角度探讨了构建信用评价指标体系和风险度量模型。其中,外国学者强调定量研究,挖掘一些中小企业的信贷数据进行研究和评价。国内学者更加重视定性研究的建设指标体系和定量研究信用风险测量。此外,大数据提供更全面、准确和精确的数字管理许多学科领域。陈、吴(9)认为,传统的管理已经成为数据管理和传统决策已成为决策基于数据挖掘分析大数据的背景。大数据应用程序的研究应该从数据特征、特点、问题和大数据的管理决策特征。小型和微型企业信用风险的度量模型由大数据提出了背景。
首先,小型和微型企业的特点以及大数据的影响在小型和微型企业的信用评估深度从粒度的角度分析了缩放、跨境协会和全局视图由大数据,小型和微型企业的机制探讨了信贷风险的形成。在此基础上,选择信用风险测量指标建立信用风险度量指标体系。其次,由于信用风险数据的固有的非线性关系,神经网络的自适应学习特征已经成为最常见的和相对准确的分类器在信用风险度量10- - - - - -13]。
因此,榆树前馈神经网络是用来解决信用风险测量的问题。因为隐层节点的数量分类精度有很大的影响,初始重量,榆树的阈值,和隐层节点参数优化的算法改进的静止。并行集成学习算法的基础上改进的静止算法和榆树神经网络应用于小型和微型企业信用风险度量的解决问题的小型和微型企业信贷风险测量。
本文的研究主要包括三部分。部分2给解释相关的算法和理论,提出了改进的静止算法基于良好的点集和结合了改进的静止算法和自适应步长策略。部分3介绍了信用综合评价的指标体系建立了暑假的因素和分析从粒度的角度扩展,跨境协会和全局视图由大数据,提出了信用风险度量模型的基础上,综合算法IGSO和榆树。部分4选择10 Banchmarks标准函数来评估IGSO算法的性能。收集数据的微小型企业在中国地区来验证微小型企业的信用风险度量模型的基础上,综合算法IGSO和榆树。
2。相关算法的描述
2.1。静止的算法
Metaheuristic算法是一种改进的启发式算法,这是随机算法和局部搜索算法的结合。传统metaheuristic算法包括禁忌搜索算法、模拟退火算法,遗传算法,蚁群优化算法、粒子群优化算法,人工鱼群算法、人工蜂群算法、人工神经网络算法,萤火虫群优化算法,等。目前,有几个新的metaheuristic算法,比如亨利气体溶解度(硫化汞)14(SMA)[],黏菌算法15(HHO)[],哈里斯鹰优化16]。群体智能优化算法是一种算法设计基于自然生物的群体行为特征,也是一个方法来解决分布式问题。共同的群体智能算法是蚁群算法,粒子群优化算法,人工鱼群算法,人工蜂群算法,狼蚁群算法,萤火虫群优化算法,等等。静止(萤火虫群优化)算法不仅是metaheuristic算法,也是一种群体智能算法。
静止的算法(17)也是一个仿生群体智能算法提出的印度学者Krishnand和Ghose用2005年,它模拟成群觅食、求偶行为的性质。与其他智能优化算法比较,GSO算法简洁明了和易于实现算法流程。由于更少的参数设置的优点,简单的工作机制,容易编程,和多极值捕获,本文选择静止算法为研究对象进行相关的理论和应用研究。该算法目前已经应用于多模函数优化(18),多源信号的位置(19),无线传感器节点布局(20.),模拟机器人组(21),聚类分析(22等领域,显示出良好的研究和应用前景。
静止算法的主要思想是,萤火虫在搜索空间代表每个优化问题的可行解。每个萤火虫都有自己的荧光素和传感半径。它的亮度的目标价值有关它的位置。亮度较高的萤火虫具有更好的索引值。在迭代过程中,光明的萤火虫具有较强的吸引能力,吸引其他明显走向它。因为每个萤火虫半径有自己的决定,决定将受到邻国的影响半径明显在同一时间。当周围明显的数量不多,决定半径明显增加,这可以吸引更多的萤火虫。当周围有更明显,决定半径较小。最后,大多数的萤火虫聚集在几个位置更好的目标函数值达到最佳值。静止算法描述的数学公式如下: 在哪里是萤火虫的荧光素值t迭代,中的目标函数值吗tth迭代,是荧光素的挥发系数值,是荧光素的增强因子,是感知半径的变化系数,社区萤火虫的数量阈值,是感知半径的街区,是动态决策域和步长。
静止的算法描述如下:步骤1:初始化算法的相关参数,包括人口规模、迭代时间,和其他参数,设置。步骤2:目标函数值对应的位置的萤火虫在tth迭代转化为荧光素值由公式(1)。步骤3:在动态决策域的半径 ,每个萤火虫个体选择的亮度高于本身形成域设置由公式(2)。的概率个人的移动到个人 在他们的领域设置计算公式(3)。第四步:选择对象和更新的位置的萤火虫我根据公式(4)。第五步:更新动态决策域半径的萤火虫我根据公式(5)。第六步:判断是否达到最大迭代算法。如果不是,转向步骤2;否则,结束。
由于不均匀分布的初始解的解空间中,该算法不稳定,收敛速度慢,准确率低。为了避免过早的静止问题算法,好点集的概念(GPS)理论是用来生成初始萤火虫人口与均匀分布。与此同时,一个新的惯性权函数的萤火虫用于动态更新移动步长,即。自适应步长,以进一步提高稳定、静止算法的收敛速度和精度。
2.2。改进的静止算法
2.2.1。好点集算法改进的静止
好点集的理论(23]提出Luogeng和王在近似分析理论的书。好点集可以为计算在高维空间提供更好的支持(24]。在[25),基于良好的点集的萤火虫优化算法提出了优化BP神经网络的初始权重和阈值,这是用来解决农业干旱评估的问题。根据(23- - - - - -25),好点集的基本定义和结构描述如下。
定义1。让是一个单位立方体m维欧几里得空间,表示为 。
定义2。根据样本的数量和尺寸 ,生成一个相同大小的点集作为目标 ,在哪里 ,和小数部分的吗 。比较样本点 与目标设定 ,并承担 ,在哪里 , , ,和被称为点集的偏差 。
定义3。集
,在哪里
是一个常数有关吗
和
。
也被认为是偏差的
,和
。因此,被认为是一个点集,好吗是一个很好的观点。
它可以看到从25)的顺序错误的数量只有相关样本和独立样本的空间维度,它提供了一个很好的算法对于高维近似。基于点集理论更好的方法比随机方法生成初始种群,因为良好的点集方法的偏差
,和偏差的随机方法
。
因为使用好点集理论构造萤火虫的初始种群,其计算精度是独立的维度。所以使用方法基于良好的点集理论设计最初的萤火虫人口均匀可以克服传统方法的缺点,可以产生更好的初始种群的多样性。
最初的萤火虫人口的数量n的方法的集合n优点在m维空间被定义如下:(1)通过指数序列生成好点集的方法:
。(2)通过根序列生成好点集的方法:
。(3)生成圆好点集划分方法:
。使用良好的点集的方法来设计最初的萤火虫人口均匀可以产生更好的初始种群的多样性。数据1- - - - - -4显示二维初始种群分布图表400的规模由随机生成方法和三个好点集的方法。直接从数据可以看出,数据点分布在好点集的方法是比这更均匀的随机点。优点是独立的建筑空间的维度,可以用来解决高维问题。因为采取的点的数量好点集的方法是一样的,分布的效果是相同的。因此,可以获得相对较好的初始萤火虫人口映射生成的静止的目标解决方案空间的好点的算法。
2.2.2。自适应步长算法改进的静止
在静止的算法中,每个萤火虫有不同的搜索范围由传感半径。静止算法可以找到全局或局部最优解,这取决于个人能否在感应范围内移动。随着迭代的数量的增加,萤火虫个体倾向于峰值附近的收敛。在这个时候,如果萤火虫个体之间的距离和峰值小于移动一步,个人将搬到另一边的高峰。如果再次重复迭代,萤火虫个体将搬到另一边的高峰。个人还未达到最优峰值。萤火虫个体反复绕着山峰,叫做振荡现象。为了解决这个问题,有必要调整步长动态地根据不同阶段的搜索结果,以处理之间的关系全局优化能力、收敛速度和优化精度。基于惯性权重的粒子速度的粒子群优化算法(26),惯性权重萤火虫位移的函数定义,函数的迭代 。移动步长是专门的惯性权重函数定义为 在哪里至少移动步长,最大的移动步长,是迭代的最大数量。
萤火虫的惯性权重函数如图移动一步5。因此,的位置更新我th萤火虫不再是由公式(4由公式(),但7在改进的静止算法):
2.3。榆树
传统的单隐层前馈神经网络模型主要是基于梯度下降算法的BP神经网络算法等。其学习速度难以满足需求,并且很容易导致局部最优解。在不同的应用场景中,参数需要调整。
2004年,黄等。27)提出了一种新的前馈神经网络,这是极端的学习方法(ELM)。榆树有一些优势在解决数据拟合,回归、分类、模式识别、以及其他相关的问题(28),已广泛应用于cx-image处理(29日),医学诊断(30.),故障检查(31日)交通标志识别(32),和其他领域。榆树是一个快速学习单层前馈神经网络算法基于彭罗斯摩尔矩阵理论。
假设隐层神经元的数目的榆树和训练样本的数量 。有任意样本 ,在哪里 , 。单隐层神经网络l隐层节点可以表示为 在哪里是激活函数, 代表输入重量, 是输出的重量,是第i个隐层单元的偏移量,然后呢 的内积和 。
单隐层神经网络的学习目标是最小化输出错误,可以表示为
也就是说,有 , ,和 ,使
它也可以表示为 在哪里隐层节点的输出;是输出重量;和是预期的输出。
为了单隐层神经网络训练,我们希望得到的 ,使 在哪里 ,相当于减少损失函数:
传统的学习算法基于梯度需要调整所有参数在迭代的过程中。在榆树算法,一旦输入重量和偏见隐藏层的决心,输出矩阵隐层的独特的决定(33]。培训单隐层神经网络可以转化为求解一个线性系统 和输出的重量可以确定为 在哪里是彭罗斯摩尔隐层输出矩阵的广义逆,叫做伪逆。因此,榆树的学习过程可以概括为三点。(1)输入体重和隐层随机阈值给出(2)根据训练数据的输入和隐层的激活函数,输出矩阵隐藏层计算(3)根据公式(16),输出的重量计算网络
3所示。信用风险度量模型的小型和微型企业
3.1。信用风险测量指标体系的建设
因为建设小型和微型企业信用风险度量的指标有三个特点,大数据问题9]:粒度缩放、跨境协会和全局视图,这也属于与大数据相关的问题。首先,粒度扩展是指数字化的小型和微型企业信贷问题的元素,它可以按比例缩小的不同测量指标之间的粒度级别。其次,跨境协会指的因素空间的扩张信贷问题的小型和微型企业。不仅需要考虑传统元素和域视角的小型和微型企业,但也强调“外部性”和“跨境”,把内部数据(如基本信息和金融和非金融行业内部数据的小型和微型企业)与外部数据(社会接触和电子商务数据的业务所有者或管理者)。最后,全局视图是指全球性信贷指数的定义和解决方案的问题,小型和微型企业,强调整体的控制和解释有关情况及其动态演化的照片。
参照使用的信用指标体系穆迪投资者服务公司和标准普尔公司,结合小型和微型企业发展的特点由大数据驱动,我们充分注意社交平台和电子商务平台数据的影响企业所有者在小型和微型企业的信用状况。企业经营者的信用状况,企业创新能力、企业竞争力和员工质量突出显示,以便合理反映小型和微型企业的信用水平。选择7个一级指标和22个二级指标。SPSS软件用于因素分析量化指标之间的相关性,以及主成分分析用于提取因素指标。最后,7种主要指标和10个二级指标选为信用风险测量指标体系,如表所示1。
3.2。信用风险度量模型
3.2.1之上。思想的综合算法
榆树可以随机初始连接权值和隐藏阈值输入层和隐层之间前培训。榆树不需要多次迭代学习,可以直接计算输出权重矩阵的最小二乘解。虽然学习速度快,参数调整简单,模型的鲁棒性将大大影响时噪音或不均匀分布在训练数据集(34]。此外,由于输入重量和隐层阈值是随机选择的,榆树需要更多比其他前馈神经网络隐层节点,影响网络的稳定性和泛化。因此,IGSO是用于优化榆树的重量和阈值,和整体策略进行了最佳权重和阈值和最合理的隐层节点的数量。
IGSO-ELM集成学习算法的思想是确定结构的榆树根据输入和输出参数,以确定每个萤火虫的编码长度。每个人群中包含初始权值和阈值榆树的价值。也就是说,榆树的初始权值和阈值是通过解码的萤火虫个体IGSO算法;然后IGSO算法用来优化榆树的权值和阈值。因此,平行和交互式学习算法IGSO和榆树的构建方法。最后,得到了最优榆树权重和阈值。IGSO-ELM的流程图如图6。
3.3。集成算法的描述
榆树输入节点的数目是由小型和微型企业的信用风险测量指标。隐层节点的数量是由样本的数量决定。输出节点表示的信用记录是否小型和微型企业违约。IGSO-ELM算法实现如下:步骤1。编码:榆树的参数,如重量 ,阈值 ,和最初的隐层节点的数量 ,被认为是作为一个萤火虫对实数编码。萤火虫的人口理论的初始化好点集,计算输出权重和创建榆树网络根据公式(11)- (14)和(16)。步骤2。初始化参数:设置萤火虫人口规模 ,最初的荧光素 ,传感半径 ,初始步长 ,荧光素波动系数 ,和荧光素更新率萤火虫。让迭代计数器的初始值 。设置最大迭代数 。步骤3。计算萤火虫健身:解码萤火虫,生成榆树的重量和阈值,训练和测试网络的网络测试误差(美),采用误差指标作为每个萤火虫的健身,和更新每个萤火虫的荧光素值由公式(1)。步骤4。更新萤火虫地点:计算公式设定的社区(2),计算转移概率公式(3),和更新每个萤火虫的位置基于目标对象的移动方向由轮盘赌选择法和步长计算公式(6)。第5步。更新决策半径:更新传感半径的萤火虫根据公式(5)。步骤6。判断:判断输出榆树精度是否满足结束条件;如果实现了,乐观的结果给了榆树网络产生的输出结果,迭代结束;否则,判断是否到达最大迭代,如果不是,转到步骤3。否则,结束。
3.4。模型的性能评价指标
模型的性能评价标准是衡量模型的不可或缺的部分。适当的测量模型的估计可以评估不同模型的准确性,使不同的模型相互比较,也被用来定义警告阈值(35]。有许多误差测量方法评估模型和观测数据之间的匹配程度,如梅(平均绝对误差),均方根误差(均方根误差),CA(分类精度)(平方相关系数)。细节如下: 在哪里和代表了测量值和平均测量值;和代表观测值和平均观测值;和代表的数量样本正确分类和测试样本的数量;代表观测样本的数量。
4所示。实验和分析
这个实验中的所有代码都写在MATLAB r2013a软件平台。编译后的英特尔电脑参数(R) (TM)核心i7 - 7200 u CPU 2.71 GHz 8.00 GB内存、64位Windows10操作系统。
4.1。IGSO算法的性能测试实验
为了验证IGSO算法的有效性基于点集理论和自适应步长策略好,以下10选择基准标准函数进行测试,如表中列出2。其中,f1来f5是二维的函数和f6来f10多维功能,尺寸d= 20。显示的优点IGSO算法在解决多值函数,研究比较了IGSO算法与传统的静止算法如下。
两个静止算法的参数设置如下:最大迭代设置为100。人口规模设置为100。设置初始荧光素 ,初始步长 , , ,荧光素波动系数 ,荧光素更新率 ,和现场变化率 萤火虫。静止的参数和IGSO来自实验的价值体验。萤火虫个体的动态决策域和感知半径对算法的结果有重要的影响。因此,我们关注实验确定萤火虫个体决策和感知半径时解决每个基准测试函数。
最初的感知域和动态决策域的测试函数 是不同的,其决定萤火虫个体半径是2.448,2.548,2.688,2.448,2.888,35.048,28.048,30.048,35.048,30.048。
在表3,最好的,最糟糕的情况下,的意思是,和Var是用来记录最好的解决方案,最糟糕的解决方案,一般的解决方案,解决方案的方差30次独立实验。图7显示了IGSO和GSO算法的收敛曲线为10的功能 。IGSO算法的性能测试结果分析如下:(1)在计算精度方面,在30次重复实验,表中3表明,最好的价值,最坏值,和10的平均价值函数解决IGSO算法都优于传统的静止算法,这基本上是接近各自的标准值。(2)在收敛速度方面,从图可以看出7的收敛速度IGSO算法功能f1,f5,f9,f10比静止的算法快得多,但是对于功能f6,f7,f8的收敛速度是一样的,静止的算法,由于函数f6,f7,f8多维功能,两种算法在高维空间的搜索速度远远慢于二维空间。IGSO算法收敛速度的函数f2,f3,f4比静止的算法要慢得多。但是算法的准确性比静止的算法。(3)在稳定性方面,从方差值表3,可以看出GSO算法有很大差异的30倍的解决方案结果的功能f1,f2,f6,f9,f10、IGSO算法的方差小于静止的算法功能f1f2,f6,f9。这是因为IGSO算法的初始种群生成的好点集的方法,和最初的解决方案是相同的每次运行该算法。它还可以看到从图7有一定的波动曲线算法在迭代过程中。静止算法与IGSO算法相比,更不稳定。
(一)
(b)
(c)
(d)
(e)
(f)
(g)
(h)
(我)
(j)
把函数f8例如,与原来的静止算法相比,最佳的解决方案,最糟糕的解决方案,和平均30次独立实验的方案IGSO算法减少了7.456504 e−15日1.612441 e−08年,分别和2.003430 e−12。原始GSO算法减少了1.132974的相应的解决方案e−14日1.612441e−08年和6.449133e−09年。IGSO算法的性能是最好的,这表明IGSO算法的能力近似最优的解决方案。此外,解决方案的方差静止和IGSO算法减少了2.696393e1.531690−16日e−17分别,这意味着IGSO算法可以生成更准确稳定的解决方案。因为IGSO算法是基于均匀分布的初始种群产生的好的点集方法和自适应步长策略引入了惯性权重,使萤火虫个体算法保持一种自适应步长搜索最优解。因此,IGSO算法具有全局搜索能力。
总之,与原始静止算法相比,IGSO算法收敛速度和计算精度有很大的提高,和IGSO算法在稳定性与GSO算法相比有一些优势。
4.2。实证分析小微企业的信用风险
4.2.1。准备数据收集
小型和微型企业信贷数据在中国是用来测试IGSO-ELM算法模型。实验数据跨度从2017年到2018年,其中包括以下类型的信息:(1)个人信息的小型和微型企业法人;(2)经济和财务比率数据的小型和微型企业;(3)当前的信贷数据的小型和微型企业。个人信息的企业所有者和金融和经济数据来自CSMAR泰安金融研究数据库,和企业信贷数据从芝麻获得信贷业务服务平台。共549个样本的小型和微型企业获得和处理。根据金融机构的定义,贷款被认为是违约如果逾期超过15天。其中,小型和微型企业308年没有贷款违约,占56.11%,剩下的214小型和微型企业不同程度的贷款违约,占43.89%。为了有效地比较分类模型(摘要、榆树、ABC-ELM PSO-ELM, GSO-ELM,和IGSO-ELM),数据集随机分成两个不相交的子集,其中75%是训练子集和25%是测试子集。10交叉测试是用于每个模型。 The advantage of cross testing is that the credit model can contain the available data (75% of the samples) to the maximum extent.
4.2.2。实验设计
根据研究结果部分4.1,10个索引是选为榆树神经网络的输入层,10的隐层节点,对应于一个节点的输出层。因此,榆树网络结构是10-10-1。验证的效率IGSO-ELM模型,摘要模型,榆树模型,ABC-ELM模型、GSO-ELM模型和PSO-ELM模型构造进行信用风险度量分析。榆树相关模型的参数设置如下:重建[0,1]之间的数据规范化。采用乙状结肠函数作为激活函数。榆树的类型设置为分类模式。
IGSO和GSO算法模型相关的参数设置为人口规模 ,最大迭代 。最初的荧光素 ,初始步长 , , ,荧光素波动系数 ,荧光素更新率 ,和现场变化率 萤火虫。最初的感知域和动态决策域都是一样的,58.248。
摘要利用模型、初始权值和阈值由马夸特Levenberg获得。隐藏层和输出层的传递函数s形的函数和线性函数,分别。其中,培训摘要模型的迭代的数量是103,MSE目标是10−2和学习速度是10−1。摘要隐层节点的数量和榆树模型是由一步试验计算。根据训练样本的大小,隐层节点的数量依次增加。确定隐层节点的数量时,分类精度达到最大。计算结果表明,榆树模型的隐层节点的数量是20。
ABC-ELM算法(36),模型与ABC算法的参数设置为人口规模n就业的人数是100,觅食者和旁观者吗n/ 2,食物来源的局限性限制设置为50,和最大迭代次数设置为50。
PSO-ELM算法(37),模型与PSO算法的参数设置为人口规模n是100。加速度的因素C1,C2都设置为2,和其他PSO算法的参数设置如下:最大速度V马克斯= 0.5,最低速度V最小值=−0.5。
IGSO-ELM开始从最初的隐藏节点5,逐步增加隐藏节点的数量,优化样本分类的准确性。确定IGSO-ELM隐藏节点的数量,如图所示8。因此,摘要的结构模型、榆树模型,ABC-ELM模型、GSO-ELM模型和IGSO-ELM模型都是10-20-1。
为了比较IGSO-ELM模型的收敛效果,GSO-ELM模型,PSO-ELM模型,和ABC-ELM模型,图9显示了健身价值之间的关系,即MSE(均方误差)和四个模型的迭代次数。从图可以看出9IGSO-ELM模式减少了迭代次数,可以找到一个稳定的解决方案接近最好的目标。初始种群的主要原因是基于好点集的理论和移动的动态调整步长可以改善萤火虫种群的全局搜索能力。
在表4,最好的,最糟糕的情况下,的意思是,和Var是用来记录最好的解决方案,最糟糕的解决方案,解决方案,平均方差摘要模型的解决方案,榆树模型,ABC-ELM模式,PSO-ELM模式,GSO-ELM模式,和IGSO-ELM模式ABC-ELM 10次独立实验,PSO-ELM GSO-ELM和IGSO-ELM算法。测试集的输出结果如图6模型10。性能测试结果分析了六个模型如下。
首先,它可以从表4相比之下,其他五个模型,最好的,最糟糕的情况下,和平均IGSO-ELM模型的解决方案与10个独立实验是92.7273,85.4545,和88.8951,分别比相应的其他五个模型的解决方案。
其次,与ABC-ELM模型相比,PSO-ELM模型,GSO-ELM模型,和IGSO-ELM模型,摘要模型和榆树模型这两种单隐层前馈神经网络分类精度较低。摘要模型的最佳分类精度仅为50%,和榆树的最佳分类精度模型仅为81%,这表明它是一个非常正确的选择优化单隐层前馈神经网络模型通过使用各种群体智能优化算法来提高分类精度。
最后,它可以从表4摘要和榆树模型的方差值远远大于ABC-ELM, PSO-ELM, GSO-ELM,和IGSO-ELM模型,这说明摘要和榆树模型的稳定性与其他四个模型相比是相对贫穷。IGSO-ELM模型的方差值是最小的ABC-ELM相比,PSO-ELM GSO-ELM模型,这表明IGSO-ELM模型比其他三个组合模型更稳定。这是因为IGSO算法生成初始种群通过使用良好的点集的方法,这可以极大地提高整个IGSO-ELM模型的性能。
为了更好地说明IGSO-ELM模型的优势,三个常用的机器学习的评价指标、梅、RMSE,R2,选择。平均的平均绝对误差(MAE)平均绝对误差,这意味着平均绝对误差预测值与观测值;均方根误差(均方根误差)是样本标准差之间的区别(称为残余)预测值和观测值。RMSE是用来说明样本分散的程度;R2尼克决定系数的名称或相关系数平方,衡量总量的比例变化的因变量解释为独立变量。
从表可以看出5相关系数平方摘要、榆树、ABC-ELM、PSO-ELM GSO-ELM, IGSO-ELM模型NaN, 0.3888, 0.5952, 0.6668, 0.6261,和0.7105,分别。的榆树的价值模型比摘要模型,和梅和MSE的值小于摘要的模型,它显示了榆树模型具有较高的分类精度和更好的泛化性能与摘要模型基于梯度下降的方法。
在表5,分类精度(CA) ABC-ELM PSO-ELM,和GSO-ELM模型是高于榆树模型,这表明,群智能算法起着良好的作用在改善榆树的预测精度。此外,IGSO-ELM模型的分类精度高于ABC-ELM, PSO-ELM,和GSO-ELM模型,它显示了榆树算法的改进方向的正确性和性能良好的IGSO-ELM模型在信用风险测量的微型和小型企业。
5。结论
由于缺乏可靠的财务报表和操作记录,小型和微型企业面临融资困难,已成为一个重要因素限制小型和微型企业的发展。小型和微型企业的信用状况中扮演一个重要的角色在他们的融资,因此,研究信用风险的测量具有重要意义的小型和微型企业。因此,本文提出了一种信用风险度量模型的基础上改进的静止算法和榆树的算法。首先,根据小型和微型企业的增长和发展特点的大数据环境下,信用风险的形成机制分析了小型和微型企业从规模由大数据粒度的角度来看,跨境关联,和全球视角,综合评价指标体系是由总结和分析影响信用评价指标的因素。其次,传统的静止算法提高了好点集理论和变步长策略,和10个标准函数选择测试IGSO算法的有效性。实验结果表明,该IGSO算法有很好的改善稳定性、精度和收敛速度与GSO算法。所以,综合算法建立了基于改进的静止和榆树。隐层节点的数量在榆树是由一步一步的试验方法,然后榆树的重量和阈值的优化改进GSO算法集成算法。最后,榆树是一个简单而有效的方法来建立小型和微型企业的信用风险度量模型,通过仿真实验验证。因此,小型和微型企业信用风险的度量模型基于IGSO-ELM集成算法。 The sample data of small and micro enterprises in China are collected, and the simulation experiment is carried out with MATLAB software tool. The experimental results showed that the model was effective, feasible, and accurate compared with the BPNN model, ELM model, ABC-ELM mode, PSO-ELM model, and GSO-ELM model. The research results of this paper can provide a reference for solving the problem of credit risk measurement of small and micro enterprises and also lay a solid foundation for the theoretical research of credit risk management.
数据可用性
[。xlsx]数据用于支持本研究的发现正在禁运,而研究成果商业化。请求数据,6个月后发表的这篇文章中,将会被相应的作者。
的利益冲突
作者宣称没有利益冲突。
确认
本研究支持的哲学和社会科学规划基金项目的安徽省(没有。AHSKY2018D09)。