行动研究进展

PDF
行动研究进展/2019年/文章

评论文章|开放获取

体积 2019年 |文章的ID 1974794 | https://doi.org/10.1155/2019/1974794

r . y .吴作栋l·s·李, 信用评分:回顾支持向量机和Metaheuristic方法”,行动研究进展, 卷。2019年, 文章的ID1974794, 30. 页面, 2019年 https://doi.org/10.1155/2019/1974794

信用评分:回顾支持向量机和Metaheuristic方法

学术编辑器:爱德华多·费尔南德斯
收到了 2018年11月01
修改后的 2019年1月28日
接受 2019年2月18日
发表 2019年3月13日

文摘

发展信用评分模型是重要的金融机构识别违约者和nondefaulters授信决策的时候。近年来,人工智能(AI)技术在信用评分显示成功的表现。支持向量机和metaheuristic方法不断收到研究人员关注在建立新的信贷模式。本文综述了两种人工智能技术与详细讨论信用评分模型由1997年到2018年以来的两种方法。主要讨论的是基于两个主要方面与问题解决模型类型和评估程序。然后,一起编译过去常见的数据集实验结果,混合造型这两种方法的最先进的方法。为未来的研究确定一些可能的研究空白。

1。介绍

信用评分是金融机构授信决策的基础。一个良好的信用评分模型能够有效地组客户违约或默认的组。更高效,更可以节省成本的金融机构。

信用评分是用来模拟数据和评估每个实例数据中信用评分和违约概率(PD)。一般来说,分数是衡量客户的信誉,在PD的似然估计客户无法满足一个人的债务在给定的时间内。手和母鸡1信用评分来定义为”这个术语用于描述正式统计方法用于申请信贷分类成“好”和“坏”风险类”。由于最终决定是二进制,信贷评分因此相当于一个二元分类问题。

当信用卡开始在1960年代被引入,触发信用评分模型的必要性。金融机构开始合并或替代纯粹judgemental-based授信决策与统计模型极大地增加客户数据库。2004年,巴塞尔协议II。在信用风险,而不是以前的标准化方法,基于内部评级(IRB)方法可以采用银行计算的最低资本要求。这标志着进化在信用评分领域,试图形成复杂的模型一直在积极研究。结合计算机技术的快速发展,制定复杂的模型成为可能。

手,亨利(1)首次出版审查论文的信贷评分域。他们回顾了统计方法和数据挖掘(DM)几个方法和得出的结论是,信用评分模型的未来趋势将更复杂的方法。托马斯(2)还回顾了过去研究指出信用评分和利润的重要性得分。讨论的方法包括统计,运筹学,和DM方法。Sadatrasoul et al。3)综述了DM技术申请信用评分域2000年- 2012年,显示的趋势模型建立与DM方法近年来。

也有评论论文特别关注应用评分(4)和破产预测(5,6]。马丁(4)审查申请评分模型在不同的角度看,在计分卡程序性能评估由过去的研究分为一致性,应用适合和透明度。作者指出过去实验的缺点,只注意模型开发和被忽视的适当的评估过程模型。太阳et al。6)审查破产预测信用破产预测模型通过提供明确的定义了从文学在整个年,然后讨论了基于三个主要的技术方法,即。、造型、抽样和特色。Alaka et al。5)也关注破产预测模型。他们发现了流行的统计和人工智能(AI)工具使用,发现13个标准的工具使用。基于13个标准,他们开发了一个框架作为工具选择的准则。除此之外,有一个评论莫罗和丽塔(7),采用了一种完全不同的方法比其他所有的评论文章。一个自动化与文本挖掘过程进行审核。重要问题的信贷评分顶级域和模型开发工具被发现通过自动化的文本挖掘。

Baesens et al。8)是第一个建立信用评分模型与支持向量机(SVM)和比较其性能与其他先进的方法。他们尝试了标准支持向量机和最小二乘支持向量机(二)和报道,为生物产生良好的性能相比其他方法。此后,SVM信贷评分一直积极研究领域,是其中一个主要用于DM方法构建信用评分模型。最近的研究(5,7)也确定支持向量机作为一种重要的工具选择信用模型的研究人员开发。

Metaheuristic方法(MA),特别是进化算法(EA),也被引入作为替代形式的信用评分模型。飙升应用信用评分可以看到近年来,大多数评论论文包括EA的讨论主要DM方法之一(见Alaka et al。5),骗子et al。9),Lahsasna et al。10),Lessmann et al。11],Louzada et al。12])。在Louzada et al。12时间表的讨论,可以看出,2005年后,支持向量机和EA增加了信贷评分领域的研究工作。此外,品牌等。13)回顾了信用评分模型特别聚焦在EA,表示马的流行用法。

迄今为止,审查信用评分域主要专注于发展记分卡多种类别的方法。积极研究利用SVM促使该方法需要特别审查。只有一个品牌的审查等。13,专注于信贷EA建模。然而,马EA只是一部分,还有其他的马已经收到关注信贷评分领域近年来由于造型趋势转向基于ai技术。飙升这两种技术的应用大大增加了工作,导致情况一般评论不足以了解这两种方法的发展趋势。因此,与过去相比一般评论文学评论,这项研究是一个集中审查,尤其是在支持向量机的发展和马。

所有的研究文章在这项研究中获得了从三个在线学术数据库,谷歌学者,科学指引和IEEE Xplore /在线电子图书馆。几个主要关键词应用选择文章的信用评分,信用风险预测,metaheuristics,数据挖掘、支持向量机、遗传算法、遗传编程、进化计算、机器学习和人工智能。从搜索结果中,有44岁和43岁的文章SVM和MA模型,分别有12篇文章利用这两个在一起,从而导致共有75篇研究论文综述了研究从1997年到2018年不等。

本研究的目的是回顾过去文献使用SVM和马在发展中信用评分模型,确定两种方法的贡献,并讨论可能导致未来可能的发展趋势在信用评分工作领域。

本文组织如下。部分2探讨了信用评分模型的演变趋势DM方法从传统的方法。部分3简要介绍了支持向量机和MA方法。部分4总结和讨论了基于模型结果类型与问题解决,评估程序,编译从过去的实验结果。然后,部分5提出几种可能的未来的发展方向,为本研究的结论。

2。趋势

信用评分模型、信贷发放前决定纯粹是judgemental-based。统计模型自1941年开始被利用在杜兰(14)是第一个先锋的使用判别分析(DA)分类好的和坏的贷款。奥特曼(15)也使用多元判别分析(MDA)来预测公司破产。财务比率作为输入变量,与MDA模型。MDA模型已经显示出良好的预测能力和有用的为分析师提供投资建议。Ohlson [16)然后介绍概率的方法来预测1980年信誉的公司。逻辑回归方法(分对数)。指出一些问题使用MDA和分对数比MDA被认为是更健壮。

1985年,Kolesar和淋浴17]介绍了数学规划(MP)的方法来解决信贷发放问题。议员与经典DA和报告结果显示,议员是决策者更健壮且灵活。在传统的方法中,分对数是标准的信用评分模型,因为它能够满足所有的需求从巴塞尔协议II。

大规模的计算机技术进步开辟了DM方法在模型建立信用评分。过去已经做了大量的研究,利用DM方法在信用评分域。他们中的大多数将采用的方法与标准LOGIT模型和显示DM模型具有竞争力。一些比较研究和审查文件(1,2,8- - - - - -12,18]报道DM模型的良好的性能,在各种方法中,支持向量机和马(特别是EA)已经被广泛研究替代信用评分模型。

3所示。人工智能技术

3.1。支持向量机

支持向量机(SVM) Vapnik首次引入的91年的上下文中)1998年,统计学习理论。有许多成功的支持向量机在模式识别中的应用,表明支持向量机是一个竞争的分类器。

SVM寻求一个最优超平面作为决策边界的最大利润,分开两个不同的类。给定一个训练集与标签实例对 ,在哪里 实例的数量吗 , ,决定边界分开两个不同的类支持向量机通常表示为 最优分离超平面是最大利润和所有训练实例都假定满足约束, 然后定义为凸优化问题 最优超平面是相当于一个二次函数的优化问题,利用拉格朗日函数在哪里找到全球最大。的 是误分类的松弛变量引入考虑, 伴随违约成本。对非线性分类、内核技巧是用来修改SVM配方。受欢迎的内核的选择是线性的,径向基函数(RBF)和多项式。(我)线性: (2)多项式: (3)径向基函数(RBF):

3.2。Metaheuristic算法

Metaheuristic算法(MA)是一个基于ai的数据挖掘方法,近年来引起了人们的关注。马是一个自动化的过程搜索算法优化问题的解决方案。搜索过程是确保之间的平衡与运营商进行勘探和开发有效地寻求好的解决方案。一般来说,马由几种类别;的描述的类别中使用信用评分域给出如下:(我)进化算法(EA)EA方法有一个机制来寻求解决方案后,达尔文主义的原则,这是基于“适者生存”的概念。有四个主要过程来寻找一个解决方案,即:、选择、复制、变异和交叉。人口的解决方案是改善以一种进化的方式,根据适应度函数的质量。EA应用于信用评分是遗传算法(GA)和遗传编程(GP)。(2)群体智慧(SI)自然算法进行solution-seeking SI的方法是一个基于自然的或人工分散的集体行为和自组织系统。人口的解决方案是改善通过相互代理之间的相互作用和环境。同样,更好的解决方案是由适应度函数的生成质量。如果应用于信用评分是粒子群优化(PSO),蚁群优化(ACO),分散搜索(SS),人工蜜蜂蚁群优化(ACO),蜜蜂交配优化(HBMO),布谷鸟搜索(CS),与和谐搜索(HS)。(3)基于迭代(IB)IB方法改善集中在一个单一的解决方案在其附近,每个迭代改进的解决方案是基于适应度函数的质量。因此,IB是不同的与EA和SI以人群为基础的。IB应用于信用评分是模拟退火(SA)和禁忌搜索(TS)。

4所示。讨论

4.1。模型类型和问题解决

SVM和马信贷模型是根据模型形成的类型分类。有四个主要类别利用支持向量机的信用评分:标准支持向量机和它的变体,修改后的支持向量机,混合支持向量机,和整体模型。另一方面,MA方法应用于信用评分可以分为三类:标准的马,混合的妈妈,和混合MA-DM。模型开发和解决的主要问题进行了讨论。

以下4.4.1。支持向量机

(1)标准支持向量机和它的变体。这里讨论支持向量机应用于建立信用评分模型是标准支持向量机和它的变体,这些支持向量机被应用直接建模没有任何修改。

调查的预测能力。信贷支持向量机模型的预测能力是通过两个主要的检查方法,即。,比较研究8,11,12,18,26和应用特定的信贷领域19- - - - - -25,27]。

各种先进的方法从传统的非参数统计方法DM方法一直试图形成信用评分模型在不同的研究。这促使基准研究的必要性Baesens et al。82003年)。在他们的研究中,支持向量机和最小二乘支持向量机(二)是第一个利用开发信用评分模型,和他们的表现与其他先进的方法相比在8个不同的数据集。分对数的方法从家庭,哒,线性规划(LP),贝叶斯网络(BN),再附近(资讯),神经网络(NN)和决策树(树)。回归模型和神经网络显著更好的结果比其他模型。他们的研究结果还表明,相互竞争的方法。因此,SVM信贷评分一直积极研究领域。

Lessmann et al。11)更新Baesens et al。8)的研究包括与更多的个体分类器,乐团,和混合方法。他们说增加信用评分的研究领域,敦促更新基准研究必要性,不仅先进的分类器,也像乐团应该包括先进的技术。因此,总共有41个分类器(BN,家族的树,分对数,哒,神经网络,然而,极端学习机(ELM)和集合体)被调查在6个数据集与广泛的尺寸基准研究。实验结果表明,整体模型了排行榜前10 41个分类器。单个分类器、神经网络显示最高排名。线性和RBF SVM进行调查;两种SVM模型显示性能相似,都取得了类似的排名。他们还指出发展业务价值计分卡的重要性,应该考虑在提出新模型。

Louzada et al。12)进行了系统评价分类方法应用于信用评分,覆盖1992 - 2015年的研究论文。评估几个方面讨论的信贷评分域:客观的研究,比较研究完成,数据集用于模型建立、数据分割技术,使用性能的措施,应用程序缺失的数据参数和特征选择中的应用。他们进行实验11日主要分类技术(线性回归(LR)、神经网络树,哒,分对数,模糊,BN,支持向量机,遗传规划(GP),混合,和集合体),在加入乐团开始得到关注推荐(11]。不平衡数据集的问题是调查和支持向量机在处理不平衡数据集显示稳定。一般来说,支持向量机有更好的性能和更低的计算工作的实验。

最近的比较研究是由Boughaci Alkhawaldeh [18]。他们调查的11个机器学习技术(家庭的资讯,BN, NN,树,支持向量机,分对数,室内乐)在8个不同的数据集。前一个的研究的主要区别在于所涉及的数据集使用的混合应用得分和破产预测数据集。实验结果并没有建议赢家在调查的技术没有一致的表现在所有的数据集。他们通常认为BN和提高整体有效方法随着信贷模式。

这些比较研究包括各种各样的分类技术制定信用评分模型和评估他们的预测能力是跨各种信贷数据集。然而,其中信贷模型,没有一个明确的信用得分的最佳技术领域。尽管如此,这些比较研究提供了一个指南的更新最新信用评分模型,支持向量机在哪里最初被标记为国家的艺术8),然后在这一领域作为一个重要的模型。此外,乐团是另一个国家的艺术在11]。

相反的比较研究各种技术基准测试,SVM-focused研究是由Danenas et al。26),特别是在破产预测数据集。各种类型的SVM源自不同的库和软件,例如,LIBLINEAR LIBSVM WEKA LIBCVM,都包含在他们的实验。SVM分类器从线性到非线性不等的各种各样的内核。模型是研究原始数据集和减少数据集已经预处理与特征选择技术。比较的准确性,不同类型的SVM分类器显示类似的结果,减少了数据集应用程序拥有更高的精度。此外,计算工作量而言,线性SVM模型是最快的。

调查预测能力的另一种方法是通过应用程序在特定领域。具体领域的尝试是多级企业评级(19,20.,22,23,25)、应用评分(21,24),和行为评分(27]。多级企业评级、信用评分模型是由二(19,22)和支持向量机(20.,23,25)的主要目的显示SVM在建筑企业信用评级模型的有效性。范et al。19和赖et al。22]表明,二是表现最好的信用模型相比其他传统技术应用于Bankscope和英国金融服务数据,分别。

黄等。20.测试了SVM在台湾和美国市场债券评级数据。他们还进行了市场分析和变量贡献分析的神经网络模型。李(23)利用支持向量机对韩国企业信用评级分析。金和孙25]在2010年启动了信用评分模型的建立为中小企业(SME)。他们专注于韩国中小企业和解释变量包括四个主要方面:中小企业特点、技术评估、财务比率和经济指标。他们相信SVM模型适合用于科技型中小企业。所有的SVM模型这四个不同的市场研究数据的企业评级,SVM有优于其他方法在每一个实验。

申请评分,李et al。21)相比,支持向量机和神经网络在台湾银行消费贷款信用评分。SVM报道比神经网络精度高,结果是显著的。此外,他们也尝试不同的hyperparameter值的影响支持向量机的错误和II型错误,即,误分类错误。他们展示了影响整个hyperparameter误分类误差值范围可以作为信用评分模型的可视化工具。因此,他们得出的SVM比神经网络的可视化。征求和骗子24)测试不同内核的支持向量机在大信用卡数据集。比较与传统统计模型只报道资讯和多项式SVM有贫穷的结果可能是由于过度拟合。他们建议使用支持向量的体重作为替代选择重要的特性和比较选择特性与分对数的瓦尔德统计数据。实验表明SVM模型适合用于构建信用评分模型的特征选择。

行为得分,南非的无担保贷款市场调查Mushava和莫里27]。尽管旨在显示SVM的有效性,本研究旨在研究一些扩展的统计分对数和DA较少探讨信用评分领域,作为基准进行比较,包含了支持向量机是在他们的研究。在固定窗实验中,广义可加模型表现。尽管SVM并未表现出优越的性能,将SVM在这项研究中再次表示支持向量机被认为是克服信贷评分标准的领域。

(2)修改后的支持向量机。修改后的SVM算法涉及改变配方的支持向量机。有一些作品提出修改的信贷评分支持向量机来解决不同的问题领域,尤其是在应用评分。所需的修改变化二次规划制定最初的支持向量机。

异常处理。王等人。28)提出了一个双边模糊支持向量机(B-FSVM)。的方法启发想法,没有客户绝对是好是坏客户作为分类好的客户总是有可能违约,反之亦然。因此,他们利用会员的概念在每个实例的模糊方法在训练集需要积极和消极类,但在不同的会员。这导致双边加权的实例,因为每个实例现在必须考虑两类错误。由模糊,包括会员的支持向量机算法是新配方形成B-FSVM。他们使用LR、分对数和神经网络产生隶属函数。B-FSVM与单边模糊支持向量机(U-FSVM),和其他的标准方法。线性、RBF和多项式内核用于形成B-FSVM, U-FSVM,支持向量机模型。

计算效率。哈里斯(29日]介绍了集群SVM (CSVM),提出一个方法顾和汉92年),为信用评分模型。支持向量机模型的研究旨在减少计算时间。与k - means聚类形成集群,这些集群将被包含到支持向量机优化的配方问题,改变原来的支持向量机算法。开发两个CSVM模型与线性和RBF内核和与分对数相比,支持向量机,用k - means混合动力车。优秀的时间改善CSVM报道。

动态评分。杨(30.)修改加权SVM模型成为一个动态评分模型。主要的思想是使一个简单的信用评分模型的更新,而不需要重复变量选择过程当新客户数据变得可用。原来的内核修改成为一个自适应加权支持向量机的内核。当增量数据的大小,自适应内核可以自动更新最优解。此外,与训练模型,杨30.)建议一个属性排名指标排名内核的属性。因此,这成为了SVM的黑盒财产替代解决方案。

拒绝推理。拒绝推理的目的是包括拒绝了实例模型训练,然后提高分类性能。李等人。31日和田等。32)提出了新的在线支持向量机来解决拒绝推理问题点对点借贷。李等人。31日)提出了一个semisupervised L2-SVM (SSVM)来解决拒绝推理一个对等贷款贷款俱乐部不同年份的数据。因此,SSVM配方,无标号的拒绝实例被添加到支持向量机的优化约束条件,将原来的二次规划问题转化为一个混合整数规划。SSVM报道比其他标准方法更好的性能。田et al。32)提出了一种模糊支持向量机二次表面kernel-free (FQSVM)。该模型的主要优点是检测异常值的能力,从拒绝客户提取信息,没有计算所需的内核,高效的凸优化问题。该模型为基准对其他拒绝推理方法。FQSVM报道比SSVM上级提出的(31日]的几个性能措施以及计算效率。

特征选择。有两种新配方的SVM进行特征选择成本法(33和利润的方法34在智利小而microcompanies。数据集由新返回客户,表明形成的信用评分模型所涉及的应用程序和行为得分。Maldonado et al。33)包括可变收购成本制定的支持向量机的信用评分模型进行特征选择。类似于李et al。21),他们还添加了额外的约束优化问题,将它转化为一个混合整数规划问题,但添加约束变量的收购成本。他们提出了两个模型,1-norm和LP-norm支持向量机都是修改有额外的约束,形成两个新的信用评分模型,即L1-mixed整数SVM (L1-MISVM)和LP-mixed整数SVM (LP-MISVM)。由于提出的能力模型考虑的变量同时收购成本和良好的性能,相信该方法是有效的信用风险以及业务分析的工具。

另一方面,Maldonado et al。34]介绍了一个以利润为基础的框架来做特征选择和分类方案修改后的支持向量机以及利润业绩指标。而不是考虑收购成本变量,他们一个接一个地把成本作为一个整体被处罚的变量。因此,L - 规范是用来惩罚成本。提出了两个模型与1-norm SVM和标准支持向量机被包括L -修改 为优化目标函数,形成L1L - 支持向量机和本项目- 支持向量机。他们提出的模型是有效的选择特性降低收购成本,然而保持良好性能。而先前的研究的主要区别在33),这个新提出的模型,可以评估利润,冒充一个至关重要的业务决策者的洞察力。

(3)混合支持向量机。混合支持向量机的信用评分模型开发的合作支持向量机与其他不同的目的的技术。

拒绝推理。陈等人。48)解决这个问题使用信用卡数据从本地中国银行。他们与SVM杂化k - means聚类,制定一个两阶段的过程。第一阶段是新接受客户的聚类阶段分组均匀,孤立的客户删除,和不一致的客户重新命名。聚类过程的处理不一致的客户是一种拒绝的推理问题。这些集群客户从第一阶段的输入支持向量机分类在第二阶段。而不是分类客户分为二组,他们试图分类分为三个和四个组。不同的截止点也设置为不同的群体。他们认为该方法能够为风险管理提供更多的洞察。

规则提取。黑盒SVM的属性一直是主要的弱点,这也是一个主要关心从业者不使用支持向量机作为信用评分模型。Martens et al。36]提出的规则提取技术与支持向量机一起使用。三种不同的规则提取技术,即C4.5,欺骗,和遗传规则提取(G-REX)与支持向量机杂化。实验是在不同领域上进行,需要的可理解性的模型,信用评分是在他们的研究领域之一。该模型有利于给明确的规则解释。2008年,马顿斯et al。93年规则提取问题做了概述,可理解性的重要性在信用评分域是解决了。Zhang et al。38)提出了一个混合的信用评分模型(HCSM)杂化遗传编程(GP)和支持向量机。该技术的主要优势是能够提取规则与全科医生解决了SVM的黑盒性质。

计算效率。母鸡和女子46)综合使用分层抽样方法建立支持向量机模型。然后,较小的样本,f值的方法是用来做特征选择计算基于重要性的特性。该模型实现了最低运行时和类似的性能与其他方法相比在他们的实验中。

特征提取。徐et al。40与SVM)注册链接分析,链接分析首先是用于提取申请人的信息,然后输入支持向量机进行分类。该方法是一个两阶段的过程。在第一阶段,他们介绍了使用三种不同算法的链接关系来提取输入特征的连接关系申请人的数据。所以,有三个正在建造的混合支持向量机模型对三种不同的算法。最近,韩寒et al。50)提出了一种新的正交降维特征提取(ODR)方法。他们使用支持向量机作为主要分类器作为SVM的他们认为ODR是一种有效的预处理和分对数作为基准分类器。在实验中有三个主要部分。首先,他们发现变量正常化造成大影响支持向量机的分类性能,但分对数不强烈影响。因此,标准化是申请所有的模型。其次,比较了现有功能还原法,主成分分析(PCA)。第三,他们建议使用分对数与瓦尔德开始挑选重要的变量数据,然后只从减少变量中提取特征,它们的名字是回龙观。他们的结论是,ODR是有效的支持向量机在解决维度诅咒。

特征选择。特征选择混合支持向量机模型,有过滤的方法37,39,43和包装方法54,55)使用。对过滤方法,粗糙集理论是受雇于周和白37和姚明et al。39),粗糙集在第一阶段选择输入特性和分类进行任务在第二阶段对杂化技术。有三个主要混合模型与粗糙集之间的差异提出了这两个研究。首先,周和白37)指定他们的研究在中国建设银行而姚明et al。39]研究通常是在公共数据集。第二,特征选择是基于信息函数在37)而计算变量重要性(用于选择特性39]。第三,混合模型开发的(37)杂交与神经网络、支持向量机和GA-SVM (GA优化SVM hyperparameters)而开发的混合模型(39与支持向量机)杂交,树和神经网络。实验表明,基于svm混合模型获得最佳性能。陈和李43]也适应一个过滤器做特征选择方法。他们提出了四个不同的过滤方法:LDA,树,粗糙集和f值。这四个方法与支持向量机杂化。为了使模型相比,相同数量的特性是根据四个方法基于变量选择的重要性。

除了过滤的方法进行特征选择,Jadhav et al。54和王et al。55)合并过滤技术在发展中新颖的包装器模型特征选择的任务。主要概念是指导包装器模型进行特征选择与获得的信息过滤功能排序技术。

Jadhav et al。54)提出了信息增益定向特征选择(IGDFS)包装GA模型,基于三个主要分类器,即。、支持向量机、资讯和NB。最高等级从信息增益特征传递给包装器模型GA。他们比较三种不同IFDFS(基于三种不同的分类器)与其他6个模型:包括三个独立的分类器与所有特征,和三个标准GA包装器模型的分类器进行特征选择不遵循任何过滤方法。王等人。55)杂化与多种群遗传算法支持向量机形成一个包装器模型进行特征选择。该方法有一个两阶段的过程。在第一阶段,他们利用三个过滤特征选择方法找到之前信息的功能。功能重要性降序排序,然后一个包装器方法是用来寻找最佳子集。三个特征子集的三种方法和概率特性开启,他们形成了初始种群传递给第二阶段。在第二个阶段,与支持向量机运行HMPGA找到最终的最优特征子集;因此HMPGA-SVM模型与之前的信息。

Hyperparameters调优。除了输入功能,hyperparameters SVM模型构成影响最终形成模型。之前的作品,提出了特征选择模型应用传统的网格搜索(GS)方法来找到合适的hyperparameters。介绍了混合支持向量机的研究发现hyperparameters [47,52在破产的预测,42,44,51在应用评分,49,53在公司的评级。

与线性支持向量机的成功试验(26],Danenas和Garsva [47]研究了使用不同的线性支持向量机中可用LIBLINEAR包在破产的预测。所有的技术都是杂化与GA和模型选择和hyperparameters调优算法。形成的混合模型,即GA-linSVM PSO-linSVM。滑动窗口方法是用于构建模型在不同的时间段报表模型表现。比PSO-linSVM GA-linSVM得出更稳定持续选择同一模型在不同的时间段还具有良好的性能。在以后的岁月中,Danenas和Garsva [52另一个研究进行改进PSO-linSVM。他们修改算法通过对速度和位置,使用整数值,而不是围捕的值47,51]。

由Garsva和Danenas PSO-linSVM继续收到关注51在应用程序的得分。同样,他们进行了模型选择和hyperparameters调优PSO-linSVM而是混合算法的搜索空间,这是一个轻微的修改比以前的工作(47]。比较了SVM和回归模型(不同的内核),其中hyperparameters调整算法,直接搜索(DS)和SA。为了解决数据不平衡问题,他们调查的使用真阳性率(TPR)和准确性作为适应度函数。TPR订立适当的适应度函数对不平衡数据集。

周et al。42]介绍了直接搜索(DS)调整为生物hyperparameters。他们比较DS与GA、GS和实验设计(DOE)。在四个混合模型,DS-LS-SVM是推荐的方法由于其最佳性能。Yu et al。44)进行了类似的实验装置(42DS), GA、GS和能源部hyperparameters调优。主要的区别在于,他们认为类不平衡问题,因此,模型优化加权回归模型(WLS-SVM),可以分配不同的权重来解决类不平衡在分类。不同于(42),他们建议使用能源部hyperparameters调优由于竞争结果报告为DS相比,GA, GS,但最低计算时间。外部以结果为基准(8,45)也包括在内。

陈等人。49和许等。53)集成ABC和SVM hyperparameters优化企业信用评分。陈等人。49)应用提出ABC-SVM Compustat数据库上美国从2001年到2008年。主成分分析的数据预处理方法用于提取重要特征。最近,许et al。53)还在ABC-SVM研究企业信用评级与从相同的数据库作为数据集49),但包括最近几年2001 - 2010。同样,他们利用PCA预处理步骤。他们进行了更详细的研究数据,利用主成分分析的信息,他们将数据集分为三类研究信用模型的能力占未来信用评级的变化趋势。

同时Hyperparameters调优和特征选择。基于前面的讨论研究,特征选择和hyperparameter选择支持向量机模型在信用评分模型建立的关键程序。因此,两块研究[35,41)旨在解决这两个问题同时包装器模型的方法。

黄等。35]试图构建基于SVM的信用评分模型三种策略:首先,GS和所有功能包括优化SVM hyperparameters;第二,GS找到hyperparameters和f值特征子集为建立支持向量机模型;第三,混合的起始GA-SVM同时搜索hyperparameters和特征子集。这个实验结果表明GA-SVM作为选择合适的工具来解决这两个问题在一起但需要高计算工作。周et al。41使用GA)也制定一个混合模型,但使用加权支持向量机的不同变体,从而形成GA-WSVM。他们提到的黄等。35]研究发现没有携带的特性选择特性的重要性。因此,他们提出的特征权重的过程在包装器方法。该模型旨在寻找hyperparameters WSVM的特性与功能权重子集。他们比较了特征加权方法和基于熵的方法通过t检验。

(4)整体模型。整体模型的两种主要类型是同质的(结合分类器相同)和异构(结合不同分类器)。在信用评分域,56- - - - - -58在均质集合体而夏et al。59在异构的集合体。

提高预测能力。周et al。56]指出感应偏压问题单分类器在使用固定的训练样本和参数设置。因此,他们介绍了整体模型基于生物减少偏见的信用评分模型。整体策略的两个主要类别介绍了可靠性和体重依赖型剂量。有三种技术,分别对每个类别,导致共有六LS-SVM-based合奏模式正在形成。另一个研究,提出整体模型是由Ghodselahi [57]。他们建议使用模糊c均值聚类预处理前送入支持向量机的数据。然后,10的混合支持向量机基本模型形成了整体模型,利用隶属度方法融合所有基础模型作为最终的整体结果。夏et al。59命名为bstacking]引入了一个新技术。主要的思想是池模型和融合的最终结果在一个单一的步骤。四个分类器使用,即。,支持向量机,Random Forest (RF), XGBoost, and Gaussian Process Classifier (GPC), as the base learners due to their accuracy and efficiency.

数据不平衡。Yu et al。58)开发的深层信念网络基于svm (DBN-SVM)整体模型在不同的方法,主要目的是解决数据不平衡问题。他们的模型有一个三阶段过程。在第一阶段,数据与装袋算法划分为各种训练子集,每个子集是平衡实例重新取样。在第二阶段,在重新平衡训练SVM分类器训练子集。在第三阶段,DBN采用融合的最终结果。提出的方法与支持向量机相比,整体与多数投票支持向量机。

4.1.2。马

(1)标准的马。标准马被试图形成信用评分模型GA, GP, SA算法和CS。信用评分的问题是制定与这些马作为一个优化问题需要解决对目标函数。

调查的预测能力。马信用模型的预测能力已经测试通过应用程序特定的信贷领域,即。、应用评分(60,62年,63年,65年)和破产预测(68年]。德赛的实验等。60],芬利[62年],Abdou [65年)具体研究一个特定的国家信用合作社在美国东南部,大数据的英国信用卡应用程序,分别和埃及公共部门银行。相比之下,Cai et al。63年和杨et al。68年)进行了一般性研究基于德国公共数据集和模拟20家公司的数据库,分别。

早在1997年,德赛et al。60]研究了人工智能技术的预测能力进行比较与传统信贷模型分对数和哒。人工智能技术研究了三种变体的神经网络和遗传算法。他们分类信贷客户分成三个类(好,贫穷,和坏的),而不是通常的二进制(好的和坏的)。遗传算法用于判别分析。旨在减少误分类的数量,一个整数问题是制定与GA作用等同于和方法,然后,求解对偶问题给最后的分离超平面。芬利[62年]指出发展与GA的信用评分模型的优势由于其基于self-decide形式模型目标函数的能力。他们提议建立一个线性评分模型与遗传算法最大化基尼系数。大型数据集的英国信用应用尝试。四种不同GA-derived开发模型,考虑播种(之前的信息分对数作为初始解决方案)和不同的编码方案(整数或二进制)。

Cai et al。63年]和Abdou [65年包括误分类代价到他们的研究。Cai et al。63年)建立信用评分模型的遗传算法。优化问题是一个线性得分的问题(62年]。他们计算适当的截好的和坏的客户关键值的加权平均。一个适应度函数组成,被认为是所有组件的混淆矩阵一起误分类相关的成本。Abdou [65年]相比的性能GP与利润分析和证据的效力(悲哀)模型。两种类型的医生在这里检查:单一项目的全科医生和全科医生团队模型,这是一个单一项目GP的组合更好的结果。他们根据不同的误分类率进行了灵敏度分析和强调了评价计分卡误分类成本重要性。只有杨et al。68年与CS)解决破产预测问题。作者开发了一个CS模型使用征收的飞行产生新的解决方案。

规则提取。有一些研究集中在规则提取与不同的马医生的(61年,64年),SA (66年),算法在67年,69年]。Ong et al。61年)推荐使用的全科医生作为一种替代形式的信用模型。医生经历了同样的过程在GA搜索解决方案中,但主要的区别在于,GP生成分类规则。作者总结道GP建立信用计分卡的几个优点:非参数,适用于任何数据集,自动识别功能,不需要用户定义函数和神经网络一样,获得更好的规则相比,树和粗糙集生成低误差。黄等。64年2]提出了一种两级GP (sgp)。在第一阶段,if - then规则。他们制定的全科医生来确保只提取有用的规则。基于这些规则,数据集将减少通过删除实例不满足任何规则或满足多个规则。然后,减少数据传递给第二阶段的GP判别函数对客户进行分类。

董et al。66年)建立了SA (SAREA)信用评分规则提取算法。类似于前面的规则提取与GP (64年),提出SAREA也在两阶段,提取规则的if - then规则。在第一阶段,股价运行初始规则及其对应的最佳精度规则放入第一阶段的最后一个规则集。最好的规则从第一阶段要求适应度函数计算第二阶段惩罚的准确性。在第二阶段,股价再次运行随机初始规则来查找相应的最佳精度规则形成最终的规则集,但健身计算将惩罚精度从第一阶段基于最好的规则。

信用评分模型的可理解性的重要性已经指出[36,93年]部分中讨论以下4.4.1(2)Martens et al。(67年]小说研究在建立一个模型,该模型具有良好的精度和可理解性的性能。他们介绍了ACO算法AntMiner +作为潜在的信用评分模型。规则有很高的可理解性是商业决策的关键,他们也分析了提取的规则与巴塞尔协议II集成。最近,ACO-based分类规则归纳(CRI)框架介绍Uthayakumar et al。69年]。他们进行了定性和定量数据集实验,专注于破产的预测。ACO算法修改基于规则归纳的概念。由于配电网的能力提供更好的结果在中国国际广播电台,减少规则的复杂性和丰富有效的分类数据,ACO建议,在他们的研究。

(2)混合妈妈。混合妈妈涉及两个不同的马被集成在一起,形成一个新方法。只有两个研究工作,提出了迄今为止。

参数调优。江et al。70年使用SA)提出的想法来优化遗传算法,形成混合SA-GA。SA是融入遗传算法更新人口通过选择染色体利用SA的大都市抽样的概念。两个变量的神经网络在这个实验中使用的主要分类。SA-GA利用搜索的输入权向量组合神经网络分类器。

规则提取。Aliehyaei和汗71年)提出了一个混合模型,和医生两步任务。ACO负责寻找训练集的规则集。规则提取算法然后送入GP的分类。

(3)混合MA-DM。混合MA-DM的方法包括使用MA技术帮助DM分类器的分类任务,从而提高模型的性能。

规则提取。过去的研究,提出了旨在做规则提取(38,79年)利用SA和GP,分别。Zhang et al。38)提出了一个混合的信用评分模型(HCSM)这是一个两级模型合并GP和支持向量机。在第一阶段,医生是用来提取规则错误分类的错误和II型误差作为适应度函数。在第二阶段,使用支持向量机的判别函数对客户进行分类。江(79年)合并SA和树作为一种新的信用评分模型。规则树作为初始输入SA候选人,然后SA产生新的分类决策规则。他们形成三个TREE-SA信贷模型与不同的判别函数,占错误和II型错误,这是类似于Zhang et al。38]。

参数和Hyperparameters调优。一般来说,参数和hyperparameters对模型性能有显著的影响。两者的区别是,参与模型参数训练,可以评估的价值模型,而hyperparameters完全是用户定义的,它的价值无法评估的模型。因此,适当调优值参数和hyperparameters模型构建信用计分卡是至关重要的。Metaheuristics申请参数优化神经网络输入重量和偏见的77年),hyperparameters优化神经网络(75年,84年],hyperparameters优化支持向量机的37,42,44,47,49,51- - - - - -53]。

神经网络模型优化,王et al。77年)杂交遗传算法与神经网络调优参数输入重量和偏见。他们采用实值编码遗传算法,采用算术交叉和非均匀变异和得出结论,与GA优化参数提高了神经网络的学习能力。另一方面,拉赛尔达et al。75年在神经网络建立GA优化hyperparameters。他们提出了一种改进遗传算法的基础上考虑冗余、合法性、完整性和因果律。训练样本集中,他们介绍了集群交叉GA算法。然后,他们利用提出的GA形成多目标遗传算法寻找NN hyperparameters。科雷亚,冈萨雷斯(84年)提出了两种混合模型GA和二进制PSO(全局搜索)在NN hyperparameters调优。对马技术,成本计算候选解决方案之前搜索过程。他们提出了不同的方法来检验模型,提出在那里进行成本研究在三个不同的评分模型,即。、应用评分行为得分,得分和收集。

几个模型,利用遗传算法来优化支持向量机hyperparameters [37,42,44]部分中讨论以下4.4.1(3)在周和白。37)实验,该模型与遗传算法优化支持向量机效果最好。在周et al。42)实验,调查是在DS上进行SVM hyperparameters调优,GS,能源部,GA。在余et al。44实验中,他们研究为生物hyperparameters调优也与DS, GS,能源部,GA。从这三个研究,它可以观察到,他们包括GA优化基于SVM为比较,他们的实验暗示EA是一个很好的替代hyperparameters优化的支持向量机。的线性支持向量机的模型选择和hyperparameters调优LIBLINEAR使用遗传算法和PSO在一些研究调查47,51,52),如部分中讨论以下4.4.1(3)GA-linSVM显示更好的性能比PSO-linSVM破产预测(47]。然后,Garva和Danenas51)进一步尝试修改算法形成PSO-linSVM应用评分。算法由Danenas进一步修改,Garsva [52),形成一个不同版本的PSO-linSVM构建破产预测模型。还有两个模型,优化支持向量机与ABC (49,53]部分中讨论以下4.4.1(3),研究集中在企业信用评级的问题。陈等人。49]首先制定ABC-SVM然后接着详细研究徐et al。53]。这两项研究也得出了同样的结论ABC-SVM是一种有效的方法来优化hyperparameters和徐et al。53]表明ABC-SVM也能够捕获信用评级的变化趋势的预测。

特征提取。福格蒂和Ireson72年杂化GA和BN。利用遗传算法来优化BN通过选择类别和属性组合使用同现矩阵从训练数据。属性组合生成类似于提取特征。刘等人。76年)设计医生通过选择派生特征提取功能,属性组合但确定分析方法与人类交流。确保派生特征是实用,采用GP最大化信息生成的特征与人类交流的应用价值。线性DA模型然后使用这些构建派生特征。Zhang et al。78年)形成的混合模型,将遗传算法、k - means聚类,和树在一起。介绍了遗传算法进行属性约简,是一种特征提取。采用二进制编码和GA候选解决方案包括断点。然后k - means聚类分配给去除噪声和分类树。

特征选择。混合模型MA-DM发达的特征选择(54,55,74年,81年,83年,86年,89年,90年]。遗传算法从EA类别是最受欢迎的方法与DM分类器(杂化54,55,81年,83年,86年,89年)为解决信贷评分域的特征选择。所有的混合MA-DM特征选择是基于包装器方法除了[87年- - - - - -89年),提出了滤波器的方法。

Drezner et al。74年)构造一个新的信用评分模型通过将TS LR特征选择,专注于破产的预测。第一,所选特征子集从TS与一个已知的最佳子集,从逐步回归子集,子集最大 改进。TS-feature子集被报道是很有竞争力的选择算法特征子集。Sustersic et al。81年]介绍了遗传算法进行特征选择与Kohonen子集和随机子集。PCA是基准特征选择方法相比,两个GA-generated特性。神经网络和开发LOGIT模型生成的特性。他们的实验在斯洛文尼亚指定银行贷款数据。作者还讨论了设置截点对第一类误差的变化和II型错误。黄、吴(83年]研究了遗传算法对特征选择的有效性。GA包装资讯,BN,分对数,支持向量机,神经网络、决策表和三种不同的乐团进行特征选择的任务。在第一部分中,独立的分类器(没有包装与GA)进行了比较。在第二部分中,遗传特征选择与四个过滤特征选择技术,即。、卡方统计、信息增益、ReliefF和对称的不确定性。在第三部分,每个独立的分类器是与他们的GA-wrapped同行相比。

提出包装器模型包括过滤技术来获得一些有用的特征信息对提高标准的包装方法。这种类型的包装器模型提出了(54,55,86年]。Oreski和Oreski86年)解决特征选择问题,提出了混合遗传算法与神经网络。他们包含四个不同的过滤技术开发包装GA-NN。排名从过滤方法的特性,被注入到GA-NN三个主要过程。这三个过程是减少搜索空间使用过滤功能降低排名,改进遗传算法的搜索空间,引导增量阶段使用遗传算法的初始种群的多样性。还有两个包装器模型求解在信贷造型特征选择问题提出了Jadhav et al。54和王et al。55]部分中讨论以下4.4.1(3)。同样的,这两个研究形成新颖的包装器模型与过滤信息。Jadhav et al。54)制定wrapper-based SVM、资讯和NB模型与遗传算法,结合信息增益。另一方面,对于王et al。55),这个想法是为了制定一个wrapper-based SVM模型与多种群遗传算法。他们把信息从不同的过滤技术作为初始输入多种群遗传算法的解决方案。

Marinakis et al。80年模型与算法和PSO)形成的包装器。资讯及其变种(1-NN和加权资讯被包装的特征选择和分类。实验使用两个数据集在多类问题从一个英国非金融公司第一个数据集是做信用风险建模和第二个数据集是审计资格。后来,Marinaki et al。82年与类似的设置进行了研究[80年和第一数据集用于80年]。他们提出了一个不同的metaheuristics HBMO包装的资讯和它的变体。HS歌曾激励了SI技术,试图通过Krishnaveni et al。90年)最近与资讯变体形式包装器模型,即。,1-NN特征选择。此外,并行计算模型和报道也试图大幅节省时间的平行版本的方法比其他包装器模型。

除了包装器方法,滤波器的方法模型也被证明是有用的在信用评分域。王等人。87年)杂化TS与粗糙集(tsr)搜索最小权值作为特征输入到分类器子集。日本数据集实验的实验。tsr的特征子集送入RBF网络,支持向量机,分对数。之后,小王et al。88年]试图杂交的党卫军粗糙集(SSRS)特征选择。类似的实验设置在(87年)进行,但有两个差异:包括一个额外的数据集的分类器包括比较是不同的。Waad et al。89年)提出了另一种基于过滤器与遗传算法特征选择方法。新方法是一种两级过滤选择模型。第一阶段制定一个与GA优化问题需要解决。在第一阶段的主要思想是选择克服困难和等级聚合问题,然后根据他们的相关性排序功能。在第二阶段,一个算法来解决不相交的排名问题相似的特征和删除冗余功能。

离散化的特性。只有一个研究由手和亚当斯(73年)展示一种新的模式,信贷评分功能离散化。他们形成合作SA与证据的效力(悲哀)和广义悲哀,形成两个包装器模型。主要概念是有效的连续属性离散化到适当的时间间隔。拟议中的SA离散化技术与分位数分区和相等的间隔。

同时Hyperparameters调优和特征选择。hyperparameters调优和特征选择的重要性已敦促一些研究者同时解决这两个问题(35,41,85年]。黄等。35和周et al。41)开发了遗传包装器模型分别结合支持向量机和回归模型。这两项研究中讨论部分以下4.4.1(3)和他们的研究结果表明GA包装器可以有效地解决这两个问题。Oreski et al。85年同时也解决了hyperparameters调优和特征选择但以神经网络为主要分类器。这项研究是在克罗地亚银行信贷申请人的数据集上进行。提出的基于遗传特征选择用神经网络(GA-NN)为基准对其他特征选择技术,即。向前,选择、信息增益、增益比,基尼指数的相关性,投票。hyperparameters调优,作者提出了神经网络的通用模型(NNGM),采用遗传算法来优化神经网络模型中hyperparameters。从不同的方法生成的功能是传递给NNGM做分类。他们还调查了不同的截止点对精度的影响,研究不同的误分类率。

4.1.3。总结

(1)支持向量机模型。支持向量机模型的发展进行了总结在即将到来的表和数据。表1按时间顺序安排所有的回顾研究显示的发展趋势,总结了解决问题,并提供了额外的信息支持向量机使用对内核类型以及其他模型的细节考虑在每一个实验进行比较。表2报告的论文数量类型分类的模型。图1说明了分类的支持向量机模型的基础上的目的。


作者 支持向量机类型 内核 其他方法 讲话

标准支持向量机和变异
Baesens et al。(2003)8] 支持向量机回归模型, 线性的,RBF - - - - - - (i)与分对数,哒,然而,LP BN, NN,树
范Gestel et al。(2003)19] 回归模型 RBF - - - - - - (我)多级企业评级
(2)与LR,分对数,神经网络
黄et al。(2004) (20.] 支持向量机 线性、RBF多项式 - - - - - - (我)多级企业评级
(2)与神经网络
李et al。(2006) (21] 支持向量机 RBF - - - - - - (我)和神经网络相比
(2)研究误分类错误
赖et al。(2006)22] 二、支持向量机 RBF - - - - - - (我)多级企业评级
(2)与神经网络相比,LR,分对数
李et al。(2007) (23] 支持向量机 RBF - - - - - - (我)多级企业评级
(2)与NN,哒,CBR
征求和克鲁克(2009)24] 支持向量机 线性、RBF多项式 - - - - - - (我)应用在大型数据集
- - - - - - (2)与分对数、LR、DA、资讯
- - - - - - (3)支持向量权重选择重要的特性
金姆和孙(2010)(25] 支持向量机 RBF - - - - - - (我)多级企业对中小企业的评级
(2)与神经网络相比,分对数
Danenas et al。(2011)26] 支持向量机 线性的,RBF、多项式 - - - - - - (我)比较不同库的支持向量机之间(LIBLINEAR LIBSVM,
拉普拉斯算子,皮尔森,逆 WEKA LIBCVM)
距离平方反比
距离
Lessmann出版社(2015)(11] 支持向量机 线性的,RBF - - - - - - (我)与分对数,树,榆树,然而,哒,BN,集合体
(2)建议使用不同的绩效指标
Louzada出版社(2016)(12] 支持向量机 没有提到过 - - - - - - (i)与LR、神经网络树,哒,分对数,模糊,BN,支持向量机,全科医生,
混合动力车,乐团
(2)研究类不平衡问题
Boughaci和Alkhawaldeh (2018) [18] 支持向量机 没有提到过 - - - - - - (i)与资讯,BN, NN,树,支持向量机,分对数和集合体
Mushava和穆雷(2018)27] 支持向量机 RBF - - - - - - (i)与分对数,哒,扩展分对数和
哒,乐团

修改后的支持向量机
王出版社(2005)(28] 支持向量机 线性、RBF多项式 模糊的会员 (我)在分类问题中引入双边加权误差
(2)与U-FSVM相比,支持向量机,LR,分对数和神经网络
哈里斯(2015)(29日] 支持向量机 线性的,RBF k - means聚类 (我)减少计算时间
(2)与分对数,k - means +分对数,支持向量机,k - means + SVM
杨(2017)(30.] WSVM RBF, KGPF - - - - - - (i)与自适应动态评分的内核
(2)内核的属性来解决黑盒模型的排名
(3)与分对数
李et al。(2017) (31日] L2-SVM 没有提到过 - - - - - - (我)拒绝推理
(2)与分对数相比,支持向量机
田et al。(2018)32] L2-SVM 没有内核 - - - - - - (我)减少计算时间
(2)拒绝推理和异常值检测
(3)与分对数,资讯,支持向量机,SSVM
Maldonado et al。(2017)33] 支持向量机, 线性 - - - - - - (我)特征选择
1-norm支持向量机 (2)购置成本SVM的配方
(3)应用程序和行为得分
(四)研究类不平衡问题
(v)与支持向量机(过滤器和包装特征选择)
Maldonado et al。(2017)34] 支持向量机, 线性 - - - - - - (我)以利润为基础的特征选择方案
LP-norm支持向量机 (2)集团罚函数包含在SVM配方
(3)与分对数相比,支持向量机(过滤、包装特征选择)

混合支持向量机
黄et al。(2007) (35] 支持向量机 RBF 遗传算法 (我)hyperparameters调优、功能选择(包装方法)
(2)与医生相比,神经网络,树
Martens et al。(2007)36] 支持向量机 RBF C4.5,钻孔机, (我)规则提取
G-REX (2)与分对数、支持向量机、树
周和白(2008)(37] 支持向量机 RBF 粗糙集 (我)特征选择(过滤方法)
(2)与哒,神经网络,支持向量机,通过GA SVM包裹
Zhang et al。(2008)38] 支持向量机 RBF 全科医生 (我)规则提取
(2)与支持向量机相比,GP,分对数,NN,树
姚(2009)(39] 支持向量机 RBF 附近 (我)特征选择(过滤方法)
粗糙集 (2)与哒,分对数,神经网络
徐et al。(2009)40] 支持向量机 RBF 链接分析 (我)特性提取申请人的链接关系
(2)与支持向量机相比
周et al。(2009) (41] WSVM 线性的,RBF 遗传算法 (我)hyperparameters调优、功能选择(包装方法)
(2)特征权重
(3)与LR、分对数NN,树,然而,演算法
周et al。(2009) (42] LSSVM RBF DS, GA、GS、能源部 (我)hyperparameters调优(包装方法)
(2)与分对数,然而,哒,树
陈和李(2010)(43] 支持向量机 RBF 哒,树, (我)特征选择(过滤方法)
粗糙集, (2)与支持向量机相比
f值
Yu et al。(2010)44] WLS-SVM RBF DS, GA、GS、能源部 (我)hyperparameters调优(包装方法)
(2)研究类不平衡问题
(3)与结果(8,45]
母鸡和女子(2011)(46] 支持向量机 线性 分层抽样 (我)减少计算时间
(2)与支持向量机相比,神经网络,全科医生
Danenas和Garsva (2012) [47] 支持向量机的 线性 算法,遗传算法 (我)模型选择
LIBLINEAR (2)hyperparameters调优(包装方法)
陈et al。(2012) (48] 支持向量机 RBF k - means聚类 (我)拒绝推理
集群 (2)不同的截止点多类问题
陈et al。(2013) (49] 支持向量机 RBF 美国广播公司 (我)hyperparameters调优(包装方法)
(2)与支持向量机与GA算法
汉et al。(2013)50] 支持向量机 线性 正交尺寸 (我)特征提取与降维
减少 (2)与分对数
Garsva和Danenas (2014) [51] 二, 线性的,RBF、多项式 PSO、DS、SA (我)模型选择
支持向量机的 乙状结肠 (2)hyperparameters调优(包装方法)
LIBLINEAR (3)研究类不平衡问题
(iv)比较在所有支持向量机和回归模型与算法优化,DS, SA
Danenas和Garsva (2015) [52] 支持向量机的 线性 算法 (我)模型选择
LIBLINEAR (2)hyperparameters调优(包装方法)
(3)与分对数相比,RBF网络分类器,支持向量机与DS调谐
许et al。(2018)53] 支持向量机 RBF 美国广播公司 (我)hyperparameters调优(包装方法)
(2)与分对数相比,支持向量机与g调,GA算法
Jadhav et al。(2018)54] 支持向量机 RBF 遗传算法 (我)特征选择(包装方式)
(2)与独立的支持向量机,然而,NB和GA的包装器
与标准遗传算法
王et al。(2018) (55] 支持向量机 RBF 多种群遗传算法 (我)特征选择(包装方式)
(2)与MPGA-SVM GA-SVM, SVM

整体模型
周et al。(2010) (56] 回归模型 RBF 模糊c均值 (我)齐次合奏
(2)与整体和单个分类器
Ghodselahi (2011) (57] 支持向量机 线性的,RBF、多项式 - - - - - - (我)齐次合奏
乙状结肠 (2)与整体和单个分类器
Yu et al。(2018)58] 支持向量机 RBF DBN (我)齐次合奏
(2)研究类不平衡问题
(3)与整体和单个分类器
夏et al。(2018)59] 支持向量机 RBF 射频、GPC、 (我)异构合奏
XGBoost (2)与整体和单个分类器


类型

标准支持向量机和它的变体 13
修改后的支持向量机 7
混合支持向量机 20.
乐团支持向量机 4

44

从表1,早期阶段的信用模型与支持向量机基本上是独立的预测能力的支持向量机进行调查。从这些调查实验,结果验证了方法的有效性,它很快被贴上一个先进的信用评分方法。然后,发展趋势转向提高原来的SVM模型,混合模型公式是最受欢迎的方法,仍然是活跃的,直到最近几年,数据预处理和hyperparameters调优比其他的研究目的。整体信用评分模型的最新研究趋势由于其改善分类性能的能力。这导致支持向量机参与两种情况;即。,支持向量机is one of the benchmark models against ensembles and SVM is the base classifier used to form new ensembles. On the other hand, in view of the SVM type in credit modelling, standard SVM has been most frequently used while SVM variants have apparently lesser research works. In view of the kernel used, linear and RBF kernel have been widely utilized in this domain.

报道在表2、混合支持向量机是最常采用的方法来构造新的SVM信贷模式。这是紧随其后的是独立的支持向量机,修改后的SVM和集合体。Louzada et al。12]回顾性研究也显示同样的趋势,混合模型是研究中最受欢迎的。在混合模型中,杂化方法与支持向量机协助行为不改变SVM算法分类任务。因此,混合模型的建设被认为是一个直接的方法。排在第二位的是独立的支持向量机由于其认可的最先进的技术。其作为基准模型参与最近的研究进一步巩固其在信贷领域认可。修改后的支持向量机需要一个复杂的过程来改变SVM算法,从而获得相对较少的关注。整体模型的新造型概念,最近只是研究非常,导致最少的贡献。

1提供了一种快速总结在过去研究研究目的处理利用支持向量机模型。根据计数为每个目标的论文,占大多数的顶级研究目的本文研究调查的预测能力,特征选择,和hyperparameters调优。频繁使用支持向量机模型在各种类型的信贷数据集和参与基准实验调查模型预测能力是一个指示的意义领域。数据预处理与支持向量机的特征选择和微调hyperparameters第二验证这两个有效地保证质量的重要性分类的支持向量机。因此,另一个有两件作品同时进行任务提出了新的模型。除此之外,也有一些研究用的是特征提取对数据集进行预处理,而不是功能的选择。然而,这些不能解决支持向量机的主要缺点与大黑盒财产和低效率的计算实例。因此,研究规则提取和计算效率是相对应的解决两个问题。其他信用评分问题面临使用SVM少数计数的贡献。异常处理,提高分类性能,拒绝推论,动态评分和数据不平衡。 The attempts to solve various issues with SVM imply its worthiness to be considered as the alternative in credit scoring domain.

(2)MA模型。MA模型开发了即将到来的表和数据。表3马是实足的总结回顾研究显示的造型趋势,总结问题解决,并提供详细的适应度函数和模型考虑在每个实验比较。然后,表4报告MA模型的计算模型类型的分类。图2说明了研究论文数量相应的研究目的。


作者 硕士(类别) 其他方法 适应度函数 讲话

标准的马
德赛et al。(1997)60] GA (EA) - - - - - - 不。的错误分类 (我)多类问题
(2)与神经网络相比,分对数,哒
Ong et al。(2005)61年] GP (EA) - - - - - - 平均绝对误差 (我)规则提取
(2)与分对数、神经网络树,粗糙集
芬利(2006)(62年] GA (EA) - - - - - - 基尼系数 (我)大型信贷数据的应用程序
(2)与分对数、LR、神经网络
Cai et al。(2009) (63年] GA (EA) - - - - - - 出错率 (我)包括误分类代价健身
函数
黄et al。(2006) (64年] 2阶段GP (EA) - - - - - - 平均绝对误差 (我)规则提取
(2)与分对数,树,然而,全科医生
Abdou et al。(2009)65年] GP (EA) - - - - - - (平方误差的总和)+ (i)研究误分类代价的影响
(分类错误) (2)与利润分析
和证据的效力
董et al。(2009)66年] SA (IB) - - - - - - 精度 相似度函数 (我)规则提取
( 是一个系数) (2)与哒,然而,树
Martens et al。(2010)67年] 算法(SI) - - - - - - 覆盖+信心 (我)规则提取
(2)与树相比,支持向量机,多数投票
杨et al。(2012) (68年] CS (SI) - - - - - - 错误率 (i)与奥特曼的z分数和支持向量机
Uthayakumar et al。(2017)69年] 算法(SI) - - - - - - (我)规则提取
(2)与分对数、神经网络、射频、RBF网络

混合的妈妈
江et al。(2011)70年] SA + GA 神经网络 (我)SA优化遗传算法
(IB + EA) (2)参数调优
(3)比较独立的神经网络和GA-optimized NN
Aliehyaei和汗(2014)71年] 算法(SI)、GP (EA)、 - - - - - - 平均绝对误差 (我)规则提取算法GP的输入
算法+全科医生 (2)比较算法和全科医生

混合MA-DM
福格蒂和Ireson (1993) [72年] GA (EA) BN 精度 (我)特征提取
(2)大型信贷数据的应用程序
(3)与默认规则,BN,然而,树
手,亚当斯(2000)(73年] SA (IB) 悲哀,加权 可能性 (我)离散化特性
有祸了 (2)与分对数,哒,另外两个离散化方法
Drezner et al。(2001)74年] TS (IB) LR (我)特征选择(包装方式)
(2)与奥特曼的z分数
拉赛尔达et al。(2005)75年] GA (EA) 神经网络 平均的 (我)hyperparameters调优
等级的个人 (2)与神经网络相比,连续学习算法,支持向量机
从一个人口
黄et al。(2007) (35] GA (EA) 支持向量机 精度 (我)hyperparameters调优,特征选择(包装方法)
(2)与神经网络相比,医生、树
Zhang et al。(2008)38] GP (EA) 支持向量机 准确性+预期 (我)规则提取
误分类代价 (2)与支持向量机相比,GP,树,分对数,神经网络
刘et al。(2008) (76年] GP (EA) 信息的价值 (我)特征提取(选择派生特征)
(2)大型数据集从金融企业
(3)与DA进行比较
王et al。(2008) (77年] GA (EA) 神经网络 1 / MSE (我)参数调优
(2)与神经网络
张出版社(2008)(78年] GA (EA) (1-info熵)+ (我)特征提取
(1-info熵) (2)与树,NN,全科医生,GA-optimized SVM,粗糙集
江(2009)(79年] SA (IB) (我) (我)规则提取
(2) (2)与树
(3)
Marinakis et al。(2009)80年] 算法(SI), 然而,1-NN 没有提到过 (我)多类问题,特征选择(包装方式)
PSO (SI) 加权资讯 (2)与包装模型GA和TS与资讯
(变种)
Sustersic et al。(2009)81年] GA (EA) 神经网络 精度 和RMSE , (我)特征选择(包装方式)
, 预设的阈值 (2)与神经网络相比,分对数(PCA)特性
周et al。(2009) (42] GA (EA) 支持向量机 出错率 (我)hyperparameters调优
(2)与分对数,然而,哒,树
周et al。(2009) (41] GA (EA) WSVM AUC (我)hyperparameters调优,特征选择(包装方法)
(2)与LR、分对数NN,树,然而,演算法
Marinaki et al。(2010)82年] HBO (SI) 然而,1-NN 精度 (我)多类问题,特征选择(包装方式)
加权资讯 (2)与包装器模型GA相比,PSO, TS, ACO资讯
(变种)
黄、吴(2011)(83年] GA (EA) 然而,BN,树,LR, 精度 (我)特征选择(包装方式)
支持向量机、神经网络、演算法, (2)与资讯,BN,树,从分对数,SVM(功能
Logitboost, Multiboost 过滤器选择方法)
Yu et al。(2011)44] GA (EA) 回归模型 精度 (我)hyperparameters调优
(2)研究类不平衡问题
(3)与结果(8,45]
科雷亚和冈萨雷斯(2011)84年] 全局搜索(SI), 神经网络 AUC (我)hyperparameters调优
GA (EA) (2)大型信贷数据集
(3)成本研究应用程序,行为和收集得分
(iv)与分对数、神经网络、全球最佳
Oreski et al。(2012)85年] GA (EA) 神经网络 精度 (我)hyperparameters调优,特征选择(包装方法)
(2)研究误分类代价的影响
(3)将他们的模型和特性
过滤器的选择方法
Danenas和Garsva (2012) [47] GA (EA), PSO (SI) 支持向量机 TPR (我)模型选择
(2)hyperparameters调优
陈et al。(2013) (49] ABC (SI) 支持向量机 没有提到过 (我)多类问题
(2)hyperparameters调优
(3)与支持向量机(调谐与遗传算法和PSO)
Garsva和Danenas (2014) [51] PSO (SI) 支持向量机 TPR(我),(ii)的准确性 (我)模型选择
(2)hyperparameters调优
(3)研究类不平衡问题
(iv)在所有支持向量机进行比较,为生物与PSO优化,DS, SA
Oreski和Oreski (2014) [86年] GA (EA) 神经网络 精度 (我)特征选择(包装方式)
(2)与标准wrapper-based与GA神经网络
Danenas和Garsva (2015) [52] PSO (SI) 支持向量机 TPR (我)模型选择
(2)hyperparameters调优
(3)与分对数相比,RBF网络
王et al。(2010) (87年] TS (IB) 神经网络、支持向量机、分对数 (我)特征选择(过滤方法)
(2)与神经网络相比,支持向量机,分对数与完整的功能
王et al。(2012) (88年] 党卫军(SI) 神经网络,树,分对数 (我)特征选择(过滤方法)
(2)与神经网络相比,树,分对数与完整的功能
Waad et al。(2014)89年] GA (EA) 分对数、支持向量机、树 (我)特征选择(过滤方法)
(2)与分对数相比,支持向量机,树(从其他滤波器特性
选择和排名聚合方法)
许et al。(2018)53] ABC (SI) 支持向量机 ,如果 (我)多类问题
,如果 (2)hyperparameters调优
(3)与分对数和SVM(调谐与GS、GA算法)
Jadhav et al。(2018)54] GA (EA) 支持向量机、资讯、NB 精度 (我)特征选择(包装方式)
(2)与独立的支持向量机,然而,NB和他们
包装与遗传算法
王et al。(2018) (55] 多的人口 支持向量机 精度 (我)特征选择(包装方式)
GA (EA) (2)与MPGA-SVM GA-SVM, SVM
Krishnaveni et al。(2018)90年] HS (SI) 1-NN 精度 (我)特征选择(包装方式)
(2)减少计算时间
(3)与独立的支持向量机,树,然而,NB,神经网络
遗传算法和PSO和他们的包装器


类型

标准的马 10
混合的妈妈 2
混合MA-DM 31日

43

MA模型的时间顺序表4显示了建模的趋势。早期马马模型独立的调查目的。启动信贷马造型将人工智能技术的日益普及。以后的发展趋势是制定新的混合模型,直到最近几年,这个问题仍然存在。混合模型中,大部分的研究是混合MA-DM MA技术作为DM完成分类任务的助理。针对利用MA技术,遗传算法被认为是马先驱以及占主导地位的信用评分可以观察到现场使用以来从最早的研究直到最近,医生是第二受欢迎的马。有前途的表演与混合遗传算法和马医生打开一个新的页面在信贷造型其他马开始得到关注。

基于模型的类型与马总结如表组成4、混合MA-DM显然是占主导地位,其次是标准的马和混合的妈妈。丰富的研究构建混合MA-DM马表明可以有效地提高独立的DM信用模型的表现。标准的马和混合妈妈有很多较小的研究工作。这可能是由于MA模型的主体性在制定优化问题对信贷客户进行分类,对于一般的使用造成困难。

一个快速概述研究目的的MA模型如图2。特征选择是主要问题解决,贡献了最多的工作,其次是规则提取和hyperparameters调优。这一结果推断,马是一种有用的工具进行数据预处理。高的可理解性总是至关重要的信贷标准模型。有马的数量与规则提取研究,解决这个问题是承认马英九可以产生透明的信用计分卡。此外,人工智能模型对hyperparameters敏感;因此自动调优与马代替手工调优一直在持续研究。成功的特征选择和hyperparameters调优在确保良好的性能敦促一些研究同时进行两种。除了预处理数据与特征选择,有一些作品使用马做特征提取和离散化。其他少数民族研究的目的是调查的预测能力和参数调优。

(3)整体总结。是两种不同的人工智能技术,这两种方法都一直积极研究这些年来,释放他们的信用得分域中的巨大潜力。这两个角色的信贷模型见图3基于研究目的。

特征选择是大多数一致通过两种模型来解决这个问题。特征选择,支持向量机和马都几乎相同数量的工作在解决这个问题。然而,主要的区别在于,支持向量机分类的工具直接马而间接做分类,它作为杂化DM助理负责分类模型。调查预测能力是第二个研究目的。支持向量机模型GA相比更大数量的研究。这表明,支持向量机已经是一个公认的信用评分模型,因为它通常是包含在比较研究,试图在不同的特定领域。马有较小的作品在此的目的是很少参与基准实验,可能是由于其在模型构建的主体性。然后,规则提取研究的第三大数量,与马多支持向量机模型。这显示了伟大的马开发透明的模型的能力。Hyperparameters调整之际,下有七个贡献所有的七个马的协作与支持向量机。 Thus, MA can be viewed as a recommended tool to tune SVM hyperparameters. Simultaneous features selection and hyperparameters tuning result in a total of three studies, with two of them being hybrid MA and SVM.

其余的研究目的显示马SVM或主导地位。功能离散化只有被马而拒绝尝试推断,改善性能、计算效率、动态评分,不平衡数据集,并使用支持向量机处理离群值只有得到解决。MA模型考虑多的小问题相比,支持向量机马以来集中更多解决特征选择和提取规则。

4.2。评估程序

为了评估信用模型的性能,它们通常与其他标准的信贷模型应用于选定的信贷数据集和评估适当的性能的措施。因此,评估过程分为基准实验、性能的措施信贷数据集。

4.2.1。准备基准实验

基准实验包括提出模型的比较与其他标准的信用模型。表12提供简短的总结在每个模型考虑的比较实验。详细的实验设置应当指的是原始的纸。表5介绍了分类类型的基准与SVM和MA模型进行实验。


指标类型 支持向量机模型 MA模型

大规模的 (8,11,12,18,27,56- - - - - -59] - - - - - -

小范围内 对应 (33,40,43] (70年,71年,79年,80年,82年,83年,85年,86年,89年]
(77年,87年,88年]
(47,49,51,54,55]
统计 (30.,50] (65年,73年,74年,76年]
人工智能 (20.,21,46] (67年,72年,75年,78年]
(35]
统计与人工智能 (22- - - - - -25,29日,31日,32,34,36] (60- - - - - -62年,64年,66年,69年,81年,84年,90年]
(19,28,37,39] (68年]
(38,41,42,52,53]

外部 (44]

没有一个 (48] (63年]

报道在表5比较,可以看出包含模型一直是标准方法进行结论提出的模型。大多数研究采用内部基准方法进行比较与其他模型基于相同的信贷数据的实验装置。只余et al。44采用外部基准方法比较他们提出的模型与其他模型。陈等人。48和Cai et al。63年]在文献中是罕见的情况下不基准与他人提出的模型。

大型基准是一种罕见的方法只有几项研究提出这过去。它可以注意到研究工作与大型基准是那些比较研究和制定新的整体模型进行性能改进。比较研究有必要包含足够的大量的基准方法能够提供足够的信息作为指导未来的研究。自组装的乐团制定独立的分类器,作者提出了新的集合体通常有比较新的集合体不仅与独立的分类器,也可用标准的集合体。

小规模基准测试是最常见的方法可以进一步分为四个主要部分,即。,比较only with the counterpart techniques of the proposed model, comparison only with either statistical or AI techniques, and comparison with both statistical and AI techniques. For both SVM and MA models, the most preferred small scale benchmark is comparison with both statistical and AI techniques. Besides, LOGIT and NN are the most frequently involved statistical and AI techniques, respectively.

4.2.2。性能的措施

有四个主要类型的性能措施被用来进行推理的模型表现。Cutoff-dependent措施直接获得或混淆矩阵的计算,截止点往往是problem-dependent。Cutoff-independent措施的计算来确定模型的识别能力。表明混合使用cutoff-dependent和cutoff-independent措施而面向业务的措施都是那些错误分类的计算成本。表6总结了SVM的性能措施的文献和MA模型。


类型 支持向量机模型 MA模型

Cutoff-dependent (12,19- - - - - -21,23,25,26,28,30.,36,37,39,40,46,48] (60,61年,63年- - - - - -72年,74年- - - - - -79年,81年- - - - - -83年,85年,86年,89年,90年]
(35,38,42,44,47,49,51- - - - - -53,55]

Cutoff-independent (24,33,34] (84年]
(41]

混合物 (8,11,18,22,27,29日,31日,32,43,50,56,57,59] (1,62年,87年,88年]
(54]

面向业务的 (33,34] (65年,72年,76年,86年]

其他人 (58] - - - - - -

Cutoff-dependent措施是最受欢迎的指示器利用研究者,尤其是精度或其对应的出错率,以简单明了的方式正确分类的数量。其中,支持向量机模型的一些研究[21,22,28,30.- - - - - -32,40,57)和MA模型(70年,77年,81年,83年)感兴趣的误分类被认为给金融机构带来更高的风险;因此包括I型和II型错误。尽管cutoff-dependent措施直接为表现表现的分类器,一个主要缺点是用4,11,24),研究人员通常不地址使用的分界点。因此,有一些研究认为cutoff-independent性能措施足以作为模型指导表演报道在表6接受者操作特征曲线下面积(AUC)是最广泛使用的。

Cutoff-dependent措施混淆矩阵和cutoff-independent措施模型识别能力为决策者都是有益的。因此,一些研究包括两种类型的措施在他们的实验中提供不同角度的解释。的最新和最大的比较研究Lessmann et al。11),建议使用更多cutoff-independent措施,目的是在不同的角度来解释模型。因此,他们在最近的研究(建议被采纳59]。

损益往往是金融机构信贷评分的最终目的是作为一种避险工具。只有少数的研究解释了他们的模型与面向业务的措施。他们预计Misclassfication成本(EMC) [65年,86年),盈利能力(72年),和自我界定的利润或成本措施(33,34,76年]。注意,所有研究利用面向业务的措施还包括cutoff-dependent或cutoff-independent措施来评估他们的模型。只余et al。58)应用称重精度,包括不平衡率、收入和成本计算精度的新版本。

4.2.3。模型评价

研究人员推断和结论的基础上,报告性能的措施。表明,该模型的结论往往是竞争或比其他标准信贷模型基于数值结果。此外,一些研究提出模型的统计检验显示明显改善。

有几项研究支持向量机模型(29日,36,46,59],MA模型[60,69年,71年,78年,84年],和关节MA-SVM [41,47,51,52)没有他们提出的模型相比,模型的数值表现。然而,他们造成了另一个方面,即。,表现在时间(29日,46),妥善处理不平衡(59),透明的规则(36,69年],和表示竞争新方法[41,47,51,52,60,71年,78年,84年]。

一些比较研究[8,11,12]某些方法来确定最佳的性能,为未来的研究建议但他们没有惩罚的使用其他技术报道以来表现依然很有竞争力,而比较研究[18,26)并没有导致任何方法相比在模型的表现。其余的研究文章综述了研究报道他们提出的模型比其他人有更好的结果。

而不是仅仅取决于数值改进检测表现,少数的研究(8,11,12,19,21,23,29日,34- - - - - -36,43,50,53,55,56,59,60,67年,89年)利用统计测试更具体支持的结果。最常用的统计测试是配对t检验,Mc Nemar测试,弗里德曼魏克森讯号等级测试和测试。

4.2.4。信贷数据集

SVM和马信贷模型应用于不同类型的信贷数据集,即。,application scoring (AS), behavioural scoring (BS), collection scoring (CS), corporate rating (CR), and bankruptcy prediction (BP). There have been two main types of studies which are specific studies particularly on a country’s financial institutions and general studies using publicly available datasets from the UCI repository [94年]。表7总结了信贷数据集使用。


类型 支持向量机模型 MA模型

具体的 CR:BankScope (19),英国(22), CR:英国80年,82年]
台湾/我们[20.)、韩国(23,25), 英国石油公司:模拟数据68年]
台湾(21)、信用卡(24] 作为:美国东南部60),英国(62年),
英国石油公司:美国(26] 埃及(65年],Compustat [74年),
作为:德国30.],LC P2P [31日), 深圳(70年,77年)、克罗地亚(85年),
LC /汇金P2P [32),中国(37,48] 英国/模拟[1]
废话:智利27,33,34] 作为/废话/CS:当地银行(84年]
英国石油公司:美国(47,52]
CR:Compustat (49]

一般 作为:【12,39,43,57] 作为:【61年,63年,64年,66年,70年,71年,75年,78年,83年,87年,88年,90年]
作为:【35,38,41,42,44,51,55]

具体& 作为:英国CDROM (28],巴巴多斯[29日), 作为:克罗地亚86年),
一般 比荷卢经济联盟(36] 突尼斯/房屋净值[89年]
英国石油公司:ANALCAT (69年]
作为/英国石油公司/CR:中小企业/ BankScope [67年]
作为:台湾54]
CR:Compustat (53]

大规模的 作为:【8,11] - - - - - -
比较 作为/英国石油公司:【18]

为特定的研究中,他们都集中在特定的金融机构,与应用程序得分成为主要利用数据类型,其次是企业评级和破产的预测。行为得分已收到非常的关注更少。一般研究有三个数据集:德国、澳大利亚和日本在UCI数据集可用的存储库,和所有应用程序得分数据。其中,德国和澳大利亚广泛参与研究。也有了具体的研究,包括UCI数据集作为评价的目的,同样的,德国和澳大利亚仍然是占主导地位的研究人员使用。它可以注意到,几乎所有的研究利用少量数据集进行调查,只有涉及大量的数据集的比较研究。

4.3。文献的结果

德国(G)和澳大利亚(A)数据集已经经常包含在信用评分域使用SVM和MA模型。这部分编译那些贡献作品基于模型类型的研究目的提供信息的处理表现出良好的性能在两个数据集的问题。注意,编译只是基于精度是常见报道的措施。仅供研究报告出错率,转换精度。研究,利用这些数据集不包括但不报告的准确性。然后,使用超过一个标准支持向量机和它的变体,以及制定多个新模式的研究,只有表现最好的结果记录下来。编译生成的结果表8


目的 模型类型 作者 G 一个

调查预测 标准支持向量机和 Baesens et al。8] 74.30 89.10
能力 它的变体 Lessmann et al。11] 75.30 86.00
Boughaci和Alkhawaldeh18] 69.90 80.70
独立的马 Cai et al。63年] 80.00 - - - - - -

计算效率 修改后的支持向量机 哈里斯(29日] 77.10 - - - - - -
混合支持向量机 母鸡和女子46] 75.08 85.98

改进的分类 乐团 周et al。56] 78.13 - - - - - -
性能 Ghodselahi [57] 81.42 - - - - - -
夏et al。59] 78.32 86.29

规则提取 混合支持向量机 Martens et al。36] - - - - - - 85.10
独立的马 Ong et al。61年] 77.34 88.27
黄等。64年] 79.49 89.17
董et al。66年] 72.90 - - - - - -
Martens et al。67年] 80.80 - - - - - -
Uthayakumar et al。69年] - - - - - - 86.37
混合的妈妈 Aliehyaei和汗71年] 70.70 84.30
混合MA-DM Zhang et al。38] 79.88 89.45
江et al。79年] 73.10 - - - - - -

特征提取 混合支持向量机 徐et al。40] - - - - - - 89.28
汉et al。50] 75.00 - - - - - -
混合MA-DM Zhang et al。78年] 77.76 89.33

特征选择 混合支持向量机 姚(39] 76.60 87.52
陈和李43] 76.70 86.52
混合MA-DM Jadhav et al。54] 82.80 90.75
王等人。55] 78.53 86.96
黄、吴(83年] - - - - - - 87.54
Oreski和Oreski86年] 78.90 - - - - - -
Krishnaveni et al。90年] 80.40 93.50
王等人。88年] - - - - - - 88.90

Hyperparameters调优 混合MA-DM 周et al。42] 77.10 86.96
Yu et al。44] 78.46 90.63
Garsva和Danenas51] 81.30 87.40
许et al。53] 84.00 92.75
拉赛尔达et al。75年] - - - - - - 86.05

同步功能 混合MA-DM 黄等。35] 77.92 86.90
选择& hyperparameters
调优

的意思是 77.56 87.75
标准偏差 3.35 2.64

计算均值表8模型的整体性能在两个数据集。高价值的准确性是表明SVM的性能好和MA模型在文献中。表的计算标准偏差8被视为一个指标来概括的范围的准确性被认为考虑到变化在不同的实验设置为每个模型的发展。

总体平均值和标准偏差表8概述了模型性能通过编译所有研究不管采用的数据分割策略。数据分割方法是影响实验结果。一般编译表8进一步详细的表吗9考虑不同的数据分割策略的影响。详细的分析是由分类研究(除了江(79年)如没有数据分割述)分为四个主要类型的数据分区,即。,k-fold cross validation (k-fold), holdout validation (holdout), repeated k-fold cross validation (rep k-fold), and repeated holdout validation (rep holdout).


数据分割 作者 G 一个

k-fold简历 董et al。66年] 72.90 - - - - - -
Uthayakumar et al。69年] - - - - - - 86.37
Zhang et al。38] 79.88 89.45
徐et al。40] - - - - - - 89.28
汉et al。50] 75.00 - - - - - -
Zhang et al。78年] 77.76 89.33
姚(39] 76.60 87.52
陈和李43] 76.70 86.52
Jadhav et al。54] 82.80 90.75
王等人。55] 78.53 86.96
黄、吴(83年] - - - - - - 87.54
Oreski和Oreski86年] 78.90 - - - - - -
王等人。88年] - - - - - - 88.90
周et al。42] 77.10 86.96
Yu et al。44] 78.46 90.63
许et al。53] 84.00 92.75
黄等。35] 77.92 86.90
的意思是 78.20 88.56
标准偏差 2.93 1.92

坚持 Baesens et al。8] 74.30 89.10
Cai et al。63年] 80.00 - - - - - -
Boughaci和Alkhawaldeh18] 69.90 80.70
哈里斯(29日] 77.10 - - - - - -
周et al。56] 78.13 - - - - - -
Ghodselahi [57] 81.42 - - - - - -
Martens et al。36] - - - - - - 85.10
Martens et al。67年] 80.80 - - - - - -
Aliehyaei和汗71年] 70.70 84.30
Garsva和Danenas51] 81.30 87.40
的意思是 77.07 85.32
标准偏差 4.47 3.20

代表k-fold Lessmann et al。11] 75.30 86.00
夏et al。59] 78.32 86.29
Krishnaveni et al。90年] 80.40 93.50
的意思是 78.01 88.60
标准偏差 2.56 4.25

代表坚持 Ong et al。61年] 77.34 88.27
黄等。64年] 79.49 89.17
拉赛尔达et al。75年] - - - - - - 86.05
的意思是 78.42 87.83
标准偏差 1.52 1.61

9表明k-fold和坚持是最适应数据分割策略,而代表k-fold和代表坚持不太受欢迎,这可能是由于高计算所需的努力代表k-fold和代表抵抗。而不是一般的平均值和标准偏差表8,每个类别的特定的平均值和标准偏差被发表在表9,这被认为是减少偏见和更可靠的指标是根据数据分组均匀分割方法。为所有类别,在这两个数据集,平均精度相对较高,显示的有效性建立新的信用模型与支持向量机和马。

然而,对于抵抗类别,可以注意到,标准差远高于另一个类别去了。观察抵抗类别,推导出高偏差从Boughaci来自一个不同寻常的低精度和Alkhawaldeh18]。这个精度低可能是由于支持向量机的使用没有hyperparameters调优过程。除此之外,另一个高的标准偏差来自代表k-fold类别只在澳大利亚的数据集。这个偏差来自更高精度高的结果Krishnaveni et al。90年]。这可能是由于这个数据集的本质适合该方法。

提供信息的模型比其他人更有效,模型精度高于平均被视为有更大的潜力来应对信贷评分问题,为未来的研究将是值得推荐的。更高的潜在模型在斜体(见表9),它们与各自的平均精度在每个类别。在表精度用斜体8对应于从表中获得更高的潜在信用模型9。一般来说,规则提取,hyperparameters调优和特征选择观察的有效措施进行well-performed信用模型。这与我们先前的讨论4.1.3

特征选择和hyperparameters调优,支持向量机和马似乎是至关重要的信贷工具造型,支持向量机是主要的分类器和马助理是融合SVM进行目标任务。对规则提取,马是最好的选择建立透明的信用评分模型,在马独立或与其他黑盒DM杂化。在支持向量机的不同变体,标准支持向量机是最常采用的人员对新模型的发展。另一方面,在不同的马,GA和GP似乎占主导地位的工具,而最近的趋势已经转移到其他类型的马建立新模型。

包括德国和澳大利亚基准数据集到大规模的信用模型的比较研究表明这两个状态成为标准的信贷数据集在这一领域。这导致频繁使用的数据集在整个年,直到最近。

5。结论和未来的发展方向

本研究提出了一个文献综述信用评分模型的制定与SVM和马。从两个方面,与问题解决模型类型和评估程序,连同过去信贷模型应用于UCI数据集的结果,混合方法被确定为最先进的造型信贷评分方法的技术领域。信贷支持向量机和马当前的趋势模型与支持向量机的主要分类器和马助理工具模型增强混合方法。一致的意见(1,11,12),得出复杂的模型是未来的趋势,支持向量机和马也会有类似的造型未来的趋势。各种问题和评估过程在文献中总结指出一些未来的发展方向如下。

5.1。模型类型和问题解决
5.1.1。支持向量机模型

SVM是一个持续的信用评分,积极研究的未来发展趋势是视为建设新的SVM模型基于混合和乐团的方法。几个方向指出了未来可能的工作。有各种可用SVM变异能够更灵活的分类。基准实验比较标准支持向量机和它的变体可以给洞察力进行SVM的类型在这个领域更具有适应能力。在构建新模式时,支持向量机变体,包括不同的正则化条件应考虑。Danenas et al。26)提供的信息可用内核的不同选择支持向量机;因此,而不是常见的线性和RBF其他内核追究。修改后的支持向量机在超平面上的文献涉及修改优化问题。引入新的内核可以被视为一个可能的未来为修改后的SVM分类工作,由于支持向量机本身的灵活性,任何内核遵循Karush-Kuhn塔克条件可用于支持向量机。混合方法是特征选择的多数,只有两部作品(33,34)采用成本和利润的观点来处理这个问题。未来的特征选择可以考虑整合成本和利润在模型建立过程中利润得分(建议作为未来的主要趋势2,11]。除此之外,其他的研究目的一些出版物是有价值的未来的发展方向要考虑。

5.1.2中。MA模型

混合MA-DM一直领先的模型类型在整个年,并相信在未来这一趋势将持续下去,因为混合模型制定被认为是一个直接的方式提出新的模型能够提高独立的DM。EA,即。马,GA和GP,是最受欢迎的信贷评分的应用领域。它可以观察到,马(EA家庭以外的)增加近年来出版物。自马有多种选择在每个家庭,那些尚未调查信用评分域,例如,社会认知优化、蝙蝠算法局部搜索,变量附近搜索,等等,应考虑新模式发展。虽然马标准很少用于模型开发,马的透明属性,和灵活性是专为解决特定的信贷数据+点使用信贷造型的马。此外,面向业务的模型是一个重要的决策者的前景。因此,马的灵活性应采用成本和收益纳入模型公式。考虑到计算效率,马是非常灵活的,运营商可以仔细修改或并行实现效率高。

5.1.3。整体

特征选择,hyperparameters调优和规则提取的结论与支持向量机的一些受欢迎的问题解决和MA模型,具有较高处理混合方法的倾向。从过去的实验结果与德国和澳大利亚的数据进一步验证这三个趋势的信用评分模型。与支持向量机相比,马主要限于处理这三个问题,而支持向量机处理更广泛的品种问题。因此,马而不是限制建立模型的基础上,一些受欢迎的目的,其他问题已经试图在SVM模型应考虑因为马的灵活性,使其适应具体的问题总是可能的。马主要是与支持向量机结合形成混合。其他人工智能模型尚未尝试同样的研究目的值得被调查。此外,马是有利的在规则提取支持向量机是一种黑盒模型。这两个还可以制定一个透明的合作竞争模式。最后,形成面向业务的支持向量机模型与混合方法是一个更直接的任务比修改在支持向量机算法。马的适应性强的属性是一个很好的前景加入SVM,马在哪里负责考虑成本和利润的建模过程。 Ensembles modelling is also a future research direction as it has just received attention in credit scoring domain lately. Business-oriented ensemble with MA-tuned SVM model is a recommendable future research.

5.2。评估程序

整个评估过程在每个实验中一个主观的决定是基于研究者的实验装置。内部小范围基准实验统计和人工智能技术,包括报告的数值改善cutoff-dependent措施,信贷评分域是最主要的趋势。内部小范围基准是未来的推荐实验装置实验由于两个主要因素。首先,新开发的模型必须与标准的信用评分模型统计和人工智能家庭作为一个具体的支持拟议的模型的实用性,但大规模的比较是没有必要的,以避免失去焦点。第二,外部基准比较结果与其他研究可以考虑但必须非常谨慎,因为使用不同的实验有不同的设计,可能很难有一个apple-to-apple比较。还建议报告一起cutoff-dependent和独立的措施和披露使用cutoff-dependent措施时假定的分界点。有品种的性能措施建议Lessmann et al。11),但应当认真作出选择,而不是使用尽可能多的这些措施。这是因为每一个测量在不同的方法评估模型;研究人员应选择基于需要传达的最重要的信息是什么,因为它并不总是“越多越好”4]。面向业务的措施可以被视为一个未来趋势评价模型,提供的信贷数据集应该信息利润和成本。尽管数值改进被认为是一个宝贵的贡献,建议包括统计检验进一步验证模型的统计学意义的表演。集中在应用程序的趋势得分尤其是公共UCI数据集可能是由于信用评分的保密问题域。最近,有一些数据挖掘的数据集可以从比赛和还贷款俱乐部(LC)在线P2P贷款平台。因此,应当涉及其他类型的数据集来检查模型鲁棒性在不同的类型的数据。此外,LC数据集提供了更多的信息,可以被认为是构建行为评分模型。具体研究使用私有数据集、利润得分可能是未来的研究趋势和建议包括UCI数据集作为基准由于他们一般使用在文献中。

的利益冲突

作者宣称没有利益冲突有关的出版。

确认

这项研究是由Geran Putra-Inisiatif Putra Siswazah (GP-IPS / 2018/9646000)支持马来西亚Putra大学(芬欧蓝)。

引用

  1. d . j .手和w·e·亨利,”在消费信贷评分统计分类方法:审查,”英国皇家统计学会杂志》:系列(社会统计数据),卷160,不。3、523 - 541年,1997页。视图:出版商的网站|谷歌学术搜索
  2. l·c·托马斯,“信贷的调查和行为得分:预测消费者贷款的金融风险,”国际期刊的预测,16卷,不。2、149 - 172年,2000页。视图:出版商的网站|谷歌学术搜索
  3. s . m . Sadatrasoul m . r . Gholamian m·萨米)和z . Hajimohammadi,“信用评分在银行和金融机构通过数据挖掘技术:一个文献综述,”《人工智能和数据挖掘1,1卷,不。2、119 - 129年,2013页。视图:出版商的网站|谷歌学术搜索
  4. n .马丁”评估计分卡性能:一个文献综述和分类,“专家系统与应用程序,40卷,不。16,6340 - 6350年,2013页。视图:出版商的网站|谷歌学术搜索
  5. h·a·Alaka l . o . Oyedele h·a·Owolabi et al .,“破产预测模型的系统综述:对框架工具的选择,”专家系统与应用程序卷,94年,第184 - 164页,2018年。视图:出版商的网站|谷歌学术搜索
  6. j .太阳Q.-H h . Li。黄,K.-Y。他,“预测金融危机和企业失败:审查的最先进的定义、建模、抽样,和特色的方法,”以知识为基础的系统卷,57 41-56,2014页。视图:出版商的网站|谷歌学术搜索
  7. 美国震响,p·科尔特斯和p .丽塔,”一个自动化文学分析信贷风险评估数据挖掘应用程序,”人工智能在金融市场,页161 - 177年,帕尔格雷夫麦克米伦,伦敦,2016年。视图:谷歌学术搜索
  8. b . Baesens t . Van Gestel s Viaene m·斯j . Suykens和j . Vanthienen“基准的分类算法对信用评分,”运筹学学会》杂志上,54卷,不。6,627 - 635年,2003页。视图:出版商的网站|谷歌学术搜索
  9. j . n .骗子d·b·埃德尔曼和l·c·托马斯,“最近发展消费信贷风险评估,”欧洲运筹学杂志》上,卷183,不。3、1447 - 1465年,2007页。视图:出版商的网站|谷歌学术搜索
  10. a . Lahsasna r . n . Ainon和t . y .哇,“信用评分模型使用软计算方法:一项调查,“国际阿拉伯信息技术杂志》上,7卷,不。2、115 - 123年,2010页。视图:谷歌学术搜索
  11. s . Lessmann b . Baesens H.-V。?萧和,l·c·托马斯“基准测试先进的分类算法对信用评分:一个更新的研究,“欧洲运筹学杂志》上,卷247,不。1,第136 - 124页,2015。视图:出版商的网站|谷歌学术搜索
  12. f . Louzada a Ara, g·b·费尔南德斯”分类方法应用于信用评分:系统回顾和整体比较,”调查在运筹学和管理科学,21卷,不。2、117 - 134年,2016页。视图:出版商的网站|谷歌学术搜索
  13. 人工智能品牌,加西亚诉和j·s·桑切斯,“对进化计算的应用文献综述信用得分,”运筹学学会》杂志上,卷64,不。9日,第1399 - 1384页,2013年。视图:出版商的网站|谷歌学术搜索
  14. d·杜兰消费分期融资风险元素,1941年NBER的书。视图:出版商的网站
  15. 依奥特曼”,财务比率分析、判别分析和预测企业的破产,”《金融,23卷,不。4、589 - 609年,1968页。视图:出版商的网站|谷歌学术搜索
  16. j . a . Ohlson”财务比率和破产的概率预测,”《会计研究》杂志,18卷,不。1,第131 - 109页,1980。视图:出版商的网站|谷歌学术搜索
  17. p . Kolesar和j·l .淋浴,”一个强健的信用使用分类数据筛选模型”,管理科学没有,卷。31日。2、123 - 133年,1985页。视图:出版商的网站|谷歌学术搜索|MathSciNet
  18. d . Boughaci和a . a . Alkhawaldeh”合适的信用得分和机器学习技术在银行业和金融业破产预测:比较研究,“风险和决策分析,2018年,页1 - 10。视图:谷歌学术搜索
  19. i t . Van Gestel b . Baesens j·加西亚,p . Van Dijcke,“支持向量机的信用评分方法,”银行——en Financiewezen,2卷,第82 - 73页,2003年。视图:谷歌学术搜索
  20. 黄z h . Chen C.-J。许,W.-H。陈、吴,”信用评级分析与支持向量机和神经网络:市场比较研究,“决策支持系统,37卷,不。4、543 - 558年,2004页。视图:出版商的网站|谷歌学术搜索
  21. S.-T。李,w . Shiue M.-H。黄”,使用支持向量机评价消费贷款,”专家系统与应用程序,30卷,不。4、772 - 782年,2006页。视图:出版商的网站|谷歌学术搜索
  22. l . k .赖l . Yu周,王,“信用风险评估与最小二乘支持向量机,”粗糙集知识和技术,第495 - 490页,2006年。视图:谷歌学术搜索
  23. 研究。李”,应用支持向量机对公司信用评级预测,“专家系统与应用程序,33卷,不。1,第74 - 67页,2007。视图:出版商的网站|谷歌学术搜索
  24. t .征求和j .骗子”,支持向量机的信用评分和发现的重要特性,“专家系统与应用程序,36卷,不。2、3302 - 3308年,2009页。视图:出版商的网站|谷歌学术搜索
  25. h·s·金和郑胜耀孙”,支持向量机的预测基于技术的中小企业信贷违约,”欧洲运筹学杂志》上,卷201,不。3、838 - 846年,2010页。视图:出版商的网站|谷歌学术搜索
  26. p . Danenas、g . Garsva和开瑞,“信用风险评价模型开发使用基于支持向量分类器,”Procedia计算机科学4卷,第1707 - 1699页,2011年。视图:出版商的网站|谷歌学术搜索
  27. j . Mushava和m . Murray”分类技术的实验比较债务复苏得分:证据来自南非的无担保贷款市场,“专家系统与应用程序卷。111年,~,2018页。视图:出版商的网站|谷歌学术搜索
  28. 和k . k . s . y . Wang Wang赖,“一个新的模糊支持向量机,对信用风险进行评估,”IEEE模糊系统,13卷,不。6,820 - 831年,2005页。视图:出版商的网站|谷歌学术搜索
  29. t·哈里斯,“信用评分使用集群支持向量机,”专家系统与应用程序,42卷,不。2、741 - 750年,2015页。视图:出版商的网站|谷歌学术搜索
  30. 杨y”,与内核学习方法适应信用评分”,欧洲运筹学杂志》上,卷183,不。3、1521 - 1536年,2007页。视图:出版商的网站|谷歌学术搜索
  31. y, z . Li k . Li f .周和w·杨,“拒绝信贷评分使用semi-supervised支持向量机,推理”专家系统与应用程序卷,74年,第114 - 105页,2017年。视图:出版商的网站|谷歌学术搜索
  32. y, z勇,j·罗,“拒绝推理新方法在信用评分使用kernel-free模糊支持向量机二次表面,”应用软计算卷,73年,第105 - 96页,2018年。视图:出版商的网站|谷歌学术搜索
  33. s . Maldonado j·佩雷斯,c·布拉沃,“基于成本的支持向量机的特征选择:应用程序在信用得分,”欧洲运筹学杂志》上,卷261,不。2、656 - 665年,2017页。视图:出版商的网站|谷歌学术搜索
  34. s . Maldonado c·布拉沃,j·洛佩兹和j·佩雷斯,“以利润为基础的特征选择方案的集成框架和支持向量机分类信用得分,”决策支持系统卷,104年,第121 - 113页,2017年。视图:出版商的网站|谷歌学术搜索
  35. 黄c·l·m·c·陈,c . j . Wang“信用评分和基于支持向量机的数据挖掘方法,”专家系统与应用程序,33卷,不。4、847 - 856年,2007页。视图:出版商的网站|谷歌学术搜索
  36. d·马顿斯b . Baesens t . Van Gestel和j . Vanthienen”理解信用评分模型利用支持向量机的规则提取,”欧洲运筹学杂志》上,卷183,不。3、1466 - 1476年,2007页。视图:出版商的网站|谷歌学术搜索
  37. j .周和t .呗”,使用粗糙集理论和遗传支持向量机的信用风险评估,”学报》第三届国际会议上网格和普适计算座谈会/车间(GPC)IEEE,页320 - 325年,2008年。视图:谷歌学术搜索
  38. d . Zhang m . Hifi问:陈,w .你们“混合信用评分模型基于遗传编程和支持向量机,”第四届国际会议上自然学报》计算(ICNC),卷7,8 - 12,2008页。视图:谷歌学术搜索
  39. p .姚明,“混合分类器使用邻域粗糙集和支持向量机的信用得分,”《商业情报和金融工程国际会议(BIFE)IEEE,页138 - 142年,2009年。视图:出版商的网站|谷歌学术搜索
  40. x徐、c .周和z . Wang”排名基于链接分析的信用评分算法与支持向量机”专家系统与应用程序,36卷,不。2、2625 - 2632年,2009页。视图:出版商的网站|谷歌学术搜索
  41. 和j·l·周k . k . Lai日圆,“信用评分模型与基于加权SVM AUC最大化,”国际信息技术与决策》杂志上,8卷,不。4、677 - 696年,2009页。视图:出版商的网站|谷歌学术搜索
  42. l .周k . k .赖,l . Yu”信用评分使用直接搜索支持向量机参数选择,”软计算的融合基础、方法和应用,13卷,不。2、149 - 155年,2009页。视图:谷歌学术搜索
  43. F.-L。陈和F.-C。李”,结合支持向量机的特征选择方法在信用得分,”专家系统与应用程序,37卷,不。7,4902 - 4909年,2010页。视图:出版商的网站|谷歌学术搜索
  44. x l . Yu姚明,s . Wang和k . k .赖“信用风险评估使用加权最小二乘支持向量机分类器和实验设计的参数选择,”专家系统与应用程序,38卷,不。12日,第15399 - 15392页,2011年。视图:出版商的网站|谷歌学术搜索
  45. d .西方,“信用评分模型,神经网络”电脑与行动研究,27卷,不。11 - 12,1131 - 1152年,2000页。视图:出版商的网站|谷歌学术搜索
  46. a . b .母鸡和m . k .女子”计算时间减少信用评分:一个集成的方法基于支持向量机和分层抽样方法,”专家系统与应用程序,39卷,不。8,6774 - 6781年,2012页。视图:出版商的网站|谷歌学术搜索
  47. p . Danenas和g . Garsva信用风险评估建模使用进化线性SVM分类器和滑动窗口方法,”Procedia计算机科学9卷,第1333 - 1324页,2012年。视图:谷歌学术搜索
  48. 刘g . w . Chen, y, k . Wang”混合数据挖掘技术,信用风险评估”系统工程Procedia,3卷,第200 - 194页,2012年。视图:出版商的网站|谷歌学术搜索
  49. c . c . m . y . Chen Chen和j.y.刘”信用评级分析与支持向量机和人工蜂群算法”学报》国际会议产业、工程和应用智能系统的其他应用程序施普林格,页528 - 534年,柏林,德国海德堡2013。视图:谷歌学术搜索
  50. l .汉、l .汉和h .赵“正交信贷支持向量机得分,”人工智能技术的工程应用,26卷,不。2、848 - 862年,2013页。视图:出版商的网站|谷歌学术搜索
  51. g . Garsva和p . Danenas粒子群优化基于线性支持向量机分类器的选择,”非线性分析:建模和控制,19卷,不。1,26-42,2014页。视图:谷歌学术搜索
  52. p . Danenas和g . Garsva”,选择基于支持向量机的分类器对于信用风险领域,“专家系统与应用程序,42卷,不。6,3194 - 3204年,2015页。视图:出版商的网站|谷歌学术搜索
  53. f . j .许m . y . Chen和y . c .陈“信用评级的类似人类的智能仿生计算方法预测,“Neurocomputing卷。279年,11到18门,2018页。视图:出版商的网站|谷歌学术搜索
  54. s . Jadhav h .他和k·詹金斯,“封装信息增益定向遗传算法特征选择信用评级,”应用软计算卷,69年,第553 - 541页,2018年。视图:出版商的网站|谷歌学术搜索
  55. z d . Wang, r·白毛和y,”一个混合系统,过滤方法和多种群遗传算法的特征选择信用得分,”计算和应用数学杂志》上卷,329年,第321 - 307页,2018年。视图:出版商的网站|谷歌学术搜索
  56. l .周k . k .赖,l . Yu”最小二乘支持向量机整体模型的信用得分,”专家系统与应用程序,37卷,不。1,第133 - 127页,2010。视图:出版商的网站|谷歌学术搜索
  57. A . Ghodselahi”混合支持向量机整体模型的信用得分,”国际期刊的计算机应用程序,17卷,不。5,页1 - 5,2011。视图:出版商的网站|谷歌学术搜索
  58. l . Yu r, l . Tang和r·陈,“一个DBN-based重采样信贷支持向量机集成学习范式与不平衡数据分类,“应用软计算卷,69年,第202 - 192页,2018年。视图:出版商的网站|谷歌学术搜索
  59. y, b·达·c . Liu和f·谢,“一种新型异构合奏基于bstacking信用评分模型的方法,”专家系统与应用程序卷,93年,第199 - 182页,2018年。视图:出版商的网站|谷歌学术搜索
  60. v . s .德赛,d·g·康威j . n .骗子和g . a . Overstreet“信用评分模型在信用社环境中使用神经网络和遗传算法,”IMA管理数学杂志》上,8卷,不。4、323 - 346年,1997页。视图:出版商的网站|谷歌学术搜索
  61. c。Ong j j。黄,G.-H。Tzeng”,构建信用评分模型利用遗传规划,“专家系统与应用程序卷,29号1,41-47,2005页。视图:出版商的网站|谷歌学术搜索
  62. s·m·芬利使用遗传算法开发评分模型的替代措施的性能施普林格,兰开斯特英格兰,英国,2006年。视图:出版商的网站
  63. 黄林w . Cai, x, x, h .钟”个人信用评分的遗传算法模型,”《计算智能和软件工程国际会议(CiSE),页1 - 4,IEEE 2009。视图:谷歌学术搜索
  64. 黄j·j·g·h·Tzeng, c . s . Ong”两级遗传规划(2 sgp)的信用评分模型,”应用数学和计算,卷174,不。2、1039 - 1053年,2006页。视图:出版商的网站|谷歌学术搜索|MathSciNet
  65. h·a·Abdou“遗传编程信用评分:埃及公共部门银行的情况下,“专家系统与应用程序,36卷,不。9日,第11417 - 11402页,2009年。视图:出版商的网站|谷歌学术搜索
  66. g .董、k . k .赖和l .周“模拟退火规则提取算法为基础的信用评分问题,”学报》国际联合会议上计算科学和优化(方案)IEEE,卷2,页22日——26日,2009年。视图:谷歌学术搜索
  67. d . Martens t . Van Gestel m . De支持者,r . Haesen j . Vanthienen和b . Baesens“信用评级预测使用蚁群优化,”运筹学学会》杂志上,卷61,不。4、561 - 573年,2010页。视图:出版商的网站|谷歌学术搜索
  68. X.-S。杨,s . Deb, m . Karamanoglu, x,他“布谷鸟搜索业务优化应用程序,”美国国家会议上计算和通信系统(可),页1 - 5,IEEE 2012。视图:谷歌学术搜索
  69. j . Uthayakumar和t . Vengattaraman基于群体智慧的分类规则归纳(CRI)框架,定性和定量的方法:一个应用程序的破产预测和信用风险分析,“沙特国王大学-计算机和信息科学杂志》上,2017年。视图:谷歌学术搜索
  70. 江m . f .霁,r·李”的应用研究信用评分模型基于SA-GA算法结合,”第四届国际会议在商业智能和诉讼金融工程(BIFE),第494 - 491页,2011年。视图:谷歌学术搜索
  71. r . Aliehyaei s汗,“蚁群优化,遗传编程和信用评分:混合方法比较研究,”学报》第八届国际会议软件,知识,信息管理和应用程序(SKIMA),页1 - 5,IEEE 2014。视图:谷歌学术搜索
  72. t·c·福格蒂和n . s . Ireson”演进的贝叶斯分类器对信贷规划——比较与其他机器学习方法,“IMA管理数学杂志》上,5卷,不。1,第75 - 63页,1993。视图:出版商的网站|谷歌学术搜索
  73. d·j·n·m·亚当斯,手”定义属性记分卡建设信用得分,”应用统计学杂志》,27卷,不。5,527 - 540年,2000页。视图:出版商的网站|谷歌学术搜索|MathSciNet
  74. z Drezner、g . a . Marcoulides和m . h . Stohs”金融应用禁忌搜索变量的选择模型,”应用数学和决策科学杂志》上,5卷,不。4、215 - 234年,2002页。视图:谷歌学术搜索
  75. e·拉赛尔达,a·c·卡瓦略a·p·布拉加和t . b . Ludermir“进化的径向基函数对信用评估,”应用智能,22卷,不。3、167 - 181年,2005页。视图:出版商的网站|谷歌学术搜索
  76. 美国的。刘、王问:和美国Lv,”遗传规划在信用评分中的应用”中国控制与决策会议学报》(CCDC)IEEE,页1106 - 1110年,中国,2008。视图:谷歌学术搜索
  77. s . s . Wang阴,m .江”混合神经网络基于GA-BP个人信用评分,”第四届国际会议上自然学报》计算(ICNC),3卷,第214 - 209页,IEEE 2008。视图:谷歌学术搜索
  78. d . Zhang, s . c .梁和z,“一个决策树评分模型基于遗传算法和k - means算法,”学报》第三届国际会议上收敛和混合信息技术(ICCIT),1卷,第1047 - 1043页,IEEE 2008。视图:谷歌学术搜索
  79. j .咦,“信用评分模型基于决策树和模拟退火算法,”《世界大会在计算机科学和信息工程(WRI),4卷,页在18到22岁,IEEE 2009。视图:出版商的网站|谷歌学术搜索
  80. y Marinakis, m . Marinaki m . Doumpos, c . Zopounidis“蚁群和粒子群优化金融分类问题,“专家系统与应用程序,36卷,不。7,10604 - 10611年,2009页。视图:出版商的网站|谷歌学术搜索
  81. m .Šušteršičd . Mramor和j·朱潘“消费信贷评分模型与有限的数据,”专家系统与应用程序,36卷,不。3、4736 - 4744年,2009页。视图:出版商的网站|谷歌学术搜索
  82. m . Marinaki y Marinakis, c . Zopounidis“蜜蜂交配优化算法对金融分类问题,“应用软计算,10卷,不。3、806 - 812年,2010页。视图:出版商的网站|谷歌学术搜索
  83. 研究所。黄,张炳扬。吴,“客户信用质量评估使用数据挖掘方法对银行业来说,“非洲商业管理杂志》上,5卷,不。11日,第4445 - 4438页,2011年。视图:出版商的网站|谷歌学术搜索
  84. a和a . m . b .科雷亚冈萨雷斯,“进化算法选择MLP神经网络的体系结构:信用评分情况,”学报》第11届IEEE国际会议数据挖掘研讨会(ICDMW)IEEE,页725 - 732年,2011年。视图:谷歌学术搜索
  85. s . Oreski d Oreski, g . Oreski”混合动力系统与遗传算法和人工神经网络及其应用零售信贷风险评估,“专家系统与应用程序,39卷,不。16,12605 - 12617年,2012页。视图:出版商的网站|谷歌学术搜索
  86. 美国Oreski和g . Oreski遗传算法的启发式特征选择在信用风险评估中,“专家系统与应用程序第41卷。。4、2052 - 2064年,2014页。视图:出版商的网站|谷歌学术搜索
  87. j·王,郭k和s . Wang“粗糙集和基于禁忌搜索的特征选择信用得分,”Procedia计算机科学,1卷,不。1,第2432 - 2425页,2010。视图:出版商的网站|谷歌学术搜索
  88. j . Wang联合。Hedar、王s和j .马”,基于粗糙集和分散搜索metaheuristic的特征选择信用得分,”专家系统与应用程序,39卷,不。6,6123 - 6128年,2012页。视图:出版商的网站|谷歌学术搜索
  89. b . Waad b·m·拉什德和l·穆罕默德,“一个新的特征选择技术应用到信用评分数据使用排名聚合方法基于:优化,遗传算法和相似性,”知识发现过程和方法来提高组织绩效k . Osei-Bryson和c·巴克利,Eds。,pp. 347–376, CRC Press, Boca Raton, Fla, USA, 2014.视图:谷歌学术搜索
  90. 诉Krishnaveni k . g . Santhiya m·p·拉梅什和m . s . Jaganathan“信用评分预测模型基于和声搜索基于1-NN分类器特征选择方法,”国际发展研究期刊》的研究在科学和工程,7卷,不。2、468 - 476年,2018页。视图:谷歌学术搜索
  91. v . n . Vapnik统计学习理论,威利-跨学科,纽约,纽约,美国,1998年。视图:MathSciNet
  92. 问:顾和j .汉”集群支持向量机”,人工智能和统计,第315 - 307页,2013年。视图:谷歌学术搜索
  93. d . Martens j . Huysmans r . Setiono j . Vanthienen和b . Baesens”规则提取支持向量机:问题的概述和应用信用得分,”从支持向量机中提取规则卷,80年,页33 - 63,施普林格,柏林,德国海德堡2008。视图:谷歌学术搜索
  94. m . LichmanUCI机器学习库信息与计算机科学学院,加州大学欧文分校,美国、http://archive.ics.uci.edu/ml/

版权©2019 r . y .吴作栋和l·s·李。这是一个开放的分布式下文章知识共享归属许可,它允许无限制的使用、分配和复制在任何媒介,提供最初的工作是正确引用。


更多相关文章

PDF 下载引用 引用
下载其他格式更多的
订单打印副本订单
的观点5210年
下载1948年
引用

相关文章