文摘

近年来,供应链金融(SCF)是利用来解决融资困难的中小企业(中小企业)。中小企业信贷风险评估是一个自洽场系统的关键部分。中小企业信贷风险的扩散可能会导致严重的后果,导致整个供应链金融系统不稳定,没有安全感。与传统的信用风险评估模型相比,供应链关系,中小企业的信贷条件,和核心企业都应该被认为是在自洽场对中小企业信贷风险。传统方法将所有指标从不同的指标体系。他们不能给出一个定量的结果在这些指数系统是如何工作的。此外,传统的信用风险评估模型主要是依靠注释中小企业数据的数量。然而,这是难以置信的提前积累足够的中小企业信贷风险。在本文中,我们提出一种自适应异构多视图图学习法来解决小样本问题对中小企业的信贷风险预测。三个图是由利用供应链操作的指标,中小企业的财务指标,分别和非金融指示器。 All the graphs are integrated in an adaptive manner, providing a quantitative explanation on how the three parts cooperate. The experimental analysis shows that the proposed method has good performance for determining whether SME is risky or nonrisky in SCF. From the perspective of SCF, SME financing ability is still the main factor to determine the credit risk of SME.

1。介绍

由于COVID-19大流行,全球产业链和供应链已经遭受了一次严重的挫折。产业链在全球正经历着前所未有的危机,几乎很少遇到的世纪。相应的调整供应链和产业链对中小企业有很大的影响(中小企业)。中小企业所面临的生存困境也出现在中国。根据国家统计局的数据,中国的中小企业在国民经济中扮演了一个至关重要的角色,,占企业总数的99%以上,80%以上采用人在工业企业中,超过70%的国家技术创新的结果,总GDP的60%以上,超过50%的国家总税收收入。然而,中小企业所面临的融资困难一直为他们的发展和生存的关键问题。

供应链金融(SCF)是一系列的融资模式旨在解决中小企业融资问题1)于一体的资本流入供应链管理。以核心企业为中心和真实的贸易背景,自洽场将单个企业的不可控风险转化为整个供应链的风险可控资本企业通过有效的控制流,信息流和物流。它有效地构建一个良性的工业生态学的银行、核心企业和中小企业,促进资本和产业的互动发展。在自洽场,信用风险被认为是核心问题之一,必须认真考虑,尤其是中小企业的上游或下游的核心企业。与银行和核心企业相比,中小企业更容易遭遇信用风险。自洽场系统,一旦发生信用风险,连锁企业的信用状况将被放大,甚至蔓延到整个供应链由于供应链的连接(2- - - - - -4]。然而,信用风险是不可避免的。因此,有必要建立中小企业的信用风险评估模型,有效地控制风险,形成一个稳定的自洽场系统,在建设和运营过程。

中小企业的信用风险评估体系自洽场环境下一直是学术界和金融界的焦点(5]。核心企业和中小企业之间的深度集成自洽场能反映中小企业的未来的资本能力和现金流。这个特性提供了一个坚实的数据基础信用风险预测的自洽场。学术界从不同的角度构建信用风险评估指标体系。基于不同因素构建信用风险评估系统是其中的一个分支。Lekkakos等人考虑核心企业资质为中小企业信用评估的一个主要因素(6]。伍德克发现,买方影响供应链金融(7]。这些文献调查之间的关系自洽场理论和中小企业信用风险。然而,一些指标在实践中很难获得和定量分析(8]。

另一个分支建立中小企业的信用风险评估体系从不同的角度自洽场。奥尔特曼和萨巴托(5)设计了一个中小企业信用风险评价体系,包括五个财务指标如流动性、盈利、杠杆、覆盖率和业务活动比率。然而,只有选择财务指标为主要功能,为中小企业信贷风险评估和其他非金融指标忽视了。Yurdakul [9)结合金融和非金融指标评价中小企业信用风险在土耳其,包括创收能力,成本控制,运营效率和盈利能力,短期流动性、资本结构,和其他偿债能力指标。为了综合考虑的因素在自洽场中小企业信贷风险评估,也参与了很多其他的指标体系。从供应链的角度,Rostamzadeh et al。10)提出考虑操作和主要政策风险的考虑。谅解备忘录等。11从四个方面构建了评价体系:工业状况、操作状况、资产状况、和信用记录。在这些系统中,可能有重叠或相互矛盾的现象在信用风险评估指标选择从不同的观点。应该强调,这个问题是很难解决的常规预测模型。此外,大多数现有的信贷风险评估系统重点选择单一的区别的指标(例如,三级指标),不考虑整体歧视的角度(例如,一个或两级指标)。他们无法给出定量结果的关系不同的观点。

最近,机器学习方法已经广泛应用替代传统的定性分析和统计分析方法在信用风险评估领域12,13]。逻辑回归(LR)的基本方法来评估信用风险的简单性和可用性(14]。然而,这不足以描述复杂的信贷风险状况。预测精度有待进一步提高。支持向量机(15)(支持向量机)是另一种方法来解决信用风险问题。已经证明,基于svm的信用风险评估模型是有效的和有利的LR模型基于主成分分析(PCA) (16]。Danenas和Garsva确定风险企业在不平衡数据集的基于线性支持向量机和粒子群优化(17]。的作者(18)应用遗传优化的非线性支持向量机分类器对信贷风险评估。人工神经网络(ANN)也吸引了广泛的关注信用风险预测。Adnan全面调查不同监督神经模型和信用风险评估(学习计划19]。深度信念网(DBN),作为一种特殊的范式的安,被发现在cd产生最佳的性能数据集(20.]。此外,树形结构(21和图结构22)方法也被证明是有效的信用风险评估。

各种方法已经显示出有利的信用风险评估。然而,中小企业的信用风险评估在自洽场环境中,我们需要构建模型从供应链的角度,而不是只评估偿付能力(23]。中小企业的资金和信贷条件,核心企业和供应链关系涉及机器学习算法。这些信息从不同的观点需要正常组织。大多数的方法把这些指标在一起评估中小企业供应链金融信用风险。通过连接指标,Zhang et al。23和徐,他24应用支持向量机和限制玻耳兹曼机(元),分别进行评估。从功能的角度融合,这些早期的融合方法以同样的方式对待所有功能,这会削弱内部不同观点之间的联系。其他文献集合多个机器学习模型进行综合决定。Zhang et al。25]认为龙头企业的信用状况和发达的关系在供应链通过将支持向量机和英国石油公司。朱et al。26)提出了一个两阶段混合模型通过整合的结果LR和安来提高单一模型的准确性。然而,上面提到的所有方法主要是依靠带注释的中小企业数据紧密。一旦注释样本的数量减少,该算法性能会迅速下降。然而,似乎难以置信的积累足够的中小企业信贷风险的现实。与上述方法相比,基于学习可以使用少量的带注释的数据建模样本的关系,已广泛应用于许多其他领域(27- - - - - -29日]。很难构建一个图形覆盖当地繁殖特性不同的视图。因此,如何将多视图异构特性集成到图学习是值得玩味。

在本文中,我们提出一个异构多视图图学习法对中小企业的信用风险预测。信贷风险或nonrisky中小企业被扩散过程在融合多视图集合管。考虑不同的观点有不同影响信用风险识别,我们学习的观点同时重量和信用风险评分。我们工作的主要贡献总结如下:(1)解决问题缺乏足够的注释数据,我们提出一个多视图基于semisupervised学习方法,建模样本之间的本地歧管现金流量表对中小企业信贷风险评估。(2)提出的多视图基于学习方法集成多视图功能全面。中小企业信用风险评分是通过学习自动complementariness不同的视图,可以改善可解释性。(3)综合实验是进行实证分析提出了中小企业信贷风险的自洽场方法。收集的数据集上的实验结果证明了该方法的有效性。

本文的其余部分组织如下。节2和部分3,我们将讨论单一图学习和多视图图学习。部分4描述了数据和变量。部分5展示了实验结果。最后一部分是结论。

2。单一的基于分类学习

基于学习(30.,31日)引起了极大兴趣分类任务由于其各领域的有效性和灵活性。图表描述了成对关系基于给定的数据,顶点在哪里标记和未标记样本和边表示顶点之间的关系。一般来说,单一的基于学习可以制定如下。

假设有 数据点 在数据集。每个样本 可以表示为一个吗 - - - - - -维特征向量。不失一般性,我们假设第一 样品标签数据集 由专家提前, 是标签的类。我们的目标是分配最优的标签 为每个休息 无标号数据点通过图学习。

被定义为一个图 是点的集合,其中每个样本吗 是一个顶点 ,包括标记和未标记样本。 边的集合,在哪里 连接相邻的顶点 称为关联矩阵,在哪里 的重量是 ,表示顶点的力量 的价值 可以是离散的(例如, )或连续的(例如,0.54)。

一般来说,基于分类的任务是制定一个正则化框架: 在哪里 是要学习相关性得分向量域上定义的 , 是一个经验损失函数, 是一个规范的术语 , 是一个非负参数。

实现了图上的平滑假设通过考虑数据点在同一箱可能会共享相同的标签。

图上的规范定义如下: 在哪里 是一个对角矩阵给出了吗 ,也就是说, 的总和吗 - - - - - -th排

,和标准化图拉普拉斯算子表示如下: 在这里 对角矩阵是一个单位。最后,调整可以改写如下:

经验损失函数 顶点进行标签的一致性通过强制分配标签接近最初的标签。 在哪里 是初始标签向量。三个可能的值 可以分配给 : 如果顶点 是积极的样本, 如果它是负样本, 如果它是无标号。发现最小化的封闭解

在获得 ,数据点 可以根据其分类标志,即。积极的,如果 和消极的。此外,数据点的相对价值 排名也可以根据学到了什么

3所示。多视图基于学习分类

单图学习改善了分类任务的有效途径,尤其是当标签样本是有限的。然而,中小企业信用风险进行综合评价,信息应该考虑许多不同的方面,如中小企业的资金和信贷条件,核心企业,供应链操作。这些互补的知识包含在多个视图,全面代表中小企业的信用状况。在这种情况下,多个视图特性可以用来衡量顶点之间的亲和力。

假设我们有 的特性集。因此, 可以构造图,表示 方程的正则化框架(2)可以扩展到处理多视图功能结合每个图的加权系数。然后,编写框架如下:

是相关系数的重要性 - - - - - -th视图,限制 图的关联矩阵和对角矩阵是吗 ,分别。的价值 可以提前设置为先验知识由领域专家根据不同观点的重要性。然后,方程的解决方案(1)可以推导如下: 在哪里 是归一化图拉普拉斯算子的 方程(8)学习融合图,几个标准化图拉普拉斯算子的组合系数 然而,有很多混乱的观点是更重要的一个分类的任务。随后,在大多数情况下,这不是一个简单的方法来设置值 提前。它需要吸收的影响 到上面的学习框架。为了避免琐碎的解决方案,对权重系数通过改变放松 在方程(上执行7)。 在哪里 是hyperparameter比 是用来避免只有最顺利图发挥关键作用( ),而从其他视图无效图( )。最后,成本函数的多视图基于学习新配方如下:

方程(10)认为,数据在本地歧管空间为不同观点,分别。结合多个特性可以通过加权图联盟所产生的不同的观点。每个图表类似于弱分类器产生一个线索,他们联合起来,组成强分类器。

相关性值f美元和权重系数 通过最小化方程(10)。

学习的优化策略 同时通过修复和优化为每个迭代。我们首先解决 和优化

目标函数的偏导数与尊重

通过设置 ,我们有

然后,我们修复 优化 目标函数的偏导数与尊重

同样,我们可以获得 拉格朗日乘数法,因为

4所示。数据和变量

4.1。数据

验证多视图的有效性基于学习方法预测中小企业的信用风险在自洽场,我们构造一个合适的中国中小企业的数据库。自洽场是一个新的融资和发展分支。由于理论研究的缺陷,发展中国的自洽场不到令人满意。直到最近几年,自洽场业务逐渐走上正轨,使支持企业和数据信息披露相对完美。然而,它仍然是很难收集自洽场的完整数据集,尤其是非上市公司。因此,上市公司选择作为主要数据源。

由于巨大的差异在不同行业的因素和特点,它可能导致的衰退预测模型通过使用整个行业数据。制造业是自洽场的关键字段,它的研究引起了广泛的关注。然而,传统的工业产品(如汽车工业)是如此复杂,从供应商向经销商已长链,全面收集自洽场数据是不可能的。与传统的制造业相比,手机制造业供应链数据规模适中(例如,移动电话有超过80部分,而汽车有成千上万的部分)。上游供应商之间的劳动分工,中游制造商和下游分销商在手机制造业相对明确。此外,手机时间敏感,这就需要企业密切合作。考虑所有这些因素,我们选择104上市中小企业风数据集的数据。后删除无效数据,最终数据集包含924个样本在此期间(2011 - 2019)。

一些文献[26,32)确定信用风险通过考虑企业是否特殊待遇(ST)。他们认为,圣, 圣公司在金融危机33]。这些公司可能比一般的有较高的信用风险。连续两年圣公司遭受了损失。然而,它不能反映信用风险在第一年当公司遭受了损失。z分数模型(34)采用定义信用风险,这是广泛应用于企业财务健康测量。最后,样本的z分数< 1.8,是风险企业在实验中,而其余样品nonrisk类型。总的来说,265年的数据集由高风险企业和659 nonrisky企业。在实验设置,40美元的样品被当作已知风险企业用1和40被称为nonrisky企业用+ 1。其余的未知样本(用0)需要验证的多视图基于学习。样本分布表1

4.2。独立变量

符合被广泛接受的5 c原则,信用风险评估系统是由三个视图,比如供应链操作,中小企业金融指标,非金融类指标。为了便于观察,独立变量的描述供应链操作,中小企业金融指标,非金融指标如表所示2- - - - - -4,分别。

4.3。评估

评估提议的方法的有效性,平均精度,采用第一类误差和II型错误的实验。这些评估标准定义如下: 在这里 是在测试样本集的总数, 分别正负样本的数量吗 , 所有正确预测样品的数量, 是错误地预测正负样本。

平均精度是用来评估模型的整体性能。越高越好。有时,正负样本之间的不平衡可能领导一个不准确的评估。I型和II型错误也采用补充评估模型的性能。越低越好。错误描述阳性样本的准确性。中小企业信贷风险评估、II型误差高比率将导致损失的潜在客户,而错误地分类nonrisky企业风险。II型误差提出了负样本的准确性。错误地分类风险企业nonrisky将导致高比率的II型错误,这可能会暴露大风险对银行、核心企业,中小企业在现金流量表。为了建立一个稳定的自洽场系统,II型误差比其他两个更重要的标准。

4.4。实验设置

实验在计算机上执行的Intel Xeon 8 (R) 2.13 GHz处理器8 GB内存和64位Windows10系统。进行的实验是基于Python, NumPy, Scikit-learn。首先是规范化的数据如下: 在哪里 规范化数据, 源数据, 的平均值和标准偏差 然后,主成分分析(PCA)上执行 降维。保留90%的能量,准备LR 18-dimensional功能,支持向量机,和GL,尤其是M-GL PCA分别在每个视图上执行。GL和M-GL顶点 与最近的5个邻国和欧几里得距离是用来测量。的参数 在方程(6)和方程(8)被设置为0.01 在方程(8)被设置为1.9。最初的重量 将同样的三个视图。

5。结果与讨论

5.1。实验设置

在本部分中,我们比较提出了中小企业信贷风险评估图多视图学习自洽场与几个相关的工作。(1)LR。逻辑回归(35)从所有三个视图上执行处理功能。(2)支持向量机。支持向量机进行加工特性的三个观点。(3)GL。单图学习是由LR和SVM使用相同的特性。只有一个图是由使用加工特性。(4)M-GL。提出的多视图基于学习方法单独集成多视图功能,可自适应地分配不同的权重的三个观点。三个图是由使用相应的加工特性三个视图。

数据1- - - - - -3描述四个模型的结果当正面和负面的训练样本的数量是40,分别。在检查结果数据1- - - - - -3最好,我们注意到该M-GL执行在所有三个评价现金流量表中小企业信贷风险评估标准。它演示了该M-GL的优越性。从功能的角度融合,上面列出的所有方法集成的功能三个观点。然而,M-GL将这些特性视为异质元素,这些元素分配不同的权重每个视图的信用风险评估。其他作品将作为一个整体的三个视图。他们不能区分哪个观点是现金流量表的中小企业信贷风险评估更有价值。虽然有些工作(例如,LR)可以获得最重要的独立变量,模型过于依赖这些特性,主要数据敏感性高。相反,图论方法(GL和M-GL)利用样本之间的平滑。损失或不准确的一个特性几乎没有影响的评估模型。数据收集过程中,并不是所有的指标可以很容易地获得每一个中小企业。

噪声电阻是一个重要的特征在实际金融应用程序。在接下来的小节中,我们将探讨不同的影响为中小企业信贷风险评估法现金流量表财务视图。

5.2。不同的金融观点的影响

对传统中小企业信贷风险评估方法,很难进行定量调查对哪一个是最翔实的风险评估。他们要么集中的功能作为一个整体或治疗单独每一个指标。一些工作(32)给歧视每一指标分析。然而,单一指标不能提供证据的有效性保证相应的视图的整体有效性。拟议中的M-GL构造三个单独的子图通过供应链操作的特点,中小企业金融指标,非金融类指标。通过小说图建设和优化方法,M-GL可以自适应地区别不同的观点的重要性。好处这种中小企业信用风险评估的适用于构建安全的和稳定的自洽场系统。例如,中小企业可以提高他们的信贷人为篡改某些财务数据欺骗银行或核心企业。它是整个自洽场系统的极大的危险。篡改少量的数据不会影响M-GL提出风险评估的结果很明显,这是我们的方法的优势之一。表5给出了权重系数 为每个视图。 , , 学会了权重系数为供应链操作,中小企业的财务指标,分别和非金融指示器。从表5,我们可以看到,中小企业金融指标的主要因素是现金流量表中小企业信贷风险评估。然而,这并不意味着供应链关系是无用的。供应链关系的视图也是一个有效的补充,也是信息化评估现金流量表的中小企业信贷风险评估。相比之下,非金融指标之间的最小值三个观点。部分原因是我们研究移动制造业供应链数据,不同行业之间的差异影响因素在数据收集阶段受到了削弱。

5.3。对标签样本的数量的影响

提出M-GL是基于转换的分类。转换方法的一个优势是,它可以用更少的标记样本做出更好的预测。在本部分中,我们研究不同数量的初始标记样本的性能。图4报告的平均精度和数据56报告I型和II型错误的SVM和M-GL不同数量的正负样本。M-GL标签可以被看作是扩散过程通过三个子图。良好的图形方法需要标签传播到未标记样本。可以看出M-GL优于支持向量机在整个实验。尤其是当标签样本的数量是10,M-GL的优点是更明显比支持向量机三个评价标准。在实际金融预测,标签样本总是不方便,特别是高风险的中小企业。它有一个很大的影响在传统方法标记样本是不充分的。然而,我们可以获得大量的无标号中小企业信息。M-GL模型的关系这几个标签样本和大量的未标记样本通过品牌扩散过程光滑流形上的中小企业信贷风险预测。利用大量的未标记样本来提高信用风险预测的准确性也是一个M-GL的优势。 In the next subsection, we will investigate the influence of smoothness on the classifier’s performances.

5.4。对最近的邻居的数量的影响

在我们的实验中,最近的邻居的数量 将5图施工。在标签扩散,我们需要一个平滑的图像。一个合适的值 将导致一个稳定和优秀的性能。大或小 会降低性能。当 很小,不能捕获样本之间的关系。相反,当 很大,不匹配顶点可能带进图。这就解释了趋势曲线如图7- - - - - -9。后 达到一个适当的值,表演开始下降。

由于图像的平滑度,我们可以通过标签扩散得到可以接受的结果。当我们需要从一些中小企业选择合作伙伴,M-GL能给一个合适的候选企业之间的信用等级。

6。结论

本文的主要目的是评估中小企业信贷风险自洽场的多视图基于学习。信用风险评价体系是由三个方面:供应链操作,中小企业金融指标,非金融类指标。不同于传统的方法,该方法把单独的三个观点,旨在给出一个量化比较的观点是更重要的信用风险评估。本文还提供了一个详细的分析的影响不同金融观点在自洽场中小企业信用风险评估。总之,M-GL显示其有效性评估中小企业信贷风险自洽场。尤其是M-GL具有良好的性能在处理一些标签样本。此外,中小企业是最关键的财务指标视图现金流量表中小企业信贷风险评估。供应链操作是一个辅助视图,这也是一个有益的观点来提高性能的评估。此外,M-GL不仅使用特性的三个观点还利用样本之间的关系。因此,提出了中小企业信用风险评估是M-GL健壮的、适用于防止信用欺诈的篡改数据。 When the bank or core enterprise needs to pick a partner, M-GL could give a relative sort order from the candidate enterprises.

机器学习方法显示其有效性在信用风险评估中。然而,中小企业信用风险评估在自洽场仍是一个真正的挑战。数据收集和注释是一个天然屏障应用的新的机器学习方法在自洽场中小企业信贷风险评估,如深度学习的方法。此外,手机制造业供应链数据利用本文产业之间的差异被忽视的地方。在未来,我们将调查中小企业信贷风险评估在自洽场大型数据集进行综合分析。

数据可用性

使用的数据来支持本研究的发现可以从相应的作者。

的利益冲突

作者宣称没有利益冲突。

确认

这项工作得到了中央大学(没有基础研究基金。18 cx04007b)、青岛(没有社会科学规划项目。QDSKL2001044),山东省社会科学规划研究项目(没有。18 cjjj13)。