文摘

在中国农村信用体系,信贷约束问题突出。由于信贷市场不完善,大量农村居民的信贷约束。农村信贷约束是制约中国农村经济发展的一个严重的问题。旨在解决农村信贷约束,本文优化分析农村信用体系和贷款决策。更合理地评价客户的借贷能力,基于农民的信用风险评估数据在大数据平台。堆叠提高去噪autoencoder网络采用深度学习框架来提高信用评估的准确性。为改善农村信用贷款的决策能力的系统,贷款优化策略基于多目标粒子群优化算法。仿真结果表明,优化能力,速度和稳定性的算法取得了良好的效果在处理贷款组合决策问题。

1。介绍

在市场经济时期,农民消费货币化、社会化在很大程度上。一方面,农民所需的产品和服务不再是自给自足。像城市居民一样,它使用货币作为交换媒介,需要产品。另一方面,农民收入水平低,收入和支出是非常不准确的。就经常会有一种不平衡农民收入和消费支出,所以形成的需要生产和消费融资退出。中国农村经济发展面临的一个严重问题是农村信贷约束(1]。由于信贷市场不完善,大量农村居民的信贷约束。农民获得贷款的可能性很低,这也成为遏制农民消费的重要原因之一(2]。

中国农村居民有很强的信贷约束(3]。2007年,中国人民银行和国家统计局进行了一个特殊的调查在10个省份20000农民。结果表明,农民贷款需求的46%,但只有约26%的农民贷款需求可以通过正规金融机构获得贷款。据调查,农村金融服务机构的网络覆盖是不够的。到2009年6月底,中国有2945个乡镇没有任何金融机构。有超过8000个乡、镇只有一个银行网络。在所有乡长、镇长在中国,金融服务占1/3的严重短缺。

引起的农村信贷约束和四个原因如下:(1)在农村金融体系存在缺陷。农业发展银行有一个业务,是有限的粮食和棉花的发行贷款。同时,大多数银行的业务范围还没有涉及到农村地区。(2)农村社会信用体系建设滞后,信息不对称。为什么正规金融机构不愿意贷款给农民还包括金融机构无法理解农村借款人的准确信息。例如,农民的信用水平和还款能力,其贷款的实际目的是什么,会有什么风险,等等。这使得农村居民金融机构不愿发放贷款。(3)农村金融机构通常要求抵押担保。然而,主要属性属于农村居民土地只有使用权和房地产没有流动性。这些属性不能被用作银行贷款抵押品在现有的金融监管。 Other properties owned by farmers are mainly livestock and means of production. These can not be used as collateral for loans. (4) The credit products issued by financial institutions are not suitable for the consumption needs of rural residents. The important characteristics of Chinese rural residents’ loan behavior are the huge number of farmers, high dispersion, and small loan amount. These require financial institutions to have very high operation efficiency in order to meet the needs of rural loan business [4]。本文的分析侧重于第二个和第四个点,研究提高信用评估的准确性和优化贷款计划。

商业银行的目的是实现利润最大化和最小化风险。它遵循效率原则、安全性和流动性。贷款组合风险定量决策是一个过程从许多贷款对象选择适当结合贷款对象的前提下,全面考虑贷款收入和风险。文献[5)建立了一个贷款组合优化决策模型基于最大单位风险回报的原则。上面的组合优化问题,属于NP(不确定性多项式)困难的问题6]。问题的求解过程是简单和容易的规模很小,但是问题的规模的增加,计算量成倍增加。因此,有必要设计一个更好的算法,考虑解决方案的质量和运行时间。

粒子群优化(PSO)的灵感来源于鸟类群体觅食行为的研究成果(7,8]。粒子群优化算法具有快速收敛的优点,操作简单,容易实现。算法吸引了学者们的广泛关注领域的进化计算(9),计算机科学(10),和管理科学11和取得了很多研究成果12]。这些研究成果大部分是获得各种多维连续空间优化问题的研究,但是很少有应用研究结果在离散优化问题(13]。

下面列出了本文的创新和贡献:(1)为了评估农民借贷能力更合理,深度学习框架是用来评估农民的个人信用。由于存在银行的高维数据的大数据平台,堆叠去噪autoencoder网络首先用于压缩特性和提取(2)不同于之前的银行信贷评估,本文以银行大数据风险评估的数据源。它使信用评估的特点,提高评估的准确性(3)为了改善农村信用贷款的决策能力的系统,一个自适应分解多目标粒子群优化算法是本文设计的。然后,通过计算最优解和会员信息的子空间,选择适当的解决方案在外部文件,和一个外部文件更新策略基于分解方法的设计。最后,以提高算法的收敛性平衡算法的勘探和开发能力

本文的结构如下。节中描述的相关理论2。部分3本文侧重于算法模型。部分4实验和分析。部分5是结论。

2.1。选择风险评估功能

银行个人信用风险评估使用的数据主要来自于客户数据的收集,如中央银行的信用调查数据,基本的个人信息、财务状况、信用记录、债务(14]。和银行的各种业务的扩张,特别是内部客户的交叉销售、客户信息不断丰富。银行客户不再属于一个业务范畴,和客户留下的脚印在多个业务领域的银行将成为个人信用风险评估的数据源。这些数据也成为必要的补充个人信用的肖像。

基于传统的评价功能,即信用卡贷款和偿还贷款数据,依赖于商业银行的大数据平台。客户跨业务信息添加到评价体系整合这两部分的数据,以建立一个完整的银行个人信用的肖像。图1显示数据拼接和集成的逻辑表示。

2.2。多目标优化问题

为一个多目标优化问题(拖)15),其目标函数可以被描述为

在哪里 是一个 - - - - - -维决策变量。 目标函数。 是目标函数的数量。

对一组决策变量 ,假设要优化的问题最小化的目标价值。如果 小于或等于什么 对任何目标价值,至少有一个的目标 小于 ,然后 占主导地位

在哪里 如果 是显性的,然后 可以与之相比。否则, 不能相比。当一个解决方案并不是由任何解决方案,它被称为nondominated解决方案。所有nondominated解决方案最终获得通过该算法得到的最优解集的算法。

多目标粒子群优化算法使用一组随机分布的人群,引导人口搜索优化空间,通过选择合适的解决方案。多目标优化算法获得最优解集的拖把。在每次迭代中,粒子速度和位置更新公式

在哪里 是惯性权重。 正在学习的因素。 是随机值。 是粒子的个体最优位置 迭代。 是全局最优的位置 迭代。 迭代第i个粒子的位置 的速度吗 th粒子在迭代

3所示。多目标粒子群优化算法的应用程序

3.1。信用评估基于深度学习

堆叠autoencoder网络应用在本文中是一种特殊结构的深入学习。它主要应用于高维数据的降维,即压缩特性(16]。首先,浅构造神经网络的输入项,隐藏层和输出项,和隐藏层解决当输出项是最接近输入项。然后,隐藏层用作输入下一个肤浅的网络。重复上面的过程来解决新的隐藏层。最后,隐藏层是一层一层地堆放在栈的形式形成深层神经网络。

大数据样本噪声造成的数据偏差,错误,和失踪。为了提高autoencoder,的抗噪能力的去噪autoencoder (DAE)添加噪声原始数据来生成一个浅神经网络结构,然后压缩并提取其特征(17]。多维的算法具有良好的性能和高噪声的数据场景。首先,训练样本 受到一系列随机转换 ,和变量 腐蚀后获得。然后,重新输入 通过学习和培训的autoencoder吗

在神经网络中,采用梯度下降法迭代的解决方案,以便 是最接近原始数据 此时,相应的隐藏层 (或压缩功能层)

在哪里 相应的元素属于原始特征和重建功能,分别。 损失函数的均方误差或交叉熵。 是一个规范约束添加到防止过度拟合模型的过程中学习。

原始生成的随机变换去噪autoencoder网络只会增加一个小改变原始数据的特征。它不考虑噪声输入特性之间的相关性,这显然不足以改善模型的鲁棒性。在考虑到样本噪声的相关性的前提下,为了提高噪声发生的质量,其截断的形式来提高计算效率。

首先,通过分析输入特性之间的相关性,正定关联矩阵决定 对于任何 向量 和对角矩阵 ,方程(6)可以成立。

在哪里 是一个非零特征的相关矩阵 扩张可以被定义为相关矩阵的分解。

在哪里 归一化的特征值吗 因此,可以表示为随机变量

在哪里 表示随机变量的均值 将进行正常化以来第一次在计算过程中,它可以假定 是一个随机的数字。它遵循了标准正态分布, 在实践中,为了减少计算量,只有获得截断近似得到 术语( )。

项目 需要确保截断误差小于0.05。截断误差被定义为

堆叠去噪autoencoder (SDAE)网络是由单个autoencoder层叠层的层。具体来说,训练得到的中间隐层之前的autoencoder参与下autoencoder训练的输入。这个堆栈反过来形成深层神经网络结构,如图2

商业银行的大数据平台需要个人信用卡数据为主要数据构建个人信用的肖像。和个人信用肖像也将连接个人业务属性和交易数据。因为个人信息是分散在不同的数据源,它需要集成和拼接为了方便使用和上层业务逻辑的统一管理。与个人客户为粒度和信贷维度为出发点,拼接和集成其他的个人客户业务数据的大数据平台。最后,它可以形成一个完整的视图基于银行的个人信用的大数据。下面是一个正式的表达个人信用风险评估的整体算法。(1)数据预处理:第一,提取、集成、清洗和转换的原始数据预处理。特征向量 由传统的信用评估功能。个人客户的intrabank业务数据预处理形成特征向量 两个部分的功能融合形成的输入特性模型;也就是说, 作为模型的输入数据使用培训(2)模型训练:输入特性集构造基于大数据,和一种改进的SDAE网络构造(我)建立图层1网络

我们获得特性之间的相关矩阵

随机干扰的转换 通过进行分解得到输入词 后腐蚀。根据去噪autoencoder计算流程,第一个隐层 获得和变成第一个输入层。(2)结构层2层 网络

获得隐性特征之间的相关矩阵

以前的神经网络的隐层用作下一个神经网络的输入。

所有隐藏层 第二层后保留,构造成一个深层神经网络结构。(3)反向调优

支持向量机是用于最后的识别和分类。英国石油公司是重量用于反向优化网络参数 和偏见 ;也就是说,使用梯度下降法调整

3.2。基于多目标粒子群优化信贷决策

文本周围的多目标粒子群优化算法主要是改善外部文件更新策略和速度参数更新策略。外部文件更新策略提高了算法的空间搜索能力通过优化解决方案的空间分布信息。速度参数更新策略主要使用粒子的进化方向信息来实现参数的自适应调整和平衡算法的全局探索能力和局部开发能力。

3.2.1之上。空间分布信息的优化解决方案

给定一组均匀分布的方向向量, 目标域 均匀分解成 子空间 最优解的空间分布信息 是由其位置矢量和矢量方向之间的角度 的决定, 是最优解的位置向量

在哪里 是目标函数的数量。 是参考点在目标空间, 位置矢量满足下列条件。

如果矢量方向 满意 ,那么 th优化解决方案 属于子空间 决定的方向向量 在目标空间。

3.2.2。外部文件更新策略

为了确保算法的搜索能力的优化空间,外部文件更新策略基于最优解空间分布信息的外部文件。更新策略包括两个部分:子空间解集分配过程和子空间解集的选择过程。

之间的角度新生成的优化解决方案 和所有给定的方向向量计算。子空间的矢量方向与选择的最小夹角归因空间。家里空间分配的最优解。对于任何子空间 ,最优解集 如下:

在哪里 是其他方向向量, 为了避免在算法空间搜索能力差的问题,这在子空间算法筛选最优解集。的上限的数量为每个子空间优化解决方案 ,在哪里 定义如下:

在哪里 是给定外部文件的默认值。 是子空间的数量与当前最优解的迭代过程。当算法并不完全探索目标空间, 很小。在这个时候,更优化的解决方案需要保留的子空间,以确保该算法可以完全探索在目标空间。优化流程, 逐渐增加。这时,子空间需要保留最优解具有良好收敛性来保证算法的收敛性。

3.2.3。自适应飞行参数调整机制

增强粒子的探索,如果粒子 是由 ,的价值 需要降低。同时,的值 需要增加。为了提高粒子开发能力,如果粒子 占主导地位 ,的价值 需要增加。同时,较低的值 因此,为了适应粒子搜索的特点,一个飞行参数调整机制设计基于粒子进化方向的信息。自适应飞行参数 调整机制的粒子 如下:

在哪里 是勘探参数矩阵和开发参数矩阵的粒子 ,分别。

在哪里 是调优参数。

在哪里 粒子之间的欧几里得距离吗 和全球指导点 是所有粒子之间的距离的平均值和指导意义 当粒子 接近 , 价值很低。在这个时候,粒子可以深入发展 社区。当粒子 是远离 , 价值较高。在这个时候,粒子可以完全探索的优化空间 社区。勘探参数矩阵和开发参数矩阵将被更新粒子谐波参数的变化。粒子速度是有效地调整根据粒子的飞行特性。

3.2.4。算法的步骤

的计算流自适应分解多目标粒子群优化算法如下。

步骤1。随机初始化速度 ,位置 ,和惯性权重的粒子群中的每个粒子 和学习的因素 每个粒子的初始位置设置为当前的历史最优位置

步骤2。计算每个粒子的适应度值。优化解决方案的方向向量计算从方程(11)。优化解决方案之间的角度值和给定的方向向量计算从方程(13),确定归属区域的优化解决方案。

步骤3。更新政策根据外部文件。选择合适的子空间优化解决方案解集更新外部文件。

第四。任意选择优化的解决方案从外部文件作为gb的人口,和更新每个粒子的pb点。

顾不上。影响每个粒子的进化方向指导。进化计算谐波系数从方程(16)- (18)。粒子的飞行参数自适应调整方程(15)。

第六段。更新粒子的位置和速度根据方程(3)和(4)。

Step7。确定算法满足终止条件。如果是,则退出循环和输出最终的优化解集。否则,返回步骤2。

在实现过程中,外部文件更新策略基于空间分布信息的优化解决方案是用来确保算法的解集的分布。同时,结合粒子的进化方向信息自适应更新飞行参数,该算法可以获得最优解集分布和融合。

4所示。实验和分析

4.1。信用风险评估

本文的数据来自于大数据平台在中国的商业银行。为了得到更全面的用户画像,建模所需的数据是集中在个人信用卡数据。然后,拼接在银行客户的业务数据,包括存款、贷款、财务管理、保证,三方存款、基金、借记卡,电子银行交易。总共有540000个客户收集作为建模数据,其中包括521361默认的客户。

评价指标常用的机器学习分类任务是用来测量和评估方法,如召回、精度、准确性,马修斯相关系数(MCC) [18), - - - - - -分数,AUC-ROC [19]。由于DAE层堆叠的数量去噪autoencoder网络影响学习结果的模型,本文评估和验证模型与不同DAE层,结果如表所示1

1列出了不同的比较实验结果当DAE层的数量从3增加到7。从表可以看出1DAE层的增加,召回率、精度和MCC逐渐增加。DAE层的数量增加到5时,索引值已经达到最高。这表明深层神经网络不是越深越好,而是需要动态调整和选择根据特定业务的应用场景和数据。因此,在后续的实验中,模型与5 DAE层用于相关实验。

为了说明改进算法的优势在这个案例研究中,改进算法之间的比较结果和其他常见算法在个人信用风险评估是在下面详细描述。该算法与传统的特征选择算法和先进的深度学习算法,在传统的特征选择算法包括文献[20.]和文献[21]。先进的深度学习算法包括文献[16]和文献[17]。实验结果对比如图所示3

从结果可以看出在图3,信用评估的结果本文提出的算法比其他传统的方法。同时,它比原来的堆叠去噪autoencoder网络,和准确性提高了约3%。相比,特别是与原来的特性集(原始成绩没有任何特征选择),AUC-ROC, ACC, - - - - - -分数增加了15%、18%和21%,分别。上面的结果说明了这一点。在大数据的情况下,该算法基于深度学习框架可以充分提取个人信贷风险的潜在的基本特征。它有效地压缩和嵌入高维稀疏的特性,所以信贷功能之间的关系可以表示在低维空间中,以提高最终的信用评估能力。autoencoder网络堆栈基于去噪改进模型的抗噪能力,当大数据环境中的数据质量不高,以获得更好的信用评价结果。

4.2。贷款组合决策

为了更好地说明这个算法的操作影响的贷款投资组合决策,以下两个仿真例子测试。

4.2.1。准备仿真示例1

银行的农村项目的贷款总额是150万元。上级银行所需的最低贷款的任务是135万元。目前,10农民企业申请贷款,和企业的净现值(NPV)申请贷款好,媒介,不良信贷表所示2

本文提出的多目标粒子群优化算法用于解决仿真示例1。算法的人口规模和最大容量的外部文件设置为100。最初的惯性权重为0.5,和学习因子设置为1。所有测试函数的最大迭代次数设置为200。算法运行独立30次,结果平均值。一次的操作结果和目标函数的收敛曲线如图所示4。30分的结果达到最优值,平均时间小于1秒。

4.2.2。仿真示例2

为了更好地说明本文提出的算法可以用来解决大规模的贷款组合优化决策问题,本文设计的仿真示例2。仿真示例2重复10次仿真示例1的数据,以构建一个示例100农民企业申请贷款。这不仅不会影响测试本文算法的但更有利于算法的测试。因为上述问题的解决方案需要指数阶时间问题的规模,为仿真示例2构造根据这个方法,这个真的可以测试该算法的效果在大规模的贷款组合优化决策问题。综上所述,本文使用上述方法构建仿真示例2,和具体数据如下。

银行的农村项目的贷款总额是1500万元。上级银行所需的最低贷款的任务是1350万元。目前,100农民企业申请贷款,和净现值的企业申请贷款好,中等和糟糕的操作。在这里,净现值,即重复的数据表110次。算法的人口规模和最大容量的外部文件设置为1000。最初的惯性重量是0.5和学习因子设置为1。所有测试函数的最大迭代次数设置为200。算法运行独立30次,结果平均值。一次的操作结果和目标函数的收敛曲线如图所示5。30分的结果达到最优值,平均时间是不到10年代。该算法找到最优解的平均时间不到10年代,这表明,该算法取得了良好的结果在解决速度和优化能力。在30个独立随机实验,该算法达到最优解,表明该算法具有较强的稳定性。

总之,本文提出的多目标粒子群优化算法在优化能力方面取得了良好的效果,解决速度,稳定解决大规模的贷款组合优化决策问题。

5。结论

农村信贷约束是中国农村经济发展面临的一个严重的问题。中国的农村信贷市场是不完美的,大量的农民获得贷款的可能性非常低。为解决这些问题,本文优化农村信用体系和贷款决策。解决大数据应用程序中数据质量的问题,本文改进了堆叠去噪autoencoder深度网络和改善信用评估的准确性。为了提高贷款组合策略,一种自适应分解多目标粒子群优化算法。它的主要优点包括以下两个方面。(1)外部文件更新策略基于空间优化可以有效地平衡外部文件的收敛性和多样性,以提高空间算法的搜索能力。(2)自适应飞行参数调整机制可以平衡算法的勘探和开发能力,以提高算法的收敛性。实验结果表明,该算法优于其他算法在速度和稳定性。未来的工作将增加国家政策、地方特点、季节等因素的影响因素更一般的算法使农村信用约束。

数据可用性

标签数据集用于支持本研究的发现可以从相应的作者。

的利益冲突

作者宣称没有利益冲突。

确认

这项工作是支持的温州科技项目,温州农村金融人才现状及对策的研究(没有。R20190062)。