文摘

在本文中,我们提出一个跨境电子商务信用风险预警模型。我们建议的模型,即。,KPCA-MPSO-BP, is constructed using kernel principal component analysis (KPCA), improved particle swarm optimization (IPSO), and BP neural network. Initially, we use KPCA to reduce the credit risk index for cross-border e-commerce. Next, the inertia weight and threshold of BP neural network are searched using MPSO. Finally, BP neural network is used for training the data of 13 different enterprises of cross-border e-commerce’s credit risk. To analyze the efficiency of our proposed approach, we use the data of five different enterprises for testing and evaluation. The experimental results show that the mean absolute error (MAE) and root mean square error (RMSE) of our model are the lowest in comparison to the existing models and have much better efficiency.

1。介绍

据《华尔街日报》,2014年9月22日,阿里巴巴,跨境电子商务的巨头1,2)列为有史以来最大的首次公开发行(IPO),融资250亿美元。虽然这一成就主要是由于跨境电子商务的发展应用,这些应用程序的信贷风险仍然存在。要理解这种风险,不同的研究都是在这样的背景下进行的。然而,存在一些研究在跨境电子商务信用风险预警的应用程序。基于风险水平,信贷风险预警的这些应用程序可分为四个层次。在这些水平,1级代表最低的风险和4级代表最高的风险。跨境电子商务交易过程中,总是希望为交易选择企业拥有更好的性能,尽管跨境电子商务的信用风险水平都是动态的。选择一个企业更好的各种跨境电子商务企业之间的信用交易是一个重大的挑战,需要详细研究[3]。区分这些企业的风险水平的主要原因之一,这个选择很麻烦。

在文学,存在很少研究跨境电子商务信用风险的早期预警。例如,作者的4,5)使用最小二乘近似支持向量回归模型研究跨境电子商务信用风险预警。在[6- - - - - -8),作者采用z分数模型分析预警和获得相对更好的结果。在[9),BP神经网络用于研究跨境电子商务信用风险的早期预警。从上述研究,众多因素派生有直接影响的信用风险跨境电子商务应用。

在这种背景下,跨境电子商务使用财务信息披露上市公司和选择更好的和可靠的企业进行信用风险研究似乎是一个可行的选择。然而,有两个主要挑战与之关联的(10]。首先,由于大量的上市企业的财务指标,一些研究人员主要集中在使用主成分分析(PCA)的降低维度,但使用PCA降维使用线性变换,这不是有效的解决非线性问题。有一些非线性问题跨境电子商务的信用风险指标,已证明了先前的研究[11]。在这种情况下,神经网络似乎是一个更好的选择,但它几乎没有与之关联的主要缺点比如过度拟合,广义差性能,和收敛速度慢得多。神经网络可以配合PSO算法惯性权重和阈值的确定一个给定的神经网络。然而,PSO算法容易陷入局部最小值最终会导致效率的损失。此外,基于PSO神经网络的结果在大多数情况下是不准确的。

解决上述问题,我们使用KPCA, MPSO, BP神经网络建立一个框架跨境电子商务信用风险预警的应用程序。主要贡献如下:(1)最初,核主成分分析(KPCA)求解非线性特征向量提取。(2)接下来,MPSO用于解决当地极问题与粒子群优化(PSO)有关。现象是一个较小的值通过动态调整阈值来解决BP神经网络和惯性权重。基于KPCA的原则,MPSO和BP神经网络,本文实证研究使用跨境电子商务的信用风险的早期预警。

本文的其余部分组织如下。节2,我们将讨论我们提出的组合模型。节3,我们将讨论实证分析以及实验结果为我们建议的模型。最后,本文的结论和未来的研究方向提供了部分4

2。组合模型

在本节中,我们首先讨论KPCA的原则2.1。接下来,我们讨论的原则MPSO节2.2其次是BP算法的工作原理部分2.3。最后,我们讨论我们提出组合模型部分2.4

2.1。KPCA的原则

KPCA是一种多元统计分析方法,它使用一个内核方法通过应用主成分分析。它将多个变量映射通过非线性映射到高维特征空间,并在高维空间进行分析。基于确保相关变量之间的关系不变,努力把损失减小到最低限度的原始数据信息,减少跨境电子商务的信用风险指数。几个主要指标能反映原始问题的特点获得了这个目的(10- - - - - -12]。KPCA非线性特征提取方法,但它并没有应用到跨境电子商务的信用风险预警。它避免了复杂问题的求解特征向量在特征空间和实现通过求解矩阵特征值和特征向量的内核。

首先,跨境电子商务信用风险对于一个给定的样本, 映射到特征空间HD,在那里HD协方差矩阵是一个非线性映射,那么C的特征空间 样品

在方程(1),C的特征值分解为

在这个方程, 矩阵的特征值是CV相对应的特征向量是什么λ。因为,V的一个线性组合吗 ,然后存在

在方程(3),V属于映射函数 特征空间的HD;生成空间

在方程(4),矩阵K我,我定义n×n

在方程(5)的特征值问题 ,α取决于内核函数Kij,K是一个内核点积矩阵和方程(5)可以写成

在方程(6),内核跨境电子商务信用风险数据的主成分提取,投影P(t)的测试集t在特征空间矢量的方向Vl计算如下:

在方程(7),它被假定训练集满足方程(1在特征空间), ,这是极难满足方程(1在特征空间)。放松的假设 ,矩阵表达式 介绍了内核矩阵取而代之的是下面的形式:

在方程(8),由KPCA提取主成分的最大数量n。如果最初几个特征向量可以反映所有跨境电子商务信用风险的特点,提取主成分的数量可以减少(13- - - - - -15]。

2.2。MPSO原则

粒子群优化算法(PSO)是一种智能启发从鱼和鸟的自然社会行为。在算法中,每个粒子”反映了一个实体,可以比作一只鸟在一个搜索空间。粒子用于解决优化问题。每个粒子可以搜索、遵循和记住当前的最优粒子在解空间。粒子具有健身价值,这是由一个优化函数和速度决定其飞行方向和距离(16,17]。最后,PSO算法通过迭代找到最优解。首先,它是初始化为一群随机粒子。粒子追逐两个极值和更新他们的位置在每个迭代中。最好是全球极值,整个集团,目前找到的最优解,另一个是个体极值最好,这是当前最优解自己发现的粒子。当这段时间(当前时间)的健身价值等于之前的时间,算法将陷入局部最小值。为了解决上述问题,提高算法通过动态调整惯性权重。当这一次的健身价值等于上一次的健身价值,粒子群将会陷入局部最小值。可以预测,在未来所有的迭代中如果惯性权重等于,是不可能产生这样的惯性权重相等。如果后续的迭代的数量是最好的健身价值的当前迭代产生的惯性权重,惯性权重将不可避免的改变,改变是不可逆转的,这使得算法陷入局部极值的状态。 The improvement method of PSO is introduced below. In the past, some improved algorithms for inertia weight were proposed based on equation (9)。改进的惯性权重有严重缺点,改进取决于当前迭代时间和算法的最大迭代次数,这将使其陷入局部最小值。因为这些缺点,本文提出一种算法来动态调整惯性权重,即。,the method of first increasing and then decreasing controlled by the algorithm itself to improve the PSO algorithm [18,19]。

在方程(9),iter是当前的迭代次数,iter马克斯的最大迭代数,ω最小值惯性权重的最小值,ω马克斯是最大的惯性权重。基本思想如下:使用一个动态惯性调整策略,首先选择较小的惯性权重的粒子初始值,因此粒子的初始开发能力强。如果健身价值ft−1之前的迭代与健身价值ft当前迭代的粒子陷入局部最小值的两个健身价值f=ft−1。增强粒子的全局搜索能力,我们可以调用线性函数:ω=ω+α×ω,在那里α是当地一个随机数的间隔(0 - 1),调整惯性权重的大小,增加粒子的惯性权重,粒子可以跳出当地的极端观点。惯性的体重增加到1.4时,粒子间的勘探能力最强的,但粒子之间的联系是最弱的,也就是说。,粒子的开发能力是最弱的。增强颗粒之间的联系,一个线性函数,ω=ω+α×ω,使用。这里,当地的一个随机数字(0 - 1)区间用于线性减少惯性权重提高粒子之间的联系。反复使用此方法使控制和动态调整惯性权重粒子和粒子的连接是发达的方向改进,探索能力和开发能力的粒子可以达到动态战略平衡。惯性权重的调整公式如下:

在这个方程,α是一个0到1之间的随机数,ω是一个线性函数,ft一代的健身价值吗t,ft−1一代的健身价值吗t−1。全局搜索和局部搜索之间的动态平衡粒子群优化是由上述方程(20.- - - - - -23]。

2.3。BP算法原理

BP神经网络是一个主要的人工神经网络(ANN)。它由一个输入层,几个隐藏层和输出层,有几个节点。反映了神经元,每个节点通过权重低,上层节点相连。节点层间完全紧密联系在一起的,不存在连接节点在每一层中。典型BP神经网络是一种三层结构的网络模型与一个隐藏层,如图1

在一个神经网络模型输出之间的关系yt和输入 可以使用下列方程表示:

在这个方程, 模型参数,n表示在隐藏层节点的数量,反映了模型输入层的节点数,和 是一个转换函数。常用的函数

BP神经网络模型中描述方程(11)反映了线性函数的输入和输出之间的映射关系yt以前的观测值序列

在方程(12),ω是所有模型的参数向量;函数 是由网络结构和重量参数(24,25),分别。

2.4。组合模型

我们的组合模型,即。,KPCA-MPSO-BP, is discussed in detail here. The basic idea of this model is as follows: firstly, the eigenvalues and eigenvectors of the indicators of cross-border e-commerce credit risk are calculated. Then, the kernel principal component eigenvectors with cumulative contribution rate greater than 85% are calculated, and finally, MPSO is used to search the weights and thresholds of BP neural network. The current position and fitness of the particles in the swarm are expressed by the weights, thresholds, and errors of the BP neural network and the results are compared. To analyze whether or not to update the PSO algorithm, BP neural network is used for early warning calculation. The flowchart of our proposed model is shown in Figure2

我们的模型的操作步骤如下:(1)数据收集和数据预处理:跨境电子商务的信用风险指标标准化,和反向指标转化为积极的指标。方法是1-index值,也就是说,xij= 1−xij,在那里xij反向索引和吗xij转换后积极的指数。归一化的公式如下: (2)计算内核矩阵:数据标准化后,跨境电子商务信用风险数据分析,KPCA和协方差计算的特征值和特征向量。(3)特征值提取:KPCA方法用来减少输入的维数特征值。降维是选择的标准内核主成分特征向量包含超过85%的信息。(4)初始化算法:初始化初始位置和初始速度的人口,设置最低的健身价值ε和迭代的最大数量,粒子的初始位置转移到初始粒子的最优位置。(5)BP神经网络初始化:粒子的初始位置转移到BP神经网络的初始阈值和BP神经网络的初始值。(6)产量和平均误差:输出和平均误差 BP神经网络的计算。样本数据的综合得分作为期望输出值,BP神经网络的平均误差计算,粒子群优化算法的适应度值是由网络错误εt,确定粒子群优化算法的适应度值(6]。(7)BP神经网络的训练集:跨境电子商务信用风险的一部分数据作为BP神经网络的训练集,并计算网络中进行培训。(8)BP网络的测试集:跨境电子商务信用风险的另一部分数据作为BP神经网络的测试集和测试在BP神经网络。(9)信用警告:根据BP神经网络的分数,跨境电子商务企业的信用警告。基于测试/检验的结果,给出了跨境电子商务企业的信用风险根据风险预警级别。(10)误差分析:为了测试KPCA-MPSO-BP模型的优越性,平均绝对百分比误差(日军)和均方根误差(RMSE)计算。这两个指标是用于误差分析: 在方程(14)和(15),平均绝对误差和均方根误差越小,更好的结果。

3所示。实证分析

根据企业跨境电子商务信用风险的特点,数据来源使用的指标体系1,3]对跨境电子商务信用风险进行实证研究。

3.1。选择研究样本和指标

以18国际跨境电子商务企业的数据为样本,选择的指标为我们研究销售利润率X1,净资产收益率X2,总资产回报率X3,总资产周转率X4存货周转率、成本费用利润率X5, X6,应收账款周转率X7流动资产周转率X8、利息多个X9数字证书年级X10速动比率X11流动比率X12,资本积累速度X13信贷X、平台服务提供商14固定资产更新率X15,总资产增长率X16、合同打破率X17逾期付款率X18X,贸易额增长速度19。18个企业命名的企业,企业,和企业R,分别。该指数的含义如表所示1

据表的定义1的原始数据表2可以通过使用获得的数据(3]。

3.2。数据处理

根据组合处理方法2.4的标准化变换原始数据(包括反向索引进入正常化正指数)使标准化跨境电子商务信用风险矩阵。我们采用KPCA降维的标准选择特征值的累积贡献率占85%。粒子的初始位置转移到BP神经网络的初始阈值和BP神经网络的初始值。首先,13组数据用于形成训练集,然后使用BP神经网络训练,然后其他的5组数据用于测试集。使用预测测试,跨境电子商务的信用风险分为四类:一级风险(80100),二级风险[80],三级风险(30、60),四级风险[0,30]。其中,1级和2级的风险状态,而三级和四级的无风险状态。如果分数大于或等于60,没有报警,如果分数小于60,这是一个闹钟。标准化处理后的数据如表所示3

3.3。跨境电子商务信用风险预警分析

根据跨境电子商务信用风险预警的表3企业进行分类,如表所示4

从表可以看出4有4个企业状况良好(一级风险)。这些企业包括D, E,我分别和P。这些企业财务状况良好。接下来,有6企业二级风险(正常状态),包括一个G,我,K, N,分别和Q。这些企业的财务状况是好的,不存在信用风险。有5个三级风险企业(轻微的风险)。财务状况的跨境电子商务企业在这一节中不是很好,有轻微的信用风险。最后,还有3与4级风险企业(严重的风险),包括J, F, O如表所示。企业的财务状况在本节中,是极其危险的,一个相对严重的信贷危机。

3.4。模型组合装配测试

的测试模型,平均绝对误差和均方根误差的模型可以由英国石油公司相比,PSO-BP, MPSO-BP, KPCA-MPSO-BP,如表所示5

从表可以看出5RMSE和日军KPCA-MPSO-BP模型的最小,这表明KPCA-MPSO-BP模型预警精度高于单一模型,MPSO-BP模型预警精度高于PSO-BP模型,和KPCA-MPSO-BP模型预警精度最高,这表明KPCA-MPSO-BP模型具有良好的拟合程度和KPCA-MPSO-BP模型提出了科学、合理。

4所示。结论

提高能力防止跨境电子商务企业的信用风险,提出了一种结合KPCA-MPSO-BP模型。该模型用于早期警告跨境电子商务企业的信用风险和分析相关的示例数据。结果表明,KPCA-MPSO-BP组合模型是有效的信贷风险预警。与其他模型相比,KPCA-MPSO-BP参数少,计算速度更快,更好的拟合。虽然我们的模型具有更好的结果,仍有改进的余地。例如,对于企业1级风险(的状态),没有信用风险,因此有必要加强信用评级的数据收集,以避免信用风险的发生。企业的二级风险(正常状态),有一个信用风险的可能性,因此我们应加强信贷风险的潜在因素的分析,加强管理,防止信用风险的发生。企业三级风险(轻微的风险状态),如果有轻微的风险和预警状态,我们应该加强企业信用风险的工作,改善信贷,降低信用风险的发生。四级企业风险(严重的风险状态)在早期预警状态和有严重的信用风险,所以他们应该停止业务,加强整顿和清理,并输入风险计划过程,防止企业破产的发生。

数据可用性

使用的数据来支持本研究的结果包括在本文中。

的利益冲突

作者宣称没有利益冲突。