文摘

公司的会计信息的真实性是一个重要的保证资本市场的有效运行。会计欺诈是篡改和歪曲公司公开披露的信息。诈骗案件的连续爆发严重打击了投资者的信心,动摇了资本市场的信用基础,阻碍了资本市场的健康稳定发展。因此,它具有重要的理论和实践意义进行研究会计舞弊的识别与治理。传统上,会计欺诈识别主要是基于线性思维构建舞弊识别模型。然而,越来越多的研究表明,欺诈具有典型的非线性特征,和欺诈的多目标意味着也决定了使用识别的线性模型的局限性。考虑到传统的识别方法可能的缺陷模型设定错误和不足的信息提取,本文构造了支持向量机和逻辑回归模型来确定会计欺诈。支持向量机是用于提高的学习能力和泛化能力未知的现象,和每个变量的解释力整个模型是确定的逻辑回归模型。本文突破了线性约束假说,探讨了模型设定形式更适合企业欺诈行为提取欺诈的法律身份信息更全面,为投资者提供更强大的支持有效地识别欺诈。

1。介绍

公司的会计信息的真实性是一个重要的保证资本市场的有效运行。会计欺诈是篡改和歪曲公司公开披露的信息(1]。诈骗案件的连续爆发严重打击了投资者的信心,动摇了资本市场的信用基础,阻碍了资本市场的健康稳定发展。因此,它具有重要的理论和实践意义进行研究会计舞弊的识别与治理。长期以来,学者们进行了丰富和富有成果的研究和探索2]。早期的理论分析和问卷调查的研究深化的理解欺诈的原因,单欺诈识别因素的调查,然后建设多维指数的欺诈识别模型,对欺诈识别和治理的研究取得了丰硕的成果。然而,随着研究的积累和深化的理解会计欺诈的基本特征,以及越来越复杂的欺诈,欺诈识别现有研究的局限性越来越突出(3]。由于欺诈行为的复杂性和多目标,为了提高欺诈识别的影响,指标体系的尺寸变得越来越高,和变量的多重共线性增加,有必要考虑消除多重共线性来改善的性能模型。

综述文献对企业会计舞弊识别和治理国内外,使用支持向量机来提高学习能力和推广能力的未知现象,并使用逻辑回归模型来确定每个变量对整个模型的解释力。支持向量机的原因具有良好的泛化能力是基于结构风险最小化的原则(4]。通过将输入向量映射到高维函数空间,最好的地板可以构造分类,弥补缺陷,无法通过多层前解决社区(5]。使用的二次规划优化使用援助向量计算机可以发现世界上最有效的解决方案,这是一个困难的麻烦,神经社区邻里最小的麻烦不能解决;然而,协助向量计算机的解释能力较弱,和逻辑回归模型可以简单地意识到每一个变量的解释力量对整个模型,这可以帮助我们看结构化变量上的每个变量的影响(6]。每个变量之间的相关性和欺诈风险指数和平均差的意义下的每个变量的不同水平的欺诈风险测试,和舞弊治理提出了相应的对策。

本文的其余部分组织如下:相关章节中讨论工作2。节3支持向量机和逻辑回归模型。节4基于支持向量机和逻辑回归模型,进行实验设计和分析。部分5总结了整个论文。

学术界已经密切关注会计欺诈的问题很长一段时间,使得很多研究结果的识别方法。人们使用逻辑回归模型来判断大多数会计欺诈和指出,会计数据包含有效信息来识别会计欺诈。相关学者第一次模拟测试数据作为输出变量,建立了一个人工神经网络模型来识别会计欺诈基于原始财务数据(7]。发现这个模型的能力将大大提高独立审计师发现欺诈和表明,审计师应该使用这个模型在初始阶段的审计8]。通过分析公司的财务指标,相关学者,发现应收账款的周转率,毛利率、资产质量指标、销售增长指数和资产负债比率指数可以为投资者提供有用的参考来分析该公司是否进行会计欺诈(9]。一些学者介绍了五种方式来确定会计欺诈从定性的角度来看:关注外部的财务指标,关注高审计风险,分析三大报表之间的关系,并分析现金流量表的结构和异常波动指标(10]。此外,我们使用描述性统计,two-population异方差性测试,和二进制逻辑回归来分析中国企业的财务报告欺诈。实证研究表明,企业规模小和恶化的财务状况更容易金融欺诈(11]。基于29欺诈样本和29 nonfraud样本,本文运用单变量和多变量统计技术来建立一个模型来识别虚假财务报告,发现模型的正确识别率超过75% (12]。使用68诈骗样本和68 nonfraud样本,四种方法被用来建立识别模型,和逻辑回归模型的最高识别率为77% (13]。

从财务报告舞弊的研究现状,大多数学者都意识到重要的财务指标之间的关系和识别财务报表欺诈和关注财务指标异常(所提供的身份信息14]。然而,他们中的大多数主要是实证分析方法,具有更高的专业要求和没有考虑使用许多金融指标检查。一些财务指标可能内部相关性。因此,非常有助于提高模型的准确性,如果金融指标统计分析测试或加工。

在统计分析方法、逻辑回归模型具有很强的解释和歧视精度高的特点(15]。它是使用最广泛的应用领域的欺诈识别模型。一些建立logistic回归模型,根据毕马威(KPMG)的数据,使用逻辑回归模型实证研究;一些制造业欺诈企业为样本,综合使用逻辑回归模型和主成分分析方法研究;一些逻辑回归模型用于歧视和验证逻辑回归模型和回归模型的有效性在财务报告舞弊的识别(16]。然而,逻辑回归模型也有一些问题需要改进,主要是因为对多重共线性的变量模型非常敏感,计算过程复杂。因此,它具有重要意义有效地显示经济的关键指标变量文件欺诈识别许多经济指标。这不仅可以有效地简化人体模型和极限计算的复杂性,还能削弱无偏变量的多重共线性的影响对人体模型,提高模型的识别能力。

筛选模型中的变量的本质是选择最好的模型可选模型集。早期的变量选择方法主要包括最佳子集法和向前或向后逐步回归模型,但也有一些缺陷在应用程序(17]。最优方法很难解决当变量子集尺寸很大,而向前或向后逐步回归模型对变结构的变化更敏感,和稳定的模型需要改善。为了克服传统方法的缺点,基于罚函数的变量选择方法已逐渐吸引了大多数研究者的注意。提出的套索方法Toshigami已经成为最常用的变量选择方法(18]。它将罚函数转换成绝对值和压缩压缩一些变量的系数为0的回归系数以达到变量筛选的效果。在这篇文章中,支持向量机用于提高学习能力和泛化能力不明的现象,和每个变量的解释力整个模型确定的逻辑回归模型。通过将输入向量映射到高维特征空间,支持向量机可以构造最优分类面,它可以弥补多层前馈网络的缺陷。使用的二次规划优化支持向量机可以找到全局最优解,这是一个困难的问题,神经网络局部最小值的问题不能解决,但支持向量机的解释能力较弱,和逻辑回归模型可以确定每个变量的解释力整个模型,它可以帮助我们观察每个变量对因变量的影响。

3所示。变量选择和模型结构

本文构造了支持向量机和逻辑回归模型来确定会计欺诈。支持向量机是用于提高的学习能力和泛化能力未知的现象,和每个变量的解释力整个模型是确定的逻辑回归模型。如图所示的细节1

3.1。变量的选择

会计欺诈是指故意遗漏或伪造财务会计信息的过程中外部报告。根据类型的欺诈、会计欺诈主要分为财务报表欺诈和非法披露会计信息。后者通常涉及到有关法律、法规和规章制度的交换,所以它不是一个简单的会计问题19,20.]。本研究只关注财务报表欺诈;为核心的资产负债表和损益表为核心,财务报表舞弊可以分为虚假的净资产和虚假的利润。共同处理项目应收账款,应付账款,存货,折旧,待摊费用,和其他收益;虚假的利润通常是通过识别或提前制作收入,低估成本,费用,和隐瞒损失,报告项目涉及包括营业收入、营业利润、净利润,期间费用。此外,先前的研究已经表明,财务状况是一个重要因素影响公司会计欺诈,和奥特曼Z分数提供了一个全面的观察来衡量企业财务状况。

3.2。支持向量机

主要使用分类的支持向量机预测的想法是建立一个最优分类超平面作为决策表面,最大化不同类型之间的间隔,如图2

支持向量机是基于线性可分情况下的最优分类超平面。假设训练集T:

找到这样一个最优分类超平面,可以使用拉格朗日函数:

当训练集是线性nonwearable,为了构造最优超平面线性nonwearable数据的情况下,我们需要引入一个负的松弛变量 ;支持向量机的非线性分类问题将样本空间映射到希尔伯特空间通过引入核函数 通过这种方式,非线性分类问题可以转化为一个线性分类问题。

在这一点上,通过引入核函数 ,优化函数变得

,相应的决策函数

可以使用不同的核函数构造不同类型的输入空间非线性决策表面学习机器。

3.3。逻辑回归模型

逻辑回归模型是一个离散选择模型基于最大似然估计(标定)。与最小二乘(OLS)方法常用的线性回归,以最小平方偏差变量的观测值与模型的估计价值的优化条件,最大似然估计(标定)方法以最大概率复制的样本观测值随机选择优化条件的参数估计(21]。假设会计欺诈的概率是p(0 <p< 1),和不执行会计欺诈的概率是1p。有指标来判断会计欺诈发生的x1,x2,…,x。一般来说,逻辑回归模型设定如下:

方程两边取自然对数:

为了有效地识别会计欺诈,模型通常包含多维变量。然而,变量维度的增加容易导致较高的多个解释变量之间的相关性。当有许多解释变量在模型中,主成分分析采用主成分变换提取主成分代替原始变量无关的(22]。在保留的基础上最大程度的原始变量的信息,它可以消除变量之间的相关性,实现模型降维的目的。

3.4。欺诈的框架分析

摘要会计信息欺诈贪污的企业除了实物资产通常被称为会计欺诈,这是进一步分为非法会计信息披露和财务报告欺诈。的定义,所谓的会计信息披露,是指企业为了达到一定的目的违反信息披露的有关法律、法规的行为,这是有限的披露相关信息链接。舞弊财务报告是指重大活动的操作由企业为了达到一个特定的目的23]。之前的操作是有限的信息披露,被扭曲后和披露信息是正确的。从本质上讲,它是一个为整个企业会计信息系统的规划活动。如果我们说财务报表欺诈是一个虚假的经济业务的真实反映,会计信息披露是一个错误的反映真实的经济业务。这个部门可以提供方便的研究欺诈的原因,然后提出反欺诈的对策。在此基础上,本文提出了一个分析框架,如图3

从研究方法的角度来看,国内外学者倾向于实证分析和数据挖掘在金融欺诈的原因。涉及的主要方法是概率分析,构建线性概率模型、回归模型、正态分布模型和人工神经网络模型建立识别模型。回归模型使用最大似然估计法计算欺诈的概率,它没有严格的假设,不需要服从正态分布,所以它被大多数学者建立欺诈模型(24]。接下来,本文运用逻辑方法构建财务报告欺诈预警模型和postinvestigation模型。识别效率得到后,比较两种模型的识别率。

根据欺诈理论,通过深入分析贪婪因素、机会因素,需要因素,和暴力因素,我们可以准确地识别财务报告中存在欺诈的可能性。因此,本文建立的预警模型是基于欺诈理论和构建预警模型的欺诈行为与相关替换变量的设置四个因素。会计欺诈识别的过程模型如图4

4所示。实验设计和结果分析

4.1。预警和Postinvestigation模型的回归分析

从图可以看出5预警模型的x平方分布值为75.718,显著性水平为0.000。因此,独立变量预警模型的测试是重要的。模型的拟合优度为0.435,表明该模型具有良好的解释力。从指标的角度来看,如果估计系数管理者的风险偏好,并发任命,董事长兼总经理和管理层的持股比例是积极的,它表明管理者的风险偏好,并发任命,董事长兼总经理和管理层的持股比例与财务报告舞弊呈正相关;如果估计系数董事的人员更换频率,关联方交易的频率,和他们的影响是积极的25),这表明管理者的风险偏好,并发任命,董事长兼总经理和管理层的持股比例与财务报告舞弊呈正相关。如果监管委员会的估计系数的大小和数量的股东会议的公司是负的,那么它是欺诈的发生成反比;如果审计意见类型的估计系数是负的,那么它是欺诈的发生成反比;如果流动比率和资产负债比率估计系数是负的,那么它是欺诈的发生成反比。公司的偿债能力成反比的欺诈行为。

从图可以看出6ex-postinvestigation模型的x平方分布值为23.249,显著性水平为0.010。因此,测试ex-postinvestigation模型是重要的自变量。模型的拟合优度为0.152,这表明ex-postinvestigation模型具有良好的解释力。从指数的角度来看,该公司的财务指标异常,也就是说,更糟糕的是,该公司的盈利能力,偿债能力,经营能力,会导致财务报告舞弊的实现。

4.2。交叉验证的分析参数组合

根据欺诈理论,通过深入分析贪婪因素、机会因素,需要因素,和暴露因素,我们可以准确地识别财务报告中存在欺诈的可能性。因此,本文建立的预警模型是基于欺诈理论和构建预警模型的欺诈行为与相关替换变量的设置四个因素。在这个模型中,一系列的值C(2−10,210),的值范围γ(2−10,210),单一改变步骤2−1,共有21 21日(C、γ)参数组合。交叉验证率参数组合的细节图所示7

预警模型的建立主要以四个欺诈因素为起点来识别欺诈的可能性。后来,侦察模型用于检测异常数据后的财务报表欺诈的发生,为了识别金融欺诈的可能性。在这个模型中,一系列的值C(2−10,210),的值范围γ(2−10,210),单一改变步骤2−1,共有21 21日(C、γ)参数组合。交叉验证的细节图所示8

基于交叉验证,通过网格搜索方法两个关键参数cγRBF核函数决定的(8,0.25)。图9是一个交叉验证率随参数变化的三维图。结果表明,交叉验证准确率在30%和79.17%之间波动的变化(C、γ)参数组合。它表明,交叉验证准确率不能拒绝的影响Cγ。结果还表明,交叉验证的准确性是稳定的,和支持向量机有很好的anti-microvariation特征。交叉验证的识别精度最好的79.17%,和79.17%的参数组合(8,0.25)。

基于交叉验证,通过网格搜索方法两个关键参数cγRBF核函数决定的(4,2)图10是一个交叉验证率随参数变化的三维图。结果表明,交叉验证的准确性是漂浮在30% - -65.10%的范围的变化(C、γ)参数组合。它表明,交叉验证的准确性不能拒绝的影响Cγ。结果还表明,交叉验证的准确性是稳定的,和支持向量机有很好的anti-microvariation特征。交叉验证是65.10%的识别精度最好,只有参数的组合(4,2)为65.10%。

4.3。比较分析模型的识别效果

下固定分布和固定数量的样本,通过比较实验结果的第一步,第二步,第三步,得出实验结果的准确性的第一步是最高的,这决定了,在这个实验中,会计舞弊识别模型是直接建立了逻辑回归。第四步是知道数据分布的影响和训练样本大小一定的条件下预测精度会计欺诈识别模型。从两组实验数据,50岁,100年,150年,200年,250年和300年的欺诈和样品nonfraud选择样本,分别对配对,然后,逻辑回归是直接使用。可以看出,在相同的数据分布,样本容量预测精度有很大的影响。样品越小,精度越高,样本越大,精度越低。然而,当样本足够大,准确性会保持在一定水平,这才是真正的欺诈识别模型的水平。在这个实验中,当样本量是200,它基本上是保持在71%至74%之间。因此,当使用物流模型构建会计舞弊识别模型,最好是有一个更大的样本量,以避免过高的预测准确性,这可能是严重不符合现实;在不同的数据分布,样本大小是相同的,但预测精度是不同的。会计舞弊的识别结果的准确率识别模型如图11

当会计舞弊识别模型和财务指标,确定模型中应该包括,公司的会计欺诈的可能性可以计算。但是,为什么这些财务指标是用来识别会计欺诈和舞弊样本之间的差异和共同点是什么和nonfraud样本可以理解通过原始数据的描述性统计。财务指标包括在模型分为欺诈集团和nonfraud集团为描述性统计和结果在图所示1213。实验结果的步骤5中,我们可以看到,财务指标的方差x1,x3,x5,x11的欺诈大于样品相同的财务指标一个1,一个3,一个5,一个11nonfraud样本;但的方差x2在舞弊样本小于相同的财务指标一个2nonfraud样本,这证明了大部分的财务指标包括在会计舞弊识别模型比那些欺诈nonfraud样本,样本和波动很大。

根据支持向量机方法,训练样本的数量的增加,训练精度也提高,和相应的分类器推广能力也在提高,和测试精度超过94人。可以看出,支持向量机的机器学习方法在处理财务数据更加可靠和有效。整体识别率,整体识别率高于SVM算法的逻辑回归模型,显示了良好的分类器的性能。逻辑回归模型具有很高的解释力在不同变量的影响欺诈的概率。第二,欺诈的压力,增长率,破产风险,资产负债比率,和损失与否,高管的持股具有显著的正相关关系与金融欺诈的可能性,而经营活动产生的净现金流量/总负债,营业收入的增长速度,和高管年薪与欺诈的概率显著负相关。第三,欺诈的机会,董事会会议,欺诈的概率就越高;大股东的控制程度越低,出勤率的股东会议,独立董事的出席率,欺诈的概率就越高。第四,欺诈的借口,更多的时候我们得到非标准审计意见,欺诈的可能性就越高。因此,为了有效地预防和检测欺诈行为,我们不仅要加强内部控制的建设和运营过程也加强股东的外部监督,独立董事,独立的审计师。首先,缓解企业面临的内部和外部的压力和管理。 By formulating a scientific development strategy, designing a stable organizational structure, and creating a reasonable incentive mechanism, a healthy corporate culture can be established, and the internal control environment can be improved. Second, internal control and risk management evaluation should be carried out to prevent fraudsters from being provided with any opportunities for fraud. Third, strengthen internal and external supervision to eliminate fraud excuse. The empirical results of this paper show that the problem of the internal supervision function is still serious in China. While improving the efficiency and effect of internal supervision, we should strengthen the supervision of external investors and auditors.

5。结论

在这项研究中,随着训练样本的数量的增加,训练精度也提高,和相应的分类器推广能力也在提高,和测试精度超过94%。支持向量机的机器学习方法用于处理财务数据,及其预测能力的判断未知数据更可靠和有效的。整体识别率,整体识别率高于SVM算法的逻辑回归模型,显示了良好的分类器的性能。逻辑回归模型具有很高的解释力在不同变量的影响欺诈的概率。第二,欺诈的压力,增长率,破产风险,资产负债比率,和损失与否,高管的持股具有显著的正相关关系与金融欺诈的可能性,而经营活动产生的净现金流量/总负债,营业收入的增长速度,和年度薪酬的高管与欺诈的概率显著负相关。缓解通过企业面临内部和外部压力和管理。通过科学的改进策略方法、安全组织机构图和实际的激励机制,一个健康的公司可以建立生活方式改善内部控制环境,加强内部操作和风险管理评估的效率。

数据可用性

使用的数据来支持本研究的发现可以从相应的作者。

的利益冲突

作者宣称没有利益冲突有关的出版。