文摘

AI(人工智能)是一个重大的技术进步,每个人对其令人难以置信的潜力都嗡嗡作响。当前的研究评估监督人工智能技术的影响,即。,米achine learning techniques on the nonfinancial firms of Pakistan and focuses on the practical application of AI techniques for the accurate prediction of corporate risks which in turn will lead to the automation of corporate risk management. So, in this study, we used financial ratios for accurate risk assessment and for the automation of corporate risk management by developing machine learning algorithms using techniques, namely, random forest, decision tree, naïve Bayes, and KNN. A secondary data collection technique will be used. For this purpose, we collected annual data of nonfinancial companies in Pakistan for the period ranging from 2006 to 2020, and the data are analyzed and tested through Python software. Our results prove that AI techniques can accurately predict risk with minimum error values, and among all the techniques used, the random forest technique outperforms as compared to the rest of the techniques.

1。介绍

人工智能是一个重大的技术突破,一天需要解决不同的风险评估和预测问题。深刻学习和机器学习(ML)标题下的人工智能。人工智能被描述为机器知识类人做决定的能力,继续改善。机器学习需要的发展模式,主要是统计模型,可以建立和提供预测的结果。最初,人工智能在软件开发有限公司大企业与金融手段采用高技术人员。人工智能与高水平的抽象框架已建成随着时间的推移,和一个智能系统可以只有几行代码创建在任何编程语言的选择。在比较迅速变得过时的传统技术,人工智能技术可以提供重要的好处的全球金融环境中,通过自动化某些任务和提高分析能力。人工智能是现代金融的重要组成部分,因为它使它更便宜,更快,更大,更可用,盈利和竞争力的多种方式。

FERMA发布了第一个思维论文影响风险管理的人工智能(AI) 2019年11月,目的是指导风险经理从一个基本的了解设计自己的人工智能实现计划。此外,他们集中在另一篇论文提出了利用人工智能技术和双相障碍的开放图书馆(BigData)和神经网络的集成基地,发挥重要的作用在企业风险管理的自动化。建议的解决方案,开发分布式分析系统,通过使用深度学习算法。同样,阿齐兹和道林在法国进行了研究和探索如何将风险管理通过使用机器学习和人工智能。没有这样的研究进行了在巴基斯坦的非金融行业企业风险管理可能是使用人工智能技术,如自动随机森林,安,深入学习,等等。将解决问题的声明,这项研究是人工智能技术如何自动化企业风险管理,和人工智能的技术是最适合准确确定公司将面临多大的风险。

1.1。人工智能的基本理解
1.1.1。人工智能(AI)为什么?

人工智能发展知识和独立的一个系统。基本上,人工智能技术用于构建预测模型算法的形式尽可能高的精度。人工智能在各种领域快速发展的,有大量的功能。这项技术有可能被用于多种行业和领域。人工智能应用于财务识别和跟踪等金融和银行业活动不寻常的借记卡账户的使用和大额存款,这两个帮助欺诈银行单位。人工智能的应用使交易更容易和更有效。它可以通过使其更容易估计生产、需求和股票价格1]。机器学习是人工智能的标题下,允许系统采用和开发自己的理解,而无需程序明确。艾未未作品在两个方面:一个是数据驱动的,另一种是象征性的。基于数据的边叫做毫升,大量的数据需要被送入机器之前学习的能力。机器能够学习的更大范围的维度。机器可以从大量高维数据演绎模式。一旦掌握了这些模式,他们将生成预测,人类无法匹配(2]。推理、信息表示、NLP,调度,深入学习,解释,和传输和控制他们的能力都是人工智能研究的领域。人工智能的一个长期目标是实现一般智力。程序需要实现的目标包括传统符号人工智能,人工智能,和统计方法。人工智能的研究是正在进行的和不断发展的今天。预计中国将取代美国在即将到来的四年是人工智能的主要枢纽,拥有了来自美国的第二位,2004年迅速接近欧洲主要的位置。被认为是欧洲最丰富、规模最大的地区在全球合作的背景下,在人工智能的研究。在美国和中国之后,印度是第三号最大的人工智能研究的国家。AI是重要的和发展在某种程度上,日本风险资本公司出名本身通过任命第一AI董事会成员来预测产业动态比人类快(3]。

1.1.2。机器学习(ML)是什么?

机器学习是人工智能的领域,包括自动检测数据中的模式。它最初被描述为一个程序,学会从经验(即自动完成任务。明确,数据)而不是编程。机器学习算法有能力发展通过培训,他们可以处理海量数据和使用各种编程技术提取有意义的信息。通过这种方式,他们可以学习他们给出的数据和改进之前的迭代4]。在金融行业,机器学习是被用来改善多种功能,即欺诈检测、支付处理,和监管5]。

1.1.3。类型的机器学习(ML)技术

机器学习系统是基于多少和什么样的监督分类培训期间他们收到。机器学习是大致分为以下三个类别:

(1)监督学习。基于一组训练数据,监督学习开发一个函数,将输入输出。在训练集,算法推断函数连接每组输入预测,或标记,输出5]。监督学习的目的是预测一个已知的结果。训练一个模型,一个数据集与特性(变量)和标签(或类感兴趣的结果)。技术生成一个函数映射功能标签,然后利用它来预测未标记的标签数据。监督学习模型预测结果的准确性在一个或多个数据集不包含在开发过程中通常是测量。最重要的监督学习算法是随机森林,决策树,再邻居,支持向量机(线性)、支持向量机(RBF),朴素贝叶斯、多项式回归和人工神经网络。本研究中使用这些也对风险的预测。

(2)无监督学习。在无监督学习,训练数据不标记。系统试图学习没有老师的帮助。无监督学习无标号数据中发现隐藏的模式,使结论。无监督学习提要数据模型,但不描述一组预测结果;结果没有标记(5]。无监督学习不是预期的一个特定的结果。相反,程序查找模式识别的数据或组。

(3)强化学习。强化学习是一个相对较新的一类学习相结合的监督和非监督学习。这是一个完全不同的野兽。在强化学习算法准确性最大化通过试验和错误。模型的形状通过反馈训练集的真实和模拟的结果决定。在这种背景下,学习系统被称为一个代理,因为它可以监视环境、选择、和行为动作和接收奖励(或惩罚负回报的形式)。它必须找出自己最理想的技术,称为政策,是为了最大化回报。在每种情况下,一项政策指定代理应该采取什么行动。

1.1.4。风险企业

虽然有几种风险类型,最明显的企业,我们也包括在我们的研究是财务、运营、战略、声誉风险。事实上,研究表明,金融风险仅占约10%的大市值下降,而操作风险占30%;剩下的60%的下跌是由于战略风险,尽管战略排名第三在risk-prioritization练习6]。“金融风险是赔钱的可能性在一个投资或商业计划。“这种风险会导致那些暴露于它失去金钱和资本。流行的财务风险类型包括“资产担保风险,信用风险,流动性风险,外国投资风险,股票风险和汇率风险。“损失的概率,因为无效的或程序的失败、结构或实践;员工的错误;系统故障;欺诈或其他犯罪活动;业务流程或任何事件不被称为操作风险。(7]。“声誉风险是风险或危险的公司或实体的好名声和地位。这种类型的风险可能出现以多种方式直接将公司的活动,或间接地由于员工或员工的行为,或通过其它外围政党无关地如合资伙伴或供应商。”“战略风险是那些发生的基本决策由董事会在一个组织的目标。“不同的财务风险比率被投资者用来评估一个公司的前景8]。我们的主要目的是评估影响和实际应用人工智能技术在巴基斯坦非金融企业风险管理的自动化公司。除了评估人工智能的影响外,我们还将开发一个算法使用python对准确预测的财务、运营、战略和企业声誉风险。此外,我们将比较不同的人工智能技术的精度水平,以确定哪些技术将最适合的风险评估。

这个研究是有组织的如下:部分2检查相关研究。部分3提出了风险预测方法和模型描述了利用不同的机器学习算法和技术。部分4介绍了分析和结果,而部分5分析了管理、社会和本研究的方法论意义。最后,在节6,调查结束。

AI必须能够应对风险的想法,这是中央财政领域,为了是有用的金融体系。信用风险可以计算使用各种机器学习方法可以提取非线性金融资产负债表上的数据之间的关系。模型是选择在一个典型的科学数据生命周期预测准确性最大化。决策是提高利用后验解释基于他们的准确性预测算法和模型选择9]。

金融风险预警是由依赖信息技术,建立模糊数学模型,和其他的分析方法开发一个合适的财务风险预警指标体系,主要是基于企业的内部控制信息,外部环境数据、行业数据和财务报表数据。检查公司的财务状况;金融风险的概率生产估计;和操作过程动态变化的基础上还将检查一系列指标。简而言之,金融风险预警是指检测的过程中,监视和控制一个公司的财务风险10]。承担风险是一个不可避免的结果进行投资,因此它是经济活动的必要条件。太多的风险,另一方面,可能会导致不可持续的损失甚至系统性危机。不幸的是,风险是一个潜变量,必须来自可观测的结果,而不是一个单一的定义。因此,任何风险评估是主观的基于统计模型,必须承担。有大量的“风险米”可供选择,其中有许多截然不同的结果,使得它难以区分他们(11]。

人工授精技术通常被认为是与自动化、方程的计算机取代人类在职业和决策,但人工智能应用于增强人机交互,如风险或重点跟踪和监测在招聘,与人类覆盖部分自动驾驶汽车,建议客户服务脚本,和审计,欺诈检测,和司法判决12]。“人工智能的出现从根本上改变了交易,金融研究,风险分析、财富管理、投资银行、金融行业等领域,导致利润增强和社会效益。“AI公司和企业家的降低了资本成本,扩大金融服务的类型提供一个更大的更多样化的人口的投资者,并使客户更容易银行和投资,但是它同时也带来了重大风险(13]。

自1970年代以来,计算机资源的使用决策包括风险领域的广泛研究信息技术作为决策支持系统(14]。2012年,Otim等人发表了一项研究,侧重于评估IT投资的收益和风险。这些投资包括范围广泛的利益相关者,迫使组织政治的考虑15]。工业决策涉及多个利益相关者,多个参数,由这些的存在在一定程度上影响多个利益相关者。风险分析在制造业多个标准,风险评价技术也可以应用(16]。此外,许多其他框架也提出了风险评估和其他问题在产品开发过程的早期。金融市场是非线性的,具有微妙的动态结构和交互是人类很难把握。由于这个原因,人工神经网络已被广泛应用于这一领域。人工神经网络可以用来预测外汇市场,银行流动性、通货膨胀,和各种各样的其他金融需求。“金融模型,预测投资者行为、财务评估、信贷审批、资产组合管理、首次公开发行(ipo)定价和评估最优资本结构是企业融资的几个应用程序也可以受益于安技术”(17]。神经网络是人工智能的工具,已被证明是非常有效的检测模式在复杂的数据结构,尤其是那些具有非线性关系(14]。

AI可以逐步提供可靠的实时信息在所有形式的公司正在采取的风险。实时的建议将会变得更加普遍作为数据组织变得更加面向人工智能使用。先发制人的警告后下一步的风险实时风险意识。AI-driven风险管理框架使企业能够准确预测公司风险,如经济、信用、操作风险,提前。机器学习技术这一功能,传统的统计技术不可能希望匹配(18]。金融大数据包括相关的财务细节如“银行间流动性”和“全球资本流动”,可以用来执行任务,如风险预警和风险识别为了应对风险通过金融监管19]。“大数据用于分析风险来源和风险之间的相互关系多样化基于系统性金融风险的金融大数据。实际数据的应用在金融系统性风险的主要挑战之一是财务数据保存在严格控制”(20.]。

人工智能可以帮助组织在不同阶段的风险管理过程,包括确定风险,评估,评估和分析它的影响(21]。它也可能帮助选择一个有效的减少风险计划和工具,促进风险转移或交易的识别。因此,人工智能组织风险管理策略的使用扩展到新的领域,如审查详细的文书工作和开展例行程序,开始试图避免外部损失如信用卡欺诈检测的洗钱,需要大型数据集的分析。

总之,这增加了工作,以各种方式扩展了现有文献。首先,它扩展了应用人工智能技术在巴基斯坦的非金融行业通过提供一个详细的概述的技术用于精确的风险预测。它提供了基本的信息使用不同的技术,如随机森林,决策树,朴素贝叶斯和资讯。第二,它开发一个框架以及机器学习算法来帮助从业者和实业家利用AI提供最高精度水平的最佳技术和最小误差值首次在巴基斯坦的非金融行业。最后,我们检查这些技术如何提高风险评估的准确性水平在企业部门通过测试数据使用python软件。

3所示。方法

本文旨在通过提供最高精度预测的风险水平通过应用人工智能基于机器学习算法,将导致企业风险管理的自动化。准确预测的各种类型的风险在企业部门通过基于机器学习算法的人工智能技术,使用二次数据收集技术,定量数据收集研究。分层随机抽样利用研究。的总数在巴基斯坦注册的美国公司,证券交易所(PSX)是540:443非金融行业的公司,97年公司的金融部门。这443家公司,活跃的非金融企业的数据是330。公司然后选择使用分层抽样技术研究;200年样本公司在巴基斯坦的非金融行业,从2006年到2020年,已经选择了这个研究来确定风险的准确预测巴基斯坦非金融公司注册的证券交易所(PSX)。共有200家非金融公司市值高价值选择样本。预测企业的风险,财务风险,声誉风险,操作风险,战略风险,和发展中不同的机器学习技术的算法,使用的变量是负债与股东权益比率,debt-to-capital比率,degree-of-combined杠杆,利息保障比率,debt-to-asset比率,产权比率。Python版本3.9.2在这项研究中测试数据用于风险预测的非金融公司巴基斯坦证交所上市。 Different machine learning algorithms that are suited for this scenario were used to make the prediction.

数据被收集后,描述性统计和可视化是用来评估他们的属性。准备数据集进行分析的目的,以便它可以使用作为算法的输入是一个最困难的过程。结构的数据,样本的频率,缺失值,和组学包括所有应考虑,可能需要不同的知识水平。本文首次预处理的数据集来确定财务比率用于预测各种类型的风险在企业方面。数据集被分割成两个子集后初始数据预处理步骤:一个训练集(从2006年到2018年)训练模型和测试集(从2019年到2020年)测试模型。二千零六行用于培训和400行用于测试从当前数据集。下一步是确定使用哪个模型和如何分区的数据。本研究利用学习模型等随机森林,然而,朴素贝叶斯决策树。这些模型是基于财务比率的估计风险。学习模型然后使用关键评估指标包括RMSE和梅,并给出了研究结果。图1描述了该方法的整个过程进行了研究。

3.1。技术使用

在过去的几年里,一直是机器学习方法和扩散增加激增的影响这些方法在金融领域。这些方法在投资组合的优化,风险建模、趋势和情感分析的新闻,和各种其他用例,帮助投资管理。

分类和回归的主要研究领域是在监督学习,这个方法被频繁应用于构建预测模型。相比传统的回归,回归机器学习采用回归算法,允许使用多变量作为独立变量被自动删除之前如果他们缺乏解释力。因为数据科学家获得了大量的数据,这是一个至关重要的功能。它还减少了所需的推理找到适当的独立变量(18]。

3.1.1。随机森林(RF)

随机森林是一个监督学习技术,在培训期间,许多决策树构造和输出的类的模式是类或个体的平均预测树。它是用于分类、回归、和其他应用程序。决策树是一个树结构,用于做出决定(可以是一个二叉树或二进制树)。nonleaf的每一个节点代表一个功能测试,与每个部门反映在一系列特征属性的输出值和每个叶节点类别。此外,图2已被证明概略地显示群随机森林模型。分类器射频的目标是结合许多二进制DTs由生成一些引导从学习样本实例l随机选择一个小组的预测因子X在每一个节点。在他们的研究中,Uddin等人使用一个索尔福德所产生的射频系统的升级版本,通过一些特殊的添加和修改。通过选择目标变量和相关属性,射频方法评估商业智能(BI)和其他领域,如数据集,这是本研究的主要话题。射频的优点是,它可以自动选择从大量可能的预测因素;例如,射频方法可以确定最佳预测值从成千上万的变量(22]。

3.1.2。决策树

决策树是一种监督机器学习技术,可用于解决分类和回归问题。决策树只不过是一组连续的决定导致某种结果。我们可以看到图解说明技术的决策树模型图3监督的机器学习技术,并在之后的方法用于pretention的风险。特征/属性和条件可以改变取决于数据和问题的复杂性,但是核心的概念是相同的。决策树,从而产生一系列的判断基于一组特征/属性的数据。

3.1.3。朴素贝叶斯

朴素贝叶斯分类器忽略可能输入的依赖(相关性)。对于一个给定的类变量,变量是有条件地相互独立的所有特性。下课后概率估计,最后的决定对于一个类是由(23]。朴素贝叶斯分类器,这是基于著名的贝叶斯概率定理,以生产简单但有效的模型,特别是在域的文档分类和风险预测。贝叶斯定理支撑朴素贝叶斯分类器的概率模型,以及形容词天真指的是假设一个数据集的特点是相互独立的。Naive Bayes分类器使用在各种各样的领域,因为他们通常是健壮的,易于实现,快速,准确。某些情况下包括疾病诊断和治疗决策,RNA序列分类的分类调查,垃圾邮件过滤电子邮件客户机,和许多其他人。这种方法显示在图的插图4

3.1.4。然而,

它是一种非参数分类器,使得预测没有建立一个模型通过使用距离测量。训练样本的类标签和特征向量存储在资讯培训阶段。测试阶段,新的向量之间的距离和所有先前存储向量计算,和K选择最接近的样品。类标签然后再分配基于大多数邻居的类(23]。

“事例的方法假设新病例/数据和现有的情况是相似的和地方的新病例最喜欢现有类别的类别。事例的算法节省了所有现有数据和分类新数据点根据其相似性。这意味着新的数据可以快速使用事例的方法分为一个良好定义的类别。事例的方法可以用于回归和分类,但它是更常见的用于分类的任务。事例的算法是一种非参数算法,这意味着它对底层数据没有假设。它也被称为一个懒散的学习算法,因为它不马上从训练集;相反,它节省了数据集和执行一个动作的时候对它进行分类。资讯的方法简单地存储数据集在训练阶段,当它接收到新的数据,它将它分为很喜欢新数据的一个类别。“这是如图5

3.2。分类器使用一个毫升技术的优点

每种类型的分类器作为毫升技术可以评价为有一些优点和缺点用作未来的预测;例如,安具有用户友好的和容易的用于实现结果。安的很大的优势是开发简单的基于机器学习的和用户友好的算法,它将提供有效的解决方案相比,传统的评估技术。简而言之,我们可以说,安是多才多艺的,用于不同的应用程序和问题解决方案。这是一个通用的分类器(24]。它可以用于许多应用程序和问题。然而,除了优点,安也有一些缺点;例如,它会与一个巨大的数据慢,准备培训(25]。除了上面的朴素贝叶斯分类器的技术的优势,我们需要少量的训练数据,这将被转换成适当的分类可以很容易地实现具有高识别率(26]。

3.3。模型的评价参数

在这个研究,模型的性能评估是基于两个评价参数,即均方根误差(RMSE)和平均绝对误差(MAE)这些测量显示我们如何准确预测和实际数据有多遥远。

3.3.1。均方根误差(RMSE)

模型预测的值之间的差异和实际值测量使用均方根误差(RMSE)。均方根误差(RMSE)是一种广泛使用的评价参数,它表示有多少错误的系统使预测。RMSE值越低,模型越好。

在数学上,RMSE由下列公式计算: 在哪里在数据集实例的数量, 是一个向量包含所有特征值(包括标签)th例如, 是它的标签(实例)的期望的输出值,X是一个矩阵,其中包含所有特征值的所有实例(包括标签)的数据集,h是系统的预测函数,也称为假说和RMSE (X,h)是集上的函数测量的例子使用的假设h

3.3.2。平均绝对误差(MAE)

错误的绝对值的平均值称为平均绝对误差(MAE)。梅的价值越低,模型越好。

在数学上,美是由下列公式计算:

4所示。分析和结果

在这项研究中,我们使用不同的机器学习技术和风险模型预测等随机森林,决策树,然而,和朴素贝叶斯的评估是基于RMSE和梅。处理数据模型,数据集的所有六个特性分为训练集和测试集。共有六个变量(财务比率)是用于风险的准确预测debt-to-capital比率,负债与股东权益比率、利息保障比率,程度的综合利用,debt-to-asset比率,产权比率。这六个变量,debt-to-asset比和股票比我们的目标特性的预测是基于剩余的四个变量。根据预测结果,我们将选择这些模型的错误率相对较小的比其他模型。基本上,比较标准的技术更准确地预测风险是由错误的值。较小的值的误差评价参数,技术越好。

4.1。分析的第一个目标变量:Debt-to-Asset比率

在表1,四个机器学习技术的结果给出了误差测量是基于RMSE debt-to-asset比和梅变量。在这里,我们将分析这四种技术哪一个是最好的和最精确的预测风险更少的错误值。

朴素贝叶斯方法的结果显示RMSE值为0.25266和0.20181 MAE的价值。同样,结果RMSE和梅从资讯技术获得较低的值相对于朴素贝叶斯方法。RMSE值获得资讯是0.17256比朴素贝叶斯的RMSE值较小(即。0.25266)。同样,美应用资讯技术获得的价值是0.08551,相比也少梅从朴素贝叶斯(即获得值。0.20181)。

在表1决策树结果(个人)和随机森林2,3,5,7,10,15决策树也已表明,应用于我们的数据集对准确预测使用RMSE和梅作为风险评价矩阵。我们可以看到,决策树模型RMSE和梅值0.09421和0.03592,分别。但是随机森林方法与不同数量的决策树给RMSE值相对较低和梅比单一的决策树模型。如果我们基于RMSE参数作出预测,随机森林方法10决策树给RMSE的最小值,即0.08093相比单一决策树和随机森林2,3,5,7,15决策树。如果我们基于MAE参数作出预测,随机森林方法15决策树给梅的最小值,即0.03049相比单一决策树和随机森林2,3,5,7,10决策树。因此,随机森林与更多的决策树更准确的结果,和这种技术的原因比单一决策树是它有很多决策树结合的力量,它不依赖于单一的决策树的特性的相关性。值表1中大胆的含义是,RMSE和梅是绩效评估方法,决定最好的表现技术现有技术中使用的基于最小变异的研究论文像在定量粗体显示的数据显示了现有最小的变化。

以下4.4.1。第一个目标变量分析的结果

我们可以集体说,为评价参数、随机森林方法优于最小的RMSE值和梅。所以,总的来说,我们可以说,从上述技术表,随机森林方法优于其他三种技术,也就是说,决策树,然而,朴素贝叶斯。

最后,风险预测的精确度用股本比率变量和不同的机器学习技术如表所示2

4.2。分析第二个目标变量:股本比率

在表3,四个机器学习技术的结果给出了误差测量是基于RMSE和梅为变量股本比率。在这里,我们将分析这四种技术哪一个是最好的和最精确的预测风险更少的错误值。

朴素贝叶斯方法的结果显示RMSE值为0.30508和0.21779 MAE的价值。同样,结果RMSE和梅从资讯技术获得较低的值相对于朴素贝叶斯方法。RMSE值获得资讯是0.13878比朴素贝叶斯的RMSE值较小(即。0.30508)。同样,美应用资讯技术获得的价值是0.03791,也少与美从朴素贝叶斯(即获得值。0.21779)。

在表3决策树结果(个人)和随机森林2,3,5,7,10,15决策树也已表明,应用于我们的数据集对准确预测使用RMSE和梅作为风险评价矩阵。我们可以看到,决策树模型RMSE和梅值0.05684和0.01825,分别。但是随机森林方法与不同数量的决策树给RMSE值相对较低和梅比个体决策树模型。如果我们基于RMSE参数作出预测,随机森林与10决策树技术RMSE的最小值,即0.05194相比单一决策树和随机森林2,3,5,7,15决策树。如果我们基于MAE参数作出预测,随机森林方法15决策树给梅的最小值,即0.01825相比单一决策树和随机森林2,3,5,7,10决策树。因此,随机森林与更多的决策树更准确的结果,和这种技术的原因比单一决策树是它有很多决策树结合的力量,它不依赖于单一的决策树的特性的相关性。大胆的值如表1所示意味着技术更好的基于RMSE和梅值。在门外汉方法中,RMSE和梅决定人工智能技术将超越技术使用的研究。

4.2.1。准备第二个目标变量分析的结果

我们可以集体说,为评价参数、随机森林方法优于最少的RMSE值和梅。所以,总的来说,我们可以说,从上述技术表3,随机森林方法优于其他三种技术,也就是说,决策树,然而,朴素贝叶斯。

机器学习技术的比较如表所示4

5。讨论

5.1。本研究对社会的好处
5.1.1。管理的影响

本研究在理论上的贡献(即。,学术界和实践(即。行业)。对学术界来说,这项研究将有助于提供一个更好的理解在非金融部门和人工智能技术的影响,人工智能技术在风险预测和企业风险管理的自动化。它将提供基本的信息使用不同的技术,如随机森林,决策树,然而,朴素贝叶斯等等,这些技术如何提高企业风险评估的精度水平。它还将提供的信息来源和指示未来的研究和文献综述。对于行业来说,这将提供一个了解人工智能技术和实践需要通过组织更好地预测他们的财务,运营,战略和声誉风险。从本研究的结果,可以分析公司的优势在风险预测人工智能技术的结合。这项研究将帮助他们分析人工智能技术的缓解和重要性的自动化企业的风险,这将帮助他们从长远来看。这些技术将特别有用促进增长和减少人为错误通过自动化公司的企业风险。它将帮助投资者如保险公司、银行、风险投资公司,在更好的信贷决策和并购,简化任务,改善公司的财务效率。公司可以很容易地验证潜在的合作伙伴和客户的信贷通过自动化风险评估的过程,它可以帮助他们确定他们是信用风险。

5.1.2中。社会和方法论的意义

PACRA等在巴基斯坦,组织已经开始使用人工智能策略协助发放信用评分机构。这种算法模式将帮助快速和准确的预测风险。巴基斯坦的非金融公司应该努力利用先进的统计模型需要准确地估计和减少的风险已经比以往任何时候更重要的企业变得更大、更复杂。提出了研究的应用程序(即。,我米plication of AI) in different fields of finance is also shown in Figure6。与之前应用统计或模拟方法,精确地测量接触动态组合的金融市场正变得越来越困难的主要组织规模庞大和复杂的金融产品组合。这些人工智能方法与最小错误率作为信标光的初始人工智能领域的金融在非金融公司在巴基斯坦。他们将在长期受益的公司,也可以有利于非金融公司通过提供一个完整的描述的最新技术,他们的潜在用途,和成功应用的可能性和准确预测风险。我们的研究结果是有价值的学者和实践者与投资管理感兴趣,特别是量化投资。

6。结论

这个研究的目的是调查、评估和开发机器学习算法,可以准确地预测风险最小误差的非金融公司PSX上市。通过提供一个完整的描述的最新技术,他们的潜在用途,成功应用的可能性和准确地预测风险,这些类型的模型可以用于非金融企业在投资管理中,特别是量化投资。

6.1。我们的贡献

在本研究中,我们首先收集辅助数据,以及数据的定量性质。我们利用分层随机抽样,选择200年样本公司在巴基斯坦的非金融行业,从2006年到2020年,这项研究来确定风险的准确预测巴基斯坦非金融企业注册的证券交易所(PSX)。公司拥有高市值值选为样本。预测企业的风险,财务风险,声誉风险,操作风险,战略风险,和发展中不同的机器学习技术的算法,我们使用了负债与股东权益比率变量,debt-to-capital比率,程度的综合利用,利息保障比率,debt-to-asset比率,产权比率。Python版本3.9.2在这项研究中测试数据用于风险预测的非金融公司巴基斯坦证交所上市。我们使用不同的机器学习算法适合这个场景做出预测,如随机森林,决策树,再(资讯),朴素贝叶斯和我们使用各种上述风险预测技术的性能分析的机器学习。使用各种毫升风险预测方法的性能分析进行了分析通过使用两个RMSE评价参数和梅。

6.2。结果和结论

第一个目标变量的结果,也就是说,debt-to-asset比率表明,随机森林的RMSE和梅值(即。,0.08093和0.03049)相对较低,相比其他技术,如决策树,然而,朴素贝叶斯。所以随机森林方法优于其他技术相比,它给的RMSE值最小,美。随机森林方法是最适合准确预测的风险给予最小误差值,和这种技术的原因比其他技术是众多决策树结合的力量,它不依赖于一个单一的决策树的特性的相关性。因此,对于准确预测风险的非金融公司的巴基斯坦使用debt-to-asset比率作为目标功能,随机森林是最好的健康和更好的技术。

第二个目标变量的结果,也就是说,产权比率还表明,随机森林的RMSE和梅值(即。,0.05194 and 0.02019), are comparatively low as compared to the other techniques such as decision tree, KNN, and naïve Bayes. So the random forest technique outperforms compared to the rest of the techniques as it gives the least values of RMSE and MAE. The random forest technique is the best fit for accurate prediction of risk as it is giving the minimum error values, and the reason for this technique to perform better than other techniques is that it has the power of numerous decision trees combined in it and it does not rely on a single decision tree’s feature relevance. So, for accurate prediction of risk of nonfinancial firms of Pakistan using debt-to-asset ratio as a target feature, random forest is the best fit and preferable technique.

共同的目标功能,随机森林被认为是表现最好的技术等人工智能技术监管,也就是说,决策树,然而,朴素贝叶斯给最高准确率提供最小误差的RMSE值和梅。这种人工智能的方法最少的错误率会作为信标光的初始人工智能领域的巴基斯坦在非金融企业融资。它将帮助债权人确定信用风险,帮助投资者寻找准确的风险预测之前投资公司。

6.3。研究的局限性

本研究仅限于巴基斯坦非金融公司,它不包括非金融企业的所有南亚国家由于时间的短缺。这项研究可能对其他类似国家进一步验证其结果或能力来识别结果的变化在不同的市场和理解这种变化关系,扩大范围并验证其结果。此外,两个评价参数用于本研究在此基础上预测了。多个评价参数如准确性、F1分数,和混淆矩阵也可以合并,进一步验证结果。分析、讨论和比较的ML算法是当前研究中使用。

6.4。未来的工作

未来的研究人员可以专注于影响和限制在未来提高研究的质量。本研究进行了非金融公司只在巴基斯坦。未来的研究人员可以结合其他南亚国家的数据,可以扩大这项研究预测其他南亚国家非金融公司的风险。目前的研究需要扩大和富含更详细的分析工作假设随机森林比决策树技术是最好的预测,然而,朴素贝叶斯使用其他变量对风险的预测,而不是财务比率。多个评价参数如准确性、F1分数,和混淆矩阵也可以合并,进一步验证结果。在未来,我们可以用毫升方法和计量经济学预测模型更精确的结果,可以检查是否这两种方法的混合优于或优于个人的方法。

数据可用性

本研究分析现有的辅助数据,这是公开可用的位置数据流数据库和公司年度报告的样本。因此,我们使用可用的辅助数据在数据流数据库和公司年度报告的样本已经引用的论文的方法部分。此外,从DataStream数据对每个人都是开放的和可用的数据的数据库。

的利益冲突

作者宣称没有利益冲突。