农村银行的概念被引入由于有限的农村商业银行分支机构为农村发展动员他们的资源。也相信农村银行等金融机构强大的工具来减轻贫困。然而,一些银行通过非法活动而增加人们的负担和管理不善的资源。评估银行的性能使用一组财务比率一直是一个有趣和具有挑战性的问题,许多研究人员和从业人员。识别因素准确地预测公司业绩是任何决策者极大的兴趣。该研究使用ARB的财务比率作为独立变量来评估性能的农村银行,后来使用随机森林算法找出最相关的变量模型。一个数据集来自不同的银行。本研究使用三个决策树算法,即C5.0, C4.5和购物车,构建各种决策树预测模型。研究的结果表明,C5.0算法给出了精度为100%,其次是CART算法的准确性达84.6%,最后,平均83.34 C4.5算法的准确性。研究中,因此,建议使用C5.0预测模型在预测在加纳农村银行的财务业绩。
为了快速通道在加纳农村的发展,农村银行。农村银行协会(ARB)描述了一些农村银行的角色如下:培养农村居民储蓄的习惯,动员资源锁定在向银行系统,以促进农村地区的发展,并确定可行的行业在各自领域的投资和发展
本文的其余部分组织如下:第二部分(部分
不证自明的,基于实证观察,大多数金融机构在加纳多年来经营失败了,因为他们无法预测他们的财务状况与进展或失败。一个机构像钻石小额贷款有限公司(DKM)公司,于2005年开始其业务,其业务已暂停中央银行的加纳后,违反了银行法。由花旗银行商业新闻分析,该公司未能保留足够的资产,以满足其负债储户(
根据(
机器学习是计算机科学的一个分支,它的发展从模式识别的研究和计算学习理论在人工智能
作者的
此外,(
企业破产的预测是一个重要和广泛的研究课题,因为它可以产生重大影响银行贷款决策和盈利能力。Atiya [
除了使用决策树的预测,一个有趣的技术在预测神经网络(
这个项目的主要目的是开发一个预测框架能够分类农村银行的财务状况在加纳。这个不可能是没有必要的步骤完成数据采集、数据预处理、特征选择和分类。框架是如图的概述
提出了DT模型分类农村银行的财务状况。
本研究使用农村银行在加纳注册协会下的农村银行在加纳作为案例研究。根据加纳银行,截至2018年8月,农村银行的数量是已知的法律是一百四十五(145)(
ARB的数据收集顶点银行Sunyani分支,在接下来的季度。
2014年6月第二季度结束。
2014年12月第四季度结束。
2015年12月第四季度结束。
2017年9月第三季度结束。
2018年6月第二季度结束。
因变量的状态是金融机构的金融时期季度末是否强大,令人满意的,公平的,边际,或者不满意。如果一个金融时期被标记为强,满意,公平,边缘,或不满意,它将继续,直到下一次金融周期的证明。预处理过程的最后,我们只剩下六百五十七(657)数据操作单位(研究),九十九(99)被强,三百三十(330)满意,一百六十四(164)公平,六十四(64)被边缘化。表
各种类使用ARB对农村银行的财务状况进行分类(来源:农村银行协会的季度报告,2017)。
| 评级范围 | 评级分析 | 评级分析的解释 | 研究 |
|---|---|---|---|
| 1.0 - -1.50 | 强大的 | 声音在所有指标,不需要监督的反应 | 99年 |
| 1.50 - -2.50 | 令人满意的 | 从根本上与适度矫正缺点声音;监督反应有限 | 330年 |
| 2.50 - -3.50 | 公平(手表类别) | 组合的弱点,如果不能得到解决,将会严重。手表分类 | 164年 |
| 3.50 - -4.50 | 边际(失败的风险的迹象) | 无节制的弱点:除非妥善解决,可能会损害未来的生存能力。需要密切监督。 | 64年 |
| 4.50 - -5.0 | 不满意(失败的高度明显) | 失败在短期内的风险很高。需要持续的监督。 | 0 |
独立变量或预测研究中使用的各种财务比率或参数使用ARB顶点银行来评估他们的成员农村银行的性能。他们在四个大类,即资本、资产包括资产质量和资产利用率,收益/盈利能力和流动性。广泛的主题已经详细为16(16)参数评估表
独立变量使用ARB(来源:农村银行协会的季度报告,2017)。
| 独立变量 | |||
|---|---|---|---|
| 实收资本 | 损失/不良贷款率 | 其他资产对总资产比率 | 盈利资产回报率 |
| 资本充足率(汽车) | 盈利资产对总资产比率 | 房地产、工厂和设备总资产比率 | 成本收入比 |
| 逾期比率 | 流动资产占总资产比率 | 资产回报率(ROA) | 平均主要准备金率 |
| 不良贷款的不良贷款比率 | 可贷资金的比例 | 股本回报率(ROE) | 平均二次准备金率 |
C5.0是由罗斯1994年昆兰。它通过分裂示例基于领域提供最大信息增益。每个定义的子样品第一次分裂然后再次分裂,通常基于一个不同的领域。并重复这个过程,直到次级样本不能进一步分裂。重复这个过程,直到次级样本不能进一步分裂。0.1.2 C5.0 R包版本是由马克斯et al。
分类和回归树是由Breiman et al。
C4.5决策树构建从一组训练数据和训练数据是一组
随机森林算法是非常受欢迎的特性选择数据科学,因为它基于树的策略有多好,他们自然排名的节点的纯度。树的节点,大大有助于纯度已知或被视为最重要的。文献[
在本文中,我们使用一个类似技术的提出(
提出了DT模型分类农村银行的财务状况如图
最初,所有16(16)被用来预测因子构建随机ror模型,模型的总结,这是观察到13(13)的预测(即。星号的预测(
模型的预测出来的错误率10.1%的执行时间2.11秒,而十三的模型预测出来的错误率11.05%的执行时间1.75秒。
在构建C5.0模型使用数据集的预测和十一的预测,模型推出了相同的结果。这个图中可以看到
在构建C4.5与训练数据集包含所有预测模型,该模型出来94.12%的准确性和测试数据时也显示,82.83%用于预测(即。,only 39 out of 53 banks with fair status, only 10 out of 14 banks with marginal status, only 89 out of 97 banks with satisfactory status, and only 26 out of 34 banks with strong status were predicted correctly). Using 10-fold cross validation, the model gave a Kappa value of 0.6908. More details about the C4.5 models with all sixteen predictors can be seen in Table
在构建C4.5模型训练数据集,包含13个预测,该模型出来93.87%的准确率和还显示83.84%的精度测试数据用于预测时(即。,only 40 out of 53 banks with fair status, only 12 out of 14 banks with marginal status, only 81 out of 97 banks with satisfactory status, and only 33 out of 34 banks with strong status were predicted correctly). More details about the C4.5 models with the eleven predictors can be seen in Table
购物车在建筑模型的训练数据集包含所有的预测,模型还推出了87.87%的准确性和测试数据时显示,87.88%用于预测(即。,only 46 out of 58 banks with fair status, only 15 out of 18 banks with marginal status, only 94 out of 98 banks with satisfactory status, and only 19 out of 24 banks with strong status were predicted correctly). More details about this model can be seen in Table
购物车在建筑模型的训练数据集包含11预测,模型推出了一个81.31%的准确率测试数据用于预测时(即。,only 37 out of 58 banks with fair status, only 19 out of 18 banks with marginal status, only 91 out of 98 banks with satisfactory status, and only 14 out of 24 banks with strong status were predicted correctly). Cross-validating this model, the CV model gave the best CP of 0 but came out with an accuracy less than the initial CP of 0.01 (this can be seen from the graph at the right side of Figure
随机森林模型的初始预测错误率有过失不到十三的预测。然而,第二个模型获得更好的执行时间权衡的结果。此外,随着最相关的财务比率的随机森林模型拆散,在加纳农村银行可以更关注获得更好的结果在这些比例,以达到更好的财务状况。
图
相关(
| 独立变量 | |||
|---|---|---|---|
| 实收资本 | 损失/不良贷款率 |
其他资产对总资产比率 |
盈利资产回报率 |
| 资本充足率(汽车) |
盈利资产对总资产比率 |
房地产、工厂和设备总资产比率 |
成本收入比 |
| 逾期比率 |
流动资产占总资产比率 |
资产回报率(ROA) |
平均主要准备金率 |
| 不良贷款的不良贷款比率 |
可贷资金的比例 | 股本回报率(ROE) |
平均二次准备金率 |
交叉验证车模型图。
图形表示的模型精度。
简洁地,机器学习算法使事情更容易,因为他们从优先级和预测未来事件。有很多机器学习算法,但是很容易精明的大多数人来说,特别是数学倾向的人来说,是决策树因其易于理解的图形化表示。本研究使用DT算法建立模型,可以预测金融机构的财务状况。也我们的研究旨在确定最具影响的财务比率在评估这些金融机构的性能使用随机森林变量选择方法的13个16预测成为最相关的模型。我们的模型显示精度高使用我们的数据集。这描述了DT算法可以精确预测时,金融机构的失败。C5.0算法精度最高的三个算法我们使用,其次是CART算法,最后但并非最不重要,C4.5平均。其他统计信息中可以看到各种DT模型表
在各种适应DT算法的统计信息。
| 决策树算法 | 精度 |
|
卡巴 | 没有信息率 | |
|---|---|---|---|---|---|
| 与所有初始预测数据集 | C5.0 | 1 | 2.2 |
1 | 0.4899 |
| C4.5 | 0.9412 | 2.2 |
0.9094 | 0.5076 | |
| 车 | 0.8787 | 2.2 |
0.8078 | 0.4949 | |
|
|
|||||
| 与13个预测数据集 | C5.0 | 1 | 2.2 |
1 | 0.4646 |
| C4.5 | 0.9387 | 2.2 |
0.9038 | 0.4646 | |
| 车 | 0.8131 | 2.2 |
0.7048 | 0.4949 | |
未来的发展方向,我们的目标是增加数据集数量大于用于这个项目,因为它可以帮助改善精度超过获得的这个项目。同时,商业银行的财务数据可以用来代替使用农村银行的财务数据,只要他们符合独立变量用于构建模型。此外,在未来,我们希望把传统机器学习深度学习,以有效地解决农村银行的破产在加纳。
为我们提供了数据的机构明确表示,这是限制和不应该共享。
作者宣称没有利益冲突。