TY -的A2 Garcia-Diaz韦森特盟——俄南、AytuğPY - 2019 DA - 2019/03/03 TI -共识Clustering-Based欠采样方法不平衡学习SP - 5901087六世- 2019 AB类不平衡是一个重要的问题,在机器学习应用程序遇到一个类(称为,少数类)有非常小的实例数量和其他类(称为,大多数类)有巨大数量的实例。不平衡数据集可以在几个实际应用具有十分重要的意义,包括医疗诊断、恶意软件检测、异常识别、破产预测和垃圾邮件过滤。在本文中,我们提出一个共识集群based-undersampling不平衡的学习方法。在这个方案中,多数类的实例的数量undersampled利用clustering-based方案达成共识。在实证分析中,44个小规模和大规模不平衡分类基准2利用。聚类方案的共识,五个聚类算法(即 k则, k模式, k——+ +、自组织映射和戴安娜算法)及其组合考虑在内。在分类阶段,5个监督学习方法(即朴素贝叶斯、逻辑回归支持向量机,随机森林,和 k最近邻居算法)和三个合奏学习者的方法(即演算法、装袋和随机子空间算法)是利用。实证结果表明,文中提出的异构共识clustering-based欠采样方案收益更好的预测性能。SN - 1058 - 9244 UR - https://doi.org/10.1155/2019/5901087 - 10.1155 / 2019/5901087摩根富林明科学编程PB - Hindawi KW - ER