TY -的A2 -阿里,拉赫曼盟——刘、杨AU -李,香非盟- Chen Xianbang AU -王,Xi AU -李,华强PY - 2020 DA - 2020/05/18 TI -高性能机器学习对大规模数据分类考虑类失衡SP - 1953461六世- 2020 AB -目前,数据分类是最重要的一个分析数据的方法。然而,随着数据采集、传输和存储技术的发展,数据的规模急剧增加。此外,由于数据集中存在多个类和数据分布不平衡,类不平衡问题也逐渐突出。传统的机器学习算法缺乏处理上述问题的能力,这可能会严重影响分类的效率和精度。因此,本文提出了一种改进的人工神经网络来实现对不平衡大容量数据的高性能分类。首先,Borderline-SMOTE(合成少数过采样技术)算法是用来平衡训练数据集,可能旨在提高培训的反向传播神经网络(摘要),然后,零均值,batch-normalization,纠正线性单元(ReLU)进一步用来优化输入层和隐层的摘要。最后,利用Hadoop框架实现了改进后的基于集成学习的BPNN并行化。根据实验结果可以总结出肯定的结论。利用Borderline-SMOTE算法对不平衡训练数据集进行了平衡,提高了训练性能和分类精度。对输入层和隐含层的改进也提高了训练的收敛性。 The parallelization and the ensemble learning techniques enable BPNN to implement the high-performance large-scale data classification. The experimental results show the effectiveness of the presented classification algorithm. SN - 1058-9244 UR - https://doi.org/10.1155/2020/1953461 DO - 10.1155/2020/1953461 JF - Scientific Programming PB - Hindawi KW - ER -