TY - Jour A2 - Chen,Shyi-Ming Au - Ghosh,Monalisa Au - Sanyal,Goutam Py - 2018 DA - 2018/10/01 TI - 基于集合特征选择方案的多分类器的性能评估SP - 8909357 VL- 2018年AB - 情绪分类或情绪分析已被确认为开放式研究领域。近年来,通过应用各种方法来在这些领域进行巨大的研究工作。由于高维特征集可能会影响情绪分析的性能,因此特征生成和选择是对文本挖掘的影响。本文调查了广泛使用的特征选择方法(IG,Chi-Square和Gini指数)与Unigram和Bigram特征在四台机器学习分类算法(MNB,SVM,KNN和ME)上设置的无能或无能。所提出的方法是在三个标准数据集的基础上进行评估,即IMDB电影审查和电子和厨房产品审查数据集。
最初,通过施加n-gram方法提取Unigram和Bigram特征。此外,我们生成复合特征向量compulubi(Unigram + bigram),它被发送到特征选择方法信息增益(Ig),Gini索引(Gi)和Chi-Square(Chi)以获得最佳特征子集为每个功能分配分数。这些方法根据其分数为特征提供排名;因此,可以容易地生成突出的特征向量(Compig,Compgi和Copchi)以进行分类。最后,机器学习分类器SVM,MNB,KNN和ME使用了突出的特征向量,用于将审查文档分类为正或负面。通过评估方法(例如精度,召回和F测量)等评估算法的性能。实验结果表明,复合特征向量实现的性能比UNIGRAM特征更好,这是令人鼓舞的,也可以与相关的研究相媲美。在最高精度方面,从信息增益的组合获得了最佳结果。SN - 1687-9724 UR - https://doi.org/10.1155/2018/8909357 Do - 10.1155/2018 / 8909357 JF - 应用计算智能和软计算PB - Hindawi KW - ER -