文摘

分类基于基因表达提供了洞察的癌症治疗策略。因此,开发机器学习方法可以成功区分癌症亚型或正常与样品是很重要的。本工作讨论监督学习技术,曾对癌症进行分类。此外,基于属性的两步特征选择方法估算方法(例如,ReliefF)和遗传算法来找到最好的一组基因可以区分癌症亚型或正常和肿瘤样本。不同的分类方法的应用程序(如决策树,再,支持向量机(SVM),装袋,和随机森林)5日癌症数据集显示,没有普遍优于其他分类方法。然而,再和线性支持向量机通常比其他分类器提高分类的性能。最后,结合不同类型的基因组数据(如基因表达数据和蛋白质间交互作用)增加预测精度比单独使用基因表达。