研究文章

iBLP: XGBoost-Based预测识别生物荧光蛋白

表3

公布的基准数据集BLPs的预测。

数据集 一年 训练集 独立的测试集 序列的身份 参考
BLPs Non-BLPs BLPs Non-BLPs

D1 2011年 300年 300年 141年 18202年 ≤40% (CD-HIT) (10]
2012年 300年 300年 139年 18202年 ≤40% (CD-HIT) (11]
2013年 199年 199年 141年 137年 ≤40% (CD-HIT) (12]
2014年 274年 274年 234年 220年 ≤40% (CD-HIT) (13]
2015年 441年 13446年 NA NA ≤40% (CD-HIT) (14]
D2 2017年 863年 7093年 690年 5674年 ≤30% (BlastClust) (15]

NA表示不适用。