研究文章

从高通量表观基因组学数据预测模型的基因调控

表5

正确分类的实例在每个记录的子集。集过滤,以避免重叠基因的身体,发起人或背面从不同的基因转录位点相同或相反的链(部分2)。属性选择已经应用于每一对:P1 (CFS)和P2 (CFS),为每个intron-containing位点的子集,高(HCG)或低(LCG) CG内容启动子。属性集对应的表4(b): P1为P1 (CFS)表示模型,使用的属性在哪里那些得分80或更高(最高100)使用CFS属性选择方法。P2 (CFS-P1)表明,模型训练使用数据从P2但属性选择使用CFS P1。P1 (CFS)在P2表明,模型训练与对P1只有选定的属性和测试对P2。

属性 转录位点组 实例的总 正确分类的实例

P1 (CSF) LCG-IC 1767年 1185例(67.06%)
HCG-IC 1959年 1182例(60.34%)
P2 (CSF-P1) LCG-IC 585年 454例(77.60%)
HCG-IC 792年 577例(72.85%)
P1 (CSF)在p2 LCG-IC 585年 410例(70.09%)
HCG-IC 792年 445例(56.19%)