研究文章

从高通量表观基因组学数据预测模型的基因调控

表4

我们展示的准确性的ROC曲线下的面积(AUC) 10倍交叉验证各种IC记录集的训练条件。结果之前的所有转录位点所示(a)和(b)过滤后重叠相反链和重叠的推动者和尾巴(部分2)。P1 (RNAPII)有额外的RNAPII属性,对应于一对P1, P2 + RNAPII相同的属性。P1和P2表示每个细胞株的模型对所有的属性。P1 (CFS)和P2 (CFS)表示P1和P2的模型,分别使用的属性在哪里那些得分80或更高(最高100)使用CFS P1和P2的独立属性选择方法。P2 (CFS-P1)表明,模型训练使用数据从P2但属性选择使用CFS P1。P1-on-P2表明,模型训练与P1和所有属性和测试对P2。P1 (CFS)在P2表明,模型训练与对P1只有选定的属性和测试对P2。
(一)在过滤

属性 HCG-IC LCG-IC
向上 Dw Nr 平均 向上 Dw Nr 平均

P1 (RNAPII) 0.8 0.79 0.74 0.78 0.82 0.87 0.78 0.83
P1 0.79 0.79 0.74 0.77 0.83 0.86 0.76 0.82
P1 (CFS) 0.8 0.79 0.74 0.78 0.82 0.86 0.76 0.81

P2 0.85 0.83 0.81 0.83 0.9 0.88 0.83 0.87
P2 (CFS-P1) 0.85 0.83 0.8 0.83 0.9 0.88 0.83 0.87
P1-on-P2 0.83 0.77 0.63 0.74 0.88 0.83 0.71 0.81
P1 (CFS)在p2 0.83 0.8 0.57 0.73 0.88 0.84 0.74 0.82

(b)后过滤

属性 HCG-IC LCG-IC
向上 Dw Nr 平均 向上 Dw Nr 平均

P1 (RNAPII) 0.79 0.84 0.76 0.8 0.85 0.9 0.81 0.86
P1 0.79 0.82 0.75 0.79 0.86 0.89 0.76 0.84
P1 (CFS) 0.79 0.81 0.73 0.78 0.84 0.9 0.77 0.84

P2 0.89 0.88 0.85 0.87 0.92 0.91 0.85 0.89
P2 (CFS-P1) 0.87 0.87 0.84 0.86 0.92 0.92 0.86 0.9
P1-on-P2 0.89 0.87 0.7 0.82 0.92 0.89 0.79 0.87
P1 (CFS)在p2 0.85 0.82 0.68 0.78 0.91 0.89 0.81 0.87