研究文章
从高通量表观基因组学数据预测模型的基因调控
表4
我们展示的准确性的ROC曲线下的面积(AUC) 10倍交叉验证各种IC记录集的训练条件。结果之前的所有转录位点所示(a)和(b)过滤后重叠相反链和重叠的推动者和尾巴(部分
2)。P1 (RNAPII)有额外的RNAPII属性,对应于一对P1, P2 + RNAPII相同的属性。P1和P2表示每个细胞株的模型对所有的属性。P1 (CFS)和P2 (CFS)表示P1和P2的模型,分别使用的属性在哪里那些得分80或更高(最高100)使用CFS P1和P2的独立属性选择方法。P2 (CFS-P1)表明,模型训练使用数据从P2但属性选择使用CFS P1。P1-on-P2表明,模型训练与P1和所有属性和测试对P2。P1 (CFS)在P2表明,模型训练与对P1只有选定的属性和测试对P2。
| (一)在过滤 |
|
| 属性 |
HCG-IC |
LCG-IC |
| 向上 |
Dw |
Nr |
平均 |
向上 |
Dw |
Nr |
平均 |
|
| P1 (RNAPII) |
0.8 |
0.79 |
0.74 |
0.78 |
0.82 |
0.87 |
0.78 |
0.83 |
| P1 |
0.79 |
0.79 |
0.74 |
0.77 |
0.83 |
0.86 |
0.76 |
0.82 |
| P1 (CFS) |
0.8 |
0.79 |
0.74 |
0.78 |
0.82 |
0.86 |
0.76 |
0.81 |
|
| P2 |
0.85 |
0.83 |
0.81 |
0.83 |
0.9 |
0.88 |
0.83 |
0.87 |
| P2 (CFS-P1) |
0.85 |
0.83 |
0.8 |
0.83 |
0.9 |
0.88 |
0.83 |
0.87 |
| P1-on-P2 |
0.83 |
0.77 |
0.63 |
0.74 |
0.88 |
0.83 |
0.71 |
0.81 |
| P1 (CFS)在p2 |
0.83 |
0.8 |
0.57 |
0.73 |
0.88 |
0.84 |
0.74 |
0.82 |
|
|
| (b)后过滤 |
|
| 属性 |
HCG-IC |
LCG-IC |
| 向上 |
Dw |
Nr |
平均 |
向上 |
Dw |
Nr |
平均 |
|
| P1 (RNAPII) |
0.79 |
0.84 |
0.76 |
0.8 |
0.85 |
0.9 |
0.81 |
0.86 |
| P1 |
0.79 |
0.82 |
0.75 |
0.79 |
0.86 |
0.89 |
0.76 |
0.84 |
| P1 (CFS) |
0.79 |
0.81 |
0.73 |
0.78 |
0.84 |
0.9 |
0.77 |
0.84 |
|
| P2 |
0.89 |
0.88 |
0.85 |
0.87 |
0.92 |
0.91 |
0.85 |
0.89 |
| P2 (CFS-P1) |
0.87 |
0.87 |
0.84 |
0.86 |
0.92 |
0.92 |
0.86 |
0.9 |
| P1-on-P2 |
0.89 |
0.87 |
0.7 |
0.82 |
0.92 |
0.89 |
0.79 |
0.87 |
| P1 (CFS)在p2 |
0.85 |
0.82 |
0.68 |
0.78 |
0.91 |
0.89 |
0.81 |
0.87 |
|
|