研究文章

从高通量表观基因组学数据预测模型的基因调控

表3

区域考虑每记录轨迹计算的不同属性。我们定义了13个地区基于基因注释从Gencode version 7(运用62)。

类型 地区 描述

子2 kb 地区开始2 kb上游的转录起始站点(TSS)和结束前1 bp TSS;
子5 kb 上游地区开始5 kb TSS和结束前1 bp TSS;
固定长度的区域 TSS±2 kb 地区开始2 kb TSS的上游和下游结束2 kb
TSS±5 kb 上游地区开始5 kb TSS和结束5 kb下游
pA±2 kb 地区开始2 kb上游下游的pA和结束2 kb
尾巴 地区开始1 bp pA和结束后下游2 kb

第一外显子 相应区域的第一外显子记录轨迹
第一个内含子 区域对应于第一个内含子的轨迹记录
GB 基因体,地区之间的TSS和poly-adenylation站点(pA)的注释记录轨迹
变长区域 GB3′党卫军 地区前3′之间的剪切位点和注释记录轨迹的pA
GB±1 kb 基因的身体额外的1 kb -和下游延伸
GB±5 kb 基因的身体额外5 kb -和下游延伸
GB + 5 kb 基因的身体额外的5 kb pA的下游延伸