文摘

长非编码RNA (lncRNA)在阿尔茨海默病基因的信使RNA序列,即应用,载脂蛋白e, PSEN1 PSEN2,分析了用分形维数(FD)计算和相关分析。我们检查了lncRNA通过比较mRNA FD相应编码DNA序列FD(信用违约互换)。应用、载脂蛋白e和PSEN1 cds选择FDs mRNA相比略高,而PSEN2 cds FDs较低。这些序列的相关系数为0.969。差异表达的比较研究MAPK信号通路lncRNAs在胰腺癌细胞显示了一个0.771的相关性。选择更高的FD cds可能表明阿尔茨海默氏症基因产品的交互应用,载脂蛋白e, PSEN1。包括食欲素序列分形维度(所有信用违约掉期高于mRNA)的应用,载脂蛋白e,和PSEN1序列分析提高相关性,但红细胞生成素(FD cds都高于mRNA)会抑制相关,表明HCRT下丘脑神经递质相关的后/睡眠周期,可能更好的EPO(促红细胞生成素)相比,糖蛋白激素,针对阿尔茨海默病药物开发。分形维数和熵关联提供了支持证据,与进化研究一致,使用斑马鱼模型小鼠模型一起,HCRT药物开发。

1。介绍

基因序列的指令是由波动或变化的核苷酸碱基序列。一个序列的生物信息学研究如果序列建模为一系列基于核苷酸,核苷酸原子序数的T、C、g .最近的一项研究在这样的波动在FOXP2基因通路已经被报道1]。分形维数和香农熵被发现有一个负相关( FOXP2的监管“加速conserved-non-coding”序列在人类胎儿的大脑。一般来说,分形维数和香农熵产生2 d图表示一组基因序列。例如,使用人类Y染色体,其中包含429个基因序列根据http://ncbi.nlm.nih.gov/mapview/数据库,列出序列分形维值从1.92到2.06,香农熵二核苷酸从3.0到3.8位/基地。分形维数,作为一个核苷酸位置敏感的测量,将丰富的嵌入式相关的信息学与序列相关。转录和翻译而言,分形维数可能与对接能量参数与粗糙度的概念相似度的拉链和组装交通类比对接互动。除了cd,信使rna序列通常是嵌入intronic地区。非编码RNA序列与超过200个碱基对长度已经被用于标签长非编码RNA (lncRNA)无论intronic或基因间的起源。这个项目使用分形维数的信使rna和DNA序列编码(CDS)调查中的lncRNAs mRNA(但不是CDS)在阿尔茨海默病的基因,也就是说,应用程序或AD1、载脂蛋白e或AD2 PSEN1或AD3粉,PSEN2或AD4。lncRNA序列已被证明参与重要的监管职能。的lncRNA SPRY4-IT1序列据报道,迁移到细胞质中,观察和upregulation黑色素瘤细胞(2]。微分表达式在lncRNA辐射的海拉和MCF-7细胞和胶质母细胞瘤发病机制已报告(3,4]。lncRNA关系细胞基因产品稳定报道小鼠模型(5]。微阵列数据分析有关lncRNA亨廷顿氏舞蹈症(6),lncRNA作用在神经疾病和癌症了(7,8]。lncRNAs成为新的癌症诊断和治疗的金矿被假定9]。尽管所有这些活动,只有少数计算分析结果在lncRNAs报告给我们的知识。lncRNAs 3′未翻译的比较研究区域(3′utr)在蛋白质编码RNA序列揭示了平行结构的序列,研究符合相似的进化约束的存在(10]。

本项目主要针对疾病相关基因序列的研究。中的lncRNAs mRNA在阿尔茨海默病的基因序列,即应用程序或AD1、载脂蛋白e或AD2 PSEN1或AD3粉,和PSEN2或AD4,分析了分形维数的计算和相关分析。探索性假设lncRNA序列嵌入到一个转录信使rna序列将展览在阿尔茨海默病相关基因在比较研究了分形维数模型的信使rna序列和编码DNA序列(CDSs),不包括lncRNA序列。

2。材料和方法

在这项研究中使用的数据是根据以下Gen-ID数字从基因库下载。研究人类基因的应用- gen - id - 351包含10 mRNA变体,apoe - gen - id - 348, psen1 - gen - id - 5663有2 mRNA变体,psen2 - gen - id - 5664有两个信使rna变异,HCRT - gen - id - 3060, hcrtr1 - gen - id - 3061 (HCRT Receptor-1), hcrtr2 - gen - id - 3062 (HCRT受体2),促红细胞生成素- gen - id - 2056, epor - gen - id - 2057。MAPK信号通路基因加入数字一直在报告中列出的微分表达式长非编码intronic rna在胰腺癌细胞(11]。艾伦脑图谱数据库访问http://brain-map.org。

序列的核苷酸多样性相对较低会低香农熵(约束)的16个可能的二核苷酸对的集合。一个序列的熵可以作为的总和计算 在所有国家 的概率, 可以获得的经验直方图16 di-nucleotide双。最大熵是4二进制比特每对16(2的可能性4)。mono-nucleotide考虑,最大熵是两位/单核苷酸和四个可能性(22)。一般来说,monoentropy di-nucleotide熵与成正比 在报纸上报道的序列。

大致说来,分形维数的措施自相似序列的复杂性。等一维序列的DNA序列,附近的一个分形维数2表示极大的复杂性,而一个接近1将显示小复杂性、多样性,或信息。在不同的分形维数的方法,Higuchi分形方法是适合学习信号波动(12]。一个随机空间系列以同样的空间可以建模为一个亮度信号的步骤时间,时间序列分析工具可以用于空间序列分析。空间强度(Int)随机系列以同样的时间间隔可以用来生成一个不同系列 对不同空间变量的滞后。的nonnormalized明显长度空间系列曲线是简单 和在哪里都对在哪里 - - - - - - 。术语的数量k系列不同,必须使用规范化的系列长度。如果Int ( )是一个分形函数,那么 应该是一条直线的斜率等于分形维数。Higuchi合并一个校准部门一步,理论上的最大价值是校准的拓扑价值2。给出了详细的计算方法在文献[12]。数值计算分形维数的例子可以发现在我们先前的报告(13,14]。为了清楚起见,我们使用的算法的Matlab实现如下列出。“数据”是一个数组加载与输入序列在每个列(一个)。“宽度”的组合数加载数据的数组。” ”截止之间的最大距离 - - - - - - 对。一个 7用于本文,尽管其他值 给了非常相似的结果。

考虑%计算长度为每个列向量 = 0 ( 、宽度); = 1: ,data2 = circshift(数据, );data2 = abs (data2−数据);data2 (1: :)= 0;%去除最终效果 = (data2) / / ;结束

%计算斜坡(FDs)斜率= 0(1、宽度); :宽度,temp = 1: 1: ; ; ; ; ; ;结束

3所示。分形分析

CDS长度的比值mRNA长度范围从0.23到0.78在研究阿尔茨海默病序列。一个负相关 0.61发现分形维数和cd长度的比值mRNA长度,使用10个变量序列应用mRNA。分形维数的增加与减少比率可能与一些系统的属性在应用基因mRNA变体的形成。看起来增加lncRNA长度部分相对于cd与分形维数增加的部分应用mRNA变体。

信用违约互换的分形维数相关性与mrna在阿尔茨海默氏症是显示在图1 0.969 ( )。所有的研究阿尔茨海默病序列显示更高的分形维度在信用违约掉期与mrna相比,除了PSEN2变体1和2变种。同样,差异表达的比较研究MAPK信号通路在胰腺癌细胞长非编码RNA intronic显示在图中2的相关性 (11]。MAPK信号通路被报道涉及9 mrna的微分表达式长非编码RNA intronic (11]。他们ARRB1 ATF2、MAPK1 MAP2速率MAP3 K1, MAP3 K14、PPP3CB RAPGF2, TGFbR2。MAP3 K1的cds, MAP3 K14、RAPGF2分形维值较低而mrna。

更高的分形维数的选择信用违约互换可以表明阿尔茨海默氏症基因产物的某些特征交互应用,载脂蛋白e, PSEN1相关 0.979 ( )。食欲素(促食素)损失在阿尔茨海默氏症患者被报道(15]。脑部扫描研究一群年轻人透露其中1/3 PSEN1 E280A突变携带者,对阿尔茨海默氏症(一种公认的标志16]。的食欲素序列(所有信用违约互换在HCRT分形维值高于mrna, HCRT-R1,和HCRT-R2)的应用,载脂蛋白e, PSEN1序列分析将提高相关( )如图3。红细胞生成素EPO与多巴胺通路已被证明有互动(17- - - - - -19),并提供保护神经元损伤(20.,21]。的红细胞生成素(所有信用违约互换维度高于mRNA在促红细胞生成素和EPOR)的相关应用,载脂蛋白e, PSEN1会抑制相关( )。

4所示。讨论

数据的回归拦截1,2,3是负面的,而斜坡都大于1。这表明选择压力驱动光盘分形维数或对高FD lncRNA的选择压力。负的截距值是否在mRNA建议最低分形维数阈值包含一组功能cd在研究阿尔茨海默病的基因需要进一步调查。探索性假说lncRNA序列嵌入到转录mRNA将展览在阿尔茨海默病相关基因收到证据比较信使rna序列分形维数模型和编码DNA序列(CDSs)。

HCRT的相关结果显示一个假设,一种神经递质只在下丘脑及相关生产/睡眠周期之后,可能是一个相对更重要的候选人作为阻滞剂或发起人EPO(促红细胞生成素)相比,肾脏和肝脏产生的一种糖蛋白激素,靶向药物开发与应用阿尔茨海默病的临床试验。HCRT假说将符合MRI脑部扫描(168区)包含微阵列表达水平数组数据来自艾伦大脑图集数据库。大脑扫描数据分析显示更高的偏态值HCRT受体2表达水平分布(图4)在大脑中与促红细胞生成素受体分布(图5)。推理遵循这一事实食欲素受体表达水平分布会有积极的长尾代表高表达水平和高需求HCRT大脑中与促红细胞生成素受体表达水平分布。0.91偏态值将HCRT受体2(图40.04)与促红细胞生成素受体(图5),约20的因素不同。HCRT和促红细胞生成素表达水平分布在大脑中显示数据67,分别。2.2偏态值将HCRT(图61.1)与促红细胞生成素(图7),一个因素差异约为2。大因子受体表达水平的差异在大脑中会影响药物开发的目标受体的选择。

小鼠模型已经成为一个受欢迎的选择进化以来药物开发的理解生物学的基石。分形维数与熵的情节HCRT cds在人类,老鼠,斑马鱼是显示在图8与一个调整 0.9996,和老鼠HCRT cd将被视为局外人的回归分析人类,小鼠和斑马鱼。回归结果将符合一个进化的趋势,人类HCRT最高的分形维数,和斑马鱼HCRT最低的分形维数。类似的分形维数熵图HCRT-R2显示在图中9与一个调整 0.965,和老鼠HCRT-R2 cd将被视为一个异类。回归结果将符合进化的趋势,人类HCRT-R2最低的分形维数,和斑马鱼HCRT-R2分形维数最高。分形维数高HCRT低的分形维数的结合人类受体HCRT-R2将符合对接的关系正如上面所讨论的意义粗糙度的分形维数作为关联参数匹配的拉链类比转录和翻译的理解。lncRNA折叠的进一步研究可能是重要的对接和监管的序列分形维数计算,和金属控制折叠RNA可以作为起始平台与紫外圆二色性和基于同步加速器的x光吸收光谱结构数据(22]。在任何情况下,当一个分形维数熵地图作为一种工具用于进化压力研究超出了简单的分类,很强的相关性将提供定量支持鼠标的选择模型和斑马鱼模型在HCRT药物开发。扩展的分形维数计算和相关分析最近发布的数据集的表示对斑马鱼胚胎发生有助于HCRT lncRNAs药物开发(23]。

最近TREM2 R47H变体的报道与晚发性阿尔茨海默氏症(负载)24,25]。人类TREM2被称为先天免疫受体和信号通过TYROBP(受体激动剂4 mRNA变异和4 cd的变异)清除受损组织,减少炎症。分形维数计算和相关显示在图中10 。TREM2 BLASTN比较的数据点在图(最低左角落10)显示 ,鉴于cd 693 -核苷酸序列和366 -核苷酸序列内的信使rna通过添加开始和结束一个非编码区。类似BLASTN比较TYROBP变体数据点在图1(最右角落10)返回一个空的结果,给定一个cd 342 -核苷酸序列和266 -核苷酸序列在mRNA获得如上所述。这一事实的cd和信使rna研究序列分形维值相似但显示很少或根本没有关系,根据爆炸调查将显示一个选择的过程,和相关展示 0.9992 ( )在4变种和受体系统选择的过程,符合信用违约互换熵和分形维数的阴谋 0.949 ( )在图11

(24)指出,载脂蛋白E (APOE)故障仍然是最重要的序列变异,会晚发性阿尔茨海默氏症的风险。APOE图10会给 0.9993 ( ),这意味着一个非常严格的监管选择信用违约互换mrna的负荷序列进行了研究。相比之下,类似的相关分析在老鼠和牛TYROBP, TREM2, APOE会给 值为0.89 ( )和0.45 ( ),分别。返回的人类APOE BLASTN比较 ,鉴于cd 954 -核苷酸序列和269 -核苷酸序列内的信使rna通过添加开始和结束一个非编码区。包含HCRT和促红细胞生成素信息学将抑制相关 值为0.973 ( )和0.927 ( ),分别,这表明HCRT药物可能是一个更好的选择治疗晚发性阿尔茨海默病与促红细胞生成素的药物。APOE将给予的包容 0.32的熵和分形维数图在图11。APOE序列中最低熵研究序列,和所有信用违约互换熵低于mrna在晚发性阿尔茨海默氏症研究序列。1.8673的APOE单核苷酸熵会抑制略微mono-nucleotide mRNA和cd在晚发性阿尔茨海默病的相关性研究序列 0.9948 ( )到0.9944 ( )。晚发性阿尔茨海默氏症研究mrna和信用违约掉期显示在分形维数相关性很高( 0.999)和熵( 0.994),符合晚发性阿尔茨海默病lncRNA假说的分形维数高满意低熵在信用违约掉期选择删除lncRNAs低熵值大约1.91除了TREM2 lncRNA有1.995位/核苷酸类型。

高度相关的结果也观察到另外两个涉及TYROBP的神经退行性疾病。Nasu-Hakola疾病,疾病影响大脑和骨骼,是相关的故障TREM2或TYROBP [26]。CSF1R(小胶质受体),故障与corticobasal综合征称为遗传弥漫性脑白质病与TYROBP cosignaling报道是球状体(27]。添加CSF1R图10将从0.999(减少的相关性 )到0.992 ( )。非编码RNA的探索性研究,通过比较mRNA和cd信息揭示规律。考试的图1 0.969 ( )和图10 0.999 ( 包括APOE)建议晚发性阿尔茨海默病的非编码RNA装配过程将涉及相对高度系统化的过程或进程相比,家族与应用,早发性老年痴呆症PSEN1 PSEN2,载脂蛋白e。这个项目已经使用 差异0.02是划分的顺序lncRNA调查通过比较mrna和信用违约掉期在一个集群中疾病相关的序列。信使rna与cd信息比较方法可以普遍接受的一个补充,爆炸的方法。进一步的调查使用分形分析序列的神经退行性疾病,目前针对受体将是富有成效的。

5。结论

长非编码rna (lncRNAs)在阿尔茨海默病的基因的信使rna序列,即应用,载脂蛋白e, PSEN1, PSEN2,分析了分形维数的计算和相关分析。结果表明,应用、载脂蛋白e和PSEN1 cds相比选择稍高的分形维作为信使rna序列的相关系数模式证明了这一点 ( 包括变异)。包含2变种在PSEN2 cds的分形维值低于mrna会屈服 0.969 ( )。更高的分形维数的选择信用违约互换可以表明阿尔茨海默氏症基因产物的特征交互应用,载脂蛋白e, PSEN1。食欲素序列将提高相关( ),但包括红细胞生成素会抑制相关( ),这表明HCRT可能相对更重要的候选人作为阻滞剂或子目标相比,促红细胞生成素在药物开发与应用阿尔茨海默病的临床试验。HCRT假说将符合MRI脑部扫描包含微阵列表达水平数据来自艾伦大脑图集数据库显示更高的偏态值HCRT受体表达水平分布与促红细胞生成素受体表达水平分布在大脑中。熵序列分形维数和相关研究提供了定量的证据,与进化研究一致,使用斑马鱼模型小鼠模型一起,HCRT药物开发。TREM2和TYROBP mrna报道最近在晚发性阿尔茨海默病也收益率的相关性 0.999 ( )使用类似的信息分析,但是HCRT信息学包含会抑制相关略比欧洲专利局信息学包容。

确认

城市大学支持的项目部分研究资助j .你们感谢NSF-REU项目学生的支持。张和美国Dehipawala谢谢手法物理系的款待。作者感谢n勒博士的托马斯·杰斐逊医学院病理学系,蝗虫街1020号,费城,宾夕法尼亚州19107年美国讨论。作者感谢论文中提到的研究小组发布他们的数据和软件在公共领域。