文摘
胃癌是一种异质性疾病,代表全世界所有新癌症病例的5%到10%。组织学诊断的进展和新发现的基因已经承认新基因分类。然而,生物信息学分析胃癌数据库支持特定的差异表达基因的检测和生物意义。Claudins,一个家庭的蛋白质参与紧密连接生理学、已成为细胞过程的主要监管机构,如生长、增殖,迁移,与癌症恶化有关。Claudin-9的表达在胃癌组织与不良预后有关,然而,它的转录和表观遗传法规要求更全面的分析。使用神经网络启动子预测、TransFact Uniprot-KB, Expasy-SOPMA,蛋白质数据银行,蛋白质组学数据库,Interpro, BioGRID,字符串,和FASTA蛋白质序列数据库和软件,我们发现以下几点:(1)启动子序列有一个非传统的结构,包括不同的转录调控元素分布在它的,(2)叫4,叫6和KLF5 Claudin-9表达的主要监管机构,(3)Oct1, NF -κB AP-1 c-Ets-1, HNF-3β有较高的亲和力CLDN9启动子,(4)Claudin-9与蛋白质、细胞分化和发展(5)CLDN9高度甲基化,和(6)Claudin-9表达与贫穷的生存。总之,Claudin-9是一种蛋白质,应考虑诊断标记作为其基因启动子区域结合转录因子与细胞控制的放松管制,增强细胞增殖和转移。
1。介绍
胃癌是全世界癌症相关死亡的第三大原因1]。胃癌的主要有两种亚型,即肠道和分散。肠道类型有关幽门螺旋杆菌感染,而扩散类型主要是遗传和具有多个突变(2,3]。在胃癌的研究,实验胚胎学被认为是开发新策略的一个关键因素的理解分子过程(4]。概要的基因表达的变化是侵略性的基本性质和良好的工具在一些肿瘤疾病的预后5]。新基因的基因组上下文吸引了疾病的进展中发挥重要作用[6]。
紧密连接(套)是细胞间粘附复合体位于顶端区域的侧膜上皮和内皮细胞。套是必不可少的屏障功能和细胞极性通过限制蛋白质的运动在质膜和规范paracellular溶质(7]。套是由适配器蛋白质和完整的膜蛋白,如claudins,这对TJ链形成[是不可或缺的8]。Claudins, 27个亚型的家庭,除了屏障和极性功能,也为病毒和细菌毒素,函数作为coreceptors coexpressed在特定的细胞类型和与不同的功能(功能分成四组9]。claudins的转录是由监管机制,严格控制表观遗传改变,转录变化,和转录后修饰10]。然而,对TJ的结构和功能的理解被放大为嵌合claudins[的外观11]。后果的其他组件,如交叉的粘附分子,zonula occludens蛋白,膜脂质,和机械力量,改变了我们的知识结构、动态交互和TJ组装的函数(12]。有趣的是,功能之间的串扰TJ蛋白和信号通路参与细胞增殖、转换和转移正成为当前主题(13]。
Claudins起到至关重要的作用在调节细胞的过程,如生长,增殖和迁移14,15]。和信息枢纽中断导致的损失细胞极性,在癌症的发展过程中具有决定性作用16]。Claudin表达式是改变、提升和负调控在癌症,但最有趣的是,肿瘤特异性Claudin表达式(17]。生物信息学分析广泛证实的患病率claudins胃癌患者(18- - - - - -22),特别是Claudin-6和9,这被认为是关键因素与胃癌预后不良有关(23,24]。Claudin-9主要表达在内耳和对听力至关重要25),然而,据报道,其异常表达于肺癌(26],垂体嗜酸性[27),和宫颈癌28]。Claudin-9被包含在seven-gene签名为临床预后标记在食管腺癌(29日]。尽管上面,有一个有限的文献承认Claudin-9在胃癌的重要性。
增加Claudin-9表达在胃癌肿瘤组织与细胞增殖的增加和入侵。此外,Claudin-9超表达与更高的死亡率(66%)在弥漫型胃癌30.,31日]。目前的工作旨在进行生物信息学分析理解的机制参与的转录和表观遗传调控在胃癌Claudin-9及其影响。
2。材料和方法
2.1。Claudin 9 (CLDN9)数据集
CLDN9基因序列是获得国家生物技术信息中心(NCBI),https://www.ncbi.nlm.nih.gov/)(基因ID: 9080)和爆炸进行获取参考号码和FASTA格式的序列。随后,基因组浏览器的数据库(https://genome.ucsc.edu/)是用于分析的基因组上下文CLDN9基因。在序列部分,上游的5′末端调整为进一步启动子分析2500个基点。
2.2。数据处理
首先,我们来确定最小启动子区域使用“神经网络预测启动子”。此外,我们评估监管存在的共识序列,如CpG岛,塔塔,CAAT和GC盒,叫,印度卢比(引发剂)和DPE(下游启动子元素)序列。
2.3。预测的转录因子
转录因子数据库(TRANSFACT;http://gene-regulation.com)是用来识别可能的转录因子的结合位点CLDN9基因启动子。TRANSFACT使用两种算法。首先描述了启动子或增强子结合位点,而第二显示了转录因子。再次,使用2500个基点序列上游的转录的开始CLDN9,我们执行分析。在比赛中建立了搜索设置:脊椎动物,最小化的总和都错误模式:0.7 - -0.75 cut-off-best selection-prf。100%的相似度被认为是进一步分析的分子对接和相应的启动子序列。
我们使用信号通路项目实验数据库(https://www.signalingpathways.org/index.jsf),研究可能的转录因子。“Ominer”工具(https://www.signalingpathways.org/ominer/query.jsf)被用来发现单基因之间的关系CLDN9和转录因子的节点使用cistromics数据集(Chip-Seq)在人类胃组织的生物样本的类别。
2.4。分子对接分析
晶体可用性和生物相关性在癌症上下文选择考虑因素和分子对接分析。得到的晶体结构的蛋白质数据银行(http://www.rcsb.org/pdb)。的智人晶体使用oct - 1 (1 e3o;280 - 438 aa), NF-kappaB (1 svc;2 - 365 aa), AP-1 (1 jnm;254 - 315 aa), C-ets-1 (1 gvj;297 - 441 aa)和HNF-3β(5 x07;157 - 258 aa)。三维DNA模型被使用”生物信息学和计算生物学的超级计算中心“IIT德里(SCFBiohttp://www.scfbio-iitd.res.in/)。对接研究计算使用不同HDOCK服务器的配置(http://hdock.phys.hust.edu.cn/)。最后,分子的可视化模型是使用嵌合体软件版本完成的。1.11.2。
2.5。甲基化的生物信息学分析
疾病冰毒2.0版本数据库(http://bio-bigdata.hrbmu.edu.cn/diseasemeth/)集中的异常methylomes不同类型的癌症。癌症基因组的甲基化分析阿特拉斯(TCGA)胃癌病人数据存储库(STAD)。获得的数据使用Illumina公司永远HumanMethylation 450 Beadchip技术实验平台(n= 397)。微分分析方法是学生的t以及。 被认为是一个重要的价值。绝对的甲基化差异被设定为> 0.2。启动子区域的甲基化分析(2 kB上游向下游0.5 kB TSS) CLDN9使用MethBrowser工具执行。
齐娜服务器(https://xena.ucsc.edu/)是用于探索的可能关联CLDN9启动子甲基化的表达水平和组织学类型之间的差异甲基化。同样,CLDN9甲基化的影响在不同的临床后果,如总生存期(OS),无进展时间间隔(PFI),无病区间进行了分析。
2.6。结构特点分析
研究结构、序列和CLDN9域,使用数据库Uniprot-KB(获得的多肽序列https://www.uniprot.org/),二级结构预测是确定使用Expasy-SOPMA软件(https://npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.pl?page=/NPSA/npsa_sopma.html),蛋白质数据银行(https://www.rcsb.org/),蛋白质组学数据库(https://www.proteomicsdb.org/)和Interpro (https://www.ebi.ac.uk/interpro/)。FASTA蛋白质序列用于所有分析。我们选择095484年UniprotKB条目,CLDN9_HUMAN条目名称,智人有机体。
在Expasy-SOPMA的案例中,我们使用UNK_645620 ID蛋白质Claudin-9 [32]。
灯塔是用来分析数据显示在一个知识管理基础考虑复杂的分析目标。有了这个工具,寻求有效的可视化和总结结果来识别模式。Claudin-9审查和相关的信息组织和细胞类型,电池组件,疾病干扰基因改变,代谢,分子功能,蛋白质域,PubMedID, SNP和转录因子等。
2.7。蛋白质相互作用网络
一般的互动地图Claudin-9使用字符串生成数据库(https://string-db.org/cgi/input?sessionId=biUPDH3R9Of4&input)分析已知的相互作用(从策划数据库和实验确定),预测的相互作用(附近基因、基因融合和基因同现),和其他(textmining、coexpression和蛋白质同源性)。在字符串中,行表示物理或理论交互,每一行的结束表示对蛋白质的影响。在这种情况下,圆的线表明结果是未知的。分析交互使用信心字段执行。厚线,距离越近,越互动的信心。此外,我们使用BioGRID (https://thebiogrid.org/与Claudin-9)探讨物理交互。设置用于在两个数据库是CLDN9化验;主要外部参考:UniProt O95484;物种:智人;标识符:r - hsa - 421271。
2.8。表达和生存分析
临床影响评估使用齐娜功能基因组浏览器(https://xenabrowser.net/)。此外,从580年的样本数据,TCGA胃癌研究(STAD)被用来分析Claudin-9表达在胃癌患者的影响。
分析Claudin-9表达不同的组织学类型的胃癌(TCGA STAD研究),我们比较的组织学类型和基因表达RNAseq-IlluminaHiSeq UNC CLDN9基因。统计检验来确定差异表达的Claudin-9组织学类型是单向方差分析。
总生存期(OS)和无进展时间间隔(PFI)病人和他们的协会RNAseq-IlluminaHiSeq UNC生成的CLDN9基因的表达进行了分析。操作系统,样品被分成低(< 3679)(n= 222)和高(≥3679)(n= 221)CLDN9表达式。PFI的案例中,样品被分成低(< 3679)(n= 223)和高(≥3679)(n= 222)CLDN9表达式。所有生存分析和分析使用卡普兰Meier情节。
3所示。结果
3.1。预测CLDN9的元素和启动子转录监管
CLDN9基因启动子2500个基点的特征筛选上游的转录起始点。如图1(一)启动子序列有一个非传统的结构不同的转录调控元素的形式分布于整个2500个基点。神经网络启动子预测软件分析确定了两个序列与GATA交互因素和GC和CAAT框。根据传统的定义,一个叫绑定序列,两个GC盒,启动区域综合最小启动子区域。−之间转录起点位于965−915个基点。中也检测到一个远端启动子之间的2450年和1635−−基点。三个CAAT框集成该启动子和一个叫绑定序列,与转录起点位于之间的2071年和2021−−bp(图1 (b))。
(一)
(b)
3.2。转录因子
22个转录因子被TRANSFACT预测中存在转录起始点和2500年英国石油公司上游(表1)。他们所有人的分数是100%,因此这意味着高绑定与启动子序列的可能性。有趣的是,他们中的大多数是癌症起始和发展密切相关。
分析信号通路中执行项目显示GATA6和GATA4 YCC3 CLDN9表达式的监管者和AGS上皮细胞系,分别,而KLF5加藤三世细胞(数据监管机构2(一个)和2 (b))。
(一)
(b)
3.3。分子对接分析
锚固分析预测c-Ets-1的亲和力,NF -κB, HNF-3β、Oct1 AP-1 CLDN9启动子。Oct1的对接分数获得377−−NF - 312κ261 B AP-1 276−−c-Ets-1,并为HNF-3−266β(图3)。残留交互之间的距离都是< 4。
(一)
(b)
(c)
(d)
(e)
3.4。表观遗传调控分析
与正常对照组比较均呈增长趋势的甲基化胃癌样本(疾病冰毒v . 2.0 STAD数据库)。因此,一个更详尽的生物信息学分析启动子区域进行使用癌症基因组图谱的数据。
因为他们亲密的基因组上下文和功能相似,比较之间的启动子的甲基化CLDN9和CLDN6基因。钙粘蛋白1基因甲基化的基因调控胃组织,增加了控制。CLDN9基因高度甲基化与CLDN6相比,表现出低水平(数字4(一)和4 (b))。甲基化背景显著降低(图4 (c))。claudin基因甲基化的热图结果显示转录镇压CLDN9基因表达在胃癌患者(图4 (d))。
(一)
(b)
(c)
(d)
(e)
(f)
(g)
CLDN9基因高和低风险值计算中值显示基因甲基化的价值。没有明显差异之间的整体存活率高,low-methylation组( )(图4 (e))。同样,最高的组甲基化仍无病稍长的没有复发比最低的组甲基化( )(图4 (f))。无进展时间间隔略好,但没有显著的低甲基化组( )(图4 (g))。
3.5。二级结构的Claudin-9
CLDN9基因RNA成为法律翻译217个氨基酸的蛋白质22.8 kDa。的二级结构预测Claudin-9使用SOPMA方法确定α螺旋(50.69%的序列),延长链的序列(13.36%),β把序列(5.07%),和随机线圈(30.88%的序列(图)5(一个))。Interpro数据库被用来识别nonconserved(蓝色)和非整合(布朗和阿月浑子绿色)元素内的蛋白质。最具代表性的人物是二级结构预测跨膜α螺旋(蓝色,螺旋结构),表(红、折叠),把(绿色),线圈(紫色)生成一个不规则卷曲结构(图5(一个))。
(一)
(b)
序列比对结果表明,Claudin-9非常类似于Claudin-6和8拥有217 - 220残留Claudin-18相比,有261个残基。分析表明,有地区出现在Claudin-18 (148 - 159, 234 - 258) Claudin-6, 8, 9。
径向图(图5 (b))表明,更多的进展检测Claudin-9的表达的组织和细胞类型(0.75)比研究变化的表达式(0.45),提到在Pubmed(0.59),并分析其转录因子(0.45)。低于0.7的值被认为是低丰度的知识。
3.6。蛋白质相互作用
字符串interactome分析表明,蛋白质的第一个字段直接交互或协会与Claudin-9 claudin家族蛋白质,如Claudin-1, 2、3、8, -10年,-12年,-15年,-16年,-18年和-23年,等等。在第二个字段,蛋白质与间接交互Claudin-9蛋白质,如Cadherin-1(背景),Cadherin-5 (CDH5) Occludin (OCLN) ZO1 (TJP1) ZO5 (TJP5) EPCAM,研究,或把一(F11R),等等。这些蛋白参与积极的血脑屏障通透性的调节,calcium-independent信息通过质膜附着力,肠内皮屏障的建立,TJ组装、和蛋白质relocalization TJ(图6(一))(表2)。
(一)
(b)
(c)
分析使用BioGRID Claudin-9数据库的物理交互网络(72年]显示17蛋白质,身体与Claudin-9(图6 (b))。这些蛋白质不典型的扶少团团员Claudin-9,指出其参与仍然未知的过程。例如,GRM2和LPAR3蛋白G protein-coupled受体调节谷氨酸和lysophosphatidic酸吸收,分别或RPRM (Reprimo蛋白质)调节的逮捕p53-dependent G2期细胞周期。
最后,分析interactomes由“textmining”Claudin-9和转录因子确定使用TFSearch之间有可能确定一组功能通常与四大细胞过程有关。(1)细胞连接其他claudins组成。(2)细胞生存的特点是凋亡或凋亡过程中,细胞迁移和入侵过程;最具代表性的蛋白质参与这些过程MAPK8, MAPK9, MAPK10 MAPK8IP1, MMP9。(3)细胞分化和发展,这些过程的相关蛋白质,如转录因子Sox5参与入侵和转移的胃癌和Sox9在胃癌发展中所起的作用,确定。其他重要的蛋白质在这组转录因子FOXA1和FOXA2报告为一个细胞分化转移程序,生成的启动因素gastric-like在肺腺癌组织。(4)细胞转录过程,其中包括各种各样的转录因子,如USF1参与家族性高脂血症,TCF3,扮演着重要的角色在B和T淋巴细胞增殖,或LMO2红细胞生成的核心作用和造血发展(图6 (c))。
3.7。相关性与胃癌患者的生存
病人的总生存期,基于生存数据”癌症基因组图谱(TCGA)“从STAD研究(TCGA胃癌),显示了重要的积极的影响( )在这些患者Claudin-9的低表达。相比他们的生存中值是4.7年到1.6年(图组最高的表达式7(一))。
(一)
(b)
无进展时间间隔显示Claudin-9表达更高的患者预后差,提出疾病进展的平均2.7年相比,观察低表达组(图4.5年7 (b))。
4所示。讨论
Claudins符合家族的蛋白质有27个人类亚型调节中起关键作用的细胞过程,如生长、增殖,迁移和入侵14]。claudin家族的大多数成员共享相同的细胞内框架,然而,它们之间的区别在于他们的细胞外域调节门,障碍,和coreceptor多样性(7,9,12,73年]。CLDN9基因有四个内含子和位于靠近CLDN6基因在染色体16 (73年]。类似于CLDN6,它被认为是一个发展claudin同种型(74年]。Claudin-9在内耳中表达的是25),作为阳离子障碍(75年),这一过程对于听力,它也是一个coreceptor丙型肝炎病毒和c . perfringes肠毒素(76年,77年]。胃的RNA表达得很糟糕(0.3平均蛋白质记录每百万)虽然蛋白质水平并不一定与mRNA水平(人类的蛋白质图谱)78年]。Claudin-9在胃癌预后不良有关23,30.,31日]。然而,突出Claudin-9与相互作用,激活,胃癌描述得很糟糕。Claudin-9表达与肝细胞的转移能力增加了令人不安的TyK2 / Stat3信号通路(79年),它一直在宫颈癌淋巴转移相关(28]。
结果表明,CLDN9启动子具有最小启动子区域集成一个叫绑定序列,两个GC盒,启动区域和远端启动子集成三个CAAT框和两个叫绑定序列。GC盒序列被认为是普通的转录调控元件。CAAT框信号通用转录因子的结合位点,和叫序列的因素作为激活或抑制转录的控制器80年]。可能翻译的功能蛋白质,细胞增殖和/或细胞凋亡,可能是依赖于启动子区域结合给定的转录因子或其结合动力学(81年]。也有可能绑定两个同样的转录因子启动子区域的中介和修改复杂的需要形成一个循环,启动转录的蛋白质(82年]。它已经建立了一个转录因子活性的变化依赖于转录因子浓度改变的表达它的目标(83年]。
有趣的是,20个不同的转录因子,可以绑定CLDN9子地区以100%的得分决定。大多数被认为是上皮分化和器官发育的主要监管机构,即。,CP2 [84年),维护生殖系干细胞,即。,普遍服务基金85年),增强剂,激活转录程序和细胞重新编程,即。,GATA1和GATA 3 (86年),支持细胞生长和增殖,即。,AP1 AP4 [87年),和促进TJ在癌形成细胞,即。,HNF4 [88年]。
ChiP-Atlas MACS2分析发现GATA6和GATA4 YCC3调节CLDN9的表达和AGS胃上皮肿瘤细胞系,分别而KLF5,转录因子结合GC盒(89年]和与GATA4 GATA6 [90年]是加藤的调节器三世胃癌细胞。可能出现的差异可能来自不同的组织病理学表型因为加藤III是一个人类胃印戒细胞腺瘤癌症可以诱导脂肪形成的,chondrogenic,神经源性分化成骨的,91年]。
不同的分析表明,CLDN9基因高度甲基化和热图结果显示CLDN9基因表达的转录镇压在胃癌患者。DNA甲基化是表观遗传机制被认为是一个生物过程,可以改变DNA片段的活性,沉默基因表达(92年]。一些基因可以表达即使他们广泛的甲基化(93年,94年]。的甲基化与胃癌Claudin-11子已经增加入侵潜力(95年],Claudin-3启动子的甲基化被认为是预测预后不良的先进胃腺癌(96年]。事实上,启动子甲基化和claudin表达与胃癌TNM阶段(97年,98年]。
正如所料,Claudin-9表达式与短和无进展生存率相关。去分化标记物的表达,比如CD44, CD133, Claudin-6或9,在大多数上皮肿瘤(99年- - - - - -103年)与贫穷的生存。
5。结论
Claudin-9 TJ蛋白参与关键的生物过程。其表达式可能受许多机制,然而,其过度或启动子的甲基化状态可能是胃癌的预后因素。
数据可用性
使用的数据来支持本研究的发现可以从相应的作者。
的利益冲突
作者宣称没有一个利益冲突。
确认
伊莉莎白Hernandez-Nava是收件人的博士后奖学金Consejo Nacional de Ciencia y Tecnologia墨西哥(CONACYT)。这项工作是支持的项目Apoyo四面八方de Investigacion e Innovacion Tecnologica (PAPIIT)大学根据墨西哥赠款IN218019和IN221519(自治)。