文摘

食管癌癌(EsC)是一个发生在癌症组的成员,食道;在全球范围内,它被称为一个致命的恶性肿瘤。在这项研究中,我们使用基因表达分析识别分子生物标志物提出为小说的发展药物治疗靶点。我们认为EsC相关的四个不同的基因表达微阵列数据集的综合数据库。执行统计分析使用R语言和确定共有1083个差异表达基因(度)的380人中,703人underexpressed。执行功能的研究与确定度屏幕重要基因本体论(去)条款和相关通路为注释,使用数据库可视化和综合发现库(大卫)。分析表明,过表达度主要是与蛋白质出口,轴突引导路径,和downexpressed度主要是与L13a-mediated平动血浆铜蓝蛋白表达的沉默,形成池免费40 s亚基路径。字符串用于收集数据库(PPI)蛋白质间交互作用网络信息和用Cytoscape可视化软件。我们发现10基因中心的PPI网络考虑三种方法白介素6(白细胞介素6)基因的所有方法。PPI,我们发现识别集群相关的复杂我生源论,泛素化和蛋白酶体降解,白细胞介素信号,Notch-HLH转录途径。 The identified biomarkers and pathways may play an important role in the future for developing drugs for the EsC.

1。介绍

食管癌癌(EsC)是一个发生在癌症组的成员,食道;在全球范围内,它被称为一个致命的恶性肿瘤。在2018年,EsC列为第九最常见的一种癌症与572000例新病例(所有类型的癌症病例的3.72%)和第六个最常见的癌症死亡率与509000人死亡(1]。EsC仍是地方病在世界的一些地区特别是在第三世界国家2]。虽然EsC的发病率是不稳定的全球利率最高的发病率被发现在非洲和亚洲东部[1]。智性别研究声称EsC患者是男性的70%左右(1]。饮酒和吸烟列为食管鳞状细胞癌的危险因素在美国(3]。胃食管反流病(GERD)和巴雷特食管与风险增加发展的EsC (4,5]。肥胖也esophagus-related腺癌的危险因素(6]。EsC仍然是一个全球关注的存活率较低,5年存活率直到现在仍不到20% (7]。尽管巨大的进步发生在医学领域在过去的几十年里,EsC的平均存活率已略有增长在过去的几年里8]。大部分的EsC病例诊断在其后期缺乏早期临床症状。一些常见的症状如突然减肥,胸骨燃烧的感觉,胸痛、吞咽困难。微阵列基因表达谱和基因芯片分析广应用于医学领域(9]。基因表达分析有助于解码差异表达基因和分子生物标志物使用一些技术,可能有潜在影响癌症发展(10]。分子生物标志物是一个重要的角色,在癌症治疗早期诊断和预后价值。一些研究已经产生确定EsC分子生物标志物。在一项研究中,东等人表明,甲基转移酶7 b可以参加食管腺癌的早期检测11]。王等人声称MAPK1基因显示异常表达可能有助于发展EsC (12]。EsC的癌症之一,很多研究人员的关注,但仍不太了解其机制和进展。增加EsC-associated分子生物标志物的研究可能提供独特的基础方法在预防,诊断和治疗EsC。在这项研究中,我们进行了一个全面的芯片全基因组分析识别分子签名使用生物信息学方法和工具。当前的研究开始通过收集4 EsC-associated微阵列数据集。我们确定差异表达基因(度)数据集。度提出了完整的功能性研究和蛋白质相互作用分析。显著的集群识别蛋白质相互作用网络。我们还确定了中心基因使用连接值、最大社区组件(跨国公司),和瓶颈的方法。

2。方法

2.1。微阵列数据收集

许多研究已经开展了关于食道癌探索基因生物标记(13- - - - - -15]。但很少有数据综合分析EsC这样确切的遗传机制仍然未知。探索基因生物标记,我们应用我们当前研究的综合分析。我们使用四个不同的微阵列数据集来完成这个研究。GSE93756、GSE94012 GSE104958, GSE143822数据集选择从国家生物技术信息中心(NCBI)基因表达综合(地理,https://www.ncbi.nlm.nih.gov/geo/)[16]。基于平台GPL21282 GSE93756样本数据集有四个方阵人类OneArray版本7版本1。GSE94012数据集有6个样品基于平台GPL15207 [PrimeView] Affymetrix人类基因表达数组。GSE104958数据集共有46个样本,数据集是基于平台GPL21185安捷伦- 072363 SurePrint G3人类通用电气v3 039494 x60k微阵列(探头名称版本)17]。GSE143822数据集有八个样本,它是基于平台GPL20844安捷伦- 072363 SurePrint G3人类通用电气v3 039494 x60k微阵列。一步一步的过程,本研究显示在图1

2.2。数据处理和识别度

Limma代表微阵列数据的线性模型,并且大多数Limma已经开发了微阵列数据的功能。使用limma微阵列数据处理简单,其结果是准确的。我们使用了limma包R语言的转换选定的四个数据集的原始文件(18]。基因表达数据集转换成措施进行进一步分析。确定统计学意义的基因日志2 FC 超表达, 基因数,标准的调整 值< 0.05应用(19,20.]。

2.3。去度的通路富集分析

基因本体论(去)分析提供了广泛的生物勘探结果单个基因或基因集。近年来,去分析是系统生物学研究的一个至关重要的部分。在另一个角落,通路富集分析有助于探索基因集之间的机械化洞察力产生广泛的公司分析(21]。在这项研究中,我们使用了基因本体数据库探索度去相关条款(22),和途径进行分析是使用京都基因和基因组的百科全书(KEGG) [23],REACTOME [24],BIOCARTA [25),和生物生化图像数据库(BBID) (26)数据库。数据库的注释、可视化和综合发现(大卫,http://david.abcc.ncifcrf.gov/)是富有成果的收集所有的结果(27]。统计显著性 值< 0.05维护确定最终结果。

2.4。PPI建筑和聚类分析

检索的搜索工具相互作用基因/蛋白质(字符串,https://string-db.org/)存储库是用于探索内部之间的交互度(28]。结合高 用于验证交互。开源软件Cytoscape [29日)是用于生成(PPI)蛋白质间交互作用的网络。CytoHubba插件应用于得到拓扑参数值(30.]。确定集群从PPI网络,我们使用分子复杂的检测(MCODE)算法(31日]。MCODE插件内置参数是用于分析的程度 ,节点分 , , 算作是最低标准。执行功能通路分析集群中使用REACTOME数据库。

3所示。结果和示范

3.1。度检查

最初,20102,20085,33762,和32212度确定从GSE93756 GSE94012 GSE104958, GSE143822数据集。在应用最小日志(FC)和 价值标准,5802、5393、5945和7024度相应的标识。380年调节和703度使之抑制筛选在选定的四个数据集用于进一步分析(表1)。排名前十的调节和表达下调度如表所示2

3.2。去度的通路富集分析

大卫我们应用功能分析使用数据库来实现进一步的知识转化为函数的识别度。功能分析显示显著的富集条件和路径的识别度。去分析探索,过表达度主要与蛋白质泛素化、生物过程和调节细胞周期(BP);内质网的膜和核浆细胞组件(CC);为分子DNA和蛋白质绑定,绑定函数(MF)(表3,图2)。另一章的分析探讨了downexpressed度与平动起始和SRP-dependent cotranslational蛋白质定位为英国石油(BP)膜;细胞外基质,为CC核糖体;核糖体的结构组成,NADH脱氢酶(辅酶q)活动MF(表4,图3)。

我们使用四种不同的数据库实现相关的途径更清楚。路径分析显示,过表达度主要是与蛋白质出口,轴突引导,和ρgtpase激活形成通路(表5(一)图4);的downexpressed度主要是与L13a-mediated平动血浆铜蓝蛋白表达的沉默,形成的自由40年代的子单元,三磷酸鸟苷水解和加入的60年代核糖体亚基路径(表5(b),图5)。

3.3。PPI建设和中心基因识别

使用数据库的字符串,我们生成与Cytoscape PPI网络和可视化软件。构建PPI网络有646个节点和2055个连接,包括172调节度和474度使之抑制(图6)。使用CytoHubba插件,我们确定了十大中心从PPI网络包括白细胞介素6基因,是携带者,NOTCH1, ATP5C1, BPTF, MRPS11, MRPS15, MRPL1 NDUFB7, NDUFS5。CytoHubba插件有11种不同的方法来识别重要基因的PPI网络;在这项研究中,我们考虑三种方法包括连接值(学位),最大社区组件(跨国公司),和瓶颈识别中心的基因。PPI网络中,白细胞介素6基因数量的最高学位价值68,跨国公司价值60,和瓶颈价值151(图7)。十大中心基因名称和他们的排名基于三种方法在表的筛选6

3.4。聚类分析

是在使用MCODE方法进行聚类分析。在这个分析,11集群识别节点的数量大于5。我们确定了四个重要的集群构造PPI网络。最重要的集群是富含MCODE得分17.5和节点密度33;第二重要的集群MCODE得分12和节点密度12;第三重要的集群MCODE得分9.238和节点密度22;第四重要的集群MCODE得分5和节点密度9。通路富集分析探索,集群明显富含复杂的生物起源,线粒体翻译终止,泛素化和蛋白酶体降解,白细胞介素信号,Notch-HLH转录途径(表7)。集群的结果与它们相关的通路图所示8

4所示。讨论

EsC被认为是全球最致命的疾病之一,其快速发展和基础预示。大约80%的EsC病例记录从欠发达地区2]。2012年在中国,EsC列出了第五常见诊断癌症死亡率的类型和第四个杰出的原因(32]。迫在眉睫的是理解EsC的临床流行病学发展医疗。在这项研究中,我们开发了一个微阵列基因资料分析来识别分子特征。EsC-associated GSE93756四个不同的数据集,GSE94012、GSE104958 GSE143822被选中,这些数据集进行了分析与limma R语言的包。380调节和703下调度匹配每个标准在所有的数据集。这些度应用于画重要条款使用大卫数据库。去分析表明,调节度与蛋白质泛素化相关,调节细胞周期,内质网的膜,核浆,蛋白质绑定。度与转化使之抑制起始,SRP-dependent cotranslational目标蛋白质膜,细胞外基质,核糖体,核糖体的结构成分。细胞周期的异常被表示为食道肿瘤发生的一个关键因素33,34]。2017年,奥托等人声称,细胞周期蛋白可能有前途的作用在癌症治疗35]。

在这项研究中,PPI网络是由使用识别度。从PPI网络,我们发现10中心基因(白细胞介素6、背景、NOTCH1 ATP5C1, BPTF, MRPS11, MRPS15, MRPL1, NDUFB7,和NDUFS5)使用三种组合方法。白介素6(白细胞介素6)基因是白介素家族的一员,它参与细胞生长的操作。白细胞介素6可以作为促炎细胞因子和抗炎myokine,它与许多类型的癌症发展(36]。一项研究表明,乳腺癌细胞产生白细胞介素6作为核心化合物(37]。白细胞介素6也列为治疗生物标志物在肾细胞癌38]。白细胞介素6显示肺癌患者的不良预后的价值(39]。IL6-associated信号通路参与癌症恶化。基于上述讨论,我们可以说,白细胞介素6可能在EsC发展发挥重要作用。钙粘蛋白1(背景)基因与蛋白质编码。背景是与细胞增殖相关的通路,扮演着一个重要的前言在癌症发展(40]。背景突变蛋白标记为遗传性胃癌扩散增加的危险因素(HDRC) [41,42]。

HDRC影响乳腺癌接受高的风险(43]。HDRC病人增加患胃癌的风险高是与食管相关联的器官。几个特征表明,背景可能参加EsC的发展。NOTCH1编码蛋白质的切口家庭而闻名。NOTCH1扮演了一个角色在细胞生长和增殖,分化和细胞凋亡。NOTCH1从事许多类型的癌症,包括三阴性乳腺癌,白血病,脑瘤,和许多其他人。影响细胞凋亡、增殖、免疫反应和癌症干细胞的数量(44]。关于上面的讨论,我们可以假设NOTCH1 EsC发展可能的影响。Bromodomain博士手指转录因子(BPTF)发现了基因过表达和显示不良预后价值在肺腺癌组织(45]。从2015年的一项研究提出BPTF作为抗癌治疗的新目标(46]。

在PPI分析部分,我们应用MCODE方法识别集群。重要的四个集群识别,执行路径分析。路径分析表明,集群主要是富含复杂的生物起源,线粒体翻译终止,线粒体翻译起始和α干扰素/β信号通路。线粒体生物起源发展乳腺癌的肿瘤上皮细胞系(47]。

作者认为,这项研究的结果将影响EsC的生物标志物识别。但需要更多的研究来证明。缺乏工具和建立实验室,我们无法验证结果本研究的限制。对于未来的目标,我们将使用输出为EsC探索microRNA标志物,这将给我们关于EsC发展更深层次的知识。

数据可用性

和/或使用的数据集分析在当前研究可从相应的作者以合理的要求。

的利益冲突

所有读过作者提交的手稿和批准以及没有利益冲突。

作者的贡献

概念化是由k·艾哈迈德和保罗的手段;数据管理、形式分析调查,方法是通过核磁共振伊斯兰教;收购资金是由a Zaguia;项目管理是由k·艾哈迈德和保罗的手段;资源和软件是通过核磁共振伊斯兰教;监督是由k·艾哈迈德和保罗的手段;验证是由保罗和k·艾哈迈德的手段;可视化是由核磁共振伊斯兰教;原创作品草案是由核磁共振伊斯兰教,B.K.保罗,抗议阿拉姆,a . Zaguia d . Koundal和k·艾哈迈德;writing-review编辑是由核磁共振伊斯兰教,阿拉姆表示抗议,K艾哈迈德。

确认

这项工作是由塔伊夫大学的研究人员支持项目数量(TURSP-2020/114),塔伊夫大学,塔伊夫,沙特阿拉伯。