文摘

结直肠癌(CRC)是全世界癌症死亡的主要原因之一。肠癌筛查程序使我们能够发现早期病变,提高CRC患者的预后。然而,他们也产生大量的有问题的息肉,例如,与上皮腺瘤错位(pseudoinvasion)可以模仿早期的腺癌。因此,生物标记物,将使我们能够区分与上皮腺瘤错位(pseudoinvasion)和腺瘤和腺癌早期(真正的入侵)是必要的。我们假设前腺瘤基因相似,后者的腺癌,我们用生物信息学方法搜索候选基因可能潜在的用于区分两个病变。我们使用公开可用的基因表达综合数据库的数据,我们分析了252个样本的基因表达谱正常粘膜,结直肠腺瘤和癌。总的来说,我们分析了122结直肠腺瘤,59大肠癌癌,62正常粘膜样本。我们已经确定了16个基因在癌与腺瘤与微分表达式:COL12A1,COL1A2,COL3A1,宽带、PLAU SPARC、SPON2 SPP1,SULF1,FADS1、G0S2 EPHA4 KIAA1324,L1TD1, PCKS1,C11orf96。总之,我们的在网上与不同的表达模式分析显示16个候选基因腺瘤和癌相比,这可能会被用来区分这两种病变。

1。介绍

结直肠癌(CRC)是由多步过程从正常上皮腺瘤和腺癌,可最终转移到不同的器官1]。介绍了CRC的发展模式在1990年,在哪里APC,喀斯特,TP53,DCC提出了基因促进CRC的发展(2]。以来,许多研究已经调查了CRC的潜在的分子机制。接受,CRC源自积累的遗传和表观遗传事件改变细胞信号传导通路,如Wnt PIK3CA, TGF -β。发病机制的三个主要途径接受CRC是染色体不稳定途径,微卫星不稳定性的途径,CpG岛methylator表型。有许多CRC缺乏上面描述的变化途径,表明其他机制参与CRC的发展(1]。

CRC是全世界癌症死亡的主要原因之一。在欧洲,CRC是第二个和第三个癌症死因的男性和女性,分别为(3]。早期的CRC患者5年生存率是90%,而对于先进的CRC患者,存活率下降只有8 - 12% (4]。预后的引入可以显著提高人口筛查。肠癌筛查程序使我们能够发现早期病变,包括腺瘤和腺瘤早期腺癌(恶性息肉)。然而,他们也产生大量的问题息肉含有腺体发育异常的黏膜下层。这一现象被称为上皮错位(pseudoinvasion)。它可以扭转的结果或管腔内的大型有梗的创伤远端结肠息肉,或者它可能是前一个活组织检查的结果。与上皮腺瘤错位(pseudoinvasion)很难区分腺瘤与腺癌早期(5- - - - - -7]。正确的诊断治疗最佳的选择是至关重要的。腺瘤和腺瘤上皮错位,内镜切除就足够了,而恶性腺瘤(癌早期)可能需要手术治疗,因为他们有能力转移(7]。

尽管定义良好的上皮错位的形态学特征和早期的入侵,有大量的病变与模糊特性之间的诊断意见分歧导致病理学家(7]。生物标记,使区分与上皮腺瘤错位(pseudoinvasion)和腺瘤与腺癌早期(真正的入侵)是必要的。我们假设前者是腺瘤基因相似,后者腺癌和我们用生物信息学方法搜索候选基因可能潜在的用于区分两个病变。

在CRC被广泛研究的基因表达微阵列技术,通常比较癌和正常粘膜组织,研究微卫星不稳定的CRC,或建立基于CRC亚型基因表达模式(8- - - - - -10]。的一些研究集中在结直肠腺瘤和癌之间的基因表达差异11- - - - - -15]。这些研究的缺点是限制数量的样本。因我们的目标是最小化任何可变性不同的微阵列和程序,确定与腺瘤相关的基因,随后通路发展为癌。由于研究的目的,我们选择了五个不同的数据集,其中包含正常,腺瘤和癌样本,两人没有发表。

2。材料和方法

2.1。微阵列数据

几个项目(GSE10714 GSE37364、GSE41657 GSE50114,和GSE50115)与基因表达谱的结肠正常,腺瘤和癌样本从公共功能基因组学数据下载repository-Gene表达式综合数据库(地理,http://www.ncbi.nlm.nih.gov/geo)的国家生物技术信息中心(NCBI)。总共7 CRC, 5腺瘤,3正常粘膜标本中包括GSE10714,而27 CRC, 29腺瘤,38个正常粘膜标本中包括GSE37364(无论是在平台GPL570 Affymetrix人类基因组U133 + 2.0数组)。GSE41657是由25 CRC, 51腺瘤,12正常粘膜样本,和GSE50114结合GSE50115包含9 CRC, 37腺瘤,9正常粘膜样本(所有三个平台GPL6480安捷伦整个人类基因组芯片4 x44k G4112F)。结肠活检的总共252个样本,包括62年正常,122腺瘤,和59 CRC样本,包括在这项研究中。

2.2。数据处理

所有项目的原始数据文件下载并进一步规范化R语言(https://www.r-project.org/)。项目在Affymetrix数组(GSE10714 GSE37364)包affy用于玻璃纸文件转换成使用健壮的多片平均函数表达数据,执行背景校正和标准化的一步(16]。项目在安捷伦数组(GSE41657、GSE50114 GSE50115)包limma是用于执行背景校正和标准化之间的数组(17]。数据归一化后的基因过滤器是用来去除探针强度小于100年的超过20%的样本在每个项目。

差异表达基因(度)在调查发现水平使用limma包R为每个单独的项目18]。我们构建三个对比矩阵(腺瘤与正常相比,癌与腺瘤相比,和癌与正常相比)为每个地理项目。截止条件设置调整p值< 0.05和日志褶皱的绝对值变化(日志FC) > 1.5。每一个比较(腺瘤与正常相比,癌与腺瘤相比,和癌与正常相比)重叠在项目获得度共同所有的项目。

2.3。功能分析和蛋白质相互作用网络

功能分析和蛋白质-蛋白质之间的关系(PPI)网络建设,检索的搜索工具相互作用的基因(STRING)数据库采用(https://string-db.org/)。PPI网络分析的一个重要工具,解释的致癌过程的分子机制。字符串提供了综合工具背后揭示生物学的意义大的基因集,提供除了PPI网络建设以及功能和通路富集分析。基因本体论(去)分析包括生物过程、分子功能,细胞组件和京都基因和基因组的百科全书(KEGG)通路富集分析进行选择度与字符串。统计显著性阈值被设置为p < 0.05。

在这项研究中,我们构建了PPI网络的度癌与正常相比,腺瘤比较正常,癌与腺瘤相比。PPI网络构建的截止下交互得分为0.4分。可视化的三个网络在一起完成Cytoscape版本3.5.1 (http://www.cytoscape.org/)。

3所示。结果

分别从每个微阵列数据分析获得度为每一比较,癌与正常相比,腺瘤比较正常,癌与腺瘤相比。我们确定了172个基因在所有项目重叠癌相比正常(GSE37364 GSE10714 568, 845, 1057年GSE41657,和806年GSE50114 combind GSE50115), 137个基因在所有项目重叠腺瘤相比正常(GSE37364 GSE10714 530, 412, 927年GSE41657,和555年GSE50114 combind GSE50115),在所有的项目和26个基因重叠癌与腺瘤(GSE37364 GSE10714 252, 392, 116年GSE41657,和348年GSE50114 combind GSE50115)(图1)。我们还与联盟构建的热图的基因差异表达在每一个单独的项目,确认样品属于三个不同的组,即正常胃粘膜癌,腺瘤,样品(图2)。

为了调查我们选择度,我们重叠的基因在每个比较,获得独特的基因特征为每个比较(补充图1)。正如预期的那样,最度被发现癌与正常粘膜组织(172)相比,少与正常组相比,腺瘤(137),癌与腺瘤组,26度(补充表1)。有趣的是,没有度这三个比较常见。

3.1。蛋白质相互作用网络

PPI网络的基础上构建字符串使用Cytoscape数据库和可视化软件。图3代表网络的基因差异表达分析。在整个网络中,顶部中心基因IGF1 (21), MYC (20), FN1 (14), CXCL12 (14)、GCG (13), AGT (10)、BCL2 (10)。在括号中表示数量的数量每一个基因与其他基因网络的交互。

我们确定每组顶部中心基因,至少有四个连接一个基因。正常顶部中心相比,腺瘤基因是APOE (7), NR3C1(4),和NMU(4),在前中心癌与正常基因AGT (10)、BCL2 (10), AURKA (9), MMP3 (6), cdc 6 (6), TPX2 (6), PRKACB (6), UB2C (5), SULT1A1 (4), KLF4 (4), ECT2(4),和MMP1(4)相比,腺瘤和癌前中心基因COL3A1 (6), COL1A2 (6), SPARC(5),宽带(5),和SPP1 (4)。

3.2。功能富集分析

的五大重要条款和KEGG浓缩分析展示在表1,而所有条款补充表中可以查看2。组癌相比正常展品浓缩在生物蛋白质磷酸化调节的过程,一个碳代谢过程,碳酸氢离子运输,对内生的刺激做出反应,和运输。至于分子功能,这些基因是富含碳酸盐脱水酶活动,催化活性,荷尔蒙活动,绑定和metallopeptidase活动。细胞功能是包含丰富的基因在细胞外的地区,囊泡,面上泡,细胞外区域部分,细胞外的外来体。腺瘤的生物学过程浓缩与正常组相比阴离子交通,一个碳代谢过程,碳酸氢盐运输、有机离子运输和离子运输。在这一组中,只有一个分子功能词丰富,即碳酸脱水酶的活动。基因在细胞外的细胞组成部分地区丰富,细胞外空间,细胞外区域部分,面上泡,膜区域。有趣的是,在描述癌与正常组和腺瘤相比正常同一KEGG途径进行浓缩,即。、氮代谢、胆汁分泌和近端小管重碳酸盐复垦。此外,正常组相比,癌症两个KEGG通路被发现,即化学致癌作用和胰腺分泌。

3.3。癌与腺瘤

最有趣的是腺瘤和癌之间的比较。对比矩阵的建设使我们能够比较两组,但是我们没有关于第三组的信息。比较三组,我们构建了一个图的对数平均强度值,比较正常,腺瘤和癌样本(图4)。16个基因的图中显示独特的癌与腺瘤组与正常样本的平均强度也不同。有四种类型的表达的变化。COL12A1遵循第一个模式有相似的表达在正常和腺瘤,在癌表达升高。表达类似的其他模式是正常的腺瘤,并降低表达式中观察到癌。基因是遵循这种模式KIAA1324PCKS1EPHA4L1TD1遵循第三种模式,高表达在正常和癌腺瘤和较低。所有其他的基因C11orf96,COL1A2,COL3A1,宽带运,FADS1,G0S2,PLAU,SPARC,SPON2,SPP1,SULF1遵循第四模式,表情却降低了在正常和癌腺瘤和增加。

4所示。讨论

腺瘤的CRC可以通过发展起来,这是上皮细胞的遗传和表观遗传事件的结果。一些芯片的研究已经确定的腺瘤和癌基因表达谱11,19- - - - - -24]。然而,Nannini等人进行的一项研究显示有相当弱重叠的基因表达谱在不同的研究。他们给这几个原因:技术变化带来的样品,协议用于样品制备,使用的芯片类型和后续数据分析管道使用,和缺乏大规模研究[25]。我们克服了这些局限在两个不同的平台上,通过使用更多的数据集Affymetrix人类基因组U133 + 2.0阵列和安捷伦整个人类基因组芯片4 x44k G4112F。我们使用四个微阵列基因表达研究的原始数据集(GSE10714-Gambo et al。19),GSE37364-Valcz et al。26,GSE41657 GSE50114 GSE50115-the后者三未发表)并进行了归一化的过程,总结,和过滤,无论程序的作者提供的数据。

本研究的目的是调查的差异基因表达谱的结直肠腺瘤和腺癌相比,使用正常粘膜样品作为参考。我们的分析显示,许多变化发生在腺瘤与正常组相比,表明腺瘤是一个正常和癌之间的中间状态,尽管并不是所有的变化中发现癌腺瘤。我们确定了16个基因表达模式独有的癌与腺瘤相比,表明这些16基因有一种角色可以促进发展的腺瘤癌。已经报道了这些基因的腺瘤和癌相比,等SPON2(15),SPP1,SPARC(11),这是为我们自己的分析验证。

功能分析的基因在癌与腺瘤组透露,最重要的生物过程和KEGG通路与细胞外基质(ECM)相连。两大重要的生物过程在这个比较ECM拆卸和其他ECM组织;此外KEGG通路是ECM-receptor交互。基因参与这两个生物过程途径是相似的;COL12A1,COL1A2,COL3A1,宽带运,FN1,SPP1参与ECM拆卸和相同的基因添加SPARCSULF1参与ECM组织(补充表吗2)。基因在这些途径都是调节癌与腺瘤相比,表明ECM组织参与的过程中发展的腺瘤癌。

ECM是上层建筑,它有一个支持的作用,但另一方面,它还提供信号的细胞,这决定了他们的行为。因此,EMC是直接参与EMT的过程在恶性转化和癌症的病理过程中起着重要作用[27]。我们的分析结果表明,16的基因,这显示,癌与腺瘤相比,微分表达式是ECM的组件。这些基因都是三个胶原蛋白的基因,宽带、PLAU SPARC、SPON2 SPP1,SULF1。他们都显示,癌与腺瘤表达的增加在我们的研究中。

两个我胶原蛋白(COL1A1,COL1A2)被发现显著调节肿瘤组织与正常组织相比。研究显示高表达我在II期肿瘤的胶原蛋白,这表明激活胶原蛋白我是CRC进展的早期事件。胶原蛋白的发现表明,表达我在CRC的早期阶段,高胶原蛋白我需要肿瘤侵袭性28]。细胞系的研究表明,坚持我胶原蛋白促进胞内信号通路,包括AKT通路;此外胶原蛋白我证明诱导EMT-like变化,与肿瘤进展和转移相关(29日,30.]。的表达COL3A1基因被证明是调节CRC与正常对照组相比。王等人用kaplan meier生存分析表明增加COL3A1蛋白在癌上皮细胞预测预后差(31日]。这项研究扩展到等离子体样品,可溶性细胞外蛋白质COL3A1也明显高于CRC患者与正常对照组相比。同时,COL3A1发现促进CRC细胞增殖通过激活一种蛋白激酶信号通路(31日]。一项研究使用微阵列数据(GSE20219)和实验验证COL12A1基因。它的表达不断从正常增加,通过腺瘤癌。此外,的表达COL12A1据报道,明确区分正常、腺瘤和癌组,并可能进一步诊断潜在的(32]。除了胶原蛋白,EMC也包含其他蛋白质,如蛋白聚糖、硫酸酯酶和磷蛋白质。宽带是一个fibril-associated蛋白多糖,EMC中找到。虽然调节癌,腺瘤相比,整体的表达宽带运是表达下调当正常癌和腺瘤比较正常。的作用宽带运在体内和体外都表明它的肿瘤抑制作用是在基质和上皮细胞(33]。的免疫反应性之间的负相关宽带运观察和恶性潜力(34]。

PLAU是一个urokinase-like纤溶酶原激活物(uPA)分泌丝氨酸蛋白酶,将纤溶酶原转化为物活性胞浆素。uPA-R uPA其受体结合,激活它的蛋白水解活性,促进ECM降解,随后入侵和肿瘤细胞的迁移。的PLAU是CRC发现调节。此外,增加活动的血纤维蛋白溶酶/纤溶酶原系统物导致肿瘤萌芽,这也是淋巴结转移显著相关(35]。SPARC的家庭成员matricellular蛋白质,钙结合蛋白。研究表明,SPARC表达在间充质基质细胞(MSC)相比显著增加表达在肿瘤细胞和正常粘膜组织。低表达的SPARC是一个独立的不利的结肠直肠癌的预后因子(36]。另一个ECM蛋白分泌是SPON2,属于mindin / F-spondin家庭。Spondin蛋白质在不同的信号通路发挥重要的作用,重要的癌症。SPON2发现是调节在许多癌症,包括CRC。SPON2也被作为一种生物标志物在等离子体的CRC患者进行测试,完成手术之后,这是调节和表达下调,表明SPON2与肿瘤负荷(37]。SPP1磷蛋白质存在调节在许多癌症,包括CRC。人们发现它促进细胞增殖和转移通过激活EMT (38]。最后一个ECM组件之间的显著差异表达腺瘤和癌是硫酸酯酶,SULF1。硫酸酯酶过表达在CRC和导致细胞增殖,迁移和入侵39]。

其他基因不是连接到ECM但都包含在癌的进展。两个基因在癌和腺瘤相比,增加了表达这些FADS1G0S2。FADS1是脂肪酸desaturase基因家族的一员,已经被修改建议调节炎症代谢物的脂肪酸,这可能影响癌症的恶化。减少表达FADS1好处发展和增长的癌症细胞,而增加表达式被观察到的保护性因素食管鳞状细胞癌(ESCC)。减少表达与预后不良相关ESCC患者(40]。的表达G0S2表达下调在各种癌症细胞和肿瘤抑制的性质。的upregulationG0S2显示显著减少肿瘤细胞生长和能动性。自G0S2是负的甘油三酯分解代谢的调节,细胞脂质代谢存在于转换的改变从正常癌(41]。

最后四个基因在我们的研究中表达下调在癌和腺瘤相比,这是EPHA4, KIAA1324,L1TD1,PCKS1。Upregulation EPHA4的观察到在各种癌症,包括CRC。研究表明,激活EPHA4与高度侵略性EMT-like表型相关。同时,激活EPHA4减少钙粘蛋白表达和细胞迁移和入侵控制通过PI3K信号(42]。KIAA1324是一种跨膜蛋白,也称为EIG121(雌激素基因121)。结果表明:KIAA1324作为一个肿瘤抑制胃癌细胞株,感应的KIAA1324基因表达显著降低肿瘤大小(43]。L1TD1 rna结合蛋白,这是多能细胞中高度表达。L1TD1枯竭导致减少OCT4和NANOG水平和增加人类胚胎干细胞分化为)。L1TD1需要为其自我更新和报告的主要监管机构的干细胞命运(44]。一项研究报告的表达增加PSKC1与正常相比,鼻息肉鼻粘膜。此外,他们显示的表达增加PSKC1诱发EMT-like过程在气道上皮细胞。细胞系表现出形态转换与典型epithelial-like形状细长,纺锤体形态。过度的PSKC1导致了一个增强的细胞增殖和展品受伤后显著增加细胞迁移。也减少显示的细胞上皮间充质标记的标记和增加表达的表达(45]。

总之,区别与上皮腺瘤错位(pseudoinvasion)腺瘤早期癌(真正的入侵)是非常重要的,以选择最佳的治疗。为了这个目的,我们确定了16个候选基因与腺瘤和癌相比,不同的表达模式与一个潜在的区分这两种病变,这将是我们未来工作的基础上,我们将通过实验验证基因选择与上皮腺瘤组织部分错位早期癌和腺瘤。

数据可用性

使用的数据来支持本研究的发现可以从相应的作者。

的利益冲突

作者宣称没有利益冲突。

确认

作者要感谢Daša Jevšinek . Skok,博士(大学医学院病理学研究所卢布尔雅那)设计的人物3。作者承认金融支持斯洛文尼亚研究机构通过研究核心资助。p3 - 0054。尼娜Hauptman斯洛文尼亚承认金融支持研究机构通过项目没有。z3 - 6797。

补充材料

补充1补充数据:图1显示了差异表达基因的数量在每个比较及其交叉;图2显示了对数平均强度的值正常,腺瘤,并为(a) GSE10714癌样本,(b) GSE37364, (c) GSE50114 GSE50115。

补充2补充表1显示了在每个基因普遍比较的列表及其表达式为每个项目。

补充3补充表2显示了基因本体和KEGG各组比较差异表达的基因。