肺癌死亡率很高。促进早期诊断和筛查肺癌的最有效的方式是提高肺癌患者的生存率。通过计算机技术,基因检测结果的综合评价,肺癌患者的基本临床资料能有效地诊断早期肺癌和表明癌症风险。本研究回顾性收集70对肺癌组织样本和正常的人类组织样本。6基因的甲基化频率(RASSF1A基因FHIT基因p16,管理,APC, DAPK)在肺癌患者中,基本的临床信息,和肿瘤标志物水平的患者进行了分析。然后,python包“sklearn”是用来建立一个支持向量机(SVM)分类器执行10倍交叉验证建立诊断模型,可以确定肺癌疑似病例的风险。接受者操作特征(ROC)曲线,和性能的基于几个因素的综合诊断模型(临床信息、肿瘤标记物水平和血液中6基因的甲基化频率)被证明是比模型只有一个病理特征。组合模型的AUC值为0.963,和敏感性,特异性,和准确性分别为0.900,0.971,和0.936,分别。上面的结果显示,基于这些特性是高度可靠的诊断模型,可以屏幕和诊断疑似早期肺癌患者,有助于提高诊断速度和肺癌患者的生存率。
肺癌仍是全球癌症死亡的主要原因(
早期筛查可以有效地降低肺癌的死亡率。现有的成像技术,如低剂量计算机断层扫描(CT)检查可以降低肺癌死亡率降低20%。然而,低剂量CT申请肺癌筛查是有限的误判率高和高成本,及其重复扫描会对人体造成一定的伤害
基于先前的研究和调查,我们认为6肿瘤抑制基因的甲基化(RASSF1A基因FHIT基因p16,管理,APC,和DAPK)与肺癌患者的预后相关。因此,本研究试图建立一个诊断模型为疑似肺癌患者临床特征的基础上,6-gene甲基化频率在血液和肿瘤标志物水平通过使用支持向量机分类器。这个模型可以帮助患者的早期筛查和诊断肺癌,肺癌,展开尽早疑似患者的风险,从而治疗患者在时间和提高其存活率。
本研究回顾了70例门诊病人(45岁男性和25岁女性,30到85岁)受肺癌在郑州大学第二附属医院和河南省级医院胸部2015.03.31 2019.11.31。病人在第四阶段我符合以下标准的人包括:(1)患者在临床和组织病理学诊断为原发性肺癌没有其他器官疾病;(2)病人之前没有收到任何放疗,化疗,或手术前抽样。正常的临床样本收集从70年健康的捐赠者(36男性和34岁女性,32到81岁)接受身体检查在郑州大学第二附属医院和河南省级医院胸部被招募为对照组。所有的健康受试者没有其他器官的疾病。病人的临床资料,包括年龄、性别、吸烟史、病理类型,主要病变,收集阶段。健康受试者临床信息包括年龄、性别、吸烟史。研究协议是医学伦理委员会批准郑州大学第二附属医院、河南省级医院胸部,和所有参与者签署知情同意。
试剂盒PAXgene®血液ccfDNA管(上海汇生物科技有限公司)是用于收集空腹静脉血(> 6毫升/病人)。血液样本在2000 r·分钟离心机115分钟在4°C。血清总是孤立的肿瘤标志物检测和cfDNA提取,分别。
cfDNA从血液样本中提取了GeneJET全血基因组DNA纯化迷你包(热费希尔科学)和纯度分析NanoDrop nd - 1000分光光度计(美国NanoDrop)。
肺癌肿瘤标志物水平的血清样本评估以下包/制造商的指示。东航工具包(ab99992)和CA125工具包(ab274402)从Abcam购买,英国剑桥。CYFRA21-1工具包(猫No.211-10)和SCCA工具包(猫No.800-10)从瑞典访问CanAg(北京)。总之,相应的剂量的校准器和未知样本添加到每个微量滴定板;然后,50
基因启动子区域的甲基化状态是由MSP,和1
MSP中使用的引物序列。
| 基因 | 底漆 |
|---|---|
| FITH-M | 转发:5 |
| 反向:5 |
|
|
|
|
| FITH-U | 转发:5 |
| 反向:5 |
|
|
|
|
| P16-M | 转发:5 |
| 反向:5 |
|
|
|
|
| P16-U | 转发:5 |
| 反向:5 |
|
|
|
|
| MGMT-M | 转发:5 |
| 反向:5 |
|
|
|
|
| MGMT-U | 转发:5 |
| 反向:5 |
|
|
|
|
| RASSF1A-M | 转发:5 |
| 反向:5 |
|
|
|
|
| RASSF1A-U | 转发:5 |
| 反向:5 |
|
|
|
|
| APC-M | 转发:5 |
| 反向:5 |
|
|
|
|
| APC-U | 转发:5 |
| 反向:5 |
|
|
|
|
| DAPK-M | 转发:5 |
| 反向:5 |
|
|
|
|
| DAPK-U | 转发:5 |
| 反向:5 |
|
这里,结合样本临床资料(年龄、性别、吸烟史),肿瘤标记物表达水平,和6基因的甲基化频率血,SVM分类器是由python包“sklearn”执行十倍交叉验证。然后,接受者操作特征(ROC)曲线绘制计算曲线下的面积(AUC)值来验证可靠性和评估建立诊断模型的性能。
通过敏感性预测模型的性能评价(
卡方检验是评价肺癌患者和健康者之间的关系等方面的临床病理特征和基因甲基化频率。由于血清肿瘤标记物水平的患者和健康者不符合正态分布,使用的数据是由(
模型程序用于确定病人是否有肺癌是由我们的团队成员,提供开源模式的代码(
所有样本的基本信息和临床特征包括在本研究详细的表
包括样本的基本信息。
| 样品 | 肺癌患者( |
健康受试者( |
|
|---|---|---|---|
| 年龄 | |||
| ≤60 | 34 | 42 | 0.17 |
| > 60 | 36 | 28 | |
| 性别 | |||
| 男性 | 45 | 36 | 0.12 |
| 女 | 25 | 34 | |
| 吸烟史 | |||
| 吸烟者 | 32 | 22 | 0.21 |
| 不吸烟者 | 22 | 26 | |
| 曾经吸烟 | 16 | 22 | |
| 病理类型 | |||
| 腺癌 | 31日 | - - - - - - | |
| 鳞状细胞癌 | 39 | - - - - - - | |
| 主要病变 | |||
| 左肺 | 34 | - - - - - - | |
| 对肺 | 36 | - - - - - - | |
| 阶段 | |||
| 我+二世 | 31日 | - - - - - - | |
| 3 + 4 | 16 | - - - - - - | |
| 未知的 | 23 | - - - - - - |
共有140名肺癌患者和健康受试者的血样收集进行分析。结果表示,四种血清肿瘤标记物水平(SCCA,东航,CYFRA21-1和CA125)肺癌的患者明显高于健康受试者的数据具有统计上的显著差异,如表所示
血清肿瘤标记物水平的样品(
| 血清肿瘤标志物 | 肺癌患者( |
健康受试者( |
|
|---|---|---|---|
| CEA (ng / mL) | 5.63 (2.83,25.36) | 1.93 (1.18,3.51) | < 0.05 |
| CYFRA21-1 (ng / mL) | 3.97 (2.50,7.43) | 1.99 (1.39,2.49) | < 0.05 |
| SCCA (ng / mL) | 1.35 (0.86,2.70) | 0.91 (0.62,1.19) | < 0.05 |
| CA125 (U /毫升) | 38.21 (15.71,85.50) | 11.23 (8.00,16.12) | < 0.05 |
管理,本研究发现FHIT基因P16, RASSF1A基因,APC, DAPK肺癌的甲基化标记通过文献综述和先前的研究[
6基因的甲基化频率包括样本。
| 甲基化频率 | 肺癌患者( |
健康受试者( |
|
|---|---|---|---|
|
|
|||
| 甲基化 | 33 | 1 | < 0.05 |
| Nonmethylation | 37 | 69年 | |
|
|
|||
| 甲基化 | 14 | 4 | < 0.05 |
| Nonmethylation | 56 | 66年 | |
|
|
|||
| 甲基化 | 7 | 1 | < 0.05 |
| Nonmethylation | 63年 | 69年 | |
|
|
|||
| 甲基化 | 26 | 5 | < 0.05 |
| Nonmethylation | 44 | 65年 | |
|
|
|||
| 甲基化 | 33 | 7 | < 0.05 |
| Nonmethylation | 37 | 63年 | |
|
|
|||
| 甲基化 | 24 | 3 | < 0.05 |
| Nonmethylation | 46 | 67年 |
better-diagnosing肺癌患者的临床医生、临床资料(年龄、性别、吸烟史),肿瘤标记物表达水平或风险基因的甲基化分析了单独或集体的10倍交叉验证的支持向量机分类器。之后,几个诊断模型被ROC曲线(图构造和验证
ROC曲线的诊断模型。
肺癌是最致命的癌症,早期很难被检测到,因此,大多数病人已经确诊的晚期(
肿瘤标记重要的筛查、诊断和疗效评价肺癌,但是他们的独立使用无法准确识别和诊断肿瘤特异性和灵敏度较低
支持向量机的基本思想是通过映射和构造分类超平面,为了解决这一问题,将低维空间中的非线性问题转换成线性问题,在高维空间中(
总之,本研究建立了一个结合肺癌的诊断模型和有利的功效通过SVM分类器基于样例的临床特性,肿瘤标志物水平,6-gene甲基化频率。这个模型建立在这项研究可能帮助临床医生在一个精确的测定在早期肺癌患者/肺结节,从而提高诊断速度和早期肺癌的生存率。本研究在一定程度上有临床应用价值。虽然上述研究可以验证模型的准确性,仍然存在不足。需要做进一步的工作来验证这个模型对肺癌的诊断价值通过扩大样本容量与多中心组合和标准化的检测证明测试。
使用的数据来支持本研究的结果包括在本文中。如果需要任何额外的数据和材料可以从相应的作者以合理的要求。
所有作者同意提交出版的手稿。
作者宣称他们没有潜在的利益冲突。
CY为研究设计做出了贡献。JC进行文献搜索。DD获得数据。XZ写了这篇文章。LX进行数据分析。外汇起草。JC修订文章的最终批准,并提交的版本。所有作者阅读和批准最终的手稿。
本研究支持的基金从河南省的科技项目(192102310373)。本研究基金支持的重点科研项目的高校在河南省(19 a310011)。