文摘

本研究旨在进行模型的基础上,广泛学习系统(BLS)预测患者住院的28天死亡率社区获得性肺炎(CAP)。共有1210个符合条件的限制情况下从市政赤峰市医院终于包含在这个回顾性病例对照研究。随机森林(RF)和一个极端的梯度增加(XGB)模型被用来开发预测模型。美国劳工统计局的数据特征提取是利用射频和XGB模型来预测帽的28天死亡的病人,建立两个模型BLS-RF和BLS-XGB集成。我们的结果显示集成模型BLS-XGB作为一个有效的广泛学习系统(BLS)预测患者的死亡风险,这不仅表现好于两个基本模型也表现得比集成模型BLS-RF和两个著名的深度学习systems-deep神经网络(款)和卷积神经网络(CNN)。总之,BLS-XGB可以推荐为一个有效的模型来预测住院后28天限制患者的死亡率。

1。介绍

肺炎是最常见的呼吸道疾病(1]。抗生素的出现之前,肺炎是人类健康的主要杀手之一(2]。随着现代医学的发展,许多治愈的病人肺炎抗生素和辅助治疗,但之间的死亡率仍然很高很年轻,老年人和那些免疫功能(3]。肺炎患者的初始治疗后,关键是紧急医疗人员来评估这些患者是否需要住院治疗(4]。不必要的住院不仅增加了感染的风险,而且排水卫生保健资源(5]。几个肺炎严重程度量表可用于评估病人的疾病的严重程度,但这些尺度主要用于住院患者,不适合急诊病人6]。社区获得性肺炎(CAP)是一种常见的呼吸系统传染病(7]。深刻了解抗生素使用的潜在影响因素质量基本上是需要开发有效的和有针对性的干预措施,提高患者照顾帽(8]。准确评估是很有价值的初始治疗疾病,临床稳定性和长期预后[9]。生物标记物的免疫细胞和免疫蛋白显著增加的过程中微生物免疫和辅助诊断价值评价的帽(10]。

现在,人工智能已经用于解决紧急问题医学工程特别是预测帽(11]。为了避免上限的毁灭性影响病人的日常生活和医疗保健系统和控制这种病毒的进一步传播,我们不仅需要一个有效的早期诊断感染的患者通过有效的筛查,但还需要预测帽病人死亡的风险(12,13]。提出了一系列的模型和算法搜索最佳隐层体系结构、连通性、深度学习和训练参数系统预测前列腺癌的危险性患者呼吸道投诉,但这些模型和算法的效率在预测患者住院的死亡风险帽需要进一步调查,与此同时,新方法是非常必要的(14,15]。

我们的目标在当前研究(1)基于前面的模型开发一个有效的模型和算法预测28天死亡率的风险患者住院帽,用随机森林(RF)和极端的梯度增加(XGB)模型(16];(2)利用广泛的学习系统(BLS)提取特征和评估的重要性,美国劳工统计局特性预测病人的28天死亡率(17];和(3)比较的性能模型有两个著名的深度学习systems-deep神经网络(款)和卷积神经网络(CNN)。

2。材料和方法

2.1。研究设计和人口

这是一个回顾性病例对照研究。1397限制病人的信息是来自市政赤峰市医院2019年8月至2020年12月。后扣除例 年( ),最近接受化疗( ),先进的肝脏疾病( ), ( ),1210名符合条件的患者终于纳入本研究。本研究机构审查委员会批准(IRB)市政赤峰市医院(批准文号:没有。2019大于)。

入选标准如下:(1) 岁,(2)患者诊断为帽根据中国成人社区获得性肺炎诊断和治疗指南,和(3)可用信息的28天死亡率或住院后生存。

排除标准:(1)最近接受化疗的患者,糖皮质激素,或其他免疫抑制剂;(2)暴露在抗生素前14天内进入集团;(3)晚期肝病患者;(4)接受血液透析;(5)患者 ;(6)患者严重感染;和(7)患者免疫功能紊乱。

2.2。数据收集

限制患者的人口统计学和临床信息收集,包括性别、年龄、国籍、疾病史(过敏、高血压、糖尿病、肺部疾病恶性肿瘤,心力衰竭(HF)),手术史,吸烟,饮酒,收缩压(SBP)、舒张压(菲律宾)、呼吸频率、心率(HR)、白细胞(WBC)计数,红细胞(RBC)计数、血红蛋白(Hb)水平、血小板(PLT)计数、天冬氨酸转氨酶(AST)水平,血清白蛋白(铝青铜)水平,血尿素氮(BUN)测定水平,肌酐(Cr)水平,血糖(Glu)水平,猪降钙素(PCT)的水平,和c反应蛋白(CRP)水平。结果是28天的住院病人的死亡率与帽子。

2.3。预测模型的建立和验证

所有限制患者被随机分成训练集和测试集的比例6:4。两组之间的平衡进行了测试。六个预测模型进行了使用训练集(图1)。逻辑回归、射频、款和CNN分析用于建立四个模型预测28天死亡率的风险患者住院帽,分别。所有研究变量输入劳工统计局106生成功能。然后,两个模型(BLS-RF和BLS-XGB)根据106年特性建立了使用射频和XGB分析,分别。图2显示BLS-RF模型的建立。曲线下的面积(AUC)、精度、灵敏度、特异性、阳性预测价值(PPV)和阴性预测价值(NPV)评估六个模型的预测性能。六的内部验证预测模型是使用测试集进行的。接受者操作特征(ROC)曲线的BLS-RF BLS-XGB, CNN和款模型预测帽的28天死亡患者如图3

款由三层组成,输入层、隐藏层和输出层。每一层是完全连接。使用原始数据作为输入层,获得的样本特性逐步通过隐藏层,然后在输出层预测的特性。对于深度学习的流程,使用30个隐藏层。

CNN的全称是卷积神经网络,其中包括三个卷积层为特征提取和最大池层抽样。对分类和完全连接层2特征提取的卷积层,无用的功能是由池层排除,最后特性在输出层进行分类和预测的完全连接层。在这项研究中,四个卷积层,一个汇聚层,和一个完整的连接层采用。

2.4。统计分析

测量数据的正常测试被夏皮罗测试评估。连续变量的正态分布进行了分析 测试和表达的 ( )。非正态的分布由Mann-Whitney测量数据进行了分析 测试和用中位数和四分位数( )。分类数据进行利用 测试或费舍尔的确切概率方法,病例数量和构成比( )。缺失的数据都是由随机森林的分析。进行了敏感性分析。所有统计分析使用Python软件。 被认为是一个统计的差异。

3所示。结果与讨论

3.1。患者住院帽的特征

共有1210个符合条件的限制患者最终包括在这项研究中,平均年龄的 年。其中,120例患有住院期间死亡。所有患者被随机分成训练( )和测试( )集根据6:4。没有差异,性别、年龄、国籍、疾病史(过敏、高血压、糖尿病、肺部疾病恶性肿瘤,和高频),手术史,吸烟,饮酒,SBP,类似呼吸速率,人力资源,白细胞计数,红细胞计数,Hb水平,PLT, AST水平,铝青铜级别,包级别,Cr, Glu水平,PCT水平,(所有c反应蛋白水平 )。显示的数据是两组之间的平衡。限制病人的特点在训练集和测试集表所示1

3.2。模型的预测性能的28天限制患者的死亡率

的AUC值BLS-RF模型预测限制患者的28天死亡率为0.979(95%置信区间:0.963—-0.996)和0.962(95%置信区间:0.936—-0.988)在训练集和测试集,分别。BLS-XGB模型的AUC值为0.958(95%置信区间CI: 0.928 - -0.0988)和0.943(95%置信区间:0.905—-0.980)在训练集和测试集,分别。款用于训练集的AUC是0.968(95%置信区间:0.947—-0.990)和测试集的AUC是0.907(95%置信区间:0.860—-0.955)。CNN在训练集的AUC为0.980(95%置信区间:0.967—-0.993)和AUC在测试设置为0.938(95%置信区间:0.910—-0.966)。使用基本的预测模型,AUC的射频训练集是0.900(95%置信区间:0.861—-0.939)和测试集的AUC是0.786(95%置信区间:0.727—-0.846)。物流模型的AUC为0.832(95%置信区间:0.785—-0.879)在训练集和0.714(95%置信区间:0.649—-0.780)在测试集。最后,劳工统计局是用来学习和输出特性,和随机森林预测是使用,如图34

从AUC,我们可以发现两种培训模式的AUC根据劳工统计局在测试集(类似 )。然而,没有明显区别的AUC款和CNN在测试集( )。之间没有显著差异的AUC两种基本的物流和随机森林预测模型在测试集( )。测试组的AUC BLS-based随机森林模型优于款( )。集成模型在测试集的AUC不仅比基本模型的射频和物流在测试集。

3.3。图BLS-Based特性的重要性

如上所述节2,美国劳工统计局用于学习和输出特性,和随机森林预测。在劳工统计局输出特性,功能特性重要性最高的是60,65年,74年,9日,84年,45岁,18岁,102年,75年,49中最高的十大特性模型的重要性,BLS60是最重要的,其次是BLS65, BLS49是最低的,看细节图4

机器学习分析文本表示一直在利用一些先前的研究,如早期发现重新接纳风险决策支持基于临床笔记,发现临床笔记的预测价值,在胸部x光深度学习方法,深度学习技术在胸部x光,CT扫描(18,19]。但进一步调查应用程序在预测死亡的风险限制在住院患者呼吸道投诉仍然是必需的,和一个新颖的方法来改善模型性能也很必要的(20.- - - - - -23]。

3.4。比较预测模型

的准确性、敏感性、特异性、PPV和NPV的两个预测模型建立了通过使用劳工统计局学习和输出特性,这是一个brain-inspired模型(24]。,然后利用随机森林和XGB提取特征从美国劳工统计局所有模型中是最高的。因此,两个集成模型BLS-RF和BLS-XGB建立。的敏感性和NPV 模型使用训练集是0.970(95%置信区间CI: 0.929 - -1.000)和0.997(95%置信区间:0.992—-1.000),和那些使用测试集是0.925(95%可信区间:0.853 - -0.996)和0.989(95%置信区间:0.979—-1.000),分别。训练集准确性特异性,PPV的BLS-XGB模型0.959(95%置信区间CI: 0.944 - -0.973), 0.967(95%可信区间:0.953 - -0.980),和0.728(95%置信区间:0.632—-0.825),分别。测试设备的准确性、特异性和PPV BLS-XGB模型0.932(95%置信区间CI: 0.909 - -0.954), 0.958(95%可信区间:0.939 - -0.977),和0.679(95%置信区间:0.565—-0.801),如图5

3.2,我们利用劳工统计局构建更好的隐层结构和连接提取数据特征,在本节中,我们进一步训练参数综合广泛的学习系统和比较综合的效率模型与以往算法的性能在预测患者的死亡风险获得性肺炎后28天住院治疗。

如表所示2实验结果表明,该集成模型BLS-XGB ( , )作为一个有效的劳工统计局预测患者的死亡风险,这不仅表现优于两种基本模型射频( , )和综合模型BLS-RF ( , )而且执行比BLS-RF ( , )和两个著名的深度学习systems-DNN ( , )和美国有线电视新闻网( , ),和该模型进一步证明的竞争力。建议集成模型BLS-XGB作为一个有效的劳工统计局预测患者的死亡风险。

本研究旨在开发一种预测模型为28天的风险在患者住院死亡率帽,这本质上是重大紧急治疗系统在现代医院的明智的决定24- - - - - -28]。潜在的工程应用的模型将不局限于患者住院帽(29日- - - - - -32]。我们使用射频和XGB方法学习的样本特征数据后由劳工统计局(33- - - - - -38]。这种方法是小说相比,以前的研究在预测死亡限制情况下的风险39- - - - - -43]。集成模型的精度是90%以上,表明一个健壮的预测。我们的模型也使预测根据各种指标的患者。同时,与之前的方法相比基本模型和其他竞争模型,集成模型实际应用中的性能精度大幅度提高。未解决的问题也在治疗肺炎的主要挑战是病人的病情突然恶化,因此,随后紧急治疗储蓄个人病人需要进一步利用其他方法在医学和人工智能。

4所示。结论

劳工统计局提供的另一种方式学习在深层结构,在目前的研究中,结合XGB后,实验表明鲁棒预测控制帽病人住院后的28天死亡率风险。集成模型BLS-XGB被选为一个有效的模型来控制患者住院的28天死亡率帽。为后续研究中,我们鼓励其他研究者扩展潜在的工程应用提出的模型(不限于患者住院帽)。另一个下一个研究重点是找到方法在医学和人工智能的紧急治疗拯救个人病人死后的风险预测。

数据可用性

可用的数据用来支持这些发现从相应的作者。

的利益冲突

作者宣称没有利益冲突。

确认

这项研究受到了上海高层工业技术创新基地建设项目(1021 gn204005-a06)。