文摘

的研究集中在应用价值分类算法在处理急性呼吸窘迫综合征(ARDS)的CT图像,旨在分析ARDS的致病因素。共有60 ARDS患者在选择医院,他们被分成ARDS组(38例)和non-ARDS组(22例)按诊断标准。没有显著差异在两组之间的通用数据( )。FWAC算法被引入CT成像对图像数据进行分类更准确。两组比较的左心室射血分数(LVEF)、氧合指数PaO2/ FiO2(P / F)、急性生理和慢性健康评估(APACHE II)分数,pH值,PaO2。结果表明,PaO2、P / F和APACHEⅱ评分两组没有统计学意义( )。ARDS的P / F组为136.12,与non-ARDS组143.04;APACHE II ARDS组的得分为40.1,与non-ARDS组为62.3,显示无显著差异( );ARDS的LVEF组为58.14,与non-ARDS组为46.26,显示显著差异( )。当最低支持0.3和0.5最低信心,复发的价值是0.7082和0.968诊断的价值。生成的规则FWAC算法可以准确地预测类别,与预期结果一致。这个算法的准确性高达98.7%,明显高于传统的CT成像(88.4%)。生成的规则FWAC更准确,协助医生ARDS的预防和诊断疾病。早产、窒息是ARDS的高危因素。总之,FWAC算法具有良好的分类能力ARDS的CT图像和显示精度高。

1。介绍

急性呼吸窘迫综合征(ARDS)是一种常见的急性呼吸衰竭引起的肺泡和毛细血管膜损伤,毛细血管通透性增加,和ARDS死亡率高达40% - -70% (1]。ARDS的常见的主要疾病包括败血症、肺炎和严重的创伤。对于这种疾病的病理基础,多种炎症细胞调节炎症反应在肺部和将导致II型肺泡上皮细胞损伤,炎症失控时肺微血管通透性增加,导致肺间质水肿(2]。ARDS是肺血管组织障碍。对于从ARDS患者,肺水含量的增加和遵从性减少,最终导致呼吸窘迫和血氧不足。ARDS的年死亡率逐渐增加,和严重的创伤和肺炎会引起呼吸窘迫。因此,研究ARDS及其相关危险因素流行病学是重要的3]。ARDS发病机理十分复杂,急性发作,和快速进展和治疗是困难的。此外,它还具有预后不良,死亡率高。药物对ARDS的效果并不理想,通常治疗ARDS的关键是早期诊断和治疗(4]。

计算机断层扫描(CT)是一个重要的依据的诊断肺部成像(5]。肺血管CT成像能重建三维图像。作为ARDS的诊断方法,CT可以清楚地显示肺血管。多层螺旋CT优化图像采集和分析技术6,7]。CT成像技术已广泛应用于医疗、工业等领域。在实际CT扫描过程中,由于探测器的有限大小或对象的大尺寸,探测器被截断投影数据和重建CT图像只能反映对象信息的一部分。高分辨率CT图像可以显示肺的变化(8]。研究结果表明,高分辨率CT可以检测一些感染性肺段和subpulmonary栓塞的变化特点,如“楔形阴影”和“连接血管影子”(9]。CT血管灌注成像可定量分析的局部组织血液灌注,可以及时反映生理功能的变化。随着微电子和计算机技术的不断发展,CT也不断更新和改进。将分类算法纳入CT成像提供了一种新的方法来准确地诊断和分类的疾病。

高科技医疗设备的使用增加了医疗数据的数量,和从复杂的医疗数据中提取有价值的数据可以提供一个有效的参考分析疾病的危险因素(10]。目前,包括传统的随机森林分类算法,神经网络,支持向量。分类精度,但这不是容易找到影响疾病的特点。关联分类算法能够挖掘出有效的特性相关的疾病,和大多数的协会分类计数算法适用于关联规则分类加强分类和加权关联分类算法生成更精确的规则的特征谐波的意思。关联分类算法可以在每个节点注册相应的类别信息和直接我类关联规则与最小支持度和最小的信心。当扫描数据库,不需要重复既定的条件下,有效地减少了内存消耗,提高了运行效率。经典关联分类算法的本质是采用信心度,支持度和规则项目,以便它可以综合考虑信心程度和支持程度(11]。在这项研究中,一个关联分类算法使用和修剪的统计测量技术来获得更准确的关联规则,提高协会分类的准确性。它被训练使用ARDS疾病机器学习数据库中的数据集,以获得更准确的治疗和诊断结果,预期为ARDS的治疗提供参考。

2。材料和方法

2.1。医疗数据的特点

医疗数据生成当病人在医院诊断和治疗。病人的信息,如图像数据、医疗订单,和处方信息,是特殊的和多样化,有大量的通过CT和彩色多普勒超声成像数据。

数据挖掘技术,从数据中提取知识或模式,一些隐藏的潜在信息已被敌军布上了地雷。使用相关算法从大量的医学数据获取疾病信息可以帮助医生诊断和治疗。医学数据挖掘的步骤如图所示1

2.2。关联分类算法的步骤

与神经网络算法相比,该协会分类算法具有良好的分类精度,可以产生更多的可以理解的规则,也可以发现罕见的规则。关联分类算法主要包括三个阶段:生成分类规则,规则的建设,预测。具体流程图如图2。在第一步中,可以生成频繁项集根据FP-Growth等相关算法和辉煌的成就,然后基于最小信任阈值和最小支持,修剪规则,包括χ2测试、数据库覆盖和分类预测。

2.3。关联分类算法

协会分类主要使用协会根据频繁规则挖掘算法对数据集进行分类,根据分类关联规则构造分类器,最后预测新数据集分类。关联规则技术主要是用来发现和分类数据库中的各种属性之间的关联,然后预测分类标签。

假设有一个数据集和培训对象中的属性1 (B2(1),属性B3(2),属性B3)…;在这个问题上,关联规则适用于分类过程。如果英国电信1D1属于一个规则,然后D1是一个类的属性。(英国电信1,英国电信2,英国电信3、……英国电信n)表明,训练集N不同的属性,D表示的类别列表。属性包括分类属性和连续属性。需要连续属性离散使用一定的离散化方法,并分类属性分配一组正整数对应分类属性值一比一。培训对象可以被描述为一个属性的组合吗D英国电信1

如果D代表一个类标签,itemset规则f(项目集,D和培训对象b((B1, )(B2, ),D)项目集的规则。然后,对于b((B1, )(B2, )),actoccr = 3。的行数匹配的规则f是项目的支持技术规则吗f,fD,然后,支持计数方程如下:

如果项目集的规则f≥最小支持度阈值,那么就

||代表实例的数量,然后,支持计算如下:

如果数据集训练对象的数量等于5,itemset的suppcount规则((B1, )(B2, ),D)= 2。根据方程的支持,我们将得到以下方程:

项目集的规则f≥最小信任阈值,也就是说, 的置信水平表示如下:

项目集((B1, )(B2, ),D),有

然后,有

分类关联规则意味着频繁的规则集的信心是大于或等于指定的最低阈值的信心。频繁项目集的规则可以被视为itemset的规则f满足最小支持度阈值。

关联分类算法有很高的准确性。在数据挖掘领域,研究人员可以使用分类算法来找到罕见疾病的病例。传统的分类算法直接过滤掉罕见的情况下,因此,这些规则不能开采。关联分类算法可以克服这些缺点并生成规则更容易理解。

2.4。加权关联分类算法

该协会生成关联规则的分类算法。在此基础上,一个特征加权关联分类(FWAC)算法基于统计调和平均数。该算法使用加权模型代替传统的关联规则挖掘结构的信心。图3显示FWAC的三个阶段,这是规则,规则建设和数据预测。生成的规则适用于训练集和最小支持;规则剪枝最低的建设信心;最后,一组测试的预测。

至于规则生成的过程中,首先,训练集(最低的支持,N生成),Y' =Ψ和K= 1,(−1 =Ψ);Yk是生成的候选人k项目设置f:

如果加权支持(f)≥最小的支持,Y′=Y′+f。如果没有,返回Y′。

2.5。一般信息

呼吸困难入院的病人抱怨从2018年1月至2019年6月被选为研究对象。所有患者肺部CT检查和胸部x线检查在入院24小时内。入选标准如下:(I)患者无急性病毒或细菌感染;(2)ARDS患者有风险因素:肺炎、异物吸入,广泛的创伤,肺外脓毒症;(3)没有免疫系统疾病和传染病患者;和(IV)新患者呼吸道症状或7天内现有的呼吸道症状加重,气短、棘手的和进步的血氧不足,呻吟,鼻风潮。排除标准如下:(I)患者临床数据不完整;(2)没有自愿参与这项研究的人;(3)患者心脏、肝脏和肾脏功能障碍;(IV)人不合作的CT检查。 The difference was not statistically significant in the general data of patients ( ),和一般信息具有可比性。这项研究已经得到医院伦理委员会的批准。

ARDS诊断的金标准:(I)在围产期相关肺部疾病的儿童被排除在外;(2)患者血氧不足的症状和肺部x射线的变化在7天内;(3)呼吸衰竭患者不因心脏衰竭或过度液体超负荷;固体(IV)患者肺部病变与肺的渗出性变化一致成像;(V)在侵入性机械通气5≤OSI < 7.5或4≤OI≤8被诊断为轻度ARDS, OSI < 8≤16或7.5≤OI≤12.3被诊断为中度ARDS和OI≥16或OSI≥12.3被诊断为严重ARDS;和无创机械通气期间(VI), CPAP≥5厘米H2O或正面的面罩正压通风,P / F≤300。

2.6。CT扫描

在这项研究中,患者检查与西门子Somatom DSCT(德国)定义。在扫描之前,检查过程是病人的详细解释。病人在仰卧位,西门子的第二代用于扫描。管电流参数是根据体重调整,机器自动给了球场,并周期性的接触是全自动的。120或140千伏体重> 90公斤,100或120千伏为60公斤<体重≤90公斤,80或100千伏体重≤60公斤。马在165或140 mA,旋转速度为0.28 s /圆和准直是64×0.6毫米;每个圆是38.4毫米的长度和时间分辨率是75 ms。使用ECG-gated螺旋扫描技术,层厚度是0.6毫米,层的距离是0.75毫米,流速为0.12毫升/秒/公斤使用MEDRED双筒高压注射器。它是通过下肢的静脉注射,注射时间是20秒。生理盐水注射在相同的流量,维修时间是10秒。 The scanning range was accurately located. The CT images of the best time sequence were selected and sent to the workstation Syngo via VB10 B for image processing. All the images were evaluated by three chief physicians with more than 5 years of experience in the CT room using the double-blind method. When the opinions were inconsistent, the reconstructed images were evaluated again until the opinions were consistent.

2.7。观察指标

正常范围内的左心室射血分数(LVEF)是50% - -70%,和轻微的减少意味着LVEF是40% - -50%;适度的减少意味着LVEF是30%到40%之间;而适度的减少意味着LVEF < 30%。

PaO2/ FiO2(P / F)是氧合指数,即动脉血液氧气分压比吸入的氧气浓度。通常情况下,它是在400年和500毫米汞柱。氧合指数应用于临床,反映身体的氧化状态。氧合指数< 300毫米汞柱表明肺呼吸功能的障碍。

急性生理和慢性健康评估(APACHE II)是一个全面的方法来评估病人的病情的严重程度和预测预后。急性生理学的分数,它主要包括三个部分年龄评分和慢性健康得分。主要用于分类和预测病人的病情的预后作出定量评估病人的病情。

2.8。统计分析

所有数据都使用快乐21.0处理。测量数据被表示为 ±年代,T以及使用。计数数据被表示为(n,%) 显示有统计学差异。因子分析采用多元逐步回归分析。

3所示。结果

3.1。比较的一般信息

4显示病人的一般资料。ARDS组(38)23岁男性和10个女性。non-ARDS组(22例),有10个男性和12女性。ARDS组中,有7例严重的肺炎,9例吸入性肺炎、败血症的6例,4例慢性肺部疾病。non-ARDS组中,有5例重症肺炎、吸入性肺炎6例,4例脓毒症,慢性肺部疾病3例。两组之间没有统计学差异的患者( )。

3.2。分类算法的精度比较

5显示了肺癌的CT图像。多重填补缺陷可以看到在主肺动脉和劣质肺动脉分支。图5(一个)显示多个缺陷填正确的肺动脉,和吹3/6级收缩期杂音可以听到在肺动脉区,并没有进行心脏的顶点。图5 (b)在左肺动脉显示多个填充缺陷。分,投射向肺动脉近端像一颗子弹;几乎可以看到它占领了整个腔和随需应变的肺动脉,扩展到子和壁不光滑。图5 (c)显示了磨砂玻璃的密度下的斜裂缝中间叶肺、胸膜下渗出性病变的肺下叶。在图5 (d)指出,这是一个或双方的肺被发现和模糊,肺纹理增厚,整合阴影的边缘被胸膜模糊的影子。图中蓝色框标记病变的位置。

然后,常规CT和关联分类算法CT进行对比的准确性和结果如图所示6。常规CT的准确性为88.4%,和关联分类算法的准确性CT为98.7%。关联分类算法的准确性CT显著高于常规CT ( )。

3.3。FWAC算法的运行结果

ARDS患者的数据集被用来验证FWAC算法的性能,选择三种不同的最小支持度和最小的信心度都是0.5。如图7,当最小支持0.2和最低的信心为0.5,复发的价值是0.7361和诊断的价值为0.964;当最低支持0.1和0.5最低信心,复发的价值是0.6972和诊断的价值是0.971;当最低支持0.3和0.5最低信心,复发的价值是0.7082和0.968诊断的价值。生成的规则FWAC算法可以准确地预测类别,与预期结果一致。

3.4。测量数据的比较

8(一个)表明,P / F两组没有显著差异( )但LVEF两组之间的差异具有统计学意义( )。8 (b)显示了pH值和PaO2两组,两组之间没有显著差异在pH值和PaO2( )。

3.5。两组之间的比较APACHEⅱ评分

9显示了APACHEⅱ评分两组。指出,APACHEⅱ评分在ARDS组低于non-ARDS组,差异具有统计学意义( )。

3.6。ARDS-Related因素分析

逻辑回归的方法被用来分析早产的高危因素,剖腹产,羊水吸入性窒息。结果表明,这些因素是ARDS的风险因素,如图10

4所示。讨论

研究表明,外部感染和冲击的最常见原因是ARDS [12,13]。ARDS的发病机制并不十分清楚,但临床研究表明,它是由肺和毛细血管损伤引起的。肺损伤,如直接吸入毒素,可引起全身炎症,增加ARDS的风险(14,15]。ARDS的最直接原因是炎症细胞的迁移和积累。创伤和感染来自于内毒素脂多糖的积累在肺部的毛细血管,导致急性呼吸道疾病(16,17]。Luyt et al。18]本文指出ARDS患者的主要并发症之一是肺部感染。除了传统的因素,肺免疫防御和失衡的微生物群也ARDS患者的致病因素。Matthay et al。19相信ARDS是异构的临床危险因素,肺损伤生理学、微生物学、生物学和识别ARDS的表型可以增强治疗效果。在这项研究中,人们发现早产,剖腹产,羊水愿望,窒息是ARDS的高危因素。

许多算法纳入CT成像,如深度学习、神经网络和迭代重建算法。他们不仅提高扫描速度也缩短一个旋转0.5秒的时间。同时,多层图像可以获得。因为它是一个快速容积扫描,不间断的数据收集可以进行大面积的身体在短时间内,获得的信息也可以增加(20.]。处理过的图像具有较高的质量。虚拟内窥镜可以提高小病灶的检出率和粘膜病变。算法引入CT成像技术能有效地改善图像质量。图像的质量,最大化算法和各种降噪技术用于平滑图像。Hadia et al。21)利用关联分类算法分类图片,被用作评估标准和信心和支持。发现该算法有很好的分类精度。在这项研究中,FWAC算法被用来处理CT图像,为了帮助医生预测ARDS。结果表明,精度为98.7%,明显高于常规CT成像( )。

5。结论

探索ARDS的致病因素,在这项研究中,FWAC算法被用来处理CT图像。结果表明,算法的准确性高达98.7%。CT可以在一定程度上反映了ARDS的严重性。CT成像基于关联分类算法是一种可靠的诊断方法,以确保图像质量和准确诊断。生成的规则FWAC更准确,协助医生ARDS的预防和诊断疾病。得出结论,早产和窒息是ARDS的高危因素。然而,在研究中应该注意的一些限制。样本量小,这将减少该研究的力量。在后续研究中,扩大样本容量是必要的加强这个研究的发现。

数据可用性

使用的数据来支持本研究的发现可以从相应的作者。

的利益冲突

作者宣称没有利益冲突。