文摘

客观的。Henoch-Schonlein紫癜(HSP)患儿可能患有肾功能不全,严重影响了孩子们的生活和健康。本研究旨在构建预测模型的Henoch-Schonlein紫癜性肾炎(HSPN)。方法。总共有240儿童HSP在皮肤科、儿科医院接受治疗。一般信息,患者的临床症状和实验室检查指标收集了特征选择,和XGBoost算法建立了预测模型。结果。根据输入的特性指标,十大关键功能指标XGBoost模型输出的是尿n -乙酰-β-D-aminoglucosidase,尿retinol-binding蛋白质,IgA、年龄、紫癜复发,紫癜,腹痛、24小时尿蛋白定量、中性粒细胞百分比和血清白蛋白。训练集的曲线下面积(0.895,95%置信区间CI: 0.827 - -0.963)和测试集(0.870,95%置信区间CI: 0.799 - -0.941)模型是相同的。结论。基于XGBoost预测模型用于预测基于临床数据的儿童HSP肾损害,可减少侵入性检查对病人造成的伤害。

1。介绍

Henoch-Schonlein过敏性紫癜(HSP)是最常见的一种系统性vasculitides童年,一种常见的血管过敏性疾病。它主要影响皮肤、肾脏、肠、关节和其他身体部位(1]。近年来,儿童HSP的数量显著增加,一些研究表明,HSP是160 - 191的年发病率情况下每百万儿童(2]。HSP指向身体接收各种敏化材料的刺激,使体内毛细血管脆性和渗透性增强,并导致炎症或出血等处皮肤,关节,和肠1,3]。临床特征Henoch-Schonlein紫癜性肾炎(HSPN)的纤维化患者肾纤维化(4]。HSPN是儿童最常见的继发性肾小球疾病(5,6]。

流行病学显示,HSP患者出现HSPN率高达30%到50% (7]。尽管大多数HSPN病人预后良好,1% - -3%的孩子们仍然患有肾功能不全终末期肾功能衰竭,严重影响孩子们的生活和健康(8]。因此,早期、准确的诊断HSPN对预后和个性化的治疗是至关重要的。肾活检是诊断HSPN的黄金标准。不过,这个方法是侵入性和父母和孩子很难接受,导致一些严重的肾病患者在诊断时(9]。

机器学习可以使用临床数据建立预测模型并验证其预测效率(10- - - - - -12]。近年来,在医学领域中的应用逐渐增加(13- - - - - -16]。据我们所知,很少有研究机器学习预测HSPN。因此,本文构建了一个基于机器学习的预测模型预测的发生肾损害在HSP通过临床数据,提供一种新的有效的诊断方法HSPN首次诊断为儿童HSP在皮肤病。

2。方法

2.1。一般信息

总共有240儿童HSP在皮肤病治疗和儿科医院从2019年10月到2021年12月入选,其中153与HSPN复杂。根据欧盟对风湿病(17),HSP是诊断为明显的皮疹(基本)与至少一个四个临床症状:腹痛、关节炎或关节痛,肾的参与和组织病理学结果显示IgA沉积。肾功能损害主要临床:异常血尿,蛋白尿、肾功能,如增加血清肌酐(SCr)和减少估计的肾小球滤过率(eGFR), 6个月之内HSP的进程。表皮生长因子受体的计算公式如下:≤16岁用施瓦兹公式(18];CKD-EPI公式时使用> 16岁(19]。当eGFR < 90毫升/(1.73分钟·m2),它被认为是肾功能不全。

2.2。预测指数

研究中的指标测试主要包括一般信息,临床症状和实验室指标。一般信息包括性别、年龄、发病的季节。临床症状和体征包括关节肿胀、腹痛和胃肠道出血,上身皮肤紫癜,紫癜复发。实验室指标包括血常规检测,尿常规检测,和生化测试。

2.3。机器学习

在这项研究中使用的机器学习是机器学习的综合XGBoost算法基于分类和回归树(20.]。XGBoost算法具有高可伸缩性和高计算速度。在相同的环境和条件下,XGBoost算法比类似的算法快10倍以上21]。具体检测过程如图1

XGBoost一个学习算法是基于梯度增加。它的原理是通过迭代计算,实现准确的分类效果的弱分类器(22]。这是一个加法表达式组成的K基本模型: 在哪里 k基础模型和 的预测价值吗 样本。

模型的偏差和方差共同确定模型的预测精度,和模型的变化体现作为损失函数。因此,模型的目标函数是由损失函数和正则项Ω抑制模型的复杂性。因此,目标函数可以表示为

根据泰勒公式的计算方法,上述目标函数可以写成

CRT的定义是 ,x是一个特定的文本,(x)代表叶子节点示例所在地,和 代表叶节点的值w。因此, 代表的价值w每个样本(即。,the predicted value). The regular term of the objective function can be defined as

梯度增强生成一系列的crt的培训过程。CRT的叶节点的相应值是一个实际的分数,和每个CRT的累积分数是最终的预测价值。我们测试使用5倍交叉方法算法的准确性。数据集分为五个部分,其中4个为训练集和其他为测试集,获得了每个实验的准确性和的平均精度5结果作为算法的估计精度。具体的建模过程如图2

2.4。统计分析

计数资料统计的χ2测试。测量数据所表达的 偏差和t测试采用。 意味着不同的是统计学意义。

3所示。结果

3.1。一般信息

与HSP 240名儿童中,有126男性和114女性。发病年龄- 18岁,平均年龄 岁了。其中,62例(25.8%)发生在冬天,102例(42.5%)有关节肿胀和疼痛,128例(53.3%)有腹痛和消化道出血,和38例(15.8%)有上身皮肤紫癜。有153例HSPN儿童和87例无肾损害。没有显著区别培训组和测试组在性别、发病季节,关节肿胀和疼痛,腹痛,紫癜的上半身,HSPN(图3, )。

3.2。选择预测功能

根据统计分析结果,性别是一个无关紧要的因素在预测HSPN的发生一般信息。临床症状的指标都是统计学意义( )(表1)。

HSPN发生的相关性预测根据实验室指标如生化测试,其中没有显著差异在HSPN血小板计数、c反应蛋白、总胆固醇、IgM和肺动脉栓塞( )(表2)。然而,其他指标包括白细胞计数、中性粒细胞的百分比,百分比的嗜酸性粒细胞、血清白蛋白、血清肌酐,免疫球蛋白,IgA, IgE,住院时间,rinary retinol-binding蛋白质(RBP),尿n -乙酰-β-D-aminoglucosidase(唠叨)、24小时尿蛋白定量明显与HSPN ( )。

3.3。XGBoost算法模型的预测结果

XGBoost模型自动计算功能。根据输入特性指标,十大重要特性指标输出XGBoost模型如下(图4):唠叨、RBP IgA、年龄、紫癜复发,紫癜,腹痛、24小时尿蛋白定量、中性粒细胞百分比和血清白蛋白。

3.4。绩效评估模型的预测

在训练集,XGBoost模型的曲线下的面积是0.895(95%置信区间:0.827—-0.963)。在测试设置中,模型的曲线下的面积是0.870(95%置信区间:0.799—-0.941)。XGBoost预测模型具有较好的敏感性和特异性。接受者操作特性曲线如图XGBoost算法模型5

4所示。讨论

HSP是一种系统性血管炎,主要涉及皮肤、关节、胃肠道、毛细血管、小血管的肾脏,伴随着显著的IgA的沉积23]。临床上,更常见的儿童。据报道,超过90%的HSPN发生在儿童和青少年,儿童占第一位与继发性肾病。肾活检是侵入性的,父母和孩子很难接受9]。因此,我们从临床数据预测HSPN的发生率,临床症状和实验室测试指标基于XGBoost预测模型。

XGBoost模型可以自动获取每个属性的重要性得分,从而有效地过滤功能。我们的研究筛选的孩子一般信息,临床症状和实验室测试指标。前三指标基于XGBoost模型是唠叨,RBP, IGA。我们的研究结果是一致的Karadag et al。24),他们认为血管内皮损伤HSP的发病机制是一个至关重要的环节。可能的原因如下:(1)管壁的渗透率增加由于过敏反应,和外渗浓度增加,减缓了血液流动。高粘度状态、免疫复合物沉积,更有可能进一步损害血管内皮细胞和血小板计数的可能性增加附着力和self-aggregation。(2)损害血管内皮炎症反应。受损的血管内皮提高凝固促进效应,刺激血小板激活因子的释放,并进一步促进血小板的激活和附着力。

血清IgA是人体的主要组成部分粘膜防御系统。广泛分布在乳、唾液和胃肠道粘膜分泌物,呼吸道、尿道。因此,它起着至关重要的作用在抗感染的第一道防线,特别是呼吸道和肠道。这也是一个重要指标,本文的预测模型。唠叨是一个发生在泌尿系统的溶酶体酶,通常发现在很低水平的尿液。当管状细胞受损,许多唠叨释放从管状上皮细胞进入尿液,唠叨水平升高。RBP是第三个重要特性的预测模型在我们的研究中。刘等人认为延迟肾的RBP有一个重要的预测价值参与儿童HSP (25]。

在这项研究中,基于XGBoost算法构造的预测模型能有效降低过度拟合问题,并自动指定默认分支方向缺失值,从而提高算法的效率26,27]。因此,这个模型的广泛应用提供了更多的可能性。此外,训练集的曲线下面积(0.895,95%置信区间CI: 0.827 - -0.963)和测试集(0.870,95%置信区间CI: 0.799 - -0.941)模型是相似的,有很好的敏感性和特异性。因此,预测模型基于XGBoost可以提供一种新的诊断方法HSPN首次诊断为儿童HSP在皮肤病。

对我们的研究有几个局限性。这是一个单中心回顾性研究样本量小,没有外部验证。其次,由于数据来源的限制,尽管这个研究包括了许多预测变量筛选,它仍不全面。可能有潜在的预测变量,并不包括在内。此外,这将进一步限制XGBoost算法的优势。接下来的研究将增加样本容量,扩大预测指数。

5。结论

XGBoost预测模型的基础上,我们可以初步预测HSP临床试验数据显示肾损害皮肤门诊工作。这可以减少侵入性检查造成的伤害孩子。它提供了一个新的想法Henoch-Schonlein紫癜患儿的预后的皮肤病的诊断。在未来的工作中,我们将改善缺点,从临床需求,更好地服务于临床应用。

数据可用性

使用的数据来支持本研究的发现可以从相应的作者。

的利益冲突

作者宣称没有利益冲突。