文摘
目的。预测视力(VA) 1月后anti-vascular内皮生长因子(VEGF)治疗糖尿病黄斑水肿患者通过使用机器学习(测距装置)。方法。这项回顾性研究包括281名眼睛测距装置接受intravitreal vegf治疗从1月1日,2019年,2021年4月1日。十八特性从10月电子医疗记录和测量数据提取图像。获得的数据从2019年1月1日,11月1日,2020年,被用作训练集;获得的数据从2020年11月1日,4月1日,2021年,作为验证集。六个不同的机器学习算法被用来预测VA患者vegf治疗后。最初的详细调查后,我们设计了一个方便的应用程序的优化模型。机器学习与预测的VA地面真理。结果。整体算法(线性回归+随机森林回归量)和VA方差中表现最好的预测。验证设置,VA预测的平均绝对误差(梅斯)是0.137 - -0.153 logMAR(在7 - 8字母)和均方误差(为了)0.033 - -0.045 logMAR月VA(在2 - 3个字母)预测,分别。弗吉尼亚州的预测方差为1月,梅斯是0.164 - -0.169 logMAR(9封),和为了0.056 - -0.059 logMAR(在三个字母),分别。结论。我们的机器学习模型可以准确预测和VA方差测距装置患者接受抗血管治疗1个月后,这将是更有价值的指导精确的个性化的干预和管理预期在临床实践中。
1。介绍
国际糖尿病联合会(IDF)估计,全球有5.366亿人患有糖尿病(DM),超过1.4亿中国人居住在2021年与DM (1,2]。糖尿病性视网膜病变(DR)是糖尿病的主要并发症和工作年龄的成年人致盲的重要原因之一1]。糖尿病黄斑水肿(测距装置)的最常见原因DR-related视力丧失,它的特点是流体的积累在中央视网膜黄斑增厚引起blood-retinal屏障功能障碍(3- - - - - -6]。测距装置影响大约10%的患者(博士6,7),导致视力丧失和降低生活质量,造成了很大的经济和社会负担,如果不及时治疗(3,7]。
激光光凝术用于推荐作为测距装置的标准治疗协议,提供视觉稳定但有限的功效在改善视觉(8]。目前,anti-vascular内皮生长因子(vegf)治疗已成为一线治疗因为抗vegf药物可以减少水肿,从而防止进一步的结构损伤和改善视力8,9]。两大抗vegf药物常用的并由国家基本医疗保险在中国之初,conbercept (Lumitin、成都Kanghong生物科技有限公司、成都,四川,中国)(10]。许多临床研究表明,vegf治疗解剖和功能有效,30%的测距装置实现显著改善患者最佳矫正视力(BCVA) [11]。然而,并不是所有的病人满意回应抗vegf注射;大约31.6 - -65.6%的病人没有反应或者反应不完全抗vegf代理(12]。切换到其他可能在早期有效的治疗建议,比如intravitreal皮质类固醇治疗患者不良反应(13]。因此,预测治疗反应,区分不响应vegf的病人,和确定最佳的治疗方案是至关重要的。
此外,测距装置作为一种慢性疾病需要反复注射vegf药物(14,15]。几个抗vegf治疗方案已经被开发出来,如每月或两月一次的注射,临机应变(打印),和治疗和扩展(TAE)方案16]。对是最常见的测距装置优化治疗方案治疗效果和成本效益17]。许多随机临床试验建议三个加载剂量的抗vegf注射之后打印方案,即3 +打印(17]。但是在现实世界中,三个加载注入将是一个巨大的经济和心理负担测距装置的患者,特别是在发展中国家(18]。所以,眼科医生经常练习1 +打印方案,在患者接受抗vegf在第一个月注射,和患者观察到每月收到重复注射基于BCVA和光学相干断层扫描(OCT)成像(18- - - - - -21]。因此,10月预测BCVA和形态学特征vegf注射后拥有一个巨大的价值测距装置的高效管理。
10月是诊断的基础,评估和管理测距装置(3]。据报道一些10月形态学特征预测抗vegf治疗后治疗效果测距装置,包括10月测距装置的模式不同,hyperreflective疫源地的状态(高频),视网膜内层,内段/外段(是/ OS),外部限制膜(ELM)和中央黄斑厚度(CMT) [22- - - - - -24]。然而,这些参数估计好或治疗反应不佳的可能性;准确预测BCVA vegf治疗后仍难以在临床实践中。
机器学习(ML),它可以迅速地管理大量的信息,如图像和临床变量,越来越多地用于医师的临床预测是困难的在眼科领域(25- - - - - -29日]。ML-based算法可以预测治疗反应和治疗疾病,如博士、需求测距装置,年龄相关性黄斑变性(AMD),早产(ROP)视网膜病变,视网膜静脉阻塞(RVO) [30.]。刘等人已经准确地预测后处理BCVA在1个月后三个加载剂量的注射vegf在测距装置的病人使用毫升(16,31日]。然而,这仍有待阐明如何预测后处理BCVA 1 +打印治疗方案。
因此,本研究的目的是预测VA抗vegf注射后1个月使用毫升10月根据临床变量和测距装置中的1 +对患者的治疗方案。此外,我们优化预测模型通过使用更少的特点,开发一种适合临床应用的优化模型。
2。方法
这个回顾性观察研究是研究伦理委员会批准,山东大学齐鲁医院。执行协议遵循赫尔辛基宣言。知情同意是放弃由于没有直接匿名数据提取病人和公众参与这项研究。
总共有281只眼睛进入了眼科、齐鲁医院、山东大学从2019年1月1日至2021年4月1日。入选标准如下:(1)通过10月测距装置诊断;(2)患者年龄than18岁;(3)患者接受抗血管治疗1 +打印方案(初0.5毫克/注射或conbercept 0.5毫克/注射)在研究期间;(4)VA和10月数据预处理和术后(1个月)。然而,很难与一个固定的日期执行后续访问,因为病人与测距装置大多是劳动年龄人口不同的工作表,所以我们确定一个时间范围(1月±3天),以确保研究的准确性。双眼,每个独立注入相同的病人进行了评估。眼睛与任何intravitreal药物治疗之前,重要的白内障,玻璃体手术,和其他条件,可能会影响视力,如角膜透明度,青光眼,黄斑变性,视网膜静脉阻塞,视网膜疾病和其他被排除在研究之外。
在数据处理、临床数据,如性别、年龄、基线VA,月VA和vegf注射后,以及术前10月手动提取图像特征。定量评估的OCT图像进行评估图像在3000年10月水平μ米直径在视网膜中央凹中心,包括中央黄斑厚度(CMT),囊肿,和窝囊肿的最短的距离,最大的垂直长度囊肿。CMT是定义为内部之间的距离限制膜和视网膜中心凹视网膜色素上皮(RPE)。的数量intraretinal囊状的空间宽度大于50μ米数。使用卡尺测量工具的所有特性构建到10月软件(蔡司)由两个经验丰富的技师(Y张和M Wei)那些蒙面任何病人的临床资料;没有发现显著差异之间的不同的数据集,计算皮尔逊相关性。也评估以下形态学特征,包括弥漫性视网膜增厚(DRT),囊状的黄斑水肿(CME),浆液性视网膜脱离(阶跃恢复二极管),后玻璃状的牵引(PHT)牵引视网膜脱离(TRD),视网膜内层结构瓦解(铣床),外部中断限制膜(ELM),内段/外段中断(是/ OS),外层膜(ERM)的存在,渗出物或出血,hyperreflective焦点(高频)。
这批数据包括281个样本,这是由18特性和2标签。这些特性几乎是非线性数据。弗吉尼亚州的预测,所有基线数据进行分析和处理,并训练集和验证集的比例分为80%和20%,分别根据入学时间。
预测logMAR VA患者抗血管治疗,我们测试了6个回归算法与最先进的性能在每个自适应域。他们列出如下:线性回归(LR)、支持向量机、K邻居回归量,随机森林回归量(RF),岭回归量和LR +射频(26- - - - - -28,32- - - - - -34]。我们建立和优化的LR +射频数据。工作流图如图1。
定量评估模型的性能,我们应用两个评价指标,平均绝对误差(MAE)和均方误差(MSE)。美计算的平均绝对误差值的预测结果,直接反映了预测值与实际值的偏差和显示的能力模型。计算均方误差的平均值的平方误差的预测结果,显示模型的鲁棒性。
初1年期VA预测,建立相关矩阵对所有基线数据,以确保没有多余的功能(图2)。我们发现芝加哥商品交易所明显与囊肿的数量和最大的垂直长度囊肿在数据处理。然后,建立了随机森林算法输出特性的重要性,这表明,芝加哥商品交易所和其他4特性的重要性的比例小于0.01(图3)。初始数据探索后,5特性被删除,保留了模型训练和13特性。
(一)
(b)
(c)
(d)
在培训过程中,网格搜索模块应用于优化模型参数。实验结果表明,LR和射频模型训练表现最好的选择特性。来评估这两个模型的性能,VA值预测的LR和射频与预测的值相比其他算法,包括支持向量机、K邻居回归量,和岭回归量。另外,这两个模型是进一步结合成一个整体算法采用叠加模型集成框架获得更好的预测性能和鲁棒性。在第一层的叠加,随机森林回归模型是由选定的训练数据。然后,第一层输出和训练集然后投入训练的线性回归模型;因此,结合LR +射频模型基于堆叠框架。
在完成最初的详细调查,我们设计了另一个模型,该模型将更方便申请VA方差预测。弗吉尼亚州的方差被定义为个月视力之间的差值和基线视力。数据处理的步骤,算法和模型评估过程是相同的在前面的模型。
3所示。结果
描述性数据表提供了研究的人口1。VA值(logMAR)预测的机器学习模型相比,(即地面真理。随访期间,结果记录)(表2)。比较分析,整体算法(线性回归+随机森林回归量)表现出最高的精度和VA方差预测,优于线性回归、支持向量机、K邻居回归量,随机森林回归量和岭回归量模型。因此,所有后续基于整体算法进行了分析。
最近弗吉尼亚州的预测值进行了比较测量。在第一个模型中,当所有收集的数据从电子医疗记录和10月被认为是,弗吉尼亚州的梅斯预测对地面真理0.153 logmar (within8字母),弗吉尼亚州的为了预测对地面真理0.045 logmar(在三个字母),分别。取得的优化模型预测能力水平相当的用更少的特性,弗吉尼亚州的梅斯预测对地面真理0.137 logMAR(7信内),弗吉尼亚州的为了预测对地面真理0.033 logMAR(在2字母),分别。与支持向量机预测的细节,K邻居回归量,随机森林回归量和岭回归量模型如表所示2。此外,预测远景的反应更详细的抗后,我们建立了另一个模型来预测VA治疗后的变化;VA方差预测精度在1月表所示3和图4。
(一)
(b)
图5显示预测和地面实况VA值之间的差异,是VA值测量1月后vegf。VA测量基线月VA是最重要的预测因素预测原始和优化模型。然而,在弗吉尼亚州的方差的预测,CMT和年龄是最重要的预测因素。的细节特性如图重要性3。
(一)
(b)
4所示。讨论
本研究开发了一个合奏毫升系统预测VA抗vegf注射后1个月观察患者测距装置1 +打印方案和弗吉尼亚州的方差预测的整体模型。我们证明了我们可以准确地预测在一个很小的误差2 - 8字母EDTRS视觉图)基于(1 - 2行on18特性从电子医疗记录和10月图片使用ML算法。基于这两个模型,我们可以准确地预测患者视觉测距装置的好处1 +打印方案,评估抗血管治疗的疗效,并确定是否改变治疗策略。
测距装置越来越多的患者和注射vegf在世界范围内,它是至关重要的具有成本效益的治疗方案,以防止视力丧失和减少时间和经济负担16,17]。1 +的内线方案,使用月度评估临床或成像和需治疗减少注射的数量,显示出一系列视觉改进1年连同显著减少注射(18- - - - - -20.]。现实世界的数据显示测距装置患者治疗依从性较差,和病人接受治疗的患者相比,抗vegf注入强度低的随机临床试验(14,15]。这部分是由于病人的治疗结果是不确定的,担心抗血管治疗的高成本14,15]。所以,后处理VA抗血管治疗的准确预测是至关重要的为多个抗vegf注射获得更好的依从性,特别是在1 +打印方案。它不仅可以帮助眼科医生做出更好的治疗方案也帮助病人减轻心理压力和管理的期望。
先前的研究已经调查了治疗结果的预测因素与测距装置抗vegf治疗眼睛后,包括10月数据和临床数据18,31日,35- - - - - -38]。OCT图像测距装置的治疗策略管理至关重要,它提供了一种客观检测治疗反应(22- - - - - -24,35]。10月数据从10月获得图像,如不同的测距装置的形态学特点,视网膜厚度、高度的囊肿,铣床,hyperreflective焦点,和榆树的完整性/ OS,已被证明的预测治疗反应后vegf治疗(22- - - - - -24,35]。在目前的研究中,我们的研究结果表明,CMT,垂直高度最大的囊肿,囊肿的数量和VA患者预后的重要预测因素测距装置。这是一个优势,CMT和intraretinal囊肿10月图片很容易评估视觉在临床实践。
在现实世界中,详尽的临床数据收集不划算,不正确地适应临床实践。虽然一些基线人口统计学和眼部发现进行评估,治疗的好处被发现与只有几个特征,如年龄、性别、基线VA,糖化血红蛋白的水平,和之前全凝固(PRP) [36,37]。然而,一些研究表明,有一个缺乏糖化血红蛋白之间的相关性和后处理VA因为实时糖化血红蛋白水平反映了血糖控制在前两个月,而不是前瞻性管理治疗后(38]。此外,它尚不清楚为什么之前PRP与改善VA呈现负相关,这可能是由于黄斑缺血(38]。由于PRP治疗方案的一部分,不可能单独的PRP的影响从抗vegf治疗VA的结果8]。因此,只有三个临床变量包括年龄、性别、和基线VA是用于开发的预测模型研究。基线VA和年龄有关键影响视觉测距装置抗vegf治疗后结果。
除了适当的预测,VA预测算法的应用是同样重要的。线性回归估计未知值的过程是基于多个已知的数据(27,39]。这样每个已知数据分配一个因素权重,最终的预测结果近似真实的结果(27]。合适的,最合适的重量参数分配给每个特性实现的预测结果更准确。随机森林是一个学习算法,这是新兴的其他算法主要是导致其随机和森林结构(27,33]。一方面,以来引导机制可以抵制过度拟合训练样本是随机的。另一方面,森林是一个树结构的组合,可能适合非线性数据更准确33]。随机森林中重要性的统计特性,这表明一些功能更有利的预测(27,33]。实验结果“美和MSE”表明,筛选功能在所有模型相比,所有的数据都明显改善,特别是线性回归和随机森林。
更重要的是,由于线性回归的优点和随机森林,堆栈结构被用来把两个模型(25,32,33]。首先,可以利用随机森林中提取隐藏信息的一些重要特性,然后这些数据可以配备最终的输出预测结果通过线性回归(32,33]。LR +射频模型有更好的指标在任何单一模型之间的比较,可以看到,模型的预测相对接近真值的拟合曲线。
有几个限制在我们的研究中。第一个限制是样本量很小,更多和更长的随访数据仍需要改进我们的预测模型的性能。我们可以试着预测的反应患者vegf测距装置使用深度学习和更多的配对OCT图像。其次,从10月提取手动测量数据是一个劳动密集型和耗时的任务。10月有额外的数据,我们将能够使用更加渴求数据深度学习等方法的预测。
后处理的准确预测视觉反应抗vegf治疗仍然是具有挑战性的在临床实践中。毫升准确预测和VA方差测距装置的抗血管治疗1月后患者1 +打印方案,并优化模型可以更容易地适用于眼科医生。这将是宝贵的指导精确的个性化的干预和管理的期望。
数据可用性
使用的数据来支持本研究的发现可以从相应的作者在合理的请求。
的利益冲突
作者不存在相互矛盾的关系。
作者的贡献
徐Y, F和J,李被分配的概念和设计。J李被指派的行政支持和提供学习材料或病人。Y, F, J,黄C M魏,W翟被分配在数据的收集和汇编。Z林、徐F和Y张被分配在数据分析和解释。徐Y, F、Z林和李J被分配在手稿写作。所有作者的手稿的最后批准应张和Fabao徐贡献同样这项工作。
确认
这项研究得到了山东的关键研究和开发项目,2017 gsf218033。