文摘

背景。往往很难区分囊性垂体腺瘤和Rathke裂囊肿的目视检查,因为他们之间类似的核磁共振报告。我们旨在设计一个MR-based radiomics模型改善他们之间的鉴别诊断。方法。常规MRI诊断数据(T1、T2, postcontrast T1加权图像)先生从215年获得病理确诊的患者(105例囊性垂体腺瘤和其他Rathke裂囊肿110例)和被分成训练( )和测试集( )。MRI radiomics从图像数据中提取特征,和语义成像特性( )被两个放射科医生视觉估计。四个分类器被用来构建radiomics模型通过5倍crossvalidation特征选择后至少绝对收缩和选择算子。一个集成模型结合radiomics进一步构造和语义特性。诊断性能在测试集验证。接受者操作特征曲线是用来评估和比较的背景模型的性能通过放射科医师的诊断性能。结果。在测试集,结合使用安radiomics和语义模型分类器获得最佳的分类性能的AUC 0.848(95%置信区间:0.750—-0.946),精度76.7% (95% CI: 64.1—-89.4%),灵敏度为73.9% (95% CI: 56.0—-91.9%),和特异性为80.0%(95%置信区间CI: 62.5 - -97.5%)和执行比multiparametric模型( ,95%置信区间:0.674—-0.910)或语义模型( ,95%置信区间:0.705—-0.941)。两个放射科医生的准确性为69.8%和74.4%,69.6%和73.9%,敏感性和特异性分别为70.0%和75.0%。结论。的MR-based radiomics模型技术可行性和良好的诊断性能之间的鉴别诊断囊性垂体腺瘤和Rathke裂囊肿。

1。介绍

囊性垂体腺瘤(CPA)和Rathke裂囊肿(RCC)都是常见intrasellar胆囊病变,但他们有不同的治疗策略和预后在诊所1- - - - - -4]。尽管endocrinous测试是有效的区分这两种疾病,MRI仍然是这两个病变诊断的重要工具,特别是在非功能性垂体腺瘤的情况下。先生的形象特征为注册会计师和碾压混凝土已经有据可查的这些年来,例如,油水平,off-midline位置,分隔作用,和hypointense rim在t2加权像上(T2WI),而具体的注册会计师,和intracystic结节是碾压混凝土中常见5- - - - - -10]。在许多情况下,这两种病变是困难在MRI表现杰出。注册会计师可以呈现高-(亚急性出血)或低强度(液化)t1加权成像(T1WI),也可以呈现高(液化)或低(慢性出血坏死支撑)T2WI上强度。这些辐射表现可以模仿的碾压混凝土各种intracystic蛋白质含量(5,11- - - - - -13]。因此,重叠成像表现带来的挑战与目视检查鉴别诊断。

最近,计算机辅助诊断和定量成像分析已经越来越多地应用于MRI intrasellar病变(14- - - - - -16]。作为一个计算机辅助诊断的自然延伸,radiomics诊断放射学领域已成为一种很有前途的技术(17),被应用到许多疾病的鉴别诊断全身(18- - - - - -21]。与传统的计算机辅助诊断,radiomics高通量的特性和优势可采集数据,可以提高诊断的准确性(17,22]。先前的研究已经证实的组合信号强度在postcontrast图像和纹理特性可以用来区分垂体腺瘤和碾压混凝土,基于这一事实垂体腺瘤更有可能显示增强而RCC很少显示增强对比度增强的图像(15]。在我们看来,垂体腺瘤与固体增强可以区分从碾压混凝土,但很难区分CPA nonenhancement或者从RCC thin-rim增强。在这项研究中,我们旨在估计的诊断能力MR-based radiomics模型在区分CPA和碾压混凝土。

2。材料和方法

2.1。病人的选择

这项回顾性研究是我们机构审查委员会批准,知情同意放弃。共有230名患者在术前超声造影成像的囊性病变,检查和病理证实的垂体腺瘤( )和碾压混凝土( )连续收集了从2009年7月到2021年2月。患者被排除由于劣质或不完整的核磁共振数据( ),历史的手术,放疗sellar地区( )。本研究最后包括215例,包括105例CPA和110例碾压混凝土。所有215名患者被分成两个不重叠的设置根据图像采集时间先生:172例(82注册会计师和90年凭借接受MRI扫描期间从2009年7月到2019年6月被指定为训练集,和其余的43例(23注册会计师和20信用社)扫描从2019年7月到2021年2月被设置为测试集。

2.2。图像采集

核磁共振数据得到四个扫描仪在我们医院(3.0 T西门子三、3.0 T GE发现MR750 1.5 T通用标记,和1.5 T西门子Magnetom)以下协议:(1)矢状T1WI (TR, 360 - 450毫秒;TE - 17毫秒;截面厚度,2 - 3毫米;矩阵, ;和视场, ),日冕T1WI (TR, 400 - 440毫秒;TE - 17毫秒;截面厚度,2 - 3毫米;矩阵, ;和视场, ),日冕T2WI (TR, 3500 - 4000毫秒;TE, 92 - 113毫秒;截面厚度,2 - 3毫米;矩阵, ;和视场, )。矢状面和冠状postcontrast T1WI后进行静脉注射丸(0.1毫升/公斤)的提醒之下(gadopentetate dimeglumine)。

2.3。的(ROI)分割

放射科医生(有5年经验的)手动划定边界的ROI整个病变在日冕T2WI和日冕postcontrast T1WI一层一层地使用一个开源MRICRON软件(版本6)。另一位放射科医师(有10年的经验)检查大纲的结果。将T1序列的分割,postcontrast T1序列线性一致的T1序列上使用SPM12软件包MATLAB平台(http://www.fil.ion.ucl.ac.uk/spm/software/spm12),从而补偿病人运动两者之间的扫描。

2.4。Radiomics特征提取

两T1WI、T2WI和postcontrast T1WI数据受到radiomics特征提取利用Pyradiomics软件(23]。执行功能正常化radiomics估计之前的特性。110 radiomics特性提取每个T1WI, T2WI,和postcontrast T1WI数据,由七组:19阶统计特性,17 shape-based特性,23灰度同现矩阵应用灰度共生矩阵建立()特性,16个灰度运行长度矩阵(GLRLM)特性,16个灰度大小带矩阵(GLSZM)特性,5邻近的灰色基调不同矩阵(NGTDM)特性,和14个灰度矩阵(GLDM)特性的依赖。因此,总共有330 radiomics功能从原始图像中提取。一阶统计特性可以评估单个像素的属性值,但是是独立的像素之间的空间相互作用24]。shape-based特征形态属性,如体积和尺寸。剩下的特征属于纹理特征,可以用来描述不规则组织(25]。

2.5。语义特征评价

两个放射科医生(放射科医师1和10年的工作经验,放射科医师2和15年的工作经验)人蒙蔽独立临床资料和病理结果回顾了图像语义特征评估先生所有的病人。语义特征包括:(1)肿瘤形状(圆形、椭圆形、snowman-like分成小叶的(7]);(2)肿瘤位置(intrasellar intrasellar和上,上);(3)sellar抑郁(定义为sellar楼深度超过10毫米低于假想后从平面扩展线sphenoidale [26];没有/存在);(4)在T1WI强度(大脑的白质定义为参考标准;分为6组:hypointensity、iso-hypointensity isointensity, iso-hyperintensity, hyperintensity,或hyperhypointensity);(5)T2WI上强度(分为以上);(6)off-midline位置(定义为偏侧性损伤的蝶鞍或茎偏差的病变(6,7),没有/存在);(7)囊性部分的信号强度(同构或异构);(8)囊肿壁厚(均匀性/不均匀性);(9)病变边界(明确的/不明确);(10)内的囊肿壁(规则、不规则的);(11)油的水平9](缺席/存在);(12)intracapsular分隔作用[6](缺席/存在);(13)T2WI hypointense rim (sellar病灶的边缘部分的强度低于白质T2WI (5,6),没有/存在);(14)intracystic结节(自由浮动的结节没有增强[8),没有/存在);(15)与海绵窦的关系(定义为内或是否超出海绵颅内颈动脉的侧缘(ICA) [7),内/外)(图1)。在语义特征评价分歧的情况下,通过讨论与共识。如果共识仍然无法实现,高级neuroradiologist(超过18年的经验)协助达成共识。研究结果总结在补充表(可用在这里)。与此同时,两个放射科医生被告知,最后的诊断是两个肿瘤(CPA或碾压混凝土),和他们分别诊断病例。

2.6。特征选择和分类器训练

特征选择和分类方法是计算使用sklearn (https://scikit-learn.org/stable/)。为了避免共线性和过度拟合特征空间,至少绝对收缩和选择算子(套索)算法用于特征选择27,28]。评估radiomics特征和语义特征的预测价值,三个模型的训练和测试基于radiomics特性(multiparametric模型),语义特征(语义模型),结合radiomics特征和语义特征(radiomics和语义模型)。此外,出于好奇的差异歧视能力每个单一参数成像特性在多参数模型中,我们比较模型的诊断价值基于单参数成像功能:T1成像特性(T1WI模型),T2成像特性(T2WI模型),只和postcontrast T1成像特性(postcontrast T1WI模型)。对于分类,我们调查了四个机器学习分类器,包括支持向量机(SVM)、人工神经网络(ANN),自适应提升(演),和随机森林(RF)。把类的支持向量机学习最优超平面尽可能宽,而试图平衡分类错误的情况下(29日]。对支持向量机模型中,径向基函数(RBF)柯rnel,连同正则化参数 1.0。安,灵感来自生物神经网络,具有显著的自学习能力调查的意义和规则复杂的数据(30.,31日]。对于ANN模型,(即三层反馈架构。,one input layer, one hidden layer with 100 neurons, and one output layer) was performed (Figure2)。ReLU传递函数是用于隐层和输出层。亚当采用优化算法来更新网络权重。overfit点球和最大迭代次数设置为0.0001和200年,分别。我们也使用射频和演算法,两个基于树的整体学习分类器,允许非线性特性之间的相互作用和有良好的可解释性,开发我们的模型。演算法和射频训练分类模型树的数量为100,最大深度为10。

比较的性能模型,我们计算不同的特征选择方法和分类器的组合。的原理概述radiomics方法如图3

2.7。统计分析
2.7.1。组比较

所有使用SPSS统计分析软件,v。21日(美国、IBM、纽约Armonk)。人口统计学和临床特点进行了比较 测试分类变量和连续变量纠缠Kolmogorov-Smirnov测试。一个两个示例 - - - - - -测试或非参数 - - - - - -测试应用于分析统计差异,取决于他们的连续变量符合正态分布。 值小于0.05被认为是具有统计学意义。

2.7.2。模型建设和评价

所有分类实验基于特征选择的不同组合和机器学习分类器进行通过5倍crossvalidation,整个训练集随机分成五个子集。在每一个褶皱,四个子集作为训练集,剩下的一个子集作为测试集,在训练阶段,使用套索选择最相关的特征。由于不同的训练集,选择的数量特性介于20和40之间。之后,集群模型训练集训练基于这些特性。在测试阶段,这些训练模型应用于测试集,和分类结果。重复此过程,直到所有子集作为测试集。四个机器学习分类器是利用,参数选择最好的AUC为每个模型。radiomics模型,语义模型,结合radiomics和语义模型在测试集外部验证。

2.7.3。诊断性能的比较

诊断性能的六个模型计算使用训练集的AUC。multiparametric模型,语义模型,结合radiomics和语义模型评估和使用AUC相比,准确性,敏感性,特异性,阳性预测值,和消极的训练集和测试集的预测价值。此外,我们评估的诊断性能放射科医生曾评价语义特征和杰出的注册会计师从碾压混凝土。

3所示。结果

3.1。病人的特点

总结了临床和人口特征表1。在培训或测试集,没有明显的统计两组年龄和性别差异。激素水平异常信用社更频繁地发生在注册会计师的培训( )和测试( )集(表1)。

3.2。确定最好的模型训练集

诊断的结果性能使用不同组合的六个特征选择方法和总结了四个训练集的分类表2

3.2.1之上。模型基于Radiomics特性

安分类器实现一致拥有至少2.3%的优越性能比其他分类器更高的AUC除了使用T1成像特性。安分类器显示multiparametric模型(意思是最好的诊断性能 ,95%置信区间:0.851—-0.929)比其他radiomics模型。安分类器显示在T2WI表现最好的诊断模型(的意思 )和postcontrast T1WI模型(的意思 )比其他分类方法。支持向量机的性能或射频标识符(的意思 )比其他的两种分类方法在T1WI模型。

3.2.2。语义模型

安分类器显示最好的诊断性能(的意思 ,95%置信区间:0.863—-0.941)语义模型比其他分类方法。

3.2.3。结合Radiomics和语义模型

结合radiomics和语义模型的ANN分类器实现最佳的诊断性能(的意思 ,95%置信区间:0.885—-0.963)比其他分类方法。

3.3。比较模型的训练和测试集

联合radiomics和语义模型有更好的诊断性能比multiparametric模型或语义模型在训练集和测试集(表中3)。

结合radiomics ANN分类器和语义模型取得了AUC,准确性,敏感性,特异性为0.924,85.5%,86.6%,和84.4%的训练集和0.848,76.7%,73.9%,和80.0%的测试集(表3)。此外,中华民国曲线如图4

3.4。放射科医生诊断性能

放射科医生达到70.9%和79.1%的准确性,分别为76.8%和82.9%的敏感性,在训练集和特异性为65.6%和75.6%。在测试集,两个放射科医生的准确性为69.8%和74.4%,69.6%和73.9%,敏感性和特异性分别为70.0%和75.0%(图4)。

3.5。模型分析

在训练集,我们计算功能的重要性排名与最优选择套索回归λ包括非零变量在每一轮的crossvalidation它们混合起来选择TOP20重要性排名的功能(图5)。对于multiparametric模型,选定的功能主要是来源于纹理特性,如熵、重点和不均匀性。前20名特性multiparametric模型包括3阶特性,3 shape-based特性,应用灰度共生矩阵建立6功能,3 GLRLM特性,1 GLSZM特性,1 NGTDM特性,3 GLDM特性(图5)。

训练集的特征选择重要性排名前20位的组合radiomics和语义模型,6语义特征和14 radiomics特性,被发现后保留套索特征选择在5倍(图5)。6的语义特征是sellar地板抑郁、T2WI强度,off-midline位置,囊肿壁厚,intracapsular分隔作用,和intracystic结节。所选radiomics特性主要由一阶特性和shape-based特性。分radiomics特性包括4阶特性,5 shape-based特性,应用灰度共生矩阵建立3特性,1 GLSZM特性,1 GLDM特性。在排名前20位的两个模型的特点,original_shape_SurfaceArea重叠功能。

43例中测试集,10例(4 RCC, 6 CPA)被结合radiomics分类错误和语义模型。的一些分类错误的例图所示6

4所示。讨论

在这项研究中,我们使用一个radiomics-based机器学习方法来区分注册会计师从碾压混凝土。我们的研究结果表明,radiomics分析基于传统图像先生提供了一个有前途的非侵入性方法和收益率比放射科医生更好的诊断性能。另一个重要发现是,结合radiomics和语义模型的性能进一步提高的基础上添加语义特征。

的诊断准确性高于radiomics模型有经验的放射科医生。正如我们所知,放射科医生的诊断性能是基于他们的经验和主观感知的传统形象,先生虽然radiomics方法可以发现细微的差别,没有可察觉的视觉检查和允许可再生的分析(17,22,32]。

本研究旨在比较radiomics模型基于不同的诊断效果单一参数的形象。与之前的研究一致Zhang et al。15),本研究发现,最重要的图像数据先生在单一参数模型对鉴别诊断postcontrast T1形象,其次是T2图像。然而,T1 hyperintensity中可以看到肿瘤内出血在RCC PA和高浓度的蛋白质,这可能被误认为是对比度增强肿瘤;单独的评估postcontrast T1WI可能误导(13,33]。因此,我们计算multiparametric模型的性能,发现multiparametric图像有更多的贡献提高性能。在multiparametric模型中,所选择的特征主要是来源于纹理特征重要性;熵和均匀性可以用来量化异质性在相关范围内(34]。熵反映了结构不规则,而均匀性代表着灰色的水平分布在肿瘤(34]。异质性可能与特定的影像学标志,如油水平,分隔作用,和漂浮的结节,影响纹理特征。

考虑到语义特征是重要的鉴别诊断和可能提供额外的预测价值,我们添加它radiomics特性来构建集成模型。正如我们所料,结合radiomics和语义模型表现得比模型基于radiomics或语义特征。除了有价值的语义特征与先前的研究一致,我们试图解释的重要性sellar地板抑郁和囊肿壁厚的选择特性的重要性。我们推测sellar楼抑郁可能与PA的侵袭性,和PA可以渗透许多结构如sellar地板,海绵窦,蝶鞍部(35- - - - - -37]。然而,碾压混凝土的发展膨胀和非侵入性的行为模式。碾压混凝土的主要MRI发现nonenhancement或thin-rim增强。碾压混凝土的早期研究表明,thin-rim增强可以归因于鳞状上皮化生,炎症,含铁血黄素沉积,或囊肿壁胆固醇晶体(38- - - - - -41]。因此,重要的是要区分RCC周围是增强正常垂体腺囊肿壁增强模拟增强[41,42]。注册会计师的墙是归因于不完整的出血,梗塞,或出血性梗死发生在垂体腺瘤的固体部分,所以墙的厚度不均匀。radiomics特征选择的重要特性主要由一阶特性和shape-based特性。语义特征和纹理之间的相关分析还有待研究。

在测试设置中,我们发现,三种模型的性能下降与训练集相比,但仍有相对较好的业绩,而放射科医生。不同厂家和不同参数设置可能是一个因素影响图像质量和表现;因此,我们推测,这可能是影响性能的模型,但是,从另一个角度来看,这是证明了radiomics技术有很优良的泛化性能甚至认为这是由异构的数据。

在我们的研究有几个限制。首先,测试集的相对较小的患者数量在这项研究可能会影响我们的结果,和多中心数据可能需要在未来来验证我们的模型。第二,本研究没有包括高度怀疑患者没有手术,这可能导致结果的偏差。

5。结论

radiomics方法是一种可行的方法来区分注册会计师从碾压混凝土和radiomics模型比放射科医生的诊断性能。模型的性能进一步加强语义特征后补充道。联合radiomics和语义模型利用ANN分类器被认为是确定注册会计师和碾压混凝土的优化模型。

数据可用性

和/或使用的数据集分析在当前研究可从相应的作者以合理的要求。

的利益冲突

作者没有利益冲突的声明。

作者的贡献

砚平王、陈Sixuan贡献同样这项工作。

确认

这项工作是由国家重点支持的研究与中国科技部科技发展计划(批准号2018 yfa0701703和2017 yfc0108805),中国国家自然科学基金(批准号。81871345,81790653,81790650,81701680,81830056,81801686),加强卫生系统工程与科学和教育的江苏省卫生和计划生育委员会(批准号YXZXA2016007),江苏省关键人才项目资助(批准号ZDRCA2016093),自然科学Foundation-Social发展(批准号BE2016751),中国博士后基金(批准号2016 m603064)和江苏省(1501169 b)。

补充材料

补充材料:统计表的训练集和测试集的语义特征。注:括号中的数据是百分比。 测试; 从确切概率法; 测试与连续性校正。(补充材料)