文摘
目的。本研究旨在探讨的价值biparametric磁共振成像(bp-MRI)的radiomics签名的术前预测前列腺癌(PCa)年级与放射科医生视觉评估相比基于前列腺成像报告和数据系统2.1版本(PI-RADS V2.1)大量multiparametric MRI (mp-MRI)。方法。这项回顾性研究包括142名连续患者组织学证实PCa mp-MRI之前手术。核磁共振图像是由两个独立的得分和评估使用PI-RADS V2.1放射科医生。radiomics工作流程分为五个步骤:(a)选择和图像分割,特征提取(b), (c)特征选择,(d)模型建立和评价(e)模型。三个机器学习算法(随机森林树(RF)、逻辑回归和支持向量机(SVM))是区分高级和低级的PCa构造。接受者操作特征(ROC)分析是用来比较的基于机器学习分析bp-MRI radiomics PI-RADS V2.1模型。结果。,804 radiomics稳定特性的提取特性基于t2加权成像(T2WI)和ADC序列被选中。Radiomics签名成功地分类高档和低档PCa例( )在训练和测试数据集。基于模型radiomics射频方法(曲线下面积,AUC: 0.982;0.918),逻辑回归(AUC: 0.886;0.886)和支持向量机(AUC: 0.943;0.913)在训练和测试组最好的诊断性能比PI-RADS V2.1 (AUC: 0.767;0.813)当预测PCa品位。结论。这项临床研究的结果表明,基于机器学习的分析bp-MRI radiomic模型可能有助于区分高级和低级的PCa,表现在PI-RADS V2.1分数基于mp-MRI。机器学习算法射频模式略好。
1。介绍
前列腺癌(PCa)是男性最常见的恶性肿瘤1]。基于格里森评分(GS), PCa分为低级和高档,治疗策略有很大的不同(2]。例如,高档PCa需要患者根治性前列腺切除术或放射治疗,而低级的PCa患者可能候选人积极监测(3- - - - - -6]。因此,术前准确预测评分的PCa对治疗决策至关重要。
目前,活组织检查是术前识别的参考标准等级的PCa (7]。然而,这个过程已被证明是容易overdetection低级和underdiagnosis高档PCa (8]。因此,开发一种无创、准确的术前预测方法级是可取的。
Multiparametric (Mp)核磁共振已被公认为互补PCa的检测和评估的工具。放射科医生使用前列腺成像报告和数据系统2.1版本(PI-RADS V2.1)检测临床上重要的PCa [9]。然而,mp-MRI解释是具有挑战性的和容易国米,intrareader可变性在放射科医生专家(8]。
根据文献,基于机器学习mp-MRI radiomics提供一个客观的工具,已被证明是有用的在评估等级的PCa (10- - - - - -12]。相比之下,动态对比度增强(DCE)是一个耗时的过程造影剂的额外成本(13- - - - - -15]。此外,荟萃分析报道,DCE-MRI不能用于预测GS PCa (16]。
据我们所知,很少有研究预测成绩使用biparameter (bp) mri(41代理)radiomics [17]。然而,机器学习算法相对简单,结果radiomics尚未与传统PI-RADSV2.1方法相比。因此,本研究的目的是双重的。首先,我们使用基于bp-MRI radiomics三种机器学习方法,包括逻辑回归,随机森林(RF)和支持向量机(SVM),术前预测PCa品位。第二个目的是比较这些分类功能的视觉评估基于mp-MRI放射科医生在PI-RADS V2.1的协议。
2。材料和方法
当地的机构审查委员会批准了这个回顾性队列研究和放弃要求书面知情同意。
2.1。病人
2017年1月至2020年11月,总共有166个病人前列腺mp-MRI考试与组织学证实PCa纳入本研究。排除标准如下:(a)的患者接受了之前治疗包括激素辐照前的核磁共振扫描(n= 21);(b)核磁共振图像质量差,由于严重的易感性工件或呼吸运动构件(n= 2);和(c)不完整的临床资料(n= 1)。
最终,142 PCa患者参加本研究。多种肿瘤患者的网站,该网站最大的负担(即最大的大小或最高的GS)文档中被报道。因此,在这项研究中,唯一一个从每个患者肿瘤部位是用于分析(17]。
根据最近radiomics研究[18),这些患者被随机分为一训练队列(n= 98)和一个测试组(n= 44)使用计算机生成的随机数7:3比率。病人招聘流程图如图1。
2.2。核磁共振成像协议和特征提取
所有图片是使用3.0咯扫描仪(阿奇沃TX,飞利浦医疗保健、和荷兰)16通道的身体相控阵线圈。标准的mp-MRI协议包括矢状T2WI、轴向T2WI, diffusion-weighted成像(驾车)(b值0和1000、2000秒/毫米2),DCE。表观扩散系数(ADC)图自动重建一个指定的工作站。核磁共振成像序列的详细采集参数如表所示1。
ADC和T2WI图像检索的图像存档和通信系统(PACS,华海)。核磁共振图像加载到ITK-SNAP软件(版本3.4.0;https://www.itksnap.org)半自动地,一个三维体积感兴趣的(VOI),覆盖整个肿瘤划定在轴向ADC和T2WI图像每个片分割放射学家(放射学家C、z L。,在前列腺癌MRI) 10年的经验。VOI如图的过程2。
纹理提取使用人工智能工具(A.K.执行诉3.2.1之上,通用电气医疗集团)软件。总的来说,804年从每个VOI成像特征提取,包括一阶统计,直方图特性,二阶纹理,并形成因素(形状)参数。
然后,组内相关系数(可以被用来评估radiomic interobserver再现性的特征提取。大约30随机选择一位放射科医师获得的图像(放射学家D, z . x L。,20年的经验在前列腺癌MRI) VOI分割。
2.3。特征选择、Radiomics标志性建筑和模型训练
并不是所有提取的特征都有助于鉴别诊断。上述特性选择通过至少绝对收缩选择算子(套索)回归分析10倍交叉验证和斯皮尔曼相关降维(阈值0.9)系数和特征选择优化特性集的大小和保持独立的特性。
最后,8特性提取T2WI和ADC图像。使用套索算法特征选择的过程如图3。
(一)
(b)
机器学习程序的目标是建立一个预测模型区分两类:低级和高级PCa。三个算法(射频、逻辑回归和支持向量机)提出了分类器(19- - - - - -21]。他们可以用来找到有价值的特性和移除相对无关紧要的特性来实现更高的分类性能(22- - - - - -26]。评估模型的训练数据集应用到测试组。radiomics工作流呈现在图2,图中概述的过程4。
2.4。PI-RADS V2.1评价
所有图片都是网络通信工作站(华海医疗成像pac,西安,中国)和飞利浦工作区。根据PI-RADS V2.1准则,两个独立的放射学家和不同层次的体验(放射科医师,z . J。有3年经验的,放射学家B t . M。,with 10 years of experience in prostate MRI diagnosis), who were blinded to the initial mp-MRI imaging reports, clinical data, and histopathology, scored the examinations. In addition, the two radiologists did not previously participate in the process of VOI delineation. The PI-RADS V 2.1 score was independently recorded by radiologists using a score of 1–5 for T2WI, a score of 1–5 for DWI, a “+” or “−” for DCE, and an overall PI-RADS assessment category. When multiple doubtful lesions appeared in the same patient, only the most suspicious lesion with the maximum volume was scored and recorded [27]。病变有PI-RADS评分≥4被认为是高档PCa、阳性和病变评分≤3为低级的PCa被认为是消极的。最终表现为放射科医生和radiomics模型计算是基于患者的立场分类。PI-RADS V2.1的详细评估项目规模(补充表1- - - - - -5)上传的补充材料。
2.5。统计分析
kappa测试是用来评估在PI-RADS V2.1的inter-reader协议获得的分数两个放射科医生。Kappa值< 0.20表示可怜的协议,0.21—-0.40表示公平协议,0.41—-0.60表示温和的协议,0.61—-0.80表示好协议,和≥0.81表示良好的协议28]。国际刑事法庭被用来评估interobserver radiomic提取特征的再现性。ICC大于0.75的分数表明好的协议的特征提取。训练和测试组被用来验证与射频的诊断性能预测模型,逻辑回归和支持向量机。radiomics签名模型的预测能力基于bp-MRI与mp-MRI PI-RADS V2.1分数的确定低级和高级PCa分析基于接受者操作特征(ROC)曲线。德龙radiomics模型的性能比较的测试(29日]。曲线下的面积(AUC)、敏感性,特异性,阳性似然比(LR +)和阴性似然比(LR)派生的训练和测试组。高档类肿瘤被认为是积极的。
显示统计学意义。统计分析与社会科学统计软件包(SPSS,https://www.ibm.com/products/spss-statistics),MedCalc软件和A.K.软件(上面提到的)。
3所示。结果
3.1。患者的临床病理的特点
选择患者的基线特征的数据分为训练集和测试队列表进行了总结2。没有明显差异的年龄或前列腺特异性抗原密度(PSAD)之间的两组(所有 )。意义高档和低档PCa之间的差异被发现在训练和测试组(PSA水平 )。位置的差异在统计上显著的训练队列( )。
3.2。Radiomics标志性建筑
radiomic特征提取的可靠性方面的刑事法庭所有功能的ADC和T2WI图像量化,意味着ICC值为0.919(95%置信区间CI: 0.836 - -0.960)和0.963(95%置信区间:0.925—-0.982),分别。
总共有804 VOI的定量特征提取每个MRI系列及其相应的过滤结果。
在当前的研究中,8特性被从bp-MRI获得最佳特性集(由8选择从804年特性结合T2WI和ADC序列)。特征选择的过程中使用的选择步骤如表所示3。
基于机器学习的分析bp-MRI radiomics签名建立了基于T2WI结合ADC图像(一)射频;(b)逻辑回归;和(c)支持向量机模型。
3.3。预测能力的Radiomics签名(模型)
结果表明,使用射频方法鉴别诊断模型建立(AUC: 0.982;0.918)表现好于逻辑回归分析(AUC: 0.886;0.886)和支持向量机(AUC: 0.943;0.913)在训练和测试组。德龙的测试表明,该射频方法AUC比训练军团(逻辑回归分析 )。中华民国曲线radiomic签名的识别性能在训练和测试组如图5。预测能力(AUC,敏感性、特异性、LR +和LR−) radiomics模型如表所示4组织培训和考试的原始radiomics数据(见补充材料)。
(一)
(b)
(c)
kappa系数的两个放射科医生为0.7,这表明良好的协议。基于PI-RADS V2.1得分5如截止值,auc的两个放射科医生的诊断性能分别为0.767和0.813,分别低于radiomics特性分类器在分类高档和低档PCa(图5和表4)。表5列表的结果评估所有图片的两个放射科医生。每一次的成绩是基于PI-RADS V2.1放射科医生的A和B,上传的补充材料(补充表6)。
4所示。讨论
术前预测PCa年级临床决策是很重要的。病理活检是一种流行的PCa年级侵袭性的评估工具,但它有限制其临床使用的各种并发症。
在这项研究中,我们描述了使用noncontrast-enhanced radiomics签名MRI图像,这是一种新的非侵入性方法具有良好的诊断性能。我们的研究结果表明,基于机器学习的分析bp-MRI-based radiomics模型区分低级和高级PCa提供准确性和灵敏度高于视觉评估由放射科医生基于在PI-RADS V2.1 mp-MRI得分。这表明T2WI或ADC图像可以反映肿瘤的异质性,radiomic特性可以用来区分小信号的差异前列腺肿瘤。本研究还发现,选择合适的机器学习算法有助于提高模型的稳定性和预测性能。我们的研究结果表明,radiomics-based射频机器学习模型,包含8选择特性,歧视有更好的性能比其他模型(SVM和逻辑回归)区分从高档低档PCa (AUC的训练队列:0.982;AUC的测试组:0.918)在训练和测试组。
一些研究表明,逻辑回归模型的优势积极PCa (30.,31日]。一般来说,逻辑回归、射频和SVM算法都是适合模型建设和小样本大小和二进制变量(30.- - - - - -34]。然而,对于bp-MRI (ADC结合T2WI), RF算法更推荐使用我们的小样本的结果。
我们也评估基于PI-RADS mp-MRI V2.1的预测值。在我们的研究中,预测概率radiomics特性表现人类的主观评价。
先前的研究已经评估MRI radiomic-based模型预测性能的积极的PCa。Parra等人的一项研究探讨了DCE和ADC-feature radiomics模型预测临床上重要的PCa的AUC 0.82 [35]。马年代等人报道,一个mp-MRI radiomics签名比放射科医生的视觉评估预测囊外的扩展开发和验证(36]。妞妞等人报道,纹理分析模型,包括bp-MRI可用于识别高档PCa和特定参数提取纹理分析可能是额外的工具来评估肿瘤侵犯(37]。敏等人建立了一个mp-MRI-based radiomics模型区分临床上重要的PCa和临床上无关紧要的PCa的AUC 0.823 [34]。然而,这些研究方法只提取几个纹理特性或只使用一个机器学习模型和不与传统PI-RADS V2.1评分,反馈信息是相对有限。在当前的研究中,三个分类器被使用并与在PI-RADS V2.1分数;然后,最有效的特征选择的建设三个预测模型。
bp-MRI允许精确的检测和定位可疑PCa,除了减少所需的时间来完成学习和更低的成本不使用钆(38]。此外,潜在的风险相关的提醒之下媒体的使用,如肾发生的系统性纤维化、肾衰竭、钆在大脑中积累,将会减少(39]。一般来说,T2WI和ADC是最常见的序列被调查者radiomics研究[32,40- - - - - -42]。因此,我们选择radiomic特性来自T2WI和ADC只有在这项研究中。此外,使用太多的序列影响临床应用,因为费时又费力的图像分割,所以更重要的是选择一个有价值的序列。因此,我们得出这样的结论:mp-MRI-based radiomics可能有助于区分从高档低档PCa和危险分层而不需要额外的MRI序列如DCE。
高档PCa与异构组织条件比低级的PCa肿瘤表现出立体像素强度的空间分布和radiomics可以提供更多的信息来区分癌症挑战的PI-RADS V2.1分数(42,43]。此外,临床应用PI-RADS V2.1是主观的和高度reader-dependent由于其自然特性严格固定的离散的类别。此外,PI-RADS V2.1需要DCE序列和实现定量标准的缺点,有利于诊断性能。在这项研究中,我们提出了自动机器学习的方法来应对这些挑战,雇了一个公认的方法,射频,导致不使用钆健壮的分类器的性能。射频是一个算法精度高和宽容44]。它最大的优点是,它可以预测多元数据和分析复杂的非线性关系23]。
然而,也有一些限制。首先,这是一个回顾性单中心研究,样本容量相对较小。前瞻性multiple-center研究需要在未来,和其他外部验证军团还应该包括测试的重现性,未来的研究。第二,虽然三维VOI,主观因素造成的偏差是不可避免的,当VOI手工绘制。我们手动分割和划定的看到两个放射科医生在共识,尽力减少偏差。进一步的研究应采用半自动分割。第三,一些病理结果证明系统结合靶向活检和缺乏包埋连续切片。虽然包埋组织病理学是参考标准,这是不合理的期望,我们所有的情况下将接受根治性前列腺切除术,尤其是低级PCa的病人。此外,只有包括患者行根治性前列腺切除术后会导致选择性偏差。
5。结论
总之,我们的研究表明,基于机器学习的分析bp-MRI radiomic模型提出了诊断性能优越传统PI-RADS V2.1分数预测PCa的组织学分级。机器学习算法射频模型略有增加。发现该算法帮助放射科医生报告肿瘤分级和促进PCa临床决策管理。
数据可用性
使用的数据来支持本研究的结果中包括补充信息文件。
的利益冲突
作者宣称没有利益冲突有关这篇文章的出版。
补充材料
补充文件包含原始数据的补充信息radiomics(补充材料和补充表1 - 6)。(补充材料)