文摘

视觉评估乳腺乳腺密度的放射科医生在临床实践中使用;然而,这些评估显示弱关联与乳腺癌的风险比成立,定量方法。本研究的目的是提出一个统计一个完全自动化的评估,成立乳腺密度测量算法。五放射科医生估计密度5%增量为138“演示”单一的枣疯病的观点;放射科医生的中值估计是用作参考标准。协议在放射科医生非常好,ICC = 0.884, 95%可信区间(0.854,0.910)。同样,算法之间的协议和优秀的参考标准,ICC = 0.862, 95%置信区间内的放射学家的估计。Bland-Altman情节表明,参考标准略积极偏见(+ 1.86%)算法相比,密度。散点图显示,该算法适度高估低密度和低估高密度。算法评估的箱线图显示,95%跌在一个BI-RADS类别的参考标准。 This study demonstrates the effective use of several statistical techniques that collectively produce a comprehensive evaluation of the algorithm and its potential to provide mammographic density measures that can be used to inform clinical practice.

1。介绍

乳腺密度指fibroglandular组织在乳腺癌和乳腺癌的主要危险因素之一。密度极高的女性乳房( 或更大的乳腺密度)有四到六倍的增加患乳腺癌的风险比那些脂肪乳房(不到 (密度)1- - - - - -3]。

传统上,视觉评估由放射科医生被用来描述和量化乳腺密度(和女性患乳腺癌的风险)使用沃尔夫成绩,塔巴模式,博伊德尺度,或放射科医生的美国大学(ACR)乳腺影像报告和数据系统(BI-RADS)密度词典4- - - - - -7]。尽管重现性好,方法描述乳腺密度显示弱关联与乳腺癌风险量化方法相比乳腺密度(2,3,8)和国米,intraobserver可变性。

ACR指出,放射科医生的视觉评估乳腺密度使用百分比BI-RADS词汇是“不可靠地重现”9]。这个基本缺乏再现性导致了各种半和完全自动化的发展算法量化乳腺密度百分比来战胜国米,intraobserver可变性。因此,重要的是严格的统计方法应用于评估这些算法的性能。

1.1。国家的艺术

成立方法量化乳腺密度产生可靠的和标准化的乳腺密度测量在连续的规模。这种方法是积云的事实上的标准软件(10,11]。使用积云,数字化显示膜丝网乳房x光检查和培训用户选择一个阈值分离乳房区域从背景中(即。感兴趣的区域)。然后选择第二阈值,从而确定区域致密的乳房组织,乳腺密度百分比是计算密集的区域组织的面积除以感兴趣的地区。尽管证明预测乳腺癌的风险,积云的半自动的性质的乳腺密度评估容易国米,intraobserver可变性和由一个完全自动化的方法可以改进。此外,本软件适用于使用数字化膜丝网乳房x光片。在美国90%的乳房x光检查认证单位现在细致的数字(12),一个软件使用细致的数字乳房x线照片(FFDMs)是必要的。

基于卷的方法理论上产生乳腺密度的准确估计,所以它仅仅是假设基于卷的密度估计与乳腺癌风险相关,作为成立已经证明如此估计(视觉和算法评估)13,14]。容积方法使用“处理”FFDMs和DICOM头信息来计算密度。然而,基于卷的估计没有来演示一个同样强大的协会与乳腺癌风险(11,15,16]。此外,乳腺密度估计的潜在分布容积方法没有明显多于成立的方法(典型范围0 - 40%和0 - 100%)(17由放射科医生),使他们难以解释,不是仅仅能够可视化乳腺密度作为体积构造(11,15]。

乳腺密度百分比之间的协议的评估算法和专家放射科医师应该一定量化测量的一致性和再现性由这两个“评级”相同的一组数字乳房x光检查。组内相关系数(ICC)提供了这样一个的协议18]。Bland-Altman情节是用另一种方式来评估评级机构之间的协议。散射和箱形图也可以产生见解的评级机构之间的协议。然而,大部分的文献验证新兴密度测量算法依赖于使用皮尔逊相关系数, ,这是一个衡量两个评分者之间的线性关系,可以相当高,尽管协议贫穷(18,19]。总体百分比协议是另一个统计量,是用来评估协议,但也有缺陷,因为它的因素没有任何固有的国米,intrarater可变性(19]。报告一个数值测量协议仅是一维的,不全面的角度对算法性能。

介绍几种统计方法共同提供一个更全面的评价一个完全自动化的成立图像分析算法的性能产生乳腺密度百分比从FFDMs措施。

2。材料和方法

“演讲”FFDMs收集从首都地区卫生行政部门在新斯科舍进行回顾性分析。照片被收购了西门子细致的数字乳房x光检查机器和自动位制造的专有软件的收购。这个早期阶段的工作集中在中间外侧的斜视图和排除身高的观点,因为它已被证明在文献中乳腺密度估计只有一个观点足以表明乳腺癌风险(20.]。此外,acr的国家乳房x光检查数据库乳腺密度元素定义规定,“如果左和右乳房不同,使用更高密度”(21]。

2.1。百分比密度分析

百分比乳腺密度是衡量一个完全自动化的研究算法,使用“演示”FFDMs计算一个成立规模连续测量密度的百分比(图1、面板1(一)通过1 (d))。使用视图的位置和图像从DICOM偏重信息头(元素(0018、5101)和(0020、0062),职责。)软件创建和面具适用于确定乳房信封(感兴趣的区域)的胸肌,皮下脂肪,覆盖文本(面板1 (b))。MaxEntropy和力矩的变化阈值方法应用于确定一个阈值在乳房组织密度(22,23]。密集的区域组织(即。,the number of pixels of dense tissue) is then calculated (Panel1 (c)),感兴趣的区域的面积是(即。乳腺区域的像素数量,面板1 (d)),和最后的密度估计计算密集的组织区域的比例感兴趣的地区。通过这种方式,软件生成一个可复制的独特,完全自动化,成立乳腺密度的估计使用“演示”FFDM图像。

评估算法和专家之间的协议mammographer,乳腺密度百分比由五个放射科医生视觉评估 密度增加( )使用5像素Barco公司支持的屏幕Syngo MammoReport软件(VB24D,西门子)。视觉评估是由两位高级mammographers,一个初级mammographer,一位居民,一个家伙。这 分规模被用作代理连续测量。

2.2。统计分析

量化估计的可靠性由放射科医生的视觉评估,组内相关系数(可以)是用来测量interobserver协议。虽然可以可以取决于上下文的解释,ICC加权平方相当于Kappa Kappa值的解释和一个被广泛引用的量表可以作为一般指南(24,25]。具体来说,国际刑事法庭的值0.00 - -0.20,0.21 - -0.40,0.41 - -0.60,0.61 - -0.80,-1.00和0.81是用来表示贫穷,公平的,温和的,巨大的,分别和优秀的完美的协议。

它一再被证实,放射科医生的视觉评估乳腺密度与乳腺癌风险相关的1,3,4,10,26]。因此,中位数的视觉评估执行的五参与放射科医生被认为是这种分析的参考标准。算法被认为是有前途的在通知临床实践之间的协议算法和参考标准下降的95%可信区间内国际刑事法庭的放射科医生。

国际刑事法庭被用来量化的水平之间的协议算法和参考标准,和一个散点图是用来说明两者之间的关系。Bland-Altman不同情节之间的协议是用于分析算法和参考标准和量化的数量和方向偏差上限和下限的协议(偏见 的区别)27]。最后,box-and-whisker阴谋被用来可视化结果的BI-RADS密度词典(0 - 24%,25 - 49%,50 - 74%,和75 - 100%)(7]。

3所示。结果

五放射科医生视觉评估138图像来估计乳腺密度,和算法应用到相同的138张图片来生成一个完全自动化的评估每个图像的密度。

放射科医生的视觉评估是在良好的协议与刑事法庭= 0.884,95%可信区间(0.854,0.910)。与参考标准算法证明了优秀的协议ICC = 0.862,下跌的95%可信区间内放射科医生的视觉评估之间的协议。验证了算法在外部设置261乳房x光检查,ICC = 0.841。

之间的皮尔逊相关系数算法和评估参考标准

算法略有高估低密度和低估高密度相对于参考标准(图2)。总的来说,有一个小,正偏压的参考标准评估算法评估相比,平均差测量的参考标准和算法评估(偏差= 1.86%)(图3)。此外,上下一致的水平都低于25%,因此大约95%的数据分类算法是在一个BI-RADS类别的参考标准分类(图3)。

当估计算法和参考标准分类词典,使用BI-RADS密度box-and-whisker情节显示类别(图内良好的协议4)。每个盒子都一致的色彩中包含酒吧,,如预期从Bland-Altman不同情节,背面图没有超过邻BI-RADS类别。

4所示。讨论

算法演示了优秀的协议与放射科医生的视觉评估乳腺密度。至关重要的是,观察到本协议级瀑布放射科医生之间的协议的95%可信区间内观察到。这个算法的独特之处在于,它生成全自动乳腺密度测量,可以直接与视觉确定放射学家的估计,这是广泛接受作为与乳腺癌风险有关。

的唯一使用皮尔逊相关系数( )提供了一种一维水平的协议、过度膨胀的印象。

可以使用的统计评价提出了Bland-Altman,散射,箱形图量化协议和偏见在乳腺密度评估之间的完全自动化算法和放射科医生的评估。这多方面的综合方法可以用来评估任何乳腺密度测量算法的性能,提供了一种替代方法经常报道皮尔逊相关系数和协议百分比统计数据不考虑随机机会不同评级机构之间的协议,不能量化的偏见。

作为乳腺密度在美国立法收益动量和乳房x光检查供应商被要求披露乳腺密度的报告,将会有越来越需要自动化解决方案提供可靠和准确的测量乳房密度。一个女人的乳房密度将用于确定最优跟踪,因此这些算法的性能必须使用健壮的统计评价方法。

5。结论

进一步的工作需要延长乳腺密度算法的适用性FFDMs从其他制造商每个厂家都有自己的专用图像处理算法,生成“演示”图像。此外,放射科医生同时使用中间外侧的身高和体重的观点来评估乳腺密度在临床环境中,目前的算法还必须被扩展以适应身高的分析观点。

目前的算法是一种有效的研究工具和显示承诺能够提供自动乳腺密度测量,可用于通知临床实践。皮尔森相关系数( )提供了一个不足、膨胀和过于乐观的水平的协议。使用的统计方法提供了一个综合评价水平的协议算法和参考标准并确认协议的算法具有极好的水平参考标准。评级机构之间的协议只能充分评估使用多种统计方法。

伦理批准

本研究资本地区卫生行政部门批准的研究伦理委员会:CDHA-RS / 2007 - 365。

利益冲突

穆罕默德Abdolell Densitas inc .的创始人,是一个公司的股东。凯特林Tsuruda是公司的一名员工。

确认

作者要感谢梅兰妮McQuaid博士,博士Ieva Klavina,和克里斯·莱特福特博士提供视觉评估乳腺密度测量用于这项研究。这项研究受到了美国诊断放射学,达尔豪斯大学和首都地区卫生行政部门,加拿大的乳腺癌基金会(大西洋地区)。研究赞助商没有参与研究设计;在收集、分析和解释数据;在论文的写作;也在决定提交投稿。