文摘
计算机辅助检测系统针对疾病的自动检测使用不同的医学成像模式。在本文中,一种新颖的方法来检测正常/病理学在数字胸片。解决的问题是复杂的,因为它不是专注于特定疾病但任何不同于被认为是常态。首先,胸部的感兴趣的领域被发现使用模板匹配的图像。然后,纹理描述符称为局部二进制模式(LBP)是这些地区的计算。之后,LBP直方图应用于分类器的算法,产生最终的正常/病理学的决定。我们的实验结果显示的可行性建议,在最好的情况下,成功率在87%以上。此外,我们的技术是能够找到可能的病理领域在非正规的射线照片。建议的方法的优点和局限性所描述的结论。
1。介绍
医学成像医疗工程的一个关键领域,旨在帮助医疗专业人员来识别损伤和疾病。早期的尝试在电脑分析医学图像是在1960年代,如诊断原发性骨肿瘤(1]在乳房x光成像和检测异常2]。在1980年代,出现了一个新概念计算机辅助诊断(CAD)假定计算机输出可以用来帮助医生,而不是取代它们。目前,CAD系统是用于疾病的早期检测,即获得“第二意见”,帮助他们做出最后的决定3- - - - - -6]。CAD系统还可以提供一些基本的信息非常有用,当人类专家监控是不可能的。
每个生物医学影像技术是适合特定的诊断。例如,MRI可以横向成像所需的空间本地化而超声波图像允许医生软组织的可视化和产科护理带来了革命性的变化7]。然而,数字放射学仍是诊断bioimaging的支柱,主要是由于三个原因:()的能力来检测未知的病态;()不入侵;和()有一个低辐射剂量和低成本8]。
大多数研究相关CAD研究一直关心的一些器官如胸部、乳房、结肠和肝脏5,9- - - - - -11]。本文的目的是执行一个自动正常/病理学分类后前位的数字胸片(PA)。该方法不是专门在一个给定的一组类型的病变或疾病,但可以检测任何不同于常态。射线照片的一个示例视图下研究如图1。
(一)
(b)
尽管有很多CAD技术,计算机视觉研究问题研究到目前为止却没有得到足够关注。举例来说,我们可以把一些有趣的研究在CAD系统中,与乳房x光检查乳房结节检测(12,13]。还有例子系统集中在肺结节检测用计算机断层扫描(14,15)或放射学(16- - - - - -18]。这些研究导致了商业系统在临床实践中19]。
此外,一些作者提出了CAD系统能够识别在结肠息肉等疾病20.),急性颅内出血(21],严重呼吸道综合征(22]。由于它的重要性在CAD系统中,许多研究工作已经致力于身体的解剖区域的分割。胸有关医学成像,关注尤其是肺部(8,23,24),肺,心脏和锁骨(25),某些肺部结构随着门的地区(26,肝脏和邻近的腹部器官(10,11];后两种方法不使用简单的射线照片,但其他三维图像CT和MRI等形式。一些作者还在研究如何段骨结构的胸部27,28),通常消除阴影投射在肺实质。
另一方面,更少的研究一直致力于从病理识别正常的一般问题。在这个领域中,我们可以发现描述的方法(29日),解决了射线照相法的分类正常/非正态的胸部。一个最近的邻居(nn)分类器使用作为输入特性提出了一组伽柏小波滤波器的响应。另一个有趣的工作(30.],使用计算断层扫描(CT)对肺纹理识别的问题。他们使用了LBP算子扩展到三维,执行的LBP直方图的比较。这些作者还提出了一个结构基于分类系统对肺气肿量化CT图像由三个类:正常组织,小叶中心的肺气肿,paraseptal肺气肿31日]。本文是[描述的初步工作的延伸32],实质性的改善方法和实验验证。
2。材料和方法
48个样品高分辨率的DICOM图像胸片(25男性和23岁女性)被提供的医院一般雷纳索非亚·德·穆尔西亚大学(HGURSM),西班牙,执行测试。HGURSM当地伦理委员会批准了这项研究,和书面知情同意获得HGURSM放射科医生的诊断过程。图像的分辨率像素和一个12位/像素的深度。可用的图像中,有25个正常男性和13女性(12)和23个病理(13男性和10个女性)样本。研究对象的年龄范围从15到93年,平均55。
提出的图像分类方法在以下部分描述。开发系统的全局视图如图2。
2.1。预处理和分割
第一阶段系统的预处理和分割。在这一步中,输入DICOM文件减少像素深度,从12到8位/像素。之后,才应用于使用supersampling插值图像,减少了大小像素,即标准为以下步骤解决。
一般来说,分割过程是用来识别区域包含某些类型的病变(34]。在我们的系统中,图像分割定位的位置两肺片,为了确定感兴趣的领域。提出的分割方法是基于模板匹配算法(35),这是一个著名的计算机视觉技术。这个过程在于寻找一个给定的模板在图像的所有可能的位置,用一个预定义的相似性测量每个位置。
样品左右肺,从训练集中提取,用作模板的匹配过程。不同模式的肺是用来应付各种方面他们可以采用由于性别、年龄、或个人。值应用于匹配算法是一个相关系数(36),生产标准化值接近1的最优位置匹配。因此,最大关联的位置是选为每个肺的预期位置。之后,左、右肺分段的正方形网格地区,如图3。观察到该方法不会产生肺轮廓的精确分割,但每个肺的边界框,这是充分的后续流程。
(一)
(b)
2.2。特征提取与枸杞多糖
这一步的目的是产生有意义的纹理描述符对感兴趣的区域。不同种类的特性已被用于生物医学图像如傅里叶变换、小波滤波器,并筛选功能。该技术提出了基于LBP特征,介绍了在(37]。枸杞多糖是一种不变的纹理描述符产生图像中每个像素的值。让我们考虑一个单通道图像,,一个任意的光度决议。枸杞多糖计算一个像素考虑周围的8个像素点使用以下方程: 在马嘶迭代像素的邻居吗,也就是说,,,,,,,,,是一个函数的阈值参数。图4显示一个图形表示的枸杞多糖的计算一个像素。
每一个可以把256个值,从0到255,编码对中央像素灰度信息。这些值不是单独来看;相反,他们聚集在直方图为每个地区的利益。给定一个地区由一组像素,对应的直方图是由 在哪里从0到255。观察到直方图归一化结果除以,即区域像素的大小。一个示例应用程序的LBP直方图如图5相比,灰色的直方图的原来的摄影水平。注意所有的LBP图像包含相关的信息,但这可能不是清楚地看到图像中最重要的比特(只有被人赞赏的目视检查)。
(一)
(b)
(c)
如前所述,输入摄影分为网格两肺区域,确定根据分割步骤。每个地区的LBP直方图,产生一个特征向量的24 256箱的直方图。图6提出了这一阶段的一个例子。
2.3。分类的特点
分类器通常用于大部分的医学图像分析程序可分为以下类别:传统分类器,人工神经网络(3,6,38,39),模糊系统(40),和支持向量机(41,42]。需要考虑的一个关键方面是众所周知的问题诅咒的维度:具有高维度分类器需要大量的训练样本,以避免过度拟合。然而,在我们的案例中,可用样本的数量减少,那么简单分类器应用基于直方图之间的距离。
特别是,Bhattacharyya距离(42)用于提供两个直方图的相似度的测量。考虑两个直方图和,这个距离被定义为
让我们假设一个训练集射线照片,,和一个新的x光照片进行分类。24的LBP直方图的图像(训练集和计算)。然后,每个直方图是相对于相应的直方图使用(3)。之后,之间的区别的正常射线照片的最小距离和病理射线照片的最小距离计算。每个地区的系统计算在图像: 在正常组正常摄影吗和病理病理的集合。的值可以解释为票正常或病理;应该获得高负值区域与正常样本和类似的积极价值高非正规的样本。因此,24的一组值,提供信息,必须在最后一个分类。为此提出了三种不同的方法:(1)GDAV:更大的差的绝对值。这种技术由获得最大的价值对所有在。如果相应的是一个负数,那么形象吗被归为正常;否则,它被列为病理。这种方法认为,该地区有更大的区别是包含的大部分信息的一个问题。(2)DV:离散投票。在这种情况下,所有地区导致最终的分类。每一个的标志被认为是一个正常投票(负号)或病理学(积极的迹象)。得票最多的类提供了最终的分类。(3)简历:连续投票。DV方法的一个潜在缺点是,相关信息可能会丢失当离散化的值。为了避免这个问题,简历需要之和。如果金额是正的,形象被认为是病理,否则正常。事实上,最优决策阈值不是0,但它可以稍微有偏见。这个阈值决定了假阳性和假阴性错误之间的妥协。
这三种分类技术假设所有图像的区域有相同的信息的问题。然而,这种情况不可能如果一些地区比其他人更判别。因此,我们研究了矩阵的使用重量感兴趣的每个地区的相对重要性。它被称为歧视矩阵和可以被定义为一个函数真正的值从0到1,在。这些重量是相同的训练数据集。当使用歧视矩阵分类时,所有的替换的产品。上述三种分类器的评估使用加权值和不使用它们。
3所示。结果与讨论
48集数字胸片(25正常和病理23日)中所描述的部分2被用于实验验证该方法。测试程序执行一个分析的过程,它包括从数据集中删除一个图像,,剩下的图像作为训练集,。图像分类与使用LBP直方图和上述6个分类器(GDAV、DV、简历;使用矩阵)的歧视。如果预测类是不同于真正的类,还有一个分类错误。这个过程被重复所有可用的图像。的成功率分类器的定义是正确的数量分类图像对图像的总数。
3.1。实验结果
所有分类器获得的成功率验证实验的技术展示在表1。这些结果表明男性、女性和使用所有的个人。
我们也有兴趣学习投票方法中的阈值的影响。图7显示一个图形的比较三个分类器,有或没有权重矩阵,对DV和CV方法使用不同的阈值。
3.2。讨论的结果
在二元分类问题,目前,预期的完全随机分类器的错误率为50%。一些实验的事实,例如,在男性GDAV方法子集,产生更高的错误是一个解决问题的复杂性的证据。除了问题的隐式困难,可用少量图片的带来了额外的挑战。得到样品的所有可能的变化性、年龄、病理,等等,一些成千上万的射线照片将是必要的。例如,一些分类表1产生更好的结果比只有全套男性/女性集。
没有一个方法显然产生最好的所有的测试精度,尽管投票方案,DV和简历,通常获得更少的错误率。图7显示正确的阈值选择,特别是在CV方法中,可以极大地影响其有效性。在简历中,最佳阈值附近似乎是0,因为它预计将。
关于使用或不歧视之间的比较矩阵,有很强的证据表明,在结果中使用它有一个很大的好处。几乎所有方法应用矩阵的权重,获得显著改善,平均高出21%的准确性。最好的结果是获得了CV方法,给予87%的正确分类。考虑到所有图像,最优分类器与歧视DV矩阵,生产79%的准确性。
相关限制我们的数据集,在可用的领域的异常不明显病理图像;实际上,这些射线照片可能包含许多正常的地区。这实际上阻碍了正常的区别。改善通过使用矩阵显示的歧视这个问题的结果有很大的影响。更大的好处可以如果病理领域获得精确标记训练样本。
3.3。假设检验
在本节内,信息提供过程之后进行一个实验调查如果正确的比例情况下的分类是相同的所有分类器(GDAV、DV、简历)。本研究提出以下假设:(H0)零假设。分类器GDAV, DV,简历也同样有效。(H1)备择假设。有一个分类器GDAV有效性差,DV,简历。
选择的指标来衡量分类器效果是正确的检测(正常/病理学)。因此,分类器效果是因变量,分类器是独立的变量。由于因变量是二分,科克伦的采用非参数统计检验来验证,如果三个分类器相同的效果。
表2显示了结果采用SPSS 19.0统计软件包。基于观察到的重要性水平,我们可以拒绝零假设;有统计上显著的差异,对于正确的检测分类器,设置所有 (矩阵)和歧视。然而,科克伦的测试并没有发现任何差异的三个分类器(值高于0.1)在所有其他情况下。
4所示。结论
新方法检测正常/病理学在胸部摄影。我们的方法是基于枸杞多糖作为一个简单但强大的纹理描述符。LBP直方图不同的肺区域进行分类,然后结合产生最终的分类。不同的组合方案进行比较,统计分析发现,在某些情况下存在显著差异。
一般来说,使用一个歧视矩阵产量平均提高20%左右的成功率。这一事实表明,并不是所有的地区都有相同的病理检测的重要性。此外,当一个病理学检测,获得的距离可以用来识别地区最异常的概率。这可以帮助医疗专业人士,可以在可疑区域中心注意力。
获得的最佳分类器成功率接近90%。有明显改善的一个重要优势,自开发系统是一个原型为研究目的。为了引入医院的背景下,需要更好的精度。提议的方法的一个缺点是,它需要大量的图片,为了有足够的样品所有表象的不同性别、年龄、种类的病态,等等。因此,需要大量的胸片改善结果。此外,正如上面所讨论的,这些照片应该标记与病理学领域更精确。方法的另一个限制是它只依赖于纹理信息。某些类型的疾病,例如,影响图像的强度,不会被发现。为了克服这个问题,其他的图像描述符可以应用的结合,如扇区特征或深度学习的方法。在任何情况下,我们必须记得,这些系统被设计用来帮助放射科医生,不要代替他们。
相互竞争的利益
作者指出任何潜在的利益冲突。
确认
这项工作是支持的西班牙MINECO,以及欧洲委员会费德基金,资助下tin2015 - 66972 - c5 - 3 - r和tin2015 - 70259 c2 - 2 r。