文摘
我们提出一种基于RGB的战略组合dual-threshold方法和HSV颜色空间白细胞(WBC)分割。该方法包括三个主要部分:预处理、阈值分割和后处理。在预处理部分,我们得到两个图像进行进一步的处理:一个contrast-stretched灰度图像和一个H分量图像HSV色彩空间转换。在阈值分割部分,dual-threshold方法提出了改进传统single-threshold方法和黄金分割搜索方法用于确定最优阈值。的后处理部分,利用数学形态学和中值滤波降噪和删除不完整的白细胞。该方法测试在分段上的淋巴母公共急性淋巴细胞白血病(ALL)图像数据集。结果表明,该方法的性能优于single-threshold方法独立地执行在RGB和HSV颜色空间和整体单一的白细胞分割精度达到97.85%,显示出良好的前景在随后的淋巴母细胞分类和诊断。
1。介绍
自动白细胞分割中扮演一个重要的角色在自动血细胞形态学分析仍然是一个具有挑战性的问题,因为白细胞的形态多样性和血液显微图像的复杂背景。在本文中,我们关注的焦点是分割lymphoblast-one从急性淋巴细胞白血病异常白细胞图像分类。
急性淋巴细胞性白血病,也称为急性淋巴细胞白血病,是一种严重的生产过剩和连续乘法血症为特征的恶性,不成熟的白细胞(称为淋巴母或爆炸)。如果不及时治疗将是致命的爆炸”迅速蔓延到血液中及其它重要器官。幸运的是,疾病的早期诊断很有帮助,有利于病人的恢复,特别是在孩子的情况(1]。
根据工厂(French-American-British)分类标准建立在胚细胞的形状和模式变化,都可以分为三种类型:L1, L2和L3(数字1 (b)- - - - - -1 (d))[2]。准确的分类可以为治疗提供医生有用的信息选择和后续工作计划。显微镜检查血液涂片通过计算不同类型的白细胞是其中一个最经常进行血液检测的血液学家(3]。几十年来,操作是由经验丰富的操作符。然而,这是一个耗时且乏味的工作。此外,诊断结果总是倾向于主观和不精确,也很难被复制。
(一)
(b)
(c)
(d)
作为替代,白细胞的自动识别技术以低成本、同质的准确性得到了越来越多的关注在血域相关疾病的诊断。总的来说,该系统由四个部分组成:白细胞分割,特征提取,分类和计数。从分割结果的准确性直接影响分类和计数,它已成为一个非常热门的话题在临床诊断(4]。
一些工作在微观的白细胞图像分割可用文献[3- - - - - -25]。方法可以分为三种类型:基于阈值的方法,模式实现方法和可变形的基于模型的方法。基于阈值的方法包括大津法(4- - - - - -6),该地区日益增长的方法(7],分水岭方法[8- - - - - -10,他们的组合11]。Cseke [4)提出了一种快速自动选择阈值,阈值分割方案用一个简单的递归方法来源于最大化之间的组内的方差黑暗,灰色,和明亮的地区基于大津提出的方法。该方法适用于核和背景分割。然而,它不能单独的血红细胞的细胞质中。吴et al。6)开发了一个基于循环迭代大津阈值的方法对白细胞直方图分割使用H&S组件的HSI模型。实验结果表明,该方法成功地在白细胞核的分割,但失去了细胞质的信息。Dorini et al。11)白细胞分割过程分为两个步骤。在第一步中,他们中提取细胞核森林使用分水岭变换的图像变换(IFT)。然后,他们分割白细胞胞浆使用基本操作如阈值和形态学开通过红细胞的大小分布信息,但该方法往往会产生oversegmentation噪音的存在。
白细胞显微图像中可以被视为对象,模式识别方法也用于执行分割可分为监督和非监督(12]。使用上优于监督分类方法对象的方法,如支持向量机(SVM) [13)和人工神经网络(ANN),也称为无监督方法主要包括聚类方法——聚类(14- - - - - -16),模糊——(17),采用提取对象从数据本身。在[13),郭等人提出的多光谱成像技术与光谱标定方法获得与设备无关的图片,然后直接支持向量机应用于每个像素的光谱段整个微观图像分成四种类型的区域:细胞核,细胞质,红细胞和背景。分割的结果是令人满意的,但实现的速度需要提高。
可变形的基于模型的方法可以分为基于轮廓参数模型和几何模型表示。除了水平集方法(9),活动轮廓模型也称为蛇是最常见的(18,19]。在[18],柯等人提出了一个新的白细胞图像分割方法使用逐步合并规则基于均值漂移聚类和边界删除规则与梯度向量流蛇(预防)。删除规则用于消除边界和噪声边缘养狐业蛇时被迫变形细胞质边界边。由于疲软的细胞质和背景的区别或红细胞表面接触,一些实验结果略oversegmented。其他分割方法对白细胞除了上述三类形态操作(3,11,20.[],混合方法9,10,19,21),等等。混合方法结合上面提到的两个或两个以上的方法来实现更好的结果,如结合实验室基于彩色空间分割法和灰度阈值法(21)和组合的大津法和主动轮廓法(19]。
一般来说,白细胞分割的最终目标从复杂背景中提取整个WBC和段每白细胞形态组件(如细胞核和细胞质。上面提到的方法中,基于RGB颜色空间的阈值方法是使用最广泛的因其效率高和可靠性。然而,细胞质中有一个大的方差及其颜色图像背景非常相似。因此,在此前的许多作品中,基于灰度图像的阈值方法只利用核段(数字2(一)和2(d))。胞浆提取(图2(c)),需要其他辅助分割计划(19]。更重要的是,除了single-threshold-based分割方法,细胞核和细胞质分别分成不同的方法在许多其他细分方案(3,8,9,11,18]。促进胞浆通过基于阈值的分割方法,一些研究者将注意力转向等改变了颜色空间的分割HSV (22,23],恒生指数[24),和实验室21]。作为一个例子,Eldahshan et al。22]提出部分白细胞从其背景使用基于HSV颜色空间的色彩通道single-threshold方法。结果表明,该框架适用于统一的图像(图2(b)),但不一致的图像在光照变化(图2(e))。
在本文中,我们提出一个通用方法部分白细胞(包括细胞核和细胞质)从图像背景无论照明变化通过有效结合基于RGB颜色空间的single-threshold方法和基于HSV颜色空间的single-threshold方法构造一个新技术,这是叫dual-threshold方法克服弱点组件的方法。这样,细胞质可以进一步被减去细胞核分割,可以通过各种直观的方法如大津法(6),——聚类(14从上面的结果很容易。但是,它不包括在本文。确定两个阈值的价值,黄金分割搜索方法被选中。最后,除了定性评估,我们也做一个定量的比较我们的方法有两个single-threshold-based方法,分别实现了在RGB和HSV颜色空间(23)的一种广泛使用的评价指标在图像分割领域DSC。
本文的其余部分组织如下。节2,我们精心制作的完整方法dual-threshold算法。节3,我们描述一个评价该方法的准确性和鲁棒性。节4,结束的话。
2。材料和方法
2.1。方法的概述
拟议中的dual-threshold方法包括三个阶段:预处理、阈值分割和后处理。图3概述了提出的方法。在预处理阶段,我们得到两个图像进行进一步的处理:一个contrast-stretched灰度图像和一个H分量图像HSV色彩空间转换。阈值分割阶段包括三个主要步骤:图像背景提取、血红细胞分离,和最优阈值的选择。在背景提取步骤中,基于RGB颜色空间single-threshold方法,在红血细胞分离步骤中,H通道图像基础single-threshold方法是利用。最优阈值选择部分,使用黄金分割搜索方法。最后,在后处理阶段,利用数学形态学和中值滤波降噪和删除不完整的白细胞。整个过程可以概括为以下五个步骤。每一步的细节下面。
步骤1。给定一个输入图像,得到灰度图像G和H分量图像H从HSV色彩空间转换。
步骤2。做对比拉伸操作G,然后使用阈值Thresh1提取图像背景所示黑G′(图3)。
步骤3。通过阈值Thresh2,单独的血红细胞H(合成图像是H′)。
步骤4。得到一个灰度图像相交G′H′年代。
第5步。二值化、形态学腐蚀和中值滤波进行年代其次是最大连接区域(MCR)提取二进制图像,填满小洞,狭窄的缝隙连接和删除小点以及不完整的图像中白细胞。
2.2。预处理
在这一步中,两个大致图像处理获得了进一步的处理。首先,我们把彩色图像转换成一个灰色(图4 (b))。同时,源RGB颜色空间转换到HSV颜色空间,然后提取H通道图像用H图3从HSV颜色空间。从图4之间的对比,我们可以看到,前景和背景像素的灰度级通常是不够精确的像素进行分类。增加图像的对比,全球对比拉伸(GCS)技术可以分散场景照明使用的范围。gc是由滑动窗口(称为内核)在图像和调整中心元素使用以下公式(25]: 在哪里图像像素的坐标;是输出彩色像素的水平吗从对比拉伸过程;是输入颜色像素的水平吗;最小和最大最小和最大颜色级别值在输入图像。
(一)
(b)
(c)
后GCS(图4 (c)),我们可以看到,在整个图像的对比是平衡的,它更容易看到的图像细节区域最初非常模糊。更重要的是,对比是极大地增强了前景和背景像素应该促进图像通过single-threshold背景提取方法将澄清的在下一个部分。
2.3。阈值分割
2.3.1。图像背景提取
从图2(e),最终分割结果中可以看出,噪声主要来自两个方面:背景和红细胞。以下两个步骤背景提取和红细胞分离都是基于这一事实。在图5contrast-stretched直方图的灰度图像提出了一种triple-modal,分别代表核白细胞,红细胞(细胞质),和背景。现在后GCS、背景有一定的对比图像中与其他组件,它是可行的提取通过single-threshold(标记为Thresh1图5)方法。然而,它一直在介绍,仍然很难单独整个白细胞(包括细胞核和细胞质)从细胞质中也有类似的灰色的图像强度与红细胞。所以我们的第一阶段的方法是提取图像背景黑色,如图所示5 (c)。
(一)
(b)
(c)
2.3.2。血红细胞分离
节2.3。1、图像背景中提取。如果我们能继续找到一个有效的方法去除图像中红细胞,白细胞可以分段轻松减去从原始图像背景和红细胞。因此,我们在这一步的目标是独立的红细胞图像。
颜色空间的目的是促进颜色一些标准的规范(26]。颜色空间通常是由三个或四维矩阵在数学,如RGB、HSV,实验室,CMYK。RGB颜色空间是最常见的颜色空间中使用的电子设备。在这种颜色空间中,每一个颜色都可以通过添加三个原色:红、绿、蓝。一般来说,最初的血涂片染色图像由RGB颜色空间表示RGB模型。HSV颜色空间有三个组件:色调(H),饱和(S)和价值(V),色调代表颜色。在这个模型中,这是一个从0到360度。饱和度表示灰色在颜色空间的范围。它从0到100%不等。有时计算值从0到1。 When the value is “0,” the color is gray and when the value is “1,” the color is a primary color. A faded color is due to a lower saturation level, which means the color contains more gray. Value is the brightness of the color and varies with color saturation. It ranges from 0 to 100%. When the value is “0,” the color space will be totally black. With the increase in the value, the color space brightness is up and shows various colors. The HSV color space is quite similar to the way in which humans perceive color. The colors used in this space can be clearly defined by human perception, which is not always the case with RGB. These characteristics make the HSV color space more suitable for image segmentation and analysis than the RGB model. In Lab color space, L defines lightness, a denotes red/green value, and b represents the yellow/blue value [21]。它被称为设备独立,这意味着实验室色彩空间可以不同的颜色在不同的通信设备。上面的颜色空间可以互相转化为根据相关公式。
在图6血细胞图像的比较,分别在RGB, HSV,和实验室的颜色空间,每个频道形象。从图可以观察到,在大多数单通道图像(如G - S - L - b通道),细胞质中也有类似的灰色与背景强度和红细胞,很难通过大津红细胞和背景分离的方法除了H通道图像,核和细胞质中也有类似的灰色强度一定与红细胞。因此,为了避免细胞质被移除和红细胞(这种情况在发行渠道,s通道,和一些其他渠道),H通道选择图像去除红细胞在这一步。在图7(一)H通道图像及其直方图。图像中我们可以看到,,,红细胞是最亮的部分。所以我们可以通过一个合适的阈值标记为删除它们Thresh2图。图7 (b)显示了血红细胞分离后的合成图像。
(一)
(b)
2.3.3。阈值选择
该算法有两个参数,Thresh1 Thresh2,,分别用于图像背景提取和红细胞白细胞分类的删除步骤。从contrast-stretched灰色图像的直方图(图5 (b)(图)和H通道图像7(一)),我们可以看到的范围Thresh1和Thresh2可以大致估计通过先验知识。但在具体的算法实现,随机选择阈值,即使他们是在合理的范围内就不能保证任何类型的最优。所以我们制定阈值选择作为一个优化问题和两个变量(Thresh1和Thresh2)倾向于使用一个适当的方法找到最优解。
制定一个合适的目标函数,让我们介绍一下骰子相似系数(DSC)首先,通常是用来定量评价分割效果。在下一节中,我们将使用该方法的定量比较和另外两个分割方案。它被定义为 在哪里是地面实况图像的目标区域的面积是由手动分割图像摘要;目标区域的面积是自动分割的结果图像。DSC在0和1之间变化。越高,表明更好的分割精度。根据这一事实,目标函数我们制定
通过这种方式,优化问题可以被描述如下:让DSC尽可能大通过选择适当的Thresh1和Thresh2。自Thresh1近似范围和Thresh2可以确定,下一步我们应该做什么是找到最优值从所有可能的选择。
黄金分割搜索方法是技术寻找极值(最小值或最大值)先后缩小严格单峰函数的值的范围内的极值的存在。技术它的名字源于事实,该算法保持距离的点的函数值三元组形成一个被称为0.618黄金比例。已经证明,对分法相比,这个值可以使我们获得一个最优的因素减少搜索时间间隔和最小数量的函数调用时寻找最大的点。
假设是一个单峰函数在搜索区域;最大的问题是并假定算法精度。让,在地区两个点和。使用黄金分割搜索算法来确定,包括以下六个步骤(图中给出了算法流程图8)。
步骤1。让最初的搜索区间,让算法精度。
步骤2。让,让,计算。
步骤3。如果,跳转到步骤4;如果,跳转到步骤5;如果,,跳转到步骤6。
步骤4。如果,,停止。否则,让,,。计算;跳转到步骤3。
第5步。如果,,停止。否则,让,,。计算;跳转到步骤3。
步骤6。如果,,停止。否则,跳转到步骤2。
在下一节中,我们将使用这个方法来找到最优的解决方案Thresh1 Thresh2。
2.4。后处理
阈值分割后,白细胞大致可以划分图3)。当时,这仍然是一个灰度图像有一些噪音,所以在这一步中,二值化用于合成图像转换为二进制图像。然后,我们使用形态侵蚀,中值滤波(大小15×15)和最大连接区域(MCR)提取操作来填补小洞,狭窄的缝隙连接和删除小点以及不完整的图像中白细胞。最后,将二进制图像转换为RGB彩色图像,但这不是必须的。
3所示。结果与讨论
3.1。数据集
该方法测试在130年拍摄的图像从ALL_IDB27),公开和免费提供的可用数据集信息技术部门,专门为评估和比较的分割和图像分类算法。数据集的图像都被抓获的光学实验室显微镜加上佳能劲射G5相机。每个图像的数据集,所有淋巴母细胞的分类是由专家肿瘤学家。ALL_IDB包括两个子集:ALL_IDB1 ALL_IDB2。前者是由108个图像包含大约39000血的元素用不同的显微镜的放大,从300年到500年。所以图像背景色(图的数据集可能有所不同9)。后者是一家集裁剪感兴趣的领域从ALL_IDB1细胞正常或爆炸。
(一)
(b)
(c)
ALL_IDB2包含单一的白细胞在每个图像用于测试我们的建议的性能。它有260的图像。上半年是所有患者(淋巴母)和最后一个一半是non-ALL患者(正常的白细胞)。我们的最后一项任务是分类淋巴母分成三个类别L1、L2、L3(图1)有针对性的治疗和随访,所以只有第一个130的淋巴母细胞图像ALL_IDB2担心在这个研究。但实验结果表明,该方法也适用于其他130个图像。两个样品从ALL_IDB1 ALL_IDB2图所示10。子图象可以从multi-WBCs只包含一个白细胞图像通过一个适当的方法(4,6,20.]。
(一)
(b)
3.2。实验结果
我们评估的性能算法可视化和定量这部分。为此,我们找到的最优值Thresh1并通过迭代Thresh2第一黄金分割搜索方法中描述的部分2。两名医生被邀请手动段所有测试图像生成地面真理为目的的评估。
3.2.1之上。阈值选择
在本文的上下文中,我们的目标是找到两个最优阈值,使目标函数值(3)尽可能大。这个函数有两个变量以来,黄金分割搜索方法需要使用几次,以确定各自的最佳值。每一次,其中一个是固定的找到另一个变量的最优值,直到他们都不变。该方法的具体步骤在下面给出。
步骤1。假设Thresh1和Thresh2最优值,分别,。程序操作,初始值设置为230。
步骤2。让,,,,,和计算Thresh1的最佳值通过黄金分割搜索方法。
步骤3。让,,,,,和计算Thresh2的最佳值通过黄金分割搜索方法。如果重复步骤2和步骤3。否则,停止。
请注意(1)上面的数字,230年,0.8,1.0,0.01,150年,255年和5,选择通过先验知识。(2) 是指所有130个测试图像的DSC价值细分条件后获得的吗,(步骤2),(步骤3)。
通过以上步骤,Thresh1和Thresh2的最优值,可以确定。
3.2.2。定性评价
通过以上步骤,最优值,得到了。130测试图像分割结果与手工分割以及基于两个single-threshold方法,分别在RGB (18]和HSV [15)颜色空间。分割的结果被认为是准确的,当一个边界匹配手动跟踪边界。在图11,我们给五个测试图像的分割结果。三种方法进行了在同一形态学结构元素和中值滤波器的尺寸。结果出现在细胞核分割方法1显示了良好的性能,但细胞质中不能分割在某些情况下(1日、2日、4日和5日细胞)。方法2,这段WBC完全在某些情况下(1和2细胞),但没有在其他(第三、第四和第五)。相反,我们的方法3在所有的情况下表现良好。
(一)
(b)
(c)
(d)
(e)
它已经表明,该方法能达到高精度细分单一淋巴母细胞显微图像的数字11。图12表明,该方法在分段上的表现也不错正常白细胞ALL_IDB2下半年的一部分,当多个白细胞存在于一个图像(在这种情况下,MCR后处理步骤应该删除)。
(一)
(b)
(c)
(d)
3.2.3。定量评价
分割性能的一种定量描述在图给出13在DSC的130个测试图像计算值与该方法分割后和两个single-threshold-based方法。可以看出,DSC值通过我们的方法和稳定高于另两种方法在大多数情况下。这些照片在后期的测试图片,方法2有很好的性能,但不能扩展到整个数据集。一直在说数据集部分,在ALL_IDB被不同的放大图像,所以其中的一些在背景颜色不同(图9)。因此,基于H通道图像single-threshold方法不执行。平均值和标准偏差的130 DSCs表1。通过计算,我们可以学习,我们的方法具有精度高2.66%和26.6%在方法1和方法2,分别用DSC平均值指标。与此同时,其标准偏差低于64.38%和93.36%他们认为我们的方法也比其他两个更健壮。
4所示。结论
在本文中,我们提出了一个dual-threshold分段方法从急性淋巴细胞白血病白细胞图像。方法有效地结合了基于RGB和HSV颜色空间single-threshold方法利用互补优势。它由三个主要部分:预处理、阈值分割和后处理。背景和血红细胞图像的分割过程中通过两种不同的阈值提取。实验结果表明,整体分割的准确性可以实现。作为自动白细胞微分系统的第一步,它显示了良好的前景进一步白细胞特征提取,分类,诊断。
相互竞争的利益
作者宣称没有利益冲突有关的出版。
确认
作者要感谢教授法比奥Scotti提供微观急性淋巴细胞白血病细胞图像。这项工作是国家重点支持的科技支持计划(2015 ba101b06)和科学和技术协调和创新计划(2013 ktcq03-09)。
补充材料
ALL_IDB2:公开和免费可用的急性淋巴细胞白血病图像数据库进行图像处理。