文摘

细胞核的分割和量化分析的两个非常重要的任务组织学图像。细胞核分割的准确的结果往往是适应多种应用,如检测癌细胞核和重叠细胞的观察事件发生在伤口愈合过程中人体。在本文中,一个自动entropy-based阈值分割和量化系统细胞的细胞核基质提出了彩色图像。拟议中的转化计算系统旨在整合临床洞察力和计算分析通过识别和分割在组织学图像感兴趣的对象。感兴趣的对象和背景区域自动区分动态地确定最优阈值3颜色组件的输入图像。熵的阈值决定通过计算基于像素的颜色强度概率分布和空间相似的像素强度在社区内。提出了系统测试的有效性在21个组织学上彩色图像包含大约1800个细胞核,和算法的总体性能被发现是有前途的,准确度和精密度高值。

1。介绍

显微镜图像分析是最基本的目标之一在免疫组织化学领域。组织学检查的主要任务参与分析组织部分细胞核染色计数,检测异常细胞核,并在目标细胞抗原的存在。结果来源于这些分析是临床最常用来帮助诊断广泛的病态。在过去,病理学家完成这些任务的手动测量;例如,总细胞和异常细胞的量化是通过人工手算。这些手工方法不仅费时,但他们产生的结果往往容易受到人为错误导致的不一致。然而,由于最近的显微成像技术和计算机图像处理技术的发展(1),对转化有显著增长的研究计算系统能够探测、分析、分类、量化细胞核从微观图像。适应鲁棒自动图像处理技术为主要任务,如细胞核分割和量化时间不仅会被证明是有效的为病理学家,但这些技术也将能产生一致的结果。

近年来,许多图像处理技术提出了细胞核分割(2]。虽然有些技术只有执行任务的细胞核分割和量化技术能够进一步的检测和分类异常肿瘤(细胞核)导致各种类型的癌症也被提出。细胞核分割算法将非监督颜色聚类、形态学操作和局部阈值提出了区分癌和非癌变区域在组织学上彩色的图片然后段集群细胞核(3]。k - means聚类实现为无监督细胞核分割在颜色聚类技术4]。另一种方法,使用轮廓检测和轮廓优化结合局部梯度信息和颜色反褶积已经被用于检测细胞核分割的最优阈值(5]。Entropic-based细胞核分割阈值方法提出了小王和Gudla et al。6,7]。

流行的技术在图像处理领域被称为区域增长结合graph-cuts-based算法,混合拉普拉斯算子的高斯(日志)过滤检测细胞核8]。内分泌细胞细胞核染色是由连续的阈值分割算法,使用支持向量机(SVM)类型的人工神经网络9]。基于adaptive-attention-window——(AAW -)的细胞核分割技术,提出了利用四叉树分解的Ko et al。10];的大小AAW动态适应输入图像中感兴趣的区域,最后细胞核分割在每个AAW执行。直方图分析和最优局部阈值随后形态程序段不同的细胞核内发现膀胱和皮肤组织(11]。分水岭分割和自适应阈值方法也广泛用于实现自动分割的细胞核12- - - - - -15]。辛格等人提出使用前馈反向传播神经网络的分类分段细胞核分为两类:良性和恶性乳腺肿瘤(核);提出的神经网络也能够分类检测恶性乳腺肿瘤1型、2型和3型(15]。

上面的出版物的选择充分体现了广泛的图像处理技术和实际诊断应用程序包含细胞核分割在免疫组织化学的范畴。完善细胞核分割和微分免疫染色技术已被证明是如此宝贵的癌症领域正在应用于伤口愈合的研究领域(16]。感兴趣的注意的是,许多的特点和细胞功能体现在癌症中还发现伤口愈合(3]。新的研究策略探索人类现在伤口愈合,允许特定的细胞类型的深入调查,参与高度精心策划的事件发生在组织损伤和修复(4,17]。这种转化计算医疗系统的发展,并将提供宝贵的见解认识伤口愈合过程的复杂性18,19]。

在这个领域的大量研究也强调需要自动计算系统细胞分割技术,准确和可重复的结果。然而,细胞分割的任务仍然是最具挑战性的任务之一在生物医学图像处理主要是因为组织学标本用于二维图像采集过程部分的三维组织样本(8]。从二维图像获得组织学标本通常包含细胞分布不均的颜色强度、弱边缘,甚至不完整的细胞核。这是一些关键特性的微观组织学图像由于健壮的自动化的细胞分割技术的发展仍然是一个挑战。概略介绍分水岭分割技术依赖于自动检测标记的位置进行准确的分割,然而,检测的任务标记的数量和他们的位置不是微不足道的,分割结果通常是显而易见的。简单的边缘地区表现良好,并有很强的边缘检测技术,但往往导致较差的地区分割或定义糟糕的边缘。活动轮廓或蛇方法较差的细胞核边缘上表现的比较好,但是这些技术往往需要监督或优化配置文件参数设置与先验信息(20.]。因此,需要一个自动分割系统,提取细胞不需要任何用户输入的信息。

阈值技术相当简单,但仍然有效;它们广泛用于组织学图像的分割,因为这些图像中的感兴趣的区域区分从其他组件的视觉特征,如颜色和质地(21,22]。entropy-based阈值算法提出了使用像素的颜色强度信息和像素之间的空间相关性强度值段细胞核。该技术领域的组织学图像分类成对象(细胞核)和背景区域;所有像素强度值更大(或小)比全局阈值被分组为对象,而其余像素分类为背景。大多数上述技术通常执行细胞核分割组织学图像彩色的苏木精和伊红染色()),而该entropy-based阈值算法部分细胞核从彩色图像)和三个应用特定的细胞表型。内皮细胞谱系被确定血小板内皮细胞粘附分子的存在集群分化31日在细胞表面(CD-31);巨噬细胞功能的细胞被发现的一个特定的胞质粒中发现巨噬细胞叫做cd - 68;和收缩功能细胞表现为细胞内alpha-smooth肌肉肌动蛋白的存在(SMActin)。

以下部分解释了图像采集和组织程序参与准备测试数据集。部分3彻底解释所涉及的方法和数学公式的计算提出了技术。部分4提出了通过测试的结果提出分割技术在21免疫组织化学染色图像的数据集,最后结论和未来的工作简要讨论的部分5

2。数据准备

测试中使用的数据集的算法包括21个免疫组织化学染色图像。从人体组织获得的图像数据集的部分来自PTFE(聚四氟乙烯)扩大管,5,7,植入后14天(5]。描述的图像采集过程中执行及时表示4种重叠阶段:止血,炎症扩散,重塑发生在简单的急性伤口的愈合过程。与生物标记和一些相关的4个阶段不同但是重叠的细胞事件,可以通过改变观察的特性,如细胞核的数量和大小的平均细胞核组织切片。

组织收集和组织学染色程序参与准备数据集如下。使用酒精和聚乙烯吡咯酮碘局部杀菌、植入的消毒,使用3 cc利多卡因麻醉没有肾上腺素(1%)。5、6.0厘米、多孔PTFE(聚四氟乙烯自定义概要铝型材,坦佩AZ)管被植入皮下注射到健康志愿者的上臂的内在方面的话题。标准化的位置是由一个5.5厘米中空的皮下组织近端方向。使用无菌14号套针含有聚四氟乙烯管,皮肤被刺破,外科用套针插入皮下注射通过皮肤产生5.5 - -6.0厘米。套针被移除,聚四氟乙烯管的近端和远端端缝合皮肤使用单个5.0尼龙缝线。植入网站抗生素软膏和一个透明的外科敷料覆盖。14天,聚四氟乙烯管移除并存储在10%福尔马林。伤口组织包含在固定的聚四氟乙烯管加工和嵌入在石蜡,和5微米部分使用标准化的组织学技术准备。积极的和消极的控制部分包括确保可再生的染色。 Hematoxylin & Eosin (H&E) stain was used to highlight the cellular components, and standard immunostaining techniques were used to identify endothelial cells (CD-31), macrophages (CD-68), and contractile cells (α-SMActin)。

派生的组织部分检查使用蔡司LSM NLO 510元/多光子激光扫描共焦显微镜。共焦成像,488、561和633 nm激光线用于样本成像。使用连续照明(即图像采集。,one laser per channel) to avoid signal cross-talk amongst channels. The images were collected using a 63x/1.4 n.a. oil immersion lens (for single photon confocal imaging) or a 63x/1.2 n.a. IR water immersion objective (for multiphoton imaging). The human study was carried out under the approval of the Institutional Review Board of Virginia Commonwealth University, School of Medicine (IRB number 11087).

3所示。方法

本节提供了一个深入的解释提出entropy-based图像分割技术。图的流程图1说明了细胞核分割过程所涉及的步骤。该算法由四个步骤;图像预处理,entropy-based阈值、后处理和细胞核量化。

3.1。预处理

免疫组织化学染色的输入图像的预处理 从后台删除过程开始。后台删除过程消除了所有的空格(背景)捕捉到的图像 由于空间出现在显微镜幻灯片。

虽然有几个选项对颜色空间中图像的处理可以执行,对于这个项目细胞提取主要是表现在RGB颜色空间。YCbCr等其他颜色空间,实验室,和HSV进行测试,在RGB颜色空间比较一致提供了最好的结果。这是因为目标是提取细胞结构基于图像中的颜色信息,因此图像内的不同生物对象的区别。后台删除过程首先将RGB彩色图像 到它的红色、绿色和蓝色组件生产3颜色分量图像 , , ,分别。组件的本地范围的图像 , , 然后通过计算范围中包含的每个像素的值 , , 。这个操作的结果收益率三个输出图像 , , ,每个输出像素的价值是其本地范围值,也就是说,像素值的最大值和最小值之间的差异在一个3×3附近周围像素的输出。接下来,图片 , , 相乘,然后生成图像转换为二进制掩码 。值为1的像素的面具 代表感兴趣的区域,和像素值0表示消除输入图像中的空白。图像 通常包含的组件通过中值滤波消除孤立的像素。最后,图像 分别增加到 , , 生产三个颜色分量图像 , , 。RGB图像组成的图像 , , 代表只包含细胞核的染色组织切片。背景去除过程的结果见图2

一个受欢迎的直方图均衡化技术对比有限的自适应直方图均衡化(CLAHE)然后使用及形式增强彩色分量图像的局部对比度 , , 。照明和照明条件非常重要在显微图像的采集和这些条件不一定是相同的在每一个微观的设置。不同层次的照明条件通常可以导致图像像素的灰度分布的差异(23,24),因此,CLAHE中使用该算法对均匀平衡不同灰度分布在任何免疫组织化学染色的输入图像。

CLAHE,对比度增强本地执行在小区域称为“瓷砖”,每个块的直方图均衡提供更好的整体视觉区分目标对象(细胞核)和背景(细胞间物质)。此外,使用CLAHE确保染色细胞核组织切片中增强的均匀,从而准确地识别细胞核无论染色过程的影响不同。操作的直方图来源于CLAHE选择保持统一的形状。计算的算法是基于香农熵的熵,信息净值的计算在5-by-5社区整个形象;瓷砖的数量CLAHE操作的选择接近的总数5-by-5社区出现在输入图像。一旦进行对比度增强 , , ,一系列的概率和每个组件上执行图像熵计算来确定细胞核分割的最优阈值。

3.2。Entropy-Based阈值

CLAHE后进行3个颜色分量图像,下面描述的阈值技术应用于每个组件的形象。拟议中的entropy-based阈值方法有3个步骤:计算颜色组件级别的空间相关性(CCLSC)直方图,计算对象和背景的概率,并计算对象和背景熵。每个颜色分量图像阈值获得一旦所有的计算。所涉及的数学计算每一步将在以下小节中描述。

3.2.1之上。计算CCLSC直方图

的entropy-based阈值技术依赖于CCLSC直方图的修改版本的直方图灰度级空间相关性(25]。两个概率分布的计算所需CCLSC直方图,每个颜色分量图像的直方图分布和像素社区内部的相似性指数分布如下定义。

表示一种颜色组件输入图像的大小 有一个颜色强度值 为一个像素位于坐标 在图像 。所有颜色强度值的集合用 。相似性指数 一个像素位于 计算通过确定周围像素强度值的数量在一个 不同的像素的强度值 。相似度指数计算 像素的地区, 是一个积极的奇数和 是一个数字0到吗 。值的选择 取决于输入图像的特征。较小的值 工作在较低的图像的放大,如10或20 x,和更大的 值较高的工作更好的图像放大。值 都是根据经验选择5这个算法的实现。相似性指数使用空间关联信息的像素强度值保存重要的图像信息,如细胞核的边缘。对象和背景区域往往高相似度指标,而图像的特征,如边缘产生不连续的社区,因此降低相似性指数。

然后计算相似性指数在每个像素周围,和相似的程度是基于像素强度值之间的差异位于中心的 邻居和其他所有像素的邻国。最低的相似性计算,任何社区可以是1,也就是说,没有其他像素值在一个社区 不同中心的像素的强度值的相似性指数1。在任何 附近的地方 是一个奇数,颜色的像素强度值位于附近的中心可以用吗

相似性指数 对于一个 附近是数学表示为 然后计算CCLSC直方图结合颜色分量的直方图的概率分布图像和社区的相似性指标的概率分布。的CCLSC直方图 在数学上定义为 在哪里 是一个值的设置 是一种相似性指数,可以值的范围吗 。规范化CCLSC直方图 然后计算 一旦CCLSC 已经计算出来了,它用于确定对象和背景颜色分量图像的熵。图3显示了一个实例的曲面图CCLSC直方图。

3.2.2。对象和背景概率分布

对象和背景熵的计算需要概率分布与图像相关的对象和背景区域以下列方式衍生出来的。一个阈值 段需要一个图像的对象从它的背景, 年代价值选择,这样它分区的颜色强度 到两个子集, 。让 是像素值的集合表示的对象,并让 是一组代表背景区域的像素值。的概率分布表示为图像的对象 和分布的背景 在哪里

3.2.3。计算的对象和背景熵

在前一节中描述的概率分布是用来计算对象和背景熵。根据香农熵的原理,测量的不确定性来源从获得的信息从源的净值。噪声和边缘等特征和较高的熵值关联起来,因为他们之间产生不连续产生更多uncertainity的对象和背景图像,也就是说,网络信息。正如节中提到的3.2。1,背景和对象区域通常有较高的相似性指数的值( ),而边缘通常有值,躺在中期范围的集合 。熵权函数是用于计算分配更高的权重相似性指数,这些指数的范围通常代表细胞核的边缘。重量方程是 在哪里 是一个积极的奇数和 是一套的数量 。图4说明了权函数的重点对象和背景熵值的计算。

熵的对象 是计算 熵和背景 是计算

经过计算的熵函数 最大化收益的最优阈值 将用于段输入图像的目标对象(细胞核)的背景。这个函数 表示为 是由

3.2.4。Thresholding-Based分割

执行前一节中描述的过程在图像预处理 , , 收益率3输出阈值 , , 。3阈值用于段红色,绿色和蓝色像素组件代表细胞核的图像 , , ,分别。

实验观察到,在组织学上彩色图像的像素代表细胞核组成的低强度值的红色和绿色分量图像和高强度值蓝色分量彩色图像。因此,所有像素 有强度值低于阈值的输出 被认为是细胞核,而所有像素 强度值大于 被认为代表了细胞核。在分割的过程中,三个二进制图像 , 构造中所有像素视为对象 , , 内的各自位置上,价值为1的二进制图像。代表不同的背景区域像素值为0。二进制图像 , , ,然后相乘生成一个二进制图像 这只包含分段细胞核。为了获得由此产生的细胞核分割的原始颜色,图片的颜色组件 , , ,分别增加到二进制面具 ;由此产生的红、绿、蓝颜色分量图像然后结合产生一个图像 在RGB颜色空间中分割的结果的过程。在这一节中描述的程序见图5

3.3。后置处理

图像 从分割过程获得包含提取的细胞核,但它也包含不需要的噪声,由于发生相似的颜色强度的细胞和其他非细胞的区域。后处理过程试图移除大部分的不必要的噪音,这样的结果细胞核量化包含更少的假阳性。过程由两个步骤,首先,形态称为填补的技术是应用于所有3颜色组件的图像 。填补操作是有用的在维护一些细胞核的结构细节,可能已经失去了在分割的过程中。

第二步后处理的形象 中值滤波。中值滤波是一种非线性操作,被广泛用于减少图像的椒盐噪声。中值滤波是每个颜色组件层上执行 。中值滤波后图像 去噪,并准备细胞核量化。填补和中值滤波操作结果可以观察到在图6

3.4。细胞核量化

为了量化细胞核,位图像 首先转换为灰度图像,然后到一个二进制图像使用大津阈值方法(26]。转换为灰度图像可以代表双峰的方式以获得大津阈值。每个连接组件的像素代表一个细胞核在生成的二进制映像然后计算产生一个图像内细胞核总数。从测试的结果并给出了算法在以下部分。图7说明了预处理的结果,entropy-based阈值,和后处理步骤输入图像。

4所示。结果

结果通过测试该自动分割技术在数据集21免疫组织化学染色的图片展示在表1

测试数据集包括21个图像属于一个病人使用苏木精和伊红染色(圆))染色,集群分化31日(CD-31)集群分化68 (cd - 68),或alpha-smooth肌肉肌动蛋白(α-SMActin)。细胞核从21日测试图像被病理学家手工手工统计,从手动过程所得到的测试结果进行比较,结果自动生成的分割技术。的定性和定量有效性提出了该算法的性能通过其精度、准确性、敏感性和特异性。图像获得使用40 x放大通常含有更多的噪声分量,也就是说,连接的像素并不代表小组细胞核,比获得的图像使用60 x放大。这是由于一个事实,即40 x图像呈现一个面积较大的组织切片染色的颜色通常是表示在小非细胞的区域。额外的噪音影响分割技术的精度,这效果可以观察到表1对于一些40 x CD-31和cd - 68彩色图像。因此,它是理想的使用图像捕获在更高的放大算法,他们将获得的结果与更高的准确度和精密度。真正的底片在这项研究中,正确识别噪声组件的数量,是由细胞核总数之间的差异量化前后图像的后处理步骤。提出的分割算法的整体准确度和精密度根据细胞核总数分别为95.55%和91.27%,分别。灵敏度高,96.45%,特异性值,95.07%,通过细分技术的性能表明,该方法是有效的细分细胞核而准确地识别、区分,消除大量噪声的分割图像。

相关的细胞分割方法相比,基于形状稳定性(20.),该方法优于细胞提取的质量和计数的精度情况下用给定的数据集。以确保该系统对数据集执行好,染色使用不同的程序,测试系统也在额外的癌症细胞的免疫组织化学染色图像由团体主办在网上从事生物医学成像研究[27]。分割结果密切匹配的准确度和精密度达到上述的结果。

5。结论和未来的工作

小说转化计算系统提出了自动细胞核分割和量化。细胞核分割是一个任务,有几个医疗动机从恶性肿瘤细胞细胞核(肿瘤)的检测癌组织图像的观察细胞核内的伤口愈合过程的描述人体。拟议的系统使用一个entropy-based阈值技术产量3最优阈值用于部分细胞核图像的RGB颜色空间。entropy-based计算为基础的概念引入25];然而,该算法引入了新的方法,如背景去除预处理步骤中,噪声去除后处理步骤,修改CCLSC直方图。该技术生产高度准确和精确的结果是一致的细胞核量化;这项技术克服了现有的耗时的手工细胞量化方法的局限性和使用在病理学家也有巨大的潜力。未来的工作将针对提高该算法的准确度和精密度的识别和分类以及对各种类型的细胞核,如成纤维细胞和巨噬细胞免疫组织化学染色图像分割。

确认

弗吉尼亚联邦大学复活工程科学中心(VCURES)和生物医学信号与图像处理实验室的弗吉尼亚联邦大学的计算机科学系工作提出了支持。