文摘

病理分类通过透射电子显微镜(TEM)对某些肾病的诊断至关重要,和厚度的变化在肾小球基底膜(GBM)和免疫复合物沉积在GBM通常用作诊断标准。自动分割的GBM TEM图像通过计算机技术可以为临床医生提供明确的信息肾小球超微结构病变。TEM图像上的“绿带运动”地区不仅是复杂多变的形状,但也有一个低对比度和灰度的广泛分布。因此,提取图像特征并获得优秀的分割结果是很困难的。为了解决这个问题,我们引入一个随机森林——(RF)基于机器学习的方法,即射频栈(RFS),实现自动分割。具体地说,这项工作提出了一种两级综合RFS比一级更复杂的集成射频提高精度和泛化性能。包括培训集成和测试集成的集成策略。培训一体化可以推出全视图 通过同时采样几个不同灰度级范围的图像训练阶段。测试集成可以推出zoom-view 分别由抽样不同灰度级范围的图像和集成测试阶段的结果。实验结果说明,该RFS可用于自动段的不同形态和灰度基底膜。未来研究GBM厚度测量和存款识别将基于这项工作。

1。介绍

原发性肾小球疾病是最常见的肾脏疾病在中国(1]。肾脏疾病的诊断主要依赖于肾活检,这被认为是黄金标准。透射电子显微镜(TEM)结合光学显微镜和免疫荧光检查构成连续的肾脏疾病的病理诊断(2]。TEM允许观察微观结构各种肾小球病变的细胞,在光学显微镜下无法解决。因此从光可以验证和免疫病理学观察超微结构水平(3]。研究发现,超微结构的研究提供了基本的或重要的44.3%的肾活检诊断信息4]。因此,TEM对某些肾病的诊断至关重要。考虑到肾小球的TEM图像的复杂性和相关的病变,是耗费大量的时间和人力的病理学家视觉识别微妙的病理变化,导致一个巨大的工作量。然而,计算机的初步筛选后,肾小球疾病的诊断效率和准确性的帮助下可以提高自动图像处理技术。

许多肾脏疾病的诊断密切相关的肾小球基底膜(GBM) (5]。基底膜和内皮细胞内壁和足细胞外的内壁,形成滤过屏障,让血液过滤,形成尿液,如图1。厚度的变化在GBM和免疫复合物沉积在GBM通常用作某些肾病诊断标准,如膜性肾病与广泛的膜增厚和不同数量的免疫复合物,Alport综合征与弥漫性膜性增厚,和家族性复发性血尿综合症(薄基底膜肾病)“绿带运动”的扩散稀释(6,7]。手动测量厚度的“绿带运动”是早期辅助(8,9),但工作负载非常昂贵。然后,一些半自动软件工具(10,11)是用于获得GBM更快更方便的厚度,但仍需要人工干预。形态的复杂性,提高存款的难度是一样的,甚至比“绿带运动”和文献没有被发现。在实用性、厚度测量和存款自动识别可以实现随后和条件是“绿带运动”地区是完全autorecognized或分割。

早在1993年,Ong et al。12]应用自适应窗口跟踪部分肾小球TEM图像。从那时起,一些半自动或全自动方法被提出。Kamenetsky et al。13)和Rangayyan et al。14)实现GBM分割通过区域划分和动态轮廓建模和测量。吴et al。15]和吴Dikman [16提出了两种方法。一是通过插值获得的中心线GBM人工标记点然后autosegment GBM通过距离映射和低通滤波15]。另一种方法涉及使用阈值和形态学方法没有手动标记(16]。刘等人不仅分段GBM还测量它的长度和狭缝的计数17]。大多数现有的方法上面提到了一些贡献,但仍有许多问题没有解决。这些方法要么需要繁琐的手动初始化,包括额外的工作为病理学家和介绍可能的主观错误,或者他们只能用于部分截断GBM片段增加对比度和单一方向显示在他们的实验结果。因此,确保整个复杂GBM图像分割质量仍然是具有挑战性的。

两个常见的困难与GBM分割是interimage形状变化和intraimage灰度不一致。图1表明低对比GBM段和周围组织,如内皮细胞和足细胞,形成和宽度的变化GBM段autoextracting特性造成困难。除了复杂结构的病理切片,TEM图像的灰度分布很广,因为示例预制和照度不均匀性的不确定性传播成像。

解决第一个挑战autoextracting特性,我们采用pixel-wise分类器,即随机森林(RF) (18),基于机器学习来避免依赖手工的特性。射频是一个委员会弱的学习者(如决策树)来解决分类和回归问题没有手动指定一些功能通过多个决策树的构造和组合和随机选择的属性(19,20.],它可以用来应付复杂的生物图像的结构特点。射频从医学图像处理领域已被广泛研究,特别是检测任务,包括阿尔茨海默病的早期识别或预测(21),肾上腺异常检测(22],和自动心脏分割[23]。

一个增强的基于单个射频分类器的泛化效果很难获得,因为intraimage灰度不一致。为了解决这个第二个挑战,我们提出一个射频堆栈(RFS)模型基于广泛的灰度级范围的图像。将TEM图像分配给不同的灰度组后,我们从所有这些组织和训练样本全视图射频标识符 和多个射频zoom-view分类器 在分割阶段,每个像素的新GBM图像自动分类通过全视图和zoom-view RFS和候选人环节组合和优化结果。因此,提高分割精度通过这两级集成的机器学习方法。

本文的其余部分组织如下。节2,信息GBM图像选择和预处理和提议的细节描述RFS GBM分割模型。节3,实验结果和讨论。节4,给出了结论。

2。材料和方法

2.1。数据和材料
2.1.1。图像数据

肾活检标本立即用冷2.5%戊二醛固定在pH值为7.3与0.1米磷酸缓冲4 h,用磷酸缓冲,后缀为1%四氧化锇在同一个缓冲区,与一系列分级的乙醇脱水,嵌入Spurr树脂。超薄部分(70海里)对比增强了醋酸双氧铀及柠檬酸铅和检查使用日立h - 7500电子显微镜(日本东京)60千伏。所有的部分MORADA成像G3(日本)EMSIS公司5000 x放大。在整个视野,肾小球,包括肾小球毛细血管基底膜,被选中。连续拍摄进行了使用附加数字成像系统和控制的病理图像工作站的南方医院在广州,中国。

2.1.2。TEM图像的预处理

获得的病理学家收集了351张图片肾小球TEM图像建立一个“绿带运动”图像数据库。这351的图片,330人被用作训练集和分成不同的组(N= 37)根据“绿带运动”的范围的强度。在测试集,21图像不同的大小和不同的基底膜类型,如条纹、封闭,以及复合型,。图像的像素被分成“绿带运动”和背景。图2(一个)显示了原始TEM图像,图2 (b)说明了其相应的“绿带运动”二元掩模手动标记的病理学家。

2.2。方法概述
2.2.1。工作流图

射频是一个机器学习方法,它可以应用于图像分割分类像素到目标或背景。拟议中的RFS RF-based多层次集成结构,主要包括两个阶段:分层培训和细化测试。RFS如图的实现过程3

训练阶段:从预先构建的“绿带运动”数据库,一个图像是随机选择从每个图像组具有不同的GBM灰度范围。因此,N图像,即 ,需要一个训练准备。同时采样N图片和后续培训收益 所谓的全视图RFS。然后,NRF分类器, ,由采样和单独训练每个图像生成,然后呢 ,叫做zoom-view RFS,涵盖不同的灰度范围。

测试阶段:测试图像的每个像素分类 和构成候选分割 测试图像的每个像素分类由每个 并得到了N粗分割结果,即 然后,另一位候选人分割 迭代后得到细化方案。选择最终的分割 由于人类的专家。

2.2.2。软件工具

图像处理和分析的软件斐济(ImageJ)是由美国国家卫生行政和FIJI-based二次开发是众所周知的。在本文中,我们选择了一个斐济插件命名可训练的Weka分割(TWS) (http://imagej.net/Trainable_Weka_Segmentation)[24),这是基于自由开源软件Weka [25]。TWS结合一系列的机器学习算法进行基于像素的图像分割。图4表明,修改TWS和结合Matlab提供的一些图片处理功能来满足GBM图像分割的需要。

2.3。培训
2.3.1。随机森林

射频(23)是一种常见的对集成学习方法的训练算法依赖于装袋集成和随机属性选择建设的决策树。训练一个射频蓝色箭头线如图所示3。引导抽样技术是用于生成 从原始训练集训练子集 决策树模型建立成一个射频。一个射频分割是橙色箭头线如图所示3。单独的测试图像分类的 在RF决策树,每一个决策树的结果是聚合,通过投票最终的输出。在本文中,我们把这一级的集成。

2.3.2。RFS分类器

考虑到GBM各TEM图像的强度明显不同,一个射频标识符不能提取不同灰度特性的TEM图像和分割性能是不稳定的。例如,给定一个射频分类器采样和训练从图2膜见图5(一)可以分段如图5(b),因为相似的灰度图的“绿带运动”5(一)和分类器。一个贫穷的结果是通过使用相同的分类器段膜在图5(c),整个膜碎片几乎是不分段,如图5(d)。

为了解决这个问题,我们介绍了二级集成。我们第一次分配所有训练图像 组根据平均强度GBM地区。然后,建立了rfs。全视图和zoom-view方法被提出。全视图方法同时需要样本 不同灰度级范围的图像。作为 在每幅图像像素采样, 像素样本训练和在同一时间 是获得。 是一个大文件在同一个逻辑形式的射频。由于大量的采样像素和树的深度有限,我们可以假设栈叶节点形式。

zoom-view方法分别需要的样本 图像灰度范围进行训练,得到一系列RFs从 ,从而形成 因为每个森林的采样点 是针对图像相似的范围,一个森林的泛化性能是有限的,结果需要集成和完善测试或细分阶段。

2.3.3。实现细节

预先构建的“绿带运动”数据库,TEM图像训练集被分成 根据“绿带运动”的平均强度组。的平均强度“绿带运动”从73年开始Hounsfield单位的强度的步骤3 Hounsfield单位。

TWS有15个适用的特性,和14人被选为决策树的输入摘要:常见的灰度特性(意味着、最小、最大、中值和方差),边界特征(Sobel过滤器,黑森和高斯模型的差异),纹理特征(高斯模糊、熵和Kuwahara过滤器),和其他特性(膜预测,李普希茨过滤器,和邻居)。

其他射频训练参数包括决策树的数量( ),决策树的深度( ),和抽样的数量分图像( )。一些参数的选择进行了探讨4

2.4。分割

给定一个图像分割或测试,两个候选人可以分别得到分割结果 逐像素分类通过全视图 产生一个候选人分割 让候选人的过程 是更复杂的。制备一系列粗糙的结果后,即 ,处理由zoom-view ,的概率地图重建和候选人 可以获得后处理和迭代改进完成后。最后, 由专家评估来确定一个增强的分割。

2.4.1。概率地图

为每个图像像素分割,方程(1)用于重建的概率地图N粗分割结果,即 : 在哪里 粗分割结果的总数, 像素的频率是 行, 列是由每一个标记为“绿带运动” , 是像素的概率 “绿带运动”。

2.4.2。后处理

的概率地图,一个大一个像素的灰度值对应于一个高概率成为“绿带运动”。因此,通过最大化属于同一类别的相似或避免它达到最低,模糊c均值(FCM) [26)算法用于后处理图像划分为“绿带运动”的区域和背景。之后,通过形态学操作,清除了一些假阳性GBM地区可以提取。

2.4.3。迭代优化

并不是每一个粗分割结果 获得 提供有用的信息建设的概率图。在一些极端的情况下,一些粗分割结果是适得其反的概率地图。因此,细化过程中描述的算法1

(1) 粗分割结果与一个明显的错误GBM区域消除预设阈值的基础上
(2) 剩下的 粗分割结果 用于获取概率地图吗 和二元掩模 如部分所示2.4。12.4。2
(3) Jaccard相似 和每个 计算。如果相似度 小于预设阈值 ,相应的 是放弃了。剩下的 分割结果是用来获得一个新的概率地图 和二元掩模
(4) Jaccard相似 计算。如果 , ,重复步骤(3),直到 之前就退出循环。
(5) 循环结束后,候选人的结果 等于 是获得。

6显示整个细分的过程 ,包括(1)37射频分类器,(2)概率图,(3)后处理,(4)迭代改进。

2.4.4。手动交互为最终决定

测试图像的候选分割结果 与病理学家的黄金标准标签。没有黄金标准的新图像,用户可以比较 并做出最后的决定基于以下方面:(1)是否脚过程中上皮细胞或内皮细胞的细胞质是不当的区域中包含的基底膜,因为它的电子密度相似的基底膜(2)牙龈免疫存款是否错误地排除在基底膜因为其电子密度高于基底膜(3)基底膜的连续性应该谨慎分析因为病理性骨折基底膜的缺陷

2.5。评价指标

该方法的准确性是评价Jaccard系数,广泛用于评估分割方法的性能(27- - - - - -29日]。这是一个测量几何相似性定义的 在哪里一个B由人类专家手动分割的结果,该方法。Jaccard值的范围是[0,1]。大的系数值对应于一个精确的分割结果。

3所示。实验和结果

在这项研究中,21个TEM图像具有不同的灰度范围,大小和基底膜形态用于评估。这些图像由病理学家作为黄金标准手动分割。

3.1。验证

RFS方法提供了健壮的分割结果,本研究具有不同形态和灰度范围。 训练与 7对待分割图像显示了来自加沙地带,关闭,并通过使用RFS方法以及复合型基底膜。最上面的一条线显示了原始图像和底线显示相应的分割结果。从图我们可以看到,尽管取向,宽度,和其他形态的“绿带运动”有很大区别,分割的结果相对准确。这三个测试图像显示,Jaccard值高于0.75。

8显示了不同的分割图像灰度范围基底膜。可以看出,大多数的“绿带运动”是准确分割。与射频相比,RFS更好的分割结果。例如,原来的TEM图像如图5(c)与射频分割失败了,但它可以分段RFS,列1所示图8

如数据所示78,尽管基底膜的形态和灰度范围有很大区别,RFS分割的结果是稳定的,表明RFS方法的泛化性能好。未来研究GBM厚度测量和存款将在此基础上识别。

3.2。不同灰度级范围的射频分类器的影响

多层次集成RFS构造分类器,解决泛化GBM分割的问题。这是基于假设,射频标识符,越接近的灰度级范围的图像分割是训练图像,分割效果会越好。热图的实验结果图9证实这个假说。从低到高水平轴代表37射频分类器对应37训练图像的灰度范围。第一个灰度级的范围是[73.5,75.5],第37灰度的范围是[145.5,147.5]。纵轴代表了灰度平均值的“绿带运动”的21个测试图像。测试图像的灰度平均值是78,这是接近的灰度范围的水平1和2。21测试图像的平均灰度145,这是高于37级的灰度范围。

分别在这个实验中,每个测试图像分割这些37射频分类器不同的灰度范围,和相应的Jaccard值显示在不同的颜色。一个精确的分割结果对应于一个高Jaccard价值,和它的颜色变成亮黄色。它可以看到从图的颜色分布9大多数射频测试分类器只是敏感图像灰度范围。然而,如图78RFS能够准确地对段测试图像具有不同的灰度范围意味着射频的泛化性能不好,建议RFS。

3.3。全视图之间的差异 和Zoom-View

完整的多级构造RFS视图和缩放视图,如图3。zoom-view的精致细节 给出了Algorithm1,包括阈值的设置吗 分割结果的Jaccard值为每个测试图像(粉色圆点)通过使用 用三种不同的参数组合列1所示,图2和310,在那里 表明,所有 粗分割结果包含在迭代优化的步骤没有过滤。的Jaccard值通过使用全视图分割结果 列4所示图吗10

10显示全视图 比zoom-view更健壮吗 不管如何阈值 的平均值,设置吗 低于 然而,当 ,一些测试图像的分割结果 比这更好的吗 实验数据,最大分割精度是0.85,但最小值几乎是0,所有这些值都通过

的稳定性 主要是由一个大样本训练分类器,涉及 采样点。然而,这种方法的缺点是它的高强度计算。一些低精度 造成的影响 课程细化分割结果的过程。如果大部分的相似度结果与金标准是不够的,一个贫穷的优化的图像。否则,结果是增强,甚至超过 因此,这种方法涉及到选择的最后一步两个候选人之间的分割结果

3.4。后处理和细化的影响

采用以下方法来验证后处理和迭代优化的效果 :(1)投票方法(V),(2)附加后处理与FCM投票结果(V+F),(3)额外的迭代优化的投票结果(V+),(4)额外的迭代优化方法2 (V+F+),即 11显示了均值和方差的方法(1)-(4),全视图 (5),最终结果(6)的平均精度V是最低的。V增加FCM后处理后,进一步提高了迭代改进完成后。最终结果包括最大均值和方差相对较小。

4所示。讨论

4.1。方法构造集合体

整体方法构造一组分类器,然后分类新数据点通过加权投票的预测。Dietterich [30.)认为,五个通用合奏方法存在:枚举的假说,操纵训练的例子,操纵输入特性,输出目标的操纵,注入的随机性。我们采用了两个和发展相应的RFS方法。全视图 操纵训练例子来生成多个假设。考虑到复杂的“绿带运动”的图像,我们样品多个灰度图像进一步增加的多样性假说。Zoom-view 操纵的输出概率图实现集成。迭代优化步骤是写给减少粗分割结果的不利影响,进一步提高分割的准确性。

4.2。选择的参数

决策树的数量是最重要的参数之一RF算法在医学图像分割中的应用(31日]。从理论上讲,与越来越多的决策树算法的分类精度逐渐增加计算成本迅速增加。最优数量的树木应该之间取得良好的平衡的评估指标,处理时间和内存使用量。在这项研究中,决策树的数量实验设置为100。

采样点的数量是RFS方法的另一个关键参数。在我们的实验中,随着采样点数量的增加从200年到2000年每训练图像,RFS分类器的准确率提高了约10%,而不是提高准确率大大如果采样点的数量不断增加。因此,总采样点设置为74000, ,获得最好的结果。

在TWS, 15可用图像特征属性提供了决策树结构。在我们的实验中,应用程序的大部分功能可以提高分割的准确性,但熵(E和各向异性扩散一个)是浪费时间。让13F除了显示其他13个特性E一个;图12显示应用程序的特性一个不仅花费更多的时间,也减少了分割的准确性是否使用分类器 因此,只有14个特征以外的各向异性扩散提出了用于构造决策树的方法RFS。

4.3。该方法的局限性

我们的实验结果显示,该RFS方法获得对某些情况下表现不佳。例如,低对比度图像,准确率的投票几乎是0。唯一的准确率V+达到23%,而其他方法的准确率是20%以下,即使这样的 这样的坏结果大大减少平均RFS方法的准确性。射频可以结合其他模式识别方法更好的性能。陆et al。32)和一个健壮的向量机应用不完整的射频轻度认知障碍的早期识别。这种方法优于另外两个semisupervised学习方法。因此,提高分割的准确性低对比度GBM图像、射频方法与其他方法的结合将是我们未来的工作。

5。结论

整个GBM地区分割的TEM病理图像可以提供更为快速和直观的观察形态学变化和可以减少繁琐和昂贵的手工工作负载的病理学家。这项工作提出了一个两级集成RFS方法涉及培训集成和测试集成autosegment GBM形象。共有351名临床图像包含在实验。RFS方法的精度和泛化能力验证。实验结果表明该方法可以用于“绿带运动”的自动分割具有不同的形态特征和灰度范围。进一步的研究正在进行中,提高分割精度的自动CAD系统和实现GBM厚度测量和存款autorecognition辅助病理诊断。

数据可用性

所使用的图像数据来支持本研究的发现可以从相应的作者。

的利益冲突

作者宣称没有利益冲突有关这篇文章的出版。

确认

这项工作的部分支持由中国国家自然科学基金的资助(没有。81771916)和广东省重点实验室医学图像处理(没有。2014 b030301042)。许多由于由于西域,渊源辽、徐,振兴李和张Zitao参与本研究在南方医科大学和毕业设计做了一些贡献。