文摘
感染疾病名列全球问题的负面影响健康,经济,和社会作为一个整体。检测这些疾病最有效的方法之一是通过分析血细胞的显微图像。人工智能(AI)技术现在被广泛用于检测这些血细胞和探索他们的结构。近年来,深度学习架构已经利用大数据分析的强有力的工具。在这项工作中,我们提出一个深层神经网络处理血细胞的显微图像。处理这些图像是特别重要的白细胞及其结构被用于诊断不同的疾病。在这个研究中,我们设计和实现一个可靠的血样和分类处理系统五个不同类型的白细胞显微图像。我们使用gram - schmidt算法分割的目的。为不同类型的白细胞的分类,我们结合尺度不变特征变换(筛选)特征检测技术与深卷积神经网络。评价我们的工作,我们测试方法LISC和WBCis数据库。 We achieved 95.84% and 97.33% accuracy of segmentation for these data sets, respectively. Our work illustrates that deep learning models can be promising in designing and developing a reliable system for microscopic image processing.
1。介绍
尽管几十年的努力,在控制感染疾病的研究,他们仍在公共卫生领域最具挑战性的问题。据世界卫生组织(世卫组织)、传染性疾病现在世界上最致命的传染病,并列为第四人类死亡的主要原因。他们是全球性问题与人类顶部,全球社会和经济影响。因此,早期诊断和强劲的发展系统调查疫情的源头解决这个全球至关重要,危及生命的问题。
人体免疫系统的一个重要部分是白细胞(WBC)。白细胞保护身体免受传染病。有五个不同类型的白细胞,命名为淋巴细胞、单核细胞、嗜酸性粒细胞,嗜碱性粒细胞,嗜中性粒细胞。白细胞的数量,以及它们的结构,在不同的感染疾病的诊断非常重要,如艾滋病毒、麻疹、脊髓灰质炎病毒、水痘(1,2]。命名为血图测试,这个测试是通过评估血液细胞在显微镜下完成的。然而,由于不同类型的白细胞及其复杂的结构,人工血管的研究是非常容易出错(3]。因此,很多研究人员探索不同的技术来帮助与白细胞的自动检测与准确精度高。
近年来,研究人员调查和提出不同的计算智能技术感染疾病的诊断。这些技术包括但不限于转让学习和深入学习4- - - - - -6]。许多研究人员都集中在使用这些计算技术检测白细胞由于其在诊断各种传染病的重要性。大多数的研究都集中在白血细胞的分类和分割。鉴于检测白细胞的重要性,在这篇文章中,我们将首先回顾之前的文献分类和分割白细胞。我们将提供一个深入学习方法使用卷积神经网络改进之前的研究。我们的一个动机使用卷积神经网络因为他们不需要看到整个对象。因此,它可以是一个不错的选择来处理细胞显微图像的边缘。我们使用gram - schmidt算法部分细胞核的外周血样本。接下来,我们利用尺度不变特征变换(SIFT)特征检测提取最可预测的特性。让附近的空间依赖性,这是特别重要的在处理图像数据,我们将使用卷积神经网络学习上下文依赖性。 For the classification purpose, we use the weighted two-phase test sample sparse representation method (WTPTSSR) that is an improvement of the method two-phase test sample representation (TPTSR) method [7]。我们的动机选择WTPTSSR TPTSR是这种方法保持位置信息。因此,它可能是更适合图像分类上下文。
本文的其余部分组织如下。节2,我们将评估不同的技术被用于图像分割和分类。节3中,我们将描述方法两部分。首先,我们将详细解释分割和分类的步骤。再往下,分割和分类的仿真实验阶段将节中讨论4。接下来,我们将介绍我们的实验方法并将报告结果。最后,我们将提供一个讨论我们的方法提供了见解如何在检测白细胞以及我们的方法可以进一步提高了未来的研究。
2。相关工作
白细胞的多样性使他们的检测非常具有挑战性。许多研究人员调查了不同的技术在这一领域。这些研究主要依赖于图像分类和分割检测白细胞和研究他们的结构。大津阈值方法是循环使用的环形直方图分割白细胞(8吴等]。本文首先进行方法应用于H和S HSI颜色模型的组件。Gautam和Bhadauria改善血液显微图像的对比,用大津阈值分割的白色的细胞核(9]。Mohapatra等人做了预处理步骤通过应用图像的中值滤波,以消除噪声和使用成为可能 - - - - - -意味着集群在实验室颜色模型划分像素的血液显微图像10]。 - - - - - -意味着集群和实验室颜色模型的分割白细胞核也一直在探索(11,12]。Theera-Umpon使用 - - - - - -意味着模糊聚类和形态运营商部分白细胞核(13]。锅等人用榆树分类提取白细胞通过利用视觉模拟(14]。他们证明了榆树等效性能相比,支持向量机和可以找到积极有效样本和实时训练分类模型,而不需要调整的参数。
Ko et al。15)为核提供了分步积分法分割基于均值漂移聚类。他们还使用了养狐业(极端学习机)活动曲线段细胞的细胞质中。Hamghalam等人结合大津阈值方法和一条蛇的基于方法的活性曲线段细胞核和细胞质的白血细胞(16]。Rezatofighi等人提出了一种新的分割方法基于gram - schmidt的白细胞核正交性(17]。他们进一步改善他们的工作提出了一个活跃的曲线细胞质分割(18]。
显微图像边缘检测,Nakib et al。19]microcanonical退火方法用于优化准则函数通过基准测试二维熵指数。在[20.)、遗传算法和小波被用来自动估计的数量为多级阈值的直方图阈值。他们检查他们的方法不同的图像,包括血液显微图像。检测过程的目的是检测血液中的椭圆图像和提取的最佳椭圆DE算法。他们用gram - schmidt正交算法来分割白细胞。为了描述和提取白细胞的类型,这可能有五种不同类型筛选算法和深度卷积神经网络。他们使用的深卷积神经网络由两个完整的层三层的卷积和的池。为了解决数据大小的小,他们使用WTPTSSR算法(21]。
3所示。该方法
在本节中,我们将首先轮廓分割过程中,主要是基于gram - schmidt正交性。我们将做分类的过程,利用尺度不变特征变换(筛选)特征检测和卷积神经网络。
3.1。分割
我们使用gram - schmidt正交性部分细胞核的外周血样本。要做到这一点,我们首先提取一个三维向量为每个像素基于RGB组件。随后,权向量计算,优化网络的输入数据集,提取感兴趣的领域,我们使用的想法22]。也就是说,我们计算权向量的内积和像素的特征向量(图1)。这种方式,紫色区域原始图像的亮度最高强度,而其余的图像会变黑。
gram - schmidt过程需要一个有限的线性无关组 为 并将生成一组正交 跨度相同 - - - - - -维子空间作为 。为此,投影操作定义如下: 在哪里 代表的内积运算符在向量 。
鉴于这个定义,gram - schmidt正交方法将如下(19]:
使用这种方法,向量将用于设置 。随后,最大投影和其他向量正交计算如下:
最终,我们可以做细分的基础上选择合适的阈值,对结果的柱状图。鉴于血小板地区比细胞核较小,我们可以去掉小块,其余部分只包括细胞核。消除色差的影响和细胞核之间的照度图像样本,三个不同的权重向量计算每个图像。最终,我们将应用”和“理性行动三个结果图像的分割阶段的结果。这个过程如图2。
3.2。分类
3.2.1之上。尺度不变特征变换
尺度不变特征变换(SIFT)特征检测已被用于特征提取(23]。筛选是基于图像梯度和缩放和旋转不变性24]。旋转不变,这意味着即使旋转图像,我们可以实现相同的结果。尺度不变的意思是改变图像的规模不会影响结果。此外,该方法显示了高度的抵抗其他复杂形式的变换和光照变化。筛选提取关键点和特征向量的三个步骤,提出了在以下部分23]。
步骤1。在这一步中,交替传入的图像是通过高斯函数卷积获得原始图像的平滑样本。然后,平滑图像减去从对方获得的图像的不同高斯函数(狗)。
步骤2。接下来,结果狗图像检查,和当地的最大值和最小值点选择的关键点。当地最大和最小的点是最大值或最小值的点在这两个维度和量表相比,他们的邻居。此功能确保要点和提取的特征向量保持不变的规模变化。
步骤3。一旦要点和计算每个点的尺度在步骤1和步骤2,每个关键点的特征向量计算。首先,计算梯度图像,这将被用来提取关键点。随后,周围地区的方向中央像素将被设置在中央像素的梯度旋转。在这一点上,梯度图像的采样 地区的中心像素梯度旋转。这一步确保提取的特征向量具有旋转不变。
接下来,样品在一个地区是量子化的8个主要的方向。的 周边地区中央像素分为16个地区 ,和梯度方向直方图计算在每一个地区。最终,这些16八维直方图形式最后128维特征向量24]。
3.3。卷积神经网络
在自然图像,像素的值在一个空间附近有很高的空间相互依赖,这种依赖是独立于附近的位置在图像(25]。保持这些依赖项并使模型不变的空间变换,卷积神经网络可变一组过滤器( )输入图像,将导致二维命名为在以下方程:
这些过滤器是从输入数据使用反向传播算法和梯度。计算特征地图单位,卷积过滤器是通过一个非线性传播活动等功能乙状结肠功能或修正线性单元功能。随后,池层是应用于地图单元的输出特性,让它不变的传输。池的行动可以使用最大化或平均特性图一致的邻居 :
池阶段,我们使用最大池方法。这种技术经常用于池阶段,因为它负责负值,不模糊输出单位(26]。汇聚层的结果将被发送到一个常规的完全连接网络。在最后一层(层)的输出,softmax激活是经常使用;然而,在我们的工作中,我们使用WTPSSR softmax函数的方法相反。WTPTSSR方法是一个稀疏方法将在下一节中详细描述。随后,整个网络是使用反向传播训练网络的误差,计算基于crossentropy最后一层的输出。
卷积网络认为本文有褶积层和两个max-pooling层。卷积层重量的过滤器 ,和补零不被认为是在层。
3.4。加权两阶段测试样本稀疏表示
加权两阶段测试样本稀疏表示方法(WTPTSSR)是一种改进的两阶段测试样本(TPTSR)表示方法(7]。TPTSR方法代表了测试样本作为训练样本的线性组合。然后计算最近的邻居为每个测试样本根据训练样本,最适合相应的测试样本。然而,这种方法失去了本地信息,而在很多情况下,位置是非常重要的,拥有高辨识率[4]。WTPTSSR方法提出了解决这一问题(27,28]。WTPTSSR TPTSR相同,只不过它增加了位置上正则化。WTPTSSR方法的步骤如下:(1)输入: 训练样本矩阵,训练样本的数量和吗每个样本的数量特征, 是试验样品(2)列和被标准化规范化规范(3)的最近的邻居为测试样本确定基于以下方程: 在哪里是一个对角矩阵和本地适配器处罚之间的距离和每一个试验样品和计算如下29日]: 在哪里是本地适配器参数。注意,如果 ,TPTSSR的方法将被转换。然后,下面的方程将所有训练样本的计算:
随后,试验样品最低的值将被选择并构建矩阵 (4)在下一步中,我们将解决线性方程(10),来计算的线性组合训练样本: 在哪里是一个积极的常数和是单位矩阵
因为每一个选择样本属于同一个类,每个类之间的合作需要的程度决定(30.]。假设的样品吗th类为代表 。使用下面的方程,我们将检查的训练样本之间的协作程度类代表试验样品: (5)注意,小代表一个测试样本做出应有的贡献。因此,试验样本的类确定协作的类,给出了最小值
在下一节中,我们将介绍我们的模型如何工作LISC和WBCis数据库。我们也会把我们的模型与其他四个基准方法。
4所示。结果和实验
4.1。分割结果
评估细分,我们比较手动和自动分割之间的相似性。更高的相似性度量显示更准确的分割。相似度计算使用以下方程: 在哪里区域的自动分割的核心和吗的面积是手动分割的核心。
4.2。RDE标准
相对距离误差准则(RDE)是用来评估提取的片段(26,31日]。假设 是像素, 是像素,是图像的边界从自动分割和获得吗从手动分割图像的边界。和分段像素的数量吗和分别的界限。与这些假设,RDE定义根据以下方程: 在哪里和参数定义基于方程(14), 表明之间的欧氏距离和 。
4.3。或者你和ER标准
显示像素的数量从手动分割结果中未找到的自动分割。代表像素的数量由于自动分割和没有发现在手动分割。代表像素在手动分割对象的数量。
UR,或和ER标准,分别指示oversegmentation, subsegmentation,和错误的比率,计算根据方程(15),(16)和(17)[3,13,32,33]。
表1说明了该方法的计算结果为细胞核分割相比,提出的方法在16,34]。如前所述,在LISC(白细胞图像分割和分类)和WBCis(怀特岛的血液细胞图像分割)数据库、评价参数只对白细胞计算。
4.4。分类结果
我们使用了包含260个样本的图像 像素,都是彩色图像,检测血液细胞包含5个不同的类。在表1,结果程序应用于260年提出的白细胞图像如嗜中性粒细胞,嗜碱细胞、单核细胞、嗜酸性粒细胞和淋巴细胞。表2和3是猪的混淆矩阵描述符和筛选以及CNN用来提取特征,分别。在表4,我们将该方法的准确性与四个基线比较模型。在表5,我们比较不同的分类技术,即支持向量机,WTPSSR,和距离分类,执行。注意,相同的特征提取方法(CNN的组合和筛选)用于这种比较。
5。结论
全球感染疾病仍然是一个重大的公共卫生问题。的一个有效的方法来检测一些威胁生命的传染病是使用白细胞。在本文中,我们提出一个方法来检测不同类型的白细胞显微图像。我们使用gram - schmidt过程分割步骤,分类,我们使用尺度不变特征变换(筛选)技术以及卷积神经网络。在分类阶段,而不是使用一个softmax分类方法,我们利用稀疏方法改进我们的模型精度达到97.14%。尽管我们的工作提供了有前景的结果,有一些地区进一步改善,未来的研究应该探索。第一个限制我们的工作,像其他许多研究在这一领域,缺乏基准评估和比较我们的结果。这一领域未来的研究应该创建一个基准,并分析不同的方法如何在单个数据集比较工作。第二,我们没有获得一个足够大的数据集。增加数据样本大小以及各种样例图像也可以大大提高模型的精确性和概括性。增加数据集大小和种类,目的是增加数据独立性和分类精度,一个潜在的解决方案是收集数据库中可用不同的医疗中心。 Creating such a data set as the benchmark in this domain could be a very big step towards developing methods with higher accuracy and, more importantly, will improve the generalizability of the findings. Lastly, to apply our proposed model on a more complex data set, we can enhance the deep convolutional neural network by increasing the number of layers and the dimension of each layer to meet the complexity of a more complicated system.
数据可用性
图像数据用于支持这项研究的结果已经存入WBCis库(https://github.com/zxaoyou/segmentation_WBC)。
的利益冲突
作者宣称没有利益冲突。