文摘

因为手工溶血试验方法与实践经验为主,其成本高,溶血图像的特点进行了研究。溶血的图像检测方法基于生成对抗网络(甘斯)和卷积神经网络(cnn)和极端学习机(ELM)提出。第一,增强图像增强和数据样本集,执行和GAN用于扩大样本数据量。第二,CNN是用来提取特征向量的图像处理和标签与一个炎热的编码特征向量。第三,功能矩阵的输入映射在榆树网络减少错误并通过培训获得最佳的重量。最后,图像检测是训练模型,输入和图像以最大的概率被选中作为最后的类别。通过模型对比试验,结果表明,溶血图像检测方法基于GAN-CNN-ELM模型比GAN-CNN, GAN-ELM, GAN-ELM-L1, GAN-SVM, GAN-CNN-SVM, CNN-ELM在精度和速度,准确率为98.91%。

1。介绍

溶血的过程是血红细胞膜破裂,细胞和血红蛋白释放到血浆,血清和其他细胞间物质。这个异常表达式可以很容易地导致许多疾病。特别是,新生儿溶血已成为最重要的一个影响新生儿健康疾病(1,2]。2018年,张3]分析了200例新生儿黄疸。新生儿溶血发生在99年61.61%的女婴儿。在101个男婴,新生儿溶血占50.49%。因此,可以看出,新生儿的黄疸引起溶血的概率仍相对较高。然而,许多病人成为病情加重,甚至失去自己的生命因为溶血不够早期发现(4]。

在临床溶血试验,标本个性和质量判断需要视觉测量并记录下医务人员一个接一个地和溶血的程度很容易受到主观因素的影响。5600体外生化免疫分析仪是用于检测溶血指数,实现自动定量测定溶血程度(5),避免错误和缺失的条款由手工操作引起的。的浓度在新生儿溶血样本计算了无特异性神经元烯醇酶(了无)校正公式,避免重复样本收集。它是特别困难的,从新生儿(收集血液样本6]。这些方法依赖于化学仪器和医疗人员的实践经验。测量相关数据是复杂的,需要很长时间。

近年来,随着深度学习技术的迅速发展,计算机辅助检测技术提供了更好的结果比传统方法(7,8]。特别是,医学图像分析为医务人员提供更有效的诊断和治疗程序(9]。然而,大规模的标签数据难以获得。医疗数据标签需要专业知识和投资大量的时间和人力。通过培训现有数据,生成对抗网络(甘斯)可以自动生成大量的数据,有效地解决这个问题。例如,Qi et al。10)生成大量的不同的肺结节图像通过氮化镓,节省时间和成本。卷积神经网络(cnn)在医学图像分析也提供了极大的帮助。Huynh-the et al。11)骨骼信息转换成一个图像表示基于CNN。实验结果准确性得到最高的最具挑战性的数据集。布埃诺et al。12)实现精度高使用顺序CNN segmentation-classification策略。作为一个新的培训框架,极端学习机(ELM)已广泛应用于分类、识别、和诊断(13]。例如,王先生和李14榆树用于分类脉冲数据,精度为90.3%。王等人。15)使用ELM方法快速、准确地确定人体已经下降。Cai et al。16)验证的有效性和优越性榆树在岩性识别的比较。

检测溶血图像使用计算机辅助技术代替手工工作,提高相关算法,提出了一种基于GAN-CNN-ELM溶血图像检测方法。该方法的预测精度高达98.91%,识别精度和效率比GAN-CNN GAN-ELM, GAN-ELM-L1 GAN-SVM GAN-CNN-SVM, CNN-ELM模型。此外,它实现了有效的检测溶血形象,帮助医务人员及时诊断条件,争取更多宝贵的治疗时间。

本文有三个主要贡献。(1)大量的溶血GAN扩大所产生的图像数据集(2)CNN的多层特征的提取算法预处理溶血实验图像(3)榆树构造分类器分类特征值和获得更准确的预测结果

本文组织如下。部分1简要描述了溶血检测存在的问题和解决方案模型。节2介绍了一些具体的方法。部分3给出了实验过程和结果。最后,在节4,提出了一些结论,提到我们的未来工作的方向。

2。方法

提出了一种有效的溶血图像检测技术。该算法框架如图1。主要方法包括三个阶段如下:(一)图像预处理(b)CNN提取特征(c)榆树分类

2.1。图像预处理

图像的预处理主要包括图像分割和剪裁,图像增强,增强图形转换数据,生成对抗网络数据提高。进行图像预处理 图片 原始图像集作为训练阿特拉斯。 - - - - - - 图片代表实验图谱。

2.1.1。最初的裁剪和标签图片

培训照片是分段和裁剪得到的照片在试管中溶血区域。然后,专家判断和标记溶血区域并将图像分成三类。第一类是不溶的,类别数是0,主要基于明显的降水在试管和明显的分层。第二类是microsolubility,类别数是1。这主要基于溶血的解决方案在试管中部分沉淀,但解散相对统一的上层,有明显的颗粒。第三类是正常溶解类别,类别数是2,主要基于解决方案在试管中溶解均匀,排除极端情况下(完全不溶性或清水试管);没有更大的粒子或降水出现。分类的结果如图23

2.1.2。图像增强

溶血的集合图像可能会影响到不可控的因素,如光和照片角度,导致溶血现象极度集中的灰度的图像或不明显的特性区域(17,18]。因此,图像增强的收集溶血形象会导致不同的角度特征和细节特征图像的出现,减少无关信息的影响,促进模型提取图像的更多特性,并确定溶血从多个特性。

该算法主要采用直方图均衡化(19)来增强图像。例如,对于一个离散的灰度图像 ,出现的次数灰度 表示为 ,并与灰度像素出现的概率 在图像表示为 在哪里 是所有的灰度数字图像,对应的累积分布函数 被定义为

在这篇文章中,原始图像的像素的概率分布的灰度级别是改变了直方图均衡的方法来实现图像增强的效果。

2.1.3。数据增强

由于医学图像的独特特点,位置和角度的主题形象和其他因素的判断直接影响测试人员。在CNN的训练,不规则的图像可能会使模型训练不稳定,导致模型不收敛。因此,数据图像增强后强化突出溶血性图像的主要信息,规范数据集,并减少噪音干扰。

(1)图形变换。算法模型采用三种翻译方法变换,旋转变换,水平翻转,加强数据(20.- - - - - -22]。

图片翻译转换:假设有一个点 在原始图像的坐标 ,这是翻译的 单位在 - - - - - -轴和 单位在 - - - - - -轴和新坐标 ,它的矩阵表达式显示为

水平翻转:设置其原始图像宽度高度宽度和高度。原始图像中的一个点的坐标 水平镜像翻转后的坐标 ,矩阵表达式表示为

旋转变换:顺时针旋转图像原点的角 ,然后的坐标 后点 原始图像的改变 的坐标 更改为 给出了矩阵表达式

本文首先翻译和转换原始图像,然后随机旋转角度。最后,图像随机裁剪丢弃一些图像中无关的信息。然后,数据是通过扩大水平反转,和一些错误的样本由于过度增强被删除。

(2)生成对抗的网络。图形变换后,用时样品取消,导致进一步减少可用的训练数据。解决训练数据不足的问题,现有的数据训练通过生成模型来获得大量的数据来提高网络的泛化能力,提高网络的稳定性和新样本的普遍性。

甘斯(23)是由两个网络:一个生成器和一个鉴别器。发电机学习尽可能真实数据的分布。鉴频器学会判断输入数据来自真实的数据或生成数据,他们互相玩游戏和训练最终到达平衡态(24,25]。

我们样品的公式 由一群随机噪声 发电机(后17,18)如下: 在哪里 最终的输出经过几次卷积,池和激活操作(见方程(14)和(15),函数与鉴频器

真正的样本的输出结果( )和生成的样本( )通过鉴别器方程所示(7)和(8)。

二分法的判别结果可以表示为结果。 在哪里 代表的概率 属于真正的样本分布和损失函数(26,27建立了。它是表示为

氮化镓是反向传播算法进行了优化。

优化发电机时,最小化 最大化 当鉴别器优化。梯度下降法可以用来优化解决方案,以便生成器生成的样本分布与实际的样品是一致的。

2.2。CNN特征提取

CNN是一个生物激励神经网络,它由一个输入层,几个卷积交替层和汇聚层,一个完全连接层和一个输出层。其中,卷积层用于卷积计算,和池层是用来降采样的。提取图像的主要特征是通过这两个层次。该算法使用ResNet50模型(22)提取特征,如图4

假定输入图像矩阵,卷积核,和特征映射矩阵的形式都是一个正方形。这里,输入图像矩阵的大小 ,卷积内核大小 ,卷积核是 ,卷积跨越 ,补零层数是 ,和的大小 功能图生成的卷积计算给药

对图像卷积几层后,池操作,激活函数,得到了许多特性图。在矩阵形式,每个特性图 是激活函数。破ReLU函数被选中。

后的卷积计算图像中每个像素块,功能映射矩阵的大小,见以下方程:

池操作执行。在共享过程中,的大小 被选中的池内核。两种池模式的计算公式方程所示(14)和(15)。

经过多次操作,如层池、卷积,和激活,最后一层特性图扩展到行向量,表示为 ,榆树的训练数据, 映射函数和吗 是特征矩阵。

2.3。榆树分类

通过构造ResNet50模型,特征提取的重量pretrained模型加载和保存。结果的最后一层神经网络用于输出。每张照片后经过ResNet50模型,特征向量 提取, 每个图片的特征数量和吗 是行向量,见以下方程: 标签对应一个炎热的代码

特征矩阵提取的图像特征构成的数据集榆树(28)分类, 代表的数量和图片 代表的数量特征。

榆树模型如图5

榆树网络中隐含节点不需要调整通过反向传播(BP)但可以随机生成基于一组连续概率分布。榆树包含两个阶段:一个功能映射阶段和一个学习阶段。在该算法中,输入数据在输入层图像特征向量,和输出的结果 th节点显示在以下方程:

这相当于一个映射 - - - - - -一个维向量 - - - - - -维向量。 在哪里 th联系其输入层和隐层的节点, 是偏见, 是激活函数,这里使用的s形的函数。

在输出层节点的数目表示 ,和的重量 隐藏层节点 输出层节点 然后,节点的输出(映射)

在学习阶段,特征矩阵提供的一个给定的数据 训练样本来标示 ,它包含 生成映射在映射阶段。目标函数表示为 在哪里 由最小二乘法解决。 在哪里 广义逆的时刻吗

改善榆树模型的泛化能力和避免过度拟合模型, 常规术语(29日)添加到误差函数。

的解决方案 如下:

是单位矩阵。

总之,榆树训练的步骤可以概括如下:(1)隐层参数进行初始化 根据随机连续分布(2)输出矩阵 隐藏层的计算根据方程(15)- (18)(3)权重矩阵 根据方程(计算22)

在识别阶段,给定一组示例 ,它第一次成为 后,映射在第一阶段;然后,给出了样本的类别

argmax函数索引,返回数组中的最大价值;也就是说,最大概率类别数是预测类别。

3所示。实验

这个实验是在电脑上进行8 GB的64位内存Windows10, i5 - 6200 u的CPU, Python 3.6。

这个实验的数据集是来自当地的医疗机构,和溶血性血液样本是由专业人员收集和标记。集标准溶血指数 这个实验的原始数据集2250溶血医学实验室所使用的图像不规则的决议。百分之八十(1800)的原始数据作为训练数据,剩下的20%(450年)被用作最后的测试数据。数据分布如表所示1

3.1。数据集处理

(1)图像分割和剪裁,随机裁剪图像的分辨率 因此,培训规模扩大,剪面积判断和分类。直方图均衡化是用来提高图像分类,如图67

通过将原始图像的灰度值,图像的灰度值均匀分布,以提高对比度,增强图像的细节。图的灰度直方图6(一)如图8,图7(一)如图9(2)最初的数据样本的数量扩大通过图形变换,和生成对抗网络用于进行对抗训练数据图转换后,和大量的训练样本生成,如图10。训练图像生成的数量在这个实验中是2350,和原始数据集是延长到4600年

3.2。提取图像的特征

通过图像增强和增强数据,原始数据更有效地利用。生成的样品处理,不可用样品被拒绝。然后,进行特征提取。特征提取的过程中,三层的特征图中提取的视觉观察。原来的不溶性溶血检测图像如图11。在不同尺度卷积和池操作后,许多特征图从原始图像中提取反映原始图像的特征从不同角度,如图12

3.3。榆树训练效果的比较

榆树期间提前两个参数来确定培训包括输入模型和隐层的节点数。不同的参数影响的训练效率,模型的拟合程度,推广效果。一般原则是,隐藏节点的数量小于输入尺寸,和数量的功能不应太大。

为了确定适当的输入层和隐层的大小, - - - - - -采用折交叉验证的分析实验,减少过度拟合,提高模型的泛化能力,如图13。实验结果表明,4倍交叉验证精度最高,和4倍交叉验证最终用于火车GAN-ELM GAN-ELM-L1, GAN-CNN-ELM模型。隐藏节点的初始化是基于连续概率分布随机生成的。

训练参数的选择功能,和隐藏层精度的影响进行了研究。隐藏节点的数量选择如下:10,100,200,400,800,1000,2000。然后,GAN-ELM-L1 GAN-ELM的三个模型,4倍交叉验证下GAN-CNN-ELM分别训练。培训结果如图14

如实验结果所示,当隐层节点的数量 从10增加到200,准确性大大影响和迅速增加。从400年到800年,阶段精度往往是稳定的。800节点后,开始overfit模型,泛化能力较低。因此,最佳的隐藏节点的数量大约是600,这个实验有良好的性能。实验结果还表明,单一榆树分类器并不是有效的。精度提高了通过添加一个正规化的榆树分类器,和准确性由GAN-CNN-ELM大大提高分类器模型。

在确定最优数量的隐藏节点600年,本文采用4倍交叉验证来验证每个折叠的准确性,以及测试集的准确性有或没有模型的交叉验证。实验结果如表所示2。实验结果表明,模型的精度性能在最后的测试集是使用4倍交叉验证改进后。

3.4。实验结果的比较

(1)溶血检测的传统方法主要包括5600年体外生化免疫分析仪检测溶血指数(5),特异性神经元烯醇酶(了无)校正公式6)和微柱凝集凝胶检测卡(30.]。因为这些实验方法不依赖于人的主观判断,它避免了人的主观因素的影响,提高了检测的准确性。同时,它不依赖于化学仪器,可以节省化学试剂,操作简单。电脑运行速度远远超过物理和化学分析仪器。因此,它避免了耗时的缺点测量相关数据和在很大程度上提高了检测效率(2)这个实验相比,七种不同的算法:GAN-CNN GAN-ELM, GAN-ELM-L1, GAN-SVM, GAN-CNN-SVM CNN-ELM, GAN-CNN-ELM。结果表明,采用GAN-CNN-ELM分类器的训练模式,自甘大大增加样本数据;与CNN-ELM算法相比,特征提取的时间增加,但精度提高。完整的连接层在CNN网络结构需要反向传播调整参数,榆树是一个单隐层前馈神经网络,输入层的重量和偏见隐藏层是随机选择的。榆树是用来取代完整的连接层特性分类,有效地降低了算法的计算复杂度和提高模型检测的效率。GAN-CNN-ELM模型与其他模型相比,培训时间和准确性进行了优化。在表3准确性是增加了至少0.16%

四个模型准确率相对较高的选择:GAN-CNN, GAN-CNN-SVM CNN-ELM, GAN-CNN-ELM。剩下的20%的测试数据是到不同的预测模型,训练。结果如表所示4

通过以上实验比较,结果表明,GAN-CNN-ELM算法模型明显优于其他三种模型的识别时间和识别精度。识别精度增加了至少2.58%。

4所示。结论

本文提出一种GAN-CNN-ELM溶血图像检测算法模型,它使用图像增强和图形变换增强图像特征和扩展示例数据。然后,我们使用氮化镓培训现有的数据来获得大量的数据。ResNet50算法模型用于提取多层预防溶血性实验图谱的特点。榆树构造分类器分类特征值来提高训练时间效率。测试集,识别的准确性高达98.91%。实现高效的溶血性图像识别和准确地确定溶血结果。

在未来,多尺度卷积可以用来优化系统的泛化程度和识别的多样性。将试图改善与CNN多特征融合的准确性(MFF)。Res2Net框架将被用于提取图像的多层特征使粒度细,功能更加多样化,规模和凯尔姆经常算法将研究进一步提高模型的训练速度。

数据可用性

所使用的图像数据来支持本研究的结果包括在本文中。

的利益冲突

作者宣称没有利益冲突。

确认

这项工作和它的数据收集和共享的支持和资助的局部立体匹配算法研究基于视觉系统(18 jk0509)。