文摘
深度学习的迅速发展,自动损伤检测是广泛应用于临床筛查。解决这个问题,现有的颈深上优于癌前病变检测算法不能满足高分类精度和运行速度快的同时,提出ShuffleNet-based宫颈癌癌前病变的分类方法。通过添加频道关注ShuffleNet,网络性能得到了改进。在这项研究中,图像数据集分为五类:正常,宫颈癌,LSIL (CIN1) HSIL (CIN2 / CIN3)和宫颈肿瘤。阴道镜图像扩展到解决问题缺乏阴道镜图像,从每个类别图像的不均匀分布。对于测试数据集,提出了CNN模型的准确性是81.23%和81.38%。我们的分类器实现了AUC得分为0.99分。网络阴道镜图像分类的实验结果表明,基于人工智能在分类精度和模型大小具有很好的检测性能,具有较高的临床适用性。
1。介绍
宫颈癌是第四个女性最常见的癌症。世卫组织的统计数据显示2020年全世界大约有604000新发病例,占所有新女性癌症病例的6.5% (1]。宫颈癌的早期治愈率高,但缺乏症状和体征在这个阶段阻碍了早期诊断。一个成功的宫颈癌筛查程序可以避免死亡和减少疾病的发病率和持久性(2]。据统计,每年超过311000人死于宫颈癌发生。由于缺少经验丰富的卫生保健工作人员和资金不足的筛选系统,宫颈癌筛查设施是非常稀缺的发展中国家3]。因此,有必要使用自动化和有效的筛选方法,以减少早期发现宫颈癌的成本。宫颈癌筛查遵循以下流程:人乳头状瘤病毒测试,细胞学或子宫颈抹片检查测试,阴道镜和活检(4]。子宫颈抹片检查图像筛选是少量的细胞样本的子宫颈子宫,把他们放在玻璃幻灯片,然后在显微镜下研究是否异常。这个方法是费时的,取决于病理学家的经历。不同的病理学家将看到不同的结果在相同的电影。人乳头状瘤病毒DNA测试是一种测试。子宫颈抹片检查和人乳头状瘤病毒与低灵敏度测试非常昂贵的治疗。因此,阴道镜是广泛应用于发展中国家。阴道镜确定宫颈病变通过使用一个低放大倍数显微镜下强光源(5]。其准确性高度依赖医生的技能。在病变的检出率有显著差异在不同的阴道镜医生。这已引起人们的关注不足的诊断病变(包括错失诊断宫颈癌)和过度诊断病变(6- - - - - -9]。过度诊断病变可能导致的过度治疗轻度宫颈病变,增加感染的风险和经济负担10]。
近年来,深度学习在医学领域已逐渐成为流行。医学图像处理的目的是恢复原始图像不清楚,突出图像中一些特征信息,或对图像进行分类。医学图像包括MRI、CT、超声图像和血涂片图像(11,12]。卷积神经网络(CNN)是一种重要的端到端深度学习模式13),主要用于图像识别、分割、和目标检测在医学图像处理。Ai-assisted阴道镜可以帮助阴道镜专家提高诊断性能,优化临床工作流、阴道镜的医生和医院,减轻压力,拥有巨大的潜力来改善宫颈癌筛查的性能。
我们提出一个方法的分类基于深度学习的宫颈癌癌前病变。本文的主要贡献如下:(我)不同等级的宫颈癌癌前病变、宫颈肿瘤分类和宫颈癌。(2)深倒残余网络基于改进提出了额外的通道ShuffleNet的注意。(3)与传统的残余网络相比,倒残余网络不仅能保证图像中自动提取功能,还减少模型的计算,提高计算速度。
本文的结构如下:部分2介绍了提出了深度学习模型。部分3描述了数据来源和处理。部分4实验和分析。部分5总结这项工作。
2。材料和方法
2.1。切除分离卷积
深CNN网络如ResNet [14]和DenseNet [15)大大提高图像分类的准确性。然而,除了精度,计算复杂度也是一个重要指标被认为是由CNN网络。复杂网络可能运行缓慢。一些特定的场景,比如一个无人驾驶的车辆,需要低延迟,边缘计算设备也需要小模型,都是准确、快捷。为了满足这种需求,轻量级的深度学习网络如MobileNet [16]和ShuffleNet [17已经提出,速度和精度之间取得良好的平衡。
加快网络的计算速度,减少的数量计算,MobileNet建议切除可分离卷积。传统的卷积,输入特性图的大小(W,H,C在)用于获取一个输出特性图的大小(W,H,C出通过卷积操作使用一个)N×N卷积的内核。此时,计算量
切除可分离旋转分为切除隆起和逐点的曲线玲珑。切除的卷积相当于使用卷积内核的数量1渠道执行单独的卷积操作地图上每个通道的输入特性。特征映射与相同数量的输出和输入通道需要成倍增加W×H×C在×N×N次了。逐点的卷积,一个简单的1×1卷积,需求W×H×C在×C出次乘法计算。相比普通的卷积,切除分离卷积的计算量可以减少:
2.2。倒残余网络与其他频道的关注
与MobileNet ShuffleNet也有类似的想法,Xception [18),ResNet。它使用通道洗牌和切除分离卷积ResNet优化残余结构,这不仅保证了网络模型的精度也提高了操作效率。与传统剩余模块,该模块直接集成深度网络的特性和具有网络通过多个曲线玲珑,倒剩余模块将输入特征映射到两个批次X1和X2, X2通过切除可分两次卷积和1×1 +批标准化+激活函数,卷积X1和X2熔深和具有特性,最后,通道洗牌用于混合深度和具有的特性。假设分为输入层G组和渠道的总数G×n。首先,将信道分成两个维度(G,n),然后转置这两个维度(n,G),最后重新塑造成一个维度G×n。ShuffleNet结构模型如图1。英吉利海峡洗牌过程如图2。
为了使分类更准确,我们添加Squeeze-and-Excitation网络(SE) [19)和选择性内核网络(SK) (20.)模型,分别。SE模型如图3。首先,功能映射U频道C总数和大小H×W扁平的特征向量(1,1,C)全球汇集Fsq显示如下:
激活函数和线性映射添加到特征向量添加更多的非线性条件下,可以更好的适应复杂的通道之间的相关性。最后,乘以计算信道特性的原始特性映射获取输出通道的注意。SE模型加强重要特性和削弱了重要功能通过控制通道的大小比例,使提取的特征更多的方向。
频道关注允许插入每个特性之间的映射。SE频道关注后插入到depth-separable卷积,通道尺寸的特征提取是进行切除分离卷积的输出。倒残余网络结构模型融合SE模块如图4。
SK主要是一样的。不同之处在于,SENet执行关注频道,而SKNet执行关注卷积内核。SKNet使用卷积检查特性不同大小的地图在网络中提取不同尺度的特征,然后提取通道后注意不同尺度的融合特征。其网络模型如图5。
与SE, SK还用于切除可分离卷积。倒残余网络结构模型融合SK模块如图6。
首先,输入特征图由切除分离卷积计算conv_1卷积核大小的3×3,切除分离卷积,卷积核大小为3×3和2的膨胀系数不同的尺度;那么这两个输出特征图总结全球池、计算和池层类似于SE频道关注;随后,乘以conv_1双通道的输出特性和conv_2频道维度得到两个特征图的混合渠道关注不同的尺度,然后两个特征图总结得到SK注意输出特性。
3所示。数据来源和处理
3.1。Cervigram数据集
宫颈癌筛查数据集提供的是妇科,河北大学附属医院(显示在表1)。阴道镜图像的数据集是由不同等级的癌前病变(正常、CIN1和CIN2/3),宫颈肿瘤、宫颈癌。有1189例患者,共6996张图片。
3.2。数据集制作原则
在这项研究中,数据分为训练和验证子集用90%到10%的比例。
因为提供的数据集的不均匀分布在每个类别和样本的数量很小,数据增加添加图片用于五类(正常、宫颈癌HSIL LSIL,颈椎肿瘤)。数据增加用于改善训练模型的整体结构安全。有两种方法可以提高数据:一个是获得新的图像;另一种方法是增加数据,即。,to create more available data using already available data such as flips, translations, or rotations to make the neural network more generalizable. Three data augmentation methods used in this paper are as follows:(我)随机裁剪图像大小为224×224(2)图像标准化处理(3)随机图像水平和垂直翻转
4所示。实验和性能分析
4.1。实验条件
确保迭代效率和提高模型的稳定性和泛化能力,在这项研究中,由随机梯度下降优化网络参数(SGD)使用nesterov梯度下降算法1的重量衰变e0.9 - 4,学习势头,几个单批治疗32。每个模型训练了100次,最初的学习速率设置为0.05。CNN算法实现PyTorch编码框架。进行模型训练和评估使用英特尔(R)至强(R)黄金6240(电子邮件保护)GHz和英伟达RTX 2080 ti GPU。所有程序上运行Ubuntu 18.04.5 LTS。
4.2。评价指标
有效评估算法,本文运用培训损失和模型精度测量的培训阶段。在测试阶段,本文介绍了混淆矩阵为基本评价标准,和信息的混淆矩阵包含四个部分:(我)TN,是真正的负数,可以代表负样本预测为负的数量(2)TP,是真阳性,可以代表积极积极的预测样本的数量(3)FN,假阴性,可以代表的数量正样本预测为负(iv)FP是假阳性,可以代表负样本的数量作为积极的预测
由于该模型是一个multiclassification模型,精度,精度,召回,F1-scores可以根据上述四项指标计算。曲线下的面积(AUC)评分和混淆矩阵也被用来评估模型的性能。分类精度、精度、召回和F1的分数可以获得的(4)- (7)。
接受者操作特征(ROC)曲线是一个全面的索引显示连续变化的敏感性和特异性。根据曲线的位置,整个图分为两个部分。曲线下的面积就是AUC。AUC得分越高,分类模型的性能越好。混淆矩阵反映了分类器在处理multiclassification造成的混乱问题。对角线上的值代表正确分类的图像每个类的数量。对角线的颜色越深,分类器的性能越好。本文预测结果标准化。
4.3。对比实验结果和分析
评估分类网络的有效性提出了,我们比较与VGG-16提出的神经网络模型21,ResNet34 GoogleNet [22,DenseNet121 MobileNet、ShuffleNet ShuffleNet_SK, ShuffleNet_SE。比较结果更自信,所有的模型在本文中使用的数据集和训练在相同的培训环境。如表所示2,本研究比较了准确性、精密,召回,F1-scores上述网络。平均值和标准偏差被用来总结结果。结果表明,改进后的网络的分类能力显著提高。
数据7和8表明,改进的模型规模网络与传统分类网络相比大大减少,也与轻量级网络MobileNet相比大大减少。分类精度,提高网络维护识别精度高,提高分类性能比未被利用的ShuffleNet和MobileNet相比显著提高。我们的模型可以显著提高计算效率,实现良好的性能分类精度,因此代表了一个合理的模型尺寸和性能之间的平衡。
如图9,改善网络可能不是那么有效网络在一个索引改善之前,网络模型的预测精度与SENet添加更好。
5。结论
本文提出了一个数据集colposcopic图像使用colposcopic图像颈癌前病变及宫颈癌患者不同的成绩。我们也使用了六个神经网络模型的比较实验,提出了两种新的基于深度学习轻量级网络模型ShuffleNet_SK和ShuffleNet_SE multiclassification颈椎疾病。分类性能是通过将注意力集中在提高反向残余网络。因此,ShuffleNet_SK和ShuffleNet_SE实现分类精度为81.23%和81.38%,分别。该网络是适合移动终端有限的计算资源,可以分类更准确和更快的宫颈疾病,以满足实时的要求,具有更实际的临床应用价值。此外,他们也可以向预选申请其他类型的癌症,减少了医生的检测。
数据可用性
在公开的数据https://github.com/AluminiumOxide/ShuffleNet_Attention_Extend。
的利益冲突
作者宣称没有利益冲突有关的出版。
确认
本研究支持保定科技计划项目(2141 zf306 2141 zf135),河北大学和基金会支持的总统(XZJJ201918)。