文摘
乳腺癌的特点是异常不连续的衬里细胞女人的乳导管。大量的妇女死于乳腺癌的症状在乳导管。如果早期诊断,可以降低死亡率。放射科医生或内科医生,手动分析乳腺癌的乳房x光检查图像成为耗时。防止手工分析和简化的工作分类,介绍了一种新颖的混合DenseNet121-based极端学习机模型(ELM)分类乳腺癌的乳房x光成像。乳房x光图像处理通过预处理和数据增加的阶段。的特性分别收集池和压平层后的第一阶段分类。此外,功能是作为输入提供给DenseNet121-ELM模型提出的完全连接层作为输入。一个极端学习机模型已经取代完全连接层。极端的学习机器的权重更新了AdaGrad优化算法来提高模型的鲁棒性和性能。 Due to its faster convergence speed than other optimization techniques, the AdaGrad algorithm optimization was chosen. In this research, the Digital Database for Screening Mammography (DDSM) dataset mammogram images were utilized, and the results are presented. We have considered the batch size of 32, 64, and 128 for the performance measure, accuracy, sensitivity, specificity, and computational time. The proposed DenseNet121+ELM model achieves 99.47% and 99.14% as training accuracy and testing accuracy for batch size 128. Also, it achieves specificity, sensitivity, and computational time of 99.37%, 99.94%, and 159.7731 minutes, respectively. Further, the comparison result of performance measures is presented for batch sizes 32, 64, and 128 to show the robustness of the proposed DenseNet121+ELM model. The automatic classification performance of the DenseNet121+ELM model has much potential to be applied to the clinical diagnosis of breast cancer.
1。介绍
乳腺癌是乳腺组织的不受控制的发展。乳腺癌占所有新癌症病例的12.5%,使其成为世界上最常见的癌症。大约30%的新诊断恶性肿瘤在女性预计2022年乳腺癌。作为一个女人和变老的两个最重要的危险因素是乳腺癌。现在最大的全球公共卫生问题是癌症。根据世界卫生组织(世界卫生组织),研究(国际癌症研究机构)和GBD(全球疾病负担癌症协作),他们说,癌症的情况下上涨了28%,从2006年到2010年,将会有270万例新病例,2030年的癌症。女性乳腺癌的影响超过任何其他类型的癌症(170万起,535000人死亡,1490万残疾人生命年调整)。乳腺癌的发病率和死亡率显示持久的不平等现象,据美国癌症协会。美国癌症协会(ACS)的研究指出,2022年,乳腺癌将利率高死亡率的主要原因1]。1670年的报告估计每天的死亡人数。浸润性乳腺癌会影响大约13%(8)或1的美国女性在一生。乳腺癌治疗的早期诊断的重要组成部分。还有一个非常重要的诊断乳腺癌在早期为了提高存活率。乳腺癌诊断的人工干预消耗大量的时间去理解和分类的乳房x光检查图像。近年来,深入学习算法如CNN已经证明了他们的能力来检测乳腺癌病理图像。也发现,一些模型失败由于过度拟合。我们相信这个复杂的诊断系统可以更容易通过设计一个自动深度学习分类系统。出于深度学习的进步,我们已经开发出一种新的分类模型的分类乳腺癌。 The development of deep learning as an image classification technique is crucial in the current research era. Several studies proposed classifying mammography images, and the effectiveness of the classifiers was demonstrated using binary, multi, and dual classification. By randomly deleting layers from CNN models during training, deep learning significantly enhances the training of deep networks [2]。MobileNets使用生产架构构建,使用深度方面创建深层神经网络运算(3]。ResNet是由谢et al。4对图像分类)。的训练精度98%,尔孔尼et al。5)推荐VGG Xception, ResNet乳腺癌的分类。DenseNet和SENet被李等建议。6)与组织学图像交叉分类的乳腺癌。用5倍交叉验证,王et al。7)提出修改InceptionV3架构和实现曲线下面积(AUC)值为0.9468,敏感性和特异性分别为0.886和0.876,。米娅数据集,胫骨et al。8]提出的多尺度卷积神经网络(MA-CNN),取得了AUC灵敏度为96%和0.99。Squeeze-Excitation-Pruning(9月)为乳腺癌组织病理学图像块分类是由朱et al。9)在混合CNN架构。彻底审查的文献后,发现没有研究使用DenseNet121 +榆树模型乳房x光检查图像。由于缺乏传统CNN自动分类器性能更快,我们提出DenseNet121-ELM模型的启发。该模型表现良好相比,现有的CNN模型分类。
的贡献如下:(我)我们开发了DenseNet121杂交模型与一个极端学习机(ELM)完全连接层(2)我们提出了一个极端学习机(ELM)模型在平层分类(3)我们利用AdaGrad优化权重优化模型的批量大小32,64和128
剩下的部分组织如下:所做的相关研究人员提出了部分2、方法、研究图,和提出的架构DenseNet121 +榆树模型给出了部分3,所呈现的结果与讨论部分4,并给出了结论和参考文献部分5。
2。相关的工作
医学成像的基础上,来自世界各地的研究人员正在开发乳腺癌自动识别和分类的技术。由于快速增长的深度学习在医学成像领域,研究者们对这项新研究吸引了。任何诊断系统的基本元素是艾滋病放射科医生和医学专家的早期识别癌症。乳腺癌,各种基于深度学习分类算法开发。横波弹性成像(理念)数据和CNN加上segmentation-free radiomics技术乳腺肿瘤分类提出的周et al。10]。特征提取,这种方法产生的弹性形态学数据。建议实验,318恶性乳腺肿瘤和222良性乳腺肿瘤。在最后的实验中,建议SWE-CNN模型实现特异性为95.7%,敏感性为96.2%,准确性为95.8%。面具CNN的地区被角等建议。11为乳腺癌的CT扫描图像的分类。收集的数据来自中国医科大学医院使用超声图像加上活检,组织学和诊断报告。的实验中,总共有307从80年实例聚集超声图像。他们已经实现了85%的总体精度诊断良性和恶性乳腺肿瘤使用面具R-CNN求婚。CNN的紧凑SE-ResNet模块分类器是由江泽民et al。12)为了提高CNN性能参数较少。CNN的squeeze-and-excitation块和剩余模块相结合形成了SE-ResNet。研究采用BreakHis数据集,一个二进制分类的准确率为98.87%和93.81%多类分类。深度学习架构转移学习提出了汗et al。13为乳腺癌的乳房细胞学图像的分类。LRH医院在白沙瓦、巴基斯坦、数据集提供了组织病理学。GoogLeNet、视觉几何组网络(VGGNet)和残余网络(ResNet)用于特征提取。合并后的特征被赋予完全连接层与平均池的分类癌和良性细胞。提出了深度学习框架的准确性为97.525%。乳腺癌的深度学习Xception模型分类提出了Abunasser et al。14]。这项研究使用了7909 BreakHis乳腺癌的显微图像数据集,其中包括2480年良性和5429年恶性样本。提出Xception模型达到训练精度,精度,回忆,和F1-score为99.78%,97.60%,和97.58%,分别。混合算法改进的海洋食肉动物——(IMPA) ResNet50模型和转移Houssein等人于2022年提出了学习(15]。CNN最佳hyperparameters架构使用IMPA被确定。实验,DDSM数据集和米娅的数据集。米娅数据集达到98.88%的准确率,敏感性97.61%,特异性98.40%乳腺癌的分类,而DDSM和获得98.32%的精度,灵敏度98.56%,和98.68%。DenseNet CNN模型提出了纳瓦兹et al。16)对乳腺癌的多级分类和预测癌症的子类,如纤维腺瘤和小叶癌。DenseNet CNN模型产生杰出的处理结果有95.4%的准确度用组织病理学BreakHis图像数据集。汗等。17]提出深CNN ResNet50模型分割和分类类型的乳房异常为良性和恶性案件。该模型在分类准确率达到88%乳腺癌异常如大众、钙化,癌和不对称的乳房x光片。为了区分正常组织和良性病变hematoxylin-eosin-stained乳腺癌显微镜图像,Hameed et al。18]提出Xception有六个中间层次。所做的分类建议Xception模型利用自己的分层结构。模型的性能研究四归一化数据集产生的莱因哈德,Ruifrok Macenko, Vahadane污渍正常化。他们聘请 交叉验证的性能测量和kappa值已经达到了97.79%的准确率http://0.965。胡锦涛的时刻,Haralick纹理、颜色直方图特征提取技术,和一款分类器提出了由约瑟夫•et al。19multiclassification)的组织病理学图像。为了防止过度拟合,采用四款致密层,softmax函数在它的结构,和数据增大。当使用BreakHis数据集分类图像时,精度达到了97.87%magnification-dependent组织病理学图像。为了提高分色和对比,Alkassar et al。20.)建议magnification-specific二进制(MSB)和magnification-specific multicategory (MSM)的分类方法,可实现苏木精和伊红染色。与BreakHis组织病理学数据集,两个特色types-deep和浅特性,提取使用两个深DenseNet Xception结构网络和实现了99%和92%的准确性MSM MSB和分类。Altameem et al。21)提出了一个整体的方法,龚帕兹函数被用来形成模糊排名的基本分类。InceptionV4 resnet - 164、VGG-11 DenseNet121模型视为基分类器。他们利用四个数据集DDSM BCDR, Mini-MIAS, INbreast。99.32%的准确率达到了InceptionV4模型与模糊rank-based龚珀兹函数是高于其他resnet - 164, VGG-11, DenseNet121基础模型。Alqhtani [22)提出了一个新颖的层的卷积神经网络(BreastCNN)对于乳腺癌的方法,在五个不同工作层和使用不同类型的过滤器。乳腺癌是分类的准确性达99.7% Mastology研究使用数据库(DMR),其中包含745名健康和261年生病的照片。胡斯尼·马哈茂德·et al。23)提出了一种深CNN的特征提取的方法,和功能耦合的纹理特征的分类乳腺癌。一个支持向量机分类的训练在深CNN以及尺度不变特征变换(筛选)算法,取得了97.8%的准确性与TP的98.45%和一万亿年96%的速度。基于“脉冲耦合神经网络的混合模型(相)和深卷积神经网络(cnn)”是由图(24使用三个公开访问的数据集,包括DDSM INbreast, BCDR数据集。从这三个数据集,他们使用了900年,300年和450年的图像,分别。混合PCNN-CNN模型达到98.72%。DDSM, INbreast BCDR数据集,分别精度值分别为97.5%,96.94%,96.94%。使用深层神经网络的组合(ShuffleNet ResNet 18日,和InceptionV3Net 18日,48岁和50个隐藏层)和转移学习BreakHis数据集,Aljuaid et al。25乳腺癌)提出了一个新颖的CAD方法分类,取得了平均精度为99.7%,97.66%,96.94%,ResNet, InceptionV3Net和ShuffleNet分别。ResNet、InceptionV3Net ShuffleNet每平均精度达到97.81%,96.07%,95.79%,二进制分类和multiclassification,分别。
3所示。材料和方法
3.1。研究实现图
研究流图1(一)呈现逐步成就的研究工作。
(一)
(b)
3.2。提出DenseNet121 +榆树模型及其体系结构
拟议中的DenseNet121 +榆树模型结构如图1 (b)。调整后的输入到原来的乳房x光检查图像 大小,数据分为训练和测试阶段。数据规范化是一个独特的数据集和美联储模型VGG19 (26],MobileNet [2],MobileNetV2 [27],Xception [28],ResNet50V2 [28],InceptionV3 [6],InceptionResNetV2 [6],DenseNet201 [29日],DenseNet121 [27]。所有数据通过卷积阶段,平均池,平阶段。模型VGG19 [26],MobileNet [2],MobileNetV2 [27],Xception [28],ResNet50V2 [28],InceptionV3 [6],InceptionResNetV2 [6],DenseNet201 [29日)通过传统的分类阶段的分类与AdaGrad重量优化通过一个简单的神经网络。DenseNet121架构呈现在图2 (b)。
(一)
(b)
3.2.1之上。榆树模型
榆树的输出函数(29日)与隐藏的神经元为代表 在哪里 是隐藏的矩阵,然后呢权向量,方程(1)可以写成 在哪里是隐藏层矩阵,矩阵元素被认为是谁的
方程(2)是一个线性系统,它是由 在哪里是“Moore-Penrose广义逆矩阵 。“输入作为特征输入数据集,从平层,收集和美联储作为榆树的输入模型。
DenseNet121模型有一个 卷积,58 (58) 曲线玲珑,61(六十一) 卷积、4平均池和一个完全连接层。特征提取的致密块经过过渡。一个 卷积层和一个 平均池2层的步伐出现在每个单独的过渡层。在这项研究中,乳房x光检查图像的分类性能提高和差异化相结合DenseNet121模型与极端的学习模式。前馈神经网络称为极端学习机作为分类器在完全连接层。我们已经取代了神经网络与榆树DenseNet121模型完全连接层。DenseNet121 +榆树模型的权重一直使用AdaGrad优化技术优化。榆树呈现在图的体系结构模型2(一个)。128年批大小分类性能结果如表所示1。
3.2.2。算法的步骤如下
在实际实践中,CNN权重与反向传播算法进行了优化。DenseNet121模型的权重与反向传播算法进行了优化。我们为我们的研究考虑AdaGrad优化器。
步骤1。输入图像大小
这项研究被认为是。的图像进行了过程数据,和增强图像作为输入提供给模型。卷积图像和过滤器。考虑到图像大小是真正的形象;过滤器是随机选择的图像大小过滤器。卷积是由
。
在哪里
和
。
在180度旋转过滤器,然后转置,
我们有
步骤2。卷积之后,它通过致密层的阶段,和平均池已经完成与步幅池大小(2,2)2。
步骤3。平均池后,功能是由平层,夷为平地的特征矩阵向量矩阵。向量矩阵作为输入提供给完全连接榆树层。权重更新AdaGrad和学习速率调整。
更新后的公式如下:
现在,新的重量优化方程给出了
0.001选择的学习参数值
。现在,扁平的向量。
我们有
在哪里
和
。
步骤4。完全连接的输出层通过将softmax层classifiy图像成癌和非癌变。
隐层的输出是由作为
在哪里特征矩阵。现在,通过将softmax层,并给出方程
在哪里
是输出类癌和非癌变肿瘤。
3.3。数据集
本研究收集数据从开源网站使用数字扫描(DDSM)数据集17)如图3并使用分类模型比较准确。数据是可用的https://www.kaggle.com/datasets/awsaf49/cbis-ddsm-breast-cancer-image-dataset。
3.4。数据增加
数据增强过程经历了“转变、旋转和翻转。“总共3672张图片经过数据扩充阶段,产生大约11000的图像。表2总额的数据表明,70%的图像用于训练和30%是用于测试。表3列出了hyperparameters应用在实验中。
4所示。结果
4.1。分类结果
培训和测试,11000中使用的图像分类,图像分布表提供的细节2。培训DenseNet121精度、DenseNet201 InceptionResNetV2, DenseNet121 +榆树比较图4。表4比较训练精度DenseNet121 +榆树模型和显示它列出的其他性能更好。
对于批量大小32,性能结果如表所示1。数据4和5显示的训练精度和训练损失一批32的大小。人们已经发现,提出DenseNet121 +榆树模型经验培训损失低于DenseNet121, DenseNet201, InceptionResNetV2模型。建议DenseNet121 +榆树聚集在20迭代相比,近50,75年和84年为DenseNet121迭代,DenseNet201和InceptionResNetV2分别。
64批大小的训练精度和损失数据所示6和7。已经指出,虽然DenseNet121、DenseNet201和InceptionResNetV2大约40岁,60岁,72次迭代,分别;收敛,提出DenseNet121 +榆树需要大约15迭代。相比其他指定模型,发现该DenseNet121 +榆树模型训练损耗较低。64年为批量大小,性能结果如表所示5。
批量大小的训练精度和损失128所示的数据8和9。已经指出,该DenseNet121 +榆树需要大约15达到收敛,迭代相比,近20迭代,25个迭代,迭代和45 DenseNet121, DenseNet201和InceptionResNetV2分别。与其它模型相比,可以看出DenseNet201培训损失更高,而提出DenseNet121 +榆树模型训练损耗较低。提出DenseNet121 +榆树模型花了较少的计算时间为159.7731分钟,而DenseNet121 167.1242分钟,164.3344分钟,DenseNet201 InceptionResNetV2和160.4033分钟。128年为批量大小,性能结果如表所示6。系统的性能参数,如“敏感性、特异性和准确性,“也至关重要(12)分类。 “真阳性”、“真阴性”,“假阳性”和“假阴性”是用TP、TN、FP和FN。我们还考虑了计算时间,这是一个至关重要的性能指标。
从表6,它可以显示128批大小导致改进培训和测试精度以及速度的计算。批处理大小为128导致训练精度99.34%,98.84%的测试精度,计算时间为159.7731分钟。计算了167.3545分钟批大小32和163.8975分钟64年批量大小,如表所示5和6,分别。测试精度是一个重要的性能指标,给出了模型的可信度,不管他们如何训练。与之前的模型相比,建议DenseNet121 +榆树模型遭受更少的损失。该模型融合在数量少得多的时代相比,时代的总数。表1显示了该模型的准确性相比,早期的研究。它可以得出结论,提出DenseNet121 +榆树模型显示更好的性能结果与批量大小128相比其他批量大小32和64。图10介绍了所有的模型考虑的比较研究。
5。讨论
分类过程考虑了总共11000张图片,其中7700用于培训和3300进行测试。表4提供了增强图像的更多信息。MobileNet, VGG19 MobileNetV2、Xception ResNet50V2, InceptionV3, InceptionResNetV2, DenseNet201 DenseNet121, DenseNet121 +榆树模型被用来增强图像进行分类。CNN完全连接层权重模型使用AdaGrad算法调优。的训练表现恶性和良性乳腺癌的分类如图4,6,8。批量大小32、64和128年,所有提到的模型被认为是分类以及提出DenseNet121 +榆树模型。培训损失InceptionResNetV2、DenseNet201 DenseNet121, DenseNet121 +榆树如图5,7,9。批量大小为128,VGG19模型实现训练和测试的准确性为97.76%和97.98%,分别。此外,VGG19模型实现特异性、敏感性和计算时间相应值的97.73%,97.88%,211.2344分钟。MobileNet模型实现训练和测试的准确性与批处理大小为128。98.23%和98.42%此外,它实现了98.53%的特异性,敏感性98.41%,分别和198.1212分钟的计算时间。Xception模型训练和测试精度,达到98.85%和98.73%,特异性98.65%,敏感性98.82%,194.2076分钟的处理时间。ResNet50V2模型实现训练和测试精度为98.56%,98.87%,分别计算需要193.1878分钟时间收敛。InceptionV3模型训练和测试的准确性达到98.63%和98.52%,分别。此外,它实现了100%的特异性,敏感性99.52%,分别和183.1881分钟的处理时间。InceptionResNetV2模型取得了98.58%的训练,98.47%的测试精度,也实现了98.59%的特异性,敏感性100%,计算时间为167.1242分钟。 The DenseNet201 model achieved training and testing accuracy of 98.98% and 98.85%, 98.84% specificity, 99.28% sensitivity, and a computational time of 164.3344 minutes. The training and testing accuracy of 99.27% and 98.84% were achieved by the DenseNet121 model. Also, 99.18% specificity, 100% sensitivity, and a computation time of 160.4033 minutes were achieved by the model. The training and testing accuracy for the DenseNet121+ELM model were 99.47% and 99.14%, respectively. Further, 99.37% specificity, 99.94% sensitivity, and 159.7731 minutes of computational time were obtained, respectively, by the proposed DenseNet121+ELM model. For this study, training and testing data for all models with batch sizes of 34 and 64 were presented in Tables5和6.100时代被考虑为所有分类性能测量研究。DenseNet121 +榆树模型已经被证明是合适的和有价值的分类乳腺癌。
6。结论
在这项研究中,一种新型DenseNet121 +榆树模型提出了分类乳腺癌的乳房x光检查图像。榆树模型把传统神经网络的作用完全连接层的提议DenseNet121 +榆树模型。预处理图像进行数据增加,aligned-augmented作为分类的输入图像。DenseNet121 +榆树模型获得了增强图像分类。对于重量优化,AdaGrad优化考虑。DDSM高分辨率乳腺成像数据集被认为是分类。DenseNet201,我们考虑过InceptionResNetV2 DenseNet121, DenseNet121 +榆树模型图说明。批处理大小32,64,和128年的学习速率0.001,被认为是在这项研究中。与其它模型相比,DenseNet121 +榆树模型收敛速度在训练和测试。拟议中的DenseNet121 +榆树模型被认为是一个可靠的分类器在分类癌和良性乳腺癌的图像。 Compared to other CNN conventional algorithms, the proposed DenseNet121+ELM model will aid medical professionals and radiologists in recognizing breast cancer without needing manual interventions. The proposed DenseNet121+ELM model took lots of time to simulate, which is the model’s drawback. However, this proposed model will provide a superior solution to medical diagnosis due to the faster processing unit. This model is new, and till now, it has not been utilized elsewhere. The proposed DenseNet121+ELM model can be employed for a brain tumor dataset, liver disease dataset, etc. in future research.
数据可用性
收集的数据集是公开可用的网站https://www.kaggle.com/datasets/awsaf49/cbis-ddsm-breast-cancer-image-dataset。
的利益冲突
论文的作者Satyasis Mishra, Raj Kumar Pattnaik穆罕默德Siddique Sunita Satapathy和Tiruveedula Gopikrishna声明没有利益冲突或财务利益冲突。
作者的贡献
Satyasis Mishra准备文档和方法论研究的一部分。Raj Kumar Patnaik准备文档每日报格式和帮助收集和预处理数据。默罕默德克履行研究图,和python程序被编译。(Sunita Satapathy收集来自埃塞俄比亚的不同部分的数据。Tiruveedula Gopikrishna准备所有仿真作品和人物与GPU系统。所有作者回顾了手稿。
确认
作者感谢穆罕默德Naimuddin博士的批判阅读手稿和语言编辑。