文摘
深度学习(DL)是机器学习和人工智能的一个分支,已经应用于许多领域在不同领域如医疗保健和药物设计。癌症预后估计的最终命运主题并提供生存估计的受试者。一个准确和及时的诊断和预后决定将大大受益癌症科目。DL已经成为选择的技术由于计算资源的可用性高。主要的组件在一个标准的计算机辅助设计(CAD)系统预处理、特征识别、提取和选择、分类和性能评估。降低相关成本测序系统提供了无数的机会建立精确模型对癌症诊断和预后的预测。在这个调查中,我们提供了一个总结当前工作在DL帮助确定最佳模型的癌症诊断和预后预测任务。DL是一个通用的模型要求最少的数据操作和实现更好的结果,同时处理大量数据。目的是审查DL系统使用组织病理学图像的影响,目前最先进的DL的摘要方法,指点未来研究者改进现有的方法。
1。介绍
癌症被定义为异常细胞生长,来自任何身体器官。从本质上说,这些器官细胞的进一步增长是饱和。这些沉默和饱和细胞也快速增加,直到他们通过手术等物理过程,药物,使用激素治疗或放射治疗或其自然消失的。自然消失,肿瘤细胞可以发生在癌症相关的肾脏或黑色素瘤。这些细胞可以使用工具,如结肠镜检查或检查巴氏涂片检查或使用乳房x光片。有超过150种不同的癌症,和缺乏策略治疗在早期阶段。癌症干细胞是一种有效的方式形成基质细胞从而为癌症的治疗铺平了道路。除了干细胞,WNT16B蛋白质也会增加抵抗癌症化疗。治疗激光疗法、冷冻疗法等一些最活跃的方法来治疗癌症。全球一些最常见的类型的癌症包括嘴唇、口腔、乳腺癌和宫颈癌,甲状腺癌。 On the other hand, rare cancers such as osteosarcoma, Ewing’s sarcoma, male breast cancer, gastrointestinal stromal tumors, chondrosarcoma, mesothelioma, adrenocortical carcinoma, cholangiocarcinoma, kidney chromophobe carcinoma, pheochromocytoma and paraganglioma, sarcoma, and ependymoma made up more than 20% of cancer cases and are rare types of cancers [1- - - - - -4]。
癌症是一种基因疾病。复制的过程中,由氧细胞有丝分裂,轰炸带来连续正常和肿瘤细胞的变化。这个过程始于一个癌细胞的诞生,直到死亡。在这个过程中,癌细胞获得大规模使用基质支持细胞,免疫细胞和内皮细胞。这些细胞成为癌症的一部分质量由于其他因素,如压力配体和抗原。其他由细胞压力的象征proteotoxicity,核苷酸的代谢变化,流离失所的酸。另一个模式的基因使他们是染色体。他们是司机的细胞核。人体约有20000个基因在体细胞中,和他们的研究被称为细胞遗传学已经进步的大的进步在过去的几十年里,现在可以构建一个三维模型的染色体(5- - - - - -7]。
糖是肿瘤细胞的一个重要组成部分,燃料这些细胞的快速增长。他们是癌细胞的饮食的重要组成部分,其增长确保新克隆的形成。细菌和微生物细胞在人体内。微生物细胞估计一样丰富的人类细胞,但他们的基因组是人类基因组的100倍左右,提供更多的遗传多样性。幽门螺旋菌、沙眼衣原体、伤寒沙门氏菌血清型,梭菌属nucleatum,产肠毒素的脆弱拟杆菌,Koribacteraceae,等等,是一些最著名的细菌与癌症有关。细胞凋亡和necroptosis两种途径的程序性细胞死亡(8- - - - - -10]。
癌症一直激发着恐惧。在遥远的过去,医生抑郁或忧郁的幽默癌症的发病机理有关。人们认为忧郁可能引起肿瘤,因为人们认为癌症悲伤。最近,发现炎症和非特异性免疫激活关键因素在抑郁症的病理生理学与癌症有关。城市中心的风险越来越癌症相关风险由于营养等因素;如海龟fibropapillomatosis和猫免疫缺陷病毒感染;城市化学污染等致癌物质,多氯联苯,谷胱甘肽,urethane-induced腺瘤;光线和噪音污染等抑制松果体褪黑激素的生产;生存的变化;和生活史策略(11- - - - - -13]。
深度学习(DL)已显著增长近年来人工智能的使用允许复杂的计算模型来表示抽象与广泛应用于语音处理从数据收集,视觉处理和其他领域。这些方法通过发现细结构往往十分复杂的大型数据集使用反向传播算法。DL相比,传统的方法如基于机器学习方法在处理自然数据限制在它的基本形式没有预处理[14]。
卷积神经网络(cnn)是DL系统配备能力学习不变的特性。cnn滤波器,功能池层,批量标准化层,辍学层和致密层工作和谐为不同的对象创建模式识别任务,如检测、分割和分类。cnn多级层次结构,输入的分布变化过程中训练。预处理输入,例如通过美白的过程,等等,非常希望获得更好的性能在任务(15]。cnn有许多不同的变体如提供较短的连接,例如,DenseNet架构,提供优势的流通功能,并提供大量减少hyperparameters构建高效的架构(16]。可调焦和nonfocal脑电图信号问因子小波变换域进行了调查和识别特征选择和神经网络方法的帮助下(17]。最近的一项研究关于低密度奇偶校验(LDPC)码为物联网网络进行了通过新技术获得的前两个最小值check-node min-sum-LDPC译码器的更新操作(18]。此外,评估未来的健壮的网络包括各种场景6克一直在讨论(19]。
其他类型的CNN架构,近年来流行ResNets, Xception, GoogLeNet架构。对于这些网络由于性能的退化在任务网络越来越深入,需要多尺度处理和寻找更好的架构更少数量的参数(20.- - - - - -23]。
拥有相当大的重要性在DL的另一个问题是一个架构存储信息的能力在时间间隔延长。提出了这个问题,一个解决方案是漫长的短期记忆(LSTM)。LSTM建筑作品nonglobal执行一致的错误流在空间和时间的专业单位(24]。
DL值得一提的另一个想法是学习转移的概念。转移学习、特性提取深cnn正在转化为新的和小说的任务。需要因为通用任务可能不同的从原始任务由于这可能有标签或其他数据训练不足或DL架构适应新任务。使用学习,转移特性适用于有足够的泛化表达式使用简单可靠地技术(25- - - - - -27]。
为DL找到更好的架构设计参数模型是一个值得考虑的问题。强化学习的方法可以帮助在这个任务中。一个鼓舞人心的例子是NASNet架构,使用许多不同的网络拓扑发现重复的图案可以组合串联处理输入不同的空间维度和深度(28,29日]。
本文概述DL癌症诊断的任务方法,预后和预测。目的是强调之间的差异不同的模型结构和提供的局限性和未来的角度进一步探索这个令人兴奋的领域。
剩下的纸是组织如下。部分2礼物的选择背后的主旨的研究是由本文调查的一部分。部分3癌症研究概述公开可用的数据集之后,当前应用DL的描述在癌症诊断、预后和预测任务4。部分5覆盖了现有方法的局限性提出了讨论,观点,和一些未来工作方向。最后,部分6这项工作总结并提出进一步的研究在这一领域的途径。
2。方法
使用的标准选择的文章摘要是语言和电子资源的真实性。只在英语文章是这个调查的一部分由于广泛认可的英语语言科学和生物医学领域。年的文章来源考虑本研究范围在1997年和2020年之间。我们使用PubMed、网络科学、IEEE Xplore,科学的直接平台进行研究。使用的搜索词是癌症的诊断,预后的癌症,癌症的预测使用DL,和转移学习模型。
3所示。癌症研究公开可用的数据集使用DL方法
在本节中,我们将提供一个公开可用的数据集对癌症研究的简要描述。TCGA我们将简要描述癌症基因组图谱()数据库,鹿特丹肿瘤,研究了解预测及偏好的结果和风险的治疗(支持),乳腺癌的分子分类学国际财团(METABRIC) MITOS-ATYPIA-14数据集,肿瘤扩散评估挑战(TUPAC) 2016数据集,INbreast数据库,肺图像数据库的财团和图像数据库资源计划(LIDC-IDRI)数据集,肺结节分析(LUNA16)数据集,乳腺癌组织病理学图像分类(BreakHis)数据,2015年Bioimaging乳腺癌组织学分级的挑战,癌症转移淋巴结挑战乳腺癌转移检测(CAMELYON)数据集,PatchCamelyon数据集,2018年国际会议上图像分析和识别(ICIAR)数据集,MITOS12数据集,白血病基因微阵列数据、基因表达综合库,BioGPS数据门户,癌症成像存档(TCIA),基因组数据共享(环球数码创意),治疗研究适用于生成有效的治疗方法(目标),1000人基因工程,Kvasir数据集,加州大学圣芭芭拉分校的生物分类基准数据集(UCSB-BB)和多通道脑肿瘤图像分割基准(小鬼)数据集。(1)TCGA数据库。从2006年开始,TCGA的结果联合伙伴关系国家癌症研究所和国家人类基因组研究所描述超过20000个主要癌症和匹配正常样本生成33癌症类型,如急性髓系白血病,肾上腺皮质癌、乳腺小叶癌,和葡萄膜黑色素瘤。这个数据库的病例总数约为11125人。它还包含病例罕见类型的癌症。这个数据库是可用的https://www.cancer.gov/about-nci/organization/ccg/research/structural-genomics/tcga(2021年9月24日访问)。(2)鹿特丹肿瘤银行。这个数据集(30.)是由2982名原发性乳腺癌患者其中1546是积极的情况下,即他们有疾病。不同因素如雌激素受体、孕激素受体,激素治疗,阳性淋巴结的数量,等级分化,肿瘤大小描述这个数据集。R包可以访问这个数据集的https://stat.ethz.ch/R-manual/R-devel/library/survival/html/rotterdam.html(2021年9月24日访问)。(3)支持数据库。这个数据库(31日),收集五个教学医院的支持下在美国,由9105名成年人与一个整体的6个月死亡率47%。受试者招募在两个阶段。期招募了4301名患者,二期招募了4804名病人。在第二阶段中,干预组2652例,对照组2152例。病人被诊断为九危及生命的诊断之一。(4)METABRIC数据集。这个数据集(32)是主要由2509与548匹配正常乳腺肿瘤学科主题。有2506个乳腺癌主题和3乳腺肉瘤的主题。主题与乳腺浸润性导管癌最常发生在这个数据集的主题化生的乳腺癌和乳腺血管肉瘤是最常出现的类。总共有八类癌症的科目。这个数据集是可用的https://www.cbioportal.org/study/summary?id=brca_metabric(2021年9月24日访问)。(5)MITOS-ATYPIA-14数据集。这个数据集包含的乳腺癌组织学图像检测的有丝分裂细胞和核异型性的评价分数为乳腺癌的预后。这些注释提供了两个高级和三个初级病理学家。数据集提供了样本的苏木精和eosin-stained幻灯片的大小 像素在20和40 x放大的水平。对于每个幻灯片,病理学家选定几帧×10放大进一步细分为四个帧×20放大进一步细分为四个帧的×40放大。评价指标为有丝分裂检测到有丝分裂的数量,数量的真阳性,假阳性、假阴性,灵敏度、精度、和 - - - - - -价值。这个数据集是可用的https://mitos 14. -大- challenge.org/home/——异型性(2021年9月24日访问)。(6)TUPAC 2016数据集。这个数据集(33)提供了一种方法来预测肿瘤增殖分数从张幻灯片图像。数据集的挑战是由500年培训和321年检测乳腺癌组织学整个大脑幻灯片。这个数据集是为了满足三个目的。第一个是预测有丝分裂分数而第二个预测基因扩散的分数。第三个任务是后添加到有丝分裂检测所面临的挑战。(7)INbreast数据集。这种乳腺癌数据集34共有115例和由细致的数字乳房x光检查。在这些病例中,图像的数量是410。在这些115例,90例都是女性的乳房而影响25例代表乳房切除术的病人。几种类型的病变如大众、钙化,不对称,包括多个结果,正常,扭曲。8例也有图像在不同时间获得。(8)LIDC-IDRI数据库。由美国国家癌症研究所(NCI)发起的,这个数据集(35的计算机断层扫描(CT)扫描包含1018例三个类别: 。两阶段图像注释过程是由四个胸有经验的放射科医生。这个数据集的目标是识别尽可能完全所有的肺结节CT扫描。这个数据集是可用的https://wiki.cancerimagingarchive.net/display/Public/LIDC-IDRI 1966254194132 fe653e4a7db00715f6f775c012(2021年9月24日访问)。(9)LUNA16数据集。从LIDC-IDRI收集的数据集,LUNA16 [36]数据集是专为检测肺结节的CT扫描。扫描比2.5毫米厚片都被排除在外。肺结节分割,它提供了多个候选人每小结的选项。总的来说,这个数据集包括888 CT扫描。无关紧要的发现不了这个数据集包括nonnodules的一部分, 只有1或2毫米,结节注释放射科医生。这个数据集是可用的https://luna16.grand-challenge.org/Data/(2021年9月24日访问)。(10)BreakHis数据集。这个数据集(37乳腺癌的主题包含了9109个显微图像。这些图片收集到的82例肿瘤组织的四个不同的放大级别40 x, 100倍,200倍,400倍。它包含了5429 2480个良性和恶性样本。这些样本存储在PNG格式。每个样本的决议 与八位深度在每个像素,三路RGB通道。这个数据库的协作P&D实验室的病理解剖学和细胞病理学,巴拉那河,巴西,和实验室的愿景,机器人技术,成像,联邦大学的巴拉那河、巴西。良性肿瘤生长缓慢,保持局部地区虽然恶性肿瘤可以传播到遥远的地区和有能力摧毁相邻结构,可能会导致死亡。这个数据集是可用的https://web.inf.ufpr.br/vri/databases/breast-cancer-histopathological-database-breakhis/(2021年9月24日访问)。(11)2015年Bioimaging乳腺癌组织学分类数据集的挑战。这个数据集(38乳腺癌的科目有四类这是正常的,良性的,原位癌和浸润性癌。它有高分辨率、压缩和注释)染色幻灯片。图像的分辨率 像素。它同时支持图像和patch-wise分类任务。这个数据集是可用的https://rdm.inesctec.pt/dataset/nis - 2017 - 003(2021年9月24日访问)。(12)CAMELYON数据集。这个数据集(39)是专为乳腺癌转移检测和分类在整场幻灯片的图像组织学淋巴结。它促进患者的立场分析结合几个淋巴结陷入一个结果的评估直接部署在临床环境将促进病理学家,同时减少诊断的主观性。它包含1399张幻灯片的图像淋巴结有slide-level标签指示是否不含转移,macrometastases,微转移,或孤立的肿瘤细胞。此外,数据集有详细的轮廓由专家对所有转移209年张幻灯片图像。这个数据集是可用的https://camelyon17.grand-challenge.org(2021年9月24日访问)。(13)PatchCamelyon数据集。这个数据集(40)包含乳腺癌淋巴结的病理扫描部分。每一个图像在这个数据集是加注标签指示转移组织的存在。它包含327680彩色图像的分辨率 像素。这是一个GPU可训练的。的大小比较,它大于CIFAR10和小于ImageNet数据集。这个数据集是可用的https://www.tensorflow.org/datasets/catalog/patch_camelyon(2021年9月24日访问)。(14)2018年ICIAR数据集。这个数据集由苏木精和eosin-stained乳腺癌组织学镜检和张幻灯片的图片。的图片贴上正常,是良性的,原位癌或浸润性癌。与100年总共有400显微镜图像图像每个类存储在. tiff扩展。一个维度的显微镜图像是彩色图像 像素。张幻灯片图像尺寸的彩色图像 像素和存储在.svs格式pixel-wise标签。这个数据集是可用的https://iciar2018-challenge.grand-challenge.org/Dataset/(2021年9月24日访问)。(15)MITOS12数据集。这个数据集(41)包含50个乳腺癌活检幻灯片在40 x放大级别超过300在这些幻灯片有丝分裂。这些图片的尺寸 像素, 像素。这个数据集是有益的和有丝分裂数来估计乳腺肿瘤的侵袭性。这个数据集是可用的http://ludo17.free.fr/mitos_2012/dataset.html(2021年9月24日访问)。(16)白血病基因微阵列数据。这个数据集(42)包含基因表达数据从60骨髓样本属于急性淋巴细胞白血病的患者,急性髓系白血病,慢性淋巴细胞白血病、慢性粒细胞白血病、健康的骨髓。微阵列技术方面在全基因组表达的研究尤其是在后生动物基因组的知识正在改善。进一步的信息关于这个数据是可用的https://www.bioconductor.org/packages/devel/data/experiment/manuals/leukemiasEset/man/leukemiasEset.pdf(2021年9月24日访问)。(17)基因表达综合库。这个存储库(43)提供全面的微阵列,下一代测序等基因数据便于研究不同类型的癌症。进一步的信息关于这个库可以在https://www.ncbi.nlm.nih.gov/geo/(2021年9月24日访问)。(18)BioGPS数据门户。这门户44)支持八个物种的人类,老鼠,老鼠,果蝇,线虫,斑马鱼,thale-cress,青蛙,猪促进基因的研究。支持许多不同种类的癌症如肺癌、乳腺癌、食道癌、甲状腺癌、胰腺癌、直肠癌、结肠癌。这个门户网站是可用的http://biogps.org/ goto =欢迎(2021年9月24日访问)。(19)TCIA。这个服务(45)提供deidentification和举办了大量的医学图像档案公共访问患癌症的使用不同的方式如磁共振成像(MRI)、CT、数字组织病理学。它还提供了支持数据,如病人的结果,治疗的细节,和基因组学。这个服务是可用的https://www.cancerimagingarchive.net(2021年9月24日访问)。(20)环球数码创意。这个门户提供了基因组、临床和biospecimen数据为不同类型的癌症如骨髓、乳腺癌、眼、皮肤、肺、肝脏和神经系统。它支持TCGA等癌症研究计划和目标。这个门户网站是可用的https://gdc.cancer.gov(2021年9月24日访问)。(21)目标。这个程序提供了大量基因组数据来估计分子改变儿童癌症。发展的目标是使用数据有效,更少的有毒的疗法。它使研究急性淋巴细胞白血病、急性骨髓性白血病,肾脏肿瘤,神经母细胞瘤、骨肉瘤等。进一步的信息是可用的https://ocg.cancer.gov/programs/target(2021年9月24日访问)。(22)1000人基因组计划。这个项目的目标(46)是找到常见的遗传变异利用测序技术的发展。它有助于测序大量的人们提供全面的资源对人类遗传变异。细胞系和可供所有1000个基因组DNA样本。这些样品是完全匿名的,没有相关的医疗数据。进一步的信息关于这个项目是可用的https://www.internationalgenome.org/1000-genomes-summary(2021年9月24日访问)。(23)Kvasir数据集。这个数据集(47)访问https://dl.acm.org/do/10.1145/3193289/abs/(2021年9月24日访问)。它的目的是促进胃肠道(GI)呼吸道癌症研究。初始数据集包含4000注释图像属于8类,每个类500张照片。解剖标志是z轴,幽门盲囊,而病理发现包括食管炎、息肉、溃疡性结肠炎。范围从分辨率图像 到 像素。这个数据集继续深入学习研究中发挥重要作用。(24)UCSB-BB数据集。这个数据集(48)包含图像的人类、猴子和猫在亚细胞的物种,决议从细胞和组织水平 来 像素。有58属于恶性乳腺癌/良性类的图片与尺寸的人类 和 在细胞水平上与地面实况数据。这个数据集是可用的https://bioimage.ucsb.edu/research/bio-segmentation(2021年9月24日访问)。(25)有钱的数据集。这个数据集(49)是由临床和合成图像。临床数据65核磁共振扫描的低收入和高档神经胶质瘤患者。四核磁共振对比T1, T1c, T2,天赋是由临床数据。合成数据有高档和30低级神经胶质瘤的主题。它旨在促进肿瘤的分割和患者生存通过预测和区分肿瘤复发和进展。这个数据集是可用的https://www.med.upenn.edu/cbica/brats2020/(2021年9月24日访问)。
表1显示数据库的摘要/服务/项目促进癌症研究覆盖在这一节中。
4所示。当前的应用深度学习在癌症诊断、预后和预测
在本节中,我们将讨论一些领域的当前研究趋势DL对癌症诊断、预后和预测任务。我们将介绍技术/预测肿瘤的预后,乳腺癌和其他类型的癌症。此外,我们还将覆盖技术的分割/检测乳腺癌和其他类型的癌症。此外,我们将讨论不同的方法分类的乳腺癌和其他类型的癌症。我们还将覆盖技术的分类、分割和检测脑部肿瘤。图1组织病理学显示视图的一些癌症亚型将综述文章。
(一)
(b)
(c)
(d)
(e)
(f)
(g)
(h)
(我)
(j)
(k)
(左)
4.1。/预测肿瘤的预后,乳腺癌、皮肤癌、头颈癌、脑癌、肝癌、结直肠癌、卵巢癌和其他类型的癌症
Petalidis et al。50]报道病患肿瘤的基因表达数据集。他们雇用一个人工神经网络(ANN)算法结合签名从这些肿瘤的组织病理学子类为了解决这些肿瘤的分级的必要性。在这项研究中,他们发现59基因属于三类,即血管生成,肿瘤病患较低品位的歧视,以及细胞分化。他们进一步的报告,这些肿瘤亚型有很高的预后价值,他们缺少其他的研究在文献中报道。最后,他们报告11个分类器,使用基因主要/次要亚型区分恶性胶质瘤。他们使用一个自定义的数据集以及独立报告的准确性96.15%为这些亚型识别正确的类。气等。51)使用的形态学特性比较预测结果乳腺癌在两个不同的数据集。他们报告成功预测与好的和坏的预后价值。这里,预后好意味着站有价值甚至五年之后虽然坏表明不到五年。作者在52)使用DL在女性乳腺癌患者进行了实验的方法。他们所做的预测使用Cox回归模型和基因表达数据集。他们叫他们的方法与MultiOmics生存分析学习神经网络(鲑鱼)。他们报告说,改善了鲑鱼的性能,当更多的数据用于合并和简化癌症生物标记和基因表达,使预后的预测。清水和中山(53)进行实验,以确定乳腺癌预后的基因预测使用癌症基因组图谱(TCGA)数据库。他们发现了184个基因使用人工智能(AI),为此,他们用随机森林和神经网络模型。此外,他们使用预后分子分数23只使用这些基因。他们确认他们发现潜在的药物靶点在这些基因的发现。作者在54使用恶性黑色素瘤)进行实验。他们使用一个数据集与1160名女性和786名男性。他们使用一个安架构采用灵活的非线性结构的生存预后的预测概率。他们发现他们的模型的性能与Cox模型与平价优势,它提供了一个灵活的方法在分析数据使用指定的分布形式。京et al。55)引入了一个损失函数结合成对排名损失和损失均方误差优化DL模型验证在四个公开可用的数据集,如伍斯特心脏病研究(成果),鹿特丹肿瘤,研究了解预测及偏好的结果和风险的治疗(支持),和分子分类乳腺癌的国际财团(METABRIC)。他们的模型实现优越的性能结果比鼻咽癌预后的医学专家。郝et al。56)提出了DL网络预测预测和描述复杂的生物学通路从而提供他们的模型来解释其结果。他们进行实验的预测从数据库,TCGA多形性成胶质细胞瘤脑癌。他们的模型实现曲线下面积(AUC) 和一个分数的 优于其他模型等物流至少绝对收缩和选择算子(套索),随机套索,支持向量机(svm)和辍学的神经网络模型,显示了他们的方法的优越性。作者(57)提出了多通道DL网络集成多维数据。他们的模型结合基因表达数据,修改数据,和其他形式的临床数据实现更好的性能比模型1 d数据和其他方法。Chaudhary et al。58]提出了DL-based方法基于TCGA的RNA和甲基化数据模型肝细胞癌。他们的模型达到一致性指数为0.68,的价值 。他们发现,TP53突变,KRT19 EPCAM具备干细胞标记,Wnt和一种蛋白激酶信号通路与更积极的亚型有关。作者在59]提出了DL模型结合CNN和递归神经网络(RNN)体系结构的预测结直肠癌科目使用数字化haematoxylin-eosin-stained肿瘤组织微阵列样本。低收入和高危病人,他们的模型实现的风险比为2.3的视觉评估组织组织和风险比1.65张幻灯片的低收入和高风险科目。王等人。60)想出一个DL模型来预测浆液性卵巢癌的主题从CT图像中提取预后的生物标志物。他们进一步提出了一种结合DL和Cox风险模型和实现和谐指数的0.713和0.694个人和三年的复发的概率主题,分别。作者在61年从转录组数据)用DL-based ANN模型。他们TCGA部署数据集的RNA序列属于十个不同种类的癌症。他们的模型获得了优异或同等级别的性能通路和基因水平。作者在62年)想出了一个DL模型结合Cox比例风险模型与一个表现最佳的生存方法。他们进行实验成果,METABRIC,支持数据集实现良好的预测性能水平个性化的治疗建议。Mobadersany et al。63年]预测比较结果从组织病理学图像和基于基因的生物标志物作为cnn的DL模型从神经胶质瘤和胶质母细胞瘤TCGA群。他们使用了抽样,filtering-based方法的改进预测没有考虑到瘤内异质性。他们的模型实现了中值一致性指数0.754超过其他先进的方法。作者在64年)开发了一种DL-based方法利用cnn预测间皮瘤癌症的生存主题。他们用TCGA和法国源来测试他们的方法。他们取得了一致性指数0.656,TCGA队列超过了人类专家的性能,发现关键地区相关的间质炎症和细胞的多样性。刘等人。65年使用DL诊断预测模型建模。27日作者进行他们的研究不同癌症类型获得TCGA和基因表达综合数据集。他们成功解码CpG 12和13子标记。CpG标记的识别取得了100%的敏感性在前列腺癌样本的预测启动子标记达到92%颗粒脱氧核糖核酸(DNA)甲基化数据的使用。
表2显示的摘要任务的研究癌症的预后和预测本节。
4.2。分割/检测乳腺癌,肺癌,膀胱癌,和其他类型的癌症
Yap et al。66年)使用DL乳房病变检测使用超声图像的方法。他们调查LeNet的性能,U-Net, pretrained AlexNet。他们进行了306年和163年的两个自定义数据集实验图像称为数据集,数据集B,分别。他们pretrained AlexNet-based模型实现达到一个最佳的总体性能 - - - - - -0.91和0.89两个数据集。作者在67年]想出不同的变体完全分割的卷积网络(FCNs)病变患乳腺癌的科目。他们尝试一个AlexNet-based FCN,以及8 - 16 -,32-layered FCN模型。为了克服数据缺乏的问题,他们使用学习和转移pretraining ImageNet数据集。他们的数据集有两个类,良性和恶性。他们报道骰子平均得分0.7626用FCN 16层的良性病变。他们的模型正确地识别89.6%的成功良性病变和60.6%的恶性病变。刘等人。68年DL)用于检测乳腺癌淋巴结活检。他们用399幻灯片Camelyon16挑战数据集来实现幻灯片的AUC 99%的水平。他们使用一个自定义数据集,108年实现99.6%的AUC幻灯片。作为一个预处理步骤,他们使用一种颜色标准化过程。作者在69年)使用不同的DL方法如更快的地区CNN, ResNET-50, densenet - 201架构用于乳腺癌检测使用组织病理学图像。他们用三个数据集进行实验,模式识别国际会议2012年MITOS-ATYPIA-14,肿瘤扩散评估挑战2016数据集。他们取得了精度0.876 2012年国际会议模式识别数据集,在MITOS-ATYPIA-14 0.848, 0.641肿瘤扩散精度评估挑战2016数据集。作为数据扩增方法,他们使用水平和垂直翻转,翻译和调整操作,人为地增加数据集的大小。Anuranjeeta et al。70年)使用形状和形态学特征源自分割图像检测癌细胞使用DL和基于机器学习模型。他们使用J-Rip,物流模式树,旋转森林,多层感知器和其他模型的训练,组织病理学图像。旋转森林表现最好的癌/非癌变检测达到85.7%的精度。作者在71年)使用一种修改区域CNN方法有效地确定使用组织病理学图像有丝分裂在乳腺癌。他们聘请学科属于模式识别(ICPR) 2014年国际会议上,TUPAC 2016数据集在他们的研究。他们在精度达到0.76 TUPAC 2016数据集。周et al。72年)使用3 d深CNN模型来检测乳腺癌病变的MRI数据集。他们与1537名女性患者和部署自定义数据集分类良性或恶性。他们实现了83.7%的精度诊断任务和一个骰子的距离检测任务得分为0.501分。作者在73年)提出了DL集成架构的能力进行分类、分割、筛选和检测的乳房肿块是良性或恶性。他们使用数字x射线从INbreast数据库乳房x光检查。他们的模型实现了质量检测的准确性为98.96%,而对于质量分割,他们取得了骰子分数的92.69%。增加数据集,作者综合应用旋转8倍增加数据集的大小。Nasrullah et al。74年]部署DL-based架构的恶性结节的诊断肺癌。他们在LUNA16和LIDC-IDRI数据集进行了研究。他们使用更快的地区CNN和U-Net风格建筑达到94.17%的精度分类任务。作者在75年]DL-based系统用于筛查肺癌使用CT扫描。他们使用LIDC-IDRI和Kaggle数据科学碗挑战实验数据集。他们的系统是基于3 d CNN架构。作者使用重型扩增人为地增加数据集的大小使用方法如旋转、缩放、平移、和反思。他们达成了一个骰子系数0.4 LIDC-IDRI数据集。Shkolyar et al。76年]部署DL-based模型检测的乳头状和平坦的膀胱癌。他们用cnn来构造一个图像分析平台。他们使用两个数据集的100和54个科目。他们的模型成功地检测到42 44乳头状,平的膀胱癌。他们报道per-tumor灵敏度为90.9%。Fourcade et al。77年)使用DL和superpixel有效方法来段全身器官,如大脑和心脏的正电子发射断层扫描(PET)图像。综合数据集的大小增加,作者部署旋转,缩放、镜像和弹性变形。他们最好的执行模型实现一个骰子得分为0.93分。作者在78年]部署DL架构在MRI检测脑转移。他们使用的数据从121年提出的研究主题。他们使用更快的地区CNN模型实现的ROC曲线下面积0.79。马等。79年)你只看一次使用v3密集multireceptive字段CNN对甲状腺癌结节检测。他们用超声波图像抖动和部署不同的数据扩增方法如颜色,饱和度变化,暴露,色调在152年和699年的两个数据集的图像。图像的数量增加到10845之后,应用程序的数据扩充计划。的值意味着平均精度(mAP)报告的作者分别为90.05和95.23。Das et al。80年)提出了一个系统结合分水岭分割,高斯混合模型(GMM),和深层神经网络的分类和分割使用CT扫描肝癌。他们的模型进行识别的血管瘤、肝细胞癌和转移癌科目。他们雇佣了225 CT扫描在他们的研究中实现一个骰子得分0.9743测试集的分割任务和多级分类的精度99.38%的任务。作者在81年)提出了一个DL-based模型肝脏器官的组织病理学图像的分割。他们提出的DL模型结合残块,瓶颈,译码器块和关注。作者进一步创建了一个新的数据集80年他们命名为KMC肝脏组织病理学图像数据集,提出了一个联合损失函数结合骰子和Jaccard损失。他们进行了两个实验数据集:KMC肝脏和multiorgan Kumar数据集。Kumar中的每个图像数据集的维度 虽然KMC肝脏中的每个图像数据集的维度 。他们的模型实现了Jaccard指数0.7206 KMC肝脏数据集和0.6888 Kumar数据集。王,钟82年]提出了一种修改U-Net-based架构的分割和诊断结肠腺体。作者采用两个数据集实验:腺分割数据集从医学影像计算和计算机辅助干预(MICCAI)挑战和一个独立的结直肠腺癌腺数据集。作者进行了验证实验378图像增强使用弹性变换,裁剪,旋转,翻转,模糊和扭曲操作。他们的模型实现了骰子得分0.929从MICCAI腺分割数据集和0.89的独立结直肠腺癌腺数据集分割任务。作者在83年)提出了一个CNN架构结合三个CNN结直肠癌使用核磁共振图像的分割和分类的28腺癌和5粘液性癌。他们的模型实现了骰子得分为0.60分,精度0.76,0.55召回测试集。作者用裁剪和min-max比例作为预处理方法。Juebin et al。84年)提出了超声图像的分割算法基于U-Net模型卵巢癌。图像剪裁被用作预处理方法。方法验证在127名患者,总共469张图片。他们最好的模型实现了骰子得分为0.87,平均皮尔逊相关性为0.90,平均0.89的组内相关。柴田et al。85年面具R-CNN算法)用于1208健康和533胃癌内镜的分割图像。图像的分辨率范围 来 像素。他们的模型实现骰子平均指数的71%。王旭和刘刚(86年)提出一个架构基于Deeplab v3 + 1340年分割的胃癌的病理切片。作者使用图像镜像,随机翻转,尺度和旋转增强技术。意味着减之后,除与方差作为预处理方法。他们的模型实现了骰子得分为0.9166。Shrestha et al。87年)提出了DL系统结合四个U-Net模型。他们使用前列腺癌的MRI图像从一个在线数据库。每个图像的分辨率 像素。他们使用修改后的骰子和二进制叉亏损分割任务。他们使用的预处理图像去噪和强度归一化程序实现整体平均精度为95.3%。刘等人。88年)提出了DL方法集成面具R-CNN和《盗梦空间》第三版模型分类、分割和检测任务的前列腺癌。他们用1200超声波图像的数据集。他们的模型实现了骰子得分0.88和76%的精度恶性和良性类75%分类任务使用一个初始v3架构。作者在89年)提出了一种2 d U-Net模型部署556例前列腺癌的CT图像。他们取得了骰子得分0.85,0.94,0.85,三个器官,即前列腺、膀胱和直肠。梁等。90年)建立了一个DL-based模型采用CNN架构胰腺肿瘤的分割。作者部署T1w MRI图像的数据集40科目。他们取得了骰子得分是0.73使用旋转和翻转数据扩增方法。作者在91年)提出了DL方法使用螺旋转换执行胰腺癌的MRI图像的分割。作者用螺旋旋转和转换数据扩增方法。他们部署了数据集的MRI图像属于73名患者。他们的架构是ResNet和U-Net架构。他们取得了骰子得分 。
表3显示的总结研究的任务分割和检测癌症的覆盖在本节。
4.3。乳腺癌的分类
黄齐et al。92年)使用DL的方法对感兴趣的区域从超声图像进行分类。囊性、良性或恶性标签被分配到每个地区。两个二进制分类任务进行使用pretrained cnn,良性的(良性+囊性)/恶性和良性或恶性。他们使用支持向量机作为分类器CNN-derived特性。良性的/恶性分类任务,他们获得了0.9的AUC,良性或恶性的任务,他们的方法获得了AUC为0.88。作者在93年cnn作为他们DL方法和介绍了匹配层的概念,将灰度图转换成红、绿、蓝的模式。他们用882超声波图像获得两个公开的数据集。使用微调和匹配层,他们的方法接近的AUC 0.936测试组150例。Byra et al。94年)使用DL转移上优于方法如《盗梦空间》版本表3和VGG19架构重构图像分类性能下降。为了应对这一问题,他们使用数据表增加重建图像实现更好的性能在乳腺超声图像。作者在95年)结合跨通道和跨域转移学习的良性或恶性分类任务。从头开始训练和简单的微调相比,他们的方法实现更好的性能与97%的准确率在超声图像。哈达et al。96年]部署跨通道转移学习使用乳房x光检查图像实现0.93的精度比跨域转移学习。作者在97年)提出了一个研究使用MRI检查个人40年以下确认的有效性MRI诊断等形态的选择。他们报道一个高灵敏度约93%至100%,低特异性37%至97%的范围。他们发现MRI特别是在整形外科手术是有效的。胡锦涛et al。(98年)开发了一种转移学习方法使用MRI形态与多个参数。他们使用不同的序列,如动态对比度增强和t2加权序列区分良性病变与恶性的。他们用形象、特征和分类器融合方法和实现了AUC 0.87特性的融合方案,统计上优于其他方法。作者在99年)提出了一种方法使用初始版本4和残余网络传输学习架构以及2015年乳腺癌复发CNN架构挑战和BreakHis分类数据集的二进制和多级分类任务。他们使用旋转、翻译、和其他数据扩增方法人为地增加数据集的大小实现的准确性 在多级和精度 在二进制分类任务。Bayramoglu et al。One hundred.)使用单一和多任务CNN架构来预测恶性肿瘤和图像放大的水平。裁剪和旋转BreakHis数据集被部署,以增加数据集。他们实现良性或恶性的分类率为83.72%二进制分类任务使用一个和82.13%的准确性使用多任务CNN架构。作者在101年)提出了一个方法进步将疲弱的DL分类器组合成一个强分类器对癌/ noncarcinomas二进制和正常/良性/原位/浸润性癌多级(4类)分类任务。他们用BreakHis和2015年bioimaging乳腺癌组织学分类数据集的挑战。他们部署增加反射等方法,随机裁剪,旋转,和翻译的形象。他们实现了分类精度99.5%和96.9%的二元分类任务使用2015 bioimaging乳腺癌组织学分类数据库和挑战BreakHis数据库而多级分类,分类精度达到96.4%在2015 bioimaging乳腺癌组织学分类数据库的挑战。Kassani et al。102年)转让一个学习架构用于乳腺癌的二元分类。他们使用VGG19, MobileNet, DenseNet架构四个基准数据集:BreakHis, PatchCamelyon 2015 Bioimaging挑战,2018年ICIAR数据集。他们用翻转、缩放、剪切、旋转、等,作为数据扩增方法。他们实现精度为98.13%,94.64%,95%,83.1%在这些数据集。作者在103年)提出了一种多级DL方法(8类)的组织病理学分类图像BreakHis数据集。数据扩增方法如旋转、翻转、分享,和他们的组合部署实现正确分类率为95.48%的多级分类的任务。Toğacar et al。104年部署一个DL多级模型(8类)分类BreakHis乳房组织病理学图像的数据集。他们使用卷积、注意力,残余,池和密集的街区超柱状体技术来建立自己的体系结构。作为数据扩增方法,他们使用翻转,改变,改变亮度,旋转达到98.51%的准确率。作者在105年)使用DenseNet和Xception转移学习架构良性或恶性二进制和magnification-specific多级分类任务。他们用BreakHis数据集达到99%和92%的准确性二进制和多级分类任务,分别,而部署污点归一化图像的预处理。Spanhol et al。106年二进制)进行实验(良性或恶性肿瘤)使用组织学图像分类任务。他们报告的准确性 从BreakHis获得图像数据集。作者在107年)提出了一种多级DL模型(8类)使用组织病理学图像分类任务。他们在BreakHis数据集进行了实验。为数据增加,作者部署旋转,水平/垂直翻转,翻译技巧,等等,他们的组合实现患者的立场的准确性 。Bardou et al。108年]cnn相比,传统的机器学习技术,如袋单词和线性编码使用支持向量机。他们部署BreakHis数据为二进制和多级(8类)分类任务分类图像为良性或恶性类及其子类。作者实现精度98.33%和88.23%的二进制和多级分类,分别使用部署方法。作者在109年)结合四个剩余网络二进制(良性或恶性)和多级分类使用BreakHis组织学图像数据集。他们实现了96.25%的准确性八级分类任务。作者部署旋转、翻转、翻译、和颜色变异增大数据增强方法,而染色标准化作为一种预处理方法。Budak et al。110年)使用DL模型结合FCN和bi-LSTM架构BreakHis数据集的二进制(良性或恶性)分类实现96.32%的准确性。作者在111年]DL-based模型用于二进制(良性或恶性)的组织病理学分类图像。他们进行实验融合ResNet-18 BreakHis数据集,ResNet-50, AlexNet使用信念理论架构。他们取得了一个映像级别精度为96.88%。Sudharshan et al。112年部署一个弱监督方案的二元分类良性和恶性肿瘤组织病理学图像。他们部署BreakHis数据集达到92.1%的精度在40 x放大。他们的方法的一个重要贡献是没有标签的图像的需要。作者在38]部署cnn对二进制(癌/ noncarcinoma)和多级原位(正常/良好/ /入侵)分类任务。他们用2015年Bioimaging乳腺癌组织学分类数据集在他们的研究挑战。架构能够检索信息在不同的尺度。对于多级分类任务,作者实现了77.8%,准确度对于二进制分类任务,他们实现了83.3%的准确性使用旋转和镜像数据增强方法对这些任务。Rakhlin et al。113年]部署不同的转移学习架构使用显微组织学图像ICIAR 2018挑战赛数据集的二进制(癌/ noncarcinomas)和多级(四类)分类任务。他们用pretrained ResNet-50,《盗梦空间》版本3,VGG16架构。他们部署正常化,缩小规模,种植和颜色变异增加方案实现多类分类的正确分类率为87.2%和93.8%的二进制分类任务。作者在114年)提取小/大补丁使用聚类方法和CNN (ResNet-50架构)在细胞和组织水平部署2015 Bioimaging乳腺癌组织学分类数据集的挑战。多级(4类)分类任务,作者报道88.89%使用该方法的准确性。作者部署污点正常化过程作为一种预处理方法。Shallu和用115年)演示了使用三种不同的转移学习架构,如VGG16 VGG19, ResNet-50组织学图像BreakHis数据集的分类。他们旋转的数据增强方案部署。他们发现的性能调整VGG16与逻辑回归分类器是最好的与这个分类器实现92.6%的准确性。作者在116年CNN部署,近邻(资讯),《盗梦空间》第三版,支持向量机和ANN算法的二进制(良性或恶性)分类的任务。他们使用不同的方案等预处理和数据增强灰色缩放、渠道标准化、翻转、旋转、裁剪以及图像分割使用安建筑达到97%的精度。Bevilacqua et al。117年)评估两种不同的二进制和不规则的多级分类框架/普通/恒星/不透明度从分段高分辨率图像病变。他们用安先用手工和形态学特征分类器框架。第二个框架,他们使用不同的CNN模型尤其是VGG模型。他们报道的准确性84.19%第一框架二进制和74.84%多类分类任务而第二框架,他们获得了一个二进制和多级分类任务的准确性为92.02%。作者在118年)做一个对比两种机器学习的方法对多类(8类)使用BreakHis数据集上的组织病理学图像分类任务。第一种方法使用手工制作的特性,而第二种方法使用CNN作为特征提取器。他们使用VGG16、VGG19 ResNet-50 CNN模型。他们使用旋转、平移、缩放和翻转数据增强方法。VGG16模型精度达到93.25%患者水平的多类分类的任务。Spanhol et al。119年)提出了DL模型重用以前训练CNN模型BreakHis实现一个数据集 - - - - - -90.3主题层面的得分。作者在120年)利用全球协方差信息使用矩阵幂正常化过程为一个简单的CNN模型。这样的安排可以利用二阶统计信息从组织学图像产生有效的表征。BreakHis数据集的二进制(良性或恶性)分类任务,他们实现了97.92%的准确性受到水平而采用种植和翻转操作来提高综合数据集的大小。汗等。121年)使用不同的传输学习(GoogLeNet、VGGNet ResNet)体系结构的二元分类良性或恶性肿瘤细胞而部署BreakHis和自定义数据集。为数据增加、缩放、旋转、翻译、和颜色增加他们所使用的方法实现正确分类率为97.67%。作者在122年]介绍了信息化架构,旨在利用临床信息。六种类型的记录100名被试的数据集,如遇到笔记、操作记录、病理指出,放射学指出,进展指出,和放电摘要。他们用调整变压器模型从pretrained双向编码器表示实现0.976关系识别的精度。奈克et al。123年]部署DL模型来评估雌激素状态从张幻灯片组织病理学图像。他们使用TCGA澳大利亚乳腺癌组织银行以及数据集在他们的研究中,进一步部署翻转,旋转,颜色抖动,断路正规化增强方法。他们的模型实现了AUC TCGA 0.861和0.905的AUC的澳大利亚乳腺癌组织银行数据集。作者在124年]相比不同的DL技术分类的乳房x光片。他们使用单一以及平均4模型进行实验INbreast以及一个独立的数据库。他们使用不同的数据增强技术,如翻转、旋转、强度变化和变焦。0.88单一模型实现了AUC,平均4模型实现了AUC 0.91独立的数据库。INbreast数据集,单一模型实现了AUC为0.95,平均4模型实现了AUC为0.98。他们的研究显示结合模型在单个模型的优越性。
表4显示一个乳腺癌的分类研究的总结本节。
4.4。分类的结直肠癌、胃癌、膀胱癌、肺癌,前列腺癌,皮肤癌、肝癌,头颈癌,胰腺癌,和其他类型的癌症
凯丝等。125年]部署不同的多级传输学习架构(9类)结直肠癌分类科目。他们使用VGG19, AlexNet、SqueezeNet GoogLeNet和ResNet-50模型在两个数据集的86和25日主题达成98.7%,大于94%的准确性。作者在126年]部署一个CNN架构从光学相干断层扫描(OCT)图像中提取特征的结肠直肠癌的主题。训练他们的网络使用26000 10月代表42个地区达到0.998的AUC图像。董et al。127年部署一个DL方法利用信息在多相CT在胃癌科目列线图。他们用三组测试的有效性模型实现歧视率为0.821,0.797,和0.822在初选中,外部验证,国际验证军团。Woerl et al。128年部署一个DL方法识别膀胱癌histomorphological图像。他们使用2 TCGA的407和16个科目每个数据集和自定义组,分别实现69.91%和75%的精度,TCGA和自定义子集,分别。王等人。129年)使用弱监督学习的想法利用映像级别标签肺癌分类的图像。他们使用两个数据集,一个从TCGA,另一个是一个定制的数据集。提高训练集、颜色抖动、翻译、翻转和旋转。
他们的模型成功地达到97.3%的精度和85.6%的AUC TCGA定制和数据集。卡里et al。130年)使用DL方法相结合三个独立的cnn使用不同的块大小有限的组织病理学分类的图像数据。他们使用新的数据增强方法如弹性变形和增强学习的空间特性的二元分类癌/良性和low-grade-high-grade补丁实现92%和86%的准确性,分别在两个二进制分类任务。Dascalu大卫[131年]DL架构用于二进制良性或恶性皮肤癌病例分类科目。他们用皮肤放大镜偏振光和一个先进的dermoscope构建自己的数据集。作者实现了F2-score敏感性分别为91.7%和89.5%与偏振光皮肤放大镜和先进dermoscope图像。作者在132年)使用DL技术建立一个二进制皮肤癌分类模型和多级分类的恶性和良性皮肤肿瘤。他们用高雄长庚医院和HAM10000数据集在他们的研究。他们的模型实现了85.8%的准确性第七班HAM10000数据集的分类任务。高雄长庚医院数据集,他们的模型实现了五级分类的准确性为72.1%和89.5%二进制分类任务。托马斯et al。133年)可说明的DL模型应用于皮肤癌的组织病理学分类设置。他们研究了三种类型的癌症基底细胞癌,鳞状细胞癌,表皮内的癌。他们部署了多级(12类)分类模型实现精度在93.6%和97.9%之间。解决类不平衡问题和增加数据集的大小,采用翻转和旋转作为数据扩增方法增加数据集的大小8倍。作者在134年)建立了一个CNN模型对黑色素瘤的分类和痣。他们使用一个数据集的11444张图片属于五个类别。他们部署小说DL技术训练一个CNN模型。此外,他们还要求112皮肤科医生等级的图像。然后,他们利用梯度增强方法开发了一个新的二元分类器(良性或恶性)和多级(5类)分类任务实现精度86.5%和82.95%这两个任务。太阳et al。135年)开发了一个DL肝癌主题分类方法,异常/正常TCGA公开可用的数据集。转移学习和多实例学习结合了补丁的分类特征。作者组织提取,使用颜色标准化和补丁提取组织病理学图像的预处理。刁et al。136年)使用一个传输上优于CNN建筑命名为《盗梦空间》第三版对鼻咽癌的主题分为三个类进行分类。他们用1970 731名受试者的图像。三个类考虑在他们的研究中,慢性鼻咽的炎症,淋巴增生,鼻咽癌。他们的模型实现了平均AUC是0.936。刘等人。137年)使用一个CNN分类器与胰腺癌诊断对象使用对比增强CT图像。他们用三个不同的数据集来测试他们的方法的有效性。第一个数据集命名为本地测试集1 295名胰腺癌患者和256名对照培训和75名胰腺癌患者和64名对照进行验证。第二个数据集命名为本地测试集2 101名胰腺癌患者和88名对照而第三集命名美国数据集有281例胰腺癌和82控制。在本地测试集1,本地测试集2,和美国的数据集,他们的模型实现了精度为98.6%,98.9%,和83.2%,分别。增加数据集,作者用移动窗口和翻转操作。Korfiatis et al。138年]ResNet-18的表现相比,ResNet-34, ResNet-50分类架构的核磁共振扫描155例的多级分类(3类)的肿瘤,甲基化methylguanine甲基转移酶甲基化,或nonmethylated类。ResNet-50架构实现最佳性能的准确性达94.9%;ResNet-34架构实现了80.72%的准确性而ResNet-18架构实现了76.75%的准确性。作者在139年)使用一个两阶段的培训学习和减轻类使用DL-based CNN模型biasedness乳腺癌组织学图像的分类。他们进行实验数据集使用MITOS12和2016年的肿瘤扩散评估的挑战。第一阶段的训练之前,使用全球二进制的阈值分割方法应用。在第一阶段,CNN是训练有素的分段补丁使用旋转和翻转数据扩增方法以及蓝色比直方图 - - - - - -意味着聚类方法。在阶段2中,数据集再次修改减少类不平衡产生的影响 - - - - - -测量0.79。坎帕内拉等。140年)提出了一个DL-based系统利用信息从多个实例以帮助病理学家排除在不影响性能指标的信息。他们用44732张幻灯片图片属于15187名患者。他们取得了AUC前列腺癌的敏感性高于0.98和100%,基底细胞癌,乳腺癌腋窝淋巴结转移。作者在141年)提出了两种DL-based系统检测骨髓白血病白血病基因微阵列数据集。第一个DL系统是一个单层神经网络,第二个有3个隐藏层。他们使用信息的22283个基因中提取基因表达综合库。他们的模型精度达到63.33%和96.67%的单层和多层DL架构的一个重要的标准化测试( )。贾亚拉贾撒母耳Nadar [142年)使用回归DL算法对高光谱图像诊断口腔癌。他们的系统补丁的分类提取到正常的,良性的,和恶性类使用BioGPS TCIA,环球数码创意数据集。100年恶性图像补丁训练,他们实现了91.4%,而500年的准确性恶性图像补丁训练,他们实现了94.5%的准确性。作者在143年)提出了DL方法研究基因变化和特征之间的关系。他们分析了6083个样本外显子测序文件属于12癌症类型。他们用TCGA和1000人基因工程。他们执行二进制(癌症/健康)和多级(12类)使用特定分类任务,道达尔(total)和混合模型实现精度为97.47%,70.08%,94.7%,具体,混合物,和总模型识别特定的癌症。欧维斯et al。144年]部署DL-based胃肠疾病的诊断分类框架内窥镜图像。他们部署两个公开的数据集:Kvasir数据集和Gastrolab数据集。他们遵循一个两步的过程。分类网络预测疾病类型在第一步中,然后在第二步中,检索部分显示了有关案件。他们执行多级(37类)分类使用DenseNet传输学习架构,LSTM架构中,PCA,资讯的方法来实现这个任务96.19%的正确识别率。作者在145年多级]提出了CNN-based DL架构(4类)急性淋巴细胞白血病的分类。他们用彩色骨髓图像实现97.78%的准确性。萤石et al。146年]部署一个3 d CNN模型来确定淋巴结外侵犯淋巴结的转移和肿瘤。CT样本数据集有2875个,124个样本进行验证和131个样本进行测试。他们用一系列的旋转和翻转技术来增加数据集而实现的AUC 0.91。作者在147年)提出了DL方法研究有限样本训练问题从全息图像。他们研究了健康的分类和癌症细胞系。他们使用生成对抗网络(甘斯)作为数据扩增方法培养大量的未分类样本的精子细胞。他们的模型实现了99%的准确性对健康/主要癌症转移性癌多类分类问题。
表5显示任务的研究的总结分类的癌症在本节。
4.5。分类、分割、预测和检测脑瘤
太阳et al。148年)提出了一个3 d完全卷积网络multipathway架构从MRI图像中提取特征的小鬼们2019年挑战大脑肿瘤的分割区域。他们用扩张的卷积的概念在每个通路实现骰子得分为0.89,0.78,0.76,整个肿瘤(WT),肿瘤核心(TC),和增强肿瘤(ET)的小鬼们2019的挑战,分别。他们使用裁剪,随机切片, - - - - - -分数归一化预处理方法。作者在149年)提出了一个新颖的架构结合U-Net编码和解码subarchitecture,扩张卷积特性提取层,剩余模块。他们建议的体系结构实现了骰子得分是0.843,0.897,0.906和0.798,0.902,0.845等,WT,和TC脑瘤亚区2018年和2019小鬼小鬼的挑战,分别。他们使用归一化预处理图像和种植技术。汗等。150年]VGG16和VGG19转移上优于CNN模型,利用偏最小二乘法的协方差矩阵,离散余弦变换,和分类特征的提取和极端的学习机器在2015年小鬼,小鬼们2017年,小鬼们2018年挑战数据集达到97.8%的精度,96.9%,2015年92.5%,小鬼,小鬼们2017年,分别和小鬼2018数据集。之前,图像预处理喂养他们的分类模型,作者使用了直方图均衡化方法。裴et al。151年)提出了一个联合深和基于机器学习模型分类、分割和脑部肿瘤的预测。使用上下文感知CNN架构细分,3 d CNN分类架构,并为预测套索,作者实现了骰子得分是0.821,0.895,0.835等,WT,和TC地区,分别在小鬼2019细分任务,精度为58.6%的生存预测任务的小鬼2019数据集,和平衡精度63.9% 2019计算精度的测试集医学Radiology-Pathology (2019 CPM-RadPath)的挑战。作者在152年]提出节约型CNN模型集成内存连接和一个自适应密度块分割的脑瘤。他们使用了小鬼们2015数据集的验证模型和挑战 - - - - - -分数标准化作为一种预处理方法实现一个骰子系数得分是0.858,0.816,和0.818 WT、TC、等条件。Badža和Barjaktarović153年]目前22-layered CNN架构脑瘤t1加权磁共振图像分类属于三类:脑膜瘤、胶质瘤、垂体肿瘤。他们规范化和调整扫描 像素90°旋转和垂直翻转增强综合方法来增加数据集的大小。作者实现了多级分类任务的准确性为96.56%一个定制的数据集。作者在154年)提出了一个基于迁移学习方法脑部肿瘤的分割和分类使用《盗梦空间》版本3-based特性。他们连接CNN-based特性与基于局部二进制模式——(LBP)特性。对比改进作为预处理方法。作者实现了骰子得分是0.8373,0.937,0.7994,TC, WT、和等条件的小鬼2017数据集和骰子得分为0.8834,0.912,0.8184,TC, WT,等条件的小鬼2018数据集。分类任务,作者实现了92%的平均精度向上在2013年小鬼,小鬼们2014年,2017年小鬼,小鬼们2018数据集。Rai et al。155年)提出了一个使用跳过U-Net-based DL模型连接的分类、分割,检测肿瘤的大脑核磁共振扫描。他们进行实验的低档次的神经胶质瘤120例,TCGA数据库1373扫描病人和2556扫描正常控制。作者部署裁剪、调整、全球像素归一化,水平翻转,翻转和旋转,随机旋转,旋转转移规模,换位,模糊,高斯模糊、随机γ,随机亮度,和归一化预处理和数据扩增方法。他们的模型实现了分类精度99.7%的任务,一个骰子得分0.9573细分任务,和0.86 Jaccard指数检测任务。作者在156年)的性能进行了比较和对比不同传输二进制分类的学习架构脑部肿瘤为良性和恶性类别。他们选择AlexNet、GoogLeNet ResNet-50, resnet - 101, SqueezeNet架构进行比较。他们雇了一个数据集224良性的类别和472年的恶性类别t1加权磁共振图像从TCIA获得公共访问存储库。他们使用调整、翻转、镜像、盐噪声,和旋转预处理和数据扩增方法使用AlexNet-type架构实现了99.04%的准确性。冯et al。157年)建立了一个3 d U-Net模型对大脑肿瘤的分割。他们拿起一个整体的模型从大脑中提取功能核磁共振图像分割的小鬼们2018年挑战和生存的预测。作者实现了骰子得分(0.7946,0.9114,和0.8304)的(ET、WT和TC)条件细分任务和一个生存预测精度32.1%的任务。作者在158年)提出了一个深刻的CNN并行模型的架构整合两个和三个路径在一个单一的模型。他们使用2 d切片的脑核磁共振图像的小鬼们2013数据集实现一个骰子的分数(0.86,0.86,和0.88)(WT、TC和ET)条件。作为一个预处理步骤,他们标准化片使用零均值和单位方差归一化过程。nas和宗教159年)提出了DL方法结合U-Net架构,VGG16转移学习架构,和一个完全连接体系结构分类和成低级脑核磁共振图像分割属于110名患者的神经胶质瘤。他们使用规范化,裁剪、调整、填充,重新调节,旋转,缩放,转移、剪切和翻转预处理和数据扩增方法。他们的方法实现了骰子得分0.84分割任务和准确性,敏感性和特异性92%二进制分类(II级/三级)的任务。作者在160年CNN)提出了一种多尺度三维体系结构的识别和细分220高,54低档神经胶质瘤MRI扫描数据集的小鬼们2015年挑战。作为一种预处理方法,作者使用直方图匹配,以确保一致性在灰色的水平。他们的模型实现了骰子得分是0.89的话,细分任务,敏感性为0.89,特异性为0.90的识别任务。Chang et al。161年)提出了DL模型结合平均池和最大池层 内核。他们进一步结合该模型与条件随机域优化预测结果。作者使用了小鬼们2013数据集达到骰子得分(0.80,0.75,和0.71)(WT、TC和ET)条件。作为一种预处理方法,作者使用了一个强度归一化法。作者在162年)提出了一种多尺度CNN模型分类的核磁共振扫描到健康、脑膜瘤、胶质瘤、垂体肿瘤类别。作者使用2 d从当地医院在中国获得的核磁共振图像进行实验。他们取得了骰子得分(0.894,0.779,0.813,0.828)在(脑膜瘤、胶质瘤、垂体肿瘤,和平均),分别和准确性97.3%的分类任务。预处理和数据扩增方法,作者使用像素标准化和弹性变换方法。
表6显示一个总结研究的分类、分割、预测、检测脑瘤本节。
5。讨论
肿瘤生长的动力学对时间难以估计。精确的措施可以很大程度上在癌症的发展周期的结束,当它从身体分离。正在进行的克隆突变提供了一个丰富的历史血统导致基因型和表型的变化。
Psycho-oncology是肿瘤学的一个分支,直接与心理和社会问题。它涉及情感和心理生物学方面的癌症。然而,仍然有许多障碍等广泛采用的医疗从业者的缺乏以及评估工具和支持工具。重要的是,心理和精神生物学因素影响癌症的治疗方式。这个域必须满足要求的可用性资源,支持护理人员和病人,和雕刻出热情的新研究方向的研究人员(163年,164年]。
人工智能的研究已经证明它的价值在医疗决策的支持。由于这些算法的未知特性,广泛采用的仍然是有限的。说明人工智能算法提供了一个解决这个问题的。然而,性能问题可能会阻碍他们收养。鲁棒性、本地归因和完整性是一个可辩解的AI系统的三个关键属性。为了解决这一问题的方法之一是找到最优的策略合并可辩解的和nonexplainable人工智能模型。一些解决方案,指出在这个方向上赢得临床医生的信心标志着区域在图像中所涉及人工智能预测;另一种方法是攻击或欺骗DL模型通过对抗性的对应,因为它可能揭示了重要的特点和丢弃不重要的。有一个可解释性和explainability之间有着密切联系。可辩解的模型是可翻译的,但反向连接可能撑不住了。 A prediction relying on thousands of parameters is neither interpretable nor explainable [165年,166年]。
精确的DL模型预测依赖于大型语料库的数据的可用性(标签或未标记的),它是一个挑战训练在一个相对较小的数据集。看这个问题的一种方法是通过了解遗传进化的过程。基因转移从父母遗传信息的转移到其后代。基因编码遗传指令(知识)的祖先的后代。祖先不一定有更好的知识;然而,跨代的进化知识促进更好的学习曲线的后代。需要方法,可以模仿这种行为和使用有限数量的例子来达到他们所期望的性能在不同的任务167年]。灾难性的遗忘是另一个问题限制了现代网络的性能,因为他们缺乏学习能力从连续的数据流。特征表示的质量大大决定了遗忘。增加二次信息是提高特征的可转让性的关键从旧到新的任务没有忘记,是一个有前途的未来工作方向168年尤其是对癌症诊断,预后和预测。
尽管研究人员宣称多级分类是一个非常困难的问题,需要更深入地理解人类视觉感知超越大型数据集,和DL也许是需要解决许多领域问题[169年)包括癌症诊断、预后和预测。
值得一提的另一个挑战是寻找复杂的分层模式等各种形式的数据信息集成标记和未标记的方式来执行视觉推理。无监督和semisupervised学习可以帮助在这个方向,提供可能的解决方案,帮助我们深入研究癌症的发病机理和预测任务(170年]。
我们能从另一个域使用真实世界的图像校准?桥跨域校准之间的差距,在域校准需要从神经网络获得最佳性能。技术,如格拉姆矩阵相似性可以用作标准选择校准数据集从候选池进一步提高性能171年]。这个过程可用于有效的癌症诊断功能建设,预后和预测。
现代DL对象检测网络严重依赖地区建议计算算法来确定物体的位置。然而,地区建议计算是一个缓慢的任务。更快的地区cnn解决这个问题通过共享卷积与对象检测子系统层。这个过程需要进一步研究,需要改进的轻量级方法计算(25,26]。癌症病变检测可以提高通过深入研究在这一领域。
现代DL网络严重依赖全球形象统计数据。这种依赖可能会导致某些问题为形状和纹理识别这些系统往往是更好的在当地,而不是全球层面上完成的。研究在这一领域可以带来更好的网络泛化(172年)控股的潜力提高癌症诊断,预后和预测。
缓和梯度爆炸或衰变RNN培训基于考虑在信息输入加强他们的贡献在隐藏状态,为此寻找计算有效的方法抑制噪声在小说输入或施加约束是一个值得研究的问题(173年]。
图像识别和计算机视觉图像生成两个基石。虽然两者都是新兴的领域,专业技术从分区有时可以形成一个二分法。从历史上看,DL领域被广泛推广与AlexNet区别的图像分类体系结构和图像生成通过甘斯和变分Autoencoders (va)。小说数据扩增方法,迫使网络关注的时刻提取层深度网络是需要时间的174年),可以提高模型的性能在癌症诊断、预后和预测。
进一步的研究也应该目标的发现小说对象(如有异常组织,罕见的肿瘤,和异物),可判断的DL模型(使用影响函数或一个注意力机制),术中决策、和肿瘤浸润免疫细胞分析。一些问题,如张幻灯片的外观形象不整齐的质图像和颜色变化和文物可能阻碍DL的性能技术(175年)对癌症诊断、预后和预测。
不同类型的成像模式像乳房x光检查,CT, MRI和超声有助于癌症的分期尤其是乳腺癌。这些系统已经帮助医护人员在乳腺癌的早期识别176年]。乳腺癌,不同类型的乳房密度使大众很难检测和分类相比,钙化提供进一步的研究在这一领域的空间177年]。
其他领域潜在的研究缺乏数据,不平衡数据集,缺失的数据,高维度的患者数据。未来的工作应该专注于测试和改进方法实现性能更好的DL模型对癌症诊断、预后和预测任务。
6。结论
DL革新了癌症的诊断和预测模型。接受各种形式和多个数据源的数据。这些模型都是很好的特征提取器,他们的特征可以提高癌症预后和预测。数据增强癌症诊断和预测是非常重要的任务来提高系统的最终性能。这些方法将发挥关键作用在预测癌症诊断和预测任务。然而,需要进一步的测试和验证临床应用的更大的数据集。更多的研究数据扩增方法,学习在频域等不同领域,小说和部署架构如图卷积网络可能会进一步改善他们的表现。
数据可用性
没有数据被用来支持本研究。
的利益冲突
之间不存在任何利益冲突的作者对目前的研究。
作者的贡献
A.B.T.构思和设计研究。Y.K.M. M.K.A.K.进行分析。所有作者写道,修订草案手稿。
确认
我们愿意承认该组织努力在这个研究。