JHE 医疗保健工程 2040 - 2309 2040 - 2295 Hindawi 10.1155 / 2021/7467261 7467261 研究文章 HybridCTrm:桥接CNN和变压器多通道脑图像分割 https://orcid.org/0000 - 0002 - 7149 - 4912 太阳 Qixuan 1 2 Nianhua 1 2 https://orcid.org/0000 - 0003 - 4576 - 9967 3 https://orcid.org/0000 - 0001 - 6301 - 1311 1 2 Youpeng 1 2 鸿祥 1 2 总部位于 1 重点实验室为辽宁省的无处不在的网络和服务软件 大连 中国 2 软件技术学院 大连理工大学 大连 中国 dlut.edu.cn 3 大连医科大学第一附属医院 大连 中国 dlmedu.edu.cn 2021年 1 10 2021年 2021年 9 7 2021年 3 9 2021年 16 9 2021年 1 10 2021年 2021年 版权©2021 Qixuan太阳et al。 这是一个开放的文章在知识共享归属许可下发布的,它允许无限制的使用,分布和繁殖在任何媒介,提供最初的工作是正确的引用。

多模态医学图像分割在医学图像分割一直是一个至关重要的问题。传统的深度学习方法充分利用cnn对编码图像,从而导致缺乏长程相关性和坏的泛化性能。比起最近,一系列的基于变压器方法在图像处理领域的出现,这让伟大的泛化和性能在不同的任务。另一方面,传统的有线电视新闻网有自己的优势,比如快速收敛和局部表示。因此,我们分析一个混合多通道分割方法基于变压器和cnn和提出一个新颖的建筑,HybridCTrm网络。我们进行实验使用HybridCTrm两个基准数据集和与HyperDenseNet相比,基于完全cnn的一个网络。结果表明,我们的HybridCTrm优于HyperDenseNet大部分的评价指标。此外,我们分析的深度的影响变压器的性能。此外,我们可视化结果和认真探索如何改进分割我们的混合方法。

中国国家自然科学基金 61906030 辽宁省自然科学基金 2020 - bs - 063 中央大学基础研究基金 DUT20RC 009 (4)
1。介绍

医学图像分割是一个重要的区域在医学图像分析和诊断和治疗是必要的,其目的是将图像中每个像素。出于深度学习的最近的成功,研究人员在这个领域也试图应用基于深度学习医学图像分割方法,包括U-Nets [ 1- - - - - - 6)和完全cnn ( 7- - - - - - 13]。这些方法取得了优越的性能比传统方法在医学图像分割任务。为了获得更准确的分割对于高级诊断,使用多通道医学图像已经越来越普及。与单一的图像相比,多通道图像有助于从不同的视图和带来的额外信息,提取特征导致不同的数据表示和区别的电力网络。以前作品通常遵循一个完全CNN架构,CNN的患有天生的缺陷。这些缺点包括缺乏在提取非局部特性和糟糕的泛化。随着变压器的发展在语言处理,比起这些的基于变压器也吸引太多的注意在图像处理方法 14- - - - - - 18),包含分类、检测和分割。这些成功的应用程序显示了伟大的能力比起的非局部特征提取的基于变压器结构图像。然而,它不能被直接利用多模态医学图像分割。这些作品有pretrained各种图像和生成的先验知识和表示。Pretraining self-supervised和辅助一步,比起至关重要的基于变压器的方法,因为这些方法无法轻易提取足够的意义表示通过简单的任务,因此需要从Pretraining先验表示。然而,多通道医疗缺乏图像分割任务,因此不能遵循pretraining策略。

为了解决这些问题,我们设计一个名叫HybridCTrm混合架构结合优势从cnn和变压器。具体地说,这些网络编码图像从CNN和变压器,两个平行的和独立的路径,然后整合表征解码和分割。这样,cnn生成和控制当地表示梯度下降法的快速收敛,而变压器提取非局部特性和避免过度拟合和局部最优的postperiod培训。针对完全测试我们的方法,我们提出了两种融合策略,即单一路径策略和多路径策略,并应用我们的方法在这两个不同的策略。实验,结果表明,我们的方法可以有效地克服美国有线电视新闻网和《变形金刚》的缺点,我们显示一个伟大的多通道的性能改善医学图像分割任务。此外,我们可视化结果和认真探索如何改进分割我们的混合方法。

2。相关的工作 2.1。多模态医学图像分割基于cnn

多模态医学图像分割来源于医学图像分割任务,这两个目标实现为一个输入图像进行像素级分类。传统的医学图像分割方法一般遵循encoder-decoder架构,如U-Net [ 5和完全CNN 12]。在这些结构中,一个编码器解码器时通常是用来提取功能恢复特性和输出最终的分割提取预测。U-Net [ 5)已被广泛用于医学图像分割,包括卷积、池、skip-connection。克等。 2]扩展U-Net架构3 d图像的应用,提出了3 d U-Net。Milletari et al。 4]提出V-Net,剩余为更深层次的网络连接。同样,Yu et al。 1]提出VoxResNet,李et al。 3肖)提出3 drunet, et al。 6]Res-UNet求婚。在多模态医学图像分割领域,研究人员通常应用完全CNN架构。有效地使用信息从不同的形式,聂et al。 11)提出了一种新的完全CNN架构的多通道婴儿脑组织分割。Kamnitsas et al。 10单独训练三个完全cnn然后平均每个网络的信心。陈等人。 7)提出了一个dual-pathway完全CNN multimodal脑瘤分割网络。王等人。 13)提出了一种级联各向异性卷积网络。Dolz et al。 19)提出了一个3 d完全基于DenseNets CNN ( 8]。

2.2。基于变压器的图像处理

变形金刚第一次被应用于自然语言处理任务。Vaswani et al。 20.)提出了机器翻译attention-pure架构叫变压器和句子解析。Devlin et al。 21提出伯特,一个双向变压器两步训练pretraining和微调。布朗et al。 22训练一个更大的变压器。比起最近,一系列的基于变压器方法在图像处理领域出现( 14- - - - - - 18]。其中,视觉变压器( 16和检测变压器 14)是最重要的。检测变压器制定了检测任务作为一个连续的预测。视觉变压器(ViT)裁剪图像序列的小补丁,旨在适应原来的变压器的结构。维特证明它的力量在远程依赖和表现出极大的性能,因此被视为一个强大的支柱。

3所示。方法 3.1。体系结构概述

在多模态医学图像分割的目的是为每个像素分配标签不同形式的给定的输入图像。我们建议两个混合架构多通道医学图像分割如图 1。具体来说,我们提出两个模型基于两种不同的策略:单一路径策略和多路径策略。图 1(一)描述了一个单一路径的策略是如何工作的。我们把MRI-T1 MRI-T2作为输入模式。这两个模式 x1, x2结合多通道图像 x1、2然后用旋转编码的图像层和变形金刚 n层。表示分别从这两个编码器生成并为后续解码独立和集成。多路径的策略是非常类似于单一路径,输入不同的方式和图 1 (b)告诉的区别。MRI-T1 ( x 1 )和MRI-T2 ( x 2 收集)编码与独立的编码器和表示。多路径网络可以有效地结合,充分利用这些信息从不同的形式和特点,而单路一个更关注于如何不同的方式相互作用。我们工作中最关键的部分是,我们使用变压器和旋转,作为两个单独的编码器,我们将仔细描述编码器在其余的部分。

两个混合架构。(一)混合Convolution-Transformer模型用一个路径。(b)混合Convolution-Transformer与多路径模型。

3.2。卷积编码器

为了避免梯度消失和爆炸,DenseNets [ 8]skip-connections申请直接将每一层添加到后续层。提到的启发点,我们保持这个想法卷积编码器。

如图 2,一个卷积层由四个部分组成,批处理规范化,PReLU, 3 3 3卷积核,skip-connection。它是计算如下: (1) x l = Conv 3 3 3 PReLU BN x l 1 , x l 1 , 在哪里 x l 的输出是什么 l 卷积和th层 x l 1 是这一层的输入。特别是,当 l 代表第一层 l = 1 ,然后 x 0 是输入的图像。多路径的策略,它代表一个形态 x 在哪里 不大于形态号码吗 n 。同样的, x 0 代表输入模式的结合 x 1、2 , , n 当涉及到单一路径模型。

卷积编码器。

3.3。变压器编码器

避免过度拟合和缺乏外地依赖性产生完全cnn,我们应用变压器编码多通道图像和模型的泛化。《变形金刚》( 20.]被首先应用于自然语言处理,最近一部小说变压器结构命名的愿景变压器(ViT) [ 16提出了]。维生素在图像分类任务表现很好和很快被接受作为图像处理的常见的脊椎。

受生命的启发,我们修改和应用变压器多重模态医学图像分割如图 3。首先,我们重建三维图像 x ^ 0 H × W × D × C 为一系列三维立方体夷为平地 x p N × P 2 C ,在那里 N 序列的长度是: (2) N = H W D P 2 , 在哪里 H , W , D , C 的高度、宽度、深度和起源的3 d频道形象吗 x ^ 0 。多路径模型, C = 1 因为每个输入图像代表一个单一的形态。为单一路径模型, C 是形态数量 n P 是数据集的大小。

变压器编码器。

我们得到一个补丁序列 x p 从上面的方程。变压器应用一个常数的大小 D 每个隐层的维度。因此,我们线性项目 x p D 维度和添加一个位置嵌入补丁包埋: (3) x 0 = W x p + x pos , 在哪里 W 是一种可习得的投影参数和 x pos 是一种可习得的位置向量。位置嵌入 x pos 一样的尺寸吗 x p 。具有十分重要的图像处理由于变压器不生成位置信息,需要补充输入。输出,补丁包埋 x 0 ,被视为输入变压器的第一层。

之后, x 0 投入是一个多层变压器: (4) x tmp = MHSA LN x l 1 + x l 1 , x l = = FFN LN x tmp + x tmp , 在哪里 x l x l 1 输出和输入的吗 l th层变压器编码器。LN(归一化层)是一种常见的设计在变压器和FFN(前馈网络)包括两个PReLU线性预测和非线性激活函数。MHSA(多线程Self-Attention)是《变形金刚》的关键部分,仔细在下面描述。

不同于常见的变压器在图像处理领域像维特 16),我们修改LN的位置。熊等。 23]证明了训练时更稳定的正常化块出现在残块。在我们的工作中,多通道的医学图像分割不能利用pretraining过程如维特和因此导致训练时波动较大。因此,我们这个修改变压器架构应用于网络。

MHSA(多线程Self-Attention)是《变形金刚》的核心,它可以被视为一堆几个简单的关注网络。一个简单的注意机制可以计算如下: (5) 丙氨酸 , K , V = softmax K T d k V , 输入的多次复制然后分离为独立(查询) K(钥匙), V(值)与他们的维度 d , d k , d v ,分别。

多个叠加使用简单的关注可以专注于不同的陈述不同的子空间。因此,MHSA项目, K, V到不同的子空间,独立进行关注与输出: (6) MHSA , K , V = Concat 1 , , h W O , 在哪里 = 丙氨酸 W , K W K , V W V , 预测参数矩阵在哪里 W d 模型 × d k , W K d 模型 × d k , W V d 模型 × d v , W O h d v × d 模型 d 模型 是变形金刚的每个隐层的维度。

3.4。译码器

我们使用 l th层变压器编码器的输出 x l trm k th层CNN编码器的输出 x k 美国有线电视新闻网 从变压器和CNN表示提取的特征。然后,我们把这些功能整合进一个矩阵 x f : (7) x f = x l trm x k 美国有线电视新闻网 , 在哪里 代表concat操作。然后,功能 x f 发送到译码器组成的吗 l 层与批处理规范化、PReLU和1 1 1卷积核,计算如下: (8) x l f = Conv 1 1 1 P 再保险 l U B N x l 1 f , 最后的输出层 x l f 发送到Softmax函数 p x 最后分割。

3.5。损失函数和学习速率衰减

我们应用一个共同的熵函数作为我们的成本函数。让 θ 表示网络参数和 y 年代 v 像素的标签 v 年代 届图像部分。我们优化如下: (9) J θ = 1 年代 V 年代 = 1 年代 v = 1 V c = 1 C δ y 年代 v = c 日志 p c v x 年代 , 在哪里 p c v x 年代 是将softmax网络的输出像素 v 和类 c ,当输入部分 x 年代

我们利用余弦学习速率衰减,衰减策略: (10) η t = η 最小值 + 1 2 η 马克斯 η 最小值 1 + 因为 T 坏蛋 T π , 在哪里 η t , η 马克斯 , η 最小值 代表学习速率、最大的学习速率,分别和最小的学习速率。 T 坏蛋 是递归和迭代号码 T 是当前迭代的数字。

4所示。结果与讨论

我们进行我们的实验两个基准数据集,MRBrainS [ 24)和iseg - 2017 ( 25]。医学图像分割都是多通道数据和关注分段三种类型的大脑组织,包括白质(WM),灰质(GM)和脑脊液(CSF)。他们之间,MRBrainS triple-modal分割数据集和iseg - 2017是一个double-modal。

4.1。实验设置

而子卷的大小 27 × 27 × 27 被认为是培训中,我们使用吗 35 × 35 × 35 不重叠的子卷在推理,如( 19, 26, 27]。我们讨论了给定图像的裁剪和压扁在前面的部分。其中, P 多维数据集的大小,计算成本和性能是至关重要的。当 P = 1 ,MHSA可以计算每一个像素。然而,它会导致高计算成本和超越有限的GPU资源。有一个大 P 、变压器不能有效地捕获功能。基于这两点,我们集 P = 3 。变形金刚,我们将头部设置为4,隐藏的维度是128,和深度4根据实验性能。初始化权重卷积的路径,我们采用策略提出了 28),产量快速收敛很深的架构。在这一战略中,零均值高斯分布的标准差 2 / n l 用于初始化层的重量吗 l ,在那里 n l 表示层的单位的连接数量。最初的学习速率( η 马克斯 )被设置为1 e−4。余弦衰减, η 最小值 是5 e−5和 T 坏蛋 是50。考虑到GPU资源有限,我们将批量大小设置为32。

我们比较模态与几个完全CNN-based架构,包括fCNN [ 12), 美国有线电视新闻网 ( 27), 美国有线电视新闻网 女士 ( 27],HyperDenseNet [ 19]。fCNN [ 12)是第一个方法,应用cnn分割任务。然后,Dolz et al。 27)设置一个较小的内核隆起和呈现两种方法包括传统的和多尺度。HyperDenseNet [ 19)是一种常用的fCNN-based法在多通道图像分割任务。这些模型可以有效地与我们的混合模型相比,HybridCTrm。相当与基线相比,我们用两种策略进行实验,分别单路和多路,设置一个后缀,如- multi和单一,为每个方法。

我们应用骰子相似系数(DSC)作为评价指标,常见的分割评价方法( 19, 26, 27]: (11) DSC = 2 TP 《外交政策》 + 2 TP + FN

5。结果MRBrainS

我们MRBrainS leave-one-out-cross-validation申请five-sample数据集,也就是说,四个样本训练和测试。我们报告三组织DSC (CSF,通用和WM)和他们的平均水平。

5.1。主要结果

1总体结果显示我们的方法和基线MRBrainS,得分最高的每一列是大胆的。

MRBrainS主要结果。

脑脊液 通用汽车 WM 的意思是
fCNN-Single [ 12] 52.55 73.62 74.82 66.99
fCNN-Multi [ 12] 67.03 80.59 62.50 70.04
美国有线电视新闻网 单( 27] 58.49 74.66 71.31 68.16
美国有线电视新闻网 - multi [ 27] 62.26 81.93 81.67 75.29
美国有线电视新闻网 -MS-Single [ 27] 42.88 70.02 80.66 64.52
美国有线电视新闻网 -MS-Multi [ 27] 64.08 82.09 59.23 68.46
HyperDenseNet-Single [ 19] 49.12 84.14 85.85 73.04
HyperDenseNet-Multi [ 19] 72.90 85.06 70.64 76.20
HybridCTrm-Single 75.09 85.30 8 8 5 4 82.98
HybridCTrm-Multi 7 6 5 3 8 5 5 2 88.37 8 3 4 7

一般视图显示,我们的混合网络达到每个指标上的得分最高。有一个清晰的对比,我们首先比较两个简单路径模型。我们与HyperDenseNet大多比较我们的方法,因为这个模型对每个执行CNN-based架构之间的最佳策略。与HyperDenseNet-Single相比,HybridCTrm提高约3%,1%,和26%在WM,通用,分别和CSF。同时,平均得分表现为10%。对于多路径模型,CSF HybridCTrm-Multi提高4%和18%,相比HyperDenseNet-Multi WM组织。然后,我们专注于同一个模型的性能在不同的策略。通用汽车和CSF分段组织,多路径策略是更合适的,而单一路径在WM表现更好。这可能推断,不同形式的分段通用和CSF信息,需要独立编码,然后相互集成,而对于WM恰恰相反。

5.2。分析Hyperparameters

为了更好地分析变压器对性能的影响,我们进行实验和不同深度的变压器设置。

4显示深度如何影响性能单路和多路径模型。HybridCTrm-Single, DSC到达峰值平均深度为4。曲线增加首先然后下降随着深度的增加从1到5。HybridCTrm-Multi,峰值到达的深度5和新潮的曲线非常相似,从上升到下降。这类似的趋势可能是因为不同深度捕捉不同表示形式和一个合适的深度可以提取分割的最有效的信息。

表演不同深度的变形金刚。

5.3。烧蚀研究

我们的混合架构由一个CNN编码器和变压器编码器获取本地和外地特性分割。CNN和变压器分支研究如何影响我们的混合模型,我们进行消融研究。如表所示 2我们单独的CNN分支和变压器分支,分别基于单一路径模型和多路径模型。删除CNN分支后,意味着DSC针对单一和多策略下降约48%和46%,分别虽然下降约16%和13%,消除变压器分支。这表明与变压器分支相比,CNN分支更重要,因为外地特征提取的变压器编码器细分发挥辅助作用。

烧蚀研究。

脑脊液 通用汽车 WM 的意思是
HybridCTrm-Single 75.09 85.30 8 8 5 4 82.98
W / o CNN分支 30.39 44.91 54.64 43.31
W / o变压器分支 56.18 84.11 68.64 69.64
HybridCTrm-Multi 7 6 5 3 8 5 5 2 88.37 8 3 4 7
W / o CNN分支 32.72 50.36 52.48 45.19
W / o变压器分支 75.32 81.48 62.03 72.95
5.4。用双通道辅助实验

进一步分析分割不同的形式的重要性,我们选择两个模式和双通道进行辅助实验。

如表所示 3,三个形式表现的更好的结果比两种形式。然而,仔细比较结果清楚地表明,基于T1和T2-FLAIR模式最低性能下降(只有2% -3%),表明这两种方法具有较强的互补性。其他两个模态的组合、T1和T1-IR T1-IR T2-FLAIR,显示显著的性能退化(10% - -13%),表明T1-IR形态并没有带来更多的信息。CSF的性能,进一步比较通用,WM组织显示的性能组合的T1和T2-FLAIR CSF和WM可比的三个模式下相应的策略。和前下甚至比后者高0.6%多路径策略,这表明在这两个模式的信息足以段CSF和WM组织。这表明这两种形式的信息足以段CSF和WM组织。相反,转基因组织分割的性能是最好的只有三个模式中的信息是完整的,有5% - -6%的退化在其他两个方法的结果。

辅助结果与双重形态。

形态 脑脊液 通用汽车 WM 的意思是
HybridCTrm-Single T1, T1-IR 53.89 79.75 81.88 71.84
HybridCTrm-Single T1, T2-FLAIR 75.09 79.88 87.92 80.96
HybridCTrm-Single T2-FLAIR, T1-IR 56.13 79.78 69.94 68.61
HybridCTrm-Single 3模式 75.09 85.30 88.54 82.98
HybridCTrm-Multi T1, T1-IR 69.88 78.17 71.68 73.25
HybridCTrm-Multi T1, T2-FLAIR 74.07 78.97 8 8 8 9 80.64
HybridCTrm-Multi T2-FLAIR, T1-IR 68.54 80.20 64.17 70.97
HybridCTrm-Multi 3模式 7 6 5 3 8 5 5 2 88.37 8 3 4 7
5.5。结果iseg - 2017

我们把iseg - 2017和10个样本数据集分为训练集(火车),一组开发(dev),和一个测试集的比率(测试)8:1:1。详细的结果展示在表 4,每一项大胆的最大值。

主要结果iseg - 2017。

Dev 测试
脑脊液 通用汽车 WM 的意思是 脑脊液 通用汽车 WM 的意思是
fCNN-Single [ 12] 89.21 86.56 78.31 84.55 85.66 83.13 82.84 83.87
fCNN-Multi [ 12] 89.98 85.35 78.31 84.55 85.66 83.13 82.84 83.87
美国有线电视新闻网 单( 27] 92.42 89.00 81.74 87.72 88.59 85.47 83.47 85.84
美国有线电视新闻网 - multi [ 27] 93.13 89.24 82.73 88.36 88.92 85.85 85.26 86.68
美国有线电视新闻网 -MS-Single [ 27] 92.75 89.59 82.98 88.44 88.69 85.95 84.36 86.33
美国有线电视新闻网 -MS-Multi [ 27] 92.81 89.77 82.01 88.20 89.35 85.71 83.09 86.05
HyperDenseNet-Single [ 19] 92.24 88.58 81.18 87.33 88.59 85.40 83.92 85.97
HyperDenseNet-Multi [ 19] 92.99 89.39 83.24 88.54 88.85 85.87 8 5 3 5 86.69
HybridCTrm-Single 93.38 88.66 82.21 88.08 89.24 85.90 85.11 86.75
HybridCTrm-Multi 9 3 4 6 9 0 2 6 8 3 7 1 8 9 1 4 8 9 7 5 8 6 4 0 85.34 8 7 1 6
5.6。主要结果

首先,我们HybridCTrm网络优于7八个指标在所有这些方法。与HyperDenseNet-Single相比,HybridCTrm-Single优于所有指标。这是因为单路径策略中的信息集成在一开始,和变压器结构可以完全模型这个复杂的信息。在多路径策略,HybridCTrm-Multi也优于HyperDenseNet-Multi 7个指标,进一步验证变压器的建模能力。然而,获得大不如单一路径模型。这可能是因为每个形态的信息内容是小,所以变压器不能用有力的归纳学习足够的功能,如CNN的偏见。

5.7。泛化和稳定性的分析

已经得出的结论是,混合模型比纯fCNN模型小,我们也担心模型的稳定性和泛化性能。

5显示了两种模型的性能发展集和验证集的两种策略下后每5时代。左边的面板显示了两种模型的性能在单一路径策略。红线代表HybridCTrm和蓝线代表HyperDenseNet,同时实线代表性能发展集和测试集上的虚线代表。可以看出HybridCTrm总是比HyperDenseNet在两个模型的早期和晚期阶段训练,和它可以得出结论,混合结构可以收敛速度高于fCNN结构下的单一路径策略。与此同时,在模型训练的中、晚期,它可以发现训练基于HyperDenseNet不稳定,有时突然下降,虽然HybridCTrm更稳定。多路径的策略,HybridCTrm明显比HyperDenseNet早期和中期培训阶段,表明前者可以提供更快的收敛下多路径策略。的稳定性HyperDenseNet略优于HybridCTrm在中期和后期阶段的训练。这可能是因为模型中间学会了足够的优点和晚期的训练,并进一步学习更困难的变压器分别利用每个模态信息。因此,可能会有一些坏的功能层的变压器,导致模型的稳定性下降。HyperDenseNet, CNN的特性更加稳定,因此不产生大的波动。另一方面,在后期还允许轻微的不稳定随机模型来了解更多,避免陷入局部最小值,导致全球泛化性能差。

DSC曲线。

5.8。可视化

进一步探索不同模型的优缺点和偏好细分内容,分割结果显示部分测试集进行视觉分析。

6(一个)显示了一个分段2 d部分。帧地区,CSF组织(蓝色部分)显示条纹分布,而HyperDenseNet表现在CSF单一路径策略和多路径策略。相反,HybridCTrm CSF分割表现良好,特别是在单一路径策略,CSF的连续钢筋分布反映。通用汽车组织(绿色部分),HyperDenseNet分类很大一部分的灰质WM(黄色部分)并生成大量的“粘连”在WM地区。HybridCTrm,另一方面,有一个良好的性能在通用和更好地反映轮廓结构,表明混合结构充分利用了长距离依赖。

可视化。

6(b)显示了另一个细分,我们专注于前脑部分:盒装区域图中。我们可以看到,有一个明确的目标地区通用的途径,这是missegmented WM HyperDenseNet组织,但在HybridCTrm更好的分割。与此同时,在最右边的盒子,有一小块CSF组织,这是不分段下HyperDenseNet-Single HyperDenseNet-Multi下最小分割。HybridCTrm,这部分也分段。

6。结论

探讨混合网络的应用程序基于cnn和变压器多通道医疗领域的分割,提出了一种新型多通道医学分割架构,HybridCTrm。提出了两种多通道分割策略,即单一路径策略和多路径策略。在实验中,HybridCTrm架构测试在两个基准数据集在单路和多路策略和与HyperDenseNet相比,一个架构完全基于完全cnn。HybridCTrm优于HyperDenseNet在大多数指标。

数据可用性

使用的数据来支持本研究的发现可以从相应的作者。

的利益冲突

作者宣称没有利益冲突有关这篇文章的出版。

确认

这项工作得到了国家自然科学基金(61906030)、辽宁省自然科学基金(2020 - bs - 063),中央大学和基础研究基金(DUT20RC(4) 009年)。

H。 D。 l 中国。 Voxresnet:深voxelwise残余网络体积大脑分割 2016年 https://arxiv.org/abs/1608.05895 O。 Abdulkadir 一个。 里恩坎普这样说道 美国年代。 Brox T。 Ronneberger O。 Ourselin 年代。 利奥 J。 Sabuncu m·R。 Unal G。 W。 3 d U-net:学习密度体积分割从稀疏的注释 医学影像计算和计算机辅助Intervention-MICCAI 2016 2016年 纽约,纽约,美国 施普林格国际出版 K。 郑氏 J。 P。 耆那教徒的 V。 塞巴斯蒂安Seung H。 超人的准确性在SNEMI3D——挑战 2017年 https://arxiv.org/abs/1706.00120 Milletari F。 N。 Seyed-Ahmad 一个。 V-net:完全卷积神经网络容量的医学图像分割 学报》2016年第四次国际会议3 d视觉(3 dv) 2016年10月 斯坦福,加州,美国 565年 571年 Ronneberger O。 费舍尔 P。 Brox T。 N。 Hornegger J。 w·M。 Frangi 答:F。 U-net:卷积网络生物医学图像分割 医学影像计算和计算机辅助Intervention-MICCAI 2015 2015年 纽约,纽约,美国 施普林格国际出版 X。 l Z。 年代。 加权res-unet为高质量的视网膜血管分割 学报》2018年第九届国际会议在医学和信息技术教育(时候) 2018年10月 杭州,中国 327年 331年 10.1109 / itme.2018.00080 2 - s2.0 - 85061319178 l Y。 DSouza a . M。 Abidin 答:Z。 Wismuller 一个。 C。 Angelini e . D。 乡下人 b。 肿瘤MRI分割紧密连接的3 d与CNN 2018年医学成像:图像处理,10574卷 2018年 贝灵汉美国佤邦 国际社会对光学和光子学 G。 Z。 van der Maaten l 克里安 Q。 温伯格。人口卷积网络连接 《IEEE计算机视觉与模式识别会议(CVPR) 2017年7月 美国HW火奴鲁鲁 西蒙 J。 Drozdzal M。 巴斯克斯 D。 罗梅罗 一个。 Bengio Y。 提拉米苏:一百层完全卷积DenseNets语义分割 《IEEE计算机视觉与模式识别会议(CVPR)研讨会 2017年7月 美国HW火奴鲁鲁 Kamnitsas K。 W。 E。 麦多纳 年代。 辛克莱 M。 Pawlowski N。 Rajchl M。 M。 Kainz B。 Rueckert D。 格洛克 B。 Kuijf H。 Menze B。 雷耶斯 M。 乐团的健壮的脑部肿瘤分割的多个模型和体系结构 Brainlesion:神经胶质瘤、多发性硬化、中风和创伤性脑损伤 2018年 纽约,纽约,美国 施普林格国际出版 越南盾 N。 l Y。 D。 完全卷积网络多模isointense婴儿脑部图像分割 学报2016年IEEE 13生物医学成像(位ISBI)国际研讨会 2016年4月 布拉格,捷克共和国 1342年 1345年 Shelhamer E。 J。 达雷尔 T。 完全卷积网络语义分割 IEEE模式分析与机器智能 2017年 39 4 640年 651年 10.1109 / tpami.2016.2572683 2 - s2.0 - 85015843890 G。 W。 Ourselin 年代。 ·维 T。 Crimi 一个。 白痴 年代。 Kuijf H。 Menze B。 雷耶斯 M。 自动脑瘤使用级联各向异性卷积神经网络分割 Brainlesion:神经胶质瘤、多发性硬化、中风和创伤性脑损伤 2018年 纽约,纽约,美国 施普林格国际出版 10.1007 / 978 - 3 - 319 - 75238 - 9 - _16 2 - s2.0 - 85042527812 Carion N。 马萨 F。 Synnaeve G。 Usunier N。 Kirillov 一个。 Zagoruyko 年代。 Vedaldi 一个。 女孩 H。 Brox T。 弗拉姆 人类。 端到端对象检测变压器 电脑Vision-ECCV 2020 2020年 纽约,纽约,美国 施普林格国际出版 M。 雷德福 一个。 孩子 R。 J。 小君 H。 烹调的菜肴 D。 Sutskever 我。 Daume三世 H。 辛格 一个。 生成pretraining从像素 美国第37机器学习国际会议上,体积119机器学习研究的程序 2020年7月 1691年 1703年 Dosovitskiy 一个。 拜尔 l 亚历山大 K。 Weissenborn D。 X。 Unterthiner T。 Dehghani M。 照顾者 M。 Heigold G。 葛里炸药 年代。 Uszkoreit J。 Houlsby N。 一幅值得16 x16词:变形金刚对大规模图像识别 美国学习国际会议上表示 2021年10月 葡萄牙里斯本 Z。 Y。 Y。 H。 Y。 Z。 年代。 B。 斯温变压器:层次视觉变压器使用了窗口 2021年 https://arxiv.org/abs/2103.14030 年代。 J。 H。 X。 Z。 Y。 Y。 J。 T。 菲利普 H。 年代。 l 与《变形金刚》从sequence-to-sequence角度反思语义分割 《IEEE / CVF计算机视觉与模式识别会议(CVPR) 2021年6月 6881年 6890年 Dolz J。 Gopinath K。 J。 Lombaert H。 Desrosiers C。 班德 我。 Hyperdense-net: hyper-densely连接有线电视新闻网综合图像分割 IEEE医学成像 2019年 38 5 1116年 1126年 10.1109 / TMI.2018.2878669 2 - s2.0 - 85055864043 Vaswani 一个。 Shazeer N。 Parmar N。 Uszkoreit J。 琼斯 l 戈麦斯 a . N。 凯撒 l Polosukhin 我。 关注你所需要的 31日学报》国际会议在神经信息处理系统中,少量的17岁 2017年12月 红钩,纽约,美国 Curran Associates Inc .) 6000年 6010年 Devlin J。 硕士。 K。 Toutanova K。 伯特:训练的语言理解的深度双向变形金刚 2019年 NAACL-HLT 4171年 4186年 https://arxiv.org/abs/1810.04805 布朗 t . B。 曼恩 B。 赖德 N。 印度 M。 卡普兰 J。 Dhariwal P。 Neelakantan 一个。 Shyam P。 Sastry G。 Askell 一个。 阿加瓦尔 年代。 Herbert-Voss 一个。 克鲁格 G。 汤姆 H。 孩子 R。 拉梅什 一个。 齐格勒 d . M。 J。 冬天 C。 海塞 C。 M。 Sigler E。 Litwin M。 灰色的 年代。 国际象棋 B。 克拉克 J。 伯纳 C。 McCandlish 年代。 雷德福 一个。 Sutskever 我。 Amodei D。 语言模型是few-shot学习者 2020年 https://arxiv.org/abs/2005.14165 R。 Y。 D。 K。 年代。 H。 局域网 Y。 l T.-Y。 在变压器结构层正常化 2020年 https://arxiv.org/abs/2002.04745 Mendrik a . M。 Vincken k . L。 Kuijf h·J。 Breeuwer M。 Bouvy w·H。 德医学教授 J。 Alansary 一个。 de Bruijne M。 Carass 一个。 el - baz 一个。 慢跑 一个。 Katyal R。 a。R。 van der Lijn F。 马哈茂德 Q。 瑞安 M。 范Opbroek 一个。 Paneri 年代。 佩雷拉 年代。 皮尔森 M。 Rajchl M。 Sarikaya D。 MRBrainS挑战:在线评价脑图像分割框架3 t MRI扫描 智能神经科学 2015年 2015年 16 813696年 10.1155 / 2015/813696 2 - s2.0 - 84950116370 l D。 G。 Puybareau E。 Dolz J。 Q。 F。 J。 Z。 J.-W。 Thung K.-H。 中方通过 t D。 胫骨 J。 G。 G。 Fonov 诉。 柯南道尔 一个。 Y。 Moeskops P。 Pluim j·p·W。 Desrosiers C。 基准在六个月大的婴儿的大脑自动分割算法:iseg - 2017的挑战 IEEE医学成像 2019年 38 9 2219年 2230年 10.1109 / tmi.2019.2901712 D。 Desrosiers C。 i B。 3 d完全卷积网络皮层下在MRI分割:一个大规模的研究 科学杂志 2018年 170年 456年 470年 10.1016 / j.neuroimage.2017.04.039 2 - s2.0 - 85019101414 Kamnitsas K。 Ledig C。 纽康比 诉f·J。 辛普森 j . P。 凯恩 答:D。 梅农 d·K。 Rueckert D。 格洛克 B。 格洛克 B。 高效的多尺度三维CNN与大脑病变完全连接CRF准确分割 医学图像分析 2017年 36 61年 78年 10.1016 / j.media.2016.10.004 2 - s2.0 - 84995784237 K。 X。 年代。 太阳 J。 深入深入整流器:超越人类表现ImageNet分类 《IEEE计算机视觉国际会议(ICCV) 2015年12月 圣地亚哥,智利 10.1109 / iccv.2015.123 2 - s2.0 - 84973911419