多模态医学图像分割在医学图像分割一直是一个至关重要的问题。传统的深度学习方法充分利用cnn对编码图像,从而导致缺乏长程相关性和坏的泛化性能。比起最近,一系列的基于变压器方法在图像处理领域的出现,这让伟大的泛化和性能在不同的任务。另一方面,传统的有线电视新闻网有自己的优势,比如快速收敛和局部表示。因此,我们分析一个混合多通道分割方法基于变压器和cnn和提出一个新颖的建筑,HybridCTrm网络。我们进行实验使用HybridCTrm两个基准数据集和与HyperDenseNet相比,基于完全cnn的一个网络。结果表明,我们的HybridCTrm优于HyperDenseNet大部分的评价指标。此外,我们分析的深度的影响变压器的性能。此外,我们可视化结果和认真探索如何改进分割我们的混合方法。
医学图像分割是一个重要的区域在医学图像分析和诊断和治疗是必要的,其目的是将图像中每个像素。出于深度学习的最近的成功,研究人员在这个领域也试图应用基于深度学习医学图像分割方法,包括U-Nets [
为了解决这些问题,我们设计一个名叫HybridCTrm混合架构结合优势从cnn和变压器。具体地说,这些网络编码图像从CNN和变压器,两个平行的和独立的路径,然后整合表征解码和分割。这样,cnn生成和控制当地表示梯度下降法的快速收敛,而变压器提取非局部特性和避免过度拟合和局部最优的postperiod培训。针对完全测试我们的方法,我们提出了两种融合策略,即单一路径策略和多路径策略,并应用我们的方法在这两个不同的策略。实验,结果表明,我们的方法可以有效地克服美国有线电视新闻网和《变形金刚》的缺点,我们显示一个伟大的多通道的性能改善医学图像分割任务。此外,我们可视化结果和认真探索如何改进分割我们的混合方法。
多模态医学图像分割来源于医学图像分割任务,这两个目标实现为一个输入图像进行像素级分类。传统的医学图像分割方法一般遵循encoder-decoder架构,如U-Net [
变形金刚第一次被应用于自然语言处理任务。Vaswani et al。
在多模态医学图像分割的目的是为每个像素分配标签不同形式的给定的输入图像。我们建议两个混合架构多通道医学图像分割如图
两个混合架构。(一)混合Convolution-Transformer模型用一个路径。(b)混合Convolution-Transformer与多路径模型。
为了避免梯度消失和爆炸,DenseNets [
如图
卷积编码器。
避免过度拟合和缺乏外地依赖性产生完全cnn,我们应用变压器编码多通道图像和模型的泛化。《变形金刚》(
受生命的启发,我们修改和应用变压器多重模态医学图像分割如图
变压器编码器。
我们得到一个补丁序列
之后,
不同于常见的变压器在图像处理领域像维特
MHSA(多线程Self-Attention)是《变形金刚》的核心,它可以被视为一堆几个简单的关注网络。一个简单的注意机制可以计算如下:
多个叠加使用简单的关注可以专注于不同的陈述不同的子空间。因此,MHSA项目
我们使用
我们应用一个共同的熵函数作为我们的成本函数。让
我们利用余弦学习速率衰减,衰减策略:
我们进行我们的实验两个基准数据集,MRBrainS [
而子卷的大小
我们比较模态与几个完全CNN-based架构,包括fCNN [
我们应用骰子相似系数(DSC)作为评价指标,常见的分割评价方法(
我们MRBrainS leave-one-out-cross-validation申请five-sample数据集,也就是说,四个样本训练和测试。我们报告三组织DSC (CSF,通用和WM)和他们的平均水平。
表
MRBrainS主要结果。
| 脑脊液 | 通用汽车 | WM | 的意思是 | |
|---|---|---|---|---|
| fCNN-Single [ |
52.55 | 73.62 | 74.82 | 66.99 |
| fCNN-Multi [ |
67.03 | 80.59 | 62.50 | 70.04 |
|
|
58.49 | 74.66 | 71.31 | 68.16 |
|
|
62.26 | 81.93 | 81.67 | 75.29 |
|
|
42.88 | 70.02 | 80.66 | 64.52 |
|
|
64.08 | 82.09 | 59.23 | 68.46 |
| HyperDenseNet-Single [ |
49.12 | 84.14 |
|
73.04 |
| HyperDenseNet-Multi [ |
72.90 | 85.06 | 70.64 | 76.20 |
| HybridCTrm-Single | 75.09 | 85.30 |
|
82.98 |
| HybridCTrm-Multi |
|
|
88.37 |
|
一般视图显示,我们的混合网络达到每个指标上的得分最高。有一个清晰的对比,我们首先比较两个简单路径模型。我们与HyperDenseNet大多比较我们的方法,因为这个模型对每个执行CNN-based架构之间的最佳策略。与HyperDenseNet-Single相比,HybridCTrm提高约3%,1%,和26%在WM,通用,分别和CSF。同时,平均得分表现为10%。对于多路径模型,CSF HybridCTrm-Multi提高4%和18%,相比HyperDenseNet-Multi WM组织。然后,我们专注于同一个模型的性能在不同的策略。通用汽车和CSF分段组织,多路径策略是更合适的,而单一路径在WM表现更好。这可能推断,不同形式的分段通用和CSF信息,需要独立编码,然后相互集成,而对于WM恰恰相反。
为了更好地分析变压器对性能的影响,我们进行实验和不同深度的变压器设置。
图
表演不同深度的变形金刚。
我们的混合架构由一个CNN编码器和变压器编码器获取本地和外地特性分割。CNN和变压器分支研究如何影响我们的混合模型,我们进行消融研究。如表所示
烧蚀研究。
| 脑脊液 | 通用汽车 | WM | 的意思是 | |
|---|---|---|---|---|
| HybridCTrm-Single | 75.09 | 85.30 |
|
82.98 |
| W / o CNN分支 | 30.39 | 44.91 | 54.64 | 43.31 |
| W / o变压器分支 | 56.18 | 84.11 | 68.64 | 69.64 |
| HybridCTrm-Multi |
|
|
88.37 |
|
| W / o CNN分支 | 32.72 | 50.36 | 52.48 | 45.19 |
| W / o变压器分支 | 75.32 | 81.48 | 62.03 | 72.95 |
进一步分析分割不同的形式的重要性,我们选择两个模式和双通道进行辅助实验。
如表所示
辅助结果与双重形态。
| 形态 | 脑脊液 | 通用汽车 | WM | 的意思是 | |
|---|---|---|---|---|---|
| HybridCTrm-Single | T1, T1-IR | 53.89 | 79.75 | 81.88 | 71.84 |
| HybridCTrm-Single | T1, T2-FLAIR | 75.09 | 79.88 | 87.92 | 80.96 |
| HybridCTrm-Single | T2-FLAIR, T1-IR | 56.13 | 79.78 | 69.94 | 68.61 |
| HybridCTrm-Single | 3模式 | 75.09 | 85.30 | 88.54 | 82.98 |
| HybridCTrm-Multi | T1, T1-IR | 69.88 | 78.17 | 71.68 | 73.25 |
| HybridCTrm-Multi | T1, T2-FLAIR | 74.07 | 78.97 |
|
80.64 |
| HybridCTrm-Multi | T2-FLAIR, T1-IR | 68.54 | 80.20 | 64.17 | 70.97 |
| HybridCTrm-Multi | 3模式 |
|
|
88.37 |
|
我们把iseg - 2017和10个样本数据集分为训练集(火车),一组开发(dev),和一个测试集的比率(测试)8:1:1。详细的结果展示在表
主要结果iseg - 2017。
| Dev | 测试 | |||||||
|---|---|---|---|---|---|---|---|---|
| 脑脊液 | 通用汽车 | WM | 的意思是 | 脑脊液 | 通用汽车 | WM | 的意思是 | |
| fCNN-Single [ |
89.21 | 86.56 | 78.31 | 84.55 | 85.66 | 83.13 | 82.84 | 83.87 |
| fCNN-Multi [ |
89.98 | 85.35 | 78.31 | 84.55 | 85.66 | 83.13 | 82.84 | 83.87 |
|
|
92.42 | 89.00 | 81.74 | 87.72 | 88.59 | 85.47 | 83.47 | 85.84 |
|
|
93.13 | 89.24 | 82.73 | 88.36 | 88.92 | 85.85 | 85.26 | 86.68 |
|
|
92.75 | 89.59 | 82.98 | 88.44 | 88.69 | 85.95 | 84.36 | 86.33 |
|
|
92.81 | 89.77 | 82.01 | 88.20 | 89.35 | 85.71 | 83.09 | 86.05 |
| HyperDenseNet-Single [ |
92.24 | 88.58 | 81.18 | 87.33 | 88.59 | 85.40 | 83.92 | 85.97 |
| HyperDenseNet-Multi [ |
92.99 | 89.39 | 83.24 | 88.54 | 88.85 | 85.87 |
|
86.69 |
| HybridCTrm-Single | 93.38 | 88.66 | 82.21 | 88.08 | 89.24 | 85.90 | 85.11 | 86.75 |
| HybridCTrm-Multi |
|
|
|
|
|
|
85.34 |
|
首先,我们HybridCTrm网络优于7八个指标在所有这些方法。与HyperDenseNet-Single相比,HybridCTrm-Single优于所有指标。这是因为单路径策略中的信息集成在一开始,和变压器结构可以完全模型这个复杂的信息。在多路径策略,HybridCTrm-Multi也优于HyperDenseNet-Multi 7个指标,进一步验证变压器的建模能力。然而,获得大不如单一路径模型。这可能是因为每个形态的信息内容是小,所以变压器不能用有力的归纳学习足够的功能,如CNN的偏见。
已经得出的结论是,混合模型比纯fCNN模型小,我们也担心模型的稳定性和泛化性能。
图
DSC曲线。
进一步探索不同模型的优缺点和偏好细分内容,分割结果显示部分测试集进行视觉分析。
图
可视化。
图
探讨混合网络的应用程序基于cnn和变压器多通道医疗领域的分割,提出了一种新型多通道医学分割架构,HybridCTrm。提出了两种多通道分割策略,即单一路径策略和多路径策略。在实验中,HybridCTrm架构测试在两个基准数据集在单路和多路策略和与HyperDenseNet相比,一个架构完全基于完全cnn。HybridCTrm优于HyperDenseNet在大多数指标。
使用的数据来支持本研究的发现可以从相应的作者。
作者宣称没有利益冲突有关这篇文章的出版。
这项工作得到了国家自然科学基金(61906030)、辽宁省自然科学基金(2020 - bs - 063),中央大学和基础研究基金(DUT20RC(4) 009年)。