raybet雷竞app|雷竞技官网下载|雷电竞下载苹果

CIN

计算智能和神经科学

1687 - 5273 1687 - 5265

Hindawi

10.1155 / 2019/8527819

8527819

研究文章

TGV Upsampling:包装操作的语义分割

https://orcid.org/0000 - 0003 - 1967 - 7030

阴

徐

李

严

https://orcid.org/0000 - 0001 - 7742 - 4846

胫骨

Byeong-Seok

Yanez-Marquez

Cornelio

计算机工程系

韩国仁荷大学

082年仁川。

韩国

inha.ac.kr

2019年

1 8 2019年

2019年 08年 04 2019年 08年 07年 2019年 1 8 2019年

2019年

这是一个开放的文章在知识共享归属许可下发布的,它允许无限制的使用,分布和繁殖在任何媒介,提供最初的工作是正确的引用。

深度学习的广泛使用方法、语义分割近年来取得了很大的改进。然而,许多研究人员指出,多种用途的卷积和池操作,伟大的信息提取过程中会发生损失。为了解决这个问题,已经提出各种操作或网络架构来弥补损失的信息。我们观察到一个趋势在很多研究中设计一个网络作为对称类型,部分代表“编码”和“解码”阶段。“upsampling”操作的“解码”阶段,特征图谱构建以某种方式或多或少地弥补损失的前层。在本文中,我们关注upsampling操作做一个详细的分析,并比较当前在几个著名的神经网络方法。我们也将映像恢复知识和设计新的upsampled层(或操作)命名TGV upsampling算法。我们成功地取代upsampling层之前的研究与我们的新方法。我们发现,我们的模型可以更好地保存详细的纹理和边缘特征图,可以,平均达到1.4 - -2.3%提高精度比原模型。

韩国国家研究基金会

科技部、ICT和未来规划

NRF2017M3C8A8091768

1。介绍

相比传统的分类任务,语义分割困难得多。从神经网络的分类器应该用于每个像素的图像。这可以帮助机器更好地理解复杂的图像,不仅简单对象的认可。深入学习方法,尤其是卷积神经网络,为视觉识别问题产生惊人的结果。这证明了卷积操作可以成功地提取全球信息和功能维持空间不变性。当回顾现有的研究中,我们观察到,他们中的大多数遵循对称的建筑,这降低了分辨率(称为编码阶段),然后一层一层地逐渐增加(称为解码阶段)。任何详细的设计,特征图谱,如果网络包含一个盘中的过程,这将带来不可避免的损失因为这个过程旨在生成一个更低分辨率表示从一个高分辨率的责任。与一层的增加,与此同时,会有一个伟大的影响最终的纹理边界(或信息)密度图像。

应对这一挑战的方法之一是减少操作过程中性能的损失。陈等人。 1使用一个深黑色的卷积。通过插入像素之间的“空白”,研究人员扩大了接受域和地图生成的高分辨率特性。虽然这种方法是有效的和成功的,它仍然是难以应用,考虑硬件和内存的限制。

另一个解决方案关注的方法弥补损失。在最近的研究中,设计分层网络( 2, 3)是一个趋势。研究人员发现,在后期可以弥补损失。高层特征图可以更好地恢复混合信息的低层次的中间结果,这也进一步提高了密集的预测。

我们受到化妆理念和趋势组层编码和解码阶段(见图 1)。在编码阶段,层downsample空间分辨率一层一层地;之后,在解码阶段,特征图谱(层产生的中间结果)是“upsampled”和决议也相应增加,直到整个图像重建的原始大小。研究人员认为,在down-up抽样过程,图像分割和重建,网络可以检测最重要的功能在不破坏物体的形状或纹理。重建的目的是弥补损失产生的编码阶段,upsampling方法的选择是关键。

图1

一般对称网络体系结构。

在本文中,我们遵循对称设计和关注upsampling方法的研究在解码阶段。我们的贡献如下: (1)

我们做了一个详细的介绍upsampling现在常用的方法,必要的概念和数学定义。

(2)

我们提出了一种新的基于总upsampling方法广义变异(TGV)模型( 4- - - - - - 6),它适用于不同的网络。

2。相关的工作

语义分割,深度学习的一个重要分支 7),也已成为神经网络研究的一个活跃的话题。在本节中,我们介绍了几种先进的网络领域的语义分割及其upsampling方法用于解码阶段。

2.1。对称网络

对称网络( 8- - - - - - 11)已被证明是非常有效的特定字段。至于选择对称型的原因,研究人员认为无论卷积层,会有信息提取功能的丧失。进一步训练,即使是很小的损失可能会导致缺陷边界信息或纹理边缘。以弥补损失,他们分组所有层模型分为两个阶段根据特征图的大小。长等。 9)第一次使用一个完全卷积网络(FCN)。他们建议完全可以取而代之的是卷积层连接层,并进一步改进阶段之间的连接可以通过“跳过连接。“虽然FCN不完全对称,跳过连接,构建一个“桥”层之间在编码阶段和解码阶段,提供地图功能的另一个来源。基于这个想法,Ronneberger et al。 8)设计一个u型的网络(U-Net)。他们认为扩张路径的特性与收缩的关系路径,从而扩大渠道的数量特征。然而,当我们想要设计一个新的网络,参数大小是一个重要的问题,应该高度重视,考虑到对称网络比其他类型的网络需要更多的参数,这将是一个巨大的挑战,CPU和GPU使用量。几乎同时,Badrinarayanan et al。 10)应用一种新的upsampling方法命名为“unpooling”max-pooling时记录的指标。与这些指标,原始位置信息可以很容易地发现在解码阶段。在这种情况下,培训过程大大减少所需的参数。

2.2。当前Upsampling方法

卷积的可视化网络( 12),我们知道卷积计算可以有效地提取和概括特性,输出可被视为一组特性。upsampling操作的目的是增加的分辨率低分辨率数据和upsample原始数据映射到一个高分辨率的地图,旨在弥补损失的信息在之前层由于卷积操作。

整个过程的难度在于如何从低分辨率的地图生成采样数据和相应的颜色通道。

2.2.1。双线性插值

在早期的深度学习研究[ 7, 13),经常可以看到这种方法。对比的方法介绍了后来,双线性方法的最大优点是高速和简单的操作。的水平层,不需要学习和调整权重使用双线性插值时,作为一个参数(指所需的最终图像的大小)就足以让整个操作。

例如,有四个已知点值, x 11 = x 1 , y 1 , x 12 = x 1 , y 2 , x 21 = x 2 , y 1 , x 22 = x 2 , y 2 的价值函数 τ 可以发现在点( x , y )。

X方向: (1) 问 x , y 1 = τ x , y 1 ≈ x 2 − x x 2 − x 1 τ x 11 + x − x 1 x 2 − x 1 τ x 21 , 问 x , y 2 = τ x , y 2 ≈ x 2 − x x 2 − x 1 τ x 12 + x − x 1 x 2 − x 1 τ x 22 。

Y方向(了): (2) 问 x , y = τ x , y ≈ y 2 − y y 2 − y 1 问 x , y 1 + y − y 1 y 2 − y 1 问 x , y 2 = τ x 11 x 2 − x 1 y 2 − y 1 x 2 − x y 2 − y + τ x 21 x 2 − x 1 y 2 − y 1 x − x 1 y 2 − y + τ x 21 x 2 − x 1 y 2 − y 1 x 2 − x y − y 1 + τ x 22 x 2 − x 1 y 2 − y 1 x − x 1 y − y 1 。

与上述过程,可以找到一个近似任意点的价值 x , y 的函数间隔内 x ∈ x 1 , x 2 , y ∈ y 1 , y 2 。

2.2.2。转置卷积

严格地说,转置卷积是一种卷积操作而不是抽样法,但许多研究人员目前成为他们的第一选择在解码阶段来弥补损失。

从卷积运算的角度来看,每个卷积操作可以表示为 y = C ∗ x ,在那里 C 和 x分别代表输入矩阵和权重映射。

在反向传播,假设层的导数 ∂ 损失 / ∂ y ( 损失意味着整个网络的损失当培训)是已知的,相应的衍生品的重量可以写成 (3) ∂ 损失 ∂ x = ∑ 我 ∂ 损失 ∂ x 我 = ∑ 我 ∂ 损失 ∂ y 我 ∗ ∂ y 我 ∂ x j = ∑ 我 ∂ 损失 ∂ y 我 ∗ C 我 j = ∂ 损失 ∂ y ∗ C ∗ j = C ∗ , j T ∗ ∂ 损失 ∂ y 。

方程( 3)显示的关系 ∂ 损失 / ∂ x 和 ∂ 损失 / ∂ y 。这表明转置卷积是乘法 C T 或 C T T = C 做一个向前和向后传球时,分别。

当转置卷积用作upsampling方法时,情况完全不同于双线性插值。研究Dumoulin和Visin [ 14]介绍了四种不同的转置操作应用的情况。

例如(图 2),转置卷积在2×2 3×3的输入输出(步幅= 1)等于反向操作的卷积层( y = C ∗ x ,输入4×4;内核大小= 2)。最初的2×2地图是垫2×2 0边境第一,然后 C T 是增加的。

图2

转置卷积。

2.2.3。Unpooling

的各种组合层目前提高网络的效率,但同时带来了严重的问题:参数。甚至一个卷积层需要大量的重量参数,这对于cpu或gpu构成了重大挑战。正如节中提到的 2的转置矩阵转置卷积等于乘以相应的卷积层,这意味着我们应该业余训练时足够的内存来保存这些矩阵。

首次利用deconvolutional网络( 15],unpooling要简单得多,而且更容易使用。

图 3显示了一个unpooling操作的基本流程。以上数字对应于一个特性值映射。假设一些地图输入unpooling方法记录指数最大的值之前执行max-pooling⟶(从输入一个)。在解码阶段,收到输出 b从之前的层,与池指数(由黑色网格),可以upsample内的像素值(从原来的地方 b⟶输出)。事实上,unpooling保持定向信息(“池指数”)最大的像素值在每个特性映射处理max-pooling操作。这一行动解决问题的“方向”和“填充”在同一时间。

图3

Unpooling操作。

转置卷积相比,unpooling的优势在于参数的数量,而应该只记录池指数。

3所示。TGV Upsampling算法

灵感来自全变差模型( 16, 17),我们引入了另一个名为“TGV upsampling upsampling方法。“我们看到upsampling方法作为一种结合特性与知识地图恢复图像恢复(目的是弥补损失的信息)。我们的方法的背景和细节描述如下。

3.1。问题转换

虽然它已经几年以来第一次卷积神经网络(CNN)是使用[ 7),内部架构仍然可以简单的得出结论。大多数网络现在可以被认为是卷积层和max-pooling层的组合,和有很多的研究 14, 18- - - - - - 21)可用于理解什么是CNN。许多先前的研究指出,“max-pooling可以取代一个卷积层增加步幅和不损失精度同时”( 22]。当然,我们可以把网络组件和max-pooling卷积层作为一组卷积计算无论内部架构实际上是什么。

正如我们在前面所讨论的,语义细分领域的研究者倾向于把整个过程分为编码和解码阶段upsampling一步总是发生的地方在解码阶段。许多研究人员认为“路径”存在于卷积操作。从功能的角度来看地图,编码和解码阶段指的是扩张和收缩路径,分别;这两条路径或多或少是对称的。在这种情况下,我们对待upsampling恢复任务的特征图谱产生相应的层编码阶段。

例如,图 1提供了一个简单的观点一般对称网络。整个网络分为编码和解码阶段,和层由两个阶段 E_我和 C_j分别为( 我和 j层)的方向。当我= j,这意味着 E_输入= C_输出,我们考虑的输出 C_j地图功能恢复的结果 E_输入。

如图 4之后,一系列的卷积计算,一个4×4的功能映射在编码阶段变成2×2像素矩阵(矩阵也是一定的输出层)。投影操作,这张地图可以恢复到原始大小的地图在编码阶段(这暂时的结果是用 C ¯ 输入 )。(指的是沉重的蓝色填充部分网格)表现为模糊(噪声);剩下的工作是一个恢复工作。

图4

预处理特征图。

当比较左矩阵右,我们制定了基本的损失函数如下: (4) 损失 u , C 输入 = 1 2 u C 输入 − C ¯ 输入 2 2 , 在哪里 u 代表我们upsampled和结果 ⋅ 2 表示2-norm。

3.2。TGV-Based Upsampling

TGV ( 23)主要用于解决问题的图像去噪和恢复。但在这篇文章中,我们改编成可训练的upsampling特征图的方法。我们增加映射到目标的分辨率大小,然后对每个执行TGV地图。

我们的方法的第一步是投影,考虑低收入和高分辨率的大小区别地图。我们首先应用双线性插值得到的初步结果,同样大小的地图在编码阶段。这些处理地图将被视为嘈杂的地区(实际上指的是整个图像),这将是在TGV恢复治疗。

自从Bredies et al。 23提出TGV模型,它已广泛应用于图像恢复领域。极大地重建图像的TGV模型模糊数据或吵闹,间接测量。制定整个upsampling问题作为一个凸优化模型( 12, 24- - - - - - 26]。我们的模型的数学公式描述 (5) 最小值 u λ 损失 u , x + 法国高速列车 α K u , 在哪里损失 u , x 代表图像保真度参数 λ用于重量之前的操作来计算全局优化,然后呢法国高速列车 α K u 代表正则化项。

卷积的可视化网络( 8),我们知道卷积计算可以有效地提取和概括特性,输出可被视为一组特性。为了更好地理解图像的语义,平滑的纹理和边境边缘特征图尤其重要。

对于一个 k秩序形象,传统的修复方法倾向于解决半范数有界的变异,而TGV模型引入了一个 k订单功能,整合了来自不同渠道的信息,可有效保持纹理不连续。

给定一个 k订单图片 μ ,我们代表TGV模型如下: (6) 法国高速列车一个 k u = 吃晚饭 ∫ Ω Ω d 我 v k v d x ∣ v ∈ C C K Ω , 信谊 k 红外 d , d 我 v l v ≤ 一个 l , l = 0 , … , k − 1 。

让信谊 k 红外 d 代表的空间对称张量 k。通过平衡衍生品从一阶 k阶,这大大减轻了问题包含不同的灰色水平成像时,导致边界信息丢失损失以及边缘和角落。

但在这个工作,针对特征图谱,结果是一个二阶TGV就足够了。我们制定的二阶模型 (7) 法国高速列车一个 2 u = 最小值 w 一个 1 ∫ Ω ∇ u − ω + 一个 2 ∫ Ω ε ω 。

对于一个给定的二阶 u,最低的TGV模型是接管所有复杂的向量场 w 在有限域。 ε w = 1 / 2 ∇ ω + ∇ ω t 代表使对称导数。参数一个 1 和一个 2 应用平衡第一和第二衍生品。

最后TGV-based upsampling模型定义为一个组合的损失函数( 5)和TGV术语( 6),方程( 7): (8) 最小值 u , w λ 2 u C 输入 − C ¯ 输入 2 2 + 一个 1 ∫ Ω ∇ u − ω + 一个 0 ∫ Ω ε ω 。

与此同时,与固定权重中使用( 23),我们适应TGV可训练的方法,考虑权重a₁和a₂反向传播来寻找一个合适的平衡点。

3.3。优化方法

考虑到upsampling模型我们提议(公式( 8)是凸的,而不是光滑,我们使用了非计划( 24, 25, 27)来解决这个问题。我们新配方upsampling模型作为凸凹形鞍点问题通过引入两个对偶变量米和 n。公式的转换模型( 8)是由 (9) 最小值 u 马克斯 v λ 2 ∑ 我 , j ∈ Ω u C 我 , j − E 我 , j 2 + 一个 1 ∇ u − ω , 米 + 一个 2 ∇ ω , n 。

的可行集 ρ 和 φ 定义如下: (10) 米 = 米 : Ω u ⟶ ℛ 2 ∣ 米我 , j ≤ 1 , 我 , j ∈ Ω u , N = n : Ω u ⟶ ℛ 2 ∣ n 我 , j ≤ 1 , 我 , j ∈ Ω u 。

最终结果是逐像素计算通过迭代优化。与 u 0 = E 输入和 v 0 , 米 0 , 和 n 0 = 0 ,步大小 σ 米 , σ n 和 τ u , τ ω 是选择。对于迭代我 ≥ 0 、更新变量如下: (11) 米我 + 1 = 项目米米我 + σ 米一个 1 ∇ u ˜ 我 − ω ˜ 我 , n 我 + 1 = 项目 n n 我 + σ n 一个 2 ∇ ω ˜ 我 , u 我 + 1 = 1 + λ 2 τ u − 1 u 我 + τ u 一个 1 米我 + 1 + λ 2 C ¯ 输入 ω 我 + 1 = ω 我 + τ ω 一个 1 n 我 + 1 + 一个 2 米我 + 1 , u ¯ 我 + 1 = u 我 + 1 + θ u 我 + 1 − u ¯ 我 , ω ¯ 我 + 1 = ω 我 + 1 + θ ω 我 + 1 − ω ¯ 我 , , 在哪里项目米米 ¯ 和项目 n n ¯ 表示欧几里得投影仪到集上米和 N,分别。他们可以通过逐点的计算操作: (12) 项目米米 ¯ = 米 ¯ 马克斯 1 , 米 ¯ / 一个 1 , 项目 n n ¯ = n ¯ 马克斯 1 , n ¯ / 一个 1 。

在方程( 11), θ 代表弛豫参数。它可以通过迭代更新迭代使用预处理[ 5]。因此,TGV-based模型可以实现全局最优upsampling解决方案在处理二阶图像。

4所示。评价

在本节中,我们提出的定量评价TGV-based upsampling模型。我们比较我们的模型与当前upsampling方法从不同的角度。我们使用PASCAL VOC2012数据集(类分割)详细探讨先进的表演。在接下来的实验中,我们手动设置TGV-based upsampling模型的参数一个 1 和一个 2 (在我们的实验中,我们初步制定一个 1 = 0.05 和一个 2 = 0.1 ;他们可以用迭代训练)。

原来我们重新训练网络(FCN、U-Net SegNet)及其修改版本在帕斯卡的TGV upsampling算法训练集(1464张照片)。

特征图(数据重建的比较 5- - - - - - 7),我们对上述四种方法在帕斯卡验证组(1449张照片)。我们随机选择某一层的特征图谱FCN, U-Net, SegNet和比较了upsampled使用不同方法的结果。

图5

比较相同的转置操作和TGV upsampling特征图(FCN)。(一)输入地图。(b) TGV upsample。(c)转置。(d)地面真理。

(一) (b) (c) (d)

图6

比较相同的双线性操作和TGV upsampling特征图(U-Net)。(一)输入地图。(b) TGV upsample。(c)双线性。(d)地面真理。

(一) (b) (c) (d)

图7

比较一个unpooling操作和TGV upsampling同样的特征图(SegNet)。(一)输入地图。(b) TGV upsample。(c) Unpooling。(d)地面真理。

(一) (b) (c) (d)

整体比较(图的分割结果 8),我们使用PASCAL测试集(1456张照片)。定量结果(1456张照片),我们采用整体精度(OA),平均精度(MAcc),在联盟(FWIoU) frequency-weighted路口,意味着十字路口在联盟(MIoU)作为指标。

图8

整体分割结果例子帕斯卡VOC (GT代表地面实况,F,年代,和U代表FCN结果,SegNet U-Net,虽然英国《金融时报》,圣,和UT意味着三个网络结合TGV upsampling)。

4.1。实验以下4.4.1。重建的中间特征图

在这个阶段,我们取代了原始upsampling层在所有三个网络(FCN、U-Net SegNet)与我们的TGV upsampling方法(见图 9,FCN为例)。为了更好的对比结果,我们说明了性能TGV upsampling在处理相同的输入(特征图由以前的层)等等,在SegNet U-Net和unpooling取代双线性操作。

图9

替换的转置卷积层FCN TGV upsampling方法。

考虑到某些upsampling方法可能用在模型中使用时,我们只选择一个比较无论输入的大小和多少upsampling操作出现在网络。在数据特征图 5- - - - - - 7最具代表性的激活输出每一层的培训过程。

在数据 5- - - - - - 7(说明特征图谱的比较),所有输入一些层的地图是在编码阶段。我们发现TGV upsampling进行更好地节省的纹理和边缘特征映射。在图 5,相同的输入地图FCN体系结构中,我们观察到,与转置卷积重建相比,TGV upsampling复制几乎所有类(用不同的颜色表示)出现在输入地图。可训练的操作时,转置操作流程后输入“填充和提取”管道。绝对存在一定的概率抽样地图包含一些类,实际上包含在输入地图,或一个类可能过滤掉。它可以清楚地看到,在第二个和第三个输入子映射(图 5),转置操作没有完全复制所有对象出现在输入地图。即使这种情况下被忽略,很容易观察到TGV upsampling比转置操作更好地重建纹理。

如图 6,双线性插值恢复太多不必要的已知信息两类 x和 y对象的方向,而TGV upsampling重建的原理,基于已知的像素值的高阶散度。TGV的源模型的信息更合理和更复杂。的重建结果TGV upsampling也比双线性插值。

最后,图 7比较unpooling TGV upsampling。unpooling只记录以来最大的位置激活在编码阶段执行池操作时,很明显,unpooling重建并不完整,因为有很多空格纹理应该出现的地方。一般来说,unpooling操作的效率最严重的三个方面的可视化结果。

4.1.2。培训TGV Upsampling

在这个实验中,我们比较整体分割结果与原始网络。

图 8说明了从FCN帕斯卡VOC的示例输出(FCN-8s), U-Net SegNet,修改后的TGV upsampling-based网络(分别用FCN-TGV、U-Net-TGV和SegNet-TGV)。coarse-feature地图的原始网络相比,类(或对象)认识(指的是对象之间的间隔区)在我们的结果更珍贵的情况(见SegNet和SegNet-TGV)和超过地区地面真理是大大缓解了(见FCN和FCN-TGV)。与此同时,他们保存完好的边界的平滑。最后,它可以得出结论,TGV upsampling方法有助于做出更好的预测模型的语义。

挥发性有机化合物的定量结果测试集的算法和竞争对手展示在表 1。我们观察到,总体精度而言,意味着准确性,频率精度,或MIoU,所有指标都提高了1.4 -2.3%,相应的可视化结果图 10。

表1

帕斯卡VOC的结果集。

方法	办公自动化	MAcc	FWIoU	MIoU
FCN-8s	91.13	78.68	84.59	64.59
FCN-TGV	92.33	80.12	87.49	66.02
SegNet	86.86	74.41	80.32	58.59
SegNet-TGV	87.46	76.08	83.45	60.48
U-Net	87.13	70.68	79.59	61.59
U-Net-TGV	89.14	72.12	81.49	63.89

图10

损失函数的SegNet (a)和SegNet-TGV帕斯卡VOC VALIDATAE组(b)。

(一) (b)

数据 10- - - - - - 12显示应用新的upsampling方法(后效应 X和 Y轴代表迭代和损失,分别)。我们发现TGV upsampling算法有一个显著的影响在减少损失相比原来的方法。与一个固定的批量大小,我们的新方法聚合速度比原来的模型。

图11

损失函数的FCN (a)和FCN-TGV帕斯卡VOC VALIDATAE组(b)。

(一) (b)

图12

损失函数的U-Net (a)和U-Net-TGV帕斯卡VOC VALIDATAE组(b)。

(一) (b)

4.1.3。在训练过程中损失函数

FCN的损失函数,FCN-TGV、U-Net U-Net-TGV, SegNet, SegNet-TGV帕斯卡VOC VALIDATAE集给出数据 10- - - - - - 12。

4.2。分析

结束所有四个upsampling操作后,介绍了在上面的部分中,我们可以把他们分成两种类型根据他们不同的信息来源。

4.2.1。准备备份(包括Unpooling和转置卷积操作)

许多研究人员认为,当重构特征图,中间结果在之前的操作应该是指生产(特别是层在编码阶段),好像沿着“路径图像进行处理。“已知条件前面距离(指相应的层在编码阶段)可以更好”谓词”下面的道路状况(指功能重建地图)。因此,当应用这些方法,操作前一层的信息应该保存。例如,unpooling操作实际上是视为一个索引存储。保存参数,特征图谱可以重建。

然而,转置和unpooling操作,这是不可避免的,处理结果将保留一定的前层产生的中间结果的一部分。在某些情况下,这有助于保持重要的信息可能被忽视在培训过程中,但它也可以是一个扰动,将不必要的信息。

4.2.2。来自自身(包括双线性插值和TGV Upsampling操作)

相比“备用”领域,信息来源双线性插值和TGV upsampling用于弥补亏损来自先前操作的方法的过程,而不是结果。中描述的相关作品,双线性操作篡改 x和 y基于已知样本值的方向。TGV的方法有一个更复杂的信息来源。它开始从 k订单差异(已知的像素值 k订单图片)。它可以更好的保护边界信息的纹理,一步效应可以有效地避免,提高整个图像的平滑在同一时间。

从这些实验的结果,数值结果损失函数和平滑度的采样特征图谱证明,TGV-upsampling方法是一个很好的改善当前的方法。

5。结论

在这项工作中,我们介绍了一个基于图像恢复TGV-upsampling方法研究。我们把地图功能重建的过程变成一个loss-optimization问题。根据每个订单的散度,我们使用TGV正规化,重建分段函数。数值优化中,我们使用一个非算法,可以有效地执行并行计算和导致高帧率。我们应用新方法三个网络通过帕斯卡VOC数据集和评估结果。这些测试证明了TGV upsampling方法可以大大弥补失去的平滑度和边界信息的地图。相比原来的方法用于网络(FCN、U-Net SegNet),这个新方法平均提高1.4 - -2.3%的MIoU准确性使用时在解码阶段。当观察训练过程在实验中,我们明显发现TGV upsampling方法极大地弥补了信息损失,导致其他业务(主要指各种卷积层)。

该算法不仅限于单层upsampling地图。在未来,它将扩展到整个场景理解有效整合时间相干性在一个一致的方式。相反,提出“restoration-like”方法,我们将进一步集中在如何更好地理解潜在的语义在无人监督的设置。

数据可用性

代码用于支持本研究的发现没有提供,因为该方法后来被应用在医学项目,涉及个人隐私。

的利益冲突

作者宣称没有利益冲突。

确认

本研究支持的研究项目来解决社会问题的韩国国家研究基金会(NRF)由科技部和ICT(没有。NRF2017M3C8A8091768)。

陈

L.-C。

帕潘德里欧

G。

Kokkinos

我。

墨菲

K。

Yuille

a . L。

Deeplab:语义图像分割与深卷积网,深黑色的卷积,充分连接控

IEEE模式分析与机器智能 2018年 40 4 834年 848年

10.1109 / tpami.2017.2699184

2 - s2.0 - 85042712042

李

X。

刘

Z。

罗

P。

阿来

C . C。

唐

X。

并不是所有的像素都是平等的:通过深层级联difficulty-aware语义分割

《IEEE计算机视觉与模式识别会议

2017年7月

美国犹他盐湖城

10.1109 / cvpr.2017.684

2 - s2.0 - 85044543462

赵

H。

史

J。

气

X。

王

X。

贾

J。

金字塔场景解析网络

《IEEE计算机视觉与模式识别会议

2017年7月

美国犹他盐湖城

10.1109 / cvpr.2017.660

2 - s2.0 - 85040197457

诺尔

F。

Bredies

K。

痘痕

T。

Stollberger

R。

二阶广义总变异(TGV)核磁共振

磁共振医学 2011年 65年 2 480年 491年

10.1002 / mrm.22595

2 - s2.0 - 79251548920

Chambolle

一个。

痘痕

T。

一阶非凸问题与应用程序算法成像

《数学成像和愿景 2011年 40 1 120年 145年

10.1007 / s10851 - 010 - 0251 - 1

2 - s2.0 - 79953201848

Zeiler

m D。

泰勒

g·W。

费格斯

R。

自适应deconvolutional网络中学习和高水平的功能

《IEEE计算机视觉国际会议(ICCV)

2011年

Krizhevsky

一个。

Sutskever

我。

辛顿

g . E。

Imagenet与深卷积神经网络分类

诉讼进展的神经信息处理系统

2012年12月

太浩湖,NV,美国

Ronneberger

O。

费舍尔

P。

Brox

T。

U-net:卷积网络生物医学图像分割

《医学影像计算和计算机辅助介入的国际会议

2015年10月

德国慕尼黑

施普林格

234年 241年

10.1007 / 978 - 3 - 319 - 24574 - 4 - _28

2 - s2.0 - 84951834022

长

J。

Shelhamer

E。

达雷尔

T。

完全卷积网络语义分割

《IEEE计算机视觉与模式识别会议

2015年6月

波士顿,美国

10.1109 / cvpr.2015.7298965

2 - s2.0 - 84959205572

Badrinarayanan

V。

肯德尔

一个。

Cipolla

R。

Segnet:深卷积encoder-decoder用于图像分割的架构

IEEE模式分析与机器智能 2017年 39 12 2481年 2495年

10.1109 / tpami.2016.2644615

2 - s2.0 - 85033697420

能剧

H。

在香港

年代。

汉

B。

学习反褶积网络语义分割

《IEEE计算机视觉国际会议

2015年12月

圣地亚哥,智利

马丁

d·R。

Fowlkes

C . C。

马利克

J。

学习检测自然图像边界使用本地亮度,颜色,纹理线索

IEEE模式分析与机器智能 2004年 26 5 530年 549年

10.1109 / tpami.2004.1273918

2 - s2.0 - 3042525106

Simonyan

K。

Zisserman

一个。

很深的卷积网络大规模图像识别

2014年

https://arxiv.org/abs/1409.1556

Dumoulin

V。

Visin

F。

深度学习的指南卷积运算

2016年

https://arxiv.org/abs/1603.07285

Zeiler

m D。

Deconvolutional网络 2010年 2528年 2535年

沃格尔

c·R。

阿曼。

m E。

总变差图像快速重建

《1995年ASME设计工程会议

1995年9月

波士顿,美国

不。C部分

鲁丁

l . I。

Osher

年代。

法特米

E。

基于非线性全变差的噪声去除算法

自然史D:非线性现象 1992年 60 1 - 4 259年 268年

10.1016 / 0167 - 2789 (92)90242 - f

2 - s2.0 - 44049111982

Zeiler

m D。

罗伯

F。

观察和理解卷积网络

欧洲计算机视觉的诉讼

2014年9月

瑞士苏黎世

施普林格

10.1007 / 978 - 3 - 319 - 10590 - 1 - _53

2 - s2.0 - 84906489074

Papyan

V。

Romano

Y。

兰德

M。

通过卷积稀疏编码卷积神经网络分析

2016年

https://arxiv.org/abs/1607.08194

20.

乔

L.-B。

张

B.-F。

苏

js。

陆

X.-C。

系统回顾的结构化稀疏学习

前沿的信息技术和电子工程 2017年 18 4 445年 463年

10.1631 / fitee.1601489

2 - s2.0 - 85018602621

王

P。

陈

P。

元

Y。

理解卷积语义分割

学报2018年IEEE冬季会议上的应用计算机视觉(WACV)

2018年3月

太浩湖,NV,美国

IEEE

10.1109 / wacv.2018.00163

2 - s2.0 - 85051043298

Springenberg

j . T。

追求简单:卷积净

2014年

https://arxiv.org/abs/1412.6806

Bredies

K。

Kunisch

K。

痘痕

T。

广义总变化

暹罗成像科学》杂志上 2010年 3 3 492年 526年

10.1137 / 090769521

2 - s2.0 - 78651543709

痘痕

T。

Chambolle

一个。

对角预处理对一阶非凸优化算法

2011年国际会议上计算机视觉学报》上

2011年11月

西班牙巴塞罗那

IEEE

10.1109 / iccv.2011.6126441

2 - s2.0 - 84856673847

艾瑟

E。

张

X。

陈

t F。

一个通用的框架,一类一阶非凸优化算法在成像科学

暹罗成像科学》杂志上 2010年 3 4 1015年 1046年

10.1137 / 09076934 x

Ferstl

D。

Reinbacher

C。

Ranftl

R。

Ruether

M。

女孩

H。

图像引导深度upsampling使用各向异性总广义变异

《IEEE计算机视觉国际会议

2013年12月

澳大利亚悉尼

10.1109 / iccv.2013.127

2 - s2.0 - 84898811204

他

W。

张

H。

张

沈

H。

Total-variation-regularized低秩矩阵分解为高光谱图像恢复

IEEE地球科学和遥感 2016年 54 1 178年 188年

10.1109 / tgrs.2015.2452812

2 - s2.0 - 84947485589