复杂性

在这一页上

文摘介绍相关工作实验结果讨论结论数据可用性的利益冲突确认引用版权相关文章

特殊的问题

协作的大数据管理和分析复杂系统的边缘2021

把这个特殊的问题

研究文章|开放获取

体积2022年| 文章的ID4901746| https://doi.org/10.1155/2022/4901746

Few-Shot通过捕获组内的细分,同类信号使用类激活地图

严赵 ,¹ Ganyun Lv,¹ 和巩义市香港²

学术编辑器: Xuyun张

收到了 2021年12月10

修改后的 2022年3月23日

接受 2022年4月22日

发表 04年7月2022年

文摘

Few-shot分割是一项具有挑战性的任务由于有限类线索提供的一些注释。发现更多的类线索从已知和未知类few-shot分割的关键。现有的方法生成类线索主要来自共同的线索内部新类,支持图像和查询图像之间的相似性度量对前景区域进行定位。然而,支持图像不够充分衡量相似因为支持的一个或几个面具不能描述的对象大变化的新类。在这篇文章中,我们捕捉类中所有图像信号通过考虑未知的类,即。,not only the support images but also the query images are used to capture the foreground regions. Moreover, the class-level labels in the known classes are also considered to capture the discriminative feature of new classes. The two aspects are achieved by class activation map which is used as attention map to improve the feature extraction. A new few-shot segmentation based on mask transferring and class activation map is proposed, and a new class activation map based on feature clustering is proposed to refine the class activation map. The proposed method is validated on Pascal Voc dataset. Experimental results demonstrate the effectiveness of the proposed method with larger mIoU values.

1。介绍

图像分割(1)旨在段对象区域从图像,它是许多计算机视觉任务的基础(2]。基于基于深度学习方法(3- - - - - -7),现有的分割模型可以细分对象当给出足够的注释(8]。然而,现有的分割方法仍然有两个缺点。首先,注释生成费时。注释的数量通常是如此之小,很难训练分类模型从几个注释。另一个是分割模型工作在新的类,即。,the segmentation models only recognize the objects in the training dataset and cannot segment regions of classes unknown.

来解决这个缺点,few-shot分割(9- - - - - -14提出了]。给定一组图像的新类,一些注释(支持图像),few-shot分割的目的是部分地区的查询图像有效。然而,炼油细分模式的直观法的一些注释是被证明是无效的。Few-shot细分面临的挑战发现对象线索从有限的注释。为此,研究人员已经提出了很多方法来提高few-shot分割(15- - - - - -17]。这些方法可以概括为分割线索从现有已知类的注释,注释是足够的训练模式。因此,转移的class-agnostic制导模型分割的支持面具查询面具可以训练首先然后用于参考阶段直接定位查询图像前景的地区。一些策略如面具转移和原型使用功能。few-shot分割已明显改善。

同时,few-shot分割仍面临着缺乏对象先验尽管许多现有的注释使用数据集。两个原因导致这样的挑战。首先,组内的有很大的差异,这使得已知的类之间的知识转移和新类非常困难。其次,组内存在很大的差异。因此,一些注释不能描述所有的类和类型会导致错误的指导。换句话说,前台先验仍受限于当前few-shot分割方式。

在本文中,我们提出一个新的few-shot分割方法,考虑两个方面,即组内的线索和同类线索捕捉更多足够细分线索从已知和未知类。第一个捕获现有类之间的语义关系和未知的类,用于捕获有识别力的线索通过比较现有的类和未知的类。第二个抓住了共同的线索组内,即共同特性的查询和支持捕获图像来定位对象。这两个方面是通过类激活地图(摄像头)。一个分类模型只考虑类级别标签首次建造。然后,提取类激活映射基于反馈分析。后来,由于有识别力的地区通常是小,我们扩大区别的区域使用功能聚类方法指导下面具的支持。最后,凸轮引入few-shot分割掩模作为提高注意力地图查询图像分割。

该方法的贡献如下:(1)新few-shot分割方法基于分割线索组间和组内提出(2)类活动映射用于捕获细分因素,并提出了一种新的关注模块添加类激活few-shot分割网络地图(3)一个扩展方法提出了基于聚类的方法扩大类激活地图

Few-shot分割目标与几段地区的新类注释的图像,这是一个基本的任务在计算机计算(18,19]。few-shot细分任务总是作为一个信息指导模型,制定的常识,可以用于分割的任务是学到的分支之间传输,支持分支和查询分支。有两个关键组件在现有few-shot分割方法,其中第一个组件是一个类之前提取模块支持分支,和第二个组件是一个指导分支机构之间的网络提取的知识转移。

至于类提取之前,提出了多种类型的类之前,可以进一步分为体重依赖型剂量方法和基于原型的方法。体重依赖型剂量方法考虑分类器作为类之前的重量。最具代表性的工作OSLSM[体重依赖型剂量方法10],它利用一个条件分支生成参数查询分支。

当前最先进的方法是基于原型的方法。基于原型的方法可以进一步分为全球原型,融合全球和当地的原型,原型的背景。全球基于原型的方法考虑支持分支上的深度特性转换成类原型,例如,PANet [20.]和CANet [21)学习一门职业专用全球原型蒙面平均池操作。

第二种类型的基于原型的方法需要同时考虑全局和本地的原型和有能力提取特征与语义知识。最具代表性的方法是PPNet [22]和PMMs [22),第一个方法分解整体类表示为一组与k - means part-aware原型,第二个关联不同的图像区域与多个原型来执行基于原型的表示与援助的EM算法。

第三种类型的基于原型的方法使用背景原型来增强前景的语义知识。最具代表性的方法是MLCNet [23]和SCNet [24),第一个方法引入了一个矿业分公司利用潜在的通过转移subclusters小说类,第二种方法生成self-contrastive背景原型直接从查询图像,使建设完整的样本对补充和辅助分割任务。

至于指导支持部门之间网络的设计和查询部门,提出了多种类型的指导模块,可以进一步分为特性指导网络和参数层指导网络。级指导根据提取的特征进行相似性传播不同的分支。代表方法包括PFENet [25),生成前面罩基于余弦相似性特征,然后采用浓缩特性模块来传播这种相似性在多个分辨率。中心思想(26)提出了一种非参数和class-agnostic转换方法,地方特色的关系计算高维矩阵嵌入空间基于余弦距离,然后从低级的本地关系映射到高级语义线索与注释矩阵的广义逆矩阵。参数层指导网络考虑最后一个特定的模型参数层类之前,使用的参数变换支持部门查询部门实现指导。最具代表性的工作类(27),在分类层进行指导;它提出了分级机重量变压器动态适应支持集训练分类器的权重每个查询图像归纳方法。

3所示。该方法

3.1。该方法的管道

该方法的管道图所示1,该方法包括四个步骤:分类步骤中,CAM生成步骤,面具生成步骤,面具细化步骤。分类步骤是训练一个分类网络通过考虑所有现有的类和新类基于映像级别标签只激活地图所表示的类和输出未知类的区别的区域通过梯度反馈。然后,从最初的凸轮通常是非常小的,CAM生成步骤扩展了凸轮使用集群战略。之后,面具生成步骤生成的分割掩模软值基于掩码传输策略生成的凸轮在第二步是用作增强注意力地图查询的功能形象。最后,面具细化步骤是提高基于经典分割的分割掩模框架。我们接下来详细的四个步骤。

3.2。分类的步骤

分类步骤的目的是训练一个分类模型,考虑到已知的类和新类和提取新类的区别的区域不同的现有类的新类。因此,新类的粗略位置查询中可以获得图像。

具体地说,一个训练数据集包括现有的类,首先建立了新类。在这里, 由现有类的号码吗。是图像的新类。基于所有类,分类网络的训练,并分类映射使用Grad-CAM方法提取。

与此同时,区域通常是小是因为粗糙的映像级别标签不能获得对象的整个地区,但小范围之内。下一步扩大强调集群区域使用功能。

3.3。CAM生成步骤

CAM生成步骤扩展类激活地图基于区域定位的初始步骤可以被视为类中心,和其他与该地区突出的相似像素可以视为对象区域。因此,我们使用聚类方法得到相似的像素。

具体来说,CAM生成步骤包含三个子步骤:像素集群,集群选择和凸轮的一代。在第一步中,k - means聚类(28)用于集群像素集群基于深度特性分类步骤中获得的。为每个集群中,每个像素都激活价值在课堂上激活地图,和集群的平均值是通过激活值的平均值。像素的平均值代表了重要的类,和的平均值作为激活值集群中的所有像素。因此,一个新的类激活地图是获得。

3.4。掩码生成步骤

掩码生成步骤部分前景区域查询图像的基于类的激活地图。这里,few-shot分割网络使用,基于转移和类激活地图是嵌入到网络加强指导。

3.4.1。Few-Shot分割网络

few-shot分割网络构造的方法(26),这个想法是为了获取查询的面具(与大小 )基于如下的关系: 在哪里和分别查询面具,面具和支持,两面具被重塑成列向量。矩阵乘积的吗和 ,与大小。它是在看到价值意味着中的值和所有的价值。否则,该值是零。

一次众所周知,查询面具可以得到

因此,变化得到矩阵乘积few-shot分割问题 ,可估计的功能相似的像素支持和查询图像,即。前景像素有相似的特征,有相似的距离值。否则,距离值为零。

根据上面的公式,few-shot分割网络可以构建一个基于两个分校网络,指导模型的公式(2)。网络如图1。

具体来说,支持图像支持下面具和查询图像 ,基于两个分校网络用于提取像素特征。一个是支持部门,支持图像的提取特征 ,,另一个是查询的查询分支,提取特征的形象。然后,相似矩阵的和通过计算离散余弦距离计算,在哪里在哪里值的位置吗。和是th特性和th特性和。是离散余弦距离。因此,是指像素的相似性,这是类似于面具的相似关系,并可用于估计矩阵乘积。

然后,用于估计矩阵产品并用于获取查询通过面具(2)。

请注意,估计使用像素的特性是具有挑战性的。因此,我们使用支持面罩过滤通过element-wise生产前景区域。

3.4.2。通过凸轮功能增强

不同于few-shot分割方法(26),我们介绍了类激活映射带有歧视的线索通过所有课程来提高查询图像的特性。具体来说,如图1分类,查询图像发送到网络形成的初始分类地图。然后,使用聚类算法细化类激活地图。类激活地图然后用作注意力地图提炼的深层功能查询图像,和精制特性指导查询图像的分割。

3.5。面具细化步骤

few-shot分割分支的输出的软面具查询图像。获得二进制掩模,一个阈值可以用来获得硬软面具的面具。然而,结果是敏感阈值的选择。因此,分割掩模是用来段最后从柔软的面具,面具的软面具作为前景概率图,并进行分割网络努力获得最终的分割掩模。我们使用的方法(8)来实现面具细化。

4所示。实验结果

4.1。数据集

我们下一个验证该方法基于帕斯卡Voc数据集由20类。与现有few-shot分割方法相似,20类分为两类。一个是火车few-shot分割网络训练集。其他的测试集验证网络的分割质量。充分验证few-shot分割模型,使用四分裂。细节是在表中找到1。

4.2。实现细节

我们在Titan-XP GPU实现我们的方法。Pytorch用于实现我们的方法。网络是由亚当优化器优化初始学习速率1 e−4。等骨干VGG16、ResNet50 ResNet 101用于充分的评价。基于ImageNet pretrained骨干网络(29日)用于训练。

4.3。主观的结果

我们首先在图显示一些主观的结果2,输入图像、预测结果、结果显示和地面真理。看到的是预测结果与地面真理的结果类似,这表明我们的方法可以部分这些新类成功的图片。

4.4。客观结果

我们客观地评价该方法mIoU和FB-IoU值通常用于few-shot分割评估。结果如表所示2,1次和5岁意味着few-shot分割和五个支持注释,分别。三个骨干VGG16等ResNet 50, ResNet 101被认为是。我们可以看到,101年ResNet获得最好的结果由于深层网络。结果ResNet 50比VGG 16,这也是造成更深的网络,捕捉更多的语义功能。

4.5。与现有的方法比较

我们也比较方法与现有的最先进的方法。比较方法是显示在表中2。看到,我们的方法优于这些比较的方法,证明该方法的有效性,尤其是对方法的比较(26),我们的方法可以视为一个改进的方法26]。看到我们的方法是比的方法26)演示了我们的策略的有效性,介绍了类激活映射获取线索组间和组内。

4.6。烧蚀研究

我们下一个展示烧蚀的结果。最初的凸轮和改进凸轮是消融研究。骨干ResNet 50。结果如表所示3所示,mIoU值。是见过原始凸轮也能导致改进。与此同时,我们的改进凸轮可以进一步提高的结果,这表明事实集群策略是一个有用的方法来提高凸轮的地区。

5。讨论

现有few-shot分割方法通常集中在学习class-agnostic模型,基于阶级之间的水平。这样class-agnostic模型会导致好的泛化新类,但是还缺少类线索的新类。现有class-agnostic模型的基础上,我们试图添加新的细分信号通过歧视线索组内的和共同的线索组内,两组间和组内的水平。因此,可以通过我们的方法得到更好的分割结果。

看到我们的方法是基于方法(26](LTM),它提出了一个few-shot分割算法通过估计的关系矩阵的面具是一个有趣的想法。然而,我们的方法是不同的从中心思想26]。首先,我们的主要贡献是激活使用类图来捕获分割线索组间和组内,不考虑(26]。其次,LTM添加一个关注的模块,可以添加凸轮分割线索提高分割。因此,我们的方法可以被认为是一个扩展中心(26有更好的分割结果。”

6。结论

本文提出了一种新的few-shot分割方法使用类激活映射增强代对象先验通过考虑共同的线索组内和组内的区别的暗示。该网络由四个步骤组成:分类步骤,CAM生成步骤,生成步骤面具,面具细化步骤,用于生成初始凸轮通过类分类,生成凸轮通过特征聚类,生成细分面具,分别和细化分割掩模。该方法是在帕斯卡Voc数据集进行验证。实验结果表明,考虑共同线索的同类和歧视的组内的可以提高few-shot分割大借据的值。

数据可用性

可从数据集用于验证https://host.robots.ox.ac.uk/pascal/VOC/。列出详细的结果。更多的结果可以从相应的作者找到合理的请求。

的利益冲突

作者宣称没有利益冲突。

确认

本文部分由中国国家自然科学基金(51577086);江苏省六大人才高峰(TD-XNY004);和江苏高校重大科研项目(19 kja510012)。

引用

j .长,大肠Shelhamer, t·达雷尔“完全卷积网络语义分割”《IEEE计算机视觉与模式识别会议(CVPR),39卷,不。4,页3431 - 3440,波士顿,MA,美国,2015年6月。
视图: 出版商的网站 | 谷歌学术搜索
w . x, h . Li, z . Liu l .姚和f·戴,“人工智能互联网边缘服务优化的车辆:一项调查,“清华科技,27卷,不。2、270 - 287年,2022页。
视图: 出版商的网站 | 谷歌学术搜索
k . x张,他任美国,j .太阳,“深残余学习图像识别,”学报2016年IEEE计算机视觉与模式识别会议(CVPR)拉斯维加斯,页770 - 778年,NV,美国,2016年6月。
视图: 出版商的网站 | 谷歌学术搜索
k . Simonyan和a . Zisserman”大规模图像识别,很深的卷积网络”学报(ICLR)学习国际会议上表示美国圣地亚哥CA, 2015年4月。
视图: 谷歌学术搜索
z、x, y . Zhang et al .,“Cloud-edge合作气象雷达大数据:评估数据质量控制,”复杂和智能系统,2021年1 - 15页。
视图: 出版商的网站 | 谷歌学术搜索
问:小王,c .元,y . Liu”学习深有条件的神经网络用于图像分割,”IEEE多媒体,21卷,不。7,1839 - 1852年,2019页。
视图: 出版商的网站 | 谷歌学术搜索
x, z, j . Zhang et al .,“边缘内容缓存与深度时空残余iov网络在智能城市,“ACM传感器网络交易,17卷,不。3,1-33,2021页。
视图: 出版商的网站 | 谷歌学术搜索
L.-C。陈,g .帕潘德里欧Kokkinos, k .墨菲和a . l . Yuille”Deeplab:语义图像分割与深度卷积网,深黑色的卷积,并完全连接控,“IEEE模式分析与机器智能,40卷,不。4、834 - 848年,2018页。
视图: 出版商的网站 | 谷歌学术搜索
y刘:刘、曹问:x姚明,j .汉和l .邵”few-shot语义分割,学习非目标知识”《IEEE计算机视觉与模式识别会议(CVPR),新奥尔良,路易斯安那州,2022年5月。
视图: 谷歌学术搜索
a·沙班邦萨尔,z,艾萨,和靴子,“一次性学习语义分割”2017年英国机器视觉会议程序,BMVCp。167年,伦敦,英国,2017年9月。
视图: 出版商的网站 | 谷歌学术搜索
杨张x, y, y, t . s .黄”Sg-one:相似性指导网络只有一次的语义分割,“IEEE控制论,50卷,不。9日,第3865 - 3855页,2020年。
视图: 出版商的网站 | 谷歌学术搜索
n .邢董和大肠“Few-shot语义分割与原型学习”英国机器视觉研讨会论文集(BMVC)纽卡斯尔,页79 - 91年,英国,2018年9月。
视图: 谷歌学术搜索
g . c . Zhang Lin f . Liu j .郭问:吴和r .姚明,“金字塔图网络连接注意事项提出一次性语义分割,”学报2019年IEEE / CVF计算机视觉国际会议(ICCV),页9587 - 9595,首尔,韩国(南),2019年11月。
视图: 出版商的网站 | 谷歌学术搜索
y, f .孟h . Li k . n .颜和吴问:“一个新的few-shot分割网络基于类表示,”学报2019年IEEE视觉通讯和图像处理(VCIP)IEEE,页1 - 4,悉尼新南威尔士,澳大利亚,2019年12月。
视图: 谷歌学术搜索
张,t·吴,吴s, g .郭”Catrans:上下文和亲和力变压器few-shot分割,”《人工智能国际联合会议(IJCAI)展出2022年7月,维也纳,奥地利。
视图: 谷歌学术搜索
s•m . Hemani a Chopra, b••”Simpropnet:提高相似度传播Few-Shot图像分割,“2020年,https://arxiv.org/abs/2004.15014。
视图: 谷歌学术搜索
保y . j . Liu, g .谢h .熊j . snoke和e . Gavves”动态原型卷积few-shot语义网络分割,”《IEEE计算机视觉与模式识别会议(CVPR),2022年4月。
视图: 谷歌学术搜索
x x, z, l .七张,问:他和周x,“TripRes。”ACM交易多媒体计算、通信和应用程序,17卷,不。2、21、2021页。
视图: 出版商的网站 | 谷歌学术搜索
沈,x, l .七张x,和g·斯利瓦斯塔瓦,“动态服务器放置在边缘计算向互联网的车辆,“计算机通信卷,178年,第123 - 114页,2021年。
视图: 出版商的网站 | 谷歌学术搜索
刘j . k . Wang h . y .邹,d .周和j .冯”Panet: few-shot图像语义分割与原型一致,”学报2019年IEEE / CVF计算机视觉国际会议(ICCV),页9197 - 9206,首尔,韩国,2019年10月。
视图: 出版商的网站 | 谷歌学术搜索
g . c . Zhang Lin f . Liu r .姚明,和c .沈”Canet: class-agnostic分割网络迭代细化和细心few-shot学习,”学报2019年IEEE / CVF计算机视觉与模式识别会议(CVPR)长滩,页5217 - 5226年,CA,美国,2019年6月。
视图: 出版商的网站 | 谷歌学术搜索
张x, y . Liu s张,x,他“Part-aware原型few-shot语义分割网络”《计算机视觉——2020年大会,欧洲计算机视觉施普林格,页142 - 158年,格拉斯哥,英国,2020年8月。
视图: 出版商的网站 | 谷歌学术搜索
l .杨w·卓l .气y, y高,“为few-shot分割,挖掘潜在的类”《IEEE / CVF计算机视觉国际会议公元前,页8721 - 8730,蒙特利尔,加拿大,2021年10月。
视图: 谷歌学术搜索
j·陈,b。高,z,黄永发。雪,c . Wang和问:廖Scnet:增强Few-Shot Self-Contrastive背景语义分割的原型,“2021年,https://arxiv.org/abs/2104.09216。
视图: 谷歌学术搜索
z田、赵h . m .蜀,z, r·李和j .贾”引导功能浓缩Few-Shot分割网络之前,“IEEE模式分析与机器智能,44卷,2020年。
视图: 出版商的网站 | 谷歌学术搜索
y,孟,h·李,问:吴,x,和陈,“few-shot分割一个新的本地转换模块,”学报》国际会议多媒体建模施普林格,页76 - 87年,韩国大田市2020年1月。
视图: 出版商的网站 | 谷歌学术搜索
他,朱x, z . Lu l . Zhang Y.-Z。歌,和t .香”,越简单越好:few-shot语义分割与分类器的重量变压器,”学报2021年IEEE / CVF计算机视觉国际会议(ICCV)公元前,页8741 - 8750,蒙特利尔,加拿大,2021年10月。
视图: 出版商的网站 | 谷歌学术搜索
j·a·哈和m . a . Wong”算法136:k - means聚类算法”,应用统计学,28卷,不。1,p。100年,1979。
视图: 出版商的网站 | 谷歌学术搜索
j .邓w .咚,r . Socher L.-J。李,李k·凯和l .李菲菲”Imagenet:大规模的分层图像数据库”学报2009年IEEE计算机视觉与模式识别会议(CVPR),页248 - 255,迈阿密,佛罗里达,美国,2009年6月。
视图: 出版商的网站 | 谷歌学术搜索
k . rakel网e . Shelhamer t·达雷尔a·埃弗莱文和美国,“条件few-shot语义分割网络,”《车间(ICLRW)学习国际会议上表示加拿大,温哥华,公元前2018年4月。
视图: 谷歌学术搜索
k阮和美国Todorovic few-shot分割特征加权和提高,”《IEEE / CVF计算机视觉国际会议,页622 - 631,首尔,韩国,2019年9月。
视图: 谷歌学术搜索
c . w . Liu, g .林和f·刘,“few-shot分割Crnet:交叉引用网络,”学报2020年IEEE / CVF计算机视觉与模式识别会议(CVPR),第4173 - 4165页,西雅图,佤邦,美国,2020年6月。
视图: 出版商的网站 | 谷歌学术搜索
h . Wang x, y, y,曹x, x和,“Few-shot语义分割与民主关注网络,”《计算机视觉——2020年大会,计算机视觉的欧洲会议(大会)施普林格,页730 - 746年,格拉斯哥,英国,2020年8月。
视图: 出版商的网站 | 谷歌学术搜索

版权

PDF 下载引用

下载其他格式

订单打印副本

的观点

223年

下载

330年

引用

复杂性