复杂性

在这一页上

文摘介绍相关工作结论数据可用性的利益冲突确认引用版权相关文章

特殊的问题

限定时间控制复杂系统和他们的应用程序

把这个特殊的问题

研究文章|开放获取

体积2020年| 文章的ID1462429| https://doi.org/10.1155/2020/1462429

Semi-Supervised跨通道检索基于歧视届时系统

李刘 ,¹ 肖董 ,¹ 和王天师 ¹

学术编辑器: Jianquan陆

收到了 2020年5月08

修改后的 07年6月2020年

接受 2020年6月13日

发表 2020年7月18日

文摘

大多数跨通道检索方法基于子空间的投影矩阵学习只关注学习不同的模式映射到一个常见的子空间和更少的关注检索任务特异性和类信息。解决两个限制和充分利用未标记的数据,我们提出一个新颖的semi-supervised跨通道检索方法命名modal-related检索基于歧视届时系统(MRRDC)。投影矩阵给出了将多通道数据映射到一个共同的子空间为不同的任务。投影矩阵的过程中学习,介绍了线性判别约束保持原来的类信息在不同模态空间。迭代优化算法基于标签传播提出了解决提议联合学习配方。几个数据集上实验结果证明我们的方法与先进的子空间方法相比的优越性。

1。介绍

在真实的应用程序中,数据通常以不同的方式或来自不同域表示。因此,具有相同语义的数据可能存在于不同的形式或展览异构特性。多通道数据的快速增长,迫切需要有效地分析获得的数据来自不同形式(1- - - - - -5]。虽然有相当多的关注多通道分析,最常见的方法是整体多通道数据来提高性能(6- - - - - -9]。跨通道检索是一种有效的方法来实现数据从不同的模态数据。典型的例子就是把图像作为一个查询来检索相关文献(I2T)或搜索图像利用文本描述(T2I)。图1显示了I2T和T2I任务的详细过程。跨通道检索得到的结果更加全面与传统single-modality的结果。

一般来说,语义鸿沟跨通道检索和相关措施阻碍发展。虽然有很多方法来解决这个问题,这些方法的性能仍不能达到令人满意的水平。因此,方法(10- - - - - -16)提出了学习常见的子空间通过最小化成对差异做出不同的模式类似。然而,任务特异性和类信息经常被忽视,从而导致低层次的检索性能。

上面提到的解决这些问题,本文提出了一种新型semi-supervised联合学习框架跨通道检索通过整合共同的子空间学习,学习任务相关,和阶级歧视学习。首先,受典型相关分析(CCA) [7)和线性最小二乘法,投影矩阵被耦合线性回归了原始多通道数据映射到常见的子空间。同时,线性判别分析(LDA)和任务相关的学习(TRL)是用来防止不同形式的数据结构和语义关系的投影空间。此外,我的未标记的数据的类别信息,半监督的策略是利用传播从标签数据未标记的数据语义信息。三公共数据集的实验结果表明,该方法优于之前的最先进的子空间方法。

本文的主要贡献可以概括如下:(1)提出联合制定无缝结合semi-supervised学习,学习任务相关,线性判别分析在一个统一的框架,用于跨通道检索(2)标签数据的类信息是传播到未标记的数据,介绍了线性区别的约束和保护组间和组内不同模式之间的相似性

本文的其余部分组织如下。节2,我们将简要地概述一下跨通道检索的相关工作问题。的细节提出了方法和迭代优化方法介绍了部分3。部分4实验结果和分析报告。结论最后的部分5。

因为跨通道检索中扮演一个重要的角色在各种应用程序中,许多subspace-based方法提出了通过建立联运内部相关性。Rasiwasia et al。7)调查的各种组合图像的检索性能特性和文本表示,覆盖所有可能的两个指导假设。后来,偏最小二乘(PLS) (17)也被用于跨通道的匹配问题。沙玛,雅各布斯(18)请使用线性图像从不同的视图映射到一个共同的线性子空间,图像具有较高的相关性。陈等人。19)解决跨通道的问题通过使用请将文档检索图像特征在文本空间,和方法容易实现两个模式之间的相似性度量方法。在[20.,21),双线性模型和广义多视图(GMA)已经提出和分析领域的表现良好跨通道检索。

除了CCA,请和GMA,马哈et al。22]提出了一种基于流形学习算法,可以同时降低数据的维数不同的模式。毛等。23]介绍了跨媒体检索方法命名为平行对齐检索领域,集成了一个流形对齐框架从向量场的角度。林和唐24)提出了一个常见的判别特征提取(CDFE)方法学习之间的差异在每个散射矩阵和散射矩阵。Sharma et al。21)改善Fisher LDA和边际分析(MFA)广义多视图LDA (GMLDA)和广义多视图从single-modality MFA (GMMFA)通过扩展到多峰性。灵感来自于语义信息,龚et al。25)提出了三个视图CCA特性之间的相关性进行深入研究以不同的形式和相应的语义。

此外,其他方法,如字典学习,提出了基于学习、多视图嵌入,跨通道问题[26- - - - - -29日]。壮族et al。30.]提出SliM2通过添加一组稀疏表示的成对关系学习项目不同形式到一个共同的空间。徐et al。31日)建议字典学习和功能学习应该学习相结合的自适应投影矩阵。邓et al。32)提出了一种区别的字典学习方法与常见的标签对齐的系数通过学习不同的模式。魏et al。33)提出了一个modal-related方法叫MDCR解决模态语义问题。吴et al。34)利用谱回归图模型,共同学习最小误差回归和潜在的空间。王等人。35)提出了一个敌对的学习框架,它可以学习modality-invariant和歧视表示不同的模式。在这个框架中,形态分类器和功能投影仪互相竞争获得一双更好的特性表征。曹et al。36)嵌入获得潜在的多视图表示用于视觉物体识别和跨通道检索。Zhang et al。37)利用图模型学习常见空间跨通道通过添加组内和组内的投影的关系的过程。

这些方法的主要目的是为了解决相关距离的测量,但类信息和任务特异性不好解决。因此,如何解决这两个问题在同一时间不同的任务尤为重要。基于这个想法,我们学习两对夫妇的预测不同的检索任务和线性区别的约束应用于投影矩阵。为了实现这一目标,我们将学习任务相关与线性判别分析通过semi-supervised标签传播。图2展示了我们的方法的流程图。三开放跨通道数据集实验结果证明我们的跨通道检索方法优于最新的方法。

3所示。方法

提高检索性能,介绍了歧视届时系统和更多关注不同的检索任务和类信息保存。在这里,我们专注于检索I2T I2T,和很容易扩大我们的其他形式的检索方法。

3.1。目标函数

图像数据定义为和文本数据另外,在哪里和表示标记的图像和它的文本维度, 和代表未标记的图像和它的文本维度。让是对图像和文本文件, 和分别表示标记和未标记的文档。是语义矩阵,在哪里类别数量,是标签的标签数据与一个炎热的编码,然后呢的pseudo-label未标记的数据。我们的方法的目的是学习两对夫妇不同形式的投影矩阵,项目数据到一个共同的空间不同的任务。然后,跨通道检索可以执行的公共空间。

我们提出一个新的modal-related投影策略基于semi-supervised学习任务特异性。这里,成对亲密的多通道数据和语义投影结合成一个统一的公式。I2T和T2I最小化形式得到如下: 在哪里和代表形式的投影矩阵和分开。

线性判别约束方程(1)和(2)介绍保护类信息子空间的投影。我们表示的标签样本的均值th类和的意思是所有的标签样本。组内散射矩阵可以被定义为 ,和总散射矩阵可以表示为。目标函数表示如下: 在哪里投影矩阵和吗是基本向量的维数。

根据方程(3),可以转化为线性判别约束 ,在哪里是。组内分散的被表示为 ,和组内的散射是。多通道条件下,我们利用LDA方法预测维护每个模态的类信息。相应的公式如下: 在哪里和表示和分开。

我们把方程(4)到方程(1)和(2),分别,然后得到目标函数的I2T T2I在以下: 在哪里是一个权衡系数平衡成对信息和语义信息和和正则化参数平衡图像的结构信息和文本。根据方程(1)和(2),结构的投影和是一样的语义投射。因此,我们的方法可以消除功能和语义空间。这可以减少投影的损失和提高跨通道检索的性能。

我们介绍semi-supervised学习策略。传播信息的标签标记数据,我们利用径向基函数(RBF)内核评价成对相似性投影后的未标记的数据,然后被视为标签的相似性信息更新的优化过程,直到结果收敛。对于任何数据和 ,内核函数定义如下: 在哪里是内核参数。

3.2。算法的优化

的目标函数方程(5)和(6)是凸的,所以迭代法用于当其他变体是固定的或者更新每个变体。

对于任何一个矩阵 ,的偏微分方程(5)表示如下:

同样,偏导数的方程(6)给出如下:

根据方程(8)- (11),我们的方法可以通过梯度下降法来解决。算法1描述了跨通道的优化学习。投影矩阵后I2T T2I任务获得,和可以映射到公共空间,跨通道检索。

	输入:所有图像特征矩阵 ,所有文本特征矩阵 ,和相应的语义矩阵。
	初始: ,并设置参数和最大迭代时间。是交替的步长更新过程,和是收敛的条件。
	重复一遍:






	直到
	重复一遍:






	直到



	直到最大迭代次数
	输出:

4所示。实验

评价该方法的性能(MRRDC),我们用其他方法做对比试验三个公共数据集。

4.1。数据集

以下4.4.1。维基百科的数据集

这个数据集包含2866的图像文字对标签的语义类。在这个数据集,选择2173双的数据作为训练集,剩下的测试设置。在我们的实验中,我们使用公共数据集(7]Rasiwasia et al . (wiki-R),所提供的图像是由128维筛选描述柱状图(38),和文本的表示10维来源于一个LDA模型(39]。与此同时,我们也使用提供的数据集魏et al。(wiki-W) [40),4096 -维CNN特性(41)用于显示图像和100 -维LDA特性是用来表示文本。

4.1.2。帕斯卡句子数据集(40]

这个数据集由1000个图像文字对20个类别。我们随机选择30对每个类别的训练样本,其余作为测试样本。4096 -维CNN图像特性特性,和文本功能是100 -维LDA的特性。

4.1.3。INRIA-Websearch [42]

这个数据集包含71478对图像和文本注释从353类。我们去除一些对这些标记为不相关的和选择对属于任何100年最大的类别之一。然后,我们得到14698对进行评估的一个子集。我们随机选择70%的对每个类别作为训练集(10332对),和其他被视为测试集(4366对)。同样,图像是用4096 -维表示CNN特性,和文本标签表示100 -维LDA的特性。

4.2。评价指标

评价该方法的性能,进行了两个典型的跨通道检索任务:I2T T2I。在测试阶段,投影矩阵用于多通道数据映射到常见的子空间。然后,不同形式的数据可以被检索。在所有的实验中,采用余弦距离测量功能的相似之处。给定一个查询,每个跨通道任务的目的是找到最高k最近的邻居从检索结果。

算法的性能评估是指平均精度(地图),这是一个标准的信息检索度量。获取地图,平均精度(美联社)计算在哪里在测试数据集是关联数据的数量,是最高的精度检索数据,如果 ,顶部检索相关数据;否则, 。然后,地图的价值可以得到平均美联社所有查询。更大的地图,检索性能就越好。除了地图,precision-recall曲线和地图表现为每一个类被用来评估不同的方法的有效性。

4.3。比较的方法

来验证我们的方法具有良好的性能,我们比较我们的方法和七个最先进的方法,如请[18],CCA [7],SM [7],SCM [7],GMLDA [21],GMMFA [21],MDCR [33],JLSLR [34],ACMR [35],SGRCR [37]。

请,CCA, SM和SCM是典型的方法,利用成对学习常见的潜在信息子空间,可以通过测量不同的多通道之间的相似性度量方法。这些方法使成对数据在多通道数据集更学会了共同的子空间。GMLDA、GMMFA MDCR通过监督学习是基于语义类别的信息。由于使用标签信息,这些方法可以很容易地学习更有识别力的子空间。

4.4。实验装置

在算法的参数提出MRRDC1I2T和T2I检索任务的设置如下: , , , , , , , ,和维基百科提供的Rasiwasia INRIA-Websearch。维基百科提供的魏和帕斯卡, ,和其他与上述相同。在我们的实验中,学习速率设置。

4.5。结果和分析

表1地图显示了所有的分数通过请,CCA, SM, SCM, GMMFA, GMLDA, MDCR,和我们的方法wiki-R, wiki-W,帕斯卡的句子,INRIA-Websearch。我们注意到,我们的方法优于同行。这可能是因为投影矩阵保存通过semi-supervised学习更有识别力的类的信息。常见的子空间的方法是更多的不平等和有效的进一步利用类同时intramodality和通道间的语义相似度。从表1外,我们还发现,在大多数情况下,GMMFA, GMLDA, MDCR,比请和MRRDC总是表现得更好,CCA, SM, SCM,图像与CNN特性有优势较浅的特性。第一个结果,这是因为请,CCA, SM,和SCM只使用成对的信息,但其他方法类信息添加到他们的目标函数,它提供了更好的分离不同类别之间的潜在的常见的子空间。对于第二个结果,这是由于强大的语义表示CNN。

wiki-R precision-recall曲线,wiki-W,帕斯卡的句子,和INRIA-Websearch是绘制在图3。图4显示地图的比较方法和我们的方法,和最右边的酒吧每个图中显示的平均分数地图。对于大多数类别,我们的方法优于地图的比较方法。从这些实验结果,我们可以得出以下结论:(1)与目前最先进的方法相比,我们的方法大大提高了平均图。我们的方法始终优于方法相比,这是由于因素MRRDC学习任务相关投影矩阵和线性歧视的方式为不同的形式,不同的方法可以保留语义和原始类的信息。此外,标记数据和未标记的数据的所有不同形式的探索。标签信息可以传播到未标记的数据在训练过程中。(2)在大多数情况下,GMLDA GMMFA胜过自GMLDA CCA和GMMFA类别信息添加到他们的配方,使常见的子空间投影更适合跨通道检索。(3)较浅的特点,CNN I2T任务特征有很大的优势,这是因为CNN功能可以很容易地直接获取原始图像的语义信息。

(一)

(b)

(c)

(d)

(e)

(f)

(g)

(h)

(一)

(b)

(c)

(d)

(e)

(f)

(g)

(h)

(我)

进一步验证我们提出MRRDC的有效性,我们还提供的混淆矩阵single-modal I2T和T2I检索和查询示例数据5和6分开。直观地说,从图5,我们的方法可以实现高精度在每个类别,这证明了投影空间是歧视。我们也观察从图6在许多类别,我们建议的方法总是成功地获得最好的检索结果查询样本。

(一)

(b)

4.6。收敛

制定我们的目标是通过迭代优化算法来解决。在实际应用中,检索速度快是必要的。在图7,我们绘制的收敛曲线优化算法的目标函数值方程(5)和(6)在每个迭代wiki-W帕斯卡句子单独数据集。在这个图中,在每个迭代中,曲线是单调和算法对这些数据集通常在大约20个迭代收敛。速度快可以确保我们的方法的效率高。

(一)

(b)

(c)

(d)

5。结论

在本文中,我们提出一个有效的semi-supervised跨通道检索方法基于歧视届时系统。我们的方法使用不同的夫妻有识别力的投影矩阵不同的模式映射到公共空间,不同模式之间的相关性可以最大不同的检索任务。特别是,我们使用标签样本类别信息传播到未标记的样本,并保留了原始类信息通过使用线性判别分析。因此,该方法不仅使用不同的检索任务的关系,也使不同形式的结构信息。我在不久的将来,我们将不同模式之间的相关性和专注于无监督跨通道未标记的数据检索方法。

数据可用性

数据支持本文的研究和报道数据集引用引用。

的利益冲突

作者宣称没有利益冲突有关的出版。

确认

这部分工作是由中国国家自然科学基金(没有。61702310),山东、中国的重大基础研究项目(没有。ZR2019ZD03),山东的泰山学者项目,中国(没有。ts20190924)。

引用

r . Bekkerman和j .全”为多媒体综合聚类集合,”《IEEE计算机视觉与模式识别会议,页1 - 8,明尼阿波利斯,美国,2007年7月。
视图: 出版商的网站 | 谷歌学术搜索
d . Eynard a . Kovnatsky m·m·布罗斯特k . Glashoff和a . m .布罗斯特,“多通道同时对角化的拉普拉斯算子的多方面分析,“IEEE模式分析与机器智能,37卷,不。12日,第2517 - 2505页,2015年。
视图: 出版商的网站 | 谷歌学术搜索
s . Escalera j·冈萨雷斯,x气压,j . Shotton“客座编辑介绍特刊multimodal人类带来复苏和行为分析,“IEEE模式分析与机器智能,38卷,不。8,1489 - 1491年,2016页。
视图: 出版商的网站 | 谷歌学术搜索
b . l . Liu, h·张,n .张“图引导区别的预测基于图像识别的协作表示,“多媒体工具和应用程序,卷78,不。17日,第24518 - 24501页,2019年。
视图: 出版商的网站 | 谷歌学术搜索
x, z . Cheng l .朱r . c . Kanjirathinkal和m . Kankanhalli”MMALFM。”ACM交易信息系统,37卷,不。2,28,2019页。
视图: 出版商的网站 | 谷歌学术搜索
w·r·k . Wang, l . Wang Wang和t . Tan“联合特征选择和子空间学习跨通道检索”IEEE模式分析与机器智能,38卷,不。10日,2010 - 2023年,2016页。
视图: 出版商的网站 | 谷歌学术搜索
n . Rasiwasia j·c·佩雷拉·e·科et al .,“跨通道的多媒体检索的新方法,”诉讼Multimedia-MM国际会议上的10,页251 - 260,佛罗伦萨,意大利,2010年10月。
视图: 出版商的网站 | 谷歌学术搜索
l . Liu陈,陈x, t . Wang和l .张“模糊加权稀疏重建error-steered semi-supervised学习人脸识别,”计算机视觉,3卷,页1 - 14,2019。
视图: 出版商的网站 | 谷歌学术搜索
李l .朱、黄z z l .谢和h t .沈,“探索辅助背景:离散的可伸缩的图像检索的语义转移哈希,“IEEE神经网络和学习系统卷,29号11日,第5276 - 5264页,2018年。
视图: 出版商的网站 | 谷歌学术搜索
z l .朱、黄、刘x x, j .太阳和x周,“离散多通道散列与规范化观点强大的手机具有里程碑意义的搜索,“IEEE多媒体,19卷,不。9日,第2079 - 2066页,2017年。
视图: 出版商的网站 | 谷歌学术搜索
j·l·朱陆x, z . Cheng Li和h·张,“灵活的可扩展的多媒体检索,综合哈希”ACM智能交易系统和技术,11卷,不。2,页1 - 2020。
视图: 出版商的网站 | 谷歌学术搜索
x x, l .朱z Cheng的歌,和h·张,“有效的可伸缩的跨通道离散潜在语义散列检索”信号处理卷,154年,第231 - 217页,2019年。
视图: 出版商的网站 | 谷歌学术搜索
y y方、h·张任,“无监督跨通道检索通过综合图正规化光滑矩阵分解哈希,“以知识为基础的系统卷,171年,第80 - 69页,2019年。
视图: 出版商的网站 | 谷歌学术搜索
商,h .张l . j .太阳和h·张,“敌对的跨通道检索基于字典学习,”Neurocomputing卷,355年,第104 - 93页,2019年。
视图: 出版商的网站 | 谷歌学术搜索
f .商h·张,j·刘,h·张,“语义一致性和等级限制,跨通道的字典学习”杂志的视觉传达和图像表示卷,62年,第266 - 259页,2019年。
视图: 出版商的网站 | 谷歌学术搜索
j . m . Zhang李,张h . l . Liu“深层语义交叉与相关对齐哈希,”Neurocomputing卷,381年,第251 - 240页,2020年。
视图: 出版商的网站 | 谷歌学术搜索
r . Rosipal n·克莱默,“概述和最近的偏最小二乘的进步,”子空间,潜在的结构和特征选择,统计和优化页34-51 Springer,柏林,德国,2005年。
视图: 出版商的网站 | 谷歌学术搜索
a·沙玛,d . w . Jacobs绕过合成:请与姿势,面部识别低分辨率和草图,,”《IEEE计算机视觉与模式识别会议普罗维登斯,页593 - 600年,RI,美国,2011年6月。
视图: 出版商的网站 | 谷歌学术搜索
w . y . Chen l . Wang Wang和z,“连续回归跨通道多媒体检索”《IEEE国际会议上图像处理奥兰多,页1949 - 1952,美国2012年9月。
视图: 出版商的网站 | 谷歌学术搜索
j·b·特南鲍姆和w·t·弗里曼与双线性模型分离的风格和内容”,神经计算,12卷,不。6,1247 - 1283年,2000页。
视图: 出版商的网站 | 谷歌学术搜索
沙玛,a·库马尔·h·Daume三世,d . w·雅各布斯,“广义多视图分析:有识别力的潜在空间,”《IEEE计算机视觉与模式识别会议普罗维登斯,页2160 - 2167年,RI,美国,2012年6月。
视图: 出版商的网站 | 谷歌学术搜索
诉马哈,c . w . Wong j·c·佩雷拉et al .,“协方差最大展开:流形学习的双向数据”先进的神经信息处理系统,第926 - 918页,2011年。
视图: 谷歌学术搜索
林毛x、b, d . Cai x,他和j .贝聿铭“平行对齐为跨媒体检索领域,”诉讼的ACM多媒体会议德克萨斯州达拉斯,页897 - 906,美国,2013年4月。
视图: 出版商的网站 | 谷歌学术搜索
d·林和x唐Inter-modality人脸识别”欧洲计算机视觉施普林格,页13 26,柏林,德国,2006年。
视图: 出版商的网站 | 谷歌学术搜索
y锣,问:Ke, m . Isard和s . Lazebnik“视点嵌入空间建模网络图片,标签,和他们的语义,“国际计算机视觉杂志》上,卷106,不。2、210 - 233年,2014页。
视图: 出版商的网站 | 谷歌学术搜索
l . x, l .他h . Lu高,和y,“深敌对的度量学习跨通道检索”万维网,22卷,不。2、657 - 672年,2019页。
视图: 出版商的网站 | 谷歌学术搜索
j . x, h . Lu歌,y, h·t·沈和李x”三元对抗网络与慎独zero-shot跨通道检索”IEEE控制论,50卷,不。6,2400 - 2413年,2020页。
视图: 出版商的网站 | 谷歌学术搜索
j . y . Peng气、黄x和y元,“创新领导力:跨通道相关性学习与杂粮融合层次网络,”IEEE多媒体,20卷,不。2、405 - 420年,2018页。
视图: 出版商的网站 | 谷歌学术搜索
彭y和j·齐,“CM-GANs:跨通道生成对抗网络公共表示学习,”ACM交易多媒体计算、通信和应用程序,15卷,不。1 - 24,2019页。
视图: 出版商的网站 | 谷歌学术搜索
y y, y . Wang f . Wu,和w·卢”监督耦合的字典学习与组织结构综合检索”人工智能学报AAAI会议贝尔维尤,页1070 - 1076年,佤邦,美国,2013年7月。
视图: 谷歌学术搜索
x, a .岛田r .谷口,l .他”耦合的字典学习和特征映射跨通道检索”《IEEE国际会议多媒体和世博会意大利的都灵,页1 - 6,,2015年6月。
视图: 出版商的网站 | 谷歌学术搜索
严j·c·邓x唐,w . Liu和x高,“区别的字典学习与共同标签对齐跨通道检索”IEEE多媒体,18卷,不。2、208 - 218年,2016页。
视图: 出版商的网站 | 谷歌学术搜索
赵y, y, z朱et al .,“Modality-dependent跨媒体检索”ACM智能交易系统和技术,7卷,不。4,1-13,2016页。
视图: 出版商的网站 | 谷歌学术搜索
z . j . Wu林,h .咋”联合潜在的子空间学习和回归跨通道检索”40学报》国际市立图书馆会议在信息检索的研究与开发,页917 - 920,东京,日本,2017年8月。
视图: 出版商的网站 | 谷歌学术搜索
x y, b . Wang, a . Hanjalic h·t·沈,“敌对的跨通道检索”学报2017 ACM多媒体Conference-MM 17山景城,页154 - 162年,CA,美国,2017年10月。
视图: 出版商的网站 | 谷歌学术搜索
g .曹a . Iosifidis k . Chen和m . Gabbouj“广义多视点嵌入视觉识别和跨通道检索”IEEE控制论,48卷,不。9日,第2555 - 2542页,2018年。
视图: 出版商的网站 | 谷歌学术搜索
h . m . Zhang, j . Li l . Wang y,和j .太阳”监督图基于正则化的跨媒体检索与内部类的相关性、”杂志的视觉传达和图像表示卷,58页1 - 11,2019。
视图: 出版商的网站 | 谷歌学术搜索
y柯和r . Sukthankar PCA-SIFT:一个更独特的本地图像描述符表示,”2004年IEEE计算机学会学报计算机视觉与模式识别会议华盛顿特区,页506 - 513,美国2004年7月。
视图: 出版商的网站 | 谷歌学术搜索
d·m·布莱a . y . Ng,乔丹,“潜在狄利克雷分配”机器学习研究杂志》上,3卷,第1022 - 993页,2003年。
视图: 谷歌学术搜索
陆y, y赵,c . et al .,“跨通道检索与CNN的视觉特征:一个新的基线,”IEEE控制论卷,47号2、449 - 460年,2016页。
视图: 出版商的网站 | 谷歌学术搜索
a . Krizhevsky i Sutskever, g·e·辛顿“ImageNet分类与深卷积神经网络,”ACM的通信,60卷,不。6,84 - 90年,2017页。
视图: 出版商的网站 | 谷歌学术搜索
j . Krapac m·艾伦·j·j . Verbeek f . Jurie,“改善使用query-relative分类器网络图片搜索结果,”《IEEE计算机视觉与模式识别会议,页1094 - 1101年,旧金山,美国,2010年8月。
视图: 出版商的网站 | 谷歌学术搜索

版权

PDF 下载引用

下载其他格式

订单打印副本

的观点

475年

下载

794年

引用

复杂性

限定时间控制复杂系统和他们的应用程序

Semi-Supervised跨通道检索基于歧视届时系统

文摘

1。介绍

2。相关工作

3所示。方法

3.1。目标函数

3.2。算法的优化

4所示。实验

4.1。数据集

以下4.4.1。维基百科的数据集

4.1.2。帕斯卡句子数据集(40]

4.1.3。INRIA-Websearch [42]

4.2。评价指标

4.3。比较的方法

4.4。实验装置

4.5。结果和分析

4.6。收敛

5。结论

数据可用性

的利益冲突

确认

引用

版权