科学的规划

在这一页上

文摘介绍方法结论数据可用性的利益冲突引用版权相关文章

特殊的问题

机器学习在图像和视频处理

把这个特殊的问题

研究文章|开放获取

体积2021年| 文章的ID2934362| https://doi.org/10.1155/2021/2934362

图Embedding-Based判别降维

Yanjia田 ^1、2 和翔凤 ^1、3

学术编辑器: 白元丁

收到了 2021年10月11日

修改后的 2021年11月18日

接受 2021年11月22日

发表 2021年12月03

文摘

判别图embedding-based降维方法吸引了越来越多的关注在过去的几十年里。这些方法构造一个内在图和惩罚图保留组内样本的内在几何结构和单独的组内的样本。然而,边际样品不能准确表征只有惩罚图因为他们平等对待每个样本。在实践中,这些边际样本往往影响的分类性能,需要特殊处理。在这项研究中,附近邻居的假说的进一步最大化边际样品分离组内的样本,提高判别的能力通过整合内在图和罚款图。一本小说名叫LMGE-DDR判别降维已经提出。一些公共数据集进行实验来验证的有效性提出LMGE-DDR如ORL、耶鲁大学,曼彻斯特理工,FERET, CMIU-PIE09,和AR。LMGE-DDR执行比其他方法相比,和相应的标准差LMGE-DDR小于其他人。这表明,评价方法验证了方法的有效性。

1。介绍

降维(DR)更重要的是在大多数机器学习和模式识别等领域1- - - - - -4]。它旨在解决维数的诅咒实现相关的高维数据集的低维表示。线性判别分析(LDA)和主成分分析(PCA)是最具代表性的方法5,6]。主成分分析得到低维空间最大化方差。LDA可以使用标签信息项目的特征空间来区分类别阶级之间的距离最大化和最小化同类的距离。然而,LDA不能捕获数据的局部结构。众所周知,高维数据的局部结构对数据表示非常重要。

K附近邻居图可以更好地描述数据的局部结构(7]。因此,在过去的几年中,图embedding-based降维方法(如雨后春笋般涌现7,8),如米歇尔(9],Isomap [10,11],拉普拉斯算子eigenmap [12]。然而,这些多方面的学习方法不直接处理新样品,因为他们没有获得任何映射函数,这被称为“样本外”问题(13]。因此,为了解决这个问题,提出了一种更有效的方法来获得明确的投影映射。保局投影(牧民联盟)保存数据在低维空间的局部结构,这是一个著名的方法(2]。它的简单性和有效性,提出了它的变体(14,15]。然而,垂直距离执行糟在分类因为它并不完全使用标签信息,这是一种无监督的方法(16]。社区保留投影(NPP)保存数据流形上的本地邻居的信息(17]。

为了进一步提高分类性能,判别图embedding-based方法已逐渐成为一个热门研究课题,利用标签信息,旨在保存在类几何结构,与此同时,最大化类间距离不同的集合管(18]。因此,最近,越来越多的判别图embedding-based方法研究了。费舍尔边际分析(MFA)构造两个邻接图最大化两两之间的分离性边缘数据点(19]。当地判别嵌入(LDE) [20.利用标签信息并提出了最近的neighbor-based嵌入。然而,它遭受所谓的样本规模小(SSS)问题,它不能直接适用于高维数据20.]。考虑到当地同类景点或阶级之间的斥力,判别社区嵌入(DNE)提出了数据点在同一类压实,而类之间的差距变得更广泛的在一个低维子空间21]。然而,DNE并不总是设置不同类别的边缘与邻国,这将降低组内的新空间和距离会恶化的分类(22]。因此,丁等人构建双邻接图链接他们的同类和异类邻居和引入了一个更有效的版本DNE称为DAG-DNE [22]。受DAG-DNE的启发,提出了一些判别分析方法在过去的几年里(23- - - - - -33]。

大多数降维方法可以统一graph-embedding框架(19]。构造相似图形的方法和这些方法之间的点球图是不同的(34]。因此,graph-embedding-based方法对重量敏感矩阵,而它们赋予相同的重量为每个样本(包括边际样本)以同样的方式。然而,如前所述在[35),这些边际样本位于类保证金在高维空间中治疗达到最大的类间假设利润率和良好的分类性能,更重要的分类性能。因此,大假说附近邻居之间的利润边际样品可以改进嵌入特征的辨别能力,应该分别对待。为边际样本,在这项研究中,最近的邻居的假设边际样本被认为是边缘和最大化提高判别能力,除了构造邻接图的两倍。在这项研究中,一种新的大型边缘图embedding-based判别降维名叫LMGE-DDR已经介绍了。大部分实验结果证实的有效性提出LMGE-DDR几个公共数据集。

2。方法

首先,常见的符号在这项研究中。高维数据的表示与样品在d维度,包括类与类。表示的样本由矩阵转换 ,在哪里 , 是任何一个列向量。和 ,分别表示邻居(不同的类)和相同的类k邻居的样本。

2.1。DNE

判别社区嵌入(DNE)被认为是当地同类景点和阶级之间的斥力和学习内在图图和罚款如下:

目标函数可以表示如下:

在此, 在哪里。在哪里。

约束可以保护当地的结构和加强判别能力36]。

目标(2)可以重写的正式跟踪如下: 在哪里。因此,目标函数(2)可以改写如下:

投影矩阵可以通过解决以下特征向量的问题: 在哪里特征值,我= 1,…,d,(我= 1,…,d)是相应的特征向量。假设和。在给出的细节21]。

2.2。DAG-DNE

双邻接图论判别社区嵌入称为DAG-DNE构造双邻接图DNE的提出更有效的版本。在DAG-DNE,和可以定义如下:

投影矩阵可以解决在DNE如下:

3所示。该方法

透露,邻接矩阵的权重被赋予相同的方式为每个样本包括边际样本,不能进一步改善类间假设利润率和恶化的分类性能。在这项研究中,边际示例定义中定义1。假设利润率是研究(37- - - - - -39]。

定义1。(边际样本)。被认为是一种边际样本如果和。
边际样品在这个研究是位于类保证金的。图1是附近邻居的图并显示(即边际样本。,{5、6、7、8})。

定义2。(假设保证金)。5所示(37),假设利润率可以定义如下: 在哪里和表示最近的邻居的样本x分别用相同的类和不同的类。代表了l₂规范。样例x可以准确地认识到1神经网络分类器(最近邻)什么时候 ,如图2。

定义3。(异构附近邻居的假说保证金)。边际的样本如图3为了说明异构附近邻居的假设的 ,这是定义如下: 在此, , 。
所示(11),它可以让不同样本之间的分离,实现大幅异构附近邻居当所有括号的表达式是大于零,这意味着它可以正确地分类1神经网络分类器。

4所示。LMGE-DDR

DAG-DNE的基础上,边际样本在高维空间中被最大化另外单独处理异构附近邻居的保证金,可以提高判别能力。LMGE-DDR可以提出如下:

组内的重量和在DAG-DNE一样,LMGE-DDR的目标函数可以表示为

在这里, 在DAG-DNE是一样的。女士表示边际样本在高维空间中设置。是一种交换参数和吗。

这个目标函数转化为两个部分如下:

基于(5)。

解决方案(12)很容易得到解决的最大特征值问题。

在这里, 在哪里特征值,我= 1,…,d,对应的特征向量,我= 1,…,d。假设和。

的细节中可以看到LMGE-DDR算法1。

	输入:一个训练集 , 和判别子空间的维数r。
输出:投影矩阵P;
(1)	构建同类邻接图由:

	和阶级之间的邻接图由:

(2)	计算基于(15)
(3)	Eigendecompose矩阵,
(4)	选择r最大特征值对应的特征向量: 。

5。分析LMGE-DDR

在本节中,LMGE-DDR将分析说明保留几何和判别结构的有效性。

尽管LMGE-DDR类似于构建一个邻接图,DAG-DNE边际样本在高维空间,LMGE-DDR最大化异构附近邻居的假设利润率达到一个大的类间保证金在低维子空间和歧视邻居的局部结构,提高判别DAG-DNE相比。

LMGE-DDR表演的一个玩具数据见图4。

(一)

(b)

(c)

(d)

(e)

(f)

图4

插图的嵌入空间,假设利润率:(a)玩具数据(H (x ₁)= -0.83));(b) MFA (k₁ = k ₂H = 5,(x ₁)= -0.84);(c) MNMDP ((k) = 5, H (x ₁)= 0.19);(d) DNE ((k) = 5, H (x ₁)= 0.43);(e) DAG-DNE ((k) = 5, H (x ₁)= -0.84);(f) LMGE-DDR ((k) =k ₁=k ₂= 3,(a) = 0.8, H (x ₁)= 0.39)。

如图4(一)的样本 , 是和是。因此,基于(12),假设边缘表示如下:

基于定义2,样例会认识到错误,因为它假设利润率小于零。

嵌入的结果和假设利润率在一维空间数据中所示4 (b)- - - - - -4 (e))。可以看出,假设样本的利润率在低维空间中小于零MFA DAG-DNE, MNMDP相反的局势,DNE, LMGE-DDR。在LMGE-DDR,假设样本大(H( )比DAG-DNE = 0.39),这是有用的分类。

总的来说,最大化异构附近邻居的假设边际边际样品可以进一步提高在低维空间的判别能力。

6。实验

在本节中,与一些流行的方法如DAG-DNE相比,DNE, MNMDP, MFA, LMGE-DDR进行几个实验系统来验证其有效性。具体来说,LMGE-DDR的性能的实验说明了人脸识别和二维可视化。随机选择的l从每个人构成了训练数据图像,剩下的测试数据。最近邻参数k, k₁,和k₂在构建邻接图设置为l1中所有方法[40]。PCA是采取减少图像的维度近98%的能量。1应用神经网络分类器进行分类。20分的平均结果被认为是分类的结果。

6.1。二维可视化

葡萄酒数据集被执行2 d可视化如图5(41];从图5可以清楚的看到,所学到的采样点在低维空间比DAG-DNE LMGE-DDR分离。

(一)

(b)

(c)

(d)

(e)

6.2。人脸识别

在ORL LMGE-DDR评估(http://www.cad.zju.edu.cn/home/dengcai/Data/FaceData.html),FERET [42),基于“增大化现实”技术(43),耶鲁大学,曼彻斯特理工(https://www.sheffield.ac.uk/eee/research/iel/research/face),CMU-PIE09†面临数据集来评估分类系统性能和它与MFA等几种流行的方法相比,MNMDP DNE, DAG-DNE。

6.2.1。参数分析

参数的敏感性k₀,一个在几个脸上LMGE-DDR分析数据集参数k, k₁,和k₂被设置为l1。图6礼物最好的识别率LMGE-DDR的不同的值k₀,一个。结果在图6显示的识别精度LMGE-DDR上下波动。总的来说,最好的识别精度能取得一个和k₀更大。原因是大一个可以使边际样本紧密聚集对类中心。大k₀,边际样品。也就是说,异构附近邻居的利润边际的样本可以最大化,实现大型类间的优势,有利于分类。因此,的值k₀和一个在LMGE-DDR在不同的数据集采用交叉验证的人脸识别实验。

(一)

(b)

(c)

(d)

6.2.2。实验结果

在本节中,在公共数据集进行了几个实验来验证的有效性提出LMGE-DDR,如ORL、耶鲁大学,曼彻斯特理工,FERET CMIU-PIE09,和基于“增大化现实”技术的示例图片如图所示7。每个图像在ORL第一对齐和裁剪到32×32。每个图像在耶鲁是32×32第一对齐和剪裁。每个图像在曼彻斯特理工是40×50第一对齐和剪裁。所有的图片在FERET裁剪80×80。所有的图片在CMIU-PIE09裁剪64×64。所有图像的基于“增大化现实”技术的出现为50×40。表1- - - - - -6是最好的识别结果在不同的数据集。图8识别结果在不同的维度。

(一)

(b)

(c)

(d)

(e)

(f)

(一)

(b)

(c)

(d)

如图8和表1- - - - - -6,我们可以看到,在大多数实验,LMGE-DDR执行比其他方法和相应的标准差相比LMGE-DDR小于其他人。

6.2.3。时间成本分析

在本节中,不同的方法评估的时间成本在多个数据集包括ORL、耶鲁大学,曼彻斯特理工,FERTET。在表7,它是通过运行一次的时间计算l= 5,d= 20。

它可以得出结论,LMGE-DDR相当与其他方法在时间成本;然而,一些比别人表现得更好。

7所示。结论和未来的工作

在这项研究中,我们提出一个新的图embedding-based名叫LMGE-DDR降维方法,基于异构附近邻居的假说。不同于其他判别学习方法、边际样本在高维空间中,我们另外最大化异构附近邻居的假设利润率达到一个大的类间保证金,不包括学习两种相同的邻接图同样来说,这是非常重要的分类的实验结果。实验结果说明LMGE-DDR的有效性。在这篇文章中,我们还采用一些评价方法对该模型进行评估。结果表明,在一些公共数据集如ORL、耶鲁大学,曼彻斯特理工,FERET, CMIU-PIE09,和基于“增大化现实”技术,该模型优于其他基准模型。然而,在构建邻接图和边缘样品,将会受到噪声的影响,这是不能完全避免的。未来的作品,如何评估的可靠性社区将研究通过引入一种自适应邻接因素(44]。

数据可用性

使用的实验数据来支持本研究的发现可以从相应的作者。

的利益冲突

作者声明,关于这项工作他们没有利益冲突。

引用

m·a . Turk和a . p . Pentland“使用eigenfaces人脸识别,”计算机视觉模式识别,27卷,不。3、586 - 591年,1991页。
视图: 出版商的网站 | 谷歌学术搜索
x f .他s . c .燕y . x, p .他和h . j .,“使用Laplacianfaces人脸识别,”模式肛门。马赫。智能。27卷,第340 - 328页,2005年。
视图: 出版商的网站 | 谷歌学术搜索
林y y, t·l·刘,h·t·陈,“语义图像检索多方面的学习,”Proc。ACM Int,相依多媒体,第258 - 249页,2005年。
视图: 出版商的网站 | 谷歌学术搜索
x f .他、d . Cai和j·w·汉,“学习”图像检索的最大的利润空间,"。数据中。,20卷,第201 - 189页,2008年。
视图: 出版商的网站 | 谷歌学术搜索
m . Turk, a . Pentland Eigenfaces认可。”神经科学杂志》上,3卷,不。1,第86 - 71页,1991。
视图: 出版商的网站 | 谷歌学术搜索
邓,c . Wang z傅,m .王”的智能系统在中国证券市场内幕交易的识别,”计算经济学卷,57号6、2020。
视图: 出版商的网站 | 谷歌学术搜索
h . Cai诉郑,k . Chang,“一个全面的调查图嵌入:问题,技术和应用,“IEEE工程知识和数据,30卷,不。9日,第1637 - 1616页,2017年。
视图: 谷歌学术搜索
p . Goyal和e·费拉拉,”图嵌入技术、应用程序和性能:一项调查,“Knowl-Based系统卷,151年,第94 - 78页,2018年。
视图: 出版商的网站 | 谷歌学术搜索
s . t . Roweis l . k .扫罗,“通过局部线性嵌入非线性降维,”科学卷,290年,第2326 - 2323页,2000年。
视图: 出版商的网站 | 谷歌学术搜索
j·b·特南鲍姆诉de silva, j·c·朗格弗德”全球几何非线性降维,框架”科学,卷290,不。5500年,第2323 - 2319页,2000年。
视图: 出版商的网站 | 谷歌学术搜索
z n h . c .瞿l . Li Li和j .郑”监督判别isomap最大利润率降维图正规化,”专家系统与应用程序,卷180,不。15篇文章ID 115055 2021。
视图: 出版商的网站 | 谷歌学术搜索
m·贝尔金和p .他”,拉普拉斯算子eigenmaps维数降低及数据表示,“神经计算,15卷,不。6,1373 - 1396年,2003页。
视图: 出版商的网站 | 谷歌学术搜索
y Bengio, j . Paiement·文森特·o . Delalleau n . l . Roux和m . Ouimet”外的示例扩展米歇尔,isomap, MDS, eigen-maps,和谱聚类”国际会议程序神经信息处理系统,页177 - 184,惠斯勒,加拿大,2004年12月。
视图: 谷歌学术搜索
c . d . Lu叮,j .徐,s . Wang分级判别分析,“传感器,18卷,不。1,p。279年,2018。
视图: 出版商的网站 | 谷歌学术搜索
问:于x, g . Liu, r . Wang“稳定和正交局部判别嵌入使用降维跟踪比标准,“多媒体工具和应用程序,卷77,不。3、3071 - 3081年,2018页。
视图: 出版商的网站 | 谷歌学术搜索
w . Yu x腾,c .刘“人脸识别使用判别保局投影,”图像和视觉计算,24卷,不。3、239 - 248年,2006页。
视图: 出版商的网站 | 谷歌学术搜索
x, d . Cai、美国燕和h . j .,“社区保护嵌入,”《2005年国际会议在计算机视觉,卷2,页1208 - 1213,ICCV,卡利亚里,意大利,2005年9月。
视图: 出版商的网站 | 谷歌学术搜索
x f .他d Cai, s . c .燕和h . j .,“社区保护嵌入,”《IEEE国际Conferenece计算机视觉(ICCV ' 05),1卷,第1213 - 1208页,北京,中国,2005年10月。
视图: 出版商的网站 | 谷歌学术搜索
燕,d .徐张,h . j .张问:杨,和林,”图嵌入和扩展:降维的总体框架,“IEEE模式分析与机器智能卷,29号1,40-51,2007页。
视图: 出版商的网站 | 谷歌学术搜索
h·w·h·t . Chen Chang, t·l·刘“局部判别嵌入及其变异,”计算机视觉和模式识别国际研讨会论文集美国圣地亚哥CA, 2005年6月。
视图: 谷歌学术搜索
w·张x y雪,h . Lu和y . f .郭“嵌入街区,判别分类,”模式识别39卷,第2243 - 2240页,2006年。
视图: 出版商的网站 | 谷歌学术搜索
c·t·丁和l .张”双重邻接graphs-based判别社区嵌入”,模式识别48卷,第1742 - 1734页,2015年。
视图: 出版商的网站 | 谷歌学术搜索
问:你:郑、美国Du和y,“社区为人脸识别判别投影,”模式识别的字母,2007年。
视图: 出版商的网站 | 谷歌学术搜索
m .广域网、z卢和z,“利润最大嵌入特征提取和分类判别(毫米),”《IEEE中国相依。模式识别(CCPR),页1 - 5,南京,中国,2009年11月。
视图: 出版商的网站 | 谷歌学术搜索
m . Sugiyama“降维的多通道带安全标签的数据时由当地Fisher判别分析,“机器学习研究杂志》上,8卷,第1061 - 1027页,2007年。
视图: 谷歌学术搜索
d . Cai x,他周k j .汉保和h,“位置敏感的判别分析,”《人工智能联合会议,页1713 - 1726,黄金海岸,澳大利亚,2007年12月。
视图: 谷歌学术搜索
陈黄p c、z . Tang和z,“使用局部结构保护判别分析特征提取,”Neurocomputing卷,140年,第113 - 104页,2014年。
视图: 出版商的网站 | 谷歌学术搜索
j . p .郭台铭y z詹,m . Wan x沈,j . Chen和l . Du“最大社区保证金判别投影分类,”科学世界日报,2014年16卷。
视图: 出版商的网站 | 谷歌学术搜索
j .郭台铭y, z, j . Lv和詹y,“有识别力的全球性和区域性保护图嵌入维数减少,”专家系统与应用程序文章ID 113079卷,144年,2019年。
视图: 出版商的网站 | 谷歌学术搜索
s . Wang c .叮,c·h·许和f·杨,“通过保护本地信息降维,”未来一代计算机系统,卷108,不。22日,2018年。
视图: 出版商的网站 | 谷歌学术搜索
j.p.郭台铭和z易Locality-based判别邻域嵌入”,电脑杂志9卷,第1082 - 1063页,2013年。
视图: 出版商的网站 | 谷歌学术搜索
h·s·胡、z d·冯和y陈,“一种新型的降维方法:相似性秩序保护判别分析,“信号处理文章ID 107933卷,182年,2020年。
视图: 出版商的网站 | 谷歌学术搜索
z . Liu施k, k, w•欧和l .王”区别的稀疏嵌入基于自适应图像降维,”人工智能技术的工程应用文章ID 103758卷,94年,2020年。
视图: 谷歌学术搜索
f·罗,Du, l, l . Zhang和d .道,“功能学习使用空间谱超图判别分析的高光谱图像,”IEEE控制论49卷,第2419 - 2406页,2018年。
视图: 出版商的网站 | 谷歌学术搜索
赵和y吴”,高效大型margin-based特征提取,”神经处理信件,50卷,不。12日,2019年。
视图: 出版商的网站 | 谷歌学术搜索
r·杜达·哈特和d .鹳,模式分类新泽西州霍博肯市约翰·威利& Sons,美国,第二版,2000年版。
r·g·Bachrach a Navot, n . Tishby“保证金功能选择学说和算法为基础,”21国际会议的程序的机器学习页,43-50 ACM出版社,班夫》,2004年7月。
视图: 出版商的网站 | 谷歌学术搜索
k .谎言r . Gilad-Bachrach a Navot, n . Tishby“保证金lvq算法,分析”先进的神经信息处理系统美国马剑桥,麻省理工学院出版社,2003年。
视图: 谷歌学术搜索
gdp赵、z . y .周和j·m·张“图embedding-based判别降维理论框架”,信号处理文章ID 108289卷,189年,2021年。
视图: 出版商的网站 | 谷歌学术搜索
j .杨·d·张,j·杨和妞妞,“在全球范围内最大化,本地最小化:无监督判别投影应用面临和棕榈生物识别技术”IEEE模式分析与机器智能卷,29号4、650 - 664年,2007页。
视图: 出版商的网站 | 谷歌学术搜索
葡萄酒的数据库,http://www.resset.cn/databases(2021-7-01)访问。
p . j .菲利普斯“面部识别技术(FERET)数据库”,2004年,http://www.itl.nist.gov/iad/humanid/feret/feret_master.html >。
视图: 谷歌学术搜索
问:高,j . Liu h .张x高,和k·李,“联合全球和局部结构判别分析,”IEEE取证和安全信息,8卷,不。4、626 - 635年,2013页。
视图: 出版商的网站 | 谷歌学术搜索
y, y, j .潘罗,和c . Yeng“判别分析根据当地社区的可靠性,”专家系统与应用程序文章ID 114790卷,175年,2021年。
视图: 出版商的网站 | 谷歌学术搜索

版权

PDF 下载引用

下载其他格式

订单打印副本

的观点

203年

下载

319年

引用