研究文章|开放获取
杨博,佟坤坤,赵雪青,庞善民,陈金光, "基于低秩分解的多标签分类",自然与社会中的离散动力学, 卷。2020, 物品ID1279253, 8. 页面, 2020. https://doi.org/10.1155/2020/1279253
基于低秩分解的多标签分类
摘要
在多标签学习框架中,每个实例不再与单一的语义相关联,而是与概念歧义相关联。具体来说,输入空间中实例的模糊性意味着输出空间中有多个对应的标签。在现有的多标签分类方法中,大多采用二进制标注向量来表示多个语义概念。也就是说,+1表示实例有一个相关的标签,而−1表示相反。然而,标签表示包含的语义信息太少,无法真正表达多个不同标签之间的差异。因此,我们提出了一种将二进制标号转换为实值标号的新方法。我们采用低秩分解得到潜在的标签信息,然后将这些信息与原始特征结合,生成新的特征。然后,利用稀疏表示对新实例进行重构,重构误差也可以应用到标签空间。这样,我们最终达到了标签转换的目的。大量的实验证明,该方法可以取得与其他先进算法相当甚至更好的结果。
1.介绍
分类是机器学习中的高频词汇。我们经常说分类通常是指单个标签分类,即,对象给出了一个类别。在Multilabel学习中,分类的含义是多标签分类。具体地,实例同时与多个类标签相关联。Multilabel学习有许多应用领域,例如网挖[1.–3.],文本分类[4.–6.]、多媒体内容注释[7.–11]和生物信息学[12–14].
近年来,多标签学习逐渐引起了人们的关注。人们提出了各种各样的算法,基本上可以分为两类[15]:算法适应与问题转换。前者的核心思想是改变先前的监督学习算法,以便它可以用于解决Mulbel学习问题,例如ML-KNN [16]后者是将多标签学习问题转化为其他已知问题来解决,如BR[17].有些多标签算法不使用不同标签之间的相关性来解决多标签学习问题,如LIFT [18]. LIFT的主要思想是获取每个标签的识别特征,并构建一个新的特征空间。该算法首先获取每个标签对应的正、负样本,然后对相应的样本集进行聚类分析,得到聚类中心,最后利用聚类中心构造标签特有的特征。在求解多标记学习问题的过程中,提升不考虑标签相关性;因此,它可以看作是一种新的特征转换方法。一些算法考虑了标签相关性。19–25]用于解决多标签学习问题。例如,在[20.]是基于贝叶斯网络对标签之间的相关性进行建模,并利用近似策略实现高效学习。的确,合理利用标签间的相关性可以有效地提高多标签分类的性能。例如,如果一张图片上有“足球”和“热带雨林”的标签,那么它很可能会被贴上“巴西”的标签。如果一个文档被标注为“沙漠”,那么它被标注为“河流”的可能性就很低。因此,如何有效地挖掘和充分利用标签相关性是多标签学习的关键问题。
事实上,对于具有多个标签的对象,相关标签的重要性仍然是不同的。虽然每个标签的重要性并不是直接给出的,但是我们可以通过外部观察来判断每个标签的重要性。一般来说,在原物中所占比例越大,相应的标签就越重要。因此,如何准确表达标签的重要性也是一个挑战。
[26]分解原始输出空间以获得潜在的标签语义信息,可以有效地提高后续特征选择的能力。通过分解标签空间的激励[26],提出了一种标签低秩分解(LLRD)方法用于多标签分类。LLRD算法首先对标签矩阵进行低秩分解,然后将分解结果与原始特征结合形成新的特征,并通过稀疏重构挖掘特征的结构信息。第三,将二元标号转化为实值,最后将分类问题转化为回归问题。
本文的贡献如下:(1)利用低秩分解揭示全局标签相关性,取得较好的分类效果(2)将低秩分解结果与原始特征相结合,减少了后续标签转换过程中的信息损失(3)在不同的现场数据集上进行大量的实验,以验证不同算法的有效性
2.材料和方法
2.1.数据集
在本实验中,共使用了13个数据集,涵盖四个领域:音频、文本、图像和生物学。所有这些数据资源都可以从木兰收集(http://mulan.sourceforge.net/datasets.html)及麦卡(http://meka.sourceforge.net/#datasetsru).表格1.给出了数据集的具体细节。实例数、标签空间和特征尺寸用| S |表示,L(S) ,及D分别(S)。LDen (S)是标号密度,是标号基数LCard(S)标准化的结果。
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
2.2. 符号
正式,假设成为D-维输入空间和 表示的输出域Q类标签。让 为多标签训练数据集P的例子,是一个D-维实例向量及其应用标签向量对应于什么 .让 表示输入数据矩阵,和 表示从中提取的矩阵从 .让 是由标号向量组成的矩阵。
2.3. LLRD过程
首先,lrd用低秩法分解标签矩阵。在多标签学习的框架中,标签矩阵通常被认为是低秩的[27,28],因为存在标签相关性。低秩结构也是探究标签间全局关系的一种方法。因此,我们可以对标签矩阵进行低秩分解。假设是R < Q,可以这样写: 在哪里表示在原始标签空间和是原始标签的映射,也包含标签相关信息。
其次,我们结合了具有形成新的特征空间 .为了揭示特征空间的内部结构,我们使用了稀疏重建[29]方法对训练实例之间的关系进行建模。具体来说,我们使用表示培训对象关系矩阵,其中是衡量两者之间关系的尺度和 .让表示与相关的相应稀疏重建系数 .根据稀疏表示理论,可计算如下: 在哪里 代表所有培训实例的组合 .我们可以用乘法器的交替方向法[30.].
第三,我们对原始的二进制标签集进行变换与任何相关在训练集中转化为实值标号向量 ,在哪里和 .因为实际值包含更多信息,并且通过值的大小,我们还可以推断标签的重要性。由于输入空间和标签空间通常是相互关联的,因此假设和在输入空间之间也存在和在标签空间。因此,标签空间中的不同元素的表示误差可以如下写入: 在哪里 .上述二次规划问题可以通过与二次规划相关的成熟工具来解决。原始的多标签分类问题可以转化为多输出回归问题。有很多解决办法[31]解决它。LLRD方法的学习包括三个阶段:低秩分解、稀疏重构和多输出回归。分析了低秩分解和稀疏重构的时间复杂度 .如果选择多输出支持向量回归来实现分类,则时间复杂度为 .因此,LLRD的总复杂性是 .
3.结果与讨论
3.1.实验设置
在本小节中,我们研究了我们的LLRD与其他六种多标签学习方法在六种多标签评价标准上的比较,这六种评价标准包括两类:基于示例的指标和基于标签的指标[32].基于示例的度量首先获得学习系统在每个测试示例上的性能,最后返回整个测试集的平均值。与上面基于示例的指标不同,基于标签的指标首先返回每个标签上的系统性能,最后获得宏/微平均F所有标签上的值均为1。
在本文中,一个错误,报道,排名的损失,平均精度用于基于实例的绩效评估。和宏观平均和微宽化F.1是基于标签的度量。例如,基于指标除外平均精度,随着其值的增加,这意味着算法的性能更差。对于其余的度量,它们的值与算法的性能成比例。
让是多标签测试集和 可以看作是关联的对应的标签 .此外, 可以转换为排名函数 .如果 有,则对应的排序函数有 .
本文中使用的算法的六种评估标准定义如下:(1)一个错误: (2)报道: (3)排名损失: (4)平均精度: (5)Macroaveraging F1: (6)Microaveraging F1: FN在哪里J, TNJ,FPJ,及茶多酚J表示关于假阴性、真阴性、假阳性和真阳性实例的数量 .
为了测试LLRD的有效性,我们选择了6种多标签学习算法MLFE [33), RAKEL网(34),毫升2.[35], CLR [36],电梯[18],以及RELIAB [37]用于性能比较。MLFE充分利用了特征空间的内在信息,使得标签空间的语义更加丰富。MLFE的具体参数设置如下: , , ,和 , ,和搜索从{1,2,…,10},{1、10、15},{1,10}。RAKEL是一种高阶方法。该算法的基本思想是将多标签学习问题转化为多类分类问题的集成。我们使用RAKEL算法推荐的默认设置,即: ,整体尺寸 .为毫升2.,各参数值记录如下:和和选自{1,2,...,10}。毫克2.是第一个尝试在标签层探索流形的多标签学习算法。CLR是一种二阶问题变换方法。该算法利用标签排序来解决多标签分类问题,标签之间的排序是通过两两比较来实现的。关联参数ensemble size设置为 .LIFT使用不同的特征集,通过聚集正面和负面示例来区分不同的标签。比值参数的取值R是0.1,如中所示[18].Reliab利用标签的隐式相关信息来实现多书学习的任务。参数和分别取{0.1,0.15,…,0.5}和{0.001,0.01,…,10}。LLRD, ,R可以从{1,2…,Q−1}. 总之,比较算法的参数设置与相关文献中推荐的一致。
3.2。实验结果
对于实验中的每个数据集,我们采用十倍交叉验证策略。我们的实验结果主要分布在表格中2.和3.,其中记录了不同算法在不同多标签数据集中的性能。表中记录了相应评价标准的平均值和标准差。对于每个评价指标,“↓”表示“越小越好”,“↑”表示“越大越好”。最好的结果以粗体显示。
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
我们使用弗里德曼测试[38],以验证算法之间的差异是否具有统计学意义。如果拒绝“所有算法性能相同”的假设,则意味着每个算法的性能存在显著差异。从表中的数据可以看出4.,在0.05显著水平下,算法间无显著差异的假设不成立。因此,我们需要进行后期测试来进一步区分各种算法。通常情况下,事后测试有两种选择,一种是Nemenyi测试[38另一种是邦菲罗尼-邓恩测试[39].为了算法,前者需要比较而后者只需要在某些情况下,有时是。因此,我们选择后者。Bonferroni–Dunn测试用于测试LLRD是否比比较算法更具竞争力,其中LLRD扮演控制算法的角色。当两种算法的平均秩差大于一个临界差CD时,两种算法的性能明显不同。此处提到的CD值可通过以下公式计算得出: ,在哪里K= 7,N = 13,当显著性水平为0.05时,相应的 .
|
|||||||||||||||||||||||||
与LLRD相关的CD图及其比较算法如图所示1..坐标水平轴上的数字表示不同评估标准下每个算法的平均秩值。通过实线连接的各种算法之间的性能没有显着差异。
(一种)
(b)
(C)
(d)
(e)
(f)
通过对以上实验结果的分析,我们可以得出以下结论:(1)在四个评价标准一个错误,报道,排名的损失,平均精度, LLRD明显优于RELIAB、RAKEL和CLR。(2)平均秩值越小,对应的性能越好。对于LLRD,在6个CD子图中的平均秩值中有5个是最优的,这表明LLRD优于其他算法。(3)对于常规数据集,LLRD在不同的评估标准下的69%的案例中排名第一,而对于大型数据集,它将排名第一为36.1%。
4。结论
在本文中,我们提出了一种新的多标签分类算法LLRD,该算法采用低秩分解来获取标签的内部信息,并通过新的特征空间进一步减少标签变换的信息损失。实验结果表明,该方法的性能优于目前许多先进的多标签分类技术。在未来,我们将探索替代模型,将低秩分解和分类结合成一个联合优化问题,以考虑更复杂的标签相关性。
数据可用性
我们手稿中使用的数据集均为公开数据集,可从http://mulan.sourceforge.net/datasets.html”和“http://meka.sourceforge.net/#datasetsru”。
的利益冲突
作者声明他们没有利益冲突。
致谢
中国国家自然科学基金(61806159和61806160,61972312)和中国博士后科学基金(2018M631192)提供了中国国家重点研发计划(2019YFC1521400)的支持支持。
参考文献
- L. Tang, S. Rajan, and V. K. Narayanan,“基于金属标签的大规模多标签分类”第19届国际万维网会议论文集,第211-220页,西班牙马德里,2009年7月。查看在:谷歌学术搜索
- B杨,J。T孙,T。王和Z。Chen,“有效的文本分类多标签主动学习”,年第十五届ACM SIGKDD知识发现与数据挖掘国际会议论文集,第917-926页,法国巴黎,2009年7月。查看在:谷歌学术搜索
- H. Kazawa, T. Izumitani, H. Taira,和E. Maeda,“多主题文本分类的最大边距标记”,刊于神经信息处理系统研究进展17LK索尔,Y。维斯和L。波图编辑,第649-656页,麻省理工学院出版社,美国马萨诸塞州剑桥,2005年。查看在:谷歌学术搜索
- A.McCallum,“EM训练的混合模型的多标签文本分类”,年AAAI文本分类学习研讨会工作记录1999年7月,美国佛罗里达州奥兰多市。查看在:谷歌学术搜索
- R. E. Schapire,Y.歌手和Boostexter,“基于促进的文本分类系统”,机器学习,第39卷,第2-3号,第135-168页,2000年。查看在:谷歌学术搜索
- 上田和齐藤,“多标签文本的参数混合模型”,发表于神经信息处理系统研究进展s贝克尔,S。Thrun和K。Obermayer编辑,第721-728页,麻省理工学院出版社,美国马萨诸塞州剑桥,2003年。查看在:谷歌学术搜索
- F康,R。金和R。Sukthankar,“相关标签传播与多标签学习的应用”,年IEEE计算机学会计算机视觉与模式识别会议论文集,第1719-1726页,纽约,美国纽约,2006年6月。查看在:谷歌学术搜索
- K特罗希迪斯,G。祖马卡斯,G。卡利里斯和我。Vlahavas,“音乐情感的多标签分类”,年第九届国际音乐信息检索会议论文集,页325-330,费城,宾夕法尼亚州,美国,2008。查看在:谷歌学术搜索
- C. Sanden和J.Z. Zhang,“通过集合技术加强多标签音乐类型分类,”第34届SIGIR会议记录, pp. 705-714,北京,中国,2011年7月。查看在:谷歌学术搜索
- RC洪,M。王,Y。Gao等人,“通过区分特征映射和选择的多实例学习进行图像标注,”Cyebericics上的IEEE交易,第44卷,第5期,第669-680页,2014年。查看在:出版商的网站|谷歌学术搜索
- “弱监督多标签聚类及其在计算机视觉中的应用”,《计算机科学》,Cyebericics上的IEEE交易第46卷,第46期12, pp. 3220-3232, 2016。查看在:出版商的网站|谷歌学术搜索
- Elisseeff和J. Weston,“多标记分类的核方法”,刊于神经信息处理系统研究进展TG迪特里奇,S。贝克和Z。Ghahramani编辑,第681-687页,麻省理工学院出版社,美国马萨诸塞州剑桥,2002年。查看在:谷歌学术搜索
- M. L. Zhang和Z. H. Zhou,“具有功能基因组学和文本分类的多书的神经网络,”IEEE关于知识和数据工程的交易,卷。18,不。10,pp。1338-1351,2006。查看在:出版商的网站|谷歌学术搜索
- G. Tsoumakas、I. Katakis和I. Vlahavas,《挖掘多标签数据》,数据挖掘和知识发现手册, 2010年施普林格。查看在:出版商的网站|谷歌学术搜索
- E. Gibaja和S. Ventura,《多标签学习教程》ACM计算调查,第47卷,第47期。3, pp. 1-38, 2015。查看在:出版商的网站|谷歌学术搜索
- >。张和Z.-H。周,“multi-label learning的懒惰学习方法”,模式识别,第40卷,第7期,第2038-2048页,2007年。查看在:出版商的网站|谷歌学术搜索
- M. R. Boutell, J. Luo, X. Shen, C. M. Brown,“学习多标签场景分类”,模式识别,第37卷,第2期9,页1757 - 1771,2004。查看在:出版商的网站|谷歌学术搜索
- >。Zhang和L. Wu,“Lift: multi-label learning with label specific feature,”,模式分析与机器智能学报,第37卷,第2期1, pp. 107-120, 2015。查看在:出版商的网站|谷歌学术搜索
- 郭玉华,“基于条件依赖网络的多标签分类”,载《中国科学院大学学报(自然科学版)》第22届国际人工智能联合会议论文集2011年7月,西班牙加泰罗尼亚。查看在:谷歌学术搜索
- 张克明,“基于标签依赖的多标签学习”,发表于第16届ACM SIGKDD国际知识发现和数据挖掘会议,页999-1008,华盛顿特区,美国,2010。查看在:谷歌学术搜索
- 傅波,徐国栋,王振华,曹立波,“基于监督标签依赖传播的多标签学习”第13届IEEE数据挖掘国际会议论文集,第1061-1066页,美国德克萨斯州达拉斯,2013年12月。查看在:谷歌学术搜索
- J. Read, B. Pfahringer, G. Holmes,和E. Frank,“多标签分类器链”,刊于在人工智能讲义5782,W,第254-269页,德国柏林斯普林格,2009年。查看在:谷歌学术搜索
- 黄建军,李国荣,王世华,黄秋明,“基于局部成对标签关联的社区决策分类”IEEE数据挖掘研讨会国际会议的诉讼程序,第913-920页,中国深圳,2014年12月。查看在:谷歌学术搜索
- 刘洪伟,马志军,张思成,吴旭东,“基于ℓ1-范数的偏最小二乘判据分析,”模式识别,第48卷,第5期,第1724-1733页,2015年。查看在:谷歌学术搜索
- 黄士杰、周志宏,“基于局部标签关联的多标签学习”,《计算机科学与技术》第26届AAAI人工智能会议论文集,页949-955,多伦多,加拿大,2012年7月。查看在:谷歌学术搜索
- 凌j.d Li,和H. Liu,“利用多标签信息进行噪声弹性特征选择”,美国计算机学会智能系统与技术汇刊,第9卷,第5期,第1-23页,2018年。查看在:谷歌学术搜索
- 叶c.k. Yeh, ww . c.c. Wu, ww . J. Ko, Y. c.c.f Wang,“基于深度潜在空间的多标签分类学习”第31届AAAI人工智能会议论文集,2838 - 2844页,旧金山,CA,美国,2017年2月。查看在:谷歌学术搜索
- K-H。黄和H-T。林,“多标签分类的成本敏感标签嵌入,”机器学习,第106卷,第9-10号,第1725-1746页,2017年。查看在:出版商的网站|谷歌学术搜索
- J. Wright, A. Y. Yang, A. Ganesh, S. S. satstry, Y. Ma,“基于稀疏表示的鲁棒人脸识别”,模式分析与机器智能学报第31卷第1期2,页210 - 227,2008。查看在:谷歌学术搜索
- E. Ghadimi, A. Teixeira, I. Shames, M. Johansson,“交替方向乘法器(ADMM)的最优参数选择:二次问题,”IEEE自动控制事务集,第60卷,第2期3, pp. 644-658, 2014。查看在:出版商的网站|谷歌学术搜索
- D. Tuia,J.Verrelst,L. Alonso,F. Perez-Cruz和G. Camps-Valls,“多开营支持向遥感生物物理参数估计的回归”,IEEE地球科学与遥感通讯,第8卷,第2期4, pp. 804-808, 2011。查看在:出版商的网站|谷歌学术搜索
- 张明林,“多标签学习算法研究进展”,IEEE关于知识和数据工程的交易第26卷第2期8,第1819-1837页,2013。查看在:谷歌学术搜索
- 张秋文,张明林,“基于特征的多标签学习的标签信息丰富”,《中国科学(d辑)》IEEE国际人工智能会议论文集,第4446-4453页,台湾台中,2018年1月。查看在:谷歌学术搜索
- G祖马卡斯,I。Katakis和我。Vlahavas,“用于多标签分类的随机k-标签集,”IEEE关于知识和数据工程的交易,卷。23,不。7,pp。1079-1089,2010。查看在:谷歌学术搜索
- 侯鹏,耿新,张明林,“多标签的流形学习”第30届AAAI人工智能大会的诉讼程序2016年2月,美国亚利桑那州凤凰城。查看在:谷歌学术搜索
- J.Fürnkranz,E.Hüllermeier,E. LozaMencía和K. Brinker,“多革方案分类通过校准标签排名”,机器学习,第73卷,第2期2,页133-153,2008。查看在:出版商的网站|谷歌学术搜索
- 张明林,耿新民,“基于隐性相对标签重要性的多标签学习”,《中国科学:信息科学》,第3期第15届IEEE数据挖掘国际会议论文集,第251-260页,大西洋城,新泽西州,美国,2015年11月。查看在:谷歌学术搜索
- JDemˇsar,“多数据集分类器的统计比较,”机器学习研究杂志,第7卷,第1-30页,2006年。查看在:谷歌学术搜索
- A. Benavoli, G. Corani和F. Mangili,“我们真的应该使用基于平均等级的事后测试吗?”机器学习研究杂志,第17卷,第1期,第152-161页,2016年。查看在:谷歌学术搜索
版权
版权所有©2020 Bo Yang等。这是分布下的开放式访问文章知识共享署名许可协议,允许在任何媒介中不受限制地使用、分发和复制,前提是原作被正确引用。