文摘
Multilabel分类是一个机器学习领域的重要研究课题。在这项研究中,作者提出了两个/两层链分类算法与最优序列基于注意机制。这个算法是一个分类模型,一个两层结构。通过引入一个注意力机制,本研究分析了关键属性达到分类的目的。解决问题的算法精度退化引起的分类器的顺序,我们采用OSS(最优序列选择)算法找到最优序列标签。根据实际数据集的测试结果表明,ATDCC-OS算法具有良好的性能在所有性能评价指标。这个算法的平均准确率超过80%。microaverage AUC的性能达到0.96。的覆盖性能,其覆盖性能低于10%。单一的综合结果误差性能是最好的。 The loss performance is about 0.03. The purpose of the ATDCC-OS algorithm proposed in the study is to help improve the accuracy of multilabel classification so as to obtain more effective data information.
1。介绍
Multilabel分类、大数据分析的常用方法,旨在将多个标签样本在同一时间。无处不在的multilabel数据在真实的场景中使multilabel分类方法的一个热门研究课题。然而,在真实的应用程序中,标签的完整性通常是没有保证的。由于数据收集和差的高成本标签和其他原因,这些样本的标签信息中只有一部分是明显。在现实世界中有许多模棱两可的例子。一定概率的样本实例校准不同的属性。许多multilabel分类算法。通常情况下,是非常具有挑战性的扩展单标牌的理论分类multilabel分类。随着机器学习的发展,multilabel分类算法可以应用于成像,推荐系统、医疗诊断、信息检索、和许多其他领域(1- - - - - -8]。近年来,海洋的研究工作接受最高会议(例如,ACL, AAAI,科尔,知识发现(KDD),少量的酒,ICDM, CIKM, INTERSPEECH, ICML,和IJCAI)展出提出了multilabel分类技术和解决方案。multilabel分类理论是数据挖掘中的一个热门话题,吸引了广泛关注的机器学习社区。
有两个常用的方法来构造一个multilabel分类模型:算法适应和转换问题。算法适应方法是调整现有的算法(如演算法和决策树)来解决multilabel分类问题。算法的性能适应方法往往仍然贫困。问题变换方法将multilabel分类任务分为几个单标牌分类任务。然后,经典的单标牌分类理论是用来解决问题的,这让单标牌训练分类器结合在一起作为一个super-classifier通过线性组合。在这项研究中,我们调查multilabel分类理论算法基于转换的问题。
有很多存在的问题转换方法,比如BR方法(9)、CC理论(10],MBR模型[11[],DLMC-OS算法12]。然而,这些方法通常忽略标签之间的相关性,标签序列的随机性,和冗余的互动标签信息,从而降低分类的准确性。问题转换方法使用扩展属性挖掘标签之间的相关性,但对于不同的分类任务,功能属性的重要性通常是忽略了在这个过程中,降低分类器的敏感性。因此,我们试图引入一种注意力机制的方法。这样注意力机制方法(13)是一个仿生过程基于人类的大脑是如何工作的。广泛应用于机器学习等领域的语音识别、图像识别、自然语言处理等。注意机制通常计算的概率从一个输入映射到不同的输出。最大概率的结果将被选择作为输出,有一个伟大的影响考虑到多个属性之间的相关性和标签。然后,我们提出一个系统,即注意multilabel分类算法,基于双层链结构。
算法(两个/双层链分类最优序列的算法基于注意机制,ATDCC-OS),我们整合三个multilabel分类框架(包括BR、MBR和CC)和一个注意力机制与两层链结构。这种结构利用二进制协会分类框架。在一层,进行初始分类。在两层,连锁酒店忠诚度奖励分类器使用一个更新过程来完成最终的分类,与标签信息来自的输出层。特别是,我们把注意力机制层两个和使用的输出层的概率来计算最终的分类结果。因此,这可以找到重要的信息在不同的属性和可以提高最终的分类器精度不同的任务。然而,有一个随机链在ATDCC-OS秩序问题。我们利用的最优序列选择(OSS)算法来解决这个问题。OSS集成了几个变量和方法(包括层次遍历的算法,PageRank,克鲁斯卡算法,和互信息)来决定标签的优先级。优先等级是用来帮助ATDCC-OS分配分类器和构造链分类模型。
在这项研究中,主要贡献如下:(1)双层结构multilabel构造分类模型充分整合三种经典分类模型的优点。同时,注意机制介绍进一步分析关键属性对分类结果的影响,优化传统的分类。(2)OSS算法解决分类精度低的问题由于存在随机链链中的顺序分类模型。它应用于改善链接分类模型的第二层。这个分类模型不依赖于任何单独分类算法。基准数据集上实验验证该方法的有效性通过比较它与最先进的方法的预测性能。
本研究包括以下:部分2处理相关工作。部分3显示该ATDCC-OS方法。然后,我们介绍了实验中使用的数据集和执行一些模拟来验证该方法的实验结果和讨论部分4。我们结束我们的工作5。
2。相关工作
2.1。Multilabel分类方法
multilabel分类方法已经受到人们的关注和广泛应用在各个领域,包括文本分类、现场和视频分类、和生物信息学。multilabel分类包括两种常见方法:问题转换过程和算法的适应过程。前者multilabel问题转换成一个或多个单标牌问题[11),并使用基本分类算法,如朴素贝叶斯、支持向量机(14),再算法,等等来解决这些问题。后者转换现有的算法,这样他们就可以解决multiclassification问题,例如,ML-RBF方法(15,16],ML-kNN方法[17,18[],rank-SVM分类9),和相关分类算法(19,20.]。
BR(二进制相关性)9)是一种常见的方法问题的转换,将multilabel分类问题转化为几个二进制相关性问题,火车一个二进制分类模型对所有标签一个接一个。然而,BR是经常被忽视,因为它不能有效地使用标签之间的相关性。提出了基于BR MBR (11),构造成一个两层的模型。层在MBR作为输入层的两个作为样本属性考虑标签相关。然而,标签值冗余的问题是忽略了培训过程的层2。
CC作者提出的方法在10],链是利用建立的关系在所有标签。它将所有分类器转换为线性随机数据链,还说以前的分类器输出的数据样本属性集,并把它作为输入到下一个分类器。然而,有许多缺点随机链。首先,在CC的培训过程中,分类器的输出是输入一个新属性的原始属性到下一个分类器。所以,前者链中的分类器产生更大的影响比后者分类器分类。订单链影响分类器的分类结果。第二,CC认为相关的属性,但是两个链接分类器可以使用相邻的属性之间的相关性,不能使用和其他属性之间的相关性。最后,分类器链中的顺序是随机分配的,所以CC模型并不是独一无二的,这使得该模型具有很强的随机性和废墟的稳定算法(21,22]。
DLMC-OS两层分类模型,提出了解决分类问题(12]。在这个模型中,一级分类器的输出是转发到第二级分类器作为一个扩展的特性。每个分类器模型的第二层向后传递最新的分类结果通过链考虑标签之间的相关性。这种方法抑制分类器链随机性,但不能获得独特的分类器链中的顺序。
2.2。注意机制
注意机制的方法(23- - - - - -25)是源自人类的视觉的研究,模拟人类的视觉的角度利益当观察。当人类的眼睛扫描全球形象,信息的一部分,帮助判断图像中是动态跟踪,和无关的信息将被忽略。这个过程可以有效地降低或减少处理当眼睛识别图像的信息量更关注部分信息。现代注意机制采用机器翻译,它极大地提高了模型的性能(26]。2014年,谷歌大脑注意力机制[发表了一篇文章27]。本文指出,当浏览一个图像,但人不先看看图片像素更加注重图像的特定部分基于他们的需求。此外,作为人类,我们将关注需要关注的地方在未来基于以前的观测图像。作者设计了一个名为变压器的新架构。变压器,self-attention机制广泛用于执行文本表示(28),脱离传统的RNN / CNN。近年来,transformer-style模型取得了很多好的结果在不同的任务。随后,注意力机制变得更加普遍和广泛应用于分类任务,如情绪分类(29日],乐器识别[30.),视觉推荐系统(31日),multilabel文本分类(32),和多个蛋白质亚细胞定位预测33]。
3所示。ATDCC-OS
3.1。预赛
我们设置 和 分别作为输入域和输出域。有采用属性输入域和L-dimensional标签输出域。实例属于属性的一个子集。我们使用一组l向量 来表示,是输入和是输出。如果标签有关 ,然后 ,或 。一组 代表了multilabel训练分类模型, 是一个属性向量与d尺寸和 表示一组标签对应 。构建一个multilabel分类器,我们让 。 和 第一和第二层次的multilabel分类器,分别。 和 是第一和第二的输出层。
3.2。ATDCC框架
指算法DLMC-OS,我们构建双层链分类基于注意机制(ATDCC)。ATDCC将multilabel分类问题转化为一系列的二元分类问题,每一个独立的人。层,ATDCC上执行二进制转换标签和构造属性之间的一些分类和标签。培训后,可以获得每个二进制分类模型的分类器(12]。ATDCC完成二进制分类实例的层,然后使分类结果扩展属性转移到两层。在两层,ATDCC构造与链结构分类方法实现动态的更新过程反馈。它利用分类器链转移和改变标签。实现标签和优化分类结果之间的相互作用。ATDCC利用相关性在所有标签multilabel分类标签信息交互层和标签之间的信息传输层内。
3.2.1之上。ATDCC第一层
ATDCC第一层遵循一个二进制的概念关联分类模型。它与二元结构构造一个分类器对所有标签。这些二元分类器组合分类,如图1。
(一)
(b)
在第一步,假设有一个带注释的数据集的大小l。ATDCC第一层构造一个属性设置为所有标签通过以下方程:
在第二步,一些二进制算法B利用(如SMO)创建的二元分类器训练实例: 。
在第三步中,我们使用获得的二元分类器分类和预测看不见的实例 。
最后,每个分类器的预测结果(例如, ,如图1 (b))是看不见的实例的输出在第一层ATDCC,集成这些输出样本的属性设置,建立一个新的属性集 。让在ATDCC输入层两种。
3.2.2。ATDCC层上
注意机制通常是利用sequence-to-sequence学习范式。对不同multilabel分类任务,两层之间的属性映射权重ATDCC是不同的。注意机制方法可以捕获所有属性的权重值样本中根据需求。它可以提高最终的分类结果的精度。
ATDCC层上使用上面提到的注意机制来动态地计算扩展属性的权重。两层模型可以适应当前分类任务的要求通过调整权重值在ATDCC两层之间的传输属性。
第一步,根据原样品属性的维度定义权重矩阵的第一层W利用训练ATDCC,双曲正切函数层上捕获输入属性和标签之间的相关性我。训练模型可以表示为 在哪里W和b分别表示权重矩阵和模型的偏差。
在第二步,ATDCC层上使用一个softmax函数转换的输出方程(3)一个概率值,然后获得的重量值关注分数。
最后,扩展属性集是基于关注权重加权得到方程(4):
在我们的模型中参数进行优化,实施的反馈结果损失函数的最小化。叉损失方程(6)作为损失函数。下列方程计算累计损失源于实际和预测标签为每个实例:
3.2.3。ATDCC第二层
ATDCC第二层ATDCC模型的第二层(图2),它使用分类结构链和利用一个更新过程在第二次分类实例。每个二元模型扩展的属性设置的相关分类标签之前实例创建的链结构分类器。所有二元模型的属性设置是增强通过0/1的标签估计价值获得前层以及整个一个二进制相关性估计从两层。在第二层,每个标签完全应用之间的相关性。鉴于属性设置,每个分类器链中的学习和预测的二进制协会标签。
(一)
(b)
在第一步,ATDCC第二层创建扩展属性向量 为每一个类标签所示以下方程。 在哪里W代表了设置属性的权重值。
在第二步中,我们使用二进制的方法B(如SM)学习构建扩展属性向量(O)来创建二进制分类器, 。
在第三个步骤中,使用构造二元分类器分类和预测看不见的实例X。
在模型训练过程中,我们使用最新的预测标签值改变每个样本属性设置的标签值。例如,对于第三个分类器在一个链,下一个样本的属性变量 而不是 。
最后,ATDCC评估的分类预测结果 看不见的每个分类器作为最终分类的实例。
3.3。OSS方法
在MBR模型中,序列的分类器链是随机安排的。如果分类器的分类精度的核心这个链是非常低的,一个错误会沿着这个分类器链通过向后传播方式,降低分类器的精度。这进一步导致对整个链的分类的正确性和准确性较低。随着标签数量的增加,OSS分类器链的随机性也迅速增加。算法DLMC-OS可以减少分类器链的随机性,但最佳的标签识别序列不能确定由于根节点的非唯一性。最有效的方法是链的顺序排序。排名的顺序分类器需要根据属性和链的特征分类模型。出于这个原因,提出以下约束搜索最优链序列:(一)显示标签列表命令序列包含所有标签信息(B)标签序列满足最大的相关标签(C)在当前条件下标签列表顺序是最优的
在这些设计规则,模型中提出OSS于一体的互信息和网页排名Kruskal算法和层次遍历的方法找到最优的标签序列。链分类模型使用序列作为规则来分配每个分类器的顺序,和第二层优化ATDCC OSS算法。
3.3.1。Subalgorithm与开源软件
(1)互信息(MI)理论。在信息理论和概率理论,互信息(MI)是用来评估两个随机变量之间的相互依赖,所以我们可以获得一个随机变量的“信息数量”通过观察另一个随机变量。方程(9的MI)显示两个变量。在当前信息技术、概率理论和信息理论已经广泛使用。MI理论广泛利用于研究工作。在机器学习领域,可以利用MI选择功能(34,35]。搜索引擎经常使用MI在短语和上下文找到发现语义簇(36]。在统计力学中,心肌梗死通常是用来解决机械问题一起洛施密特的悖论37,38]。基于MI的应用程序中,我们评估标签之间的关系通过捕获MI在标签。然后,我们利用它作为边缘的重量完全连通图。(2)网页排名。PageRank (PR)是用来克服的页面排名问题的详细链接分析过程,提出了在文献[39]。该算法的核心思想包括页面的重要性有关的数量以及详细的质量另一个页面指向这个页面。该算法应用于谷歌的搜索引擎(40]。一个网页的重要性可以通过链接的数量量化的链接结构,而不是依靠特定的搜索请求。Twitter使用个性化的PageRank来显示用户的另一个账户41]。在这项研究中,我们使用网页级别和优先搜索构建定制的网页排名算法来决定一个非常重要的标签作为链的第一个节点。这可以克服链的非唯一性问题。(3)边缘体重依赖型剂量图算法。通常,不同实体之间的联系可以制定与边(图42]。成本优势可能代表的重量,长度,或能力,根据当前要解决的问题(43- - - - - -46]。在模型中,我们利用这个加权图方法来创建图完全连接标签相关算法1的关系。(4)详细的克鲁斯卡算法思想。在这项研究中,参考克鲁斯卡算法是利用寻求与最小生成树(47]。我们使用克鲁斯卡方法寻求最大的标签生成树。这可以提供一个基础来创建一个序列标签的协会是最大的。设计算法算法2所示。(5)基于广度优先搜索方法。在这项研究中,基于广度优先搜索(BFS)是一种算法用于寻找可用的路径图的遍历或搜索树或图的数据结构。然后,我们使用PageRank找到起点和使用BFS导线与最大生成树标签构建生成的标签订单,如算法3所示。
|
|
|
3.3.2。开源软件的详细设计框架
OSS算法的详细设计步骤在这个研究图所示3。
步骤1。计算之间的相关性的MI标签。假设有N标签 ,我们使用公式(9在任何两个标签)来计算MIy我和yj,MI必须负的。
定义1。MI计算的公式
步骤2。构建一个完全连通图G通过标签,标签是图的顶点,和MI卷标签作为边的权重。利用克鲁斯卡尔算法构建标签树的最大重量。然后,反转互信息值获取最大重量生成树。
步骤3。使用PageRank算法,每个标签数据集的“投票”,决定标签节点的PR值是最高的。这个节点作为根节点,属于树的最大重量。这也是选择作为第一个节点层次遍历的算法。这可以克服的问题不是唯一的头链中的标签。
步骤4。使用克鲁斯卡算法生成一个最小重量标签树(MWT)用于完全连通图G。整个标签和标签树包括整个边缘。这些边缘连接节点的标签。最大的加权和。
第5步。与标签节点遍历MWT BFS和获得的PageRank获得标签序列。使用这个序列作为指南构建的顺序链中的每一个分类器来克服不确定性问题的分类,如算法4所示。
|
3.4。ATDCC-OS框架
ATDCC-OS设计框架是绘制在图4。图4表明ATDCC第一层和ATDCC第二层是第一和第二层次。我们使用OSS的方法来优化ATDCC-OS链式结构框架。然后,我们可以寻求一个最优序列标签。根据最好的和最优序列,我们训练每个分类器在我们的模型中。我们利用这种关注机制层间层和两层发现一个重要的属性和特点从当前的任务。在这种情况下,我们可以建立一个更好的分类器在两层,如算法5和6所示。
|
|
4所示。实验
我们执行一些模拟和验证方法,使用实验结果来分析该算法的性能。在仿真中,我们分析的算法与其他算法(ATDCC-OS)提出了研究multilabel分类(包括DLMC-OS BR和CC MBR)通过五个指标。然后我们把七multilabel基准数据集。
4.1。测试数据集
我们利用标准数据集提供木兰(48]平台multilabel基准。表1描述每个数据集和相关统计数据的模拟。N,F,l代表实例的数据、属性数据包含在每个实例中,和标签的数字数据集,分别。符号标签基数(LCard)代表正常测量所示(49]。LCard表示平均标签数量与实例相关联。
4.2。评价方法
评价指标是衡量领导的指示算法的性能。为了更好的评估方法,我们使用精度,覆盖率,单错误,排名损失率,microaverage AUC分析ATDCC-OS的性能。(1)平均平均精度:精度(12)是一个精确的度量,将回忆与精度对搜索结果进行排序。评论一个标签的平均评分等级高于一个特定的标签。值的平均精度越大,分类器将会越好。的平均精度可以表示为 在哪里是一种函数。(2)报道[12]:报道表明,算法能够覆盖所有可能的标签。这个指标描述或有多深,我们走多远平均在标签列表中包含可能的标签相关文档。在完美的回忆层面,覆盖松散相关精度。报道的价值越小,算法就会越好。报道可以计算 在符号表示一种和排名相关函数分类器 。(3)一个错误指标(50:一个错误指标是用来表示例子的比例顶部标签不属于所选标签集。这个指标越大,算法就会越糟糕。可以表示为一个错误度量 在哪里代表一个函数与一个分类器与多个标签。(4)排名损失指标(12]:排名损失度量这些情况有关的分类标签样本不按顺序排序,也就是说,在连续剧的标签,分类标签(不相关的研究实例)分为前面的相关标签。这个指标是大,算法的性能越好。排名损失度量可以表示为 (5)Microaveraged AUC [50]:这个指标显示了ROC曲线图表所覆盖的区域。它的值从0.1到1。这个指标是直接利用评估分类器的性能。这个指标越小,这个算法会越糟糕。microaveraged AUC度量
,在哪里是一个实值函数(51),可以得到以下方程: 他们表示标签对“集相关或无关的。
4.3。实验设置
我们使用数据集提供的木兰平台评估所有算法。木兰(48)是一个开源的数据集用于分类与多个标签,基于Weka。在这项研究中,我们使用SMO算法作为分类的基础。利用四种不同的分类器进行比较,包括DLMC-OS算法,MBR算法,CC算法和BR算法。我们选择80%的实例从每个数据集作为训练数据集,当我们选择其余作为测试数据集。我们采用亚当(52在培训过程中优化器。我们列表的默认参数亚当的hyperparameters如下:让α是0.001,beta1设为0.9,让beta2 0.999,ε设置为10−8。我们的仿真平台包括英特尔(R)至强(R) e5 - 2630 CPU, 128 GB的RAM,以及操作系统Centos 7.6。我们的算法设计和实现Java运行环境(JDK 1.8)。
4.4。结果与讨论
数据5- - - - - -10显示ATDCC-OS之间的性能比较、DLMC MBR, CC,和BR算法,使用精度,覆盖率度量,单一错误指标,排名损失指标,microaverage AUC度量。我们使用公制的排名(大道排名)参数审查不同的分类算法的结果53]。在这些数据中,每一种颜色代表一个算法和算法的名字被列在图的左上角。每个酒吧的数量上面的性能排名算法的数据集。在数据5- - - - - -9,纵y设在表示评价结果,横坐标x设在代表数据集的名称。在图10,x设在表示算法的名称y设在显示所有数据集的平均排名算法。
图5在每个数据集显示了每个算法的准确性。ATDCC-OS方法提出了研究数据集的最佳性能。与其他方法相比,除了精度最低酵母数据集,其他数据集的精度是最高的。其中,数据准确性的旗帜,情感,和医疗数据集是超过80%。
在图6,我们可以看到microaverage AUC的比较算法的性能。ATDCC-OS算法也是最优秀的和稳定的microaverage AUC的性能。这个算法的性能是最好的,除了在鸟类数据集,和性能在医学数据集是0.96。
图7显示了每个算法的覆盖性能的比较。覆盖率越低,算法的性能越好。的覆盖性能ATDCC-OS算法研究中是最优的在所有的数据集,及其在国旗覆盖性能小于10%,情感,鸟类,医疗数据集,和酵母的数据集。
每个算法的单一误差性能图所示8。ATDCC-OS提出算法的性能与其他算法相比,这个图是相对不稳定。然而,从综合的角度来看,该算法的性能还不错,和性能的旗帜,鸟类,安然,和助理型数据集是最好的。在情感的数据集,该算法的性能是仅次于MBR算法。
从数据5- - - - - -9,我们可以看到ATDCC-OS显示最优分类性能,同时算法DLMC-OS提供了更好的性能。然而,其他方法显示性能下降。评估指标,平均精度指标和microaveraged AUC直接显示分类器的性能指标。值越大,算法的性能越好。数据显示5和6,我们可以看到,在这项研究中提出的算法ATDCC-OS DLMC-OS演示方法更好的性能与其它算法相比。这是因为他们利用一个两层的结构分类和标签信息交互创建详细的分类器。这种设计结构考虑标签之间的相互关系。同时,该算法ATDCC-OS还利用经典的注意机制理论来提高分类器的敏感性和适应各种不同的任务。三项指标,即覆盖,排名下降,和一个错误度量经常利用决定并找到无关的标签分类结果。如数据所示7- - - - - -9,我们发现该算法ATDCC-OS和前面的算法DLMC-OS也展示更好的性能与其他算法相比,而BR方法提出了一种介质的性能。MBR方法和CC度量方法是最糟糕的。这是因为算法ATDCC-OS和前面的方法DLMC-OS利用优化算法来训练分类器。序列的随机性CC法和MBR方法直接导致性能降低。相反,BR方法不考虑标签的顺序,同时显示了更好的性能。
每个算法的性能损失图所示9。其中,ATDCC-OS算法是最优秀的性能损失。在所有的数据集,该算法是一个级别的性能优于其他算法。在医学数据集,性能损失约为0.03。
从图10,我们可以看到比较算法的综合性能排名在各指标。在所有的索引,ATDCC-OS算法具有最好的性能。DLMC-OS算法的综合性能仅次于ATDCC-OS算法,以及随后在不同算法性能是不同的。
图10显示了平均排名五个分类器的性能指标平均精度,覆盖率度量,单一错误指标,排名损失指标,microaverage AUC度量。
从我们的模拟,我们可以发现我们的算法ATDCC-OS优于其他算法的数据集,当它在酵母和鸟类表现很差。我们都知道,这个算法不能获得最佳的性能在所有类型的不同的测试数据集(10]。算法性能之间的关系不仅对算法的详细结构,还对数据集的详细的类型和大小,以及标签的资产在我们的测试数据集。
数据11和12的情节训练数据的百分比和平均精度和排名的损失。这两个数据说明训练数据的百分比变化如何影响性能的增强。在这个实验中,我们把情感数据集比较作为一个例子。
图11显示了平均精度的变化曲线在两对分类器对训练数据的百分比。从图11,我们观察到的平均精度高四分类器训练数据的百分比增加。当训练数据的百分比在10%和30%之间,所有算法的准确性上下浮动。当训练数据的比例超过30%,平均精度ATDCC-OS和DLMC-OS稳步上升,而MBR需要达到40%,和CC和BR需要达到60%。总的来说,随着训练数据的增加,比DLMC-OS ATDCC-OS显示出更好的性能,其次是MBR和BR, CC是最坏的打算。
从图12,我们可以看到的结果比较排名方面的损失。在这个图中,随着训练数据的比例增加,排名ATDCC-OS损失和DLMC-OS稳步减少,MBR相比,CC和BR。当训练数据在10%和40%之间,每个算法的损失排名不稳定,其中MBR波动最多,其次是CC和BR, ATDCC-OS和DLMC-OS表现的更好。当数据集大于40%时,所有算法的排序损失曲线表现出下降的趋势。ATDCC-OS仍然在这种情况下提出了最低的损失。
5。结论
在这项研究中,我们提出一个简单而有效的multilabel分类模型(ATDCC-OS) multilabel分类集成框架的三个经典problem-conversion类型。它完全探索各种优势的方法来解决这些问题不考虑标签在执行分类之间的相关性。为了进一步提高分类的性能,该算法解决问题的第二层nonreal-time标签信息交互链接分类模型通过引入“更新替换。”与此同时,该算法动态地计算所有特征属性的权重值通过一个注意力机制为了更重要的属性特征添加到当前分类目标为每个分类器。它有助于增加分类器的分类感性,从而大大提高了分类的准确性。利用五个不同的指标来描述不同的算法在七个不同的数据集。实验结果表明,该方法获得高预测性能较先进的multilabel分类方法在大多数情况下。的平均精度,平均精度ATDCC-OS算法基本上是最高的在所有的数据集,在国旗和准确性,情感,和医疗数据集是超过80%。microaverage AUC的性能,ATDCC-OS算法的性能在所有的数据集是最好的,除了在鸟的数据集,和性能在医学数据集是0.96。的覆盖性能,ATDCC-OS算法具有最好的覆盖性能在所有的数据集,以及它在一些数据集覆盖性能小于10%。 In single error performance, this algorithm has the best comprehensive performance. In the loss performance, the algorithm has a loss performance of about 0.03 in the medical dataset. Based on the above results, it is concluded that the performance of the proposed ATDCC-OS algorithm is the best. This is only the preliminary result of this study. In the future, we will further optimize the algorithm to solve the problem of time complexity caused by the model structure, and we will also try to apply the algorithm to solve classification problems in everyday work and life. Finally, we hope that the research work in this study can provide some reference and assistance to researchers or scholars in the field of multilabel classification of problem transformation types.
数据可用性
使用的数据和/或分析在当前研究可从相应的作者。
的利益冲突
作者宣称没有利益冲突。
确认
本研究的主要研究项目支持的中国四川省教育部门(18 za319)。