TY - Jour A2 - García-Magariño,IvánAu - Zhou,Shuyue Au - Li,Xiaobo Au - Dong,Yihong Au - Xu,Hao Py - 2020 DA - 2020/08/01 TI - 多栏标签的解耦和双向重采样方法具有标签并发的不平衡数据分类SP - 8829432 VL - 2020 AB - 标签不平衡是多标签数据的特征之一,并且不平衡数据严重影响了分类器的性能。在Multilabel分类中,重采样方法主要用于处理不平衡的问题。现有的重采样方法通过欠采样或过采样进行平衡,这导致过度拟合和信息丢失。重采样对少数民族标签产生重大影响。此外,许多情况下多数标签和少数民族标签的高并发性也会影响分类的性能。在这项研究中,我们提出了一种双向重采样方法来解除多议标签数据集。一方面,通过设置去耦的终端条件,可以减少标签的并发性,另一方面,通过组合过采样和欠采样来缓解实例信息和过度装备的丢失。通过测量实例的少数群体标签,选择对少数群体标签影响的实例进行重新取样。重采样次数限制为保持在重新采样阶段期间数据的原始分布。 The experiments on seven benchmark multilabel datasets have proved the effectiveness of the algorithm, especially on datasets with high concurrency of majority labels and minority labels. SN - 1058-9244 UR - https://doi.org/10.1155/2020/8829432 DO - 10.1155/2020/8829432 JF - Scientific Programming PB - Hindawi KW - ER -