TY -的A2 -钱,Jiangbo盟——胡Zhihui AU -魏,Xiaoran AU -汉,小徐AU -口,广盟——张晧瑜盟——刘Xueyi AU -白,Yefei PY - 2022 DA - 2022/01/06 TI -密度峰集群基于功能降低和Quasi-Monte卡洛SP - 8046620六世- 2022 AB -密度山峰聚类(DPC)是一个著名的density-based聚类算法,可以处理nonspherical集群。然而,DPC的高计算复杂度和空间复杂度计算当地的密度 ρ 和距离 δ ,这使得它只适合小规模数据集。此外,对于集群高维数据,DPC的性能还需要改进。高维数据不仅使数据分布更为复杂,也导致更多的计算开销。为了解决上述问题,我们提出一种改进的密度山峰聚类算法,减少和数据采样策略相结合的特性。具体来说,高维数据的特征自动提取的主成分分析(PCA), auto-encoder (AE)和t-distributed随机邻居嵌入(t-SNE)。接下来,为了减少计算开销,我们提出一种新颖的数据采样方法的低维特征数据。首先,在低维特征空间数据分布估计的Quasi-Monte low-discrepancy特色卡洛(QMC)序列。然后,代表QMC点选择根据他们的细胞密度。接下来,选择QMC点是用来计算 ρ δ 而不是原始数据点。一般来说,所选QMC点的数量远小于初始数据集。最后,一个两级分类策略提出了基于QMC点聚类结果对原始数据集进行分类。与目前的工作相比,我们的算法可以减少计算复杂度 O n 2 O N n ,在那里 N 表示选择QMC分和的数量 n 是原始数据集的大小,通常 N n 。实验结果表明,该算法可以有效地减少计算开销,提高模型的性能。SN - 1058 - 9244 UR - https://doi.org/10.1155/2022/8046620 - 10.1155 / 2022/8046620摩根富林明科学编程PB - Hindawi KW - ER