计算智能与神经科学

PDF
计算智能与神经科学/2020/条款

研究文章|开放存取

体积 2020 |文章的ID 1386839 | 12 | https://doi.org/10.1155/2020/1386839

基于FCM和增强对数粒子群算法(ELPSO)的混合模糊聚类方法

学术编辑器:入Lo黄宗泽
收到 2019年11月10
修改后的 2020年2月5日
公认 2020年2月14日
发表 2020年3月18日

摘要

模糊c均值(FCM)是最知名的聚类方法来组织各种各样自动数据集和获取准确的分类之一,但它有陷入局部最小值的倾向。为了克服这些缺点,一些方法,对于聚类杂交PSO和FCM已经在文献中提出,并且其证明这些混合方法比传统的分区聚类的改进的精度接近,而基于PSO-聚类方法有差的执行时间比较划分的聚类技术,而目前的PSO算法需要调整一系列参数,他们都能够找到好的解决办法之前。因此,本文介绍了模糊聚类的混合方法,命名为FCM-ELPSO,其目的是解决这些缺点。它结合FCM与PSO的改进版本,称为ELPSO,它采用了新的增强的对数惯性权重策略,为勘探和开发之间更好的平衡。这种新的混合方法的用途PBM(F)索引和目标函数值作为聚类有效性索引来评估聚类效果。为了验证算法的有效性,两种类型的实验进行,包括PSO聚类混合聚类。实验表明,该方法显著提高收敛速度和集聚效应。

一。介绍

为了获得大量的数据快速,准确有效的信息,很多方法被提出。作为无监督学习方法,聚类分析是在处理这些数据,其目的是未标记数据集划分成多个集群,使得在相同的簇的元素显示相似性的高水平的重要手段之一,而从不同的元件集群显示相异的较高水平。聚类技术已经在各种应用领域,如数据挖掘,机器学习,模式识别,和图像分割[的广泛研究1-3]。

聚类算法可以进一步分为两大类:硬聚类和模糊聚类[4]。硬聚类方法的每个对象分配给一个组,而模糊聚类方法引入的对象和数据集的不同集群之间隶属度,并且同时根据该隶属函数矩阵分配一个数据集到多个集群中的每个元素。因此,后者可处理重叠分区。

最流行的模糊聚类算法是将其提出Bezdek等模糊c均值(FCM)。[],并已广泛应用于多个范畴[67]。FCM的目标是最小化的标准功能,并逐渐获得更精确的隶属度矩阵。但中心点随机选择,使迭代过程陷入鞍点或局部最优解容易。此外,如果数据集包含严重噪声点,或者如果数据集是高维的,例如生物信息学[8,交替优化往往不能找到全局最优。

然而,这些缺点促使人们提出了模糊聚类的替代方法,其中许多是FCM的扩展。一种基于核的FCM (KFCM)由张和陈提出[9],它与度量,以实现非线性可分离数据集更好映射内核取代欧几里德距离度量。林[10]提出了一种新的进化核直觉FCM聚类算法(EKIFCM),该算法将直觉模糊集(IFSs)与KFCM相结合,利用遗传算法(GA)同时优化EKIFCM的参数。尽管这些FCM版本的目的是在模糊聚类中获得良好的性能,但它们并没有改善FCM的随机初始化过程,仍然容易陷入局部最优[11]。

找到全局最优的概率可以通过随机方法如进化或元启发式优化算法来增加。作为最著名的启发式方法之一,PSO已经成为最流行的启发式算法和用于许多应用,因为它的多功能性和简单性的重要工具之一,并发现它可以提供更好的初始质心为FCM算法,提高了FCM的结果,因而这促使的硬聚集许多基于PSO-方法的建议[12]和一些基于PSO-方法模糊聚类[111314]。库拉[15]针对聚类问题提出了一种新的粒子群优化方法,利用纯粒子群优化技术同时解决已知和未知簇数的聚类问题,为聚类提供了一种新的思路。

Izakian和亚伯拉罕[16提出了一种混合模糊聚类方法基于FCM和模糊PSO(FPSO),和他们的实验显示出比FPSO和FCM更好的结果。具有完全连接的拓扑结构中的量子粒子群优化(QPSO)耦合与FCM,形成混合方法的一个新版本被称为QPSO-FCM [17]。然而,这些基于PSO的方法是慢得多相比,这可能会限制它们的实际应用传统方法。

与基于PSO-聚类方法的另一个问题,根据阿拉姆[12],是需要调整一系列参数,他们都能够找到一个更好的解决方案之前。为了克服这些缺点,基于模糊c均值和改进粒子群优化(FCM-IDPSO),用于模糊聚类混合方法由Silva的Filho等人提出。[18],谁介绍的IDPSO训练过程中动态调整参数和处理的基于PSO的聚类方法的两个主要问题。许多改进PSO-FCM聚类方法已成功地应用到实际应用[19-22]。值得一提的是,基于PSO-方法的结构复杂,计算量庞大使算法有进一步改进的余地。

近年来,人们提出了许多优秀的混合优化聚类分析方法,如CRO-FCM等,这些方法都没有使用PSO作为优化算法[23]它采用基于化学元启发式获得最佳聚类中心为FCM;ETLBO-FCM [24]引导学生结合教学学习型优化和FCM克服FCM的主要限制;拉胡等人。[25]将bat优化引入FCM,利用maxi-min分类器确定聚类数,提高了聚类精度。这些研究极大地促进了聚类算法的发展。

本文的主要贡献之一是提出了一种新的基于增强对数递减策略的粒子群算法(ELPSO)。基于该策略,ELPSO算法在不同时期自适应地选取不同的惯性权重值,从而更好地平衡勘探与开发之间的关系,避免快速陷入局部极小值,从而获得更好的解。本文的另一个贡献是利用FCM和ELPSO混合算法的优点,提出了一种新的模糊聚类方法FCM-ELPSO。该混合方法将ELPSO引入到训练过程中,利用ELPSO的全局搜索为FCM寻找合适的初始聚类原型,利用局部搜索避免陷入局部最优,并利用FCM的快速收敛性提高结果和收敛时间。分别基于UCI数据集对两种聚类方法进行了测试,并与其他基于PSO的聚类方法进行了比较。

本文的结构如下。部分2概述所有必要的先决条件。节3,PSO的新版本为聚类,命名ELPSO和混合方法(ELPSO-FCM)提出。部分4包括基于UCI数据集的实验结果。节,包括主要结论。

2.理论基础

在本节中,我们简要地描述FCM,原始PSO(或标准PSO,SPSO)的一些基本概念和PSO的不同惯性重量策略一些改进形式,以及设置在该混合方法用于评价集群效应一个簇索引。

2.1。FCM

我们定义 的聚类数据集 通过对象索引 ;每个对象 通过定量变量的矢量表示。我们定义 作为 集群通过上市一世 为模糊划分矩阵,其中 指示的成员Ĵ对象的 原型。 在哪里Q是数据维数。上约束 如下面所述:

FCM算法的目标是找到最优的原型矩阵和相应的隶属度矩阵,使由下列方程给出的目标函数最小: 在哪里 为模糊加权指数和 是欧几里德距离,其指示从数据载体中的相异度 聚类中心

参数 由以下方程式得出:

要最小化标准 聚类原型 会员学位 根据公式(6)和(7),分别。

计算所有对象的成员后,集群的新原型进行计算。当原型稳定进程停止。也就是说,从先前迭代的原型是紧邻在当前迭代中产生的那些,大于误差阈值,通常更小。

2.2。原始粒子群优化

PSO最初是根据鸟群和鱼群的社会和认知行为引入的。潜在的解决方案被称为粒子,它们通过跟随当前最好的粒子在问题空间中飞行。每个粒子都在问题空间中跟踪其坐标,这些坐标与迄今为止所获得的最佳解决方案相关。解决方案通过适应度值进行评估,适应度值也被存储。这个值被称为 粒子群算法跟踪的另一个最优值是粒子群中任何粒子迄今为止获得的最优值。最好的价值是一个全球最好的和被称为 为更好的职位搜索器遵循如下规则为方程(8)和(9): 在哪里 是粒子的位置和速度矢量吗 分别; 为惯性权重; 是正常数,称为加速度系数,控制的影响 在搜查过程中;以及 是[0,1]范围内的随机值。每个粒子位置的适应度值由适应度函数确定,粒子so通常通过重复应用(8)和(9),直到指定迭代数量已经超过或速度更新了多次迭代接近于零。

2.3条。不同惯性权重策略的PSO算法改进

利用统计理论分析粒子群算法的基本参数的方差,包括惯性权重和加速常数,可以认为惯性权重对粒子群算法的整体性能有巨大的影响[26]。许多研究表明,较大的惯性权值有更好的全局搜索能力,而较小的惯性权重值必须在当地开发的优势[27]。因此,惯性权重的不同适应性战略提出了实现的勘探能力和发展能力之间取得更好的平衡,并获得更稳定和满意的结果,如线性,非线性,模糊规则,随机,和基于策略的惯性权重等。

在这一节中,我们将着重回顾三种惯性权重策略,它们在各种应用领域中得到了广泛的应用,并介绍了相应算法的实现过程[28-三十]。本文提出的方法,将与在第上述算法进行比较4

2.3.1。线性惯性权重策略

的单调递减惯性权重调整策略由埃伯哈特[引入PSO28],旨在加强PSO的微调能力。但线性惯性权重策略无法实现本地搜索和全局搜索之间的精密天平,由于PSO搜索过程的非线性和复杂性。因此,它并不总是比一个适当的固定惯性权重进行更好时,惯性权重逐渐减小作为迭代收益。

2.3.2条。自然指数惯性权重策略

受到线性减小惯性权重策略的启发,Chen等人。[29]提出的自然指数函数的两个惯性权重的策略。根据他们的实验设置,这些自然指数策略在PSO搜索过程的早期阶段与线性调整策略相比,收敛速度快。

2.3.3。随机惯性权重策略

在动态环境中,很难预测在给定的时间内勘探或开采是否会更好。因此,在PSO的惯性权重策略中引入随机性来解决[三十]. 利用粒子群对动态系统进行跟踪和优化,提出了一种计算惯性权值的新方法。

2.4。簇索引PBM(F)

Pakhira等人[31提出了一种称为PBM的有效性指标。该指标同时适用于模糊聚类和模糊聚类;然而,这里我们只回顾了称为PBM(F)索引的索引的模糊版本。索引的定义为 在哪里 ; ;C是簇的数目;和 是数据集的中心吗小号

不同于 并认为是 在哪里ñ为数据集中的模式总数, 是数据的分区矩阵,并且 是的重心一世集群;这里是模糊参数 被设置为1.5。

因素, 包含将完整数据集视为单个集群的加权胞内距离和C集群系统。这个系数是对C集群系统。的因素 为最大集群间在分离C集群系统。这个因素表示两个簇之间的分离。PBM(F)指数值越高,表明聚类效果越好,因为聚类是分离良好且相对紧凑的。

3.提出了算法

在本节中,我们将介绍与细节增强对数递减策略,名为ELPSO新版本PSO,并给出聚类应用算法过程;接下来,基于ELPSO和FCM,混合算法形成用于组合这两种算法,称为FCM-ELPSO的优点。

3.1。增强Logarithmical PSO(ELPSO)

为了调整粒子群算法的性能,平衡粒子群算法在飞行过程中的全局搜索和局部搜索能力,在粒子群算法中引入了一种简单有效的惯性权值调整策略,开发了一种新的粒子群算法,称为增强对数递减粒子群算法(ELPSO)。新的战略职能如下: 在哪里Ť当前的迭代和ž是PSO的微调能力,其值可以通过经验设置为1.05调节因子。方程(13)和(14)示出颗粒的新速度公式和位置式在时刻Ť使用新的惯性权重:

每个元素的大小在方程中是一致的(13)和(14),参数除外 为了增加粒子群搜索的随机性,我们设置了随机值[R作为基质。每个粒子的随机矩阵将在每次迭代期间被初始化,并在矩阵中的每个元件的范围为[0,1]。

在这里,我们给它采用纯ELPSO技术聚类方法。

让粒子的位置,由 为原型矩阵,其大小为 在哪里C是正确的簇号和Q是数据集的维度 其中 是人口规模。通过这种方式, 可以被表示为如下:

因此,一个群表示数据向量的若干候选簇中心。每个数据向量根据其隶属度函数属于一个聚类,因此给每个数据向量分配一个模糊隶属度。每个集群在每次迭代中都有一个集群中心,并给出了一个集群中心向量的解决方案。这种方法确定了位置向量 对于每个粒子,更新它,然后更改簇中心的位置。广义解的适应度函数为 在哪里 是FCM的目标函数,如等式(4),计算粒子。较小 聚类效果越好适应度函数越高

符号:
P: ELPSO的人口;ω_initial:ELPSO的初始惯性重量; 粒子的惯性重量; 加速度系数; 粒子的位置; 粒子的速度矢量; 的最佳位置的是粒子在时刻取得Ť; 蜂群在瞬间获得的最佳位置Ť; 颗粒的隶属度矩阵; 粒子的适应度值;Ť:迭代的最大数目;
输入:数据集小号和集群的数量C;
产量:最佳位置
处理
(1) 创建一个群P粒子;
(2) 初始化参数ELPSO包括人口规模P;ω_initial每个粒子(= 1,2,3…,P); ;
(3) 初始化 每个粒子(= 1,2,3…,P)以及 为了蜂群;
(4) 重复{
(5) 计算隶属度矩阵 每个粒子;
(6)  计算标准 每个粒子;
(7) 计算 每个粒子;
(8) 计算 在蜂群中;
(9)  Update the velocity 每个使用粒子公式(13);
(10)  更新位置 每个使用粒子公式(14);
(11)  For each particle (= 1,2,3…,P)更新 使用方程(12);
(12) 商店 作为 ;
(13) Ť = Ť+ 1;
   }
直到ELPSO终止条件被满足()。
返回 矩阵。
(*)PSO的该方法中的终止条件是ŤŤ(达到迭代的最大数目),或速度的更新是在多个迭代接近于零。

假代码如下所示。

3.2。基于模糊c均值和改进粒子群算法的混合聚类方法

虽然FCM需要更少的功能评价,它通常陷入局部最优。在本节中,FCM算法与ELPSO算法集成以形成称为FCM-ELPSO混合聚类算法,其保持的两个FCM和ELPSO算法的优点。这种混合方法引入ELPSO培训过程,并使用ELPSO的全球探索找到一个合适的初始聚类原型FCM和地方探索避免陷入局部最优,利用FCM的快速收敛改善的效果和收敛时间。

符号:
P: ELPSO的人口;ω_initial:ELPSO的初始惯性重量; 粒子的惯性重量; 加速度系数; 粒子的位置; 粒子的速度矢量; 的最佳位置的是粒子在时刻取得Ť; 蜂群在瞬间获得的最佳位置Ť; 颗粒的隶属度矩阵; 粒子的适应度值;T_PSO:在PSO部分迭代的最大数目;T_FCM:在FCM部分迭代的最大数目;:簇状模糊程度;
输入:数据集小号和集群的数量C;
产量:最佳位置
过程:
(1) 创建一个群P粒子;
(2) 初始化参数ELPSO包括人口规模P;ω_initial每个粒子(= 1,2,3…,P); ;
(3) 初始化 每个粒子(= 1,2,3…,P)以及 为了蜂群;
(4) {做
ELPSO:
  Repeat{
(5) 计算隶属度矩阵 每个粒子;
(6)  计算标准 每个粒子;
(7) 计算 每个粒子;
(8) 计算 在蜂群中;
(9)  Update the velocity 每个使用粒子公式(13);
(10)  更新位置 每个使用粒子公式(14);
(11)  For each particle (= 1,2,3…,P)更新 使用方程(12);
(12) 商店 作为 ;
(13) Ť = Ť+ 1;
   }
直到ELPSO终止条件被满足()。
 FCM:
重复{
(14) 使用公式(7);
(15)  Calculate cluster prototypes using equation (6);
(16) 计算 每个粒子;
(17) 计算 在蜂群中;
(18) 商店 作为 ;
}
直到ELPSO满足终止条件(**)
虽然不满足终止条件
返回 矩阵。
(*)当它达到95次迭代时(T_PSO)或有小于或等于0.00001的偏差J。
(**)当达到5次迭代时(T_FCM)或有小于或等于0.00001的偏差J。
(***)当迭代总数达到500时(ELPSO + FCM),或者当没有对 在fdm - pso (FPSO之后是FCM)的连续两轮运行中。

假代码如下所示。

四。实验和结果

此部分被分成两个部分:ELPSO聚类混合聚类,可以使用算法1和算法2分别得到相应的结果。所有实验均基于Matlab 2016b平台,在运行Microsoft Windows 10的Intel core i7-8750H 2.20 GHz计算机上执行。

为了评价所提出的算法的性能,九公知的UCI机器学习知识库数据集已经选择:鲍鱼,大肠杆菌,玻璃,图像分割,页块分类,Spectf,钢板故障,超声波流量计的诊断,和酵母。这些数据集包括低的例子中,介质,和与各种分区高维数据。数据集的详细描述示于表1


数据集集合 对象 变量

鲍鱼 4177 3 8
Ecoli 336 7 8
玻璃 214 9 6
图像分割 2310 19 7
页面块分类 5473 10
Spectf 267 44 2
钢板断裂 1941年 27 7
超声波流量计诊断 361 43 4
酵母 2000 8 10

4.1条。ELPSO聚类

该ELPSO,原来PSO和三个改进版本,在部分显示不同的惯性权重策略2.3款将在这里测试这些启发式算法的性能。基于鲍鱼、Ecoli、Glass和图像分割数据集,每种方法独立运行30次,每次迭代500次。

据Izakian和亚伯拉罕[使用的方法16],标准Ĵ被引入到评价集聚效应。的较低值Ĵ得到了较好的聚类效果。因此,实验数据的最终准则值最小Ĵ被认为是最佳结果。记录的平均值是考虑到算法的随机性。的最佳值和平均值,以更好地查看结果Ĵ如图所示1-4,分别。

由于惯性权重对算法的整体性能起着重要的作用,为了保证变量的唯一性,除了惯性权重外,所有的参数都是一致设置的。每个算法的参数值设置如下。

总体:所有算法均设为30;ELPSO:C1 = C2= 2,ω根据所提出的策略使用公式进行动态调整(12),和ž设为1.05;其他算法的参数设置与ELPSO及其惯性权重策略参考文献一致[28-三十]。

结果如下。

为了更好的观察实验结果,我们分别提取了前200次迭代的曲线,并将其放在整个迭代图中。这样,我们可以清晰地感知到各个算法的收敛趋势。此外,准则Ĵ50人中,200,和500迭代是在表中所列23分别;这些结果代表了实验的最优值和平均值。


数据集集合 迭代 PSO LPSO公司 EPSO RPSO 埃尔普索

鲍鱼 50 7610.0432号 7928.2152 7321.0800 7456.6338号 7209.1766年
200 7229.6062 7399.8084 7197.7556 7210.1214 7197.7447
500 7197.7448 7237.2808 7197.7447 7198.3222 7197.7447
Ecoli 50 6.7325 6.3524 6.4713 6.8044 5.8502
200 6.0905 5.9078个 5.8227 6.0385 5.3947
500 5.3443 5.6718 5.3314条 5.4742 5.3310个
玻璃 50 240.1781 213.2250号 191.1327 220.7926 178.3978
200 176.6745号 184.5977 155.7761 168.4756 154.1854年
500 154.5077 174.6182 154.1481 159.4427 154.1460
图像分割 50 18079261 14459116 16710175个 10112452 7263604个
200 13038282 11080451 6606879 9258174 5940593
500 608202年 9604572 5780101 8724927 5690913


数据集集合 迭代 PSO LPSO公司 EPSO RPSO 埃尔普索

鲍鱼 50 7681.8732号 7756.7018号 7375.2852 7444.9952 7210.9449
200 7224.8618个 7380.1867 7197.7683 7211.3830 7197.7447
500 7197.7452 7297.5891 7197.7447 7199.7810个 7197.7447
Ecoli 50 6.9441条 6.9788 6.5282 6.6143 5.9576
200 5.8466 6.1840 5.4144 5.7297 5.3656
500 5.3791条 5.9953个 5.3618 5.5613 5.3537条
玻璃 50 245.4625 240.3651 215.4950 219.1814 184.6535
200 213.7898 220.0770 177.9124 193.2778 162.8663
500 156.9724 187.9902年 154.6609 168.6809 154.1477
图像分割 50 17945971 17274272号 15048314号 16121031 8161111
200 13228454 14092457 7037767 12326004 6154794个
500 6811563 12371116号 6298898 10979083 6050846

数据1-4显示五个彩色曲线所代表的五种方法的结果。在各图中,横轴表示迭代次数,并且垂直轴表示标准Ĵ。值越小Ĵ显示效果更佳。

30次迭代的最优结果代表了算法的极限能力,但30次迭代的平均结果更能说明算法的性能。从数字上看很清楚14这ELPSO收敛更快,更拥有最好的图形和图表平均比其他算法的收敛速度的明显的优势,尤其是在前五迭代。

23说明ELPSO的准则值总是最小的Ĵ在50,200,和500迭代次数,优于其他四种算法,无论最佳值或平均值如何。虽然在鲍鱼数据集中,EPSO最终得到了与ELPSO相同的最优值,但其早期收敛速度慢于ELSPO。从四组数据的结果来看,LPSO在五种算法中更容易陷入局部最优,而ELPSO由于其合适的惯性权重选择策略,从未陷入局部最优。

测试的结果得出这样的结论,建议ELPSO是有效的,具有快速收敛,可以更有效地平衡全局搜索和本地搜索,并能显示非常令人鼓舞的结果在解决质量方面发现。

4.2条。混合方法聚类

在本节中,我们将本文提出的FCM-ELPSO算法与另外四种基于pso的混合算法FCM-SPSO、FCM-LPSO、FCM-EPSO和FCM-RPSO进行了比较。此外,测试中还添加了GA-FCM。为了评估上述所有算法的性能,我们选择了8个UCI数据集:Ecoli、Glass、图像分割、页面块分类、vif、钢板故障、超声波流量计诊断和酵母,如表所示1

为了定量评价收敛效果,基本准则可以描述为:同一簇内不同对象之间的距离应尽可能近;在不同的集群中,不同对象之间的距离应该尽可能的远。标准Ĵ仍然引入以评估聚类效果,如第节所述4.1款。此外,有效的簇有效性索引被引入评价体系,即,PBM(F),其已经在详细的描述。它再次值得提醒的是对于给定的数据集和所确定的簇数,所述PBM的更高的值(F)表示索引在这个意义上更好的聚类,该簇被很好地分离和相对紧凑。

每个算法运行30次,对每个数据集进行随机初始化,并选择与最佳判据值对应的分区。选择分区后,计算分区对应的PBM(F)。此外,还计算了30次重复的平均值和标准差作为准则Ĵ效度指标PBM(F)。这五种算法中PSO部分的参数值与本节相同4.1款和模糊参数在FCM部分被设置为2。结果如下。

4在等式显示出最佳的目标函数值(4从五个聚类算法获得的)。为了更仔细观察,平均值列于表分开设置。应当注意的是,混合方法总是达到迭代的上述最大号[之前会聚16]。因此,可以认为在相同的停止条件下,算法的性能取决于其结果。


数据集集合 GA-FCM公司 FCM-SPSO FCM-LPSO FCM-EPSO系统 FCM-RPSO FCM-ELPSO公司

Ecoli 5.3561 5.3460 5.3490 5.3540美元 5.3457 5.3326
玻璃 157.4681 155.3780个 154.4778 155.1152个 154.7951 154.1496
图像分割 6.0142Ë+ 06 5.9676Ë+ 06 5.8362Ë+ 06 5.8933Ë+ 06 5.8689Ë+ 06 5.7221条Ë+ 06
页面块分类 8.5735Ë+ 09年 8.5614Ë+ 09年 8.5621Ë+ 09年 8.5643Ë+ 09年 8.5616Ë+ 09年 8.5612Ë+ 09年
Spectf 5.8436Ë+ 05 5.8049Ë+ 05 5.7739Ë+ 05 5.7739Ë+ 05 5.7739Ë+ 05 5.7739Ë+ 05
钢板断裂 4.3874Ë+ 14 4.2944Ë+ 14 4.3438条Ë+ 14 4.3463条Ë+ 14 4.2936条Ë+ 14 4.2900个Ë+ 14
超声波流量计诊断 3.6411Ë+ 08年 3.6287Ë+ 08年 3.6312Ë+ 08年 3.6364个Ë+ 08年 3.6310Ë+ 08年 3.6276Ë+ 08年
酵母 12.2630年 12.0382 11.8642个 11.8538 11.8746 11.8413个


数据集集合 GA-FCM公司 FCM-SPSO FCM-LPSO FCM-EPSO系统 FCM-RPSO FCM-ELPSO公司

Ecoli 5.4132 5.4074 5.3909 5.3943 5.3878 5.3649
玻璃 160.6247 158.4809 158.7457 159.0322 159.6960 154.9908
图像分割 6.1894Ë+ 06 6.0791Ë+ 06 6.1117Ë+ 06 6.1396Ë+ 06 6.0897条Ë+ 06 6.0510Ë+ 06
页面块分类 9.9203Ë+ 09年 9.8668个Ë+ 09年 9.1186Ë+ 09年 9.3430Ë+ 09年 9.3317条Ë+ 09年 8.6631号Ë+ 09年
Spectf 5.8960Ë+ 05 5.8260Ë+ 05 5.7883Ë+ 05 5.7838Ë+ 05 5.7849Ë+ 05 5.7754Ë+ 05
钢板断裂 4.5225Ë+ 14 4.5225Ë+ 14 4.8656Ë+ 14 4.7123条Ë+ 14 4.6599Ë+ 14 4.4662Ë+ 14
超声波流量计诊断 3.6819Ë+ 08年 3.6763Ë+ 08年 3.6795Ë+ 08年 3.6904条Ë+ 08年 3.6796Ë+ 08年 3.6387条Ë+ 08年
酵母 13.1546 12.1272 11.9522个 11.9556个 11.9585 11.8478

4表明FCM-ELPSO始终达到最小值为标准Ĵ。为进一步示出了这些算法的性能,我们介绍的标准偏差来描述平均值的偏差程度。的标准偏差值越小,收敛范围越小和更健壮的算法是。表4显示标准的标准差Ĵ

在表6,FCM-ELPSO在五个数据集上获得最小的标准偏差,分别是玻璃、页块分类、Spectf、超声波流量计诊断和酵母。FCM-SPSO得到两个,图像分割和钢板故障,FCM-LPSO得到一个,Ecoli。可见,ELPSO具有较小的收敛范围和较高的鲁棒性。


数据集集合 GA-FCM公司 FCM-SPSO FCM-LPSO FCM-EPSO系统 FCM-RPSO FCM-ELPSO公司

Ecoli 0.0301个 0.0297 0.0223 0.0245 0.0273 0.0272
玻璃 2.8639 1.7319个 2.4125 1.8354 2.0823 1.1018
图像分割 1.7584Ë+ 05 7.2663Ë+ 04 1.7584Ë+ 05 1.4599Ë+ 05 1.5925Ë+ 05 2.7719个Ë+ 05
页面块分类 1.2927Ë+ 09年 1.3478Ë+ 09年 7.8227Ë+ 08年 1.4926个Ë+ 09年 1.0365Ë+ 09年 4.6222Ë+ 08年
Spectf 1.4432Ë+ 03 912.4835 1.9985Ë+ 03 1.5790个Ë+ 03 1.6325Ë+ 03 261.1258
钢板断裂 3.6258Ë+ 13 1.7151Ë+ 13 3.8546个Ë+ 13 2.4850Ë+ 13 3.4818Ë+ 13 2.3890Ë+ 13
超声波流量计诊断 3.9146Ë+ 06 5.1001Ë+ 06 3.4344Ë+ 06 4.2497Ë+ 06 3.7826Ë+ 06 1.0618Ë+ 06
酵母 0.0472 0.0443 0.0627 0.0596 0.0705 0.0065

7-9示出了用于有效性索引PBM(F)对应的值。


数据集集合 GA-FCM公司 FCM-SPSO FCM-LPSO FCM-EPSO系统 FCM-RPSO FCM-ELPSO公司

Ecoli 0.3265 0.3274 0.3303 0.3308 0.3327 0.3340
玻璃 3.0827 3.1856 3.7173 3.2463 4.0843 3.9848条
图像分割 564.4213 566.3507 577.5760个 573.2499 576.2624 587.5084个
页面块分类 8.1091Ë+ 04 8.5060Ë+ 04 8.5086Ë+ 04 7.7729Ë+ 04 8.7911Ë+ 04 8.3118条Ë+ 04
Spectf 26.4198 18.8760 35.7040 35.4333 33.3814 34.2975
钢板断裂 1.0651Ë+ 7 1.0634Ë+ 7 1.0566个Ë+ 7 1.0686Ë+ 7 1.0685Ë+ 7 1.0692Ë+ 7
超声波流量计诊断 4.0962Ë+ 03 4.1664Ë+ 03 4.0975个Ë+ 03 4.0582Ë+ 03 4.1587Ë+ 03 4.2225Ë+ 03
酵母 0.1082 0.1105 0.1395 0.1374 0.1378 0.1526


数据集集合 GA-FCM公司 FCM-SPSO FCM-LPSO FCM-EPSO系统 FCM-RPSO FCM-ELPSO公司

Ecoli 0.3195 0.3162 0.3174 0.3198 0.3214个 0.3238
玻璃 2.6173 2.7959个 2.9268 2.8091 2.9334 3.3451
图像分割 261.9715 255.1723 409.8047 401.2907 361.9401个 487.0102
页面块分类 6.7247条Ë+ 04 6.8971Ë+ 04 6.5584Ë+ 04 6.7081Ë+ 04 6.5419Ë+ 04 7.0711Ë+ 04
Spectf 19.5535个 12.4250 26.0889 28.1726 27.2532 31.5303年
钢板断裂 9.6322Ë+ 2 1.0076Ë+ 7 9.5767条Ë+ 06 9.7646Ë+ 06 9.7419Ë+ 06 1.0186Ë+ 7
超声波流量计诊断 3.6912条Ë+ 03 3.7835Ë+ 03 3.7067Ë+ 03 3.6883Ë+ 03 3.7202年Ë+ 03 4.0045Ë+ 03
酵母 0.0871 0.0884 0.1207 0.1177 0.1191 0.1434


数据集集合 GA-FCM公司 FCM-SPSO FCM-LPSO FCM-EPSO系统 FCM-RPSO FCM-ELPSO公司

Ecoli 0.0085 0.0088 0.0060 0.0072 0.0065 0.0053
玻璃 0.2473 0.1993 0.2953个 0.2056 0.3306 0.1647个
图像分割 200.4316 196.6843 207.5596 198.1861 216.7850 168.7607
页面块分类 7.1675年Ë+ 03 5.8166Ë+ 03 6.7870条Ë+ 03 6.3222Ë+ 03 7.4694Ë+ 03 2.8312Ë+ 03
Spectf 7.0519 2.9708 7.7021 6.6620个 6.5179 2.1903
钢板断裂 5.8661Ë+ 05 4.2121条Ë+ 05 6.4348Ë+ 05 5.2614Ë+ 05 6.2299Ë+ 05 3.9786Ë+ 05
超声波流量计诊断 306.4910 331.9834 232.4805 245.6173 290.7265个 196.3196年
酵母 0.0133个 0.0107 0.0116 0.0129个 0.0134 0.0053

FCM-ELPSO沾到的最好的结果的数据集5的有效性索引PBM(F)的最大,如表7和FCM-RPSO执行玻璃和页面区块分类好,而FCM-LPSO擅长Spectf。在的平均结果和标准偏差计算,FCM-ELPSO进行优于其他算法。而且它注意到,GA-FCM的性能还不如基于PSO混合聚类算法。

两个群集有效指标的结果进行比较,就可以通知,最好的标准Ĵ并不总是与PBM(F)的最佳值相关联,因为集群有效性索引并不适用于所有数据集。但是,实验结果仍然可以证明,FCM-ELPSO具有更好的性能和更好的鲁棒性。该混合算法结合了两种算法的优点,有效地防止了早熟收敛和陷入局部最优,略微提高了收敛速度,取得了满意的结果。

5个。结论

本文提出的ELPSO算法能较好地平衡勘探与开发之间的关系,避免陷入局部最优,具有良好的收敛性。为了克服基于粒子群算法的模糊聚类算法的缺点,将ELPSO算法与FCM算法相结合,形成一种混合算法FCM-ELPSO,利用ELPSO算法的全局搜索特性为FCM算法生成合适的初始聚类原型。在训练过程中,FCM-ELPSO能不断修正聚类方向。因此,作为一种随机初始化方法,混合方法能够有效地缓解FCM所面临的初始化和陷入局部极小的问题。实验分别测试了ELPSO算法和混合算法。实验结果表明,ELPSO和FCM-ELPSO在UCI数据集中表现良好。特别是在高维、大数据的情况下,与其他聚类方法相比,FCM-ELPSO能够产生质量更高、标准差更小的聚类。

在今后的工作中,我们将探索这些方法在不同领域的实际应用,如图像分割、文本挖掘和医学问题。此外,我们将研究新的粒子群优化初始化方法,以提高复杂数据集的性能。

数据可用性

支持本研究结果的数据可根据要求从通信作者处获得。

的利益冲突

作者宣称,他们没有利益冲突。

致谢

这项工作得到了国家重点研发计划(2018YFB1308400)的支持。

参考文献

  1. B. A.皮门特尔和R. M. C. R.德索萨,“A多元模糊C均值方法,”应用软计算,第13卷第1期4、第1592-1607页,2013年。查看位置:出版商网站|谷歌学术
  2. P、 Melin和O.Castillo,“2型模糊逻辑在聚类、分类和模式识别中的应用综述”应用软计算,第21卷,第568-577页,2014年。查看位置:出版商网站|谷歌学术
  3. X.李,J.宋,F.章,X.欧阳和S. U.汗“MapReduce的基于用于大规模水下图像分割快速模糊c均值算法,”下一代计算机系统,第65卷,文章ID S0167739X16300486, pp. 90-101, 2016。查看位置:谷歌学术
  4. R.许,聚类算法综述,IEEE出版社,皮斯卡塔韦,NJ,USA,2005年。
  5. J. C. Bezdek, R. Ehrlich,和W. Full, " FCM:模糊c-均值聚类算法,"电脑与地质卷。10,没有。2-3,第191-203,1984。查看位置:出版商网站|谷歌学术
  6. O. Kesemen,Ö。Tezel,和E.Özkul,“模糊C均值用于定向数据(FCM4DD)聚类算法,”与应用专家系统,第58卷,第76-82页,2016年。查看位置:出版商网站|谷歌学术
  7. H、 Verma,R.K.Agrawal和A.Sharan,“一种改进的直觉模糊c-均值聚类算法,它结合了用于脑图像分割的局部信息。”应用软计算,第46卷,第543-557页,2016年。查看位置:出版商网站|谷歌学术
  8. 五,噢蔓,F.凤楼毛,H.红卫武和Y.徐莹,“大数据集与生物信息学应用的并行聚类算法,”IEEE/ACM计算生物学和生物信息学汇刊卷。6,没有。2期,第344-352,2009。查看位置:出版商网站|谷歌学术
  9. D.-Q.张和S.-C.陈,“集群使用基于内核的模糊C-means算法不完整的数据,”神经处理信件,第18卷第2期。3,页155-162,2003。查看位置:出版商网站|谷歌学术
  10. K.-林,“A新的进化内核直觉模糊C-均值聚类算法,”模糊系统的IEEE汇刊卷。22,没有。5,第1074年至1087年,2014。查看位置:出版商网站|谷歌学术
  11. 郭荣杰、林天成、祖尔维亚、蔡长云,“聚类分析的一种混合元启发式与核直觉模糊c-均值算法,”应用软计算卷。67,第299-308,2018。查看位置:出版商网站|谷歌学术
  12. S.阿拉姆,“研究基于粒子群优化聚类:文学和技术的系统评价,”群和进化计算,第17卷,第1-13页,2014年。查看位置:出版商网站|谷歌学术
  13. S、 陈,徐,汤,一种基于模糊c-均值和改进粒子群优化的混合聚类算法阿拉伯杂志科学与工程卷。39,没有。12,第8875-8887,2014。查看位置:出版商网站|谷歌学术
  14. P.路“的基础上的合作QPSO模糊C均值与学习行为,”在智能科学与大数据工程国际会议论文集,施普林格国际出版,苏州,中国,2015年6月。查看位置:谷歌学术
  15. T、 库拉,“粒子群优化聚类方法”与应用专家系统卷。39,没有。1,第1582至1588年,2012。查看位置:出版商网站|谷歌学术
  16. H、 Izakian和A.Abraham,“模糊聚类问题的模糊c-均值和模糊群”与应用专家系统卷。38,没有。3,第1835至1838年,2011。查看位置:出版商网站|谷歌学术
  17. 使用模糊c -均值和量子行为粒子群优化的混合数据聚类2018年IEEE第八届计算与通信研讨会(CCWC)会议记录,拉斯维加斯,内华达州,美国,2017年12月。查看位置:谷歌学术
  18. T. M.席尔瓦Filho的,B. A.皮门特尔,R. M. C. R. Souza的,和A. L. I. Oliveira的,“基于模糊c均值和改进粒子群优化用于模糊聚类混合方法”与应用专家系统,第42卷,第17-18期,第6315-63282015页。查看位置:出版商网站|谷歌学术
  19. 谭恩泰,蔡树泰,孙立华,和Vinh,“基于模糊聚类和粒子群优化的三维无线传感器网络寿命和网络连接的改进”,无线网络卷。24,没有。5,第1477至1490年,2018。查看位置:出版商网站|谷歌学术
  20. J. Chrouta,A. Zaafouri和M. Jemli,“建模和灌溉台的识别使用基于粒子群优化模糊C-均值聚类算法,”在系统与控制国际会议记录,美国明尼苏达州明尼阿波瓦市,IEEE,2015年。查看位置:出版商网站|谷歌学术
  21. T. P. Xuan, P. Siarry,和H. Oulhadj,“将模糊熵聚类与改进的粒子群优化相结合用于MRI脑图像分割,”应用软计算,第65卷,文章编号S1568494618300097,页230-242,2018。查看位置:出版商网站|谷歌学术
  22. N.辛格,N.乔杜里,R.塔姆和S.蒂瓦里,“模型降阶采用模糊C-均值聚类和粒子群优化,”在通信与计算科学的智能创新卷。2,施普林格,柏林,德国,2019。查看位置:出版商网站|谷歌学术
  23. J. Nayak, B. Naik, H. S. Behera,和A. Abraham,“基于混合化学反应的元启发式与模糊c-均值算法的最优聚类分析,”与应用专家系统卷。79,第282-295,2017。查看位置:出版商网站|谷歌学术
  24. “一种基于模糊c-均值(ETLBO-FCM)数据聚类算法的混合教学学习优化,”艾因夏姆斯工程杂志卷。9,没有。3,文章ID S2090447916000289,第379-393,2016。查看位置:出版商网站|谷歌学术
  25. R.库马尔,R. Dwivedi和E. Jangam,“使用球棒优化和Maxi-分钟距离分类混合模糊C均值,”在计算机和信息科学通讯,施普林格,柏林,德国,2019。查看位置:出版商网站|谷歌学术
  26. “粒子群优化参数效率的统计分析”,电子学报卷。32,没有。2,第209-213,2004。查看位置:谷歌学术
  27. D.田和Z.轼“MPSO:改进粒子群算法及其应用”群和进化计算卷。41,文章ID S2210650217307137,第49-68,2018。查看位置:出版商网站|谷歌学术
  28. R. C.埃伯哈特和Y.时,“比较惯性权重和收缩因素粒子群算法,”在进化计算2000年的IEEE会议论文集,电气与电子工程师协会,洛杉矶,加利福尼亚州,美国,2000年7月。查看位置:出版商网站|谷歌学术
  29. G.陈,黄X.,J.佳和Z.民“在粒子群算法自然指数惯性权重的策略,”在2006年第六届智能控制和自动化世界大会会议记录2006年6月,中国大连。查看位置:出版商网站|谷歌学术
  30. R. C.埃伯哈特和Y.施,“跟踪和优化用粒子群的动态系统中,”在2001年的大会上进化计算的程序,IEEE,韩国首尔,2001年5月。查看位置:出版商网站|谷歌学术
  31. M. K. Pakhira, S. Bandyopadhyay,和U. Maulik,“清晰和模糊聚类的有效性指数,”模式识别卷。37,没有。3,第487-501,2004。查看位置:出版商网站|谷歌学术

版权所有©2020张健和马宗衡。这是一篇在创作共用署名许可,它允许在任何媒体中不受限制地使用、分发和复制,前提是正确引用了原始作品。


更多相关文章

196 查看 | 193 下载 | 0 引用
PDF 下载引用 引用
下载其他格式更多的
订单打印副本订单

相关文章

我们致力于尽快、安全地分享与COVID-19有关的发现。任何提交COVID-19论文的作者应通知我们help@hindawi.com以确保他们的研究得到快速跟踪,并尽快在印前服务器上提供。我们将为接受的与COVID-19相关的文章提供无限的出版费用减免。在这里注册作为一个评审员,帮助快速跟踪新的提交。