文摘
聚类分析作为数据挖掘技术的一个重要方法,只是提供了一个方法,研究和分析大量的数据。从最重要的节点,本文基于数据字段的划分聚类特征。灵敏度修剪算法用于进一步调整和优化模糊神经网络的结构,允许网络自动学习系统的结构和参数在不同的环境中并获得最优控制规则。最后,聚类函数将算法的输出结果。实验结果表明,复杂网络的自适应聚类算法提出了可以有效提高网络集群分工,减少算法的时间复杂度,避免提供集群的数量结构的问题。这种方法的集群结构效率可以达到97.6%,和聚类精度最高可以达到96.8%。本文提出的自适应聚类算法不仅克服了传统算法的缺陷,如需要预先确定的集群和集群的结果依赖于初始聚类中心的选择,但也有理想的聚类精度。本研究引入了一个新的和更有效的方法解决实际的困难问题复杂的控制系统。
1。介绍
一切在现实世界中既有macro-abstraction micro-concreteness,而后者称为复杂性。由于信息网络技术的迅速发展,网络总是出现在我们的生活,工作,学习,和交流1]。这导致了日益复杂的人际关系,这表明人们的生活发展到复杂网络的时代。与计算机技术的进步,它已经表明,在复杂网络中节点度分布符合幂律分布,和一个无标度网络模型在此基础上建立了(2]。复杂网络与大量的节点是一个统一的整体,它们之间复杂的相互作用和依赖关系。系统元素被视为网络节点和元素之间的关系被视为节点连接的基础,因此抽象复杂的系统到一个复杂的网络。大量的复杂网络社区结构特征和网络的社区结构发现算法的目的是找到存在的社区网络中基于网络的拓扑结构。近年来研究人员发现,通过大量实际的统计分析网络在各个领域,完全定期或完全随机网络不存在或很少,而且多数是复杂网络的统计特征,介于常规和随机的。复杂网络主要是通过三个阶段演化,开始完全正则网络和发展完全随机网络,然后不完全随机网络和无标度和小世界特性。已建成的复杂网络更适用于现实世界,吸引了更多的人。群落结构也称为聚类在复杂网络领域的复杂网络。人们一直在研究群落结构很长一段时间,发现社区结构和算法,如贪婪算法,越来越成熟。
尽管神经网络可以逼近真实紧集上连续函数任意精度,以及并行计算、分布式存储、容错能力强,自学,他们缺乏人类语言表达的能力,如专业知识和经验。然而,尽管模糊系统可以表达模糊或定性知识,它缺乏self-learn和self-adapt的能力。模糊神经网络是人工神经网络的混合3- - - - - -5)和模糊逻辑系统。一方面,它可以弥补纯模糊逻辑在学习的缺点,而另一方面,它使神经网络透明的“黑盒”问题。聚类分析在数据挖掘中的应用可以有效地加快定位信息的背景下信息技术与数据库为核心,并与神经网络的发展,聚类分析的应用范围更广泛。复杂网络聚类算法的基本前提6- - - - - -8)是我的真正的家庭结构使用网络拓扑,和我们的目标是找到集群结构。因为这种类型的算法可以检测网络中集群结构,它具有重要的理论意义和应用价值。聚类分析,在数据挖掘的一个重要方法9,10)技术,已成为一个研究热点分析大规模数据增长。目前,不同类型和大规模数据集的激增,对聚类分析方法的需求增加。长期研究显示,复杂网络的社区结构特征,以及相应的群落结构算法,对复杂网络聚类分析奠定了基础的建议。在此基础上,提出了一种模糊神经网络自适应聚类算法对复杂网络。以下是它的创新:(1)本文介绍了物理数据字段的概念,和中央节点开采提出了节点的重要因素。中央节点的影响范围在周围的祝福一定会更大,所以它构成集群在一个复杂的网络。的聚类算法结合了复杂网络的社区划分技术和相似性度量解决问题事先确定集群的数量。(2)在模糊神经网络的学习过程,误差反向传播学习算法用于修改参数,灵敏度和修剪算法进一步优化网络结构,从而达到目的的网络结构和参数的自适应调整,从而获得最优模糊控制规则库。此外,自适应神经模糊网络是用来调整前后模型的参数,从而提高收敛速度和系统的建模精度。
本文基于复杂网络的自适应聚类算法的模糊神经网络。它的章节安排如下:第一章是介绍。本节提供了具体的研究内容、研究背景和研究意义。它还介绍了本文的研究创新和篇章结构。第二章是对相关的工作。本章论述了本文研究课题的研究现状,国内外对这些文件进行全面检验,提出了本文的研究工作和方法。在第三章中,介绍了相关的理论基础,复杂网络的自适应聚类算法基于模糊神经网络的设计和建议。在第四章中,通过大量的实验进行探讨该方法的可行性。第五章是总结与展望。本章总结了论文的研究成果。 Finally, the shortcomings of this paper are discussed, as well as future research directions.
2。相关工作
在现实世界中,复杂网络越来越交织在一起的人,和他们日常生活越来越密不可分。为了更好地利用这些网络,我们可以使用各种方法研究它们,其中最有效的是采用复杂网络的概念。复杂网络聚类算法不仅是重要的解决图像分割在计算机科学中,也发现社区社会学。同时,它是生物学和其他学科研究的主要方法为各自领域。有许多研究进行模糊神经网络和复杂网络聚类算法。
为了减少聚类的计算成本没有降低质量的解决方案。Burlak和Medina-Angel利用蚁群优化技术在网络找到派系和分配这些派系透漏了,然后用传统算法找到社区成员(11]。徐和燕提出健身模式,它使用健身,以确定节点连接(12]。彭和陈模糊似然函数用于定义集群的集群标准样本数据,以实现的模糊识别模型。然而,这个方法必须预先设定的规则数量(13]。曹国伟和燕二次优化方法用于最小化预先确定切功能,当网络分为网络最小的削减,它被认为是最佳的网络部门。然而,这种方法不能保证分割结果通过递归二分的思想符合实际的多网集群结构(14]。夏等人提出了一种基于BP算法的自适应模糊识别方法,但仍有BP算法陷入局部解的缺陷,速度慢15]。通过分析参数,东等人建造了一个模型来解释这一现象,真正的网络不完全满足幂律分布(16]。f .姗姗和r .志强等人提出了一种基于聚类的模糊神经网络识别方法,确定了结构和参数的祖先通过模糊聚类,然后使用线性拟合或梯度算法获得的参数后验(17]。唐家璇指出,模糊逻辑系统的核心是模糊规则库,它需要很长时间建立模糊规则库,尤其是对非常复杂的系统,很难建立正确的模糊规则和隶属度函数(18]。Sathiamoorthy Ramakrishnan提出了一个算法来取代中间性边缘与连接算法的聚类系数。想法是短路路径基本上不会出现在连接集群之间的路径,否则连接集群之间的边缘将倍数的增加,导致的密度的增加集群之间的边缘;因此,该算法集连接集群内的连接聚类系数。启发式规则(19集群之间的连接)连接聚类系数应该超过。针对问题,无标度网络模型只有加法操作点,乐天等人提出了一个优化模型,其中包括边缘加法和边缘的影响重新连接在网络调查的范围(20.]。
因为传统聚类方法不能积极发现家庭结构的总人数,实际应用中的缺陷。基于相关文献的研究,本文提出了一种自适应聚类算法基于模糊神经网络的复杂网络通过构造一个聚类评价函数,积极寻找最优数量的集群。摘要模糊c均值聚类算法用于确定系统的输入空间分区根据模糊规则的数目。然后,系统的模糊空间划分基于模糊竞争学习算法,以及适当的模糊规则和每个样品每个规则的适用性。在网络的学习过程,误差反向传播学习算法和灵敏度修剪方法用于优化网络的参数和结构,从而达到自适应地调整参数和结构重量的目的。
3所示。方法
3.1。模糊神经网络和复杂网络
随着因特网的不断渗透技术在生物技术、人工智能等领域(21),对人工神经网络的研究已经逐渐浮出水面。人工网络的发展经历了一条道路组成的三个阶段:上升,萧条与繁荣。大量的神经元与相同的形式连接在一起形成一个神经网络,这是一个高度非线性动态系统。尽管每个神经元的结构和功能并不复杂,神经网络的动态行为非常复杂。如今,经过几十年的研究,许多学者,神经网络是越来越成熟,和研究趋势与其他学科交叉和融合与其他新技术,并取得了丰硕的成果。应用模糊神经网络近年来发展迅速。模糊神经网络结合了神经网络的低级学习能力和计算能力的高级人类思维和推理能力的模糊逻辑系统,并实现双方的优势互补。有机结合形成的模糊神经网络的模糊系统和神经网络结合了两者的优点。它不仅可以表达近似和定性知识像模糊系统,但也有很强的学习和神经网络非线性表达能力。此外,模糊神经网络的参数的物理意义是非常清楚的。 But in the process of development, there is always a difficult problem. It is the problem of structural identification, that is, how to divide the input and output space properly and how to extract a simplified fuzzy rule base from the observed data.
模糊系统建模过程的模糊神经网络的设计过程主要包括两个部分:结构识别和参数估计。输入空间的划分和模糊规则是由结构识别。相对应的隶属函数输入变量划分输入空间,所以确定形状、数量和模糊规则的隶属函数是结构识别的任务完成(22]。因为有效的输入空间划分可以有效地减少模糊规则的数目,输入空间划分也是非常重要的。因此,确定隶属度函数及其参数的数量是至关重要的。许多学者感兴趣的集群。已经有大量的经典算法发展到目前为止。目前,聚类算法的研究主要分为两个学校,即经典的聚类算法和模糊聚类算法。聚类算法作为一种无监督分类方法,可以区分和分类根据一定的要求和规则。因为模糊聚类算法直接划分输入空间,它采用多维隶属度函数。因此,模糊系统的模糊规则数量大大减少。结果,“维度灾难”的传统方法划分输入维度是可以避免的。 The complex network clustering analysis methods used in the process of realizing neural network technology primarily include the K-Lin algorithm, traditional spectrum bisection method, and splitting algorithm. Figure1给出了模糊控制系统的构成和分类的聚类算法。
复杂性是发达与许多学科的交叉研究目前,它源于图论在数学。它是用来研究规则网络。由于网络中节点的数量很小,边的连接规则不复杂,常规的网络不能称为严格意义上的复杂网络。复杂网络是一个网络与某些组织、吸引子、小世界、无标度,部分或所有属性和结构和形式具有较高的自相似性。复杂的集群网络结构的发现具有重要的参考价值网络函数的直观理解,深入分析网络拓扑结构,有效发现网络中隐藏的特点和规律,并预测网络行为。家庭结构的研究广泛应用于社区检测领域的社会学、生物学代谢功能的理解,互联网的主要功能的区别。在实际的网络中,许多网络节点具有相同性质密切相关,聚集成一个社区,但没有密集的网络节点之间的连接与不同的属性,这是社区结构。社区可以包含模块、类团体,团体和其他含义。发现网络中的社区结构分析具有重要意义的基本特征和网络中的社区结构的共同特征。在一个复杂的网络,学位是用于描述网络的特点。 That is, the number of lines connecting a node with other nodes. The more lines, the greater the degree of the node, and the greater the influence of the node on the network. Mining the important nodes according to the network topology is the goal of network centralization research, and the difference of the importance of nodes is determined by the heterogeneous topology of complex networks. Radial basis function network is a single hidden layer feedforward neural network with good performance. It can determine the corresponding network topology structure according to different problems, and has the advantages of better approximation ability, smaller network training scale, faster learning speed and no local minimum problem.
3.2。复杂网络自适应聚类算法
之间有很多相似之处的神经网络和模糊推理技术在信息处理和控制方面,和他们的互补性可以穿透,促进形成新的加工结构和算法通过神经网络和模糊推理技术。聚类是一种数据结构探索工具,其核心是集群。聚类是将数据集划分为多个类的过程基于预定义的标准。数据对象之间的相似性在同一类是高,但数据对象在不同阶层之间的相似性很低。对模糊集群分析有两种基本方法:系统聚类和逐步聚类。模糊等价关系支撑系统聚类方法。模糊划分支撑逐步聚类方法。系统聚类方法只能得到最终的聚类结果,具有很高的分辨能力。集群的数量必须确定提前使用循序渐进的聚类方法。如果集群的数量不足,集群操作会重复。 The fuzzy system modeling process in the design process of a fuzzy neural network consists primarily of two parts: structure identification and parameter estimation. Because effective input space partitioning can effectively reduce the number of fuzzy rules, input space partitioning is critical. After determining the structure, parameter estimation is used to determine all of the parameters in the system.
设计模糊系统的关键是获得模糊知识。传统的方法是通过经验获得模糊规则。这种方法的缺点是强烈的主观假设,适应性差,设计周期长,没有自学习和自适应能力。利用神经网络的自学习能力来提取模糊规则或参数的模糊规则,并应用神经网络的学习能力来扩大知识库实时在很大程度上可以解决这个问题。在模糊聚类,相似系数和距离系数通常选为相似系数。距离系数是一个数学量,指的是数据之间的相似度值。相似系数描述形状相似性的数据。当相似系数值= 0,这意味着他们是完全不同的,而价值等于1时,这意味着他们是完全一样的。自适应聚类算法提出了复杂网络的特征是它可以自动合并和分裂集群没有任何先验知识的数据集。聚类分析的实验表明该算法是有效和可行的,它可以完成数据的聚类分析,没有任何先验知识。 The flow chart of adaptive clustering algorithm of complex network based on fuzzy neural network is shown in Figure2。
本文包括两个部分:前期网络和随之而来的网络。前期网络用于匹配模糊规则的前提,和随之而来的网络用于生成的模糊规则。自适应聚类算法的基本思想,本文从集群的中央节点,并利用势函数的影响其他节点划分为簇,极大地影响了中央节点。集群中心节点的发现是基于节点重要性因素提出的每个节点中心的优点和缺点。改进的自适应聚类算法不仅包括数据之间的相似度值,而且形状相似性的数据。通过这种方式,不仅提高集群的灵活性,但也最终的聚类结果更可靠。GN (Girvan纽曼)算法是一个基于边缘中间性的社区发现算法,也是一个典型的分割方法(23]。尽管其他GN算法比原算法分析群落结构,及其精度较高,它不再是适合分析大规模复杂网络由于其较高的时间复杂度。为了分析和处理大规模复杂网络,需要用更少的时间复杂度的算法。本文介绍了纽曼快速算法。本文在纽曼的快速算法,该算法的准确性不是衡量模块化。相反,模块化作为一种优化值,通过连接边和节点合并,增加模块化,以便形成一个社区。模糊神经网络中的每个节点和所有参数具有明显的物理意义,即利用模糊神经网络在纯粹的神经网络。这些参数的初始值可以确定根据模糊定性或定性的知识体系,然后学习算法能快速收敛到所需的输入-输出关系。
数据集 分为团体最小化加权和的平方距离样本在每个类别集群中心。模糊聚类的目标函数通常采用以下形式:
它的约束:
其中,样品数据点的总数;是集群中心的数量;隶属函数矩阵;元素的行吗和列的矩阵 。目标函数的必要条件达到最小值是:
在获得集群中心和隶属度函数,使用下面的公式计算模糊协方差矩阵:
纽曼学位计算相关系数为:
其中,和表示两个节点的度th边缘,在网络边缘的总数。节点的强度如下所示。
其中,表示节点的集合邻居。
聚类分析的“类”的特点:集群中提到的类不是事先给定的,但将根据数据的相似性和距离。相似性数据的测量方法极大地影响集群效应,这可以说是聚类算法的核心。自适应聚类算法的初始聚类中心本文并非随机,但从近似集群结构划分的中心节点。而不是提供一个固定数量的集群,集群的数量确定自适应基于集群的评价函数。影响边界节点,但分裂的潜在叠加分割节点基于家庭的分裂节点。分配系数的主要缺点是,它不直接与数据集的几何结构的关系,只能反映样本数据集群之间的平均分离度。提议的有效性函数结合到分配系数的几何结构信息反映了样本数据的聚类类的密实度。因为训练样本将不可避免地包含错误,如果网络结构冗余,这些错误会影响整个模糊神经网络的训练收敛方向后期的网络培训,导致全球最佳点的偏差和泛化能力降低。这被称为训练过度或过度学习。因为网络中的每个节点可以连接到任何其他节点,将形成许多复杂网络。 However, in reality, only one network is required, necessitating the evolution of various complex networks that have been constructed. Nodes in a complex network do not exist independently. They are interconnected and influence each other, and the influence range of important nodes is broad, whereas that of other nodes is narrow. When a network has modularity and clustering, the mutual influence between nodes has local characteristics, and as network distance increases, the influence of each node rapidly declines. The fuzzy system produces the following results:
总误差函数定义为:
其中,是模糊系统的输出,是预期的价值。在这篇文章中,三个指标,准确率、召回率和F1值选择对聚类结果进行评估。它是计算如下: 在哪里是正确的数量分类中的数据集群,然后呢集群中的是理论数据的数量。
其中,是集群中的数据实际分配的数量。
自F1值可以反映正确的平衡率和召回率,当F1一个分类的价值较高,这表明,类的分类精度更好。
本文认为没有其他经验知识时,最简单的网络,可以匹配给定的样本是最好的选择,相当于使样本点方法的偏差最顺利的未知的非线性映射函数在容许范围内。模糊分类器的学习算法将训练样本划分为相应的类通过竞争学习,然后获得样本的隶属度属于某个类通过模糊隶属函数,也就是说,样本属于每个规则的遵循程度。复杂网络聚类方法有一定的缺陷,计算精度不能满足要求,或时间复杂度太高,或一个特定的参数值需要事先给定,如集群的数量。观测值的数据集作为原始对象的矩阵,和所有的原始数据转换成数据区间[0,1],然后进行归一化计算范围,也就是说,所有的数据都位于区间[0,1]。当使用遗传算法优化网络结构,每个网络个体神经网络人群可能是潜在的解决优化分类问题,它们必须被训练。首先,表示网络结构的变量表示为基因编码。然后,一系列遗传操作模拟生物evolution-selection和再生健康的基础上,对人口进行交叉和变异。以产生一个更好的新一代。本文介绍了结构调整的想法,和一个新的模糊规则建立了通过添加一个新的聚类中心和半径样本不包括在现有的模糊超椭圆体空间。然后,基于模糊分类器的结果,构造模糊神经网络,后者的网络参数进行优化,以便识别模型具有较高的精度,充分反映了系统的特点。 Because the short-range field plays an important role in revealing the cluster structure in the network, the mutual influence between nodes is generally measured by Gaussian function with short-range field, which is continuous, smooth, limited, isotropic and monotonically decreasing.
4所示。结果分析和讨论
本文使用的数据选择的虹膜数据集在UCI数据库中,用于测试在国际上聚类算法,并实际测试,证明了自适应聚类算法的有效性提出基于模糊神经网络的复杂网络。虹膜数据集是一组样本的三种不同类型的花。每朵花有50个数据集,总共150数据集。每个数据集包含四个花属性:花萼长度、宽度萼片,花瓣长度,和花瓣宽度,使之成为一个四维数据集。第一种是完全不同于其他两个,第二个和第三个物种相交。数据集包含了150个数据对象,分为三个类别,每个都有50个数据对象。虹膜的价值表数据集分类有效性函数表所示1。
从表可以看出1有效性函数的最大值的虹膜数据获取类的数量是3时,第二个最大值时获得类的数量是2,这是完全符合实际的虹膜数据的分布。进化的复杂网络,连接每一个复杂网络与相邻的复杂网络形成一个小组,并采取8节点为例,形成一个小群体。我们进行回忆实验和得到的回忆结果不同的算法,如图3。
电脑网络数据集通常用于评估集群结构划分的准确性。这个信息是一组已知的网络图由电脑随机生成的拓扑结构。每个网络有128个节点和四个不同的集群结构,每个都有32个节点。多个规则经常被同时激活在模糊系统中,输出是多个规则之间的相互作用的结果,因此偏离一个规则对结果没有影响。每个神经元和连接的贡献对整个神经网络的功能是如此之小,少数神经元和连接的失败对网络功能影响不大。的执行计划的最后一步是复杂网络的小群体的进化。小群体的进化在小组代表每一个复杂网络的演化,及其操作包括交叉和变异。图4描绘了k - means聚类错误,Kernighan-Lin,这个算法基于实验。
在本文中,每个聚类结果被认为是复杂网络的一个节点,和每个节点中的数据是混乱的,需要处理。每个复杂网络中的节点处理,关键是要找到最近的两个人都彼此,然后使用该算法找到两个人之间最短的距离。网络常被用来验证的有效性集群结构在复杂网络聚类算法发现的Zachary空手道俱乐部网络,这是一个典型的小型社交网络。为了得到结果的准确性,本文运用Zachary网络和电脑网络进行仿真分析。精度结果见表2得到了。
为了更直观地反映了实验结果,本文情节不同算法在不同网络的效率作为线图。集群结构效率不同算法得到的Zachary网络图所示5。集群结构不同的算法在电脑网络上获得的效率图所示6。
之间的比较数据5和6集群结构,它可以得出结论,通过本文中的复杂网络自适应聚类算法具有较高的效率。该算法能够准确地划分的数量实际集群结构在不同的网络,而且准确率高。集群结构的效率获得圣扎迦利网络上可以达到96.8%左右,和集群结构的效率获得计算机生成的网络可以达到97.6%左右。在实际工程应用中,模型的顺序通常是未知的,所以它不仅是必要的,以确定隐层的规模和节点的神经网络,还要选择适当的模型输入。灵敏度修剪算法能有效地完成这项工作。参数识别考虑到既有线性和非线性部分的计算网络输出。线性的情况下,可以使用最小二乘法;非线性情况下,梯度下降算法可以用来训练权重,即最小二乘法的混合算法和梯度下降算法可以一起使用。的比较F如图1的值不同的算法7。
根据图中的数据7,F1这个算法是最高的价值,达到了95%。k - means算法是第二,Kerni ghan-Lin算法是最低的。这个结果进一步证明了该算法的有效性。复杂网络的自适应聚类算法基于本文提出的模糊神经网络不需要提前确定集群的数量,但是只需要选择合适的相似性度量和将其转换为所需的矩阵自适应聚类算法,然后得到聚类结果的帮助下自适应聚类算法。在这一章的仿真实验表明,这种方法的集群结构效率可以达到97.6%,和最高的聚类精度可以达到96.8%。本文提出的自适应聚类算法不仅克服了传统算法的缺陷,需要提前确定集群的数量,和聚类结果依赖于初始聚类中心的选择,但也有理想的聚类精度。
5。结论
一切在现实世界中既有macro-abstraction micro-concreteness,而后者称为复杂性。由于信息网络技术的迅速发展,网络总是出现在我们的生活,工作,学习,和交流。大数据技术的应用范围不断扩大的今天,由于计算机网络信息技术的快速发展。实现有效的数据管理和使用,必须使用科学的复杂网络聚类分析方法来优化网络,使其在实践中广泛应用。传统的聚类算法是改进本文解决的问题决定的数量分类和初始化聚类中心。监督误差反向传播学习算法用于本文调整网络参数,提高了系统的精度。生成的规则数量和初始参数基于改进算法的聚类结果,和输入变量空间划分生成初始模糊规则库。因此,网络的学习量减少,模糊神经网络具有收敛速度快,建模精度高。同时,灵敏度修剪算法,进一步调整和优化模糊神经网络的结构,所以网络可以自动学习系统的结构和参数在不同的环境中并获得最优控制规则,给它一些自适应能力。根据仿真结果,这种方法的集群结构效率可以达到97.6%,最高的聚类精度达到了96.8%。 In the results of this paper, the classification accuracy and convergence speed of the complex network adaptive clustering algorithm are validated. This study has both theoretical and practical implications. Despite the accomplishments of this paper, there are still many problems to be solved due to the diversity of complex network structures and clustering algorithms, as well as a lack of further research on the subject. Further research on how to consider the attributes of nodes in high dimensions, how to avoid the explosion of fuzzy rule combinations, and how to establish the corresponding fuzzy neural network model suitable for fuzzy clustering is required in this paper.
数据可用性
使用的数据来支持本研究的发现可以从相应的作者。
的利益冲突
作者没有任何可能的利益冲突。
确认
本研究甘肃科学技术基金(批准号兰州18 jr3ra228)和科技项目(批准号2018-4-56)。