文摘

在规则优化,一些规则提取特征描述不确定性模糊关系的相关性,但具体数字无法表达相关性的不确定性,如“至少0.1和0.5。“为了解决这个问题,一个小说的定义提出了区间模糊关系的信息内容在这个手稿实现模糊性度量的模糊关系。此外,它的定义和表达式也被建造。同时基于区间信息内容,模糊含义的问题排序和聚类分析。最后,利用组合的可能性区间比较方程和区间值的相似性度量,影响运营商的分类被证明是切实可行的。成果展示的工作将提供一个合理的指标来衡量的模糊含义运营商并为进一步的研究打下坚实的基础。

1。介绍

如今,我们正处在一个信息革命,使开发和部署新的科技与不断增长的深度和广度。信息与数据和知识,作为数据代表归因于参数值,和知识表示真实事物或抽象概念的理解1]。随着计算机科学的发展,人们所产生的信息量已从涓涓细流洪流。1948年,香农理论第一次被提出的信息的定义,在统计方法用于定量测量信息内容。

信息理论的快速发展使人们意识到它的重要性2],其理念已经应用在许多地区,如沟通、决策、和模式识别3- - - - - -5]。但不幸的是,信息理论的应用研究在语义和语用信息科学尚未广泛开展直到现在。大数据的时代已经被打开,有用的信息必须从越来越多的数据挖掘。在这个过程中,所表达的信息需要不同的规则。从实用的角度来看,很难用精确的数学模型来描述决策者的经验。因此,如何选择和评估规则的关键问题是实现模糊系统的控制,可以概括为规则优化(6,7]。

为了解决这个问题,许多研究已经进行了开发几种方法,可以分为两类:(1)通过提取一些规则特征(8- - - - - -13),如不确定性的运营商Yu et al。8由Sendi和Ayoubi[],信息熵7),和模糊依赖由胡锦涛et al。(12模糊系统的优化,实现了。(2)首先,建立了模糊规则的结构;然后,一些算法(14- - - - - -19),如梯度下降法(14)和神经网络(16),被用来优化变量参数模糊系统。经典的构图规则的推理方法,模糊规则往往转化为影响运营商。所以,许多模糊含义运营商可以构造(20.- - - - - -24),对他们来说,如何实现更好的模糊控制系统的研究仍然缺乏。为了解决这些问题,本文提出了一个新颖的方法,利用模糊关系的区间信息内容提取实现排名,聚类和分类。

信息内容是用来描述在模糊集之间的相关性关系。但是,由于事情的复杂性和人类认知的不确定性,具体数字不能用于表达两组之间的相关性。例如,当相关性是“至少0.1和0.5,“如何衡量它仍然是一个尚未解决的问题。为了解决这个问题,从而构建一个新的不确定性度量的定义,被命名为区间信息内容的模糊关系。首先,模糊区间信息内容的关系,提出了开发和五个不同的表情,与排名,聚类和分类的模糊含义运营商实现了。

2。预赛

在本节中,一些定义和理论介绍了这篇论文。

定义1。(见[8])。让XY是两套,一个模糊关系RXY是一个模糊子集X×Y,R(x,y)的隶属度xy模糊关系R和所有模糊关系的类XY可以用Ƒ(X×Y)。
有限集和 ;然后,模糊关系R可以用模糊关系矩阵

备注1。(1)模糊关系矩阵 ,模糊关系矩阵的操作定义如下: 在哪里
(2) 被定义为λ切的关系R。此外, 被定义为 - - - - - -降低矩阵的R的表达式如下:

定义2。(见[10])。让 , ,R是一个模糊关系XY的信息内容R测量如下: 在哪里 的信息内容R限制XY分别与表达式如下: U不确定性的一个还用于测量模糊集的信息内容。

定义3。(见[25])。是一个模糊集合上定义 ,和所有一个(x)(= 1,2,…)可以设计为一个有序的可能性分布 它总是这样 ;然后, 被定义为U不确定性的一个, 是一组的基数,

定义4。(见[20.])。一个模糊蕴涵算子是任何映射:[0,1] [0,1]⟶[0,1]满足边界条件:(P1)∃一个 [0,1],b [0,1],(一个,b)= 1(P2)∃c [0,1],d [0,1],(c,d)= 0此外,(P3)如果(1,0)= 0,(0,1)=(1)=(0,0)= 1,然后我是一个正常的蕴涵算子。否则,它被称为异常蕴涵算子。例如,(1)陈守煜接线员: (2)Kleene-Dienes接线员: (3)Lukasiewicz接线员: (4)赖兴巴赫接线员: (5)Mamdani接线员: (6)概率积算子: (7)R0接线员: (8)Goguen接线员: (9)Gaines-Reseher接线员: (10)狙击兵接线员: (11)有界积算子: (12)哥德尔接线员: (13) 表示两个模糊集的相似度,相似度测量的概念提出如下。

定义5。(见[26,27])。一个真正的函数年代:D D⟶[0,1]叫做相似性度量,在哪里 ,如果年代满足以下属性:(年代1) 如果一个是一套的(年代2) (年代3) (年代4) ,如果 ,然后 例如,让 ,

3所示。区间模糊的信息内容建设的关系

事实上,集成电路(R)可以用来测量传输信息内容由两个模糊集的一个精确值。但是,与不确定性,信息内容的价值两个模糊集之间无法测量精确。例如,当它是测量的最大0.7,最低0.1,它怎么样?有必要延长值区间值的确切数字,然后,间隔的定义提出了信息内容如下:

定义6。 , ,模糊关系的区间信息内容RIIC的映射(R):X YD, 基于U模糊关系的不确定性,间隔信息内容也可以表示如下。

定义7。 , ,R的模糊关系XY, 在降序排名 ,在哪里 ,然后, 区间的信息内容RXY
同样,通过定义3的区间信息内容R也可以构造成吗 然后,我们有

例1。 , ,R的模糊关系XY;的结果R(x,yj)表中列出1
采取IIC1(R例如,我们有 然后,IIC1(R)= [0。2553年,0。3278]。
{R(x,yj)}是降序排名{1,0.7,0.6,0.4,0.3,0};然后, 1= 1, 2= 0.7, 3= 0.6, 4= 0.4, 5= 0.3, = 0 (= 6,7,…,81)。在的情况下 1= 1,的值R1(x,yj)表中列出2
所以, 然后, 同样,我们有

4所示。排名基于区间的模糊含义运营商信息内容

在数据挖掘,从大型数据库中提取规则是必要的,这意味着大量的规则将生成过程中。所以,如何评估这些规则并得到有效和有用的信息通过确定的排名规则已成为数据挖掘领域的新热点。在这里,模糊含义的排名运营商可以实现模糊区间信息内容的关系。让= {1,2、…n}是模糊含义的设置操作符和排名方法定义如下:第一步:计算区间信息内容IIC ()的模糊蕴涵算子(= 1,2,…n)。步骤2:计算possibility-based比较区间信息内容的价值pij,在那里pij=P(IIC () IIC (j))(28]。步骤3:构建区间信息内容possibility-based比较矩阵P,在那里 第四步:让 ,和蕴涵算子的排名是由价值决定的P。也就是说,如果P Pj,然后 j

影响运营商的排名可以通过提取确认间隔信息内容相应的模糊关系,但随着模糊关系矩阵只是针对离散域,它是必要的离散化区间[0,1]除以n部分,也就是说,让 ,和言外之意运营商可以表示为

在这里,四个插入可以采用离散化:9分的平均插入(0到10的范围内),平均插入19分,99分的平均插入,随机插入的9分。由方程(13),影响运营商的区间信息内容1、…13表中列出3

以9分的平均插入在区间[0,1]作为一个例子,间隔信息内容可以构造比较矩阵如下:

然后,

同样,我们有P2= 6.8199,P3= 0,P4= 2.6562,P5= 10,P6= 11,P7= 1.3591,P8= 1.9908,P9= 9,P10= 4.1801,P11= 12,P12= 3.8006,P13= 3.8006;然后,

排名结果显示11,6,5传输大量的信息内容,而3(Luckasiewz运营商)传输最少的信息内容。另外,当平均插入而言,排名的结果1213还不能确定,但可以改进的帮助下随机方法。与不同的插入表中列出所有的结果4。从表4,可以得出的结论是,即使插入不同,排名结果不同,但11,6,5总是传递大量的信息内容,而3(Luckasiewz运营商)传输。事实上,前三个运营商中使用频率较高的模糊系统的建设。然而,几乎没有研究这些运营商的优势建设的模糊控制系统,和排名结果基于区间信息内容提供理论依据上述研究问题。

5。模糊聚类和分类的含义

聚类分析的重点是集群的东西具有类似属性的类别通过提取事物的属性。此外,分类是否合理是一个值得考虑的问题。在本节中,聚类分析进行了13模糊运营商根据区间信息内容的属性,通常用来构造模糊控制系统。后确认最好的分类、使用的相似性度量方法对蕴涵算子的类别进行分类。

5.1。聚类的模糊含义运营商基于区间信息内容

基于相似性度量的区间值模糊含义运营商可以集群利用区间信息内容。让= {1,2、…n}包含有限影响运营商的设置;聚类分析可以进行如下:步骤1:完成间隔信息内容IIC ()(= 1,2,…n)第二步:完成相似性度量 由方程(12)步骤3:构建相似性矩阵 基于区间信息内容第四步:计算传递闭包的矩阵t(年代)步骤5:集群影响运营商的价值λ

同样,四种方法用于分散区间[0,1]:9点的平均插入的平均插入19分,99分的平均插入,随机插入的9分。由方程(12),间隔的信息内容1、…13表中列出3。接下来,以9分的平均插入为例,13 13个相似矩阵年代10基于区间信息内容表示为

此外,传递闭包构造矩阵如下:

上述矩阵中的元素按升序排列{0.6024,0.7387,0.8318,0.8625,0.8721,0.8967,0.9047,0.9174,0.9251,0.9468,0.9905,1},集群可以由上述值,和所有集群的结果列在图1

同样,集群分析平均插入19和99点,以及随机插入的9点,列出数据2- - - - - -4

从上述四个数字,一致性聚类结果分为两类13模糊含义运营商: 因此,它可以被授予最佳类别。根据定义4严格,所有模糊含义运营商可以分为两类。均匀,5,6,11异常的影响,和其他正常的影响。也就是说,优化集群基于区间的模糊含义运营商信息内容分为两大类:正常和不正常的。因此,分类方法是合理的。

5.2。影响运营商的分类

在模式识别的问题,一旦选择最好的分类,它是必要的,以确定哪些类别的分类特性是最接近的样品。对于任何模糊蕴涵算子,在确定最好的分类提取区间信息内容特征,最后证实了类别样本之间的相似性测量影响运营商和每个类别的聚类中心。具体地说,步骤1:计算示例操作符的IIC (I)第二步:由方程(12),计算样本之间的相似性衡量运营商和每个类别的聚类中心,中心的地方th类别 n样本的数量吗th类别步骤3:确定类别根据最大相似原理

例如,1415被选中作为分类的样本运营商:

1415分别是正常和异常的模糊含义运营商。在上述最佳类别下,这两个含义运营商可以分为正确的类别?首先,计算区间信息内容与不同的插入由方程(13),表中列出的结果5

其次,计算它们之间的相似性度量方法和聚类中心,结果如表所示6

从表6,可以看出14总是分为正常影响运营商的类别 15总是分为相反,符合的性质是什么1415正常和异常的暗示。

6。结论

面对大数据的时代,必须处理大量的数据。所以,这是一个关键问题中提取数据的属性。这部小说属性提出了工作可以用来有效地实现规则的排序和聚类。利用区间信息内容,Mamdani概率的产品,比别人更好的排名结果的显示和狙击兵运营商,为运营商提供了坚实的理论基础选择构建模糊系统。聚类问题,通过提取区间信息内容,运营商可以分为两类:正常和不正常的。然后,正确的聚类算子的结果与已知属性证明有效。

在未来,将进行以下工作:(1)如果间隔的公理表示信息数量的模糊关系建立,信息数量的研究将是重要的理论意义(2)定义的区间信息内容,如果它可以应用于数据挖掘优化排名推理规则,它将现实意义来提高模糊系统的准确性

数据可用性

所有的数据已经被包括在手稿中,也没有更多的信息可以提供。

的利益冲突

作者宣称没有利益冲突有关的出版。