Ensemble-Based社区属性约简:Multigranularity视图

文摘

最近,multigranularity一直是一个有趣的话题,因为不同级别的粒度可以提供不同的信息从粒度计算的角度(GrC)。然而,建立研究较少关注调查从multigranularity视图属性约简。本文提出了一个算法基于multigranularity视图。构建一个框架multigranularity属性约简,可以解决两个主要问题如下:(1)multigranularity结构可以首先构造。摘要multigranularity结构将构建基于半径,不同信息粒度可以诱导采用不同的半径。因此,于社区multigranularity可以构造。(2)属性约简可以设计并实现了从multigranularity的角度。不同于传统的过程,通过使用一个固定的粒度计算约简,我们的算法的目标是获得导出从multigranularity的角度。实现新算法,两个主要的执行流程如下:(1)考虑到不同的决策类可能需要不同的关键条件属性,系综选择器应用在不同决策类;(2)加速属性约简的过程中,只使用最好的和粗粒度。 The experiments over 15 UCI data sets are conducted. Compared with the traditional single-granularity approach, the multigranularity algorithm can not only generate reduct which can provide better classification accuracy, but also reduce the elapsed time. This study suggests new trends for considering both the classification accuracy and the time efficiency with respect to the reduct.

1。介绍

到目前为止,属性约简是粗糙集理论的一个关键主题(RST) [1- - - - - -4]。作为一个粗略的基于集合的特征选择,属性约简的目的是降低数据维度与给定的约束。和使用约束可以清楚地解释为近似等被认为是衡量质量(5)和条件熵(6]。事实上,许多研究采用不同的措施,建立设计相应的算法。例如,胡锦涛等。5]研究了不确定性措施相关的模糊粗糙集,然后进一步探讨近似质量优先的属性约简;戴et al。6- - - - - -8)研究了属性约简对几种类型的条件熵。因此,相应的权值实际上是满足约束的条件属性的子集定义使用等措施近似质量和条件熵,分别。

以上这些研究调查了不同类型的属性约简,基于不同的措施,这些措施描述不确定性或区分能力的决策属性通过应用信息提供的条件属性。然而,值得注意的是,他们都集中在一个且只有一个固定的参数在属性约简9- - - - - -11),如固定高斯内核参数模糊粗糙集或邻域粗糙集的固定半径。从粒度计算的角度(GrC) [12- - - - - -16),在粗糙集应用一个且只有一个参数只能反映在一个固定的信息粒度(17- - - - - -19]。因此,在一个固定的属性约简的粒度可以称为单一粒度属性约简。然而,单一粒度属性约简无法满足实际应用的要求。一般来说,单一粒度属性约简的局限性主要可以概括为以下两个方面:(1)单一粒度属性约简未能从多层次(选择属性20.- - - - - -22)或多视图(23,24]。例如,假设一个导出是保护一个给定的信息获得造粒论域,这个原因可能不是仍然原因小细或粗信息造粒的水平可能是由于轻微变化的数据。观点的,如果它是要求获得一个导出具有较高适应性粒度世界由多层或多视图,有必要建立multigranularity视图的属性约简。(2)单一粒度属性减少可能导致获得学习表现不佳。原因来自单一粒度算法可能只获得的能力从一个固定的视线。这主要是因为在固定的信息粒度可能缺乏通用性和全面性。实际上,据报道,考虑到相同的数据集,不同的颗粒可以提供互补的预测能力,学习成绩可能提高结合他们的信息(25,26]。改善学习性能,它可能是一个可行的方法来使用所提供的资料不同的粒度计算约简。因此,有必要通过结合生成一个导出从multigranularity视图的信息。

为了克服上述限制,有必要建立multigranularity视图的属性约简。它包含两个过程总结如下:(1)构建multigranularity在RST的结构。摘要multigranularity结构将通过使用构造不同的半径。在报道16,27],radius-based附近形成一个信息粒,然后于社区的单一粒度可以通过构造一个且只有一个半径,这是基于社区的multigranularity可以通过构造一组不同的半径。在这个过程中,应用一个较小的半径将生成一个细信息粒而申请更大的半径将生成一个粗信息粒。信息的不同尺度的颗粒可以提供我们multigranularity基于社区粗糙近似的结果(25,28]。因此,邻域粗糙集的multigranularity自然是获得结构。(2)设计一个框架来实现属性约简从multigranularity视图。信息论的MultiGranularity视图(MG-VCR)是实现新算法,构造和MG-VCR机制主要面临两个开放问题,可以显示如下:(1)如何选择候选属性:一般来说,所有的决定类被认为是作为工会的传统工艺计算权值,这可以看作是全局视图(29日]。然而,传统的方法较少关注关键不同条件属性与决策类。换句话说,原因来自传统方法可能导致的改进决策类的恶化其他决策类。为了填补这种空白,我们将应用系综选择器(30.从本地视图)。,新战略关注的关键条件属性相关的不同决定类(31日]。此外,大多数投票策略是受雇于合奏选择器在不同决策类属性选择候选人。(2)如何选择粒度:从传统的单一粒度算法不同,重点解决固定问题在一个给定的粒度,multigranularity属性约简是一个框架,从一个新的角度处理信息。实际上,multigranularity属性约简可以考虑不同粒度的不同生成multigranularity导出。一般来说,一个自然的方式找到multigranularity导出是生成半群的一个接一个的每个粒度。不过,采用粒度生成中的可能过于耗时的粒度增加数量。提高时间效率,给定一组粒度,融合在一些粒度的信息可能是一个有趣的尝试,比如只有最好的粒度和粗粒度应用。

从上面的讨论中,本文的目的是构建一个框架,该框架不仅可以考虑不同决策类的需求也从multigranularity视图实现属性约简。首先,从不同的角度来选择属性决定类,一个选择器(30.与多数投票策略应用。另一方面,实现属性约简从multigranularity来看,一系列的半径是用来构建基于社区的multigranularity,然后将设计新的属性约简的multigranularity视图。系综选择器选择不同决策的关键条件属性类,和multigranularity视图可以提供新策略能力相关的原因。立刻,所有的过程构建multigranularity属性约简在以下三个步骤:(1)首先,multigranularity结构构造的radius-based社区。应用一组半径按升序排序,然后可以获得不同粒度,即。,可以构建基于社区的multigranularity。(2)其次,信息论加速的过程中,最好的粒度和粗粒度,而不是所有粒度。(3)最后,适应度函数是用来计算导出搜索策略。在每个迭代中,候选属性可以从全部或大部分的决定类。在这个过程中,绝大多数投票策略是用来确定哪些属性被添加到潜在的原因。

主要贡献的工作可以概括为以下几个方面:(1)构建基于社区multigranularity给予不同的半径有关;(2)设计multigranularity视图的属性约简;(3)结合的整体战略multigranularity属性约简;(4)实验结果进行15日UCI数据集,和实验分析表明,我们的算法可以有效classification-oriented属性约简计算生成半群和高效。

本文的结构组织如下。节2之后,一些基本概念邻域粗糙集,构造了基于社区的multigranularity。节3,常用的措施,提出了传统属性约简。部分4介绍了系综选择器从本地视图到传统框架首先,然后是信息论基础视图(MG-VCR)。实验结果和相应的分析部分所示5。未来研究我们得出的一些言论和观点的部分6。

2。于社区Multigranularity

在粗糙集理论中,社区(32)是一种有效的方式实现信息粒。它不仅意味着一种简单的方式来表达信息颗粒也给我们提供了一个自然方向构造multigranularity的概念。

类似于其他粗糙集理论(31日,33- - - - - -36),邻域粗糙集也可以在一个决策系统,这样形成的 :U的样本,被称为宇宙;是描述属性的条件属性集的样本;D是标签样本的决策属性集。注意,单一的决策属性的问题主要是本文中讨论。因此,我们使用在这d的被认为是单一的决策属性。和表示样本的标签或决定价值x。假设标签样本的类别,然后一个等价关系d可以这样定义 ,通过 ,一组类可以获得这样的决定。此外,被称为p在粗糙集理论th决定类。特别,决定类包含样例x用。

定义1。给定一个决策系统 , ,考虑一个半径δ可以被定义为,那么邻居关系在哪里样本之间的距离吗x和y通过使用提供的信息一个。请注意,本文采用欧氏距离。
在方程(1),不难构造样本的社区x这样

定义2。给定一个决策系统 , , 和 ,附近的上下近似而言,一个被定义为从GrC的观点,也可以被视为于社区的信息粒(37- - - - - -39]。显然,不同的价值观δ可以产生不同的结果。假设一组的半径以升序排序,然后给出一个示例 ,一组的社区x是这样吗。这些不同尺度的社区意味着结构multigranularity [25,37,40)(在本文中,一个社区和粒度是等价的条件)。这主要是因为一个小社区表达细的粒度,而更大的社区表达一个粗粒度。细节可以称为图1。
图1向我们展示了附近的变化与半径增加。应该注意到,在真实的应用程序中,样品在给定的决策系统的过程n属性,然后可以显示在相应的社区n维的情况。为了简化描述,图1显示在二维情况下画。在sub-figure1,给定一个半径 ,样品在附近的测试样品y;在sub-figure1,半径增大 ,然后更多的样本,即。、样品和 ,包括在附近吗y; ;最后,如果半径增大在sub-figure1这样,那么更多的样品落入的社区y。在这个过程中,sub-figure1意味着最好的粒度和sub-figure1暗示了粗粒度。
正如所指出的图1,应用不同的半径可以生成不同的粒度,然后multigranularity multigranularity下近似和上近似可以通过使用不同的半径,可以显示为细节表情

3所示。属性约简

3.1。一些措施

通过考虑于社区的信息粒之间的关系和决策类,很多措施已经在邻域粗糙集理论探讨,特别是对于描述不确定性和于社区的属性约简。在本节中,四个措施将得到解决。

近似质量是最常用的措施之一,它可以用来评估的确定性归属感通过使用较低的粗糙集模型中近似的解释。近似质量的正式定义如下所示。

定义3。(41给定一个决策系统 , , ,的近似质量d关于一个被定义为在哪里表示集合的基数。
近似质量反映了样本的百分比也属于一种决策类的解释较低的近似。因此,价值的近似质量越大,程度越高的解释一定的归属感降低RST的近似。
条件熵是另一个被广泛接受的测量可以描述条件属性与决策属性的识别能力。目前,对于不同的需求,提出了各种条件熵的定义(6- - - - - -8,42- - - - - -44]。条件熵的一个典型的形式如下所示。

定义4。(44给定一个决策系统 , ,条件熵d关于一个被定义为在对数的底“日志”是2。
条件熵的值越低,越高的识别能力条件属性与决策属性。
类似条件熵,邻居歧视指数(45)也可以用来描述的能力条件属性区分样品用不同的标签。然而,基于条件熵要求社区信息颗粒来自社区的关系,并获得每个样本的社区邻里关系是耗时的。提高时间效率,王et al。45)提出了社区歧视指数的测量,可以直接获得的邻里关系,而不是社区。歧视,社区的正式定义索引可以显示如下。

定义5。(45给定一个决策系统 , ,附近的歧视指数d关于一个被定义为社区歧视指数的值越低,越高的识别能力条件属性与决策属性。
另一个测量应该追究是社区决策错误率(雄鹿),提出了胡锦涛et al。(5]。雄鹿通常用于评估社区分类器的分类性能(NEC) (46在邻域粗糙集理论。立即,雄鹿的正式定义可以定义为。

定义6。(47给定一个决策系统 , ,邻居的决策错误率d关于一个被定义为在哪里预测样本的标签吗x来自使用分类器。
社区决策错误率显示分类错误的样本的比例使用分类器。

3.2。属性约简

属性约简(48- - - - - -53]在粗糙集的一个关键主题。一般来说,属性约简的目的是通过给定的约束,删除冗余属性和约束可以构造近似质量和条件熵等措施。到目前为止,许多不同类型的属性约简对不同的需求已经被研究者探索。然而,它可以发现这些属性约简的定义可能也有类似的结构。,属性约简的一般形式54,55可以显示如下。

定义7。给定一个决策系统 , ,δ是一个给定的半径,一个被称为半群的措施ψ当且仅当(1)一个满足ψ约束(2) , 不符合ψ约束在定义7中,ψ是一个给定的测量,可以“γ”、“E”、“H”或“雄鹿”。它是指出ψ约束应随使用的措施ψ,这可以进一步分为两个方面:(1)如果一个更大的价值是通过使用测量要求ψ(如 ),然后ψ约束可以设置为没有获得的价值低于使用原始的属性集,也就是说, (2)如果一个较低的值是通过使用测量要求ψ(如 ),然后ψ约束可以设置为没有获得更大的价值比使用原始的属性集,也就是说, 不仅属性约简的定义有相似的结构,还可以派生的权值相似的搜索策略。经常使用的两个主要的策略来计算权值,即:,exhaustive searching strategy and fitness function-based searching strategy. The former one is computationally more expensive than the latter one when dealing with data with the rapidly growing scale of samples, and the latter one is usually adopted due to its computational efficiency. It is mainly because different from the exhaustive strategy, fitness function-based searching strategy applies the greedy mechanism to compute reduct. Therefore, the reducts with respect to the measures shown in Section3.1将计算类似健身基于函数的搜索策略。实现健身基于函数的搜索策略,评估所需的意义是属性的重要性。然后,属性的重要性可以如下所示: 在哪里通过使用信息价值结束了吗一个而言,d使用这项措施ψ。所示的意义功能equatuon (9)表明,更大的价值 ,更重要的属性被添加到一个;而重要性函数方程所示(10)表明,较低的值 ,更重要的属性被添加到一个。
作为健身的一个常用的方法基于函数的搜索策略,添加方法(30.,47始于一个空集,然后选择最大意义到潜在的属性约简在每个迭代,直到满足约束。然后,在以下的情况下,我们将使用添加方法来进一步实现健身基于函数的搜索策略,信息论的措施ψ。然后,添加方法计算权值算法所示1。
显然,这是简单的计算,算法的时间复杂度1是。这可以归因于以下两个方面:(1)计算的时间复杂度邻里关系因为任何两个样品U应该申请计算距离;(2)在最坏的情况下,不可以删除从原始属性,然后迭代应该执行步骤3所示次,在我th迭代,将执行步骤3次了。最后,算法的时间复杂度1是。

	输入:决策系统 ,半径δ。
	输出:原因:一个。
	(1) ;
	(2)计算 ;
	(3)做
	(1) ,计算 ,选择b这样 ;
	(2) ;
	直到一个满足给定的ψ约束;
	(4)返回一个。

4所示。从Multigranularity视图Ensemble-Based属性约简

4.1。Ensemble-Based属性约简

一般来说,它是观察到的算法计算权值可以作为一个搜索的过程称为属性。我们可以看到从算法1当选择属性,决定类视为联盟(全局视图),但不同的决策类的需求没有充分考虑。换句话说,可以更多的关注的关键条件属性相关的不同决策类(本地视图)。

目前,人们越来越意识到本地视图在粗糙集理论。这主要是因为当地的观点可能不仅为我们提供更详细的数据,还提供我们一个方向研究结构对不同决策类之间的关系。例如,陈和赵29日]提出的概念当地措施和调查当地属性约简的结构模糊粗糙集决策系统,它提供了一个新的见解属性约简的问题。这种策略后,歌曲等。31日)调查了当地的属性约简从决策成本的角度,不同的传统方法,被认为是所有决策类从全球来看,他们关注的属性与一个给定的联系密切的决定比其他的类。药家鑫和张(53)研究了基于分类属性约简之间的关系(全局视图)和职业专用属性约简(本地视图)。尽管一些以前的结果对当地方法探索在粗糙集理论中,很少人关注整体策略从本地视图。因此,考虑不同决策类的不同的需求,从当地的整体战略观点可能是一个可行的解决方案。立即,当地的措施(56)和整体策略从本地视图可以在以下环境。

流定义8将显示当地的措施,和相对应的四个地方措施措施部分所示3.1可以被定义为

定义8。给定一个决策系统 , , , ,(1)当地的近似质量关于一个是 (2)当地的条件熵关于一个是 (3)当地社区歧视指数关于一个是 (4)当地社区决策错误率关于一个是不同的措施部分所示3.1,当地的措施只适用于特定的决策类而不是一起决定类。例如,近似质量部分所示3.1反映了样本的百分比也属于一个近似决定类的低,而当地的近似质量反映了样本的百分比也属于决策类通过相应的较低的近似。此外,决定类的意义也可以显示如下: 对意义显示属性的重要性程度个人决定的。同样,方程(11)和(12)适用于不同地方的措施;如果要求更大的价值,然后方程(11)应用;否则,方程(12)是应用。
以上地方提出了措施和意义,然后从当地整体战略视图将被应用到信息论的过程。这个过程包含两个关键步骤如下所示:(1)每个决策类选择一个属性的最大价值意义本身在每个迭代中(2)绝大多数投票是用来确定哪些属性被添加到潜在的原因。是注意到最高的属性频率选为候选属性每个迭代中,如果有一个以上的最高频率相同的属性,该属性排名低/最低将被选中把导出的近似质量作为一个例子,属性选择的最大增长近似质量在每个迭代中使用的算法1;在新的ensemble-based算法,大部分的属性与最大增长较低的近似(本地近似质量)类选择不同的决定。原因来自于,如果大多数决定类的下近似的增加,那么近似质量联盟也可以增加。下面的示例将显示总体战略的过程在不同的决策类。

例1。表中所示的决策系统1, 是一组样本, 的条件属性集,d决策属性。
获得, ,和 , ,和。
采取的措施”γ“作为一个例子,假设 ,如果使用,那么获得呢。
如果算法1应用,那么获得导出是吗作为。立即, , ,和可以获得。如果采用整体战略过程中计算权值,然后导出是获得。实际上,在这个新的的第一次迭代过程中,属性的最大值对决策类的意义是 ,分别。这一次的三个属性具有相同的频率。作为在第一次迭代排名最低添加到潜在的原因。在接下来的迭代中,选中的属性决定的是 ,分别,然后是频率最高的属性。因此,添加到潜在的原因。此外,约束是满意的。立即, , ,和可以获得。
可以看出与算法1,整体策略,那么当地的值近似质量对决策类已经增加,当地的值近似质量对决策类和保持不变。上面的结果告诉我们,整体战略在不同决策类可以保持或提高一个决定类的性能。类似的机制,可以申请其他措施。


ID							d

1	0.1419	0.8147	0.1576	0.0975	0.6557	0.7577	1
2	0.0357	0.9058	0.9706	0.2785	0.5357	0.7431	1
3	0.3922	0.5469	0.9572	0.5469	0.8491	0.9157	2
4	0.6555	0.6553	0.4854	0.7922	0.9340	0.7922	2
5	0.3721	0.6354	0.5432	0.8344	0.6787	0.9595	2
6	0.7922	0.3429	0.9572	0.9595	0.5768	0.0561	3

4.2。Multigranularity属性约简

算法1显示了生成的过程中的一个且只有一个粒度,即。从单一粒度视图,该算法。指出在节1,单一粒度属性约简有一些固有的局限性。因此,在以下情况下,可以注意到multigranularity属性约简。,实现multigranularity属性约简是由两个关键过程:(1)构建multigranularity RST结构;(2)实现从multigranularity视图属性约简。如部分所示2给定一组半径以升序排序,由此可见,不同的社区可以通过构造不同的半径。此外,multigranularity结构(28,40,57可以构造。然后,multigranularity属性约简可以在以下情况下设计的。

定义9。给定一个决策系统 , , ,一套升序排序 ,一个被称为multigranularity导出的措施ψ当且仅当(1)一个满足 - - - - - -约束(2) , 不符合 - - - - - -约束类似于定义7,这项措施ψ也可以”γ”、“E”、“H”或“雄鹿”, - - - - - -约束是一个multigranularity约束,也应随使用的措施ψ。但是,结果应满足multigranularity约束而不是单一粒度。让我们看看multigranularity约束;一个简单的方法来设计multigranularity约束是融合所有的约束(25)对所有的粒度。然而,它将给我们两个挑战:(1)融合的复杂性约束会降低还原过程的速度;(2)太多的约束将导致难以消除的属性。因此,为了克服上述限制,我们将开发一个很快的过程基于融合相关最好和粗粒度。这主要是因为,对于一个给定的测试样本,应用最好的粒度,最少的邻居获得和应用粗粒度,最社区。这个性能也可以清楚地看到从图1节2。
部分4所示。1显示了ensemble-based属性约简与多数投票策略,部分的上下文分析multigranularity视图,然后新算法将把multigranularity视图与整体策略结合在一起。新算法将称为信息论基础视图(MG-VCR)。类似于算法1通过使用添加方法,MG-VCR计算权值。然而,有两个主要的差异总结如下:(1)MG-VCR选择属性从不同决策类的观点而不是联盟,和绝大多数投票策略的系综选择器是用来选择候选属性(2)multigranularity视图将受雇于MG-VCR,只有最好的粒度和粗粒度应用,然后给出一组半径 ,只有和用于计算权值的过程。第一个给出了一个通用框架如何选择候选属性,和第二个节目MG-VCR策略如何选择粒度。然后,详细的过程使用的方法将设计如下:
在算法2信息论的时间复杂度 ,在这问是决定类的数目。第三步是关键的过程中计算权值,应该强调的是上下文显示如下:(1)最好的和每个占重量的粗粒度实现multigranularity视图和条件成立。(2)(我)的过程不同决策之间的系综选择器类 ;(2)绝大多数投票机制用于选择候选属性。指出,“Psig”是相关的加权平均值决定类” 。”在这个过程中,我们首先计算加权平均的值与每个决策类通过使用最好的粒度和粗粒度,然后示例1中所示的ensemble-based策略可以应用于选择合适的属性。(3)multigranularity约束( - - - - - -约束)需要融合的价值满足约束的融合值 ,分别。考虑不同的粒度可以融合的加权平均值或谐波均值,等。注意到加权平均值是用于我们的实验。最后,它注意到,如果只有一个粒度是使用在这个过程中,该算法将退化成单一粒度的过程,即信息论,单一粒度视图(SG-VCR)。考虑到半径设置 ,SG-VCR应该执行n*获取权值,而MG-VCR只需要执行一个可减少运行时间,因为它适用于multigranularity视图。
下面的例子向我们展示了一个通用的过程的多粒度视图信息论(MG-VCR)。假设 ,和( )。

	输入:决策系统 , ,一组半径。
	输出:multigranularity导出:一个。
	(1) ;
	(2)计算 ;
	(3)做
	(1)为来问
	,计算 ;
	, ;
	;
	结束
	(2)记录每个属性的频率并选择一个最高的频率:b;
	(3) ;
	(4)计算 ;
	直到一个满足 - - - - - -约束;
	(4)返回一个。

例2。表中所示的决策系统1,以近似质量为例可以获得,那么融合值的原始属性( )是0.5000。
它也指出,属性的意义融合值(加权平均的值)。作为可以获得,计算每个属性的意义将获得3倍的重要性程度与每个决策类。立即,最重要的属性将获得每个决策相关的类。在这个过程中,最大的属性融合的价值意义决定的是 ,分别。然后,添加到潜在的原因(一个)使用绝大多数投票策略。这个示例1所示采用相同的策略。
然后,我们应该知道潜在的导出满足 - - - - - -约束。最后,正如可以获得,融合值的吗一个是0.5834比融合值的原始属性。因此,约简的算法2是。

5。实验分析

在本节中,验证的有效性MG-VCR提出本文15 UCI数据集被用来进行实验。数据信息的基本描述如表所示2。所有的实验都进行个人电脑与Windows 7,双核1.50 GHz CPU, 8 GB的内存。MATLAB R2016a编程语言。


ID	数据集	样品	属性	决策类

1	乳腺癌的威斯康辛州(诊断)	569年	30.	2
2	乳腺组织	106年	9	6
3	气候模型模拟崩溃	540年	20.	2
4	皮肤病学	366年	34	6
5	生育能力	One hundred.	9	2
6	森林类型映射	523年	27	4
7	手势分割阶段	9901年	18	5
8	电离层	351年	34	2
9	分子生物学(启动子基因序列)	106年	57	2
10	构象生物降解	1055年	41	2
11	种子	210年	7	3
12	Statlog(德国信贷数据)	1000年	24	2
13	脊柱	310年	6	2
14	酒	178年	13	3
15	葡萄酒的质量	6497年	11	7

5倍交叉验证(5-CV)是用于评估提出了新算法的有效性。5-CV所有样本分为5组相同的大小,然后四组构成训练集来计算约简,而一组组成的测试集获得的结果的比较。算法过程重复5次,记录平均值。此外,在前面的作品(30.,58),它已经被实验证明了是一个最佳的候选人区间半径,大部分的分类器可以获得良好的分类性能;为此,10个不同的值δ这样被选中。SG-VCR,所有10半径将被用来计算权值。只有最好的和粗粒度是受雇于MG-VCR,应用的半径是0.03和0.30,重量值设置为( )摘要;应该强调,MG-VCR只获得一个导出使用给定的半径。

在以下的情况下,“单一粒度算法”和“multigranularity算法可以应用于信息论表示单一粒度视图的算法(SG-VCR)和信息论基础视图(MG-VCR),分别。有关不同的权值,结果可分为两种类型。(1)应用程序,花,说,犯错表示结果相关的原因来自单一粒度算法的近似质量、条件熵,邻居歧视指数,分别和社区决策错误率。这些权值可以集体称为单一粒度权值。(2)MGAPP, MGENT、MGDIS MGERR表示结果与相应的原因来源于multigranularity算法的近似质量、条件熵,社区歧视指数,分别和社区决策错误率。这些权值可以集体称为multigranularity权值。

5.1。权值的长度之间的比较

表3显示之间权值的长度、和权值是来自单一粒度算法和multigranularity算法的不同措施。


ID	应用程序	MGAPP	ENT	MGENT	说	MGDIS	犯错	MGERR

1	4.5000	4.0000	2.4400	3.2000	30.0000	25.0000	21.5200	18.6000
2	2.4800	5.0000	1.8600	2.2000	1.0200	4.2000	2.8400	5.2000
3	4.4400	5.0000	2.5600	3.0000	20.0000	9.6000	1.5800	1.0000
4	13.4200	18.2000	7.0400	11.8000	32.1600	26.8000	21.9600	32.8000
5	7.0200	7.4000	7.3800	8.0000	9.0000	8.4000	1.1000	1.0000
6	11.3400	18.0000	3.8600	11.0000	13.6400	19.2000	9.0000	7.8000
7	3.1600	7.8000	3.7800	6.2000	18.0000	16.2000	5.0400	8.6000
8	9.5600	7.0000	1.4200	3.0000	12.8600	6.2000	2.4200	3.8000
9	2.8800	4.4000	2.0000	2.6000	7.0000	7.0000	2.0000	3.0000
10	10.3600	18.2000	4.9200	10.8000	16.8200	34.4000	17.3200	21.2000
11	3.1000	3.8000	3.3400	4.0000	7.0000	6.2000	7.0000	4.0000
12	11.0600	10.8000	10.5000	11.0000	24.0000	12.6000	3.1000	2.2000
13	4.0800	3.6000	2.2000	4.2000	5.5000	6.0000	3.5600	4.2000
14	6.4780	5.2000	4.9200	6.0000	13.0000	12.2000	10.7400	11.0000
15	6.2400	7.6000	4.1800	6.6000	1.0000	8.2000	1.0000	1.0000
Avg	6.6745	8.4000	4.1600	6.2400	14.0600	13.4800	7.3453	8.3600

仔细的调查表格3,不难观察以下。

在长度方面,来自multigranularity算法权值大于那些来自单一粒度算法一般。换句话说,更多的属性被添加到导出设置使用multigranularity算法。虽然可能存在一些波动措施之间的“说”和“MGDIS”长度之间的差异对“说”和“MGDIS”是不明显的。此外,最后一行的平均值可以证明权值来源于multigranularity算法需要更多的属性被添加到导出比单一粒度算法。总之,multigranularity算法几乎可以配合的单一粒度算法权值的长度。

5.2。比较消耗时间

表4显示运行时间之间的比较与单一粒度算法和multigranularity算法的不同措施。应该注意到,单一粒度算法的运行时间的求和过程通过使用相关的约束10粒度,multigranularity算法的运行时间是一个进程使用融合约束与最好的粒度和粗粒度。在这个实验中,获得的multigranularity导出将代表所有的权值与给定的粒度,和最好的粒度和粗粒度只是用来选择属性。因此,multigranularity导出是超过使用粒度相关的原因,而且它将在所有给定的10粒度。此外,时间的单位是“年代”。


ID	应用程序	MGAPP	ENT	MGENT	说	MGDIS	犯错	MGERR

1	71.4247	13.7473	66.0414	11.1967	301.0050	50.9976	220.0193	39.6363
2	0.6136	0.2186	1.1509	0.1183	0.2982	0.1915	0.7021	0.2427
3	32.0207	7.0614	33.5664	4.7105	88.3461	11.0420	11.6320	1.5377
4	127.4708	31.6491	124.9537	22.5923	209.1630	38.6443	173.5181	41.5509
5	0.5358	0.1365	1.2395	0.1694	0.6159	0.1107	0.1189	0.0436
6	213.2737	60.5530	139.8738	45.7522	196.7573	60.2659	191.1344	35.8713
7	3.9206E+ 03	1.8569 e+03	1.1352E+ 04	1.4564 e+03	1.5761E+ 04	2.8735 e+03	4.6174E+ 04	1.3484 e+04
8	43.4906	7.0300	14.2405	3.1897	99.5249	6.4197	12.1248	3.8759
9	0.7876	0.2522	2.5775	0.1462	10.2326	2.0908	1.5736	0.4877
10	280.6782	54.6040	341.0450	72.6792	118.3220	31.5351	675.3199	150.4289
11	2.7859	0.4199	3.1873	0.4339	3.1362	0.5318	2.1888	0.4149
12	358.8993	75.2890	513.9914	69.0625	537.2714	75.0350	110.9560	15.7937
13	2.7859	0.5061	3.1873	0.5695	3.1362	0.6182	2.1888	0.5042
14	4.8653	0.9244	7.3322	0.9314	6.6377	1.3385	5.8532	1.2405
15	2.3221E+ 04	1.6156 e+04	5.0364E+ 04	5.7845 e+03	3.5816 e+03	1.7434E+ 04	3.5871E+ 03	673.4737
Avg	1885.4155	1217.6861	4197.8925	498.1635	1394.4698	1372.4214	3411.2287	963.2735

较低的值是斜体。

仔细的调查表格4不难观察到以下:(1)multigranularity算法与相应的单一粒度算法需要的时间更少。此外,单一粒度算法的总运行时间的所有固定半径是5倍multigranularity算法的运行时间。这主要是因为单一粒度算法应用计算权值的所有给定granularitities而multigranularity算法仅应用最好的粒度和粗粒度。(2)还存在一个例外:在数据集“葡萄酒质量”(ID: 15),计算机的运行时间大于计算“MGDIS说。“这主要属性太大价值的长度;这可以观察表3;“MGDIS”几乎是8倍,只要“说”。(3)此外,平均运行时间列在最后一行表明multigranularity算法比单一粒度算法需要更少的时间。总之,在表的时间4表明multigranularity算法可以提高时间效率与单一粒度算法。

5.3。比较使用NEC的分类精度

图2向我们展示了分类精度之间的比较对单一粒度权值和multigranularity使用NEC权值。有人指出multigranularity算法获得一个multigranularity导出,这原因将代表所有相关的权值n(n在我们实验)粒度= 10。因此,一个multigranularity导出将使用所有的粒度。在下面的图表X设在代表不同的权值,Y设在代表相应的值的分类精度。

(一)

(b)

(c)

(d)

(e)

(f)

(g)

(h)

(我)

(j)

(k)

(左)

(m)

(n)

(o)

图2

比较使用NEC的分类精度。(一)乳腺癌威斯康辛州(诊断)。(b)乳房组织。(c)气候模型模拟崩溃。(d)皮肤病。(e)生育能力。(f)森林类型映射。(g)的手势分割阶段。电离层(h)。(我)分子生物学(启动子基因序列)。 (j) QSAR Biodegradation. (k) Seeds. (l) Statlog (German Credit Data). (m) Vertebral Column. (n) Wine. (o) Wine Quality.

仔细调查图2不难观察到以下:(1)multigranularity的权值可以提高分类精度较单一粒度权值。“电离层”的数据集(ID: 8)为例,分类精度的平均值由单一粒度权值是0.8800,0.8726,0.8074,0.8686使用应用程序,花,说,和犯错。虽然分类精度的平均值来源于multigranularity权值是0.9057,0.9154,0.8646,和0.9023使用MGAPP MGENT, MGDIS和MGERR分别。这表明multigranularity视图的属性约简可以提高分类精度。(2)数据集内的“葡萄酒质量”(ID: 15),导出表中所示的长度3表明更多的属性被添加到导出设置使用原因”说,“虽然分类精度的平均值而言,“MGDIS”也比价值更大”说。”此外,multigranularity权值通常可以提高分类的性能比单一粒度的权值。这可能表明,尽管存在一些差异在不同的粒度、考虑最好的和粗粒度可能是一个可行的方法引入multigranularity的属性约简。

表5显示分类精度之间的比较相关的原始属性,单一粒度权值,和multigranularity权值。庆贺的读者,分类精度的最大价值是粗体,斜体的最小值。

生

应用程序

MGAPP

生

ENT

MGENT

生

说

MGDIS

生

犯错

MGERR

0.9232

0.9204

0.9401

0.9232

0.9337

0.9489

0.9232

0.9232

0.9253

0.9232

0.9211

0.9253

0.5038

0.5104

0.5125

0.5038

0.5389

0.5600

0.5038

0.3748

0.5204

0.5038

0.5131

0.5176

0.9052

0.9037

0.9019

0.9052

0.9211

0.9274

0.9052

0.9133

0.9052

0.9107

0.9111

0.9557

0.9181

0.9373

0.9557

0.9339

0.9561

0.9557

0.9406

0.9470

0.9557

0.9432

0.9575

0.8380

0.8300

0.8440

0.8380

0.8280

0.8400

0.8380

0.8380

0.8320

0.8380

0.8600

0.7871

0.7794

0.7843

0.7871

0.8030

0.8156

0.7871

0.6843

0.7821

0.7871

0.7965

0.7843

0.5454

0.4987

0.5580

0.5454

0.5634

0.5743

0.5454

0.5497

0.5454

0.5602

0.5678

0.8057

0.8800

0.9057

0.8057

0.8726

0.9154

0.8057

0.8074

0.8646

0.8057

0.8686

0.9023

0.7235

0.6729

0.7402

0.7235

0.8235

0.8431

0.7235

0.7235

0.7644

0.7500

0.8089

0.7688

0.8241

0.8089

0.8158

0.8339

0.8089

0.7762

0.8068

0.8089

0.8017

0.9124

0.8886

0.8905

0.9124

0.8943

0.9038

0.9124

0.9171

0.9124

0.8990

0.6986

0.7090

0.7172

0.6986

0.7120

0.7038

0.6986

0.6985

0.6926

0.6986

0.7134

0.7144

0.7639

0.7510

0.7871

0.7639

0.7794

0.7800

0.7639

0.7619

0.7639

0.7639

0.7768

0.6935

0.9733

0.9631

0.9811

0.9733

0.9722

0.9656

0.9733

0.9756

0.9733

0.9610

0.9675

0.5500

0.5246

0.5596

0.5500

0.5574

0.5500

0.4779

0.5507

0.5500

0.4469

AVG

0.7597

0.7679

0.7922

0.7597

0.7961

0.8084

0.7597

0.7562

0.7843

0.7597

0.7029

0.7799

最大的值是粗体,斜体的最小值。

仔细的调查表格5不难观察到以下:(1)至于测量相关近似质量和社区歧视指数之间的比较,最大的价值往往是multigranularity导出有关,和最小的价值往往是一个单一粒度相关原因。它意味着过度拟合59使用这些单一粒度)可能发生在大多数数据集的权值。换句话说,单一粒度在训练样本权值执行比原始属性但执行糟糕的测试样品。(2)至于测量条件熵和相关社区决策错误率之间的比较,最大的价值往往是multigranularity导出有关,和最小的价值趋向于一个相关的原始属性。(3)总之,是否singe-granularity中的表现良好与否,multigranularity的权值可以提高分类的性能。

本节中所示的结果表明multigranularity视图可能会建议改善分类性能的新趋势与权值有关。

此外,Wilcoxon等级测试方法将用于比较和分布对分类精度源自于单一粒度算法和multigranularity算法。我们比较的目的是试图拒绝零假设,分类精度的分布明显不同。假设阈值设置为0.05,如果该值大于0.05,然后我们拒绝零假设,即。分类精度的分布是相似的。

它是观察从表6获得的值一般大于0.05。至于获得值小于0.05,我们可以找到从图2的平均值对multigranularity权值大于那些对单一粒度的权值。“葡萄酒品质”的数据集(ID: 15)作为一个例子,”说的比较MGDIS”方法的结果小于0.05,但分类精度的平均值的“说”和“MGDIS”分别是0.4779和0.5507。唯一的例外是数据集“脊柱”(ID: 13),在“犯错的比较MGERR”均值分类精度的“犯错”和“MGERR”分别是0.7768和0.6935。总之,这两个发行版之间的显著差异不大的分类精度,和multigranularity权值甚至提高分类性能比单一粒度权值。


ID	应用程序MGAPP	ENTMGENT	说MGDIS	犯错MGERR

1	0.1986	0.1503	0.7911	0.9397
2	0.5952	0.4717	0.1116	0.7617
3	0.3944	0.2516	0.0430	0.3681
4	0.0153	0.0481	0.7321	0.0252
5	0.0934	0.1115	0.9668	0.3681
6	0.7054	0.5851	0.1212	0.5706
7	0.3256	0.8205	0.6232	0.8501
8	0.0814	0.0298	0.0954	0.8474
9	0.0045	0.0510	1.0000	0.2043
10	0.2718	0.0339	0.6500	0.4707
11	1.0000	0.2685	0.5593	0.0636
12	0.1291	0.2558	0.6494	0.9396
13	0.2395	0.9095	0.9694	0.0071
14	0.0098	0.3777	0.7793	0.8780
15	0.4055	0.7913	3.2984 e−04	1.0000
Avg	0.2834	0.3645	0.5166	0.5862

斜体的值小于0.05。

5.4。比较在使用支持向量机分类精度和购物车

进一步验证multigranularity算法的有效性,其他两个流行的分类器也应用支持向量机(60- - - - - -62年和车63年]。比较可行的,平均分类精度对单一粒度10值约简计算的响应。

表7和8显示分类精度之间的比较对原始属性,单一粒度的权值,和multigranularity中的使用SVM和车,分别。庆贺的读者,分类精度的最大价值是粗体,斜体的最小值。

生

应用程序

MGAPP

生

ENT

MGENT

生

说

MGDIS

生

犯错

MGERR

0.9471

0.9422

0.9543

0.9471

0.9365

0.9507

0.9471

0.9436

0.9471

0.9468

0.9365

0.4909

0.4413

0.4364

0.4909

0.5527

0.5345

0.4909

0.3284

0.5873

0.4909

0.5020

0.4709

0.9407

0.9152

0.9074

0.9407

0.9296

0.9444

0.9407

0.9222

0.9407

0.9126

0.9111

0.9671

0.9343

0.9671

0.9380

0.9398

0.9671

0.9432

0.9272

0.9671

0.9518

0.9671

0.8600

0.8282

0.8354

0.8282

0.8282

0.8166

0.8549

0.8282

0.6704

0.8282

0.8282

0.8437

0.8472

0.5465

0.4084

0.5446

0.5465

0.4912

0.5267

0.5465

0.5438

0.5465

0.4967

0.5446

0.9314

0.8886

0.9143

0.9314

0.8611

0.8857

0.9314

0.9274

0.8571

0.9314

0.8669

0.8914

0.6909

0.6204

0.5709

0.6909

0.6862

0.6709

0.6909

0.6909

0.6342

0.7273

0.8315

0.7873

0.8201

0.8315

0.8226

0.8296

0.8315

0.7605

0.8201

0.8315

0.8248

0.8125

0.9048

0.8914

0.8952

0.9048

0.9000

0.9048

0.9048

0.9143

0.7480

0.7382

0.7480

0.7480

0.7400

0.7500

0.7480

0.7300

0.7480

0.7124

0.7100

0.8323

0.7748

0.8000

0.8323

0.7600

0.8194

0.8323

0.8142

0.8323

0.7832

0.8323

0.9889

0.9800

0.9778

0.9889

0.9822

0.9667

0.9889

0.9767

0.9778

0.5402

0.5001

0.5349

0.5402

0.5259

0.5297

0.5402

0.4797

0.5383

0.5402

0.4444

Avg

0.8032

0.7678

0.7839

0.8032

0.7868

0.7979

0.8032

0.7700

0.8013

0.8032

0.7774

0.7898

最大的值是粗体,斜体的最小值。

生

应用程序

MGAPP

生

ENT

MGENT

生

说

MGDIS

生

犯错

MGERR

0.9122

0.9154

0.9365

0.9122

0.9148

0.9259

0.9122

0.9297

0.9122

0.9206

0.6273

0.5253

0.5236

0.6273

0.5389

0.5473

0.6273

0.3375

0.5673

0.6273

0.5225

0.5891

0.9111

0.9048

0.9000

0.9111

0.9041

0.9000

0.9111

0.9037

0.9111

0.9085

0.9111

0.9236

0.9271

0.9342

0.9236

0.9386

0.9450

0.9236

0.9056

0.9344

0.9236

0.9250

0.9290

0.8200

0.8300

0.8000

0.8200

0.8320

0.8200

0.8200

0.8200

0.8600

0.8396

0.8270

0.8396

0.8396

0.7979

0.8509

0.8396

0.6575

0.8356

0.8396

0.8377

0.8280

0.8754

0.5849

0.8404

0.8754

0.8223

0.8228

0.8754

0.8689

0.8754

0.8028

0.8327

0.8629

0.8991

0.8800

0.8629

0.8297

0.8914

0.8629

0.8651

0.8800

0.8629

0.8411

0.8686

0.7709

0.7200

0.7509

0.7709

0.7989

0.7909

0.7709

0.7644

0.7673

0.8608

0.7872

0.8239

0.8608

0.8112

0.8372

0.8608

0.7523

0.8011

0.8608

0.8130

0.8125

0.9048

0.8657

0.9238

0.9048

0.8924

0.9143

0.9048

0.9048

0.9238

0.6960

0.6900

0.6940

0.6960

0.6908

0.6980

0.6960

0.6880

0.6960

0.7094

0.7240

0.8129

0.7329

0.7161

0.8129

0.7626

0.7613

0.8129

0.8019

0.8129

0.7535

0.7677

0.9333

0.9420

0.9556

0.9333

0.9578

0.9222

0.9333

0.9444

0.9333

0.9322

0.9333

0.5789

0.5263

0.5820

0.5789

0.5515

0.5771

0.5789

0.4739

0.5746

0.5789

0.4444

Avg

0.8219

0.7786

0.8067

0.8219

0.8029

0.8136

0.8219

0.7745

0.8158

0.8219

0.7960

0.8075

最大的值是粗体,斜体的最小值。

仔细调查的表7和8不难观察到以下:(1)在表7,分类精度与最大的原始属性一般。,在表8比例,分类精度与最大的原始属性和近55%。这意味着过度拟合发生在大多数数据集使用SVM或推车。(2)分类精度对multigranularity权值比单一粒度更大的权值。实际上,在表7,比较(15 UCI数据集),“MGENT”的性能是最好的,大值占80%(12数据集);至于“MGAPP”、“MGDIS”和“MGERR”,他们都得到66.7%(10的数据集)。类似的性能表中可以看到8的表现,“MGDIS”和“MGERR”是最好的,和更大的值均占86.7%(13个数据集);次优的一个是“MGAPP”获得73.3%(11的数据集),“MGENT”,获得66.7%的性能(10的数据集)。(3)总之,multigranularity权值是优于单一粒度中的提高分类精度。如表所示7和8,multigranularity权值可以提高分类精度。和15个UCI数据集的平均价值在这两个表也可以证明相关的分类精度multigranularity权值比单一粒度更大的权值。总之,multigranularity中的执行比单一粒度权值使用SVM和购物车。

Anoval函数被用来验证是否有显著差异存在的分布对分类精度。类似于上面所示的Wilcoxon等级和测试,比较的目的是试图拒绝零假设,分类精度的分布明显不同。假设阈值设置为0.05,如果该值大于0.05,然后我们拒绝零假设,即。分类精度的分布是相似的。和比较的结果分布使用SVM和车下面的表中列出9和10,分别。


ID	应用程序MGAPP	ENTMGENT	说MGDIS	犯错MGERR

1	0.1029	0.0088	1.0000	0.9999
2	0.9989	0.9997	2.9621 e−06	0.7499
3	1.0000	0.9739	0.9852	1.0000
4	0.8988	0.5226	0.0584	0.9697
5	1.0000	1.0000	1.0000	1.0000
6	0.9967	0.0783	1.9014 e−07年	0.8709
7	2.8827 e−36	2.0328 e−08年	1.0000	1.1929 e−09年
8	0.1236	0.9765	0.3849	0.0043
9	0.2643	0.9999	1.0000	0.9949
10	0.1887	0.1506	3.2225 e−13	0.5573
11	0.9561	0.8719	1.0000	1.0000
12	0.9997	0.9996	0.9999	0.9852
13	0.2446	0.0261	0.2749	0.0392
14	0.9918	0.8474	1.0000	0.7630
15	7.8457 e−20.	0.2767	0.0059	1.0000
Avg	0.5844	0.5821	0.5806	0.7290

斜体的值小于0.05。


ID	应用程序MGAPP	ENTMGENT	说MGDIS	犯错MGERR

1	0.0532	1.9620 e−04	0.9997	0.9912
2	0.1040	1.0000	0.0046	0.9261
3	0.9988	0.9101	1.0000	1.0000
4	0.9933	0.5804	0.1851	0.9985
5	0.9988	0.9997	1.0000	1.0000
6	0.2141	0.0044	1.6372 e−06	0.9973
7	2.2575 e−52	4.1119 e−27	0.9415	1.8770 e−10
8	0.0253	0.3208	0.9741	0.5315
9	0.9083	1.0000	1.0000	0.9963
10	0.1223	2.0327 e−04	6.6803 e−06	0.6861
11	0.4844	0.1356	1.0000	0.9999
12	0.5605	0.9801	1.0000	0.9299
13	0.6600	0.5010	0.2942	0.0936
14	0.9219	0.9374	1.0000	0.8304
15	8.8496 e−26	2.6348 e−07年	1.6897 e−05年	1.0000
Avg	0.4697	0.4913	0.6266	0.7987

后的结果表9和10,我们可以发现值一般大于0.05。在下面,我们将解释这些结果表9和10,分别。(1)至于这些值等于托尔小于0.05的表9从表,它可以观察到7分类的精度对multigranularity导出大于相应的单一粒度的权值。数据集的“脊柱”(ID: 13)作为一个例子,有两个值不大于0.05:“ENT的比较MGENT”和“犯错MGERR。“然而,分类精度对这些权值(ENT MGENT,犯错,MGERR)是0.7600,0.8194,0.7832,和0.8323。我们可以发现值“MGENT”(“MGERR”)大于“花”(“犯错”)。(2)从表可以观察到类似的发现10。至于价值观是相同的或小于0.05,multigranularity的权值提供更大价值的分类精度。然而,唯一的例外是数据集“电离层”(ID: 8);在“应用程序的比较MGAPP”结果的值小于0.05,平均值在术语“应用”和“MGAPP”分别是0.8991和0.8800。

综上所述,我们可以得出结论,没有显著区别分类精度之间的分布对单一粒度权值和multigranularity权值。此外,不仅multigranularity权值可以提供更好的分类精度比单一粒度的权值也multigranularity算法可以提高时间效率。

6。结论和未来的角度

在本文中,一个框架提出了信息论multigranularity视图。有别于传统的约简算法只使用一个固定的粒度,我们从multigranularity视图执行算法。在实验中,最好的和粗粒度是用来实现multigranularity框架。此外,从不同的角度来选择属性决定类、整体策略引入到传统的基于适应度函数的搜索策略,和大多数机制被用来选择频率最高的属性对不同决策类。与信息论的单一粒度视图相比,该算法不仅能减少运行时间还权值来源于新算法可以提高分类精度。

以下话题值得我们进一步的调查:(1)最好的粒度和粗粒度每个的重量在这篇文章中,不同的权重对粒度在未来可能与不同的需求进行调查。(2)加权平均值与最好的粒度和粗粒度应用multigranularity算法,和其他更多的粒度或者其他更多的融合策略可以被视为multigranularity视图实现属性约简。(3)考虑不同决策类的不同的需求,多数表决机制的系综选择器是用来选择合适的属性在我们的实验中,和更多类型的策略可能在未来调查决定类之间。

数据可用性

(UCI)数据用于支持本研究的结果中包括这篇文章。

的利益冲突

作者宣称没有利益冲突。

确认

这项工作是由中国自然科学基金会(号。61572242,61503160,61573127)和江苏省研究生创新研究与实践项目(KYCX19_1697)。

引用

t·r·h . m . Chen Li c .罗S.-J。Horng, g .王”,一个粗糙集方法对于动态数据挖掘,决策理论”IEEE模糊系统,23卷,不。6,1958 - 1970年,2015页。视图:出版商的网站|谷歌学术搜索
z . a . pswlak“粗糙集”,国际计算机与信息科学杂志》上,11卷,不。5,341 - 356年,1982页。视图:出版商的网站|谷歌学术搜索
pswlak z, a skowron4月份“粗糙集:一些扩展,”信息科学,卷177,不。1,28-40,2007页。视图:出版商的网站|谷歌学术搜索
x张c·梅·d·陈,j .李“Multi-confidence规则获取和confidence-preserved属性约简在区间值决策系统中,“国际期刊的近似推理,55卷,不。8,1787 - 1804年,2014页。视图:出版商的网站|谷歌学术搜索
问:h . Hu w . Pedrycz d . Yu和j . Lang”选择基于社区的离散和连续特性决定错误最小化,“IEEE控制论,40卷,不。1,第150 - 137页,2010。视图:出版商的网站|谷歌学术搜索
h·j·戴,w . Wang田,l .刘”属性选择基于不完备决策系统的新条件熵,”以知识为基础的系统39卷,第213 - 207页,2013年。视图:出版商的网站|谷歌学术搜索
问:j .戴w . Wang徐,h .田”不确定性测量基于扩展为区间值决策系统条件熵,”以知识为基础的系统27卷,第450 - 443页,2012年。视图:出版商的网站|谷歌学术搜索
j .戴问:徐,w . Wang和h .田”条件熵的不完备决策系统及其在数据挖掘中的应用,”国际杂志的通用系统第41卷。。7,713 - 728年,2012页。视图:出版商的网站|谷歌学术搜索
马薛y, y, y, f .徐”措施邻域粗糙集的不确定性”以知识为基础的系统卷,120年,第235 - 226页,2017年。视图:出版商的网站|谷歌学术搜索
t·冯S.-P。张,js。Mi”,减少和模糊覆盖系统基于证据理论的融合,“国际期刊的近似推理,53卷,不。1,第103 - 87页,2012。视图:出版商的网站|谷歌学术搜索
Y.-Q。姚明,js。Mi, Z.-J。李,“基于广义模糊证据理论的属性约简在模糊决策系统中,“模糊集和系统,卷170,不。1,第75 - 64页,2011。视图:出版商的网站|谷歌学术搜索
c . j . Li梅、w .徐和y钱”概念学习通过颗粒计算:认知的观点,“信息科学卷,298年,第467 - 447页,2015年。视图:出版商的网站|谷歌学术搜索
洛杉矶德,“一些反思软计算、细粒度的计算和他们的角色在概念、设计/智能系统和利用信息,“软计算的融合基础、方法和应用,卷2,不。1,第23 - 25,1998页。视图:出版商的网站|谷歌学术搜索
洛杉矶德”,对模糊信息造粒的理论及其在人类推理和模糊逻辑中心”模糊集和系统,卷90,不。2、111 - 127年,1997页。视图:出版商的网站|谷歌学术搜索
p .朱问:胡,”自适应社区粒度选择和基于边缘分布优化组合,”信息科学卷,249年,页1 - 12,2013。视图:出版商的网站|谷歌学术搜索
p .朱问:胡、w .左和m .杨”多粒度距离度量学习通过附近颗粒边缘最大化,”信息科学卷,282年,第331 - 321页,2014年。视图:出版商的网站|谷歌学术搜索
y奖赏、t .井和阿卡玛,“granularity-based框架的演绎、归纳和绑架,“国际期刊的近似推理,50卷,不。8,1215 - 1226年,2009页。视图:出版商的网站|谷歌学术搜索
美国Kumar和h . h . Inbarani”,一种新颖的基于邻域粗糙集分类方法对于医学诊断,”Procedia计算机科学47卷,第359 - 351页,2015年。视图:出版商的网站|谷歌学术搜索
硕士。邵,y Leung X.-Z。王,W.-Z。吴,颗粒中的正式模糊的环境中,“以知识为基础的系统,卷114,不。15日,第166 - 156页,2016年。视图:出版商的网站|谷歌学术搜索
W.-Z。吴和y .梁最优规模选择多尺度决策表”国际期刊的近似推理,54卷,不。8,1107 - 1129年,2013页。视图:出版商的网站|谷歌学术搜索
W.-Z。吴,y钱,T.-J。李,S.-M。顾,“不完整的多尺度决策表规则获取。”信息科学卷,378年,第302 - 282页,2017年。视图:出版商的网站|谷歌学术搜索
h .赵,p . Wang,问:胡锦涛,“价格敏感特征选择基于自适应邻域的粒度与多层次的信心,“信息科学卷,366年,第149 - 134页,2016年。视图:出版商的网站|谷歌学术搜索
S.-M。顾和W.-Z。吴”,在多尺度决定知识获取系统”,国际期刊的机器学习和控制论,4卷,不。5,477 - 486年,2013页。视图:出版商的网站|谷歌学术搜索
y么,”triarchic粒度计算理论”,细粒度的计算,1卷,不。2、145 - 157年,2016页。视图:出版商的网站|谷歌学术搜索
林y, j·李,p . Lin g .林和j·陈,“通过社区multi-granulation融合特征选择,”以知识为基础的系统卷,67年,第168 - 162页,2014年。视图:出版商的网站|谷歌学术搜索
y钱,j .梁,y姚明,c .党“MGRS: multi-granulation粗糙集,”信息科学,卷180,不。6,949 - 970年,2010页。视图:出版商的网站|谷歌学术搜索
y y姚明,“三方决定和细粒度的计算,”国际期刊的近似推理卷,103年,第123 - 107页,2018年。视图:出版商的网站|谷歌学术搜索
x k . Liu Yang h . Fujita d . Liu x, y .钱,“多粒度属性约简的效率选择器,”信息科学卷,505年,第472 - 457页,2019年。视图:出版商的网站|谷歌学术搜索
d·g·陈和郑胜耀赵”,当地的减少和模糊粗糙集,决策系统”模糊集和系统,卷161,不。13日,1871 - 1883年,2010页。视图:出版商的网站|谷歌学术搜索
杨x和y么,”属性约简集合选择器,”应用软计算卷,70年,页1 - 11,2018。视图:出版商的网站|谷歌学术搜索
j .歌曲,e·c·c·Tsang d . Chen和x,“最小的决策成本约简在模糊决策理论粗糙集模型中,“以知识为基础的系统卷,126年,第112 - 104页,2017年。视图:出版商的网站|谷歌学术搜索
t·h . Chen Li x风扇,和c罗,“对不平衡数据特征选择邻域粗糙集的基础上,“信息科学卷,483年,页1 - 2019。视图:出版商的网站|谷歌学术搜索
j .白k .夏、y林和p . Wu”基于一致的覆盖粗糙集属性约简及其应用”复杂性卷,2017篇文章ID 8986917、9页,2017。视图:出版商的网站|谷歌学术搜索
b .太阳、w·马和y钱,“Multigranulation模糊粗糙集决策两个宇宙及其应用,”以知识为基础的系统卷,123年,第74 - 61页,2017年。视图:出版商的网站|谷歌学术搜索
x气、j . Zhang和c .梁”多属性群决策方法基于区间值双犹豫模糊语言设置不平衡和他们的应用程序,“复杂性卷,2018篇文章ID 3172716, 22页,2018年。视图:出版商的网站|谷歌学术搜索
梁x, y钱问:王et al .,”当地粗糙集:一个解决方案在大数据粗略的数据分析,“国际期刊的近似推理卷,97页38 - 63,2018。视图:出版商的网站|谷歌学术搜索
江z、x杨h . Yu d . Liu p . Wang和y .钱,“加速器多粒度属性约简,”以知识为基础的系统卷,177年,第158 - 145页,2019年。视图:出版商的网站|谷歌学术搜索
梁和z史”,信息熵,粗糙熵和知识造粒在粗糙集理论中,“国际期刊的不确定性、模糊性和以知识为基础的系统,12卷,不。1,37-46,2004页。视图:出版商的网站|谷歌学术搜索
j .梁j . Wang和y .钱,”一个新的测量不确定性的基于粗糙集知识造粒,”信息科学,卷179,不。4、458 - 470年,2009页。视图:出版商的网站|谷歌学术搜索
w·魏和j .梁”信息融合在粗糙集理论概述,“信息融合48卷,第118 - 107页,2019年。视图:出版商的网站|谷歌学术搜索
徐,x, h . Yu D.-J。Yu, j·杨和e·c . c .曾荫权“多标记学习与具体标签的功能降低,”以知识为基础的系统卷。104年,52 - 61年,2016页。视图:出版商的网站|谷歌学术搜索
杨y高,x, x, p . Wang”社区属性约简:multicriterion策略基于样本选择,”信息,9卷,不。11,282年,页2018。视图:出版商的网站|谷歌学术搜索
问:胡锦涛,x切,d, l . Zhang m .郭和d . Yu,“等级为单调entropy-based决策树分类、”IEEE工程知识和数据,24卷,不。11日,第2064 - 2052页,2012年。视图:出版商的网站|谷歌学术搜索
x张c·梅·d·陈,j .李”特征选择在混合数据:一个方法使用一种新颖的模糊粗糙集合的信息熵,”模式识别卷,56号1、1 - 15,2016页。视图:出版商的网站|谷歌学术搜索
问:h . c . z . Wang, x z . Wang d·陈钱y, z盾,“基于社区歧视指数特征选择,”IEEE神经网络和学习系统卷,29号7,2986 - 2999年,2018页。视图:出版商的网站|谷歌学术搜索
问:胡锦涛,d . Yu, z .谢,“社区分类器”,专家系统与应用程序,34卷,不。2、866 - 876年,2008页。视图:出版商的网站|谷歌学术搜索
x, s .梁h, s高,和y .钱,“Pseudo-label邻域粗糙集:削减措施和属性,“国际期刊的近似推理卷,105年,第129 - 112页,2019年。视图:出版商的网站|谷歌学术搜索
x y, y . Rao l .商和t·李,“相似性在粗糙集理论属性约简:集群的角度来看,“国际期刊的机器学习和控制论,卷1,1 - 14,2019页。视图:出版商的网站|谷歌学术搜索
w . l . y . Liu黄,y l .江y和z曾庆红,“邻域粗糙集模型快速属性约简算法,”信息科学,卷271,不。1,第81 - 65页,2014。视图:出版商的网站|谷歌学术搜索
m . c . Wang邵,问:他,钱y, y .气,“基于模糊邻域粗糙集的特征子集的选择,”以知识为基础的系统卷,111年,第179 - 173页,2016年。视图:出版商的网站|谷歌学术搜索
x, y、x歌,j .杨”测试成本敏感multigranulation粗糙集:模型和最小成本的选择,”信息科学卷,250年,第199 - 184页,2013年。视图:出版商的网站|谷歌学术搜索
张x, m . h .窦和j·杨,“社区系统在不完备信息系统粗糙集,“以知识为基础的系统,24卷,不。6,858 - 867年,2011页。视图:出版商的网站|谷歌学术搜索
y姚明和x张,“职业专用属性权值在粗糙集理论中,“信息科学卷,418 - 419,601 - 618年,2017页。视图:出版商的网站|谷歌学术搜索
x, l .商、周b和y姚明,“广义粗糙集理论的属性约简,”以知识为基础的系统卷,91年,第218 - 204页,2016年。视图:出版商的网站|谷歌学术搜索
赵y, y, j . Wang“导出建设算法,”在计算机科学的课堂讲稿,1卷,页100 - 117,施普林格,柏林,德国,2008年。视图:出版商的网站|谷歌学术搜索
h . x k . Liu Yang, j . Mi p . Wang和x陈,“基于粗糙集semi-supervised特征选择通过系综选择器”以知识为基础的系统卷,165年,第296 - 282页,2019年。视图:出版商的网站|谷歌学术搜索
c . j . Li黄,j .气y钱,和w·刘,“三方通过基础认知概念学习,”信息科学卷,378年,第263 - 244页,2017年。视图:出版商的网站|谷歌学术搜索
问:胡锦涛,j·刘,吴和c, d . Yu”基于邻域粗糙集的异构特征子集的选择。”信息科学,卷178,不。18日,第3594 - 3577页,2008年。视图:出版商的网站|谷歌学术搜索
刘贤刘,j。j的歌,w·d·张x b·杨,“减轻过度学习在属性约简:早期停止策略,”《2018年国际会议上小波分析和模式识别成都,页190 - 195年,中国,2018年7月。视图:出版商的网站|谷歌学术搜索
r·w·r . Wang Li Li和l .张“自动模糊类型通过系综分类支持向量机,”信号处理:图像通信卷。71年,巢族,2019页。视图:出版商的网站|谷歌学术搜索
h, c .μc .太阳,w·杨,杨x, x左,“基于支持向量机的优化决策阈值调整策略不平衡数据分类”以知识为基础的系统卷,76年,第78 - 67页,2015年。视图:出版商的网站|谷歌学术搜索
h, s . Changyin x,郑,h .邹,“模糊支持向量机与相对密度不平衡数据分类的信息,“IEEE模糊系统卷,99年,页1 - 15,2019。视图:出版商的网站|谷歌学术搜索
卡梅拉,m . Ariab d·a·安东尼奥·r .西西里岛舞蹈,“信息通过视觉修剪树木,”专家系统与应用程序卷,127年,第240 - 228页,2019年。视图:出版商的网站|谷歌学术搜索

复杂性

文摘

1。介绍

2。于社区Multigranularity

3所示。属性约简

3.1。一些措施

3.2。属性约简

4所示。从Multigranularity视图Ensemble-Based属性约简

4.1。Ensemble-Based属性约简

4.2。Multigranularity属性约简

5。实验分析

5.1。权值的长度之间的比较

5.2。比较消耗时间

5.3。比较使用NEC的分类精度

5.4。比较在使用支持向量机分类精度和购物车

6。结论和未来的角度

数据可用性

的利益冲突

确认

引用

版权

更多相关文章

相关文章