研究文章|开放访问
用于分类的神经模糊和特征约简混合模型
摘要
模糊系统的演变在许多普遍近似能力和应用中显示出有影响力和成功。本文提出了一种用于数据分析的混合神经模糊和特征减少(NF-FR)模型。这提出的NF-FR模型使用了所有模式的特征类归属化模糊过程。在模糊处理过程中,所有功能都基于数据集中可用的类数而扩展。它有助于处理不确定性问题,并协助基于人工神经网络 - (Ann-)的模型来实现更好的性能。然而,由于这种在模糊化过程中的输入特征的扩展,问题的复杂性增加。这些扩展功能可能并不总是对模型有显着贡献。为了克服这个问题,用特征减少(FR)用于过滤掉微不足道的特征,从而导致网络计算成本较少。这些减少的显着特征用于基于ANN的模型来分类数据。通过十个基准数据集(平衡和不平衡)测试并验证了该提出的模型的有效性,以证明所提出的NF-FR模型的性能。 The performance comparison of the NF-FR model with other counterparts has been carried out based on various performance measures such as classification accuracy, root means square error, precision, recall, and f-measure for quantitative analysis of the results. The obtained simulated results have been tested using the Friedman, Holm, and ANOVA tests under the null hypothesis for statistical validity and correctness proof of the results. The result analysis and statistical analysis show that the NF-FR model has achieved a considerable improvement in accuracy and is found to be efficient in eliminating redundant and noisy information.
1.介绍
在过去的几十年中,机器学习[1由于大量数据的动态产生和可用性,是研究人员中的一个关键研究领域。将此大量数据转换为知识是最大的挑战之一。有各种机器学习技术,如分类[2- - - - - -5],聚类[6], 预言 [7,8],以及系统控制[9,10.用于解决上述问题。分类是一种重要的机器学习技术,用于构建将数据分类到不同类别标签的模型。它提供了详细的知识[11.正在被分类的域的。为了解决现实世界的问题,ANN [12.]被用作对不同任务进行分类的工具,如分类、聚类和类似于人脑的回归。人工神经网络以同时处理大量数据的结构上的大规模并行而闻名。即使在信息非常少的情况下,它也具有很高的精度和学习能力。人工神经网络已成功应用于不同的问题领域,如时间序列预测[13.]、集群和系统控制[14.].ANN的主要缺点是处理不精确或不确定的数据[15.].由于输入信息不精确、不明确,存在一些不确定性[16.,17.]可能会在资料分类过程的任何阶段出现。模糊集是处理这些不确定性问题的一种最合适的方法。每个特性相对于几个类标签的成员关系值的程度是使用FS确定的。这些隶属度值可以很容易地处理不确定和不精确的信息。与其他数学模型相比,FS模型的显著特点是即使在数据不完整或不精确的情况下也能有效地工作。但模糊展开是大多数复杂问题中为了处理不确定性而广泛使用的概念。然而,在处理大型数据集时,这会导致计算量很大的任务。但是,相反地,使用模糊扩展也是必要的。因此,我们不能完全消除模糊化过程。相反,我们可以避免对不太重要的模糊值进行处理。 Hence, it is essential to integrate different individual techniques to form various hybrid techniques. These hybridization techniques provide an intelligent system that performs better than individual techniques to deal with the real-world problems. The motivation behind the hybrid model is to eliminate the drawbacks of individual techniques and build hybrid models that are more efficient and transparent than individual models. The hybridization of various techniques is successfully applied in several applications such as biomedical signal processing [18.],云优化[19.,20.],预测[21.]和医疗保健[22.- - - - - -24.].主要使用的杂交模型称为自适应神经模糊推理系统(ANFIS)[25.]成功地应用于不同的问题领域,如分类、预测和模式识别。但是这个模型的主要缺点是它是由模糊规则集控制的。这些规则集需要花费更多的时间来训练模型,使网络更加复杂。只有正确设计模糊规则集,它才能提供更好的性能。混合了神经网络和FS模型的NF模型的另一种变体在[26.,27.].在该模型中,模糊系统的能力是使人类感知以及NN的学习能力来调整问题。它杂交,以增强模型的适应性,速度和灵活性等不同的特性。Ghosh等人。[26.]使用了Π-type会员功能[28.]对于基于类标签属性中可用的类的数量扩展输入功能的模糊化进程。由于这些输入特征的这种模糊扩展,网络的复杂性增加,需要更长的时间训练和测试模型。它增加了维度[29.]由于模糊过程引起的问题,并导致了提高模型性能的主要阻塞[30.- - - - - -32.].该NF模型的精度比ANN具有相当大的改进,但其计算时间增加。除此之外,所有扩展功能都可能并不总是对网络贡献。因此,必须删除这些功能,这些功能不会显着贡献到网络。在这方面,维度减少算法在消除对网络没有显着贡献的特征中起着重要作用。因此,称为主成分分析(PCA)的特征缩减算法[33.]用于消除无关的功能,以提高性能并降低模型的计算成本。在许多现实生活中发现了NF模型在许多现实应用中取得了成功[34.在科学和工程领域。适用于处理问题的不精确和不确定性[35.通过在处理之前解释输入的特征。它使模型在决策过程中更加健壮和透明。这吸引了许多研究者采用NF模型进行数据分析。在上述事实的推动下,这项工作规划了一个改进NF模型的方案。
这项工作的目标是开发一种称为NF-FR的混合模型用于数据分类。第一步,使用Π-type隶属函数对输入模式进行模糊化。然后,将特征约简算法应用于NF模型的模糊化过程(特征后约简)后的模糊变量,利用特征约简(NF- fr)模型发展神经模糊。在该模型中,对模糊模式进行特征后约简,过滤掉不相关、冗余和噪声特征。与前特征还原不同,它允许所有特征参与模糊化过程,然后从模糊模式中识别不相关的特征。这种方法允许从弱特征集中挖掘潜在的模糊特征。NF-FR模型通过消除不相关的模糊特征,提取真正有助于网络加速分类过程的模糊信息。主要的观察结果是,通过使用称为PCA的FR算法,运行算法所需的总时间大大减少。因此,NF-FR模型不仅提供了更准确的结果,而且减少了执行时间。我们比较了4种模型,如ANN, ANN与使用PCA (ANN-FR)的FR, NF,以及使用来自UCI机器学习知识库的10个基准数据集的NF-FR。 Each dataset is then evaluated on various performance measuring parameters such as root mean square error (RMSE), f-measure, precision, and recall from the confusion matrix.
本文的其余部分组织如下:部分2提供相关工作的回顾。部分3.描述了NF模型,PCA和本研究工作的详细提出的NF-FR模型的基本初步。部分4给出了该模型的详细实验设置、仿真环境和结果分析。部分5描述了所有模型的统计分析,最后,部分6结束了本文未来范围的工作。
2.文学调查
几种软计算技术,如FS,NN,NF和维数减少在过去几十年中,在混合动力模型的开发中起着关键作用。这些技术的杂交也被认为是数据挖掘,机器学习和模式识别领域的基准工作之一。该文献综述表明上述模型的最新发展及其在各种领域的应用。Zadeh提出的FS代表了人类感知的表达方式,特别是语言通信,模式识别和信息抽象等不同领域,以解决不确定性问题。可以通过用于将输入特征转换为其相应的模糊特征集的不同模糊化技术来解决这些不确定性问题。该模糊化过程可以以两种方式表示,例如类归属模糊和级非信心模糊化。Ghosh等人。[27.]提出了一种基于钟形隶属函数的特征模糊化的NF分类模型。由输入特征形成的模糊矩阵与不同类别的归属程度相关联。类标签决定了对该类的归属程度的值。帕尔和米特拉[28.]使用了一个隶属函数,该函数将清晰值转换为其语言值,这些语言值被用作网络的输入模式,而不是数值。他们使用Π-type成员函数进行模糊化,并使用基于ann的MLP和反向传播模型。但他们没有考虑到网络结构的任何倾向或附加。默赫(34.使用利用最佳提取功能的粗糙集方法,提出了NF分类。这是通过使用模糊集的模式的特征性归属来获得,以处理不确定的不精确和粗糙集。Kar等人。[35.]提供了2002 - 2012年NF分类模型在交通控制、经济系统、医疗系统和图像处理等不同应用领域的发展概况。Viharos and Kis [36.]对不同NF模型进行详细的调查,如ANFIS,Falcon,Garic,Nefcon和Sonfin以及其架构。它还提供了对技术诊断和测量领域在技术诊断和测量领域使用这些模型的详细调查。从2000年到2017年对分类的详细调查,[37.].达斯和普拉蒂哈尔[38.]使用了具有多目标优化技术的神经模糊,以制造过程中固有的模糊性。Škrjanc等。[39.]解决了在现实世界环境中使用的基于神经模糊和模糊规则的模型的审查,用于分类,聚类,回归和系统识别。在数据分析过程中,在预处理中使用维度减少技术,例如特征选择和特征减少[40原始特征转化为原始特征或转化后的特征的阶段。将[41.[基于某些症状,解决了诊断人类抑郁症的NF模型。该模型使用PCA从十四个特征减少到七个特征,与七种特征有关,并显着促进疾病鉴定的决策过程。Ibrahim等人。[42.[基于症状,使用了数据适应性NF推理模型,用于早期检测和分类糖尿病病。alvanitopoulos等。[43.]提出了一种用于识别建筑地震损害的NF分类技术。在地震表现后,考虑了既有结构的安全性评估和建筑物的自动损伤分类应采取的措施。陈(44.]提出了一个截止日期约束消息调度系统的在线NF模型。它适应网络结构和参数以探索消息调度系统的动态行为。Azhari和Kumar [45.]讨论了一个关于文本摘要的NF方法。它在了解了解会议数据语料库上的文档上过滤了高质量的摘要句子。singh等。[46.]提出了一个用于聚类的增强的NF模型,与NF模型相比,该模型减少了语言变量的数量。Nilashi等人[47.]使用的合奏组合ANFIS模型,聚类以及预测肝炎疾病诊断的维度降低。谢巴德厄特等人。[48.]提出了一种基于pso的ELM-ANFIS模型用于回归和分类,以减少计算成本、随机性和更好的泛化。
PCA还在消除输入模式的冗余特征方面发挥了重要作用,提高了系统的性能和准确性。它从数据集中提取重要信息,并将其表示为一组新的正交变量,称为主成分。它是一种通过收集高度相关的变量来减少变量数量的统计方法。Polat和Güneş [49.]使用了PCA和ANFIS技术。他们使用特征约简算法将糖尿病数据集的输入特征从8个特征减少到4个特征,并通过ANFIS模型传递输入进行预测诊断。Wang和Paliwal [50.]提出了基于维数的特征提取算法,如线性判别分析和主成分分析用于元音识别。该算法将输入参数转化为特征向量,并降低特征向量的维数,使分类过程更加高效。阿扎尔的(51.[基于语言对冲在医学诊断的自适应NF模型中的特征选择方法。它通过消除冗余和嘈杂的功能来降低问题的尺寸,并增强了分类的性能。它还加快了学习算法的计算时间,并简化了分类任务。Keles等人。[52.]提出了一种用于前列腺癌分类的NF工具。该模型诊断以找到一组可以用语言解释的规则。Gabrys [53.解决了行业不确定信息处理的一般模糊MAX-MIN网络模型。它分析并识别是否结合或不结合不同的技术来形成杂交。übeyli[54.]将ANFIS模型应用于心电信号的分类。他们使用Lyapunov指数进行特征提取,使用ANFIS进行分类。Kolodyazhniy等[55.]采用主成分分析进行降维,利用NF Kolmogorov网络对污水处理厂数据进行分类。Schclar等[56.]基于降维集合各种模型。由于在NF模型中输入特征的维数增加,计算成本增加。为了解决这一问题,在预处理阶段采用了各种特征约简技术。然而,我们目前的研究提出的NF-FR模型是合理的类别归属模糊的输入特征。这些模糊特征被主成分分析过滤掉,产生约简特征。这些简化的特征被传递到基于ANN-BPN的模型中进行训练和测试。这个实验是用十个数平衡和不平衡的数据集完成的。
3.系统模型
过去几十年来,研究人员正在尝试通过使用模糊系统和神经网络进行模式分类来设计混合系统。NF模型,PCA和NF-FR模型的提出的Hybrid模型的基本概念如下所述。
3.1.去噪模型
在现实世界问题中,不确定性是主要挑战之一,这导致了关于模式分类问题中输入数据的不完整和不精确的信息。因此,有必要提供充分的规定来处理不确定性。在NF模型中,代替正常清晰的输入值,模糊值被输入到神经网络。模糊矩阵是模糊处理的结果,其生成隶属矩阵,其中该矩阵中存在的元素总数等于数据集中存在的特征数量和类的数量的乘积,这是输入到的神经网络。模糊输入矩阵与相对于类的归属程度相关联,该类提取输入模式的特征明智信息。图案的每个特征值都表示每个类的隶属值,其中通过使用图中所示的π型隶属函数来测量成员身份值1.将此模糊化矩阵传递给神经网络模型进行网络训练。
3.2.主成分分析
模糊处理可能导致高维数据,其中所有特征可能无法携带有关模式的鉴别的重要信息。此外,这种维度的增加会影响机器学习算法的复杂性。本节介绍称为PCA的特征缩减算法的工作原理,以从原始功能集中提取相关功能以减少数据的尺寸。这可以通过将高维特征转换为新的小型变换特征而不丢失原始数据集的基本信息来实现。这些新的功能集称为主组件,其中数据随着原始功能的线性组合而变化。PCA仅考虑那些具有更大方差的这些组件。PCA的主要目标是识别数据的隐藏模式,通过消除冗余和嘈杂的功能来确定特征之间的相关性,并降低特征的维度。
3.3。提出的杂交神经模糊和FR模型
在这个模型中,输入模式的特征信息是从不同类的原始数据中提取出来的。由于在区分实例时,并非所有特征都是同等重要的,因此期望基于特征的归属有助于分类过程。本节给出了新型NF-FR模型的详细示意图,用于对非线性数据进行分类。该模型将部分分为三个主要步骤,即输入特征模糊化过程、使用PCA的特征约简和使用带反向传播学习的ANN分类。
最初,该NF-FR模型用于通过使用类归属模糊化技术从输入模式从输入模式中提取特征性信息。在本研究中,我们使用了一种流行的π型隶属函数,用于对输入图案的模糊化。由于所有功能都可能没有显着贡献对分类过程,因此必须找到每个属性的类属性。为了实现这一点,这里π型隶属函数已经用于模糊过程,该过程提供了各个特征的归属程度相对于类标签。结果,输入模式的每个特征值已经扩展到值的数目,其中是类标签的数量。此外,这种输入模式的扩展可能包含一些不重要的特征,因此,PCA被用于修剪不相关的特征。最后,将神经网络模型应用到具有反向传播学习的分类过程中,并对神经网络模型的输出进行去模糊处理,得到最终结果。本文提出的NF-FR分类模型框图如图所示2,具体工作模型如图所示3..下面将详细讨论所提出的模型。
步骤1(模糊化过程)。在这一步中,n- 类输入模式 被认为是输入模式,在哪里是数据集中可用特性的数量。在这里,数据集的每个特性的成员关系值是通过使用Π-type成员关系函数计算的,如图所示1.会员价值的的例子与类标签相关的特性表示为 ,在哪里是个的实例数据集的特性,以及表示数据集中可用的类的数量。模糊化过程提供相对于不同的类标签的各个特性的成员程度。本文使用Π-type隶属度函数对模型进行模糊化和陡度控制,可通过如下公式实现:
在方程(1)时,成员值在点处是最小的和 .在这里,会员价值从点数逐渐增加和 ,保留点之间的最大值和 ,之后逐渐减少到点到 .中心是计算训练数据集。交叉点的计算和分别为:
在方程(2)和(3.),和是否使用两个数学函数来计算最小值和最大值的例子功能( )数据集。交叉点的会员价值和是0.5。
在模糊化过程之后,模糊矩阵通过使用π型隶属函数计算完整的数据集,该函数如下所示: 在哪里代表了会员价值输入模式数据集的特征,可以用下式表示: 在哪里代表了会员价值输入模式关于数据集的特征类级别。在这里,是数据集中可用的类的数量。这个过程的输出是一个包含输入模式扩展的模糊特征的模糊化矩阵。IRIS数据集的一个特征(花瓣宽度)的模糊化结果示例如图所示4.数据集所有特征的每个隶属度值将在[0-1]范围内进行转换,如图所示4.
步骤2(特征减少过程)。由于输入特征的扩展,模型的复杂性增加。为了使分类过程更有效和高效,PCA用于减少模糊隶属矩阵的特征。在此步骤中,这种模糊的隶属矩阵作为主成分分析算法的输入,对特征进行降维。
设,为上述模糊隶属矩阵有可以表示为的模糊特征数量 , , 是功能的数量,和是类标签的数量。模糊隶属度矩阵的协方差矩阵由下式计算: 在哪里是特征的样本均值吗和表示要考虑的样本数量。协方差矩阵的组件( )表示特征的方差和 .
让是主要轴的数量哪个表示协方差矩阵的特征向量,在哪里 ,其中方差在投影空间中是最大的。计算模糊隶属度矩阵各特征的均值为在哪里和 .从每个数据维中减去每个特征的平均值,生成一个平均值为零的数据集。
特征值( )和特征向量( )在一个对称矩阵时,可以轻松地计算协方差矩阵。特征向量及其相应的特征值的计算公式为: 在哪里和为可由式(8)并且可以由相应的特征载体的特征值的降序表示。
此步骤的输出是缩小的矩阵(X)包含在分类的决策过程中所需的输入特征的相关信息。在第三步中,将该缩减矩阵传递给ANN作为输入。
第3步(构建Ann-BPN模型)。在这一步中,使用带反向传播的人工神经网络(ANN-BPN)模型进行分类。ANN-BPN模型采用反向传播作为有监督学习算法来训练人工神经网络。它通过有效地计算梯度来更新模型的权值,使损失最小化。该网络采用阶跃生成的约简模糊矩阵作为输入2到这个模型。在该模型中,输入层的所有权重完全连接到隐藏层。所有隐藏的层也完全连接到自己。最后一个隐藏层也连接到输出层。最初,所有重量都会在范围内分配随机重量和 .输入层的可用节点数等于简化后的模糊矩阵的可用特征数。输出层中的节点数等于数据集中可用的类标签数。隐层中可用节点数由式(9),其中input_nodes、hidden_nodes和output_nodes分别表示输入节点、隐藏节点和输出节点的个数。隐层的数量和每个隐层的神经元数量取决于问题的复杂性。在文献中没有任何标准的计算方法,但有一些作者使用下面的公式来计算隐层中可用的神经元数:
在前馈步骤中,基于约简模糊矩阵输入信息对模型进行训练。净输入是通过将输入模式的乘积与分配的权重相加并加上偏差来计算的。数学上,净输入的性能神经元可表示为: 在哪里是偏误吗神经元, 为简化模糊矩阵的输入模式, 连接权值是神经元,是模型的净输入。类似地,计算每个层的净输入,并应用用于输出的激活函数,这在不同的连接层之间确定。通过使用以下等式中描述的SIGMOID激活函数来计算输出层的输出是激活功能和为神经元的输出:
在反向传播步骤中,误差的计算方法为实际输出与目标输出相减,误差表示为: 在哪里表示输出神经元的数量。在这里,均方根误差(RMSE) [5- - - - - -10.]可以用下式计算:
同样,在学习过程中计算误差,更新权值和偏差。通过计算模型中权值的变化来调整不同层间连接路径的权值,以减少模型的整体误差,实现式(14.),α是[0,1]的范围之间的学习率:
模型的新权值和偏差可通过以下公式计算:
这个过程重复多次,以最小化模型的均方根误差或直到达到停止准则。这个建议的方法不同于安(与反向传播前馈),ANN-FR,和NF如下:(i)安(与反向传播前馈),所有的输入特性是并行处理没有提取无关紧要的功能,这需要更多时间来训练模型,也会导致的不确定性问题。(ii)在ANN-FR模型中,预处理阶段使用PCA去除不显著的特征,但该模型无法解决不确定性问题。(iii) NF模型利用类归属模糊化过程解决了不确定性问题,但无法消除冗余或噪声特征。(4)考虑到上述问题,提出的模型利用类归属模糊化过程解决了不确定性问题,并利用PCA剔除了不显著的模糊特征,而不是剔除看似不显著的完整特征。
4.结果分析
在本节中,将介绍用于分析所提出模型的训练和测试阶段的仿真环境和数据集。在这里,四个模型(ANN, NF, ANN- fr,和NF- fr)是使用Matlab(版本R2015a)与Windows 7操作系统实现的。UCI机器学习库的基准数据集[57.]在不同的分类模型中收集和测试。关于所有这些数据集的详细描述[57.,58.]可以在“http://archive.ics.uci.edu/ml/”和“http://keel.es/.”
对每个模型的所有基准数据集,利用混淆矩阵得到分类精度、均方根误差(RMSE)、精度、查全率和f-measure等性能比较技术,并给出了比较结果。这些性能度量的细节概述如下。ANN、NF、ANN- fr、NF- fr模型的RMSE比较如表所示1.有四种模型(ANN,NF,ANN-FR和NF-FR)的四个数据集(钛,乳房癌,乳腺癌和葡萄酒)的错误图如图所示5.有一些构型上的差异这四个模型如下:安是一个简单的模型,没有模糊化和PCA用于分析,ANN-FR是没有模糊性PCA-based模型,NF是模糊性non-PCA基础模型,同样的,NF-FR是模糊性PCA-based模型。
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
(一种)
(b)
(c)
(d)
这里给出的结果完全是基于观察到的实验。表格2描述了在最差、平均和最佳情况下,ANN、NF、ANN- fr和NF- fr模型的分类精度的比较。每个模型随机执行10次,并记录观测结果。根据所有模型的十次执行历史,得到最差、平均和最佳情况分类准确率,如表所示2.除了分类精度,本文还考虑了精度、召回率和f-measure等附加指标来衡量ANN、NF、ANN- fr和NF- fr模型的性能。表格3.描述了ANN、NF、ANN- fr和NF- fr模型的精度、召回率和f-measure的比较。
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
WC:最坏情况;AC:平均情况;公元前:最好的情况。 |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
P:精度;R:召回;FM: f-measure。 |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
在表格中2和3.给出了ANN、NF、ANN- fr和NF- fr四种模型的分类精度、精度、查全率和f-measure(最坏情况、平均情况和最好情况)。在表格中很少有结果2和3.结果表明,本文提出的混合方法(NF-FR)的结果低于其他技术。一般来说,这在任何机器学习模型中都会发生。单一的机器学习技术可能并不适用于所有的基准数据集或问题(正如“no-free-lunch theorem”的原理)。因此,为了得出一个广义的绩效测度,我们进行了各种统计检验,如方差分析检验、Tukey and Dunnett检验、Friedman检验和Holm程序。为了用其他模型验证所提出模型的性能,下一节将进行一些统计分析,如ANOVA检验、Tukey and Dunnett检验、Friedman检验和Holm程序。例如,在Friedman测试中,ANN、ANN- fr、NF和NF- fr四个模型的平均秩是根据分配的秩计算的(见表)4),用公式(17.).这一平均排名的四个模型:ANN,ANN-FR,NF和NF-FR,可以计算和分配为{R4 = 4,R3 = 3,R2 = 1.9,R, 1 = 1.1}。在此基础上,对零假设进行了检验。上述统计分析的结果也表明,所提出的NF-FR模型的整体性能具有统计学显著差异,优于其他模型。这意味着我们提出的模型可能并不适用于少数情况,但适用于许多数据集。以类似的方式,我们在ANOVA、Tukey和Dunnett检验下进行了测试,发现我们所提出的模型的性能明显优于其他模型。
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
在该实验中,在模型的设计过程中考虑了很少的参数。表格中提出了一种模糊膨胀,输入神经元的数量和输出神经元数5.所使用的隐层数为1,隐层神经元数由式(9)为所有模型。所有模型的学习率为0.76。在FR过程中,主成分的维度减少是原始数据的5%。
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||
模型的复杂性描述了所提出的NF-FR模型的有效性。该模型由模糊化、特征约简和神经网络分类三部分组成。模糊化步骤需要常数量的初始化参数所需要的时间时间,以及每个功能,模糊处理基于数据集中可用的类标签将特征空间扩展到其相应的模糊特征空间中 次了。在这里,是多少特征和是数据集中类标签的数量。数据集的所有实例执行模糊化所需的总时间 次了。在这里,米是数据集中的实例数。在特征还原步骤中,计算特征值和特征向量的计算需要时间和协方差矩阵的要求 次,是模糊的功能集。因此,特征减少步骤需要时间。最后,Ann-BPN步骤由馈送和反向衰退步骤组成和 ,分别。因此,模型的总复杂性是 .
5.结果统计分析
统计分析是一种众所周知的方法,用于分析各种数据集的各种型号的性能。通常,使用不同的统计工具来分析数据和算法的性质。在本节中,统计分析[59.,并给出了所有模型在多个数据集上的比较。若干统计检验,如方差分析(ANOVA)检验[60.],tukey test [61.],Dunnett测试[62.,弗莱德曼测验[63.,64.],后HOC测试[65.,66.,证明了所提出的分类算法比现有的分类算法更有效。根据一定的测量参数,在一组分类算法中找出最优的分类算法。
5.1。方差分析测试
ANOVA [60.]是用于在不同模型中进行比较的参数统计技术。它通常比较不同模型性能的平均值和相对方差。当与不同的数据集进行比较多于两种模型时,该方法是合适的。ANOVA使用零假设和替代假设。只有当所有模型的性能相等或这些模型中没有显着差异时,才能有效。或者,替代假设才有效仅当其中任何一个模型与模型的其余部分不同时才有效。单向ANOVA测试已经在SPSS(版本16.0)中进行了95%的自信间隔,结果表明6和7.
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
5.2。Tukey和Dunnett测试
为了拒绝原假设,Tukey检验[61.]和邓尼特测验[62.已经进行了。在Tukey检验中,每个模型的性能比较是与其他模型的性能比较,而Dunnett检验则是将每个模型的性能与所提出的模型进行比较。本测试id为NF- fr的对照组与ANN、ANN- fr和NF等不同模型进行比较。Tukey和Dunnett检验结果见表8.表中显示了基于显著性水平的同质模型组9.
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
显示同质子集中的组的方法。一个Dunnettt测试将一组作为对照,并将所有其他组与之进行比较。 |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||
|
一个采用调和平均样本量= 10.000。 |
|||||||||||||||||||||||||||||||||||||||||||||||||||||
5.3。弗里德曼测试
弗里德曼测试(63.,64.是M. Friedman开发的一种非参数统计技术。它被用来找出不同模型之间的差异,通过对表中所表示的结果值进行一定的排序4.算法的平均秩可以用下面的公式计算,其中是队伍模型dataset和为数据集数量:
ANN、ANN- fr、NF和NF- fr四个模型的平均秩是根据分配的秩计算的,其表示形式为17.).ANN, ANN- fr, NF, NF- fr这四个模型的平均秩可以表示为{R4 = 4,R3 = 3,R2 = 1.9,R, 1 = 1.1}。的价值是从平均等级算出来的吗并且可以通过以下等式实现(18.),是数据集的数量和是模型的数量。在这种情况下,价值是48.2:
弗里德曼的统计数据是通过使用和自由度,可以在等式中实现(19.).临界值[64.]可以从弗里德曼统计中得到和和自由度。在这种方法中,四个模型和十个数量的数据集使用。在这种情况下,弗里德曼统计的价值是241,有4个模型和10个数据集:
如果相应的平均秩差至少达到临界差,则模型的性能就不同。用(4−1 = 3)和(4−1 = 3)×(10−1 = 9)自由度和显著性水平计算临界值为4.6α= 0.01。密度图如图所示6具有自由度(3,27)。应注意,由于临界值(4.6)少于弗里曼统计( ).在原假设被拒绝后,利用霍尔姆程序进行了事后检验实验。
5.4。河中沙洲过程
这个霍尔姆程序[65.- - - - - -67.]通过使用z值和计算每个单独模型与其余模型的性能价值。这z-value通过使用方程(20.),和值由z-value和相应的正态分布表: 在哪里为模型个数,是个z-core值,和是数据集的数量。平均等级和模型是表示的和 ,分别。所有三种模型都与基于的建议模型进行比较z值,价值, ,结果在表中表示10..这里,我们注意到,在几乎所有的情况下值小于通过使用HOLM测试。因此,结论是拒绝零假设。因此,它表明所提出的型号NF-FR在统计上显着不同,而且比其他分类模型更好。
|
|||||||||||||||||||||||||||||||||||
6.结论与未来范围
在本文中,成功地证明了所提出的NF-FR模型,以解决数据挖掘中的数据分类问题。最初,该模型使用模糊处理来扩展输入的功能,该功能的各种类的特征属性,这些类提供了处理不精确和不确定性问题。由于特征的扩展,模型结构变得大规模并行,并且还发现所有特征可能对模型无显着贡献。在下一步中,应用PCA以通过选择最佳合适的相关和非冗余功能来减少扩展功能的维度。结果,所提出的模型的学习时间也用所选择的相关特征减少。然而,考虑用于模糊处理的特定π型隶属函数可能并不总是适合整个数据集。在这种情况下,可以考虑到数据分析的合适隶属函数的选择。根据实验分析,该方法能够将数据集分类为与ANN,NF和ANN-FR模型相比具有卓越分类性能的数据集。在统计分析之后,发现所提出的NF-FR模型与ANN,NF和ANN-FR模型相比有效和高效。未来,该提出的模型可用于各种现实生活问题,例如基因表达分类,文档分类和卫星图像分类。
数据可用性
用于支持本研究结果的数据包括在第四节在文章中。我们使用了UCI机器学习存储库的十个基准数据集。关于所有这些数据集的详细描述可以在“http://archive.ics.uci.edu/ml/”和“http://keel.es/.”
信息披露
本研究不受任何研究组织资助的。
的利益冲突
所有作者都声明没有利益冲突。
致谢
这项研究工作得到了印度政府新德里科技部(DST)科学和工程研究委员会(塞尔维亚)的支持。EEQ / 2017/000355。
参考文献
- D. Michie,D.J.Piegelhalter,以及C.C. Taylor,机器学习。神经与统计分类,卷。13,Ellis Horwood,Hemel Hempstead,1994年。
- r·o·杜达,p·e·哈特和d·g·斯托克,模式分类, John Wiley & Sons,霍博肯,新泽西州,美国,2012。
- H. DAS,B. Naik和H. S. Behera,“生物医学数据机器学习分类算法的实验分析”第二届通信,设备和计算会议的诉讼程序, pp. 525-539,施普林格,新加坡,2020。视图:谷歌学术
- A. K. Sahoo, C. Pradhan,和H. Das,“用于健康决策的不同机器学习方法和基于深度学习的卷积神经网络的性能评估”自然启发了数据科学的计算,pp。201-212,Springer,Cham,瑞士,2020。视图:谷歌学术
- H. DAS,B.Naik和H. S. Behera,“使用神经模糊的医学疾病分析,具有分类特征提取模型”医学信息学解锁,第18卷,第100288页,2020。视图:出版商网站|谷歌学术
- A. K.Jain,M. N.Mutty和P. J. Flynn,“数据集群:审查”,ACM计算调查第31卷第1期3,页264-323,1999。视图:出版商网站|谷歌学术
- J. Makhoul,《线性预测:教程评论》IEEE论文集,卷。63,否。4,pp。561-580,1975。视图:出版商网站|谷歌学术
- H. Das, N. Dey和V. E. Balas,大型传感器数据的实时数据分析,学术出版社,马萨诸塞州剑桥,美国,2019。
- F。Khoshbin, H. Bonakdari, S. H. Ashraf Talesh, I. Ebtehaj, A. H. Zaji, and H. Azimi, “Adaptive neuro-fuzzy inference system multi-objective optimization using the genetic algorithm/singular value decomposition method for modelling the discharge coefficient in rectangular sharp-crested side weirs,”工程优化,第48卷,第48期6,第933-948页,2016。视图:出版商网站|谷歌学术
- 王永南,“基于递阶模糊小波神经网络的工业机器人自适应滑模控制”,“基于递阶模糊小波神经网络的工业机器人自适应滑模控制”神经计算与应用第31卷第1期11,pp。6925-6958,2019。视图:出版商网站|谷歌学术
- B. H. Kwasnik,《分类在知识表示和发现中的作用》,图书馆的发展趋势,第48卷,第48期1,页22-47,1999。视图:谷歌学术
- 微积分,神经网络,卷。2,Prentice-Hall,纽约,纽约,美国,1994年。
- H. Yoon, J. Lim, J. S. Lim,“利用神经模糊系统重建时间序列GRN”,智能与模糊系统学报,卷。29,不。6,pp。2751-2757,2015。视图:出版商网站|谷歌学术
- m·李S.-Y。Lee和C. H. Park,《神经模糊识别和控制器》,智能与模糊系统学报,第2卷,第2期1,页1 - 14,1994。视图:出版商网站|谷歌学术
- L. A.Zadeh,“模糊套”,信息和控制,第8卷,第2期3,页338-353,1965。视图:出版商网站|谷歌学术
- 洛杉矶·扎德的《模糊集和信息粒度》模糊套,模糊逻辑和模糊系统:选定的论文《世界科学》,新加坡,1996。视图:谷歌学术
- L. A.Zadeh,“朝着模糊信息造粒理论及其在人类推理中的中心性和模糊逻辑”模糊集与系统,第90卷,第5期。2,第111-127页,1997。视图:出版商网站|谷歌学术
- C. Pradhan,H. DAS,B. Naik和N. Dey,生物医学信号处理中的信息安全研究手册,IGI Global,Hershey,Pa,美国,2018年。
- J. Nayak,B. Naik,A.K.Jena,R.K. Barik和H. DAS,“自然启发了云计算的优化:应用和挑战”优化的云计算:基础、应用和挑战,第1-26页,施普林格,Cham,瑞士,2018。视图:谷歌学术
- B. S. P. Mishra, H. Das, S. Dehuri和A. K. Jagadev,优化的云计算:基础、应用和挑战, vol. 39,施普林格,柏林,德国,2018。
- M.溃败,A.K.Jena,J.K.溃败和H. DAS,“教学 - 学习优化基于汇率预测的级联低复杂性神经网络模型”智能智能计算和应用,pp。635-645,Springer,新加坡,2020。视图:谷歌学术
- N. dey,H. das,B. naik和H. S. Behera,智能医疗保健管理的大数据分析,学术出版社,马萨诸塞州剑桥,美国,2019。
- A. K. Sahoo,S. Mallik,C.Pradhan,B.S.P.Mishra,R.K.Barik和H. DAS,使用大数据分析的智力 - 基于智力的健康建议制度“智能医疗保健管理的大数据分析,pp。227-246,学术出版社,剑桥,马,美国,2019年。视图:谷歌学术
- N. Dey, A. S. Ashour, H. Kalia, R. Goswami和H. Das,医学决策中的组织病理学图像分析,IGI Global,Hershey,Pa,美国,2019年。
- J.-S.R. Jang,“ANFIS:基于自适应网络的模糊推理系统”,IEEE在系统,人和控制论上的交易,第23卷,第2期。3,第665-685页,1993。视图:出版商网站|谷歌学术
- A. Ghosh, B. Uma Shankar, S. K. Meher,《神经模糊分类的新方法》,神经网络,卷。22,没有。1,pp。100-109,2009。视图:出版商网站|谷歌学术
- S. Ghosh, S. Biswas, D. Sarkar,和P. P. Sarkar,“一种新的数据挖掘神经模糊分类技术”,埃及信息学杂志,卷。15,不。3,pp。129-147,2014。视图:出版商网站|谷歌学术
- 帕尔和米特拉,《多层感知器、模糊集和分类》,神经网络学报,第3卷,第2期。5,第683-697页,1992。视图:出版商网站|谷歌学术
- A. T. Azar和A. E. Hassanien,“使用神经模糊分类器的医疗大数据降维”,软计算第19卷第2期4, pp. 1115-1127, 2015。视图:出版商网站|谷歌学术
- H. Das, A. K. Jena, J. Nayak, B. Naik,和H. S. Behera,“一种新的基于粒子群算法的反向传播学习- mlp (PSO- bp - mlp)用于分类”,在数据挖掘中的计算智能,卷。2,pp。461-471,斯普林克,新德里,印度,2015年。视图:谷歌学术
- R. Sahani,C.溃败,J.C.Badajena,A.K.Jena和H. DAS,使用数据挖掘技术进行入侵检测,“计算、分析和网络的进展,pp.753-764,Springer,Singapore,2018。视图:谷歌学术
- H. Das, B. Naik,和H. S. Behera,“糖尿病疾病(DMD)的分类:一种数据挖掘(DM)方法”计算、分析和网络的进展,pp。539-549,Springer,新加坡,2018年。视图:谷歌学术
- L. I. Smith,“主成分分析教程”,2002,http://www.cs.otago.ac.nz/cosc453/student_tutorials/principal_components.pdf.视图:谷歌学术
- S. Kar, S. Das, P. K. Ghosh,“神经模糊系统的应用:简要回顾和未来概述”,应用软计算, vol. 15, pp. 243-259, 2014。视图:出版商网站|谷歌学术
- S. K. Meher,《神经模糊网络的有效模式分类模型》,软计算第21卷第2期12, pp. 3317-3334, 2017。视图:出版商网站|谷歌学术
- Viharos和k.b. Kis,“神经模糊系统及其在技术诊断和测量中的应用综述”,测量,卷。67,pp。126-136,2015。视图:出版商网站|谷歌学术
- K. V. Shihabudheen和G. N. Pillai,《神经模糊系统的最新进展:一项调查》以知识为基础的系统,第152卷,第136-162页,2018。视图:出版商网站|谷歌学术
- A. K. Das和D. K. Pratihar,“一种基于神经模糊系统的多目标优化方法,以捕获工程过程中固有的模糊性,”以知识为基础的系统,第175卷,第1-11页,2019年。视图:出版商网站|谷歌学术
- I.Škrjanc,J. A IGLESIAS,一个桑切斯,D. Leite,E. Lughofer和F. Gomide,在聚类,回归,识别和分类中演变模糊和神经模糊方法:调查,“信息科学,第490卷,第344-368页,2019。视图:出版商网站|谷歌学术
- C. A. Murthy,“桥接特征选择和提取:复合特征生成”,IEEE关于知识和数据工程的交易,卷。29,不。4,pp。757-770,2017。视图:出版商网站|谷歌学术
- S. Chattopadhyay,“一种诊断抑郁症的神经模糊方法”应用计算机与信息学,卷。13,不。1,pp。10-18,2017。视图:出版商网站|谷歌学术
- S. Ibrahim,P.Chowriappa,S. Dua等,“使用数据自适应神经模糊推理分类器的糖尿病分类,”医学与生物工程与计算机,第53卷,第53期12, pp. 1345-1360, 2015。视图:出版商网站|谷歌学术
- P. F. Alvanitopoulos, I. Andreadis, and A. Elenas,《建筑物地震损害分类的神经模糊技术》,测量,卷。43,不。6,pp。797-809,2010。视图:出版商网站|谷歌学术
- 多发性硬化症。陈,“在线留言调度的神经模糊方法”,人工智能的工程应用,卷。38,pp。59-69,2015。视图:出版商网站|谷歌学术
- M.Azhari和Y.J.Kumar,“使用神经模糊方法提高文本摘要”信息通信学报, vol. 1, no. 14, pp. 367-379, 2017。视图:出版商网站|谷歌学术
- H. R. Singh,S.K. Biswas和B.Purkayastha,“使用动态聚类和GSS规则生成的神经模糊分类技术”计算和应用数学杂志,第309卷,第683-694页,2017。视图:出版商网站|谷歌学术
- M. Nilashi, H. Ahmadi, L. Shahmoradi, O. Ibrahim,和E. Akbari,“使用神经模糊技术集合预测肝炎疾病诊断的方法”,感染与公共卫生杂志,卷。12,不。1,pp。13-20,2019。视图:出版商网站|谷歌学术
- K.V. Shihabudheen,M.Mahesh和G. N.Pillai,“基于粒子群优化的基于极端学习神经模糊系统的回归和分类”具有应用的专家系统,卷。92,pp。474-484,2018。视图:出版商网站|谷歌学术
- K. Polat和S.Güneş,“基于主成分分析和适应性神经模糊推理系统的专家系统方法,以诊断糖尿病疾病”数字信号处理,第十七卷,第二期4,pp。702-710,2007。视图:出版商网站|谷歌学术
- X. Wang和K.Paliwal,“特征提取和维数减少算法及其在元音识别中的应用”,模式识别第36卷第2期10,pp。2429-2439,2003。视图:出版商网站|谷歌学术
- A.T.Azar,“神经模糊特征选择方法基于语言诊断的语言诊断”国际建模,识别和控制杂志,卷。22,没有。3,pp。195-206,2014。视图:出版商网站|谷歌学术
- A. Keles,A. Samet Hasiloglu,A.Keles和Y. Aksoy,“使用Nefclass-J的神经模糊分类”前列腺癌,“生物与医学计算机,卷。37,不。11,PP。1617-1628,2007。视图:出版商网站|谷歌学术
- B. Gabrys,“从数据中学习混合神经模糊分类器模型:结合还是不结合?”模糊集与系统第147卷1,页39-56,2004。视图:出版商网站|谷歌学术
- E.D.Übeyli,“用于使用Lyapunov指数进行ECG信号分类的自适应神经模糊推理系统”Biomedicine中的计算机方法和程序第93卷第5期3,页313-321,2009。视图:出版商网站|谷歌学术
- V. Kolodyazhniy,F. Klawonn和K. Tschumitschew,“一种神经模糊的维度减少和应用程序”,“国际不确定,模糊与知识系统杂志,卷。15,不。5,pp。571-593,2007。视图:出版商网站|谷歌学术
- A. Schclar, L. Rokach,和A. Amit,“基于降维的分类器集合”,智能数据分析第21卷第2期3, pp. 467-489, 2017。视图:出版商网站|谷歌学术
- 巴赫和利奇曼,UCI机器学习知识库加州大学欧文分校信息与计算机科学学院,加州,美国,2013。
- J.Alcala-Fdez,A.Fernandez,J. Luengo等,“龙骨数据挖掘软件工具:数据集存储库。集成算法和实验分析框架,“多值逻辑与软计算学报,第十七卷,第二期2-3,页255-287,2011。视图:谷歌学术
- J.demšar,“多个数据集的分类器的统计比较”机床学习研究,卷。7,pp。1-30,2006。视图:谷歌学术
- r·a·费雪统计方法与科学推理,哈夫纳出版有限公司,纽约,纽约,美国,第2版,1956年。
- J. W. TUKEY,“比较各个手段在方差分析中,”生物识别技术,第5卷,第5期。2,页99-114,1949。视图:出版商网站|谷歌学术
- C. W. Dunnett,“一种将几种治疗方法与对照组进行比较的多重比较程序,”美国统计协会杂志,第50卷,第5期。272,页1096-1121,1955。视图:出版商网站|谷歌学术
- M. Friedman,“使用等级来避免方差分析中隐含的正态假设”,美国统计协会杂志,第32卷,第2期2000,页675-701,1937。视图:出版商网站|谷歌学术
- M. Friedman,“对M $排名问题的重要性的替代测试的比较”数理统计年鉴,第11卷,第5期。1,第86-92页,1940。视图:出版商网站|谷歌学术
- R.L.Iman和J. M. Davenport,“FBIETKAN统计部的关键地区的近似”,统计通讯-理论与方法,第9卷,第5期。6,页571-595,1980。视图:出版商网站|谷歌学术
- S.García,A.Fernández,J.Luengo和F. Herrera,“高级非参数测试,用于计算智能和数据挖掘实验设计中的多种比较:权力实验分析”信息科学,卷。180,没有。10,pp。2044-2064,2010。视图:出版商网站|谷歌学术
- J. Luengo,S.García和F. Herrera,“关于使用神经网络的实验使用统计测试的研究:分析参数测试条件和非参数测试,”具有应用的专家系统第36卷第2期4, pp. 7798-7808, 2009。视图:出版商网站|谷歌学术
版权
版权所有©2020 Himansu Das等。这是分布下的开放式访问文章创意公共归因许可证,允许在任何媒介上不受限制地使用、传播和复制,但必须正确引用原作。