文摘
在这个工作中,一种新颖的混合神经模糊分类器(HNFC)技术提出了生产更多的输入数据分类的准确性。使用广义隶属函数的输入是fuzzified。模糊化矩阵有助于创建输入模式之间的连接和数据集各种类的隶属程度。据,对输入数据执行分类过程。这部小说的方法是应用十基准数据集的数量。在预处理过程中,缺失的数据与平均值代替。然后,应用统计相关数据集选择的重要特征。应用数据转换技术后,归一化的值。最初,模糊逻辑已经申请输入数据集;然后,将神经网络应用于测量性能。 The result of the proposed method is evaluated with supervised classification techniques such as radial basis function neural network (RBFNN) and adaptive neuro-fuzzy inference system (ANFIS). Classifier performance is evaluated by measures like accuracy and error rate. From the investigation, the proposed approach provided 86.2% of classification accuracy for the breast cancer dataset compared to other two approaches.
1。介绍
最近,数据挖掘中起着重要作用的行业和研究机构的可访问性的大量数据,将这些数据转化为信息和知识。主要分类(1是比较的方法确定分类器和预测目标类与一位身份不明的类标签。在训练阶段,它遵循两个阶段;分类器的开发,以及相关的类变量。在测试阶段,一组特性应用于近似的分类器。
在数据分类过程之前,许多预处理程序应用了。人工神经网络(ANN)可以做知识的责任就像人类的大脑。一个受欢迎的值得信赖的分类方法的神经网络多层反向传播网络(2]。和径向基函数(3]是一种支配神经的方法,使用径向基程序。在神经元参数被认为是产生更好的性能。
人工神经网络(ANN)是一个时髦的数据建模方法可以执行智能任务以同样的方式作为人类的大脑。安很适合高精度和重要举措能力的目的。的一个可靠的数据分类方法从多层感知器神经网络领域是反向传播网络(MLPBPN)方法(4]。该神经网络的输出技术是径向基函数的线性组合的输入和神经元的因素。RBFNNs帮助分类、函数逼近和预测时间序列的应用程序。
离散时间线性动力系统(5)是用来制造一种精神的近似。它包括复发性神经网络(RNNs)时变系统。线性定常的子类(LTI)系统,学习数学微分方程是最简单可行的化身。在实验结果中,动态的物理、生物、机械、或化学过程是公认的从实际投入产出的痕迹。使用一种自适应比例积分控制器以及适当的增益变化根据自适应神经模糊推理系统(简称ANFIS)承诺高性能电力驱动模型的参数的差异。
在模糊方法中,所选择的属性与不同群体的隶属程度。神经网络和模糊方法灵活的测量 的相互关系。模糊系统考虑形象以及质量数据。condition-oriented神经模糊方法分为语言模糊建模处理推理和模糊建模技术像Sugeno模型认为准确性6]。
模块化神经网络是将小subcomplete神经网络模型(7]。每个模型函数分别在subportion大模式向量。模块化神经网络有两种方法,即学习和模块化结构,模块化。模块化的学习模式分类的手写印地语字母表。这里,二十四个人subneural网络被认为是第一阶段计算。然后,第一阶段的集体输出应用作为全球神经网络的输入。因此,第二阶段的输出提供所需的给定大训练集的分类。第一阶段训练的神经网络局部梯度下降学习分解输入模式。第一阶段的权重更新映射到全局神经网络。全球神经网络进一步训练集体输出模式的第一阶段计算。这里,分解和复制的概念已经应用于执行分类任务(8]。
时间序列预测模型(9)提出了利用广义回归神经网络。目标是利用其固有的属性产生快和准确的预测。建模的关键决策参与和广义回归神经网络预测。对于每一个建模的决定,提出了一些策略。每种策略分析的预测精度和计算时间。除了建模决策,任何成功的时间序列预测方法必须能够捕获的季节性和趋势时间序列模式发现。有三种不同的预测模型提出了诸如乙状结肠函数回归模型(9)、前馈神经网络和递归神经网络模型。相比,模型训练和验证使用天然气消费数据。
一种新颖的自适应逐步退焊法方法是用于管理感应电动机(IM)转子电阻跟踪问题。设备的可靠性可以预测与实验结果。转子电阻等确定各种参数,灵敏度abd力矩(10]。
遗传优化算法(11)是用于训练神经网络,并Levenberg-Marquardt算法应用于实现乙状结肠的参数模型。的结果,这表明两种神经网络模型执行同样和优于乙状结肠模型。准备使用的模型结合天气预报服务生成日前或天预测和相关地理区域。
风险管理框架是用来表示数字的乘积概率和后果。在传统的方法中,它已经被越来越多的讨论,包括力量的证据结合传统的后果和可能性。它还集中在解决这些挑战和风险对全数字分析和可视化表达。在建议的方法解决的挑战,形成一个模糊逻辑索引基于模糊逻辑理论,这使得转移从一个语言变量来一个数字。然后,它可以应用到节点规模指数来表达其实际应用。它使一种改进的可视化风险、风险管理、系统分析和风险沟通,对数字化风险。
基于规则的去噪方法(12分为两类:可以专注于可解释性的语言模糊建模,主要是Mamdani模型,主要集中在准确性和模糊建模,Sugeno模型或Takagi-Sugeno-Kang(啧啧)模型。这种基于规则的方法通常适用于自适应神经网络的概念。一种自适应网络(13)是一个网络的节点和链接功能相当于一个模糊推理系统。
,假定的条件下生成(14]。各个节点连接和一些重要的参数。Sugeno模型表示为模糊规则 在哪里和是规则的模糊集和““是一个输出函数。
摘要本研究工作安排如下:部分2描述了在这一研究领域进行相互关联的概念。部分3解释了人工神经网络分类方法功能部分4解释了体系结构和时滞分类器大小的学习方法。部分5解释了一步一步的程序提出的去噪方法。部分6讨论了性能分析和结果,最后,部分7总结了纸。
2。相关工作
模糊神经网络(FNN)提出,有练习的主要目的数值关系和实践面向数值和感知的信息。它可以减少错误率和找到连接权重和偏置值。粒子群优化(2)是与反向传播训练数据集的方法。它产生最大的预测的准确性。
一种新颖的混合预测方法(15)是基于萤火虫算法。优化器,一个算法结合自适应神经模糊推理系统评估的碎片。该混合模型评估基于统计标准系数等计算和纳什和拍摄的。自适应神经模糊推理系统(简称ANFIS) [16)提出了确定轴向速度和流深度在90°弯曲。速度和深度数据流五放电率应用培训和测试模型。简称ANFIS训练阶段,两个反向传播算法和一个混合的反向传播和最小二乘法。在该模型设计中,网格划分和subclustering方法应用生成的模糊推理系统。
模糊集理论(17)是用于描述一个重要参与数据挖掘技术的模糊概念。它管理解释和主观信息。滑动窗口的方法是用于生产序列的时间序列,然后分析模糊项集。它处理时态数据来确定关联规则。
自适应遗传模糊系统(AGFS) [18)是用于优化医疗数据分类规则。主要目标是生产优化规则的数据。模糊集理论(19在机器学习处理技术应用自动感应的方法和模式从经验中提取数据。
一种新颖的模糊分区学习方法(20.)用于应用人工免疫系统方法对提高分类精度。一个高效的crm数据挖掘框架(21)是用于建立紧密的客户关系和处理组织和客户之间的关系,以一个决定。数据库的开发,数据库中的数据量的增加迅速、敏感数据通过应用一些安全保护机制。
遗传算法(GA) [22)是确定最优的选择自适应神经模糊推理系统(简称ANFIS)隶属函数和广义的进化设计集团的数据处理方法(GMDH)结构侧堰流量系数的预测。奇异值分解)方法应用于测量的线性参数在GMDH简称ANFIS分类器和线性系数向量。调查也可以执行测量的不确定性的定量性能所有类型的模型。
多层感知器网络(23与三种类型的训练算法应用包括可变学习速率(MLP-GDX),弹性反向传播(MLP-RP),和Levenberg-Marquardt (MLPLM) [23,24]。这些方法研究了基于近似沉积物运移的能力在一个干净的管道。ANN模型,采用体积含沙量(CV)、中值相对大小的粒子平均粒径直径比水力半径、摩擦系数和整体沉积物作为输入参数比其他现有的模型更准确。
subfeature选择的属性24)利用模糊方法在分布式环境中保护用户的隐私。提出了一种有效的知识提取方法可以获得知识的规则。首先,训练模型和修剪决策树优化规则。correlation-oriented特性选择介绍线性搜索方法心律失常疾病分类。
一种自适应neuro-fuzzy-embedded减法聚类(ANFIS-SC) [25)方法是申请评估桥台冲刷坑深度与清水条件下均匀床沉积物。ANFIS-SC方法的准确性比其他两个简称ANFIS方法嵌入模糊 - - - - - -意味着集群(26)和网格划分。在桥台冲刷坑深度的决定性因素包括粒子的平均直径的比值大小桥台横向长度,多余的桥台的弗劳德数,形状系数,方法流深度桥台横向长度的比值。
遗传算法(27用于训练神经网络,分析了计算神经网络的误差收敛率。一种混合模糊min-max神经网络(28),提出了适合异常值检测。混合算法对遗传算法和粒子群优化技术也可以应用于一个模糊神经网络模型。模糊小波神经网络(FWNN)技术是另一种方法来获得更好的分类精度。
多层感知器神经网络(29日)将人工神经网络应用到接网络的输入层的基本特征。模糊径向基网络设计方法(多项式30.,31日适用于细粒度的信息分类。一个自动化医疗分类技术(32]介绍了小波变换(WT)。它有助于医护人员的决策支持系统。
神经网络情绪分类方法(33,34摘要等)和概率神经网络方法使用粒度的不同阶段词比较属性。
3所示。简称ANFIS架构
考虑到模糊推理方法有两个输入值,如“”和“ ,”和““是输出。Sugeno模糊方法有两个if - then规则约束如图1:(我)如果是有价值的和是有价值的 ,然后 (2)如果是有价值的和是有价值的 ,然后
层1:所有节点表示 ,“”或““是输入节点””,(或 )是一个关联的节点。
由广义贝尔函数
在哪里 参数设置,当参数修改,因此不同的钟形函数。这些参数被称为作为前提参数。
层2:,所有节点是固定的。它的输出是由发现输入的产物。它是由
第三层:节点评估的比例th规则的加权值的总和值的加权规则。它是用
第四层:在所有节点在本质上是自适应的。它是用 在哪里代表了一种归一化加权值的输出层 是重要的属性集合。
第五层:一个节点可以测量结果值输入的总和。它是用
这个网络是一样的Sugeno模糊模型对功能。但structure-wise,它是不同的。
4所示。径向基函数网络
4.1。体系结构和学习方法
激活阶段隐层用 ,“”表示输入向量,表示向量的相似度量 , 表示数是th径向基函数。加权值没有指定输入和隐藏层如图2。
通常情况下,代表的高斯函数
激活阶段测量的th隐藏层是最大的。RBFN的总体计算输出的加权和输出相关的属性。它是由
在哪里被表示为之间的连接权重和输出。它表示在
金融中间人和RBFN都有一个过程,它可以生成一个自拍radical-shaped函数。在接下来的约束,RBFN和FIS平等的功能:(我)RBFN和FIS利用相同的聚合方法,如加权和加权平均(2)RBFN的接受域单元的数量相当于if - then规则条件的模糊方法(3)随后的径向基函数和模糊规则表示具有相似的响应与输入
5。该方法
该方法可以执行所选择的特性从一组输入原型,fuzzifies相当于原型的措施,并应用类的隶属函数的原型。考虑输入模式( ),组类( ),和属性( )。该分类方法如图3。
该技术包含三个步骤:
步骤1。在这个模糊化阶段,一个矩阵的顺序 产生包含隶属度的模式。在这个矩阵表示为每个数据元素 ,在哪里代表了th输入模式矢量值, 和 。隶属函数表示为
输入模式向量””是由
使用广义钟形隶属函数基于三参数等 , ,和所给出的
合成的会员模式向量矩阵用
在哪里的成员th输入值的模式””, 。
步骤2。在这一步中,MLPBPN构造。它转换成一个矩阵值 向量通过置换。这个转换向量应用价值作为分类器的输入。
独特的MLPBPN方法有一个输入和输出层和至少一个隐藏层。它演示了两种类型的程序:前馈反向传播。在前馈方法相关联的节点。输入节点与隐藏节点,和隐藏的元素是完全与输出层的元素。输入和隐藏节点与加权值。所有加权值的节点优先任意如图4。
在反向传播方法中,错误和学习过程的发生,如修改加权值和偏见是反向传播路线开始从内部的输出电平值。这个过程是重复很多次。主要目标是减少之间的均方根误差预测和实际值完成的制备过程或最终的条件达到[35- - - - - -39]。
的预测输出元素””是由
在哪里的总输入元素”“在这个模型。总输入值表示为一笔连接的优点和前一个阶段的结果。它表示在
在哪里从元素”连接的连接强度“在前面的阶段单位” 。”是输出的元素””前一个阶段,元素的偏见。
总平方误差值的预测结果是衡量
反向传播网络模型的加权值更改为减少这种错误。它表示在
最终的输出阶段”“重量值, ,是由
在哪里表示学习速率。在这里,重量更新公式表示为
同样,偏差执行升级
在MLPBPN方法中,只有一个隐藏层。神经网络方法使用梯度下降法与动力监管条件。隐藏和最后一层按照谭s形的传递函数。
输入层节点相当于数据集的输入特征量。同样,合成节点的计数等于类标签的数量。隐藏层中的元素表示l在
步骤3。在这去模糊化阶段,提出了分类器分类和defuzzifies激活的结果。输入选择原型类”“会员最高的标签。
5.1。详细的过程
(步骤1)应用数据清洗预处理的数据执行通过消除或减少噪音。属性缺失值取代了它的平均值。(步骤2)应用数据选择的统计相关性分析是应用于去除重复的特性,然后,只能收集相关的特性。(步骤3)应用转换的数据标准化应用于数据集。神经网络技术包括转换的值从−1.0 + 1.0。(步骤4)数据分为两个子集,预处理后训练和测试数据集。(步骤5)在训练阶段,数据应用于提出了创建一个原型系统。它还实现了两个时滞和简称ANFIS方法开发其他分类器的大小。(步骤6)在测试阶段,三个分类,比如NFS,时滞,大小和简称ANFIS应用计算性能。(步骤7)这些模型的性能的措施进行了比较。
具体过程如图5。
6。结果和分析
在我们的实验中,三种分类方法,如HNFC时滞,大小和简称ANFIS是应用于基准数据集,即原发性肿瘤,乳腺癌,大肠杆菌、蘑菇、糖尿病、电离层、肝脏紊乱,Credit-g, Anneal-org,虹膜。从机器学习库使用R工具,有50000条记录为每个数据集创建并比较其性能。在乳腺癌数据集,它有十多的特性,比如年龄、mefalsepause,肿瘤大小,inv-falsedes, falsede-caps, deg-malig,乳腺癌、breast-quad, irradiat。所有的特性都多元分类类型的属性。
性能比较是通过考虑各种指标如准确性、TP-rate, FP-rate,精度, - - - - - -测量,均方根误差(RMSE)。从表中给出的实验结果1为上述指定数据集,提出HNFC方法产生更好的分类精度比其他两种方法如时滞,简称ANFIS大小。
6.1。性能的措施
分类器的性能评估按以下指标:
但是。混淆矩阵
混淆矩阵是一个例子,给出了详细的可视化的分类性能。每一列表示一个预测变量的记录。行表示记录在一个实际的变量。(我)真阳性数的正确和积极的分类对象(2)假阳性错误分类实例的计算,是积极的(3)假阴性错误分类实例的计算,是负的(iv)真阴性的计数正确分类的对象是负的
正确分类的准确性取决于实例
预测的关系是由积极的对象准确
消极的关系对象错误归类为积极为代表
积极的关系计算适当分类的对象
在某些情况下,最大回忆值可能是重要的。提高性能的措施,精密回忆值都为代表
从表2,而乳腺癌的数据集作为输入和应用于时滞,简称ANFIS大小等现有分类器,它产生的准确性分别为83.3%和82.2%。但与此同时,提出了混合神经模糊分类,它给了86.2%。它是相对高于其他两种方法。均方根误差也低(0.323)拟议的系统。时间复杂度高,相比其他的决策树分类方法。但是这个缺点是可以克服的通过产生最大分类的准确性。提出算法的现有方法已申请其他数据集,如糖尿病、肝脏疾病,大肠杆菌原发肿瘤,蘑菇,电离层Credit-g, Anneal-org,虹膜。性能对比如图6和7。
图8表示乳腺癌的各种特性数据集和数据集的各个数据项之间的关系。红色圆圈表示复发事件,蓝色表示没有复发事件数据集。
从上面的实验图,为乳腺癌的数据集,一个的实例数量分布和类标签所示红色和蓝色圆格式。对各种属性值、分布范围和价值将会不同。图表表明精度等各种现有算法的径向基函数神经网络和自适应基于网络的模糊推理系统;提出混合神经模糊分类器提供了更好的分类精度的各种输入数据,如乳腺癌,糖尿病,大肠杆菌,肝脏疾病,原发性肿瘤,蘑菇,电离层Credit-g, Anneal-org,虹膜。
7所示。结论
在本文中,我们将提出HNFC方法与时滞,简称ANFIS大小分类。试验了十个UCI库数据集分类器。从实验结果,提出了分类器产生更好的性能在86.2%的分类数据集相比,现有的算法。同样,这个分类器在分类输入数据提供了更好的性能。它还提供了一个宝贵的贡献的传统分类方法的性能改进的数据挖掘研究领域。仍然有一个研究开放其他分类器应用于预测基于疾病的医疗记录。
数据可用性
使用的数据来支持本研究的结果都包含在这篇文章。
的利益冲突
作者宣称没有利益冲突,关于这篇文章的出版。
确认
Alagar Karthick欣然承认该组织fqm科尔多瓦大学- 383年,西班牙的荣誉访问研究工作。