文摘
帕金森病(PD)是一种常见的神经退行性疾病,这吸引了越来越多的关注。许多人工智能方法被用于PD的诊断。在这项研究中,一个增强模糊k最近的邻居(FKNN)方法的早期诊断PD基于声音测量。拟议的方法,称为CBFO-FKNN进化基于实例的学习方法,是由耦合混沌细菌觅食优化与FKNN进行高斯变异(CBFO)方法。CBFO技术有效的集成FKNN参数优化问题的解决。的有效性提出CBFO-FKNN相比是严格的PD数据集的分类准确性,敏感性,特异性,AUC(接受者操作特征曲线下面积)。仿真结果表明该方法优于其他五FKNN模型基于拍频振荡器,粒子群优化,遗传算法,果蝇优化,和萤火虫算法,以及三种先进的机器学习方法包括支持向量机(SVM),与当地上优于SVM特征选择,和内核极端学习机在10倍交叉验证方案。本文给出的方法具有很好的前景,这将带来巨大的方便临床医生在临床诊断做出更好的决定。
1。介绍
帕金森病(PD),中枢神经系统退行性疾病,是第二个最常见的神经退行性疾病(1]。PD患者的人数迅速增加在全球范围内(2在亚洲),特别是在发展中国家(3]。尽管它的根本原因是未知的,可以显著缓解与帕金森病相关的症状,如果发现在疾病的早期阶段4- - - - - -6]。PD特点是震动,刚性,减缓运动,运动症状不对称,受损的姿势(7,8]。研究表明发声和言语障碍也普遍PD患者(9]。事实上,发声和言语障碍可以出现在PD患者多达五年在临床诊断和疾病(10]。与帕金森病相关的语音障碍包括言语障碍,障碍在声襞振动,构音障碍,残疾音素的正确阐明演讲中(11,12]。小et al。13)第一次试图识别PD患者dysphonic指标使用支持向量机(SVM)的组合,高效的学习机器,和特征选择的方法。研究结果表明,该方法有效地识别PD患者只有四个dysphonic特性。
受的结果小et al。13),许多其他的研究人员在进行研究的使用机器学习技术诊断PD病人在同一数据集(以下牛津数据集)。在[14),Das为PD的诊断分类比较分数之间的人工神经网络(ANN), DMneural,回归和决策树。92.9%的ANN分类器产生最好的结果。在[15],AStrom等人设计了一种并行前馈神经网络系统,取得了8.4%的改善PD分类。在[16),萨卡尔等人提出了一个方法,结合支持向量机和特征选择使用互信息来检测PD和获得92.75%的分类精度。在[17),由李等人开发的一种PD检测方法使用SVM和fuzzy-based非线性变换方法取得了最大的分类精度为93.47%。在另一项研究中,Shahbaba et al。18)相比,非线性模型的分类精度基于狄利克雷的组合过程,多项logit模型,决策树、支持向量机,产生分类得分最高的87.7%。在[19),Psorakis等人提出了改进的融合方法和预测模型,对多级mRVMs。改进的模型实现了89.47%的准确性。在[20.),郭等人提出了一个PD检测方法结合最大分类精度为93.1%的遗传编程和期望最大化算法(GP-EM)。在[21],Luukka相似性分类器和特征选择方法使用模糊熵检测PD的措施,和平均分类精度达到85.03%。在[22),Ozcift等人提出了旋转森林系综分类器使用相关法识别与特征选择PD患者;该模型的分类精度最高达到了87.13%。在[23],Spadoto等人使用基于进化论的组合技术和优化路径森林(OPF)分类器检测PD的最大分类精度为84.01%。在[24),Polat综合加权模糊c均值clustering-based特性(FCMFW)资讯分类器,这产生了一个PD分类精度为97.93%。在[25),陈等人结合模糊k最近的邻居分类器(FKNN)与主成分分析(PCA-FKNN) PD信号检测方法;该诊断系统的最大分类精度达到了96.07%。在[26),左等人开发了一个PSO-enhanced FKNN PD的诊断系统平均分类精度为97.47%。在[27- - - - - -29日],先生等人提出了一种基于投影学习元认知径向基函数网络(PBL-McRBFN)的方法对PD的预测,取得了测试精度96.87%的基因表达数据集,99.35%标准数据集,步态PD的数据集,84.36%和82.32%的磁共振图像。在[30.),提出了混合智能系统PD检测包括几种特性预处理方法和分类技术使用最小二乘支持向量机等三种监督分类器,概率神经网络,和一般回归神经网络;实验结果给出了最大PD检测的分类精度为100%。此外,在[31日),完全懂得等人开发了一个旋转森林整体资讯分类器的分类精度为98.46%。在[32),沈等人提出了一个提高SVM基于果蝇优化算法,并实现了96.90%的分类精度为PD的诊断。在[33],北京的设计最大相关最小冗余(mRMR)特征选择算法的复数人工神经网络诊断PD,并获得98.12%的分类精度。在[34),陈等人提出了一个高效的混合内核极端特征选择方法学习机器。实验结果表明,该方法可以实现分类精度最高的96.47%,平均精度95.97%的简历超过10分的10倍。在[35],蔡等人提出了一个最优支持向量机(SVM)基于细菌觅食优化(拍频振荡器)结合救援特征选择预测PD,实验结果表明,该框架表现出良好的分类性能,优越的分类精度为97.42%。
不同的工作小et al .,人形et al。36]设计了语音实验持续元音,单词,和句子从PD患者和控制。本文报道,持续的元音有更多PD-discriminative权力比孤立的单词和短句。研究结果利用支持向量机分类器实现了77.5%的准确率。从那时起,一些作品已经被提议使用这个PD检测PD数据集(以下伊斯坦布尔的数据集)。Zhang et al。37)提出了一种PD分类算法,集成multi-edit-nearest-neighbor算法集成学习算法。该算法取得了较高的分类精度和稳定性与其它算法相比。Abrol et al。38)提出了一个内核字典稀疏贪婪算法分类任务,与内核K-singular值分解算法和内核多级字典学习算法。方法取得了平均分类精度为98.2%和99.4%的最佳精度伊斯坦布尔PD和多种类型的录音数据集。在[39),作者调查了六个分类算法,包括演算法、支持向量机、神经网络与多层感知器(MLP)结构,系综分类器,再,朴素贝叶斯,和提出了特征选择算法包括套索,基于最大相关最小冗余、救灾、和地方学习在伊斯坦布尔PD数据集特征选择。本文表明,应用特征选择方法大大提高分类的准确性。基于支持向量机和资讯分类器与当地学习获得的特征选择最优预测能力和执行时间。
如上所示,安和支持向量机被广泛应用于帕金森病的检测。然而,理解安和支持向量机的基本决策过程由于其黑箱特点是困难的。安和SVM相比,FKNN是简单得多、产量更容易解释的结果。FKNN [40,41传统的分类器,提高版本k最近的邻居(资讯)分类器,已经被广泛的研究以来,首次提出使用诊断的目的。近年来,许多变体版本的然而,基于模糊集理论和一些扩展开发,如模糊粗糙集,直觉模糊集,2型模糊集和基于可能性理论的资讯42]。FKNN允许通过引入模糊不精确知识的表示措施,提供一个强大的方法之间的相似性描述实例。在FKNN方法、模糊集理论引入资讯,将隶属度分配给不同的类,而不是他们的距离k最近的邻居。因此,每个实例被分配一个类的成员值而不是二进制值。在投票阶段,最高的类成员函数值被选中。然后基于这些属性,FKNN已经应用于许多实际问题,如医疗诊断问题[25,43[],蛋白质识别和预测问题44,45[],破产预测问题46[],边坡坍塌预测问题47[],灌浆活动预测问题48]。
FKNN的分类性能很大程度上依赖于它的调优参数,小区大小(k)和模糊强度(米)。因此,前两个参数应该精确地确定FKNN应用于实际问题。几项研究关于参数调优FKNN已经进行。在[46),陈等人提出了基于粒子群优化(PSO)的方法自动搜索两个FKNN的调优参数。根据研究结果,提出的方法可以有效地应用于破产的预测问题。最近,程et al。48)开发了一个微分进化优化方法来确定最合适的调优参数的FKNN并成功地应用于注浆在建筑业活动的预测问题。后来,程et al。47]提议使用萤火虫算法调优hyperparameters FKNN模型。然后FKNN模型应用于污水崩溃的预测问题。实验结果表明,开发的方法优于其他常见算法。细菌觅食优化(拍频振荡器)方法(49),一个相对较新的群体智能算法,模拟几种细菌的合作觅食行为多维连续搜索空间,因此,有效地平衡勘探和开发活动。自推出以来,拍频振荡器被巧妙地引入实际优化问题(50- - - - - -55),如最优控制器设计问题(49],股指预测问题[56),自动循环检测问题涉及数字图像(57[],谐波估计问题58],有源电力滤波器设计问题[59),尤其是机器学习方法的参数优化(60- - - - - -63年]。在[60),拍频振荡器被介绍给小波神经网络训练和成功应用于负荷预测。在[61年),提出了一种改进的拍频振荡器算法调整模糊支持向量机的参数识别的疲劳状态肌电图信号。实验结果表明,该方法是一种有效的工具来诊断疲劳状态。在[62年),拍频振荡器提出了贝叶斯网络的结构学习。实验结果验证该拍频振荡器算法是一种可行的选择学习贝叶斯网络的结构和竞争激烈也是比较先进的算法。在[63年),拍频振荡器采用优化训练参数出现在自适应神经模糊推理系统的速度控制矩阵变换器(MC)——美联储无刷直流电机(刷)。仿真结果报道,拍频振荡器的方法是优于其他产品表面算法。在[64年),一个基于混沌局部搜索的拍频振荡器(CLS-BFO),提出了引入DE运营商和混沌搜索操作符的趋化性一步原拍频振荡器。
从上面的作品的启发,本文最大的拍频振荡器方法结合FKNN分类性能。为了进一步提高细菌群的多样性,混沌理论结合高斯变异是在拍频振荡器中引入的。然后,生成的CBFO-FKNN模型应用于帕金森病的检测。在我们以前的工作,我们在语音信号的分类应用拍频振荡器PD的诊断(35]。在这项工作中,我们进一步改进了拍频振荡器通过嵌入混沌理论和高斯变异和结合有效FKNN分类器。为了验证的有效性提出CBFO-FKNN方法,基于五个meta-heuristic FKNN算法包括原始的拍频振荡器,粒子群优化(PSO)、遗传算法(GA),果蝇优化(失落),和萤火虫算法(FA)实施严格的比较。此外,先进的机器学习方法,包括支持向量机(SVM),基于内核的极端学习机(凯尔姆经常)方法,并与当地上优于SVM特征选择(标志)65年](LOGO-SVM),比较与建议CBFO-FKNN模型的分类精度(ACC),接受者操作特征曲线下面积(AUC),灵敏度和特异性。实验结果表明,该CBFO-FKNN方法表现出高ACC, AUC,敏感性和特异性在两个数据集。这项工作是我们以前的完全扩展版发表会议论文(66年),提供了进一步的改进方法。
本研究的主要贡献如下:(一)首先,我们引入混沌理论和高斯变异增强的拍频振荡器自适应地确定FKNN的两个关键参数,辅助FKNN分类器在更有效地实现最大的分类性能,更稳定和健壮的五个其他仿生算法相比FKNN模型和支持向量机等先进的机器学习方法和凯尔姆经常。(b)由此产生的模型、CBFO-FKNN介绍区别人与PD的健康的两个PD UCI机器学习库的数据集。它承诺作为PD早期检测的计算机辅助决策工具。
本文的其余部分的结构如下。节2背景资料关于FKNN拍频振荡器,混沌理论和高斯变异。提出的实现方法是解释部分3。节4实验设计是详细描述。并给出了实验结果和讨论部分5。最后,部分6总结了纸。
2。背景信息
2.1。模糊k最近的邻居(FKNN)
在本节中,简要描述FKNN提供。的详细描述FKNN可以称为(41]。在FKNN,样本的模糊隶属值被分配到不同的类别如下: 在哪里我= 1,2,…C,j= 1,2,…K,C代表类的数量,K最近的邻居的数量。模糊强度参数(米)用于确定如何严重时距离加权计算每个会员邻居的贡献值。 。通常选择的价值吗米。此外,欧氏距离,之间的距离x和它的jth最近邻 ,通常选为距离度量。此外,表示模式的隶属程度训练集的类我在k最近的邻居的 。在这项研究中,受约束的模糊成员方法是采用k最近的邻居的每个训练模式(例如,)测定,并加入xk在每一个类被分配
的价值表示数量的邻居属于类。会员值计算(2)应满足以下方程:
后计算所有成员的值查询的示例中,它是分配给类的隶属程度最高,也就是说,
2.2。细菌觅食优化(拍频振荡器)
细菌觅食算法(拍频振荡器)是一种新型表面Passino在2002年提出的优化算法(49]。机制的拍频振荡器模拟接近或远离而感应外围细菌觅食过程中物质的浓度。该方法包含四个基本行为:趋化作用,云集,繁殖,elimination-dispersal。
2.2.1。趋化性
趋化性行为模拟的两个不同位置的变化大肠杆菌细菌依靠鞭毛的旋转,即暴跌和移动。暴跌是指寻找新的方向和移动是指保持方向。具体操作如下:首先,一个单位阶跃某一随机方向移动。如果健身价值的新比前一个更合适的位置,它将继续朝着这个方向;如果新职位的健身价值不是比以前更好,翻滚的操作和执行另一个随机方向移动。当尝试达到的最大数量,趋化性步骤是停了下来。趋化性步骤操作表示如下: 在哪里 的位置吗我细菌。的j,k,l分别显示的数量细菌个体完成趋化作用,繁殖,elimination-dispersal。C(我)是趋化作用的步长我细菌移动。Δ之间的随机向量1,- 1 。
2.2.2。群集
觅食的过程中,细菌社区可以调节细胞与细胞之间的引力和斥力,使细菌的聚集特征和保持相对独立的地位。引力导致细菌聚集,排斥力量细菌分散在一个相对独立的位置来获取食物。
2.2.3。繁殖
拍频振荡器繁殖操作的算法,该算法积累的健身价值的所有职位的细菌个体通过趋化性操作和安排降序排列的细菌。上半年的细菌将自己分成两个细菌通过二分裂,而另一半死去。结果,新的复制细菌个体具有相同的觅食能力作为最初的个体,以及细菌的种群规模总是恒定的。
2.2.4。Elimination-Dispersal
算法已经复制了几代后,细菌将会经历elimination-dispersal在给定概率Ped选择,细菌将会随机分配给新的职位。具体来说,如果一个细菌细菌社区中的个人满足的概率Pedelimination-dispersal,个人失去觅食的原始位置,随机选择一个新职位在解空间,从而促进搜索全局最优的解决方案。
2.3。混沌映射
混乱,作为一种普遍的非线性现象在自然界中,具有随机性的特点,遍历性、对初始条件的敏感性等(67年]。由于遍历性和随机性的特点,混沌运动可以遍历所有的状态在一定范围内根据自己的法律无重复。因此,如果我们使用混沌变量来搜索最优,我们无疑会有更多的优点比随机搜索。混沌的遍历性特点可以用来优化搜索和避免陷入局部最小值;因此,混沌优化搜索方法已成为一种新颖的优化技术。可以使用不同的映射生成的混沌序列等物流地图,正弦地图,歌手地图,正弦地图,帐篷映射。本文一些混乱的地图被尝试和选择最好的一个结合拍频振荡器算法。根据初步的实验中,物流地图取得最好的结果。因此,使用物流所产生的混沌序列图如下: u控制参数,让吗u= 4。当u= 4,物流映射进入彻底的混乱状态。让 和 。
最初的细菌数量映射到生成混沌序列,根据(6),导致相应的细菌数量混乱pch。
2.4。高斯变异
高斯变异操作已经衍生出高斯正态分布,并证明了其有效性与应用程序进化搜索(68年]。这一理论被称为古典进化编程(CEP)。的Gaussian mutations have been used to exploit the searching capabilities of ABC [69年],PSO [70年),和德71年]。同时,高斯变异更有可能创建一个新的后代最初的父母因为附近的狭窄的尾巴。由于这,方程将采取小步骤允许搜索搜索空间的每一个角落探索更好的方式。因此它将提供相对更快的收敛。由高斯密度函数 在哪里是每个成员的方差的人口。
3所示。提出CBFO-FKNN模型
在本节中,我们描述了新的进化FKNN模型基于CBFO策略。FKNN的两个关键参数自动调整基于CBFO策略。如图1,该方法有两个主要部分,包括内部参数优化过程和外部绩效评估过程。内部参数优化过程的主要目的是为了优化参数附近大小(k)和模糊强度参数(米)通过使用CBFO技术通过5倍交叉验证(简历)。然后,获得最佳的值(k,米)输入到FKNN预测模型为了执行PD的诊断分类任务外循环通过10倍的简历。分类错误率作为适应度函数。 在哪里testError我意味着FKNN分类器的平均测试误差。
CBFO战略的主要步骤进行了详细描述所示算法1。
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
4所示。实验设计
4.1。牛津帕金森病数据
牛津帕金森病数据集被小捐赠等。13),简称为牛津数据集。数据集被用来辨别PD患者和健康对照组通过检测不同的元音。各种生物医学测量声音来自31个科目。23的PD患者和8健康对照组。受试者从46到85岁不等。平均每个主题提供持续六个元音“啊…”发声,从1到36秒的长度(13收益率),195年总样本。每个记录受到不同的测量,产生22实际价值功能。表1列出这些22声音特性及其统计参数。
4.2。伊斯坦布尔帕金森病数据
第二个数据集在这项研究中沉积了人形et al。36从伊斯坦布尔,土耳其,伊斯坦布尔缩写为数据集。它包含多种类型的录音,包括持续的元音,数字,从68年学科单词和短句。具体来说,培训从40人收集的数据包括20 PD患者从43 - 77和20名健康人士从45到83,而测试数据收集来自28个不同的PD患者39 - 79不等。在这项研究中,我们选择只有3种持续元音录音/ /,/ o /, / u /,类似牛津PD数据集的数据类型。我们融合在一起,产生了一个数据库包含288持续元音样本,对这些样本进行了分析。如表所示2,一群26线性和基于时频特征提取为每个声音样本。
4.3。实验装置
实验平台上执行的Windows 7操作系统和英特尔(R)至强(R)的CPU e5 - 2660 v3 @ 2.6 GHz和16 gb的RAM。BFO-FKNN, CBFO-FKNN PSO-FKNN、GA-FKNN FOA-FKNN FA-FKNN,支持向量机,凯尔姆经常分类模型用MATLAB实现2014 b。LIBSVM包(72年)是用于支持向量机分类。该算法可以在http://www3.ntu.edu.sg/home/egbhuang是凯尔姆经常用于分类。CBFO-FKNN方法是从头开始实现。扩展成一系列的数据0 1在每个分类。
的参数C和γ在 在SVM和凯尔姆经常使用分类通过网格搜索方法确定;搜索范围被定义为 和 。趋化现象的人口群的大小8日数量25步,游泳4的长度,繁殖数量的3步,elimination-dispersal事件数量2,elimination-dispersal CBFO-FKNN 0.25的概率被选中。趋化性一步值建立了通过试验和错误,如实验结果部分所示。其他四个meta-heuristic算法的初始参数参与培训FKNN被选为试验和错误报告在表3。
4.4。数据分类
一个分层k倍的简历(73年)是用于验证该方法的性能和其他比较模型。在大多数研究中,k给出的值10。在每个步骤中,90%的样本用于形成一个训练集,剩下的样品作为测试集,然后所有10个试验的结果的平均值计算。这种方法的优点是,所有的测试集保持独立,确保可靠的结果。
一个嵌套分层10倍的简历,已广泛应用于先前的研究,用于本研究的目的(74年]。外层循环的分类性能进行了评价。自从10倍简历中使用外循环,一个独立折叠的分类器进行评估数据,和其他九个折叠的数据进行训练。参数优化过程进行内部循环。用5倍的简历内循环,CBFO-FKNN搜寻最优值k和米,支持向量机和凯尔姆经常搜寻最优值C和在剩下的9倍的数据。9折的数据进一步分裂成一个折叠性能评估的数据,和四个折叠的数据进行训练。
4.5。评估标准
ACC, AUC,敏感性和特异性被送往不同的模型的性能进行评估。这些测量值被定义为 TP是真阳性的数量,FN意味着假阴性,TN代表真正的底片,FP是假阳性。AUC [75年ROC曲线下的面积。
5。实验结果和讨论
5.1。基准测试函数验证
为了测试算法的性能CBFO, 23日基准函数包括单峰、多通道,fixed-dimension多通道是用来做实验的。这些函数表中列出4- - - - - -6在昏暗的代表了维度,是搜索空间范围,然后呢是最好的价值。
为了验证该算法的有效性,最初的拍频振荡器,萤火虫算法(FA) [76年),花授粉算法(FPA) (77年],蝙蝠算法(BA) [78年],蜻蜓算法(DA) [79年),粒子群优化(PSO) (80年),和改进的拍频振荡器称为PSOBFO比较在这些问题上。上述算法的参数设置根据他们的原始论文,具体参数值,如表所示7。为了确保获得的结果不是偏见,30个独立实验正在进行。在所有的实验中,人口的数量大小设置为50,最大迭代次数设置为500。
表8- - - - - -10结果平均(Avg),标准偏差(Stdv),不同的算法处理F1-23军衔和整体的问题。应该注意的是,排名是基于30独立实验的平均结果(Avg)为每一个问题。为了直观地比较我们的算法和其他算法的收敛性能,数据2- - - - - -4用对数刻度图反映了收敛行为。在数据2- - - - - -4,我们只从单峰函数,选择典型的函数收敛曲线多峰函数,分别和fixed-dimension多通道功能。单峰F1-F7结果如表所示8。如图所示,优化效果CBFO在F1, F2, F3, F4改进PSOBFO是一样的,但与原拍频振荡器相比性能得到了改进。此外,从排名结果,可以得出结论,与其他算法相比,CBFO F1-F7的最佳解决方案来解决问题。
关于收敛趋势图中描述2,它可以观察到,该CBFO能够快速收敛性和它可以作证优于所有其他方法在处理F1, F2, F3, F4, F5、F7。F1, F2, F3, F4, CBFO已经聚集如此之快在一些搜索的步骤比其他算法。特别是,在处理案件时F1, F2, F3, F4, 250次迭代之后迅速收敛的趋势。
多通道F8-F13的计算结果列在下表中9。这是观察到CBFO达到F8 30-dimension问题的最优解和F12 30分。从结果F9 F10、季和F13问题,它可以同意CBFO收益率PSOBFO相比很有竞争力的解决方案。然而,根据排名,CBFO始终是最好的技术和整体排名显示,拍频振荡器,FA,英航,PSO,平安险,和DA算法分别在接下来的地方。
根据相应的收敛趋势记录图3的相对优越性提出CBFO在解决F8,季,F12测试问题可以被认可。在解决到,CBFO可以支配所有竞争对手在解决F11只在一些迭代。另一方面,方法如平安险,英航,DA, PSO仍然不能提高解决方案的质量在解决到更多的步骤。
F23为F14结果列在下表中10。结果在表10显示,CBFO是最好的算法,可以超越所有其他方法在处理F15问题。在F16 F17 F19,可以看出,所有的算法的优化效果并没有太大的区别。在处理F20情况下,CBFO相比的性能得到了改进PSOBFO原始拍频振荡器和改善。特别是在解决F18,该算法比改进PSOBFO要好得多。从图4,我们可以看到CBFO的收敛速度比其他算法在处理F15 F18 F19, F20。F15,超过所有方法。
为了调查结果的显著差异CBFO比其他竞争对手的Wilcoxon rank-sum测试(81年)在5%的显著性水平也使用。被发表在表的p值比较11- - - - - -13。在每个表中,每个p值不低于0.05以粗体显示的脸。这表明差异不显著。
还提供了在表的p值11F1-F7。指的p值Wilcoxon测试表11,验证了该算法是统计学上有意义。原因是,所有p值小于0.05,除了PSOBFO在F1, F2, F3, F4。根据p值表12,所有值都小于0.05除了F11 PSOBFO问题。因此,它可以通过CBFO的结果在统计上相比其他方法的改善。我们可以看到从p值表13,CBFO算法明显优于PSOBFO,平安险,英航和PSO F14-F23。
结果表明,利用混沌映射策略和高斯变异CBFO技术改善了古典拍频振荡器的功效,以显著的方式。一方面,将混沌映射策略应用于细菌种群初始化过程可以加快算法的初步探索。另一方面,当前最好的细菌添加高斯变异个体的迭代过程有助于跳出局部最优。总之,该CBFO之间可以更好的平衡探测的使用嵌入策略和剥削的趋势。
5.2。结果帕金森病
许多研究已经证明,拍频振荡器的性能可以严重影响趋化性步长C(我)。因此,我们也调查的影响C(我CBFO-FKNN的性能。表14显示的详细结果CBFO-FKNN模型具有不同的值C(我)在两个数据集。在表中,平均结果及其标准差(在括号中)列出。如图所示,CBFO-FKNN模型表现最好,平均精度为96.97%,0.9781的AUC,敏感性96.87%,特异性98.75%C(我牛津数据集)= 0.1,平均精度为83.68%,0.6513的AUC,敏感性96.92%,特异性33.33%C(我)= 0.2伊斯坦布尔的数据集。此外,CBFO-FKNN方法也产生了最可靠的结果与最小标准差C(我)= 0.1和C(我)= 0.2牛津数据集和伊斯坦布尔数据集,分别。因此,0.1和0.2的值选择的参数值C(我)CBFO-FKNN的两个数据集,分别在随后的实验分析。
ACC, AUC,敏感性、特异性和优化(k,米)对值的每一个褶皱通过CBFO-FKNN模型获得C(我)= 0.1和C(我)= 0.2牛津数据集和伊斯坦布尔数据集如表所示15和16,分别。如图所示,每个折叠拥有一双不同的参数(k,米)自参数为每个组折叠数据通过CBFO方法自动确定。最优参数组,FKNN每个折叠产生不同的最优分类性能值。这是由于这两个参数的自适应调整CBFO基于特定分布的每个数据集。
为了调查的收敛行为提出CBFO-FKNN方法,分类错误率和迭代的数量被记录。为简单起见,这里我们以牛津数据为例。数据5(一个)- - - - - -5 (d)显示的学习曲线CBFO-FKNN折叠1,3,5,分别在10倍和7的简历。如图所示,四个健身CBFO聚集成全球最优曲线在不到20迭代。健身曲线逐渐从迭代改进后1到20但没有表现出显著改善迭代20。健身后曲线停止50迭代(迭代)的最大数量。健身曲线迅速减少错误率的进化过程的开始后,继续慢慢减少一定数量的迭代。在后者进化过程的一部分,健身曲线保持稳定,直到停止标准,最大迭代次数,满意。因此,提出CBFO-FKNN模型有效地聚集向全球最适条件。
(一)
(b)
(c)
(d)
验证该方法的有效性,CBFO-FKNN模型相比,其他五个meta-heuristic算法FKNN模型以及其他三个先进的机器学习方法包括支持向量机,凯尔姆经常,基于SVM与当地学习特征选择(LOGO-SVM)。如图6CBFO-FKNN方法表现好于其他竞争对手的ACC, AUC,牛津和敏感的数据集。我们可以看到CBFO-FKNN方法收益率平均ACC价值最高的96.97%,其次是PSO-FKNN, LOGO-SVM,凯尔姆经常,支持向量机,FOA-FKNN FA-FKNN, BFO-FKNN。GA-FKNN所有方法中最糟糕的结果。AUC指标,与FA-FKNN OBF-FKNN获得相似的结果,其次是FOA-FKNN, GA-FKNN, PSO-FKNN, BFO-FKNN,凯尔姆经常,LOGO-SVM, SVM有最坏的结果。灵敏度指标,CBFO-FKNN取得了明显优势,LOGO-FKNN排名第二,紧随其后的是凯尔姆经常,支持向量机,PSO-FKNN, FOA-FKNN FA-FKNN, GA-FKNN。BFO-FKNN有最糟糕的表现。特异性指标,FA-FKNN取得的最大成果,GA-FKNN和FOA-FKNN取得了类似的结果,它排名第二,紧随其后的是BFO-FKNN, PSO-FKNN, CBFO-FKNN和支持向量机。凯尔姆经常LOGO-SVM得到相似的结果,这两个最糟糕的表现。关于伊斯坦布尔的数据集,CBFO-FKNN产生最高的83.68%,结果与ACC而LOGO-SVM和PSO-FKNN方法第二最好的平均收益率ACC值如图7,其次是凯尔姆经常、支持向量机、FOA-FKNN FA-FKNN BFO-FKNN, GA-FKNN。从数据6和7,我们也可以发现CBFO-FKNN可以产生较小的或相对标准偏差比其他同行的两个数据集上的四个性能指标。另外,我们可以发现与当地上优于SVM特征选择可以提高性能的两个数据集。它表明有一些无关的特性或冗余特性这两个数据集。应该注意的是,商标用于特征选择方法,所有的特性都是排名的标志,那么所有递增特征子集进行评估,最后取得的特征子集最好的准确性被选为一个实验。
根据研究结果,提出的性能优越CBFO-FKNN表明,提出的方法是最健壮的工具检测PD的9个方法之一。主要原因可能在于OBL机制大大提高了种群的多样性和拍频振荡器的概率增加逃离局部最优。因此,它得到更多的机会找到最优邻域大小和CBFO模糊强度值,在更有效地辅助FKNN分类器实现最大的分类性能。图8显示训练SVM分类精度达到的表面和凯尔姆经常方法几个折叠的训练数据通过牛津数据集上的网格搜索策略。通过实验过程中,我们可以找到原来的拍频振荡器是更容易过度拟合;介绍了混沌初始化,丰富了初始种群的多样性,以及提高了收敛速度的人口;此外,本文还介绍了高斯变异策略,提高算法跳出局部最优的能力,以减轻FKNN的过度拟合问题分类的过程。
(一)
(b)
(c)
(d)
我们也调查诊断是否受年龄和性别的影响。在此,我们已经例如牛津数据集。数据集是除以年龄(老或年轻)和性别(男性或女性),分别。关于年龄,我们选择的平均年龄65.8岁的分割点。旧的样品组超过65.8,和年轻组的样本是小于65.8。因此,我们可以得到四组数据包括男性,女性组,老组、和年轻组。分类混淆矩阵的四组的结果显示在表中17。如图所示,我们可以发现,在男性团体或女性团体3 PD样本被错误地归类为健康的,健康被误判为PD的样品和2。它表明,性别对诊断结果的影响不大。老组,我们可以发现4 PD样本被错误地认为是健康的。然而,没有一个年轻组的样本,错误地判断了。它表明,旧的语音样本组更容易被错误地预测比年轻的群体。
为了进一步探讨性别和年龄对诊断结果的影响。我们进一步将样品分成男性组和女性组在年轻和年老的前提下和老组和年轻组雄性和雌性的前提下,分别。所以我们可以得到8组如表所示18,详细分类结果显示混合矩阵。如图所示,我们可以发现,样本的概率被错误归类更旧的组和年轻组雄性和雌性的前提。也可以观察到,没有样本被错误地预测在男性和女性群体在年轻人的前提下,同时有一个样本被错误地预测在男性和女性群体在老人的前提下,分别。我们可以得出的结论是,presbyphonic可能发挥混杂作用在女性和男性dysphonic集,和诊断的结果不受性别的影响。
其他方法的分类精度提出了用于PD的诊断比较表19。如图所示,该CBFO-FKNN方法取得了较高的分类精度,因此,它可以作为一种有效的诊断工具。
6。结论和未来的工作
在这项研究中,我们提出了一种新颖的进化基于实例的方法基于一个混乱的拍频振荡器和应用它来区分PD的健康的人。在拟议的方法,混沌理论增强拍频振荡器策略是用于自动确定这两个关键参数,从而利用FKNN充分发挥作用。结果表明该CBFO-FKNN方法优于其他五个FKNN基于表面模型的方法和三种常用的先进的机器学习方法包括支持向量机,LOGO-SVM,凯尔姆经常,各种性能指标。此外,仿真结果表明,该CBFO-FKNN可以作为一种有效的计算机辅助诊断工具对临床决策。通过实验分析,我们可以得出结论,presbyphonic可能发挥混杂作用在女性和男性dysphonic集,和诊断的结果不受性别的影响。此外,旧的语音样本组更容易被错误地预测比年轻的群体。
在未来的研究中,该方法将实现在分布式环境中为了进一步提高PD的诊断效果。此外,实现特征选择使用CBFO策略进一步提高该方法的性能是另一个未来的工作。最后,由于PD的小声音数据集,我们将推广该方法在未来更大的数据集。
的利益冲突
作者宣称没有利益冲突有关的出版的文章。
确认
这项研究支持由中国国家自然科学基金(61702376和61702376)。本研究也由浙江省自然科学基金资助(LY17F020012, LY14F020035 LQ13F020011, LQ13G010007)和中国温州科技计划项目(ZG2017019, H20110003 Y20160070, Y20160469)。