研究文章|开放获取
Mahnaz Behroozi Ashkan萨米, ”帕金森病检测的多分类器框架基于各种声音测试”,国际期刊的远程医疗和应用程序, 卷。2016年, 文章的ID6837498, 9 页面, 2016年。 https://doi.org/10.1155/2016/6837498
帕金森病检测的多分类器框架基于各种声音测试
文摘
最近,语音模式分析应用程序构建预测telediagnosis和遥控模型诊断帕金森病(PD)吸引了许多研究者。为此,一些数据集的声音样本存在;UCI数据集命名为“帕金森的演讲与多种类型的录音数据集“有多种声音测试,包括持续的元音,单词,数字,和短的句子从一组编译说话的练习对健康和患有帕金森症(PWP)。一些研究人员声称,总结每个主题的多个记录集中趋势和离散指标是一种有效的策略为PD建立预测模型。然而,他们忽略了这点,PD患者可能表现出更多的发音困难某些方面比其他的条件。因此,总结声乐测试可能会失去有价值的信息。为了解决这个问题,必须采取分类设置什么一直说。作为一个解决方案,我们引入了一个新的框架,适用于一个独立的分类器对每个声音测试。最终的分类结果将是一个多数投票从所有的分类器。当我们的方法有基于过滤器特征选择,提高分类精度15%。
1。介绍
帕金森病是在1817年首次引入医生詹姆斯帕金森“摇晃麻痹”1]。这是第二常见的神经系统疾病之后阿尔茨海默和主要是普遍长老(2,3]。帕金森病是一种进行性疾病的大脑受损。它会引起各种症状和体征。从一个角度来看,这些症状和体征可以分为两大类:电动机症状和nonmotor症状。运动症状是那些影响运动和肌肉和nonmotor症状包括神经行为和认知问题,睡眠问题,感觉问题,自主神经病变(神经异常)4]。
言语障碍是最常见的一种电机PD的问题(4]。工务计划的研究表明,大约90%的影响与运动问题,尤其是言语障碍(5,6]。除了发声障碍的患病率在PD患者中,收集语音样本,做他们的语音信号处理成本低,适合远程控制和telediagnosis系统(7,8]。因此,PD的诊断从言语障碍正变得越来越普遍。
在帕金森症患者中,言语障碍是由于神经损伤与弱点,缓慢或不协调的肌肉用于生产演讲(9,10]。语言障碍通常发生在以下形式:发音过弱柔软的演讲,结果从声乐肌肉组织的弱点,单调的演讲处理话音质量的软的情况下,沙哑,和单调的慌张步伐演讲当演讲变得过快,柔软,带呼吸声的,和不理解4]。
提出了很多方法为了找到每个语音障碍的严重程度的迹象。最著名的声乐有两种类型的测试的目的:持续发声(11,12),运行的演讲(12)测试。在持续发声,病人被要求说一个元音,而持有其音量尽可能常数和长。在运行的演讲中,病人说标准的句子包括代表语言单位,可以显示可能损伤发声障碍的迹象。本研究的主要焦点是后者问题陈述。以前的研究有两个主要缺陷:(a)的所有声音样本由单个分类器分类;(b)每个主题的声音样本进行了综述的帮助下统计指标无论每个声音的辨别能力测试。
因为大多数研究PD检测领域的基于语音数据集上进行聚集在一个或几个类型的声音测试,我们带来了我们的注意力与多个录音数据集。本研究的主要贡献是双重的:提出一个新的独特的分类框架,提出了一个独特的分类器应用于声乐的样本每种类型例如,分类器只是元音“,”而不是单个分类器申请所有的人声和呈现声音测试更有代表性和间接省略不歧视声音测试通过嵌入方法多数表决。
剩下的纸是组织如下。部分2回顾以往的研究领域。节3数据集的简要描述,评价指标,该方法可以被发现。部分4演示了这项工作的结果,最后一节5提出了本研究的结论。
2。相关工作
近年来发声障碍的检测在机器学习的帮助下变成了一个热门话题。各种研究论文试图解决这个问题通过考虑声学测量言语障碍的有效的特征来区分正常(从无序情况下(控制)7,8,13,14]。在这个领域的研究可以分为两个主要团体:那些试图找到最有效的声音特点和产生新的数据集(8,13,15),那些试图找到更有效的功能从现有的数据集和专注于提高分类精度14,16- - - - - -26]。
一些研究集中在如何产生新数据集的基于他们的研究成果。小等人[8]目的分析非标准测量的有效性。他们的工作导致了引入新的发声困难测量命名为PPE(基音周期熵)。在他们的研究中,他们收集了31个学科的持续元音”“发声其中23例PD患者和他们的分类精度达到91.4%。在[1340),萨卡尔等人提出了一个数据集对象包括20 PD。每个训练说一组26个不同的障碍方面代表组成的持续的元音,单词,数字,和短的句子。这个数据集是当前工作的重点。他们应用总结分析(s-LOO)验证技术,每个人将总结的所有声音样本使用集中趋势和离散指标如值,意思是,标准差,修剪的意思是,四分位范围和平均绝对偏差。他们的方法获得77.5%的分类精度。Tsanas等人在15)专注于监控PD的帮助下发展提取功能使用信号处理技术应用于一个巨大的数据集的6000 42早期PD患者的语音样本。他们试图估计统一帕金森病评定量表(UPDRS)使用线性和非线性回归。他们的结果显示的准确性从临床UPDRS估计大约7.5分的差别。这三个数据集的主要公开的数据集是PD基于语音的研究领域。
其他的研究试图改善PD检出率使用现有的数据集。例如,Tsanas等人在14]计算132发声困难新组成的测量使用现有的数据集263元音“啊…”发声从43例采用特征选择技术。他们获得了99%的总体分类精度。在另一个工作,人形和Kursun [16]试图评估之间的相关性和相关特性和PD的分数通过应用相互信息化选择算法置换测试和饲料排名数据与选择特性的基于maximum-relevance-minimum-redundancy (mRMR)成一个支持向量机分类器。他们用leave-one-subject-out (LOSO)作为他们的模型的交叉验证技术,以避免偏见。在LOSO验证方案中,所有的声音样本个体的候选人被测试样品将从其余的数据被排除在外。他们的方法分类精度(上涨92.75%8]。Shahbaba和尼尔17)提出了一个基于狄利克雷混合物的非线性模型,并获得87.7%的分类精度。Das (18)进行神经网络(NN)的比较研究,DMneural,回归,为PD的诊断和决策树;他们的研究导致了基于神经网络的分类性能92.9%。郭et al。19)应用遗传规划和期望最大化(EM)和获得93.1%的分类精度。Luukka [20.)提出了一个方法,用模糊熵措施和相似性分类器和导致的平均精度85.03%。李等人。21]介绍了fuzzy-based非线性变换方法与支持向量机相结合;他们最好的分类精度为93.47%。Ozcift和Gulten22]提出了分类器整体建设与旋转森林的方法得到的分类精度为87.13%。Astrom和角23)取得了91.2%的分类精度通过使用并行神经网络模型。Polat [24)应用模糊C——权重的聚类特性k最近的邻居分类器;获得最好的分类精度为97.93%。陈等人。25)提出了一个模型,结合主成分分析和模糊k最近的邻居方法;他们的分类方法实现了96.07%的准确性。左et al。26)使用一种基于粒子群优化(PSO)的诊断模型加强模糊k最近的邻居分类器导致平均分类精度为97.47%。
在大多数的研究中,使用支持向量机作为基分类器区分健康受试者和工务计划(8,14,27)和诊断系统的成功与ROC曲线测量,AUC和报告真阳性和假阳性率(28]。
语音数据集用于PD的诊断包括多个领域的演讲录音/主题(29日]。这些数据集可以分为两类:那些包含重复的一项那些由不同的声乐术语。大多数数据集去第一类。因此,大多数的研究PD的诊断是对这些数据集进行14,16- - - - - -26];然而,没有人能获得100%的分类精度。这种类型的最受欢迎的和可用的数据集是“帕金森的数据集“(7)和“帕金森遥控数据集“(15),都可以通过UCI机器学习库。唯一可用的数据集的第二类处理过的数据矩阵的形式是由人形et al。13]。少研究了这种类型的数据集;同时,相应的分类精度不承诺了。本研究的目的是要表明,这种类型的数据收集可以通过改变导致PD检测率高的分类策略。
3所示。材料和方法
3.1。数据
在这个工作我们使用帕金森的演讲与多种类型的录音数据集(13),可以在加州大学欧文分校(UCI)机器学习数据存储库的网站。这个数据集包含40个主题,包括20名PD患者和20名对照组。对于每一个主题,收集了26个不同的录音,包括三个持续元音,数字1到10,九个字,四个简短的句子。从这些记录有26个特征提取。表1列表的功能聚集在人形等的工作和相应的组织(见[13更多细节)。
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
3.2。该方法的概述
本文的目的是提出一个分类框架,重点是每个声乐的判别值测试。与传统LOSO交叉验证技术和s-LOO,该方法认为所有的录音数据集的设置并不一定歧视并不是每个PD病人显示区分声音障碍的所有声音测试。该方法的总体视图中可以看到图1。
该方法的四个步骤分离数据基于类型的声音记录,应用特征选择皮尔逊相关系数,我们称这两种方法我们采取如下:(一)应用多分类器的特征选择(mcf)和(b)调整多分类器的特征选择(A-MCFS)不久将推出,应用分类器在每个子集,最后融合所有分类器获得的结果最终决定通过多数投票。
(1)数据分离。每个数据集的子集包含相同类型的所有声音的测试;例如,所有的记录类型的元音“a”去“o”的第一子集和第二子集。因此,考虑到目前的数据集,有26个子集,每个盒子装40个样本。分离混合物以来已经完成的所有声音样本个体减少的识别效果更具描述性的测试,它会从负面影响分类结果。
(2)皮尔森相关系数特征选择。特征选择阶段,基于过滤器特征选择技术基于皮尔逊相关系数(30.- - - - - -32)是用来发现高度相关功能类标签。这个特性选择的更精确的定义如下:假设每个特性包括值1到样品(在本研究在向量等于40)和相应的类标签存储在向量。所以每个特性的皮尔森相关系数可以计算的 在哪里和类似的。这个方程给出了−1和+ 1之间的值,+ 1是最大的正相关,0 =没有相关性,−1是最强的负相关。
的使用学生的计算值分布的转换关系。这些特性在相关系数矩阵值小于0.05。
(3)mcf A-MCFS。当皮尔逊相关系数特征选择,一些声音测试可能仍没有相关特性。我们称这些声音测试不成功的声音测试。两种方法来处理那些不成功的声音测试是在这项研究中。第一个是mcf方法;声音测试中使用的分析仅基于其他声音的普遍特性测试。表2显示每个声音测试和其相应的应用特征选择和图后相关特性2显示每个特性的频率。特征频率的2和4 6和5,分别最常见的选择功能。第三个最常见是共享的特性25和26四的频率。最四频繁的特性被用于mcf作为失败的声音测试选择特性。A-MCFS,另一种方法是简单地忽略失败的声音测试。
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
(4)分类和多数投票。在每个子集做特征选择后,对于每个人,建立一个分类器。因为我们有26个声音测试,26个分类器。每一个分类器预测类标签的子集。分析交叉验证技术被用于所有这些分类器。因为每个主题只有一个记录在每个子集,我们不需要担心如何对待每个主题进行交叉验证,因为它是在LOSO还是以前的方法。
分类器的多数票决定属于这类人。每个分类器投票主题是否PD。然后,大部分的主题分类器投票是一个PD病人会被贴上“1”显示PD的存在和“0”。
3.3。评价指标
评价指标用于显示精度提出的方法的有效性,敏感性,特异性,马修的相关系数(MCC)。这些指标的定义如下: TP(真阳性)是PD患者的数量正确归类为帕金森症患者的模型,TN(真阴性)是控制受试者的数量贴上健康模型,FN(假阴性)的患者数量模型错误地把他们称为健康,最后FP(假阳性)的健康情况下人数错误被冠以PD的分类器。它只是显示精度的比例正确分类样本总数的实例:
机器学习中著名的度量,可以用于评估一个二进制分类器是MCC的质量。这个指标是可靠的,因为它需要TP、TN、FN,《外交政策》,这使它稳定即使类是非常不同的大小。实际上,MCC是观察之间的相关系数(实际)标签的样本和预测的二元分类器: 这个方程−1和+ 1之间的返回值。+ 1显示了一个完美的预测系数,0代表了分类器这一事实并不比随机猜测,最后−1表示一个完整的实际值和预测之间的分歧。
4所示。结果和讨论
分离数据子集后,分数归一化过程应用于每个子集。换句话说,经过变换,意思是等于零和标准偏差的变化。然后拟议的框架应用于精确数据。
四个分类器包括k -神经网络、支持向量机判别分析,朴素贝叶斯被应用于预处理数据。距离度量用于k欧氏距离和神经网络分类器值的1、3、5、7使用。使用线性支持向量机分类器应用径向基内核(RBF)和比例因子(σ)3和惩罚参数()1。表3包括精度、灵敏度、特异性和MCC从应用LOSO下提到的分类器,获得s-LOO,拟议的框架。研究结果表明,k神经网络分类器性能几乎是类似于随机猜测时使用LOSO交叉验证技术。除此之外,s-LOO不能执行比LOSO时knn以来最好的整体精度和MCC 65.00%和0.3062,分别。结果表明,A-MCFS优于s-LOO最好的结果与总体精度为77.50%,这是一个12.5%改善和MCC为0.5507。
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| 集中趋势指标用于s-LOO方法:1:的意思是,2:中位数,3:削减意味着删除(25%)。 离散指标用于s-LOO方法4:标准差,5:平均绝对偏差,和6:四分位范围。 |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
当是1,3,5,mcf结果比s-LOO至少在5%,最多12.5%,但它的精度是2.5%低于s-LOO什么时候是7。
灵敏度是另一个重要的因素,尤其是在生物医学科学,应该调查的结果基本吻合。结果显示,A-MCFS还提高了灵敏度80.00%,最低灵敏度(70.00%)仍比LOSO s-LOO当k -使用神经网络。k神经网络实现了A-MCFS应用时效果最好;除此之外,LOSO和s-LOO不能达到mcf的结果除了k= 7。
此外,最好的分类精度得到应用A-MCFS 87.5%相比,这是一个10%的准确率提高最好的s-LOO获得的准确性。
图3给出了一个更好的展示不同的方法得到的分类精度。
为了检查我们的方法找到减少歧视声乐的正确性测试,我们已经报道了分类精度的每个声音测试前多数投票阶段。结果如表所示4。比较结果如表所示2和4显示,被排除在外的特性A-MCFS是那些取得了平均低于55%的准确性。这表明对mcf A-MCFS的优越性的原因。因此,仔细调查向寻找更有效的口头测试是必要的。
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
5。结论
工务计划检测基于声音样本一直是一个有吸引力的研究领域。找到一个解决方案向歧视PD患者的健康的人基于不同的声音测试一直不准确,因为所有声乐术语被单个分类器对待。该方法分别对待每个声音测试和使用多数投票来解决任何潜在的混乱。从本研究结果显示,更准确的PD检测基于多个声音测试是可以实现的。
另一个重要的结果,实现了从这项研究中,所有的声音的辨别能力是不一样的,甚至其中的一些声乐术语已经在文献中认为是歧视,如元音”,“未能成功。因此,我们的研究可能会鼓励其他研究人员进行进一步的研究在不同的声音从提出的观点。
未来的工作,我们计划设计一个实验室设置工务计划收集的数据和健康受试者和几个声音测试来自不同语言和我们的结果扩展到其他语言。
相互竞争的利益
作者宣称没有利益冲突。
引用
- j·w·兰斯顿,“帕金森病:当前和未来的挑战,”神经毒理学,23卷,不。4 - 5,443 - 450年,2002页。视图:出版商的网站|谷歌学术搜索
- l . m . de刘和m . m . Breteler“帕金森病的流行病学,”《柳叶刀神经病学,5卷,不。6,525 - 535年,2006页。视图:出版商的网站|谷歌学术搜索
- m . c . de Rijk l . j . Launer k·伯杰et al .,“帕金森病患病率在欧洲:以人群为基础的群组协作研究,“神经学,54卷,不。11、supplemen 5、S21-S23, 2000页。视图:谷歌学术搜索
- j .扬科维奇,“帕金森氏症:临床特点和诊断”,《神经学、神经外科、精神病学,卷79,不。4、368 - 376年,2007页。视图:出版商的网站|谷歌学术搜索
- a . k . Ho r . Iansek c . Marigliani j·l·布拉德肖和美国盖茨,“言语障碍的帕金森症患者的大样本,”行为神经学,11卷,不。3、131 - 137年,1998页。视图:谷歌学术搜索
- j . a . Logemann h·b·费舍尔,波什,和e . r . Blonsky”的频率和同现声道语音障碍的帕金森患者的大样本,”演讲和听力障碍杂志》上,43卷,不。1,47-57,1978页。视图:出版商的网站|谷歌学术搜索
- m . a, p . e .创造美国j .罗伯特·d·a·e·科斯特洛和i m·莫洛兹”利用非线性递归分形扩展属性的声音障碍检测,”生物医学工程在线第二十三条,卷。6日,2007年。视图:出版商的网站|谷歌学术搜索
- m . a, p . e .创造e·j·亨特,j . Spielman和l . o . Ramig”的适用性发声困难测量远程控制帕金森病,”IEEE生物医学工程卷,56号4、1015 - 1022年,2009页。视图:出版商的网站|谷歌学术搜索
- j .达菲电动机言语障碍:基质、鉴别诊断和管理,处于,圣路易斯,密苏里州,美国,第三版,2012。
- m·麦克尼尔公司感觉运动言语障碍的临床管理蒂米,斯图加特,德国,第二版,2008年版。
- r . j .博肯和r·f·Orlikoff临床测量的言论和声音,Cengage学习,第二版,1999年版。
- p h . Dejonckere·布拉德利p·克莱门特et al .,”一个声音病理学的基本协议功能评估,尤其是对调查(phonosurgical)治疗的疗效和评估新的评估技术:语音矫正法委员会的指导原则阐述了欧洲Laryngological学会(ELS)”欧洲Oto-Rhino-Laryngology档案,卷258,不。2、77 - 82年,2001页。视图:出版商的网站|谷歌学术搜索
- b . e .人形m . e . Isenkul c . o .人形et al .,“帕金森语音数据的收集和分析多种类型的录音,”IEEE生物医学和卫生信息学杂志》上,17卷,不。4、828 - 834年,2013页。视图:出版商的网站|谷歌学术搜索
- a . Tsanas m a, p . e .创造j . Spielman和l . o . Ramig”小说语音信号处理算法的高精度分类帕金森氏病的疾病,”IEEE生物医学工程卷,59号5,1264 - 1271年,2012页。视图:出版商的网站|谷歌学术搜索
- a . Tsanas m a, p . e .创造和l . o . Ramig”准确的远程控制帕金森疾病进展的非侵入式语言测试,”IEEE生物医学工程卷,57号4、884 - 893年,2010页。视图:出版商的网站|谷歌学术搜索
- c . o .人形和o . Kursun Telediagnosis使用测量言语障碍的帕金森病,”医疗系统杂志,34卷,不。4、591 - 599年,2010页。视图:出版商的网站|谷歌学术搜索
- b . Shahbaba r·尼尔,“非线性模型使用狄利克雷过程混合物,”机器学习研究杂志》上,10卷,第1850 - 1829页,2009年。视图:谷歌学术搜索|Zentralblatt数学
- r·达斯”比较多个分类诊断帕金森病的方法,”专家系统与应用程序,37卷,不。2、1568 - 1572年,2010页。视图:出版商的网站|谷歌学术搜索
- P.-F。郭、p·巴塔查里亚和n . Kharma“帕金森病检测的进步,”医学生物识别技术卷,6165在计算机科学的课堂讲稿施普林格,页306 - 314年,柏林,德国,2010年。视图:出版商的网站|谷歌学术搜索
- p . Luukka”特征选择与相似性分类器,利用模糊熵措施”专家系统与应用程序,38卷,不。4、4600 - 4607年,2011页。视图:出版商的网站|谷歌学术搜索
- 华盛顿特区。李,C.-W。刘,s . c .胡“fuzzy-based数据转换为特征提取与小型医疗数据集,提高分类性能”人工智能在医学上,52卷,不。1,45-52,2011页。视图:出版商的网站|谷歌学术搜索
- a . Ozcift和a . Gulten”与旋转森林分类器整体建设,提高医疗诊断机器学习算法的性能,”计算机在生物医学方法和项目,卷104,不。3、443 - 451年,2011页。视图:出版商的网站|谷歌学术搜索
- f . Astrom r角,“并行神经网络方法预测帕金森病,”专家系统与应用程序,38卷,不。10日,12470 - 12474年,2011页。视图:出版商的网站|谷歌学术搜索
- k . Polat“帕金森病的分类使用特征加权方法模糊c均值聚类的基础上,“国际系统科学杂志》上,43卷,不。4、597 - 609年,2012页。视图:出版商的网站|谷歌学术搜索|MathSciNet
- H.-L。陈,c c。黄,X.-G。Yu et al .,“一个有效的检测诊断系统使用模糊再帕金森病的方法,”专家系统与应用程序,40卷,不。1,第271 - 263页,2013。视图:出版商的网站|谷歌学术搜索
- w l。左,Z.-Y。王,t·刘,H.-L。陈,“帕金森病的有效检测使用一个自适应模糊再方法,”生物医学信号处理和控制,8卷,不。4、364 - 373年,2013页。视图:出版商的网站|谷歌学术搜索
- o . Kursun e . Gumus a Sertbas, o . v . Favorov”的声音特性选择帕金森病诊断,”国际期刊的数据挖掘和生物信息学》第六卷,没有。2、144 - 161年,2012页。视图:出版商的网站|谷歌学术搜索
- 巴塔查里亚和m . Bhatia,“SVM分类区分帕金森病病人,”学报第一仙露ACM-W庆祝妇女在印度的计算(A2CWiC 10),新德里,印度,2010。视图:谷歌学术搜索
- l . o . Ramig s Sapir c·福克斯和美国同胞,“声音响度变化后密集的声音治疗(LSVT®)在帕金森症患者:比较与未经治疗的患者和正常年龄组,”运动障碍,16卷,不。1,第83 - 79页,2001。视图:谷歌学术搜索
- j·吉本斯非参数统计推断查普曼&大厅/ CRC,第五版,2010年版。
- m .打浆机和d·a·沃尔夫非参数统计方法约翰·威利& Sons,纽约,纽约,美国第3版,2013年版。视图:MathSciNet
- m·m·肯德尔等级相关方法,格里芬,伦敦,英国,第五版,1990年版。
版权
版权©2016 Mahnaz Behroozi Ashkan萨米。这是一个开放的分布式下文章知识共享归属许可,它允许无限制的使用、分配和复制在任何媒介,提供最初的工作是正确引用。