研究文章|开放获取
Jarosław Szkoła, Krzysztof Pancerz Jan Warchoł, ”复发性神经网络计算机喉病的临床决策支持:一个实验研究”,计算智能和神经科学, 卷。2011年, 文章的ID289398年, 8 页面, 2011年。 https://doi.org/10.1155/2011/289398
复发性神经网络计算机喉病的临床决策支持:一个实验研究
文摘
本文的主要目的是给创造一个以计算机为基础的临床决策支持的基础为喉病(CDS)系统。方法之一,可用于拟议的cd是基于语音信号分析使用递归神经网络(RNNs)。RNNs可用于模式识别在时间序列数据由于其记忆一些信息从过去的能力。Elman网络(ENs)是RNNs的经典代表。提高学习能力的实体,我们可以修改,用另一种RNNs结合,即,约旦网络。修改后的Elman-Jordan网络(EJNs)显化一个更快和更准确的成就的目标模式。验证实验进行语音信号的患者和对照组两种喉病。
1。介绍
以计算机为基础的临床决策支持(CDS)被定义为使用计算机将相关知识对一个病人的医疗保健和健康1]。我们的研究问题与设计方法的cd选择喉疾病的无创性诊断。两种疾病都是考虑:Reinke水肿(重新)和喉息肉(LP)。一般来说,选择的诊断是基于智能分析患者的语音信号的参数(发声)。该方法完全是无害的。比较直接的方法表明,它有几个优点。病人因为方便,测量仪(在这种情况下,一个麦克风)坐落在声音的器官。这使得免费的清晰度。此外,不同的生理和心理病人因素阻碍使用直接方法进行诊断。从临床的角度来看,一个早期诊断可以有效治疗无手术。 The problem of larynx diseases has become an increasingly serious health problem in different occupational groups.
大多数的方法提出了迄今为止只基于语音谱的统计分析(例如,2])以及小波分析。应用这种方法并不总是裁决病人分类以独特的方式。我们的计划是提出一种混合的方法,这是另外基于时域的信号分析。初步观察的信号从一个对照组患者的样本和患者病理证实标明变形标准清晰度的精确的时间间隔。在本文中,我们提出一个方法在时域信号分析使用递归神经网络(RNNs),尤其是Elman网络和约旦(3,4)也被称为“简单复发性网络。”
我们的研究问题设计的电脑支持有效的方法选择喉疾病的无创性诊断。存在各种方法分析生物医学信号(cf。5])。一般来说,我们可以区分三组根据域的信号分析方法:时域分析,频域分析(光谱分析),和时频域分析(如小波分析)。因此,在我们的研究中,我们将建立一个专门的计算机工具支持喉病的诊断基于混合方法。这个工具的一部分,扮演着重要的角色在初步阶段,将基于病人的语音信号在时域分析。杂交意味着决策支持系统将有一个层次结构基于多个分类器工作在时间和频率域信号。
早些时候发表的一系列论文(见[2,6- - - - - -8)提出了方法导致了本文中所示的方法。在这种方法中,设计时间模式的识别和复制的方式成为了关键因素。它使检测所有违背自然的干扰在被选中的音素的发音。时域分析,我们建议使用神经网络提取音素发音模式的能力对于一个给定的病人(清晰度是个体病人的特性)和复制的能力评估在整个检测信号。初步观察表明,显著复制干扰时间出现患者疾病的临床诊断。
是被反复提到的功能神经网络。一个类的Elman神经网络(ENs) (3]。在实时决策,重要的是要加快神经网络的学习过程。此外,学习精度的信号模式起着重要的作用。因此,在本文中,我们提出一些改善学习能力的实体与另一种RNNs相结合,也就是说,约旦网络(4),通过提供一些额外的修改。一种新的结果RNNs叫做修改Elman-Jordan网络(EJNs)。
论文的其余部分组织如下。介绍后,我们描述了不久喉疾病(部分相关医学背景2)。节3,我们在检查显示基本问题的演讲器官功能医学诊断。部分4描述了一个修改后的结构和特征Elman-Jordan神经网络用于支持喉病的诊断。节5,我们现在得到的实验结果做了真实的数据。给出了一些结论和最后的讲话6。
2。医学背景
基于模型的言论一代“source-filter”组合。源是喉刺激,被动的声带振动subglottis压力增加的结果。这种现象使语音响亮的声门空间叫做发声。演讲的过滤器是剩下的发音器官运河创造共振空间。喉的信号刺激的形状,在这些空间调制。这个过程称为演讲的最终产品。
病理变化出现在声门空间需要一个更大或更小的损伤喉发声功能的。提出了研究的主题与疾病有关,这出现在声带上,也就是说,他们有一个直接影响发声(9]。
我们感兴趣的是两种疾病:Reinke水肿(水肿Reinke)和喉息肉(息肉软骨)。
2.1。Reinke的水肿
Reinke水肿出现经常双边和通常不对称的声带。它是由漏出的槽形上皮空间折叠缺乏淋巴血管和腺体,叫做Reinke空间。在疾病的发病机制,在其中扮演了一个重要角色刺激喉粘膜由不同的因素,如吸烟、过度的声音努力,inhalatory毒素,或过敏原。主要症状有以下几点:声音沙哑声襞振动或造成干扰,对于大型的水肿,吸入呼吸困难。Reinke水肿的,不应用保守治疗。他们是显微外科被剥外皮拯救了直言不讳的肌肉。
2.2。喉息肉
喉息肉是良性肿瘤时引起的温柔的纤维组织增生的声带粘膜。发病机理,在其中扮演了一个重要角色因素导致慢性喉粘膜的炎症和刺激声带:吸烟、过度的声音努力,回流,等等。主要症状有以下几点:声音沙哑,失音,咳嗽,喉痒。对于非常大的息肉,呼吸困难可能出现。然而,不大息肉可能与声音混淆肿瘤特别是当病人的负载的声音的一个因素。息肉可能有梗的或可能的广泛基础。如果有必要,息肉是显微外科切除拯救自由声襞和声带肌肉的边缘。
3所示。声音的基本评估中存在的问题
研究证明,主观评价的声音总是反映在语音信号的基本声学参数。声音参数与声音的器官的解剖结构和功能特性是一个主题感兴趣的研究人员。然而,解剖形式的多样性,天生的发声习惯,一种探索材料的多样性导致研究执行不同的理由。声音一代受到很多因素的限制,这给声音一个个体,独特的性格。然而,分析语音信号的个体特性在一个合适的人,合适的众多,显示了一些收敛值测试参数。这使分化来源的变化特征(喉刺激)引起的不同的病态。因为口语是一个随机的过程,一种探索性的材料通常是由元音说出分别与扩展的清晰度。加上缺乏语调,它使消除发声习惯。
我们可以区分两种类型的声学测量方法:客观和主观的。他们都属于间接探索性方法。比较直接的方法(如计算机光线照相术,频闪观测法,生物电子系统)表明,他们有几个优势。他们方便病人因为测量仪器(在这种情况下,一个麦克风)坐落在声音的器官。这使得免费的清晰度。声学方法的优点是使用电脑自动化测量技术的可能性。也可以想象个人语音信号的参数。使用主观听诊的方法等,在喉科学和语音矫正法的正确或病态的声音发射。客观的方法是基于物理特征的声音。他们变得特别流行,当计算机技术达到一个高程度的专业化。 They enable the objective assessment of voice and deliver information in case of pathology and rehabilitation of the voice organ. Examined parameters aid the doctor's assessment of the patient's health state.
在文献中,我们可以注意到源(喉刺激)的参数经常检查,例如,(10]。然而,它是可能的修改一个探索性方法,以便它包含广泛的材料分析。在其中扮演了一个至关重要的作用进一步基本声学参数的数学处理。通过这种方式,我们可以考虑和检查在发声过程中动态变化产生的语音设备的功能以及额外的声学效果发生在整个声音的器官。
4所示。复发性神经网络在清晰度显示变形
在大多数情况下,神经网络拓扑结构可分为两大类:前馈(没有循环和连接在同一层)和复发性(可能的反馈循环)。Hopfield网络、Elman网络,和约旦网络最著名的复发性网络。在本文中,我们对两个最后的感兴趣。
在Elman网络(图1)[3),输入层有复发性与隐层。因此,在每个时间步,隐藏单位的输出值复制到输入单元,储存和使用它们的下一个时间步。这个过程允许网络记住过去的一些信息,以这样一种方式来检测周期性的模式以更好的方式。这样的能力可以被利用在我们的问题,在研究了语音信号识别时间的模式。约旦网络(4类似于Elman网络。背景层,然而,美联储从输出层而不是隐藏层。加速的学习(培训)过程Elman神经网络,我们建议修改后的网络结构。我们把Elman网络与约旦网络并添加另一个反馈一个输出神经元如图2。
纯Elman网络由四层:(我)一个输入层(在我们的模型:神经元),(2)一个隐藏层(在我们的模型:神经元),(3)一个上下文层(在我们的模型:神经元),(iv)一个输出层(在我们的模型:神经元)。
是一个单位延迟。
提高学习能力的纯Elman网络,我们建议添加额外的反馈在网络结构。实验中所描述的部分5验证这项努力。我们创建(参见图2);(我)反馈一个输出层和隐层之间通过上下文神经元(在我们的模型:神经元),这样的反馈是乔丹中使用网络,(2)反馈一个输出层。
一个新的网络结构将被称为修改Elman-Jordan网络。
Elman网络,根据它的结构,可以存储网络的内部状态。可以有信号值的隐层单元。数据存储在内存上下文。因为一个隐藏层的存储值我们可以预测下一个时间单位对于一个给定的输入值。在学习神经网络与不同的架构,我们可以区分三种方法进行预测,在那里:(1)训练一个网络的价值。(2)训练一个网络在每个值,在那里。这种方式体现小的好结果;(3)训练一个网络只有一个值将迭代,对于任何。
在我们的例子中,我们使用的方法。
约旦网络可分为变体之一NARMA非线性自回归移动平均模型(11),一个上下文层商店一个输出值。假设一个网络结构没有记忆。It过程只有一个值之前从输出。在NARMA模型中,一个上下文层是一个减法器的输入值。
如果我们将一个值传递给网络输入在一个给定的时间单位,然后Elman网络存储值从一个隐藏层的副本在背景层。一个隐藏层的大小并不取决于大小的一个输出层。在约旦的网络中,一个输出值被传递给一个背景层。因此,这一层的大小取决于大小的一个输出层。如果网络只有一个输入和一个输出,然后,我们只有一个神经元在背景层。约旦河与Elman网络相比,网络学习速度较慢,需要一个更大的结构。因此,纯粹的约旦网络不能用于解决我们的问题。在我们提出的修改Elman-Jordan网络,网络选择层之间的反馈。我们提供额外的信息隐藏层。隐藏层有一个输入值,先前隐藏层的值以及一个输出值。额外的信息有很大的影响在修改隐藏层的权重。它会导致缩短学习过程和减少网络结构相比古典Elman网络。
5。实验:过程和结果
清晰度是个体病人的特性。因此,我们不能训练神经网络的独立模式单个元音的发音。对于每一个病人,记录语音信号用于神经网络的训练和测试。过程如下。我们将检查患者的语音信号分为时间窗口对应音素。接下来,我们选择随机的时间窗口。这组选择windows用于确定语音信号的一些特征变形系数。这个系数是由一个错误在测试阶段的神经网络获得。我们建议使用类似于交叉验证的方法策略。一个时间窗口是训练神经网络和神经网络的剩余的测试。 The network learns a selected time window. If the remaining windows are similar to the selected one in terms of the time patterns, then, for such windows, an error generated by the network in a testing stage is small. If significant replication disturbances in time appear for patients with the larynx disease, then an error generated by the network is greater. In this case, the time pattern is not preserved in the whole signal. Therefore, the error generated by the network reflects nonnatural disturbances in the patient phonation. Our approach can be expressed formally as it is shown in Algorithm1。在该算法中,我们使用以下功能(程序):
在实验中,声音样本进行了分析。实验进行了两组患者(2]。第一组包括病人没有干扰phonation-the对照组(CG)。他们证实了phoniatrist意见。所有病人都不吸烟,所以他们没有接触有毒物质,会影响声带的生理状态。第二组包括耳鼻喉科诊所的病人在波兰卢布林的医科大学。他们有临床证实发声困难由于Reinke水肿(重新)或喉息肉(LP)。关于疾病的信息是来自病人的文件。
实验进行呼吸练习的课程与教学发音的一种方式。所有检查病人的任务分别是完全不同的波兰元音发音尽可能延长,没有语调,每个单独的过期。麦克风ECM-MS907(索尼)是用于记录。每一个声音样本记录在小型磁盘MZ-R55(索尼)。在小型磁盘,一个模拟信号转换为数字信号根据CD(光盘)标准(16位,44.1 kHz),其次是改变通过ATRAC(小型磁盘自适应变换声音编码)系统。数据大小是5比1比例的减少。压缩系统是基于分离谐波,人类是最敏感的。这些谐波编码精度高。然而,不那么重要的谐波进行编码与压缩比越高。可以使用小型磁盘成功。 Effectiveness of such analysis was confirmed by Winholtz and Titze in 1998 [12]。
实验过程的框图如图3。
样本归一化到区间之前提供给下一个块。接下来,语音信号分析的过程分为两个路径。在第一个路径,原始信号(归一化后)进行了分析。在第二个路径,原始信号的导数(归一化后)进行了分析。众所周知从导数微积分提供了一些额外的信息分化功能,在我们的案例中,语音信号的变化率。此信息可用于分类的过程。正常化后,或者分化,提供样品(如双数字)连续神经网络的输入。可以位于二维空间根据每个病人的平均均方误差由RNNs提供原始信号和它的导数。在表1,我们现在进行的实验的结果使用纯Elman网络。接下来,我们给的结果(见表2)获得使用修改后的Elman-Jordan网络部分中描述4。两个表包括女性发出元音字母“A”的结果。我们给平均均方误差()和平均数量()的时代需要学习网络权重,分别。标指示(我)从对照组CG:一个女人,(2)与喉息肉LP:一个女人,(3)再保险:女人与Reinke水肿,分别。
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
很容易看到,Elman神经网络和约旦的组合结构改进的神经网络的学习能力而区别(正常和疾病状态之间)能力保持在同一水平。有时,Elman网络不能学习给定模式的时代等于10000(见,例如,在表1)。观察我们进一步研究是非常重要的,尤其是在创建计算机工具的背景下喉疾病的诊断。
二维空间中描述患者可以使用不同的数据挖掘和机器学习分类方法(见,例如,13])。我们可以使用分类目的方法嵌入到著名的计算机工具,其中,(我)粗糙集勘探系统(rs)——软件工具库的方法和图形用户界面支持多种基于粗糙集的计算(14];(2)WEKA:一组数据挖掘任务的机器学习算法(15]。
中最通用的格式,医学诊断规则条件语句的形式:如果条件(症状),然后决定(诊断)。规则表达症状之间的关系确定检查和诊断的基础上,应采取这些症状在治疗之前。在我们的例子中,症状是决定患者的语音信号分析的基础上,使用RNNs。很容易看到,区分喉息肉和Reinke水肿的基础上建议的方法是,事实上,不可能的。因此,这个问题在未来将会单独考虑。现在,每个病人可以分为两类:(我)没有:病人没有喉病,(2)是的:患者喉病。
输入数据的分类(用于学习或提取数据)之间的关系,我们有一个表格形式(见例子在表3),正式称为决策系统(决策表)pswlak的形式(16]。是一组的情况下(病人),是一组描述属性和是一个决策属性确定类别。在我们的例子中,,在那里是相对应的属性提供的平均均方误差为原始信号和RNNs吗是属性对应的平均均方误差由RNNs分化信号。此外,表示喉病的存在。
|
||||||||||||||||||||||||||||||||||||||||||||||||||||
描述性的属性的值(和)可视为连续的定量数据。建立分类规则等数据可以是困难的和/或高度效率低下。因此,对于一些规则生成算法,所谓的离散化是一个必要的预处理步骤(13]。其总体目标是减少数量的值通过分组成数量的间隔。在许多情况下,离散化可以获得更高质量的分类规则。一些离散化技术基于粗糙集和布尔推理提出了(17]。另一方面,一些算法(特别是基于决策树)申请连续数据导致的形式规则与条件的间隔。
在我们的实验中,我们使用,例如,两个不同的规则生成方法:(我)直接法:包括LEM2算法,其中,在rs系统;(2)基于决策树的方法:J4.8算法,包括其中,WEKA系统。
第一个算法是基于覆盖的方法。由j . Grzymala-Busse LEM2算法(18]。Covering-based算法产生更少的规则比基于显式导出计算算法。J4.8 WEKA的改进C4.5算法的实现。决策树C4.5算法被用来生成一个由r·昆兰(19]。C4.5决策树构建从一组训练数据使用信息熵的概念。LEM2算法产生(如果使用修改后的Elman-Jordan网络)两个规则分析数据:(我)如果,然后,(2)如果和,然后。
训练集的分类误差是0%。不受任何生成的规则就是一个例子。
通过J4.8算法产生的类似的规则。决策树获得使用J4.8算法形式如图4。从决策树规则有以下形式(每个规则生成通过所有的测试遇到的结合从根到叶子的路径):(我)如果,然后,(2)如果和,然后,(3)如果和,然后。
在括号中,决策树每个节点代表一个病例数分为类别分配到该节点。训练集的分类误差是0%。
示范结果表明,病人描述的二维(两个属性对应的平均均方误差由RNNs提供原始信号和分化信号,分别地。)之间的空间可以很容易地识别正常和疾病状态。
6。结论
下列事项可以注意到在实验中所描述的基础。(我)结合和修改两个递归神经网络的结构(约旦河Elman网络与网络)用于评估喉疾病会导致患者的语音信号变形提高神经网络的学习能力,而(正常和疾病状态)之间的区别能力保持在同一水平。这样的加速度是很重要的,如果一个实时诊断应该做出决定。(2)该方法使用递归神经网络的语音信号分析的基础上可以初步一步区分正常和疾病状态。
我们可以列出以下主要问题将来会被认为是:(我)杂交喉病的患者的分类方法,本文给出的方法构成元素之一(基于频率和time-frequency-based方法旁边)。(2)设计方法能够区分不同的喉疾病(例如,喉息肉和Reinke水肿)。本文中提出的方法不让我们做出这种区分;(3)自动化的过程将语音信号划分为时间窗口对应音素由峰值(一个窗口是有限的)。在当前阶段,窗口的方法并不是自动进行的。样品相应的音素强烈噪声的一部分,特别是在开始和结束时,这部分不能提供给神经网络的输入。
提交结果将有助于选择合适的技术来创建计算机工具支持喉疾病的诊断。
承认
这项研究支持的已批准号N N516 423938从波兰科学和高等教育。
引用
- r·格林临床决策支持。前方的道路Nethrlands,爱思唯尔,阿姆斯特丹,2007年。
- j . Warchoł演讲考试与正确使用SVAN 912 ae分析器和病理发声博士论文,卢布林的医科大学,2006年。
- j·l·Elman,“及时发现结构,”认知科学,14卷,不。2、179 - 211年,1990页。视图:谷歌学术搜索
- m·乔丹“串行顺序:并行分布式处理的方法,“科技。8604年众议员,认知科学研究所,加州大学圣地亚哥,加州,美国,1986年。视图:谷歌学术搜索
- j . SemmlowBiosignal和医学图像处理美国佛罗里达州,CRC出版社,波卡拉顿,2009。
- j . Warchołj . Szkoła, k . Pancerz”向计算机喉病的诊断基于语音频谱分析:初步方法,”学报》第三届国际会议上Bio-Inpsired系统和信号处理,程序(生物的10)a·弗雷德·j·菲利浦-,和h . Gamboa, Eds。瓦伦西亚,页464 - 467年,西班牙,2010年。视图:谷歌学术搜索
- j . Szkoła k Pancerz, j . Warchoł”电脑喉病的诊断基于时序模式识别在语音信号,”Bio-Algorithms和Med-Systems》第六卷,没有。12日,第80 - 75页,2010年。视图:谷歌学术搜索
- j . Szkoła k Pancerz, j . Warchoł”提高复发性神经网络的学习能力:实验语音信号的患者喉病,”学报》国际会议仿生系统和信号处理(生物的11)a、f . Babiloni弗雷德,j .菲利浦- h . Gamboa, Eds。,第364 - 360页,2011年。视图:谷歌学术搜索
- 答:拉尔,当前在头颈外科诊断和治疗美国麦格劳-希尔,纽约,纽约,2008年。
- r·f·Orlikoff r . j .博肯·d·h·克劳斯,“吸气发声的声学和生理特点,”美国声学学会杂志》上,卷102,不。3、1838 - 1845年,1997页。视图:出版商的网站|谷歌学术搜索
- d . Mandic和j·钱伯斯,递归神经网络预测:学习算法、体系结构和稳定性约翰·威利& Sons,纽约,纽约,美国,2001年。
- w·s·Winholtz和i . r . Titze适用性的小型磁盘(MD)录音声音摄动分析,“杂志上的声音,12卷,不。2、138 - 142年,1998页。视图:出版商的网站|谷歌学术搜索
- k . cio w . Pedrycz、r . Swiniarski和l .坟头数据挖掘。知识发现的方法施普林格,纽约,纽约,美国,2007年。
- j·g·Bazan和m . s . Szczuka粗糙集勘探系统”在粗糙集三世事务j·彼得斯和a . skowron4月份Eds。卷,3400在计算机科学的课堂讲稿页37-56 Springer,柏林,德国,2005年。视图:谷歌学术搜索
- i . h .威滕·e·弗兰克,数据挖掘:实用机器学习工具和技术摩根考夫曼,旧金山,加州,美国,2005年。
- pswlak z,粗糙集。理论方面的推理关于数据的数据多德雷赫特,Kluwer学术出版商,Nethrlands, 1991。
- j·g . Bazan h . s .阮p . Synak, s·h·阮和j . Wroblewski“粗糙集算法在分类问题,”粗糙集方法和应用,Polkowski . s . Tsumoto和t . y .林,Eds。,年代tudies in Fuzziness and Soft Computing, pp. 49–88, Physica, Heidelberg, Germany, 2000.视图:谷歌学术搜索
- j . w . Grzymala-Busse”,一个新版本的规则归纳系统ler都,“Fundamenta Informaticae没有,卷。31日。1,27-39,1996页。视图:谷歌学术搜索
- j .昆兰C4.5:机器学习项目摩根考夫曼,旧金山,加州,美国,1992年。
版权
版权©2011 Jarosław Szkoła等。这是一个开放的分布式下文章知识共享归属许可,它允许无限制的使用、分配和复制在任何媒介,提供最初的工作是正确引用。