科学的规划

在这一页上

文摘介绍材料和方法结果与讨论结论确认引用版权相关文章

特殊的问题

优化模型和算法与先进信息技术操作和控制

把这个特殊的问题

研究文章|开放获取

体积2016年| 文章的ID5642856| https://doi.org/10.1155/2016/5642856

研究基于深度学习健康的异常检测模型从多个时间序列的生理信号

凯王 ,¹ Youjin赵,¹ 庆余熊,^2、3 最小的粉丝,¹ Guotan太阳,¹ Longkun马,¹ 和通刘¹

学术编辑器: x王

收到了 2016年6月16日

接受 2016年8月17日

发表 2016年9月26日

文摘

健康对每个人都至关重要。进一步提高其已经受人尊敬的医疗技术,医学界正在过渡到积极的方法预测和生病前降低风险。这种方法需要测量人类的生理信号和定期分析这些数据。在本文中,我们提出一个新颖的方法来应用深度学习在生理信号分析,允许医生识别潜在的风险。然而,从生理时间序列数据中提取高水平信息是一个机器学习社区面临的难题。因此,在这种方法中,我们基于卷积神经网络应用模型,可以自动学习功能从原始生理信号以一种无监督的方式,然后基于学习功能使用多元高斯分布异常检测方法来检测异常数据。我们的实验显示有显著的性能在生理信号异常检测。所以它是一种很有前途的工具,医生确定疾病的早期迹象,即使是未知的先验的标准。

1。介绍

多年来,各种智能设备和现代生活越来越密不可分1]。人们可以通过这些设备记录各种各样的生理时间序列数据在任何时候和任何地方2,3]。分析这些生理时间序列数据(4得到大量的信息关于我们的身体。虽然国家投入巨资在生物医学的发展,各种类型的慢性非传染性疾病的发病率正在增加。所以医学界正在向积极的方向转变。不同于上一个,旨在分析生理时间序列数据的方法和确定疾病的潜在风险和缓解措施之前生病了。

许多方法可以用来帮助我们更好地理解我们的身体状况。机器学习(5)是一个基本和重要的研究在许多领域。它广泛应用于工业6),电力系统(7,8,天气预报9),交通系统(10),计算机辅助检测和诊断系统(11),等等。一些公司也推出了深度学习相关项目通过收集和分析大量的数据和应用于异常检测或其他应用程序。这也是一个重要的助手意味着对医疗和医疗领域的重要应用价值(12]。在本文中,我们提出一种轻量级的方法检测异常数据通过分析生理信号。经验、生理信号可以从生物传感器以不同的方式获得。

虽然异常检测广泛应用于其他领域的异常生理信号检测问题的背景下,人机交互仍然复杂,进行调查。生理信号的异常检测主要是利用机器学习技术学习功能(13从生理信号,然后构建计算模型(14的异常检测。模型的主要部件包括两个部分:处理输入信号(学习功能)和检测异常数据。

特征提取和特征选择是关键在理解和培训异常检测算法(15,16]。生理信号通常是相关的时间和空间(17];他们属于高维时间序列数据。高维时间序列数据和复杂的具有独特的属性,让他们挑战来分析和模型。健康的异常检测的主要挑战之一是多元的生理信号,提取特征可以用来正确地检测异常数据(18]。传统方法的建模顺序数据包括参数的估计等假定时间序列模型的自回归模型和线性动力系统(像)和流行的隐马尔可夫模型(HMM)。估计的参数可以作为特征分类器进行分类。限制玻耳兹曼机遏制是输入单元之间的生成概率模型(可见的),和潜在的单位(隐藏)。几元可以堆叠和贪婪的方式训练形成所谓的深层信念网络(DBN),这是概率生成神经网络组成的多层次的限制玻耳兹曼机。DBNs图形模型学习训练数据中提取的深层次化表示。另一个模型,用于数据建模顺序递归神经网络(RNN)。一般来说,一个RNN从前馈网络获得通过连接神经元的输入输出。Hand-designed特征提取器需要人类专家找到合适的数据操作,将导致评估性能好。确定重要的特点和选择有效的处理一个新的应用程序可能是劳动密集型和耗时。它继承很多关键的局限性使其使用繁琐的高度复杂的多通道输入空间中。在本文中,我们提出一个新的自动生理信号异常检测方法。重点是开发无监督特征学习方法学习有意义的特征表示从无标号的生理信号。 Our hypothesis is that use of nonlinear unsupervised and multivariate Gauss distribution model methods [19- - - - - -21依靠深度学习的原则可以消除当前的特征提取和特征选择的局限性在生理信号异常检测。无监督特征学习技术(4,22]是一种学习特性表征(23]人类专家可能不知道和能反映本质的健康状态特征表示。该方法的第二个贡献是使用卷积神经网络(CNN)的特征提取饲料异常检测模型和异常数据给医生评估前降低风险方面疾病。CNN的卷积和池可以帮助我们更快地处理高维数据。通过分析生理信号,如果出现异常数据,特别提前预防应该减少疾病的风险。

2。材料和方法

在本节中,我们描述一个通用的框架用于功能学习。具体,我们将关注这些算法的应用学习从生理信号特征,尽管我们的方法也适用于其他形式的数据。此外,本文研究覆盖的两个关键研究支柱:定义特性集从客观数据信号中提取相关信息;创建一组特性映射到多元高斯模型异常检测模型来预测异常生理信号。

在高级别上,我们的算法执行以下步骤(见图1)学习特性表示:(一)将生理信号分成许多段从标记的训练数据。(b)应用预处理阶段段和正常化的原始数据。(c)使用一种无监督学习算法提取高水平信息。(d)使用高斯模型来检测异常的生理信号。

现在我们描述这个管道及其组件的详细参数。

2.1。学习功能

在健康状态异常的背景下检测,特征学习的过程是指将原始信号被硬件转换为一组输入适合异常数据的计算评估。通常,学习特性从一维连续信号简单的统计特性(24,25),如平均和标准偏差值,计算的时间或频率域原始或规范化的信号。生理信号异常检测基于信号与多个维度通常可以归结为生理异常数据从各种各样的生理信号检测。本文的焦点是卷积神经网络(5,13,26)方法,可以自动提取新特性或未知特性从这些数据以一种无监督的方式。

卷积神经网络,作为一个受欢迎的技术,可用于许多领域,如图像和视频分类自然语言处理、行人检测、通用的视觉识别,人脸识别,图像识别10,27]。他们非常类似于普通神经网络。它由许多神经元可学的重量和偏见。每个神经元接收一些输入和执行一个非线性函数乙状结肠的点积。卷积神经网络由一个或多个卷积层(通常用二次抽样步骤),然后后面跟着一个或多个完全连接层和一个标准的多层神经网络。安的架构设计,包括特征提取器和异常检测,如图2。

通常,在卷积神经网络,每一层由两个操作:卷积和max-pooling。卷积层,上一层特征地图是卷积可学的内核,然后通过激活函数形式输出特性图。每个输出映射可能把玲珑与多个输入地图。假设表示输入信号是二维数据的大小,在那里和是正整数。地图功能是输入信号的卷积得到的线性滤波器,添加一个偏见,然后应用非线性函数。如果我们表示特征映射在给定层的过滤器是由重量决定的和偏见,意味着输入地图层的选择。然后特征映射得到如下: 灵敏度计算过程: 函数就是一个将采样的逆过程。

计算梯度, 是成本函数。新变量在这里,这意味着补丁这是明智的增加元素。

二次抽样层梯度: 在这里,二次抽样函数,如average-pooling或max-pooling。是一个矩阵大小相同的吗,它的元素是所有的敏感节点之间的卷积层节点的连接层和重量被定义为,我们可以计算出梯度β和在二次抽样层以下方程:

每个神经元的输入决定了补丁的大小。每个神经元都包含一定数量的可训练的重量等于其输入和额外的数量偏差参数;计算输出通过应用一个激活函数的加权和输入和偏见。(激活功能:双曲正切ReLU、乙状结肠和Softplus。。−1中的实际价值压缩输入范围为1,所以它大体上是0的意思;ReLU:。网络引入稀疏,ReLU的性能比其他激活函数的情况下没有pretraining;乙状结肠:。激活函数的神经网络学习可以推动关键特性中央和两边nonkey特征区域;Softplus:。激活函数使输出和输入之间的关系保持的非线性单调上升和下降和容错神经网络是好的。)每个神经元顺序扫描输入,评估在每个补丁位置权重的相似模式编码。输入的连续输出生成的每个位置装配特征映射。卷积的输出层的组特征图重复应用失功在整个输入的条件。在下面,我们提供细节在CNN架构图2。卷积的神经元层采取作为输入一个补丁输入时间序列数据。输入应用补丁的滑动窗口大步沿着时间轴8。每个神经元计算然后获得特性。

一旦特征图谱已经生成,池层特征图的连续聚合值造成前面的卷积层,减少他们的决议池功能。最大值或平均值是最常用的两个池函数提供max-pooling和average-pooling层,分别。通常定期连续卷积层之间插入一个池层在一个事先架构。它的功能是逐渐减少的空间大小表示减少的参数和计算网络中,因此也控制过度拟合。摘要池层是独立运营的每一个深度的输入和修改尺寸空间,使用MAX操作。最常见的形式是一个池层过滤器的大小应用2 downsamples大步的在每个深度切片在输入2两种宽度和高度,丢弃激活的75%。因为生理信号时间序列数据,我们设计了过滤器的大小步的2 downsamples沿着时间轴。

正如我们上面所描述的那样,一个简单的CNN是一系列层,每层一个CNN转换一个活动到另一个通过一个可微函数的体积。我们使用三个主要类型的层来构建CNN架构:卷积层、汇聚层,充分连接层(就像在普通神经网络)。在我们的工作,这是一个层次模型,替代卷积和池层是为了处理大型空间或时间的输入空间之间的关系存在输入等时间序列数据,演讲,或生理信号。因此,层次分析和学习架构在异常检测是成功的关键。

2.2。Autoencoders

我们必须训练网络权值与一种无监督的方法,因为我们的训练集是无标号。通常生理信号没有标记,所以我们需要采取其他方法来训练事先权重。一个autoencoder神经网络(见图3)是一种无监督学习算法,应用反向传播,设置目标值等于输入(28]。在本文中,我们使用autoencoders列车所有卷积CNN的层。现在我们只有一组标记训练的例子,在那里。一个autoencoder需要一个输入首先它(编码器)映射到一个隐藏的表示通过一个确定的映射: 在哪里是一个非线性函数乙状结肠。潜在的表示或代码然后映射(解码器)为建设相同的形状。映射是通过一个类似的转换: 应被视为一个预测的,考虑到代码。

autoencoder是一个模型,将一个输入空间转换成一个新的分布式表示通过应用确定性参数化函数称为编码器(见图4)。autoencoder学习如何将编码器的输出映射到输入空间,参数化的解码器,小重建误差训练的例子;即原始和相应的解码输入是相似的。编码器权重(用于获得输出表示)也被用来重建输入。通过定义的重建误差的平方的总和差异输入和重建的输入,然后使用梯度下降法,如反向传播训练事先的权重。重建误差可以测量在很多方面,根据适当的分布假设给定的输入代码。传统的平方误差函数是由成本在这里是原始数据,重建数据。

摘要autoencoders用于训练无监督CNN转置的子集原始输入信号到学特性。反过来,学会了从输入层特征提取的输出可能给任何函数近似或分类器,试图找到一个输入信号和目标之间的映射输出。在本文中,我们使用多元高斯异常检测模型来检测用户的异常生理信号基于学习功能的生理信号。

2.3。多元高斯分布

单变量的多元高斯分布是一个泛化正常的两个或两个以上的变量。是一个分布的随机向量的相关变量,每个元素都有一个一元正态分布。一个向量值随机变量据说有一个多元高斯分布与平均向量和协方差矩阵。它的概率密度函数是由

我们写成。

异常检测是一种无监督学习方法,使用密度估计来评估数据是否正常。表达式如下: 当大于阈值,数据是正常的,小于阈值,数据异常。

3所示。结果与讨论

在实验中,我们专注于评估使用CNN构建模型的功效的生理信号异常检测和我们测试算法在DEAP八生理信号数据集,数据集使用脑电图进行情感分析,生理和视频信号。我们预计,相关的信息可以更有效地提取异常检测使用CNN方法直接在原始的生理信号自动选择功能比一组designer-selected提取特征。实验的硬件和软件环境如下:硬件环境:英特尔(R)的核心(TM) i3 - 2330 CPU @ 2.2 GHz RAM 2.00 GB;软件环境:Windows 7, Python 2.7和Matlab R2014a。

3.1。训练的生理信号异常检测模型

在本文提供的方法,我们研究一种有效的方法学习的模型映射用户的生理信号检测异常数据。在特征提取阶段,我们使用一个深模型由一个多层卷积神经网络,将原始信号转换为减少设置功能。在异常检测阶段,我们喂养这些特性的异常检测模型,使用多元高斯分布(见图检测异常的生理信号2)。新的未标示生理信号输入时间序列模型之前,首先,使时间序列正常生理信号。然后在原网络参数提取特征。最后,使用多元高斯分布来检测异常数据在新标记时间序列的生理信号。深安体系结构包含两个卷积层,两层池,一个多元高斯异常检测模型。第一个卷积层(12块长度原始生理信号)过程的生理信号,然后向前传播到maximum-pooling层(窗口的长度2功能)。第二个卷积层(补丁的长度5子样品特性)处理子样品特征图和第二池产生的特征图谱层(窗口的长度2功能)。最后子样品特征图形式输出的CNN提供了大量的学习特性喂养高斯异常检测模型的输入。我们的假设是特征提取的自动化通过深度学习将产生异常的生理信号更高的预测能力,这反过来,提供更高精度的评价模型。

喂食前CNN的原始数据,以使重建误差收敛,我们标准化的原始数据使用: 和分别代表原始数据的平均值和标准偏差的原始数据。然后喂规范化数据CNN学习原始数据的特性。通过分析重建误差输入数据之间的和重建投入和迭代的数量,我们可以获得更好的学习功能。理论上,迭代次数越大,重建误差越小。

随着迭代次数的增加,成本函数趋近零,然后保持稳定,我们可以得出一个结论,重建数据几乎是一样的。因此,学习功能从原始数据是有效的,我们可以把这些功能的高水平表达原始数据。如图5所示,我们将5000次迭代,成本函数是趋于零,我们可以事先和高水平的权重特性的八个生理信号。

一旦功能已经吸取了,喂到高斯混合模型来检测异常特征和协调。我们认为数据和学习特性服从高斯分布。

如图6显示,8个生理信号的特性服从高斯分布的信号。

3.2。结果

然后我们选择一个阈值的特性然后得到的坐标和对应的原始数据。所有的异常检测算法可以设置不同的阈值,这可能使结果对应于现实。如果异常数据的比例是1%,阈值我们可以得到原始生理信号的异常特性和坐标。此外,如果异常数据的比例是5%,阈值我们可以得到其他异常特性和原始生理上的协调。

在本文中,我们使用一系列的检测阈值0.2,0.23,0.25,0.26,和异常数据的比率是1%,2%,3%,和5%,分别。比例控制生理信号的数量被认为是异常严重程度排名。我们得到四组异常数据如图7显示,(a)和(b)、(c)和(d), (e)和(f), (g)和(h)。最后,很容易获得异常的原始生理信号根据异常特征点坐标和医生可以快速分析那些异常的生理信号,帮助用户了解目前的健康状态。

(一)

(b)

(c)

(d)

(e)

(f)

(g)

(h)

3.3。讨论

数据集上的测试表明,该方法能检测到异常的生理信号,一些可能出现疾病的早期迹象。因此,该方法可能是一个工具来帮助医生确定潜在疾病。

没有“医学实例”绩效评估或基准数据集,每个生理信号标签是“正常或异常”的条款。本文检测阈值是人为地选择评价生理信号正常或异常。因此,本文的一个限制是,我们不提供一个评估检测精度在传统意义上,如假阴性和假阳性。需要一个新方法来评估的性能异常检测方法不依赖于先前存在的条件,但能够检测未知的问题。

4所示。结论

介绍了深度学习的应用建设异常检测模型的建立在生理信号的表现异常数据。检测异常数据,关键是学习有效特征的原始特性。提出的算法采用的卷积层数学习从输入信号中提取相关特征,然后养活这些功能多元高斯分布来检测异常特征。算法测试八生理信号。因此,总的来说,表明算法是高效学习高水平特色从原始生理信号和多元高斯分布异常检测。

特性学习方向在我们的算法可以概述如下。首先,大范围的数据集的每一个都有不同的特征从身体的不同部位应采用以证明该方法的有效性。其次,由于数据库是一个关键的在我们的方法中,数据的收集仍在继续。我们无法评估数据库的结果,因为被标记。因此,收集一些标签的生理信号是一种提高算法的性能。需要进一步的研究来全面评估算法的性能检测未知的问题。基于本文未来的研究可以从以下几个方面:首先,收集一些标记生理信号综合评估和改进算法的性能;第二,由于缺乏对比试验,有必要与其他算法做对比试验来验证该算法的性能。

相互竞争的利益

作者宣称没有利益冲突有关的出版。

确认

这项工作是支持的主要国家基础研究发展计划(973计划)项目没有。2013 cb328903和中国国家奖学金基金(CSC)文件。201306055018。DEAP提供的生理信号数据集,和URLhttp://www.eecs.qmul.ac.uk/mmv/datasets/deap/。

引用

A . Szczepański和k·赛义德,”移动设备系统预警的心电图异常,“传感器,14卷,不。6,11031 - 11044年,2014页。
视图: 出版商的网站 | 谷歌学术搜索
h .赵r·徐m .蜀,j .胡”Physiological-signal-based身体传感器网络密钥协商协议:一项调查,“仿真建模实践和理论卷。65年,32-44,2016页。
视图: 出版商的网站 | 谷歌学术搜索
d . t . Li z Wang赵,l .黄”发展为植物生理信号的便携式多通道系统录音,”农业信息处理,3卷,不。2、124 - 132年,2016页。
视图: 出版商的网站 | 谷歌学术搜索
m . Langkvist Karlsson l ., A . Loutfi”的无监督特征学习和深度学习时间序列建模,”模式识别的字母,42卷,不。1,11-24,2014页。
视图: 出版商的网站 | 谷歌学术搜索
,的j。施密德胡贝尔表示“深度学习神经网络:概述”,神经网络卷,61年,第117 - 85页,2015年。
视图: 出版商的网站 | 谷歌学术搜索
m .张、刘x和z,”一个工业熔融指数软测量预测基于进化极端的学习机器,”中国化学工程杂志》上,24卷,第1019 - 1013页,2016年。
视图: 出版商的网站 | 谷歌学术搜索
j . Heinermann o·克莱默,“风力发电预测机器学习集合体”,可再生能源卷,89年,第679 - 671页,2016年。
视图: 出版商的网站 | 谷歌学术搜索
p .唐·d·陈,y侯“熵方法结合极端学习机方法短期内光伏发电预测,“混乱,孤波和分形卷,89年,第248 - 243页,2016年。
视图: 出版商的网站 | 谷歌学术搜索
m . Gocic d . Petkovićs Shamshirband, a .喀新风”比较分析参考蒸散方程建模的极端的学习机器,”计算机和电子产品在农业卷。127年,56 - 63,2016页。
视图: 出版商的网站 | 谷歌学术搜索
j . d . Cireşan,迈耶∙马希,的和j。施密德胡贝尔表示“多列深层神经网络交通标志分类。”神经网络32卷,第338 - 333页,2012年。
视图: 出版商的网站 | 谷歌学术搜索
崔j.y. d·h·金k . n . Plataniotis和y . m . Ro”分类器集合生成和选择与多个特性表征分类应用程序在计算机辅助检测和诊断乳房x光检查,”专家系统与应用程序,46卷,第121 - 106页,2016年。
视图: 出版商的网站 | 谷歌学术搜索
w·黄,美国曾、m .广域网和g·陈,“医学媒体分析通过排名和大学习:多模图像疾病严重程度的预测研究中,“Neurocomputing卷,204年,第134 - 125页,2016年。
视图: 出版商的网站 | 谷歌学术搜索
即Mrazova和m . Kukacka”可以深层神经网络发现有意义的模式特性?”Procedia计算机科学》12卷,第199 - 194页,2012年。
视图: 谷歌学术搜索
美国阿拉斯和t . d . Kocakoc”新模式选择策略与人工神经网络在时间序列预测:《国际先驱论坛报》,“Neurocomputing卷,174年,第987 - 974页,2016年。
视图: 出版商的网站 | 谷歌学术搜索
j·格拉汉姆·古德费勒,d . Erhan p l .载波et al .,“挑战表示学习:报告三个机器学习竞赛,”神经网络卷,64年,页59 - 63,2015。
视图: 出版商的网站 | 谷歌学术搜索
林k金,h, j.y.崔崔和k”设计框架层次的多个特征提取器和多个分类器,”模式识别卷,52岁,硕士论文,2016页。
视图: 出版商的网站 | 谷歌学术搜索
a·l·v·科埃略和c a . m .利马”评估分形维数作为EMG信号特征提取器的分类方法,”人工智能技术的工程应用36卷,第98 - 81页,2014年。
视图: 出版商的网站 | 谷歌学术搜索
s . m . Erfani s Rajasegarar s Karunasekera和c . Leckie“高维和大规模异常检测与深度学习支持向量机,使用一个线性看到下面成了“模式识别58卷,第134 - 121页,2016年。
视图: 出版商的网站 | 谷歌学术搜索
a . Aiyer k . Pyun Y.-Z。黄,d . b . O ' brien, r . m .灰色,”劳埃德高斯混合模型的聚类图像压缩和分类,“信号处理:图像通信,20卷,不。5,459 - 485年,2005页。
视图: 出版商的网站 | 谷歌学术搜索
b . Konomi g . Karagiannis, g .林”在贝叶斯植树的多元线性模型的高斯过程同区域化,”杂志的统计规划和推理卷,157/158页1 - 15,2015。
视图: 出版商的网站 | 谷歌学术搜索 | MathSciNet
欧哈根,a t·b·墨菲i c .葛姆雷和d . Karlis p·d·McNicholas”聚类多元正态逆高斯分布,”计算统计和数据分析卷。93年,18 - 30,2016页。
视图: 出版商的网站 | 谷歌学术搜索
m . Siddula f·戴,y, j .粉丝,“无监督特征学习感兴趣的对象检测杂乱的建筑屋顶网站图片”Procedia工程卷,145年,第435 - 428页,2016年。
视图: 出版商的网站 | 谷歌学术搜索
b . Zoefel和r . VanRullen脑电图振荡使乘火车阶段高级语音的特点,“科学杂志卷。124年,16-23,2016页。
视图: 出版商的网站 | 谷歌学术搜索
r . Jegadeeshwaran诉Sugumaran,“汽车液压制动系统的故障诊断使用统计特征和支持向量机,”机械系统和信号处理情况下,卷。满足52 - 53,需求没有。1,第446 - 436页,2015。
视图: 出版商的网站 | 谷歌学术搜索
森古普塔,m . Sahidullah g·萨哈,“肺声音分类使用cepstral-based统计特性,”计算机在生物学和医学卷,75年,第129 - 118页,2016年。
视图: 出版商的网站 | 谷歌学术搜索
k . Audhkhasi o . Osoba, b . Kosko”Noise-enhanced卷积神经网络,”神经网络卷。78年,15 - 23,2016页。
视图: 出版商的网站 | 谷歌学术搜索
x x。妞妞和c . y .孙”,一种新颖的混合CNN-SVM分类器识别手写的数字,”模式识别,45卷,不。4、1318 - 1325年,2012页。
视图: 出版商的网站 | 谷歌学术搜索
y y, z谢,k .徐窦,和y Lei,”一个高效和有效的卷积auto-encoder极端的学习机器学习3 d网络特性,”Neurocomputing卷,174年,第998 - 988页,2016年。
视图: 出版商的网站 | 谷歌学术搜索

版权

PDF 下载引用

下载其他格式

订单打印副本

的观点

5923年

下载

2334年

引用