文摘

健康对每个人都至关重要。进一步提高其已经受人尊敬的医疗技术,医学界正在过渡到积极的方法预测和生病前降低风险。这种方法需要测量人类的生理信号和定期分析这些数据。在本文中,我们提出一个新颖的方法来应用深度学习在生理信号分析,允许医生识别潜在的风险。然而,从生理时间序列数据中提取高水平信息是一个机器学习社区面临的难题。因此,在这种方法中,我们基于卷积神经网络应用模型,可以自动学习功能从原始生理信号以一种无监督的方式,然后基于学习功能使用多元高斯分布异常检测方法来检测异常数据。我们的实验显示有显著的性能在生理信号异常检测。所以它是一种很有前途的工具,医生确定疾病的早期迹象,即使是未知的先验的标准。

1。介绍

多年来,各种智能设备和现代生活越来越密不可分1]。人们可以通过这些设备记录各种各样的生理时间序列数据在任何时候和任何地方2,3]。分析这些生理时间序列数据(4得到大量的信息关于我们的身体。虽然国家投入巨资在生物医学的发展,各种类型的慢性非传染性疾病的发病率正在增加。所以医学界正在向积极的方向转变。不同于上一个,旨在分析生理时间序列数据的方法和确定疾病的潜在风险和缓解措施之前生病了。

许多方法可以用来帮助我们更好地理解我们的身体状况。机器学习(5)是一个基本和重要的研究在许多领域。它广泛应用于工业6),电力系统(7,8,天气预报9),交通系统(10),计算机辅助检测和诊断系统(11),等等。一些公司也推出了深度学习相关项目通过收集和分析大量的数据和应用于异常检测或其他应用程序。这也是一个重要的助手意味着对医疗和医疗领域的重要应用价值(12]。在本文中,我们提出一种轻量级的方法检测异常数据通过分析生理信号。经验、生理信号可以从生物传感器以不同的方式获得。

虽然异常检测广泛应用于其他领域的异常生理信号检测问题的背景下,人机交互仍然复杂,进行调查。生理信号的异常检测主要是利用机器学习技术学习功能(13从生理信号,然后构建计算模型(14的异常检测。模型的主要部件包括两个部分:处理输入信号(学习功能)和检测异常数据。

特征提取和特征选择是关键在理解和培训异常检测算法(15,16]。生理信号通常是相关的时间和空间(17];他们属于高维时间序列数据。高维时间序列数据和复杂的具有独特的属性,让他们挑战来分析和模型。健康的异常检测的主要挑战之一是多元的生理信号,提取特征可以用来正确地检测异常数据(18]。传统方法的建模顺序数据包括参数的估计等假定时间序列模型的自回归模型和线性动力系统(像)和流行的隐马尔可夫模型(HMM)。估计的参数可以作为特征分类器进行分类。限制玻耳兹曼机遏制是输入单元之间的生成概率模型(可见的), 和潜在的单位(隐藏)。几元可以堆叠和贪婪的方式训练形成所谓的深层信念网络(DBN),这是概率生成神经网络组成的多层次的限制玻耳兹曼机。DBNs图形模型学习训练数据中提取的深层次化表示。另一个模型,用于数据建模顺序递归神经网络(RNN)。一般来说,一个RNN从前馈网络获得通过连接神经元的输入输出。Hand-designed特征提取器需要人类专家找到合适的数据操作,将导致评估性能好。确定重要的特点和选择有效的处理一个新的应用程序可能是劳动密集型和耗时。它继承很多关键的局限性使其使用繁琐的高度复杂的多通道输入空间中。在本文中,我们提出一个新的自动生理信号异常检测方法。重点是开发无监督特征学习方法学习有意义的特征表示从无标号的生理信号。 Our hypothesis is that use of nonlinear unsupervised and multivariate Gauss distribution model methods [19- - - - - -21依靠深度学习的原则可以消除当前的特征提取和特征选择的局限性在生理信号异常检测。无监督特征学习技术(4,22]是一种学习特性表征(23]人类专家可能不知道和能反映本质的健康状态特征表示。该方法的第二个贡献是使用卷积神经网络(CNN)的特征提取饲料异常检测模型和异常数据给医生评估前降低风险方面疾病。CNN的卷积和池可以帮助我们更快地处理高维数据。通过分析生理信号,如果出现异常数据,特别提前预防应该减少疾病的风险。

2。材料和方法

在本节中,我们描述一个通用的框架用于功能学习。具体,我们将关注这些算法的应用学习从生理信号特征,尽管我们的方法也适用于其他形式的数据。此外,本文研究覆盖的两个关键研究支柱: 定义特性集从客观数据信号中提取相关信息; 创建一组特性映射到多元高斯模型异常检测模型来预测异常生理信号。

在高级别上,我们的算法执行以下步骤(见图1)学习特性表示:(一)将生理信号分成许多段从标记的训练数据。(b)应用预处理阶段段和正常化的原始数据。(c)使用一种无监督学习算法提取高水平信息。(d)使用高斯模型来检测异常的生理信号。

现在我们描述这个管道及其组件的详细参数。

2.1。学习功能

在健康状态异常的背景下检测,特征学习的过程是指将原始信号被硬件转换为一组输入适合异常数据的计算评估。通常,学习特性从一维连续信号简单的统计特性(24,25),如平均和标准偏差值,计算的时间或频率域原始或规范化的信号。生理信号异常检测基于信号与多个维度通常可以归结为生理异常数据从各种各样的生理信号检测。本文的焦点是卷积神经网络(5,13,26)方法,可以自动提取新特性或未知特性从这些数据以一种无监督的方式。

卷积神经网络,作为一个受欢迎的技术,可用于许多领域,如图像和视频分类自然语言处理、行人检测、通用的视觉识别,人脸识别,图像识别10,27]。他们非常类似于普通神经网络。它由许多神经元可学的重量和偏见。每个神经元接收一些输入和执行一个非线性函数乙状结肠的点积。卷积神经网络由一个或多个卷积层(通常用二次抽样步骤),然后后面跟着一个或多个完全连接层和一个标准的多层神经网络。安的架构设计,包括特征提取器和异常检测,如图2

通常,在卷积神经网络,每一层由两个操作:卷积和max-pooling。卷积层,上一层特征地图是卷积可学的内核,然后通过激活函数形式输出特性图。每个输出映射可能把玲珑与多个输入地图。假设 表示输入信号是二维数据的大小 ,在那里 是正整数。地图功能是输入信号的卷积得到的线性滤波器,添加一个偏见,然后应用非线性函数 。如果我们表示 特征映射在给定层 的过滤器是由重量决定的 和偏见 , 意味着输入地图层的选择 。然后特征映射 得到如下: 灵敏度计算过程: 函数就是一个将采样的逆过程。

计算梯度, 是成本函数。新变量 在这里,这意味着补丁 这是明智的增加元素

二次抽样层梯度: 在这里, 二次抽样函数,如average-pooling或max-pooling。 是一个矩阵大小相同的吗 ,它的元素是所有的敏感节点之间的卷积层 节点的连接层 和重量被定义为 ,我们可以计算出梯度β 在二次抽样层以下方程:

每个神经元的输入决定了补丁的大小。每个神经元都包含一定数量的可训练的重量等于其输入和额外的数量偏差参数;计算输出通过应用一个激活函数的加权和输入和偏见。(激活功能:双曲正切ReLU、乙状结肠和Softplus。 。−1中的实际价值压缩输入范围为1,所以它大体上是0的意思;ReLU: 。网络引入稀疏,ReLU的性能比其他激活函数的情况下没有pretraining;乙状结肠: 。激活函数的神经网络学习可以推动关键特性中央和两边nonkey特征区域;Softplus: 。激活函数使输出和输入之间的关系保持的非线性单调上升和下降和容错神经网络是好的。)每个神经元顺序扫描输入,评估在每个补丁位置权重的相似模式编码。输入的连续输出生成的每个位置装配特征映射。卷积的输出层的组特征图重复应用失功在整个输入的条件。在下面,我们提供细节在CNN架构图2。卷积的神经元层采取作为输入一个补丁 输入时间序列数据。输入应用补丁的滑动窗口大步沿着时间轴8。每个神经元计算 然后获得特性。

一旦特征图谱已经生成,池层特征图的连续聚合值造成前面的卷积层,减少他们的决议池功能。最大值或平均值是最常用的两个池函数提供max-pooling和average-pooling层,分别。通常定期连续卷积层之间插入一个池层在一个事先架构。它的功能是逐渐减少的空间大小表示减少的参数和计算网络中,因此也控制过度拟合。摘要池层是独立运营的每一个深度的输入和修改尺寸空间,使用MAX操作。最常见的形式是一个池层过滤器的大小 应用2 downsamples大步的在每个深度切片在输入2两种宽度和高度,丢弃激活的75%。因为生理信号时间序列数据,我们设计了过滤器的大小 步的2 downsamples沿着时间轴。

正如我们上面所描述的那样,一个简单的CNN是一系列层,每层一个CNN转换一个活动到另一个通过一个可微函数的体积。我们使用三个主要类型的层来构建CNN架构:卷积层、汇聚层,充分连接层(就像在普通神经网络)。在我们的工作,这是一个层次模型,替代卷积和池层是为了处理大型空间或时间的输入空间之间的关系存在输入等时间序列数据,演讲,或生理信号。因此,层次分析和学习架构在异常检测是成功的关键。

2.2。Autoencoders

我们必须训练网络权值与一种无监督的方法,因为我们的训练集是无标号。通常生理信号没有标记,所以我们需要采取其他方法来训练事先权重。一个autoencoder神经网络(见图3)是一种无监督学习算法,应用反向传播,设置目标值等于输入(28]。在本文中,我们使用autoencoders列车所有卷积CNN的层。现在我们只有一组标记训练的例子 ,在那里 。一个autoencoder需要一个输入 首先它(编码器)映射到一个隐藏的表示 通过一个确定的映射: 在哪里 是一个非线性函数乙状结肠。潜在的表示 或代码然后映射(解码器)为建设 相同的形状 。映射是通过一个类似的转换: 应被视为一个预测的 ,考虑到代码

autoencoder是一个模型,将一个输入空间转换成一个新的分布式表示通过应用确定性参数化函数称为编码器(见图4)。autoencoder学习如何将编码器的输出映射到输入空间,参数化的解码器,小重建误差训练的例子;即原始和相应的解码输入是相似的。编码器权重(用于获得输出表示)也被用来重建输入。通过定义的重建误差的平方的总和差异输入和重建的输入,然后使用梯度下降法,如反向传播训练事先的权重。重建误差可以测量在很多方面,根据适当的分布假设给定的输入代码。传统的平方误差函数是由成本 在这里 是原始数据, 重建数据。

摘要autoencoders用于训练无监督CNN转置的子集原始输入信号到学特性。反过来,学会了从输入层特征提取的输出可能给任何函数近似或分类器,试图找到一个输入信号和目标之间的映射输出。在本文中,我们使用多元高斯异常检测模型来检测用户的异常生理信号基于学习功能的生理信号。

2.3。多元高斯分布

单变量的多元高斯分布是一个泛化正常的两个或两个以上的变量。是一个分布的随机向量的相关变量,每个元素都有一个一元正态分布。一个向量值随机变量 据说有一个多元高斯分布与平均向量 和协方差矩阵 。它的概率密度函数是由

我们写成

异常检测是一种无监督学习方法,使用密度估计来评估数据是否正常。表达式如下: 大于阈值 ,数据是正常的, 小于阈值 ,数据异常。

3所示。结果与讨论

在实验中,我们专注于评估使用CNN构建模型的功效的生理信号异常检测和我们测试算法在DEAP八生理信号数据集,数据集使用脑电图进行情感分析,生理和视频信号。我们预计,相关的信息可以更有效地提取异常检测使用CNN方法直接在原始的生理信号自动选择功能比一组designer-selected提取特征。实验的硬件和软件环境如下:硬件环境:英特尔(R)的核心(TM) i3 - 2330 CPU @ 2.2 GHz RAM 2.00 GB;软件环境:Windows 7, Python 2.7和Matlab R2014a。

3.1。训练的生理信号异常检测模型

在本文提供的方法,我们研究一种有效的方法学习的模型映射用户的生理信号检测异常数据。在特征提取阶段,我们使用一个深模型由一个多层卷积神经网络,将原始信号转换为减少设置功能。在异常检测阶段,我们喂养这些特性的异常检测模型,使用多元高斯分布(见图检测异常的生理信号2)。新的未标示生理信号输入时间序列模型之前,首先,使时间序列正常生理信号。然后在原网络参数提取特征。最后,使用多元高斯分布来检测异常数据在新标记时间序列的生理信号。深安体系结构包含两个卷积层,两层池,一个多元高斯异常检测模型。第一个卷积层(12块长度原始生理信号)过程的生理信号,然后向前传播到maximum-pooling层(窗口的长度2功能)。第二个卷积层(补丁的长度5子样品特性)处理子样品特征图和第二池产生的特征图谱层(窗口的长度2功能)。最后子样品特征图形式输出的CNN提供了大量的学习特性喂养高斯异常检测模型的输入。我们的假设是特征提取的自动化通过深度学习将产生异常的生理信号更高的预测能力,这反过来,提供更高精度的评价模型。

喂食前CNN的原始数据,以使重建误差收敛,我们标准化的原始数据使用: 分别代表原始数据的平均值和标准偏差的原始数据。然后喂规范化数据 CNN学习原始数据的特性。通过分析重建误差 输入数据之间的 和重建投入 和迭代的数量,我们可以获得更好的学习功能。理论上,迭代次数越大,重建误差越小

随着迭代次数的增加,成本函数 趋近零,然后保持稳定,我们可以得出一个结论,重建数据几乎是一样的。因此,学习功能从原始数据是有效的,我们可以把这些功能的高水平表达原始数据。如图5所示,我们将5000次迭代,成本函数 是趋于零,我们可以事先和高水平的权重特性的八个生理信号。

一旦功能已经吸取了,喂到高斯混合模型来检测异常特征和协调。我们认为数据和学习特性服从高斯分布。

如图6显示,8个生理信号的特性服从高斯分布的信号。

3.2。结果

然后我们选择一个阈值 的特性 然后得到的坐标和对应的原始数据。所有的异常检测算法可以设置不同的阈值 ,这可能使结果对应于现实。如果异常数据的比例是1%,阈值 我们可以得到原始生理信号的异常特性和坐标。此外,如果异常数据的比例是5%,阈值 我们可以得到其他异常特性和原始生理上的协调。

在本文中,我们使用一系列的检测阈值 0.2,0.23,0.25,0.26,和异常数据的比率是1%,2%,3%,和5%,分别。比例控制生理信号的数量被认为是异常严重程度排名。我们得到四组异常数据如图7显示,(a)和(b)、(c)和(d), (e)和(f), (g)和(h)。最后,很容易获得异常的原始生理信号根据异常特征点坐标和医生可以快速分析那些异常的生理信号,帮助用户了解目前的健康状态。

3.3。讨论

数据集上的测试表明,该方法能检测到异常的生理信号,一些可能出现疾病的早期迹象。因此,该方法可能是一个工具来帮助医生确定潜在疾病。

没有“医学实例”绩效评估或基准数据集,每个生理信号标签是“正常或异常”的条款。本文检测阈值 是人为地选择评价生理信号正常或异常。因此,本文的一个限制是,我们不提供一个评估检测精度在传统意义上,如假阴性和假阳性。需要一个新方法来评估的性能异常检测方法不依赖于先前存在的条件,但能够检测未知的问题。

4所示。结论

介绍了深度学习的应用建设异常检测模型的建立在生理信号的表现异常数据。检测异常数据,关键是学习有效特征的原始特性。提出的算法采用的卷积层数学习从输入信号中提取相关特征,然后养活这些功能多元高斯分布来检测异常特征。算法测试八生理信号。因此,总的来说,表明算法是高效学习高水平特色从原始生理信号和多元高斯分布异常检测。

特性学习方向在我们的算法可以概述如下。首先,大范围的数据集的每一个都有不同的特征从身体的不同部位应采用以证明该方法的有效性。其次,由于数据库是一个关键的在我们的方法中,数据的收集仍在继续。我们无法评估数据库的结果,因为被标记。因此,收集一些标签的生理信号是一种提高算法的性能。需要进一步的研究来全面评估算法的性能检测未知的问题。基于本文未来的研究可以从以下几个方面:首先,收集一些标记生理信号综合评估和改进算法的性能;第二,由于缺乏对比试验,有必要与其他算法做对比试验来验证该算法的性能。

相互竞争的利益

作者宣称没有利益冲突有关的出版。

确认

这项工作是支持的主要国家基础研究发展计划(973计划)项目没有。2013 cb328903和中国国家奖学金基金(CSC)文件。201306055018。DEAP提供的生理信号数据集,和URLhttp://www.eecs.qmul.ac.uk/mmv/datasets/deap/