文摘
最近,数据和复杂的特点,比如癫痫脑电图(EEG)时间序列出现了。癫痫EEG数据特点包括非线性、nonnormality, nonperiodicity。因此,重要的是找到一个合适的预测方法,涵盖了这些特殊的特征。在本文中,我们提出一个强制地调整自回归(CA-AR)方法,从多变量癫痫脑电时间序列预测未来值。我们使用随机系数的技术,它有力的调整系数和1。分形维数是用来确定的顺序CA-AR模型。我们应用CA-AR方法反映特色癫痫EEG数据预测未来值的数据。实验结果表明,与以前的方法相比,该方法可以更快更准确的预测。
1。介绍
预测时间序列数据预测未来的值通过发现一组规则或识别模式从过去的数据。线性回归模型等预测时间序列的自回归(AR)、滑动平均(MA)和自回归移动平均(ARMA)被广泛使用1]。然而,当这些方法很难获得精确的预测时间序列数据具有非线性特征,不断变化。因此,软计算技术,如模糊逻辑和神经网络,开发解决问题的线性方法考虑非线性特性和不确定性时间序列数据(2,3]。
脑电时间序列信号从大脑获得有不规则和复杂的波结构。还包括大量的噪音。癫痫EEG数据代表一个复杂的时间序列的例子。癫痫是一种疾病定义的异常电活动的大脑是癫痫的诊断中心。癫痫EEG信号显示的变化随着时间的推移,通过不断与外部因素(4]。噪音是包括在测量期间癫痫EEG数据的复杂性。癫痫EEG数据是很难预测的,因为它有特殊的特征,如非线性、异常,和噪音。因此,重要的是要选择一个合适的预测方法,因为这些特征影响预测的准确性。
近年来,研究了使用脑电图数据自动检测和预测癫痫发作。一元、二元和多元算法提出了解决扣押的问题检测和预测基于脑电图的分析单个或多个电极(5- - - - - -7]。拉比等人应用非线性动力学基于不变的特征提取的相关尺寸测量颅内脑电图记录癫痫预测和设计了一个模糊规则系统(8]。Iasemidis等人提出了一种自适应癫痫预测算法(ASPA)收敛性的基础上的短期最大李雅普诺夫指数(STLmax)中关键电极在preseizure阶段(9]。刘等人介绍了癫痫发作预测方法利用粒子滤波(10]。同时,Shahidi Zandi等人提出了一个方法来预测癫痫发作通过分析熵对应零交点间隔在头皮脑电图及其衍生物11]。许多研究人员也使用自回归预测和光谱分析提取脑电图的癫痫前兆数据(12,13]。然而,这些研究人员使用的方法是基于数据的线性数据或不变的特征。
我们可以提供以下问题的定义。
问题的定义。给定一个时间序列数据,包括非线性等特点,nonnormality,和预测模型nonperiodicity试图预测在未来的某个时间的值。更正式,因为癫痫脑电图的时间序列,我们预测的价值。时间序列在时间的价值吗,是预测长度。
在本文中,我们提出一个调整系数的自适应预测算法的自回归(AR)模型硬。预测未来值的癫痫EEG数据包括特殊特性,我们使用随机系数与−1和1和分形维数的顺序CA-AR模型确定。我们与组脑电时间序列进行实验来评估我们的预测方法的适用性。实验结果表明,该方法比先前的方法提供了更好的预测性能。该算法提供了以下好处:对患者癫痫发作和癫痫发作预测和警告积极探索癫痫发作的特点。
本文的其余部分组织如下。节2我们描述,提出了预测方法。实验结果与其他方法相比在部分3。节4,我们将讨论相关工作发作的预测和分析。最后,我们提出我们的结论部分5。
2。材料和方法
自回归模型是一个简单的模型来估计未来价值的一系列使用以前的输入值。的基于“增大化现实”技术模型代表一个随机过程使用一般形式的秩序所示(1): 在哪里观察时间吗,自回归系数阶,通常是白噪声分布的平均值为零,方差吗在时间。
AR模型的一个重要特性是利用最近的观察过程中估计当前的观测在时间。即当前观测可以估计的线性加权和以前的观测。权重表示按照系数。基于“增大化现实”技术的问题分析是假设数据是静止的和线性的,并且必须得到最好的价值系数给定一个系列。几种方法被用来估计AR参数,如Yule-Walker,最小二乘法,伯格的方法(1]。它已经表明,这些大数据样本估算技术应该导致大约相同的参数值。Yule-Walker方法应用AR模型的信号通过最小化远期预测误差在最小二乘意义。未知的参数估计如下: 在假设下是正态分布,这是也的最大似然估计吗。的分布已经被广泛的研究。不幸的是,的具体分布是未知的。渐近,如果,它有一个正态分布,而如果,它是一个柯西分布。此外,如果,它是一个非标准的分布(14]。这些分布可以用来近似的有限样本分布。这表明不会充分分布近似有限样本分布,特别是在不连续点的附近,因为的具体分布所有的值是连续的吗。已经发现,除非是接近于零,这些分布不近似有限样本的分布。时的非标准的极限分布似乎给一个好的近似的有限样本分布接近1。但是,它太复杂了,实际应用从一个精确的近似这种非标准的极限分布可以得到渐近展开[15]。在这项研究中,我们的目标是找到一个适合癫痫EEG数据预测方法。更具体地说,假设是一个独立的和同分布序列定义为 在哪里和。从(3),我们有,,(16]。
特别是,如果我们把,我们获得一个基于“增大化现实”技术的特殊情况过程(16]。我们研究这个特殊情况。的动机模型(3)与,考虑标准的顺序灵活的AR系数模型中给出(1)。如果,我们有(4从()导致标准的随机模型1): 如果我们把,我们有 这两个模型(4)和(5)符合标准(关键)单位根(17]。一个模型,概括了(4)和(5)是 在随机系数值1或−1。模型(6)可以被视为一个泛化的标准随机连续跳向上或向下照去或−1。
癫痫EEG数据有特殊的特征,如非线性和异常和非标准分布(4]。因此,在这项研究中,当脑电图数据异常分布,我们大力调整AR系数。本文基于“增大化现实”技术的模型我们强制地调整AR模型的基础(CA-AR)。这个模型可以表示如下: 在哪里是随机系数与和,和对所有和。在AR建模有着重要的作用,因为它决定的顺序系数。自回归模型,确定订单的AR模型是一个重要的问题18]。订单的AR模型,必须适当地选择,因为它决定了自回归模型的效率。如果更小,那么估计误差较高,计算速度更快。另一方面,如果大,有缺点需要更多的计算时间没有任何估计误差的减少。因此,为了解决这些缺点,确定的最优方法的顺序AR模型是必需的。
在本文中,使用分形维数确定的顺序CA-AR模型。计算分形维数,我们计盒方法应用19]。计盒方法是最常见的一种方法来获得分形维度使用足够大的盒子的测量信号(20.]。换句话说,当广场的一边的长度和方形盒子的数量的计盒维数是和。它可以表示的计盒维数,,积极的常数,: 双方通过日志(8),我们得到 分形维数是由(10): 在哪里排除在外,而分母。同时,,如果是一个负数,将是一个正数。如果对数曲线图诗句是一条直线,分形维数是这直线的斜率(如图3)。
在这篇文章中,测量值使用(10)被定义为基于“增大化现实”技术的顺序,,它应用于CA-AR ()模型。换句话说,从脑电图数据预测癫痫发作,未来价值预计使用,从过去观测值。本文将表明,癫痫发作的特殊情况是预测的本系列,基于“增大化现实”技术()使用(7)。然后估计AR模型用于预测通过应用最小二乘估计。
3所示。结果
在本节中,我们讨论的实证验证数据分析预测癫痫EEG数据。脑电图数据集提供了(4],癫痫EEG数据集组成的脑电图数据集5(用~ E)。A和B数据记录在健康志愿者的放松清醒状态(眼睛打开或关闭)。C和D测量控制发作间隔期间,和E包含癫痫活动。这五个脑电图数据集包含100单通道脑电图段23.6秒持续时间、采样在173.61赫兹。在我们的实验中,我们只用三个数据集,比如,C和E。
3.1。检测的特点
在本文中,我们提出了一个新颖的方法来帮助改善癫痫发作预测的非线性和非周期的EEG信号。在本节中,我们首先分析癫痫EEG数据显示非线性的特点,采用倒频谱的周期性和滞后的情节。倒频谱是用来提取周期的研究或重复模式(21]。倒频谱分析的频谱峰值所对应的间距谐波,显然。的设在倒频谱显示的频率,和倒频谱的峰值周期的研究。倒频谱是用来发现受试者的周期性,C, e图1(一)展示了50原始信号的E和图记录发作期间的活动1 (b)显示使用倒频谱的测量周期。图1(一)似乎有一个原始信号中的周期波。然而,图1 (b)没有任何周期性。此外,主题和C也不显示周期性。
(一)50原始信号的E
(b) 50主题E利用倒频谱的信号
尽管原始信号中的周期的研究不断出现作为一个正弦波发作期间,当我们应用癫痫活动信号的倒频谱,结果不同于原始信号。没有任何周期性发作活动信号。我们观察到实验结果癫痫活动信号的倒频谱没有任何周期性。因此,由于大多数传统的预测或预测方法需要周期性的观测数据,这些方法不适合非周期的癫痫活动信号。
在本文中,我们应用滞后情节发现数据中隐藏的特征。滞后的情节是有用的在周期性数据的分析22]。滞后的阴谋检查是否数据集是随机的。此外,他们提供的相关数据。图2(一个)显示第一个主题的原始信号的癫痫脑电时间序列。滞后的情节主题所示的数据2 (b)和2 (c),延迟和,分别。图2 (b)显示一个明确的线性结构滞后的阴谋,这是隐藏在图2(一个)。也就是说,这滞后情节展示一个线性模式。如果数据强烈非随机的,我们能够应用可能适合一个自回归模型预测。图2 (c)展示了主题的高斯分布滞后的绘制通过绘制与。图2 (d)是第一个原始信号的c数据吗2 (e)和2 (f)表现出滞后的情节和,分别。在的情况下,线性模式显示为主题和主题图2 (f)图显示了类似的结果2 (c)。然而,数据2 (h)和2(我)主题E不同主题和主题的情况如图2(我),它是一个高斯分布的混合物。一般来说,当一个滞后情节有一个非随机模式,可以使用传统方法预测的数据。然而,癫痫EEG数据集显示随机模式,难以预测的传统方法。因此,我们需要一个合适的预测方法是非线性和nonperiodicity EEG信号的特征。
(一)第一原始信号的一个主题
| (b) 与第一个信号 |
| (c) 与第一个信号 |
(d)第一原始信号的C
| (e) 与第一个信号 |
| (f) 与第一个信号 |
(g)第一原始信号的E
| (h) 与第一个信号 |
| (我)的与第一个信号 |
(一)主题
(b) C
(c) E
3.2。CA-AR选择的顺序(维)预测
在本节中,我们目前的订单如何CA-AR决定使用分形维数。我们使用维分析是一种常见的分形维数估计的方法。也知道这是很容易的,自动计算,并适用于模式有或没有自相似性(20.]。然而,这种技术,包括数据处理和网格大小的范围的定义,需要适当的实现在实践中是有效的。在这项研究中,网格的大小从0.1到10000年的2的乘法22]。线性部分的斜率的情节是估计分形维数数据集的癫痫。在此方法中,每个信号是由一个序列提升网格的大小。两个值被记录为每个网格:方形盒子的数量由信号分割的,正方形的边长,。斜率形成的直线绘制对表示程度的复杂性或分形维数在1和2之间(23]。一个信号的分形维数1或2被认为是完全可微的或非常粗糙,不规则,分别。
我们测量了100个信号的分形维数每个主题确定CA-AR使用维分析的顺序。图3说明了的情节与基于网格的大小。图的双对数图3用于估计分形维数计算边坡的阴谋。数据3(一个),3 (b),3 (c)的重对数坐标图是第一信号的分形维数的一个主题,主题C, e .这幅图清楚地显示一条水平直线,当网格尺寸小或太大了。偏离线性直线将导致低估骨架分维值的信号。
我们应用计盒方法估计分形维数相空间的每个主题的一个信号。延迟坐标向量的向量空间称为相空间(22]。观察序列是由系列,时间序列在时间的价值。也就是说,我们可以定义。是一个真正的数量大于零称为时间延迟,然后呢是任何整数大于零。向量称为延迟坐标向量,因为它的条款是时滞时间序列的数据值。给定的时间序列和滞后,我们的所有延迟坐标向量形式。相空间是一个维空间。
图4证明了估计分形维数。的设在和设在表示相空间(时间延迟空间)和边坡,分别。这意味着一个滞后的长度足以重建状态空间。
(一)13电极
(b) 14电极
(c) 17电极
(d) 23号电极
图4显示了一些信号的分形维数,我们确认一些特定的结果;如果信号的维数增加时,分形维数(斜率)增加。结果图4对象A和C的情况下,信号主要有5和7之间的分形维数,同时E展览主题2和4之间的分形维数在时间延迟是20。即对象A和C展览4和5之间的平均斜率。然而,对于主题E,癫痫活动代表平均斜率为2.5。当时间延迟维度的增加,分形维数增加。然而,分形维数与滞后长度的情节表明,分形维数没有显著增加,滞后长度增加。这个实验显示使用对数的值参数的确定地块进行时间序列预测。也就是说,我们选择的平均斜率值的聚集整数所有正常信号作为订单对象A和CCA-AR,因为我们必须预测异常的行为,放弃了过去的模式。我们跑CA-AR模型与聚集整数“5”的平均预测的所有信号的斜率。确认选中是最佳的顺序,我们测量的预测误差信号从每个主题。这个结果可以证实3所示。3。
3.3。预测精度
评估的可靠性最优订购我们的模型,我们测量均方根误差(RMSE)的预测每个主题的所有信号。一个自回归模型意味着时间序列的当前值是基于过去的预测数据相同的随机变量。因此,一个自回归模型可以使用吗之前的时间序列值。让连续随机变量的实例,定期测量时间。我们应用标准的AR模型和CA-AR(强制地调整系数或−1)预测新模型癫痫的脑电图数据。
我们预测从481年到500年的时间点的信号模型和比较了预测误差之间的最优顺序决定由分形维度的平均值和其他订单。预测,我们使用了过去的时间序列值,选择了分形维数。如果从476年到480年,我们的模型使用时间点预测481点。表1显示RMSE几个信号,测量的结果与原始值之间的模型生成的值。RMSE比较当订单3、5、10和15 AR和该方法。在的情况下在提出的模型中,RMSE精度高于,,在主题,C和E在标准的基于“增大化现实”技术的情况下,对象A, C和E最低的RMSE展出,类似于该方法。如表所示1,该方法是展品错误率低于标准的基于“增大化现实”技术,当是5,最低的RMSE展出主题E科目之一。因此,我们确认最佳的订单是5,它用作CA-AR的顺序在实验来验证效率。该方法确定的顺序与分形维数的平均聚集整数,从所有正常信号测量对象A和C。
图5显示的结果预测受试者的快照,C和E,使用CA-AR和标准的AR模型。情节(a)、(c)和(e)显示的具体情况20-time一步预测20电极,和情节(b), (d)和(f)提供80电极信号的预测结果。原始信号图所示5(一个),从481年到500年与中性点红线标记。加号标记显示了该方法预测信号(绿线)和点标记块的预测信号标准AR(蓝线)。这些情节确认我们的预测方法优于传统的基于“增大化现实”技术的方法。
(一)主题的20电极
(b)第80届电极的主题
(c) 20电极的c
(d)的第80电极主体C
20电极(e)的e
(f)的第80电极主体E
在本文中,我们比较了几个现有的方法和CA-AR方法预测结果。表2显示了预测的结果使用现有的线性和非线性预测方法(人工神经网络3,模糊2,24),最近的邻居25),该方法)7日电极信号受大肠的实验中,我们使用一个信号的每一个主题来衡量每个预测方法的预测误差。测量现有方法的预测误差,我们部分训练信号来自原始信号从起点到500时间点或1000点的信号。例如,当现有的方法试图预测150年的时间点,1到500的时间点和1000点信号用于培训。然而,我们的方法仍然只使用5个时间点来预测未来值150个时间点。CA-AR认为从496年到500年预测未来值的时间501年,它从497年到501年使用预测502年的时间。
由于表2该方法显示,错误率低于现有的预测方法。安,RMSE逐渐增加时,预测时间点增加。然而,我们的方法是影响预测时间点的长度,因为它只用订单AR。此外,即使预测时间点的长度增加,出错率的预测结果并没有显示在我们的模型中改变。在Fuzzy-based方法的情况下,它执行批处理使用所有以前的值来估计新值。因此,我们退出测量预测错误,因为它需要很长的执行时间。
表3使用现有的方法措施的预测时间如表2。例如,如果培训时间ANN(人工神经网络)是500年预测时间是150年,然后0.5304代表了执行时间预测从501年到650年的时间。Fuzzy-based方法(2,24)被排除在1500年预测时间点测试,因为它已经表现出最高的预测时间相比其他方法预测在150 -时间点测试。该方法实现了更快的预测时间比ANN(人工神经网络)和神经网络(最近的邻居)。当培训时间点或预测时间点增加,现有的方法逐步增加预测时间。然而,由于该CA-AR方法只使用几个观测值,它维护一个稳定的时间。在癫痫发作的情况下,我们假设它应该能够告知病人前几分钟或几小时的开始发作。
我们评估预测误差与每个信号在每个主题,和表4显示了结果。这个实验是测量的未来价值500时间点使用观察信号的长度从1到500。单个信号有4096个时间点,和现有方法的单一信号从1到500的学习。模型预测从501年到1000年通过学习。在本文中,我们测量了RMSE原始信号和预测之间的信号。由于表4,C和E表示最低的平均预测错误率NN算法时使用。然而,神经网络方法需要太多学习时间相比,我们的方法。也就是说,1到500的值在神经网络训练时间的预测价值501。对502年的预测,培训期间是1:501。另一方面,我们的方法提供了快速计算时间,因为它的培训期间407年至501年对502年的预测。此外,神经网络和CA-AR错误率之间的差异非常小。
我们的方法只需要过去的值所确定的分形维数来预测未来值。因此,保证最快的计算时间学习预测癫痫发作。我们测量每个模型在预测期间的执行时间长度为1000,2000和3000。我们可以确定几个信号的结果表5。在这个实验中,我们使用使用的每个主题E和训练信号从1到500或1000年每个信号在现有方法的时间点。由于表5RMSE最低的预测出现在NN方法除非CA-AR预测的长度使用2000倍1000倍的长度训练信号。然而,我们需要考虑整个预测方法的执行时间。神经网络方法提供了良好的预测结果。然而,它需要较长的执行时间。此外,当预测时间的长度增加,执行时间也增加了。
时间序列预测的准确性对许多决策过程是一个非常重要的因素,因此该研究对提高预测模型的有效性。神经网络和AR模型捕获所有模式的数据(26]。我们的方法还可以捕获数据的模式,因为它是基于AR模型。癫痫EEG数据中,振幅之间的正常和癫痫信号带来了极大的差异。如果一个模式生成的信号通过该模型偏离过去的模式,CA-AR可以作为这些癫痫发作。然而,该模型并不单独确定检测或测量滑动时间窗口长度的变化模式。本研究的目的是提供快速运行时和在时间序列数据预测精度高,具有特殊nonperiodicity和非线性等特点。通过我们的实验结果,我们可以保证快速的执行时间和准确性之间的原始信号和从我们的模型生成的信号。
4所示。讨论
癫痫是一种常见的神经系统疾病,一些神经细胞痉挛性地承担过多的电力在短时间内。癫痫预测主要是通过统计分析方法处理脑电图记录的大脑活动。的预测癫痫发作可以用作警告癫痫发生在一定的时间尺度估算脑电波的变化。即预测癫痫发作提醒患者癫痫发作前的发生。因此,他们可以避免潜在的危险情况如脑损伤或癫痫发作期间的伤害。
近年来,许多研究已经调查使用脑电图数据的预测癫痫发作。Mormann et al。27]分析了二元对癫痫EEG信号预测。他们分析了EEG数据的同步使用意味着相位相干性(MPC)和最大线性EEG信号之间的互相关双。Schelter et al。28)使用MPC和获得的比例正确预测癫痫发作。查韦斯et al。29日]分析了焦发作癫痫EEG数据使用非线性回归预测分析和相同步。Winterhalder et al。30.)提出“癫痫预测特征”基于临床和统计学的考虑和扣押的性能预测方法相比使用线性和非线性时间序列分析的概念。这项工作表明预测的不确定性由癫痫发生的使用时期(SOP),癫痫的预期。然而,它可以表示当独立变量是连续的。此外,这些方法假定数据正常和独立。
李和姚31日]提出了基于小波变换的预测方法和模糊相似性测量脑电图数据。该方法分为两个步骤:计算熵的脑电图数据和计算相似性变量。李和欧阳32)提出了动态相似性度量基于相似性指数使用脑电图数据预测癫痫发作。Gigola et al。33]分析了不同类型的癫痫的时域预测癫痫发作使用小波分析基于储能的进化。Maiwald et al。34癫痫预测评估三种非线性方法:动态相似性指数,关联维数,积累能量。这些方法可以提取从脑电图数据健壮的特性。然而,这些方法的一部分执行基于窗口单位和临床应用是不够的。
提出了若干技术通过各种方法来分析癫痫发作的特点。刘等人。35)的分形维数测量人类小脑的磁共振影像(MRI) 24年轻健康受试者计盒方法使用。Esteller et al。36)确定皮层脑电图的分形维数(IEEG ECoG),使用Katz算法。他们的结果表明一个电记录的发作Electrocorticography (ECoG)时增加的复杂性。Sackellares et al。37]发现颞叶癫痫的特点是情景性阵发性放电(猝发的活动)。这些排放由组织中央的颞神经元的同步活动,特别是海马。然而,适当的解释这种分析还没有彻底解决。
在本文中,我们提出了一种新的CA-AR基于AR模型预测方法,可以预测复杂癫痫的发作脑电图数据通过应用非标准的特性分布(14]。CA-AR模型适用于时间序列数据具有特殊特征,如异常噪音、非线性和nonperiodicity。
5。结论
癫痫可能是由于大量的不相关的条件,包括损伤导致高烧、中风、毒性或电解质失衡。一个算法能够有效的实时癫痫发作预测将允许病人采取适当的措施减少癫痫发作的风险或伤害造成这样的攻击。传统方法预测或预测数据需要周期性的观测数据。然而,当我们应用了倒频谱,癫痫活动没有表现出周期性的信号。此外,我们可以区分癫痫EEG数据是否随机或非随机使用滞后阴谋。如果滞后情节有非随机模式,它可以用于预测的传统方法。然而,我们的数据似乎随机分布。
本研究提出了随机系数适用于随机分布数据。进一步,我们使用了双对数图(维)使用分形的概念维度预测癫痫EEG数据估计的重要预测最优顺序在我们CA-AR模型。我们的实验结果证明,CA-AR(强制地调整自回归)是最合适的预测方法对非周期的数据。它不需要复杂的计算,进行快速预测比其他方法。此外,我们的方法生成未来值比其他方法更准确或类似。癫痫EEG数据实验表明,我们的方法不仅是快速和可伸缩的而且准确实现低预测错误。
未来的研究将集中在扩展CA-AR执行多个预测,共同进化时间序列包括线性或非线性相关性和周期性或nonperiodicity。一个更加雄心勃勃的方向会自动调整参数和系数方程。
确认
这项研究得到了MKE(知识经济部),韩国,在期(信息技术研究中心)支持程序(NIPA - 2013 - h0301 - 13 - 3005)监督的海椰子(国家信息产业促进机构)。这是支持基础科学研究项目通过韩国国家研究基金会(NRF)由教育部、科技部(2012 - 0007810)。