文摘
Cross-approximate熵(XApEn)量化的共同秩序同时记录时间序列。尽管是来源于坚定孤独的熵,它从来没有达到他们的声誉和部署。本研究的目的是确定排除更广泛的问题XApEn实现和开发的一套解决方案。具体的表达式XApEn及其组成部分,相比值估计来自人工数据。这种比较显示广阔的区域内参数空间不保证可靠概率估计,XApEn估计不一致。一个简单的修正之一XApEn提出了程序步骤。三套公式联合参数选择。第一个目的是最大化阈值配置文件。其余的最小化XApEn根据强和弱不稳定条件。派生的表达式是验证使用心血管信号记录从老鼠(长信号)和健康志愿者(短临床信号),提出改变传统的参数指导方针。
1。介绍
近似熵(ApEn)是最利用非线性技术来量化时间序列的复杂性和不可预测性1- - - - - -3),引用率中突出显示(4]。ApEn被批准作为支持工具在临床前和临床研究中,在心血管研究中最突出的应用程序。
尽管庞大而坚定的实现,活动ApEn改善从未停止。研究面向修改,包括样本熵(SampEn)(5),纠正条件熵(CApEn)(6),最近的邻域熵(KNNCE)(7),模糊熵(FuzzyEn)(8),多尺度熵(MultiScaleEn)(9),距离熵(DistEn)(10),熵的关键(BinEn)(11),ApEn基于波模式(12[],加快算法13,14),对一致性的研究,包括阈值选择(15- - - - - -20.],时滞[21),和一般的一致性4]。
第一个之一ApEn修改是交叉- - - - - -ApEn (XApEn)(22]估计相互同时记录两个时间序列的可预测性。针对ApEn作为一个孤独的信号的复杂性度量,XApEn应该成为一个等价的成对的生理过程的工具。然而,声誉和部署其前任从来没有达成。除了最近的改进(23),XApEn应用程序遵循古典ApEn指南,尽管()的参数应该调整甚至ApEn(例如,(4,15- - - - - -20.)和(b)的属性XApEn是不同的,简单的ApEn指导方针可能不是适当的。
本文的目的是确定排除更广泛的问题XApEn实现和提出方法的调整。这是证明的基本来源XApEn不一致是不可靠的条件概率估计其本构元素。结果表明,所需的参数XApEn是相互依赖,所以传统的指导他们选择需要一个更新。为了定位参数不稳定地区XApEn值估计的人工模拟数据比较真实XApEn值计算公式。这些观察后,我们推导出方程共同选择稳定参数可靠XApEn估计在实际信号,精确的数学描述是不可用。派生的方程使用各种心血管信号测试:使用典型的短的门诊病人和记录使用长信号记录从小型实验室动物。
2。材料和方法
2.1。实验数据
该研究使用三种类型的数据:人工,动物,和人类。人造数据的目的是为了测试估算值的稳定性,比较他们的确切值计算的推导公式,并开发一套新的阈值方程。数据记录从动物也用于方法开发和重复测试,通过记录长度。从人类志愿者记录的数据被用来验证派生方法在典型实际应用程序记录很短。
在动物上的数据包括收缩压(SBP)信号和脉冲间隔(PI)信号记录两组老鼠:第一组由远男性纯种血压正常的老鼠,而第二组由远男性临界高血压大鼠。十天前的录音,radiotelemetric探针(TA11PA-C40、DSI Transoma医学)植入腹主动脉。血压(BP)波形数字化记录和传播使用迪讯A.R.T. 4.0设备(美国DSI、圣保罗、锰)采样频率= 1000 Hz。收缩压(SBP)决定在接收波形局部极大值。脉冲间隔决定作为一个连续的时刻之间的时间间隔最大梯度,当地最大的变化)的血压(BP)每个采样间隔波形。脉冲时间间隔是一个可以接受的替代的rr心电图的间隔。在动物实验中,暴露在两种类型的压力:瓶压力,与大鼠定位平台震动200次/分钟,和克制压力,对老鼠放在一个树脂玻璃管抑制剂(ID和毛孔5.5厘米)在仰卧位,与中给出详细描述(24]。这些数据已经用于其他研究[20.,24,25]。记录的时间基准,克制压力,和瓶压力是20分钟,60分钟,分别为20分钟。这样一个各种各样的数据(不同类型的老鼠和不同的强调环境)确保正确的派生的验证方法。非常缓慢的信号组件(趋势),一个免费的大鼠运动的结果,是消除使用高通滤波器(专门为生物医学信号26]。截止频率调整的平均脉冲间隔一个主题: 。它的值范围从0.055赫兹在这个实验0.085赫兹。传递的时间序列的平稳性,所以剩下的信号来自12个纯种血压正常的老鼠(共24的信号:12基线,6克制,和6瓶)和来自13个临界高血压大鼠(共26个信号:13基线,7克制,和6瓶信号集)。所有实验程序在这个研究符合欧洲共同体1986年11月24日理事会指令(86/609 / ECC)和医学院动物实验的指导方针,贝尔格莱德大学。
短数据系列(样本的数量 )记录从41医学检查男性健康志愿者定位在病床上,使用工作组®监测和采样频率等于1000赫兹(CNSystems Medizintechnik AG)、格拉茨http://www.cnsystems.com/products/task-force-monitor)。收缩压是取得局部极大值血压波形,当R峰发现心电图波形的局部极大值。之间的时间间隔连续R峰形成的rr间隔时间序列。传感器连接于医疗专业人员和患者不动,确保工件的数量和信号的平稳性。短数据长度是典型的动态监测,10分钟,也确保病人的宁静和记录数据的平稳性。实验遵循道德标准所医学院,贝尔格莱德大学签署了允许收集从每个志愿者。
人工数据包括样品均匀分布,使用可靠的专用机器生成独立的随机数发生器,并与正态分布的样品使用极地生成方法。为每一个参数集,一百年人工数据系列的生成,每一个组成 数据样本。程序代码是用Matlab写2014 b。
本研究时间序列中引用的一个例子是图所示1。
(一)
(b)
(c)
(d)
2.2。XApEn在短暂的
的过程XApEn估计(22)意味着 作为一个“主“时间序列和 ,因为它的“追随者”,是信号样本的数量。SBP在生物医学数据,被认为是一个主信号和π被认为是它的追随者。该系列分为长度的向量:
参数可以引入向量解相关(21),但在大多数研究设置为1(打)。一个向量从主系列通常被看作一个“模板。”
两个向量之间的距离定义为最大绝对样本的区别:
向量被认为是“类似的“如果他们的距离小于或等于预定义的阈值(公差)。找到相似之处的过程被称为“模板匹配必须执行。”评分标准的时间序列;否则,向量从不同来源将是无与伦比的22]。系列的标准得分意味着集中和标准化, ,在那里表示的意思是,表示标准偏差。一个正确的估计和至少,观测时间序列必须固定在广泛意义上。
的条件概率向量是在距离从一个特定的模板 估计如下: ,“”表示,估计表示一个指标函数,等于1如果它表明的条件是满足(距离小于或等于)。表示“的”的数量条件概率(3)也可以表示为
概率(3)和(4)描述一个二进制事件,如向量可以匹配或不匹配的模板吗。一个精确的数学推导所需的二进制事件的数量给出可靠的概率估计(27]。的推导27)是基于假设正常的二项分布的近似,在我们的案例中观察时发现匹配的数量 模板匹配试验。生成的表和图指出的概率估计的值,对于一个给定数量的匹配试验,是在特定的范围内被称为“置信区间。“从显示的图形化的结果27),可以看出,95%的置信区间 , ,这通常被认为是一个合理的不确定性,如果评估试验的数量 。所以,如果测试超过的数量 ,它被认为是一个“弱标准”,收益率令人满意的良好的二元概率估计(27]。匹配的数量等于 被认为是一个“强大的标准”的严格界限,概率估计更不确定,但通常它更难以实现,因为它需要长时间系列。相应的置信区间,为弱和强标准,推导在[27)如下:
的下一步XApEn估计是概率估计的平均对数(4)在所有模板值和被加数: 这个过程重复向量的长度 收益率的估计: 由于这一事实XApEn两个不同的时间序列比较,self-match(匹配模板本身),所谓的偏见来源ApEn,不能发生。不幸的是,比较不同系列的向量也意味着没有保证模板的长度掌握时间序列中至少有一个追随者时间序列匹配;因此,缺乏比赛可能发生的。结果是一个零的对数(6),使XApEn估计不可能,指出在5]。通常校正忽略跳过 用例。这样一个校正减少分子(6)对它的分母,大大低估了被加数。我们提出两个被加数修正,修正的不同(5]。第一个是类似的ApEn并实现了人工self-matches (见(8))。第二次修正不包括 情况下的分子(6)(见(9))。如果 代表一个零匹配总数
一个简单的抽象实验分析提出了修正。假设所有非零概率都等于一个任意常数, 。然后,加式由(6), 跳过和由(8)和(9)都是平等的 如果趋于无穷时,收敛于零估计收敛于相同的真正价值,也就是说,。但是,如果有限,低估的在(6)( 跳过)和(8)成正比。方程(8)另外患有非线性偏差由于错误的自匹配,因此重复的真正的自匹配问题ApEn。首选的校正是由(9),它被用于进一步评估。然而,正如稍后澄清,如果XApEn参数是正确选择,减少这种调整的必要性。
2.3。Parameter-InducedXApEn不一致
所需的参数XApEnestimation-time系列长度,阈值水平向量的大小和时间滞后——创造一个巨大的工作空间,但不稳定的地区。最近ApEn贡献了这个问题(4,19),也注意到在早些时候6,8,15- - - - - -18,20.]。但是参数研究XApEn不存在,除了一个简短的评论(5(作者的所知)。实现一些贡献XApEn遵循标准的指导方针从原始ApEn/XApEn论文(1- - - - - -3,22]:参数 和 实现在27];参数 或3, , 实现在28,29日),而参数 和 用于(30.]。应该注意的是,阈值在ApEn研究计算标准偏差例如, 。在XApEn研究中,标准差是通过定义组 ,由于义务标准评分(22]。
矛盾的结果由不同的工作的一个佐证点呈现在图2。矛盾的结果发现在临界高血压大鼠暴露于振动应力。嵌入式情节显示”XApEn阈值配置文件“(17]:XApEn值估计的阈值范围价值观,保持所有其他参数固定。获得一个概要文件,阈值水平逐渐增加的增量等于0.01 和等于0.05 。黑色线对应XApEn从老鼠的SBP和π信号估计基线条件,而红线对应阈值轮廓估计从老鼠的压力。这两条线的交点将图形区划分为两个区域:“灰色”地区XApEn比压力值高于基线条件,而“白”地区XApEn逆成为基线比压力较低。的最大价值XApEn(最大阈值剖面线)用一个圆。一个“空”的圆表示低这两个最大值。一个完整的threshold-length ()飞机的剩余部分图所示2。一个阈值轮廓估计为每一个特定的时间序列长度。阈值的位置的XApEn概要文件达到最大(17圆圈所示。我们假定一个时间差 。
图的符号表示2区分三种不同来源的矛盾的结果(触发效果):(一)对于一个固定长度,XApEn“翻转”较低的在压力较低的阈值在压力高阈值;例如,对于 ,这种变化发生 。(B)固定阈值,一个不受欢迎的变化XApEn从低压力在高应力发生在特定的时间序列长度;例如,如果 ,这种变化发生 和 。(C)为选择一个阈值(是阈值的XApEn达到它的最大价值,15- - - - - -17]),XApEn变化从上涨压力,如果 ,一个完整的红色圆圈所示,在压力较低 空的红圈所示。
2.4。显式公式误差估计
本构XApEn元素是条件概率((3)和(4)),这是一个估计误差每一个: 这些错误是对数积累形成被加数 估计误差 , 和XApEn错误 ,
找到一个稳定的参数区域估计错误的可能性也会被减到最小,真正的条件概率必须为每个模板评估: 在哪里表示的概率密度函数(p.d.f)信号(追随者)。一个概率对应于一个事件在一个示例是在距离从一个模板示例。
不幸的是,生物医学信号是一个结果的众多复杂的生理输入和反馈,所以精确公式p.d.f.尚未确定。相反,我们使用人工生成的数据与正常和均匀分布:
人工数据用于主和从动件系列,生成四个实验数据集:一个主及其追随者均正常,都统一的,正常的主与统一的追随者,统一掌握正常的追随者。
相应的条件概率的真实值,假设 ,都是 正态累积分布函数在下部的(16)是用而不是与被加数,以避免混乱。(16),所有相关的估计错误(11)- (13可以找到)。
2.5。参考阈值对心血管信号
人造数据的误差分析一种特权来评估一个参考点(真值)使用一个精确的公式。自然信号的问题是,他们的样本数据是统计相关的。此外,信号自然是不完全显示,没有数学表达式来描述它。所以,不存在计算参考价值的估计结果可以比较。第一个辅助的参考点考虑ApEn中获得的经验(17),作者指出的存在ApEn最大和相应的阈值达到这个最大值。发现通过执行评估的乏味任务吗ApEn分别为每个阈值,从而获得一个阈值配置文件。在[15],乏味的估计是由一组表达式代替自动评估理论的阈值这是(几乎)等于。在[16),同样的作者提出了一个替代的公式。它展示了15,16经验阈值水平)最大的价值ApEn绘图时获得阈值配置文件依赖于时间序列长度在标准差的时间序列和标准偏差滞后微分信号 ,在那里是一个样品之间的时间差(延迟), 。观察到的依赖关系被证明是线性的平方根和比,所以作者进行了计算机搜索系数产生最适合在最小二乘意义上获得(18)。我们采用了相同的方法来找到 理论的阈值在(18),有必要对我们的评价,而不是覆盖在15,16]。
自动评价方法的辅助参考点是不存在的XApEn。我们观察到25)的阈值掌握时间序列影响的阈值的XApEn,他们的区别是线性相关的平方根 ,在那里和标准差滞后微分系列的吗 和 (25]。然后,为每个人为创造的大师追随者组合(正常不过,穿,uniform-normal uniform-uniform),我们生成的100对归一化信号,总共400信号双/参数集。对于每一对信号来说,我们发现最大的概要文件和相应的阈值,我们也估计和。然后,对执行最小二乘拟合,从而获得特定系数,,。不同的重复过程值,从300年到5000年的增量等于100。结果平均为每个特定的 给系数集,,。因为几套几乎相同的平均最小二乘误差,十25基线信号从老鼠被随机选择理由,和设定的系数最小绝对误差(平均超过所有的值和选择一个阈值,XApEn接近其最大价值: 在哪里从主时间序列根据评估
在这里,是时间序列的标准差(在XApEn它总是等于1)和标准差滞后微分系列的吗 和 。的表达式 在(18首次提出了在这项研究中,而表达式 从[15]。因为它是表所示3的表达式(15]产生低量的相对误差对心血管数据在这项研究中,所以他们更合适比类似的表达式派生(16]。阈值的子集(17) 和 提出了在25]。
阈值只有一半的可靠的工作点。因为它将显示,如果阈值应用、可靠性标准规定 (或 )并不满意。不同的解释这些标准状态,至少10(或100)事件应该发现,为了估计事件概率置信界限内安装(5)与95%的确定性。
显然,增加减少模板的匹配概率及其追随者,因此必须增加阈值成正比。系数(19)和(20.)是获得使用相同的数据集(17)。在这种情况下,条件概率估计,执行和拟合系数中产生不可靠的概率不到5%,在所有的值以上所有数据长度:
强大的可靠性标准,阈值的关系(20.)对向量的长度非线性:
为了清晰,总结了不同的阈值表1。
2.6。可靠性标准统计相关的数据
信心范围(5)坚持统计独立的二进制事件(27]。模板匹配在人工数据满足这个约束:观察一个 模板,其连续匹配测试 和 在相应的位置和 是独立的,作为一个常数的绝对差吗和独立样本和不破坏独立性。类似的推理有如果 。由此可见,估计概率有一个按比例缩小的二项分布(27),所以可靠性标准和置信区间(5可以应用)。如果数据是统计相关的,唯一的变化是增加了信心,在不影响估计的值或可靠性标准(27]。然而,真正的信心范围在实际生物医学数据不能被定义为真实的是未知的,所以对真实数据统计依赖关系是不重要的。可靠性测试还可以的一种形式 ,显示是否获得价值从足够多的数据估计。
3所示。结果与讨论
3.1。在人工数据估计错误
为XApEn误差估计、主系列和一百的追随者是人工生成的一系列( )参数,相同的价值观完全使用派生的公式计算。所有四个数据集的结果,由于大小,提出了在补充材料(网上https://doi.org/10.1155/2017/8365685)。
相对条件概率的错误 绘制在图3系列,和正态分布和 。满意的结果是获得了一个非常典型的阈值水平 。对于一个典型的阈值 只有大,误差低于10%和 。结果按照可靠性标准 说明或应该是大的。的确,被定义为一个产品的概率(14),所以它是在其最大 ,同时增加阈值增加模板匹配的数量(4),再次扩大。
(一)
(b)
(c)
的可靠性估计是检查比较数据长度 所需的最低 。测试失败的比例呈现在图4,在一个飞机,0%的失败是由绿色逐渐改变黄色(100%失败)。白线标志着古典和值、显示 4,估计,实现经典参数是不可靠的。非线性的相互关系,,在图4也指出,选择参数,将产生一个稳定的工作并不是一项简单的任务。
(一)
(b)
被加数的估计误差(12)暴露了两个问题。第一个是缺乏匹配( )诱导对数的零(6),如图5从图,所有不可靠概率的一个子集4。第二个问题是一个错误积累(12)。
(一)
(b)
图6显示了一个线图的被加数Φ及其变化对系列长度如果它是由一个公式计算(具体值),如果据估计在传统的方式,如果一个校正(9)是应用。这个修正并减弱估计错误,即使对于高值,但它不能单独使用,因为它只删除问题的一个子集。被加数的融合对它的真正价值取决于数据类型:统一的数据实现正确的短长度的限制。收敛性也端依赖,需要不同的数据长度来达到相同的限制。自的定义是不同的值(7每个被加数),这一事实增加了自己的和独立的估计误差的来源不稳定。
(一)
(b)
图7显示二维XApEn配置文件。使用派生值计算公式((a)和灰色线(b)和(c))验证已知的事实XApEn的对数线性降低阈值(5]。主要结论是真实的XApEn值既不是由时间序列长度的影响或模板的长度。频繁的想法XApEn单调增加直到达到高原或其价值降低概率低估的结果,随系列长度并最终消失。(a)的板在第二行显示纠正估计好按照真正的值 ,但显示增加的差异 和3。如果没有应用校正(a)(第三行),大幅偏离正确的值。(b)和(c)显示线图。真实和估算值之间的差异指出公认准则参数选择不提供一个安全的估计。
(一)
(b)
(c)
3.2。在心血管疾病环境中稳定的工作点
为了验证推导方程的准确性(17),我们建议(15,16),其方程对进行验证ApEn相对误差。对于每一个SBP-PI (rr)和π(rr) sbp信号对,动物(或志愿者),一个阈值根据评估(17),作为一个参数XApEn()估计。真正的最大XApEn()所提供的值是一个耗时的过程找到一个阈值的配置文件。对应的相对误差提出了表2。结果估计信号记录在人类志愿者的斜体部分表中给出2。相对误差低于2%,除了很短的数据长度( ), 当它达到6%;不幸的是,这对应于动态记录,不能太长。
为了比较,我们估计ApEn从我们的数据错误。我们应用根据计算(15](见(18)根据(16]。的相对误差如表所示3,提供了以下结论:错误级别较低,如果方程(15使用和比较的结果表2和3验证我们的表达式(17)相等性能表达式(18)派生的陆等人[15,16]。
的值不能应用,因为失败的比例的概率弱和强(图标准几乎是100%8)。但这个阈值反映了数据的性质和它可以作为阈值的参考使用和。它们的实现降低了失败,如图8。
(一)
(b)
实际的阈值计算的信号如表所示4。为了比较,阈值为正态分布的人工数据也绘制(图9)。这些阈值表明,传统的指导方针(0.15,0.2,和0.35)大大低估了可靠的实际需求XApEn估计。即使 ,强烈的可靠性可能超过所需的阈值 。虽然是猜测1,详细的系统信息将会丢失值是大于 或 (ApEn),也就是说,如果阈值超过这些值模板总是匹配它的追随者,在调查心血管信号,这种假设并不持有如下评估高阈值水平相当的振幅范围观测数据。
(一)
(b)
(c)
发达的阈值表达式主要用于心血管信号分析。以及使用的人工信号均匀段(有限振幅)和高斯(小振幅的发生率上升,但无限)。人工分布都是对称的。真实信号的振幅(π,SBP和rr)是由生理有界约束。表达的信号不对称偏态系数,见表5。心血管数据可以向左和向右倾斜,所以表5礼物绝对偏态值的平均值。SBP和π信号表现出一定程度的不对称性与瑞利分布(偏斜度≈0.631),但低于指数分布的偏态(偏斜度≈2)。在信号阈值评价高度偏态分布将是后续研究的课题。特别是,它将宝贵的探索峰电位间隔时间序列的一个重要类,接近指数的分布。指数分布的无记忆的属性可能会影响微分时间序列的标准差的值必要的(17)和(18)。
最后,表6礼物的一个可靠的必要步骤XApEn估计。
4所示。结论
本文进行分析XApEn参数空间,并提出了调整过程及其参数的选择方法。人工环境与已知数据分布允许精确的数学评估参考XApEn值和估计的比较。比较显示巨大的地区XApEn参数空间(阈值、数据长度,模板的长度)和不稳定的估计XApEn及其本构组件。它也表明,参数相互关系是非线性的,取决于数据类型。一个确定的二元概率估计的理论之间的关系(27)和模板匹配过程证明了不稳定的来源不可靠概率估计,这是在不稳定的地区工作的结果。稳定的XApEn估计应该经常保持不变增加数据长度和观察到的单调增加只是另一种形式的不稳定。它也表明,传统的指导工作区域内的不稳定。拟议的修正减毒,但没有消除这一问题。
解决方案是目标参数稳定区域内的参数空间和执行参数共同的选择,由于他们的关系的非线性性质。实际环境中没有提供确切的数学误差分析的优势,所以一组参数的稳定和可靠的评估是确保获得一套新颖的阈值表达式。考虑长度的表达式、模板、统计数据属性和可靠性准则(弱或强,27])。的一致性估计的典型案例验证短记录(的患者)和长记录(小实验动物)。结果表明,经典准则低估所需的阈值水平和数据长度一致的结果。
这种分析可以使用所有的熵措施,依靠概率估计。被提议的XApEn改进可能导致的更广泛的领域实现压力等相关生理过程的研究。为了方便,促进更广泛的XApEn部署,包括补充材料内的详细说明。
虽然在心血管数据验证了方法,它可以同样应用寻找正确的参数XApEn不一定是生物医学分析流程,提供他们的分布不是太扭曲了。进一步的调查将考虑高度不对称分布的信号,例如,峰电位间隔时间序列,但也不匹配的信号分布在零概率不是一个错误,但固有的信号属性。
的利益冲突
作者宣称没有利益冲突有关的出版。
确认
这项工作是由塞尔维亚教育部科学技术的发展,在资助TR32040 III41013。作者承认欧盟的支持COST-Action CA15104-Body通讯集团。作者也感激哈拉尔德·施特劳斯博士教授,爱荷华大学,和温和的Lobodzinski博士教授,加州大学洛杉矶分校,2016年10月的鼓舞人心的讨论。
补充材料
图3、4和5显示所有主和跟随者人工时间序列的组合。