辛主成分分析:时间序列分析的新方法

文摘

实验数据往往是非常复杂的自底层动力系统可能是未知的,可能严重损坏的数据噪音。这是一个至关重要的任务进行适当的分析数据得到最大信息潜在的动力系统。介绍了一种新颖的主成分分析(PCA)方法基于辛几何,叫辛PCA (SPCA),研究非线性时间序列。非线性,它有别于传统的PCA方法基于线性奇异值分解(计算)。因此被认为能够更好地代表非线性,特别是混乱的数据,比PCA。使用混乱的洛伦茨时间序列数据,我们表明,这确实是如此。此外,我们表明,SPCA可以方便地降低测量噪声。

1。介绍

实验测量的数据情况下,特别是在现实环境中,可以非常复杂的自底层动力系统可能是非线性的和未知的结构,和数据可能非常吵。适当的分析测量数据是具有挑战性的,尤其是吵的。混乱的现象被发现以来,口译作为一个不规则的各种动力学系统的确定性混沌过程已经流行,广泛应用于几乎所有的科学和工程领域。基于混沌理论的一些重要的算法已经被用来推断出系统动力学从数据从数据(或减少噪音1- - - - - -6]。这些方法的第一步是重构相空间的数据,以便可以正确系统的动态特性研究[7]。这是通过使用塔肯斯的嵌入定理(8),即无噪声的情况下的系统动力学可以从一维重建信号,也就是说,一个时间序列。然而,实际的系统可能会noisy-sometimes如此嘈杂,重构吸引子的非线性系统可以表现出不同的特性,当使用不同的分析技术(9- - - - - -12]。因此,适当的测量数据的分析在科学和工程领域的一个关键任务。在这项工作中,我们提出一种新颖的基于辛几何非线性分析方法和主成分分析,叫辛主成分分析(SPCA)。

辛几何是一种相空间几何学。它的本质是非线性的。它可以描述系统结构,特别是非线性结构,很好。它已经被用于研究各种非线性动力系统(13- - - - - -15自从冯[16)提出了解决辛微分辛算法。然而,从数据分析的角度,很少有文献采用辛几何理论探索的动力系统。我们之前的工作提出了嵌入维数的估计基于辛几何从时间序列(17- - - - - -20.]。随后,牛等人已经使用我们的方法来评估短跑表面EMG信号(21]。谢et al。22)提出了一种基于辛几何光谱的我们的工作。在本文中,我们表明,SPCA可以代表混沌时间序列和减少噪音在混乱的数据。

2。方法

考虑一个动力系统相空间中定义。有时一个离散轨迹可能被映射的形式在SPCA,基本步骤是构建多维结构(吸引子)辛几何空间。在拍摄的嵌入定理,我们首先构造一个在相空间吸引子,即轨迹矩阵从一个时间序列。然后,我们描述了辛主成分分析(SPCA)基于辛几何理论并给出相应的算法。

2.1。吸引子重构

让测量数据(可观测系统的研究)与采样间隔记录;是样品的数量。塔肯斯的嵌入定理指出,如果时间序列确实是由标量测量动力系统的状态,然后,在某些genericity假设,一对一的图像的原始设置是由延时嵌入,提供足够大。也就是说,延时嵌入提供了映射到- - - - - -维系列: 在哪里嵌入维数,点的数量吗维重建吸引子表示动力系统的相空间轨迹矩阵,即在相空间吸引子。

2.2。辛主成分分析

SPCA是一种基于辛几何的PCA方法。它的想法是地图研究复杂系统的辛空间和阐明主要特性的测量数据。最初的几大组件捕获辛空间的主要变量之间的关系。其余的组件是由不重要组件或噪声的测量数据。在辛空间中,使用几何叫做辛几何。不同于Eulid几何、辛几何与一个特殊的辛甚至空间几何结构。它依赖于一个双线性反对称非奇异的十字架product-symplectic叉乘: 在哪里当, 辛空间区域的测量量表。在辛空间中,任意的向量的长度总是等于零,没有意义和正交交叉航向的概念。在辛几何,辛变换是非线性变换从本质上说,这也被称为正则变换,因为保测特征,可以保持原始数据的自然属性不变。它是适合非线性动力学系统。

辛主成分是由辛相似变换。它类似于SVD-based PCA。对应的特征值可以通过辛方法。在这里,我们首先构造自相关矩阵的轨迹矩阵。然后,这个矩阵可以转化为哈密顿矩阵在辛空间。

定理2.1。任何矩阵可以制成一个哈密顿矩阵。让一个矩阵,所以 在哪里是哈密顿矩阵。

定理2.2。哈密顿矩阵一直维持在辛相似变换。

定理2.3。让是哈密顿矩阵,所以是辛矩阵。

定理2.4。让是sympletcic矩阵,有,在那里是辛酉矩阵;和是上三角矩阵。

定理2.5。sympletcic矩阵也是一个辛矩阵的乘积。

定理2.6。假设家庭矩阵H 在哪里 所以是辛酉矩阵。是共轭换位。

证明。为证明矩阵是辛矩阵,我们只需要证明。在哪里。
堵塞(2.10)(2.9),我们有:

哈密顿矩阵,它的特征值可以由辛相似变换和主可以转换成维度空间维空间来解决(17- - - - - -19),如下:(我)让, (2)构造一个辛矩阵, 在哪里是Hessenberg矩阵。矩阵可能是一个辛家庭矩阵。如果矩阵是一个真正的对称矩阵,可以被视为。然后,你可以得到一个上Hessenberg矩阵(称为(2.13),即在哪里是辛户主矩阵。(3)计算特征值通过使用辛分解方法;如果是一个真正的对称矩阵,特征值的是平等的吗: (iv)这些特征值按降序排序,也就是说,

因此,计算2维空间转换成的维度空间。的辛主成分的光谱有关辛正交基地。所谓的噪声地板,的值,反映了噪声级的数据(18,19]。相应的矩阵表示辛的特征向量。

2.3。算法

测量数据,我们的算法由以下步骤组成:(1)重构吸引子从测量的时间序列,在那里矩阵的嵌入维数吗和。(2)删除平均值矩阵的每一行。(3)建立真正的对称矩阵,也就是说, 在这里,应该大于系统的维度的嵌入定理。(4)计算矩阵的辛主成分通过分解,并给家庭变换矩阵。(5)构建相应的主特征值矩阵根据数量选择辛矩阵的主成分,在那里。也就是说,当;否则,。在使用中,可以选择根据(2.16)。(6)得到转换后的系数,在那里 (7)估计从然后,reestimation数据可以给。(8)噪声时间序列,首先估计数据通常是不好的。在这里,你可以回到步骤(6),让在(2.18)步骤(6)和(7)。一般来说,第二个估计数据将比第一个估计数据。

除此之外,有必要注意,清洁时间序列的步骤(8)是不必要的处理。

3所示。数值和实验数据

为了调查SPCA的可行性,本文使用混乱的洛伦茨时间序列如下: 在哪里。在这里,测量是一个高斯白噪声。测量噪声因为所有使用真正的测量被噪声污染。噪声概念的更多细节,请参阅参考文献[23- - - - - -26]。

4所示。绩效评估

SPCA PCA一样,不仅可以表示原始数据通过捕获变量之间的关系,而且还可以减少原始数据中的错误的贡献。因此,本文研究了性能分析SPCA的两种观点,即表示混沌信号的混沌信号和噪声降低。

4.1。混沌信号的表示

我们第一次表明,对于清洁混沌时间序列,SPCA可以完美地重建原始数据在高维空间。我们首先嵌入原始时间序列相空间。考虑到洛伦兹系统的维数是3,矩阵的在我们的SPCA分析选为8。量化原始数据之间的差异和SPCA-filtered数据,我们采用均方根误差(RMSE)作为衡量: 在哪里和分别是原始数据和估计数据。

当,RMSE值低于10⁻¹⁴(见图1)。在图1原始数据是由(3.1当噪声。SPCA获得的估计数据。结果表明,SPCA比PCA方法。因为真正的系统通常是未知的,有必要研究采样时间的影响,数据长度,和噪音SPCA的方法。从数据1和2,我们可以看到,采样时间和数据长度不影响SPCA自由噪声的方法。

分析数据,我们使用主成分的百分比(PC)研究每个电脑的入住率,以减少噪音。电脑被定义为的百分比在哪里嵌入维度和吗是主成分值。从图3,我们发现第一大辛主成分(SPC) SPCA有点比PCA。它几乎拥有所有辛主成分的比例。这表明它是可行的SPCA研究时间序列的主成分分析。

接下来,我们研究张成的空间减少了几大辛主成分(单亲中心)估计Lorenz混沌时间序列(见图4)。在图4,数据给出了从混乱的洛伦兹系统采样时间为0.01。估计数据计算了前三个最大的单亲中心。原始数据之间的平均误差和标准偏差的估计数据和,分别。估计的数据非常接近原始数据不仅在时间域(见图4(一)),但也在相空间(见图4(b))。我们进一步探讨采样时间的影响在不同数量的电脑。当个人电脑数量和分别SPCA和PCA给RMSE值的变化与采样时间图5。我们可以看到,SPCA的RMSE值小于PCA。采样时间少比PCA对SPCA的影响。在的情况下,数据长度也影响SPCA比PCA(见图6)。

(一个)=7

(b)=1

与PCA相比,SPCA更好的结果数据4,5,6。我们可以看到,SPCA方法保持的基本动力特性的主要生成的时间序列混沌连续系统。这些表明,SPCA可以反映内在的原始时间序列的非线性特征。此外,SPCA可以阐明的主要特性的观测数据。这将有助于从嘈杂的数据检索主导模式。为此,我们研究了该算法的可行性来减少噪声通过使用嘈杂混乱的洛伦茨数据。

4.2。在混乱的信号降噪

吵闹的洛伦茨数据嘈杂的和清洁的相图数据给出了数据7(一)和7 (b)。干净的数据混乱的洛伦兹数据与无噪声的(3.1))。嘈杂的数据混乱的洛伦茨数据与零均值和方差的高斯白噪声(见(3.1))。采样时间是0.01。时间延迟11在图7。很明显,噪声很强。第一个运用数据获得的提议SPCA算法(见图7 (c)- - - - - -7 (f))。在这里,我们首先建立一个吸引子嵌入维数的8。然后,变换矩阵构造时。第一次去噪数据是由(2.18)和(2.19)。在图7 (c),第一个数据去噪与嘈杂的洛伦茨数据从时间的角度。图7 (d)显示了相应的相图的第一数据去噪。相比之下,图7(一),第一次去噪数据基本上能给原系统的结构。为了获得更好的结果,这个数据去噪(8)噪音再次降低了一步。我们可以看到,第二次降噪后,结果大大提高了在数字7 (e)和7 (f),分别。第二个运用数据的曲线比第一次去噪在相空间数据无论是在时间域或与数字7 (c)和7 (d)。图7 (g)就表明了PCA技术第一次去噪结果。我们将我们的算法来处理第一个运用数据的主成分分析(见图7 (h))。

(一)噪声数据的相图

(b)相图对清洁数据

(c)洛伦兹时间序列

SPCA (d)相图

SPCA (e)相图

(f)第二个数据去噪

对PCA (g)相图

对PCA (h)相图

一些噪音进一步减少但PCA的曲线并不优于SPCA图7 (e)。原因是事实上的PCA是一个线性方法。当非线性结构必须考虑,这可能会误导人,尤其是对于大型采样时间(见图8)。主成分分析的应用程序代码来自TISEAN工具(http://www.mpipks-dresden.mpg.de/ ~ tisean /)。

图8显示了关联维数的变化与嵌入维数0.1采样时间的清洁、吵闹,和去噪洛伦茨数据。我们可以观察到,清洁和SPCA运用数据的趋势曲线趋于平滑附近的2。嘈杂的数据、曲线的趋势正在不断地增加,也没有平台。PCA的运用数据、曲线的趋势也在增加,并且趋势与2一个平台。然而,这比SPCA的小平台。它比SPCA算法更有效。这表明PCA很难描述的非线性结构系统,因为维度的相关性体现混沌系统的非线性特性。在这里,关联维数由Grassberger-Procaccia估计的算法(27,28]。

5。讨论和结论

在本文中,我们提出了一种新颖的基于辛几何、PCA称为SPCA。从理论的角度,这种方法可以很好地反映非线性结构的非线性动力系统,因为它本质上是非线性的。使用混乱的洛伦茨数据和计算RMSE,百分比,相关尺寸,和相空间图,我们已经表明,SPCA方法能产生更可靠的结果为混沌时间序列广泛的数据长度和采样时间,尤其是在短数据长度比经典PCA和undersampled采样时间。关于降噪,SPCA比PCA算法也更有效。

我们想强调的是,SPCA的相位延迟了财产;也就是说,第二行SPCA-filtered数据更接近原始数据。今后值得进一步调查。

确认

这项工作是由中国国家自然科学基金(没有。10872125),科学基金创新研究群体的中国国家自然科学基金(没有。50821003),机械系统与振动国家重点实验室,项目研究基金支持的MSV的国家重点实验室,中国(批准号毫西弗- ms - 2010 - 08年)和上海市科学技术委员会(没有。06 zr14042)。作者还感谢博士高简帛的许多有价值的讨论。

引用

曹j .高,y,裴伟伟。东和j·胡,多尺度分析复杂的时间序列美国新泽西州霍博肯市Wiley-Interscience, 2007。视图:出版商的网站|Zentralblatt数学
h . Kantz和t .以下两非线性时间序列分析英国剑桥,剑桥大学出版社,第二版,2004年版。
j·胡、j·高和w·w·东“心率变异性的特征尺度李雅普诺夫指数,”混乱,19卷,不。2、文章ID 028506, 2009。视图:出版商的网站|谷歌学术搜索
m . Lei, z . Wang和z,“行动检测非线性表面EMG信号,”一个物理快报,部分,卷290,不。5 - 6,297 - 303年,2001页。视图:出版商的网站|谷歌学术搜索
g .沉思和c . Ertokatli”混乱的普通股指数回报的过程:一个实证检验伊斯坦布尔证交所(ISE)市场,“非洲商业管理杂志》上,4卷,不。6,1140 - 1148年,2010页。视图:谷歌学术搜索
a . Bogris a .郭进隆译和d . Syvridis“加密效率分析混沌通信系统的基于光子集成的混沌电路,”IEEE量子电子学杂志》上,46卷,不。10日,1421 - 1429年,2010页。视图:出版商的网站|谷歌学术搜索
h . Kantz r . heg, t·施赖伯”实际非线性时间序列的实现方法:TISEAN包,“混乱,9卷,不。2、413 - 435年,1999页。视图:谷歌学术搜索
f·塔肯斯,“检测奇怪吸引子在动荡,”动力系统和动荡d·a·兰德L.-S。年轻,Eds。,卷。898of数学课堂笔记施普林格,页366 - 381年,1981年。视图:谷歌学术搜索
a . m .弗雷泽,”从标量时间序列重构吸引子:奇异系统和冗余的比较标准,“自然史D,34卷,不。3、391 - 404年,1989页。视图:出版商的网站|谷歌学术搜索|Zentralblatt数学
m . Paluš和i Dvořak奇异值分解在吸引子重构:缺陷和预防措施,”自然史D,55卷,不。1 - 2、221 - 234年,1992页。视图:出版商的网站|谷歌学术搜索|Zentralblatt数学
j·b·高,j . Hu和w·w·东,“脑波动力学复杂性措施,”认知神经动力学5卷,第182 - 171页,2011年。视图:谷歌学术搜索
j·b·高,j . Hu w·w·东和黄懿慧曹”区分混沌和噪声通过尺度李雅普诺夫指数,”物理评论E,卷74,不。6、文章ID 066204, 2006。视图:出版商的网站|谷歌学术搜索
x Lu和r·施密德“辛Sine-Gordon类型系统的集成,”数学和计算机模拟,50卷,不。1 - 4、255 - 263年,1999页。视图:谷歌学术搜索
振国应和w·朱问:“确切固定随机兴奋,消散了陀螺系统的解决方案,“国际期刊的非线性力学,35卷,不。5,837 - 848年,2000页。视图:出版商的网站|谷歌学术搜索
a·c·j·罗和r·p·s·汉“随机共振理论层在非线性动态系统中,“混乱,孤波和分形,12卷,不。13日,2493 - 2508年,2001页。视图:出版商的网站|谷歌学术搜索
k .冯1984年北京研讨会上进行微分几何和微分方程,科学出版社,北京,1985。
c . Van贷款,”辛方法近似一个哈密顿矩阵的所有特征值,“线性代数及其应用,卷61,不。C, 233 - 251年,1984页。视图:谷歌学术搜索
m . Lei, z . Wang和z,”辛几何的应用在非线性动力学实验数据的分析,”学报》第14届国际会议上数字信号处理程序1 - 2卷,第1140 - 1137页,2002年。视图:谷歌学术搜索
m . Lei z王,z .冯”的方法嵌入维数估计基于辛几何,”一个物理快报,部分,卷303,不。2 - 3、179 - 189年,2002页。视图:出版商的网站|谷歌学术搜索
m·雷和g .孟”检测非线性太阳黑子数量。”国际期刊的非线性科学和数值模拟,5卷,不。4、321 - 326年,2004页。视图:谷歌学术搜索
x妞妞,瞿f . n . Wang“评估短跑运动员表面EMG信号基于EMD和辛几何,”青岛海洋大学学报,35卷,不。1,第129 - 125页,2005。视图:谷歌学术搜索
h·谢,z . Wang和h .黄”识别决定论在时间序列基于辛几何光谱,”一个物理快报,部分,卷342,不。1 - 2、156 - 161年,2005页。视图:出版商的网站|谷歌学术搜索
j .郭进隆译即Andreadis、g·帕瓦和m . Athanasiou”噪声的影响在混沌吸引子的关联维数,“混乱,孤波和分形,9卷,不。3、343 - 361年,1998页。视图:谷歌学术搜索
j .郭进隆译即Andreadis、g·帕瓦和m . Athanasiou”在噪声的影响最大李雅普诺夫指数吸引子的几何结构,”混乱,孤波和分形,9卷,不。6,947 - 958年,1998页。视图:谷歌学术搜索
w·w·东j·b·高,j . Hu和l .杨“恢复混沌信号在沉重的噪音环境中,”物理评论E文章ID 046210卷,83年,2011年。视图:谷歌学术搜索
j .高h .苏丹,j·胡和w·w·东“非线性时间序列自适应滤波和小波阈值收缩去噪:比较,”IEEE信号处理信件,17卷,不。3、237 - 240年,2010页。视图:出版商的网站|谷歌学术搜索
p . Grassberger和i Procaccia描述奇怪吸引子”,物理评论快报,50卷,不。5,346 - 349年,1983页。视图:出版商的网站|谷歌学术搜索
p . Grassberger和i Procaccia测量奇怪的陌生感,”自然史D,9卷,不。1 - 2、189 - 208年,1983页。视图:谷歌学术搜索

数学问题在工程

文摘