可分离的非线性最小二乘参数估计的复杂的动态系统

文摘

非线性动态模型被广泛用于描述过程管理复杂的生物通路系统。在过去的十年中,这些模型的验证和进一步发展成为可能,由于收集的数据通过高通量实验利用分子生物学的方法。虽然这些数据是非常有益的,他们通常是不完整的,吵闹的,呈现为复杂的动态模型参数值的推理具有挑战性。幸运的是,许多生物系统嵌入式线性数学特性,可能被利用,从而提高,导致更好的优化算法的收敛性。在本文中,我们探索的推理的动态模型使用一个新方法可分离的非线性最小二乘优化并比较其性能与传统非线性最小二乘法。从广泛的模拟计算结果表明,该方法至少是尽可能准确的传统的非线性最小二乘,但通常优越,同时享受大量减少计算时间。

1。介绍

非线性动态模型被广泛用于描述过程管理复杂的生物通路系统。特别感兴趣的在这种情况下是所谓的规范格式,在其可能的反应是很灵活的,但是涉及到一个非常受限制的功能形式的领域。线性系统外,最著名的规范格式(LV)生态模型(1- - - - - -4],它使用二项术语和幂律系统框架内生化系统理论(BST),只使用产品的功能。BST最初设计分析生化和基因调控系统,但随后发现更广泛的应用在各种生物医学和其他领域(5,6]。而很容易建立一个LV或BST符号格式的一个复杂的生物系统模型,确定最优参数值仍然是一个巨大的挑战。因此,估计参数的系统的常微分方程(ode)仍然是一个活跃的研究领域,吸引了来自不同的科学领域(例如,7- - - - - -12]。事实上,许多优化方法ODE模型提出了近年来,但没有在广泛应用效果非常好,从内在原因横跨整个生物数据问题(稀疏、不确定性、噪音、…)技术和计算问题(很多局部最小值,不可辨识,马虎,…)。方法如基于估计(例如,13])和动态流量估计(14- - - - - -16缓解这些问题,但并不是万能药。

在这里,我们重新审视,并将提前实现,思想(17分离的估计转化为线性和非线性方面的任务。然而,我们的主要重点是不一个真正的新的评估方法本身。相反,我们感兴趣的一个更一般的和高级的观点比一般技术文章中给出参数估计。具体地说,本文地址的动态模型参数估计的数学格式包含线性特性,使自然的分离参数和系统状态。一个小例子是一个线性的颂歌,向量场参数是线性的吗θ,表示的导数关于t。作为一个更有趣的例子,ODE向量场可能部分线性参数,因为它是所谓的s系统模型在BST (5]。

例1。一个系统(18)被定义为在这里非负应承担的速率常数,而订单实值动态反映效果的强度和方向,一个变量对给定的流入或流出。非正式地,一个可以把这个系统作为一个回归方程,“共”变量在右边,而“响应”变量是衍生品在左边。注意,在速率常数向量场是线性的 ,但非线性动力学的订单。
的参数估计方法,利用可分性和系统状态动态模型有一个悠久的历史;参见[19为一个特例)。然而,严格的统计分析的方法取得了最近才(20.]。在经典的论文在动态模型的推理,是瓦(17顺便提到“一个可以使用可分性的想法或变量投影(见[21]或[22]),线性参数是隐式地解决,由此产生的(完全)是解决非线性最小二乘问题的非线性参数,然后使用他们获得的线性参数表示的非线性参数。因为这可以减少的大小非线性最小二乘问题有待解决,这是值得的。“有些令人惊讶的是,鉴于对常微分方程参数估计通常被认为作为动态流程建模的计算瓶颈,是瓦的建议并没有在实践中受到广泛关注。事实上,在广阔的文学专门为动态模型参数拟合技术,我们知道只有两个相关的引用:用直接积分方法,Dattner et al。23应用一个可分离的非线性最小二乘技术参数的推理在捕食系统中代理在异构环境中,而吴et al。24)使用高维线性赋系统的可分性来估计参数。此外,是利用估计颂歌参数的可分性的想法实施最近才在一个公开可用的软件包25]。有关这个软件的细节将在后面一节中讨论。
分析本文希望说服读者,是瓦的想法确实是值得追求的。支持这种说法,我们探索和比较两个通用动态模型的数据拟合方法:传统的非线性最小二乘法提出可分离的非线性最小二乘(NLS)和方法(SLS)。通过广泛的蒙特卡罗模拟代表复杂的模型,我们识别和量化重要的统计和计算获得的收益与这种分离方法。我们最终得出结论,模型可分性是非常有益的,SLS方法应考虑对任何复杂的动态系统,具有显著的线性特性。
本文组织如下。节2,我们现在的细节SLS方法在动态模型的上下文中。部分3描述了仿真的设置中,我们使用量化统计措施为了比较SLS和NLS的性能,并给出了数值结果。节4我们指出未来的研究方向,而结论提供了部分5。

2。可分离的非线性最小二乘(SLS)和瓦拉的想法

2.1。概论

下面是最初的想法在动态模型的上下文中推断,利用参数估计的可分性的主要优点如下(26]:(我)优化所需的初始猜测更少(2)优化问题是更好的条件(3)收敛速度更快

这些优势已经令人信服地证明了在一些出版物。例如,看到马伦(27)的实现和应用物理和化学;钟&伊(28]在高维情况下,参数的数量远远大于观测的数量;氮化镓et al。29日)为SLS比较几种算法的性能问题;和Erichson et al。30.)研究通过变量投影稀疏主成分分析。分离模型的广泛的实用性,因此形成一个活跃的理论和应用研究的主题。例如,当“减少”非线性优化问题的分析分离结构,简化所需条件建立各种理论结果对数值和统计特性的估计,相比原来的NLS问题(例如,20.,31日])。

在下面,我们专注于复杂的动态模型,制定系统的常微分方程(例如,32])。具体来说,考虑一个方程组在哪里值在 , ,和。对于我们的目的,我们明确独立的线性组件从非线性的函数F通过设置在哪里 ,和象征代表矩阵转置(cf。20.])。在这里 ,一个向量的大小 ,代表“非线性”参数与状态变量x,而 ,一个向量的大小 ,包含“线性”参数;请注意, 。向量场(3)是线性可分的参数向量 ,我们将相应的ODE体系线性的参数 (参看线性回归模型的情况下),虽然解决方案θ系统可能是高度非线性的,甚至是隐式的。

例2。让

然后,一看到方程(1(的)是一个特例2)- (3)。

2.2。解决方案策略

让 , ,初值问题的解决方案(2)。我们假设噪声测量在系统收集时间点。这种情况常见的统计公式

这里的随机变量不一定是不可见的,独立的测量误差(高斯)与零均值和方差有限。

是在ODE模型参数估计的方法如下。让代表数据的平滑,获得,例如,使用样条函数或局部多项式(见例如,[33,34]和[35)的治疗各种平滑方法和一个广泛的参考书目)。这平滑接近的解决方案 ODE (2)。是建议插入平滑方程(2),大概现在只感到满意,减少由此产生的差异的参数ξ和。一个最小值然后是一个估计量的吗。这个想法是在布鲁内尔(坚实的统计基础36)和Gugushvili克拉森(37]。是最初的方法需要使用导数的估计量 ,这是一个劣势,因为众所周知,估计从嘈杂的衍生品和稀疏数据可能是相当不准确的;看到如Vilela et al。38和心爱的人,我们7)或更一般的风扇和Gijbels (33]。最近的研究(20.,23,39- - - - - -46]表明,更富有成效的移植是解决方案水平的方程的想法(2)。为了实现这种转变,我们定义一个完整的判别函数因为它是典型的估算方法基于积分(见上面的引用)。在这里,是欧几里得范数。的最小值(5)/ 收益率参数估计量,通常有稍微不同的特性基于微分方程本身不是一个估计量。在实践中,积分离散,取而代之的是一笔,以便最小化可以执行使用一个典型的非线性最小二乘方法,等fminsearch在Matlab。离散格式是

NLS的解决方案没有考虑特定的线性常微分方程的形式(3),但是使用的一般形式(2)。

在这个阶段,是建议使用可分性,在没有实际调查这样的方法。在这里,我们提供必要的细节(cf。20.])。表示

然后,与保持固定的最小值(5)是由

在哪里表示单位矩阵。的符号和强调了解决方案的非线性参数的依赖。这个解决方案插回(5),收益率降低积分准则函数(cf。23):

一次是最小化和一个解决方案

,估计ξ和θ遵循立即给出(轻度滥用矩阵转置符号) 分别。方程(7)和(8)是由瓦的17上面讨论的建议。事实上,只注意应用非线性优化估计的非线性参数 ,NLS的方法相比,可以大大减少非线性优化问题的维数。

从上面的推导中,很明显,SLS问题构成特殊类的NLS问题,对线性和非线性目标函数不同的变量。而使用可分性的想法提出了改善参数估计已经在劳顿和叶47),似乎很多后续的文学是基于变量投影方法提出Golub和Pereyra21]。Golub和Pereyra26)回顾了30年的研究这个问题。

3所示。仿真框架和结果

为了研究SLS和NLS的相对性能,我们设计和执行一个大的蒙特卡罗模拟,其结果是本节中给出。

所有的计算都在进行RAmazon EC2 m5a。4xlarge instance using thesimode包Yaari和达特(25)(可分离为常微分方程积分匹配)。统计方法应用于integral-matching的包使用平滑和最小化准则函数,利用微分方程的数学结构可分性的参数方程。应用平滑和integral-based常微分方程的参数估计方法被证明产生更精确和稳定的结果对比的基础上衍生的(20.]。在这里,我们使用默认的平滑和优化设置simode在这方面,SLS和NLS得到平等对待。具体地说,simode使用交叉验证(见,例如,(35])来确定最优平滑。详细的使用指南包可以在Yaari和达特25]。代码复制我们的数值结果可以在GitHub(见访问https://github.com/haroldship/complexity - 2019 code/tree/master/final代码首先提交)。策划,我们依赖ggplot2包中R,看到韦翰48]。

3.1。蒙特卡罗研究设计

我们选择几个具有代表性的和具有挑战性的颂歌模型中出现各种各样的科学学科。这些都是(我)一个爵士模型模拟传染病的传播(2)人口生态模型与正弦季节性调整(3)全面质量作用在BST (GMA)系统,例如,代谢途径系统(iv)动作电位的神经轴突FitzHugh-Nagumo系统

进一步的数学细节在这些系统和具体的实验设置下面给我们使用。

在每种情况下,我们通过数值积分生成的观测系统,然后添加独立的高斯噪声的时间课程,如(4)。我们考虑各种参数设置、样本大小和噪声水平,如下指定。ODE参数估计通过SLS和NLS方程的定义(6)和(8),分别。

性能标准,执行所需的时间优化和生成的参数估计的准确性。虽然比较计算时间很简单,但是众多的选项可供比较的准确性。我们关注的主要区别这两个优化方案,即处理线性参数的估计。SLS不需要初始猜测这些参数。相比之下,NLS确实需要一个很好的初始估计为每个线性参数;否则,它可能会偏离或陷入局部最小值。因此,找到“好”的解决非线性优化问题通常需要“好”最初的猜测在参数空间。显然,一些“信息”之前对这些参数是至关重要的优化目的。主要是之前的信息封装在常微分方程的数学形式本身,如(3)。重要的是,尽管NLS没有考虑特殊的常微分方程的数学特性和对所有参数在一个统一的方式,这对SLS并非如此。因此,有人可能会先天的希望SLS更有效率并可能比NLS更准确,当先验信息的线性参数低质量。另一方面,当一个高质量的信息关于线性参数之前,我们希望SLS和NLS将执行同样的。有人可能会指出,在几乎所有的非线性参数GMA和系统是非常严格的,通常−1和+ 2之间,通常被认为是他们的标志,而在GMA系统和非负线性参数的系统,和不知道他们的情况下(见第五章的18])。因此,不需要先验信息在SLS线性参数可以是一个巨大的优势。

蒙特卡罗的研究中,我们不同的先验信息通过使用高,中,低质量的初始猜测参数值。这里,高质量意味着最初的猜测是接近真相。更具体地说,使用的线性参数的初始猜测NLS是高斯随机变量集中在真正的参数值和标准差等于真正的参数乘以一个先验信息值(换句话说,之前的信息值也可以被理解为“先验分布的变异系数)。的具体量化“高”、“媒介”,和“低”诚然有些主观和变化不同的ODE模型,如下指定。为了更好更快的收敛的优化算法(特别是NLS),被约束的非线性参数给定的范围,这个范围是一样的,无论我们如何变化之前关于线性参数的信息。此外,在每个蒙特卡罗迭代中,我们使用完全相同的(伪随机)初始猜测NLS和SLS的非线性参数。因此,非线性参数信息而言,这是为每个基准模型保持不变,不管之前的线性参数。因此,两种算法得到相同的信息非线性参数之前,没有一个是优先处理。

噪音水平(信噪比,信噪比)我们使用定义如下。对于一个给定的解决方案歌唱的方程,我们计算标准偏差。的信噪比,和是由 ,和 ,分别在哪里σ是一个高斯分布的标准偏差测量误差ϵ定义在方程(4)。我们将把这些信噪比称为“低噪声”和“高噪音,”分别(cf。49];尽管在不同的上下文中)。然后,我们比较了均方误差(MSE)的参数估计,从而导致一个有效的比较在统计学上可识别的ODE模型(见例如,[20.)相关定义和结果)。作为另一个精度测量,我们使用标准(5)和(7)评估最优参数值。我们提出的两个标准,虽然合理,是不同的。因此,他们不将协议在每一个实验装置。然而,全球与他们得出的结论部分5是连贯和SLS。

我们现在提供的数学模型和实验设置的细节。

3.1.1。同龄组先生

SIR-type的系统感兴趣的是一个流行病学模型(Susceptible-Infected-Recovered),包括年龄和季节性组件(例如,50])。每个年龄组的感染过程和每个季节使用两个方程描述敏感的比例(年代)和感染(我)个人在人口(恢复是由个体的比例 ):

模型的参数传输矩阵β的回收率γ, ,表示的相对传染性,如流感病毒株在季节循环吗相比第一季(作为参考和固定在1)。所示Yaari et al。46),考虑到该模型的可分性特征便于数据拟合的目的。具体地说,(9在初始值)是非线性的 ,这通常是未知的,需要估计。就我们的目的而言,它可以考虑一个模型与一个年龄组和一个赛季。使用下面的参数设置: 。我们考虑了两种样本大小、18 - 36和两个噪音水平,和。之前的信息 ,对应于高、中,低质量,分别。大小的蒙特卡罗模拟研究是500。

3.1.2。季节性生态迫使

作为另一个基准我们认为古典捕食模型的延伸,即生态模型包括季节性迫使捕食率,使用两个额外的参数,控制振幅( )和阶段(ω强迫的):

非线性参数ϵ和ω。我们考虑的时间间隔内的动力学。的参数设置

和初始值。四个实验方案进行了研究,对应于100年和200年的样本大小,和信噪比和。之前的信息价值 ,对应于高、中,低质量,分别。大小的蒙特卡罗模拟研究是500。

3.1.3。GMA系统

GMA系统分析包括三个微分方程在三个变量([18];页84 - 85)。他们是

这里是速率常数的线性参数γ,而非线性的索引动能订单f。注意,参数f被允许成为消极的和他们的标志可能或可能不知道。我们认为时间间隔内的动态系统。在我们给出的参数设置是18];也就是说,

和初始值。四个实验场景进行了研究:100年和200年的样本大小,信噪比和。之前的信息价值 ,对应于高、中,低质量,分别。大小的蒙特卡罗模拟研究是500。参数估计GMA系统被认为是一个具有挑战性的数值任务(18]。

3.1.4。FitzHugh-Nagumo系统

FitzHugh-Nagumo (FHN)系统(51- - - - - -53)模型上升神经元动作电位在传播。它是由

这个系统有两个状态变量,提出了作为一个更复杂的模型的简化提出了霍奇金和赫胥黎的研究(54为研究和模拟巨型乌贼轴突的神经功能。FHN模型是用于观察到的动作电位的神经生理学作为一个近似值。

系统(10)在参数是线性的 ,和b,但非线性c。我们考虑了两种样本大小,和 ,和两个信噪比的和。参数被设置为。初始值是。真正的解决方案得到的时间间隔。这里使用的先验信息 ,对应于高、中,低质量,分别(参数的初始猜测肯定是积极的)。大小的蒙特卡罗模拟研究是500。许多研究者研究了FHN模型的参数估计问题。特别是,拉姆齐et al。55),坎贝尔和斯蒂尔(56),而拉姆齐和妓女11]指出几个困难估计的参数赋系统。

3.2。蒙特卡罗分析的结果

我们的研究结果提出了通过图表和表格。主要总结表1和2,我们报告的比率均方误差(平均平方误差在蒙特卡罗模拟)估计的线性参数(非线性参数,参见本节结束时讨论)。一些结论可以从表。(我)给予高质量的信息之前,NLS的准确性和SLS是可比的,无论是优越在各种实验装置(至少一些差异,你只能看到从可信的原始数据表应由蒙特卡罗模拟误差和因此似乎无关紧要)。(2)当先验信息的质量降低中等或低,SLS变得在大多数情况下的性能明显优于NLS(某种程度上取决于特定的实验装置)。(3)对于一个固定的噪音水平,随着样本量的增加,SLS的优势越来越明显。(iv)固定样本大小,随着噪声的增加,SLS仍比NLS,但程度不一样。


之前	低噪声				高噪音
之前	先生	LV	GMA	FHN	先生	LV	GMA	FHN

低	8.3	5.8	4.0	2。3	2。8	2。2	2。2	1.3
媒介	3所示。9	1.8	3所示。1	1.7	1.4	1.2	1.8	1.2
高	0.9	1.3	0.9	2。0	0.4	1.0	0.6	1.1

MSE比率(计算平均平方误差超过蒙特卡罗模拟运行)和NLS SLS估算各指标的线性参数模型和不同实验显示设置(见下一节3所示。1详细的规格)。识别模型名称、使用的缩写。表中的值是一个重要的数字四舍五入。样本大小是GMA和生态模型,FitzHugh-Nagumo系统,爵士模型。噪音水平和。值大于1表中对应SLS执行比NLS的情况。注意减少模式在列,反映出质量的影响之前NLS的性能信息。


之前	低噪声				高噪音
之前	先生	LV	GMA	FHN	先生	LV	GMA	FHN

低	12.0	9.6	3所示。9	3所示。9	3所示。8	3所示。2	2。2	2。2
媒介	4.1	4.3	2。8	1.9	1.6	1.6	1.6	1.3
高	1.0	2。2	0.7	2。3	0.7	1.2	0.5	1.5

样本大小是GMA和生态模型;FitzHugh-Nagumo系统;和先生的模型。噪音水平和。解释的结果,见表1。有一个增加SLS / NLS表相比的优势1。

这些结果可以直观的通过简单的统计图表。因此,图1图表显示了线,比较两种方法的家中小企业在几个实验装置。而数字表1和2是家中小企业的比率,这里的数据现在绝对MSE值。从图形、SLS / NLS的一个优势是明显不到理想的先验信息。注意,在这个特定的环境中,SLS表现比之前NLS高质量信息。一个合理的解释可能是:同时,在我们的实验装置,利用SLS的信息量通过(3在模拟)是固定的,NLS原则上可以接收任意精确的初始猜测在线性参数。你可能因此设想一个阈值,利用后者的信息超过使用结构关系的好处(3)。然而,精确的量化的现象几乎不可能超出一个观察似乎与优秀的知识可能体现在场景参数值。在现实中,这样的理想之前信息是罕见的。

(一)

(b)

图1

情节给家中小企业在对数尺度(计算的蒙特卡罗模拟运行平均值)为线性参数绘制对先验信息的质量。在面板(a),比较的基础上的噪音水平。图表表明NLS的性能恶化和减少先验信息的质量。另一方面,SLS的性能不受先验信息的质量,影响的协议与实验设计。除了罕见的高质量的先验信息的情况下,在NLS更好,SLS明显优于NLS。在面板(b),比较是基于样本的大小。整个模式类似于面板(a)。

面板(图一)1进一步表明,在特定的场景中我们报告,SLS改善噪音水平降低时,这是不同于NLS在同一个图。

图2是NLS的散点图和SLS损失(5)和(7)(在对数尺度)评估最优参数估计。图强调以另一个方式NLS的先验信息的重要性:很明显,后者是强烈影响的性能质量的初始参数的猜测。NLS和SLS先验信息时执行同样的高质量。然而,当先验信息的质量并不理想,因为它是在大多数应用程序中,NLS变得明显比SLS。散点图也给快速评估结果的可变性的印象。

图2

情节可视化NLS的性能(在对数尺度)和SLS根据标准(5)和(7),评估的最优参数估计。点散点图的颜色根据先验信息用于计算NLS的质量估计。45°斜行添加了通过原点参考和直观的评估。散点图补充了边际密度估计使用相同的颜色编码。密度估计表明,作为先验信息的质量会降低,NLS结果的质量受到影响,这体现在长尾的密度。根据定义,SLS的性能不受质量影响之前关于线性参数的信息。对于高质量的信息之前,集群的损失在散点图中接近参考线表明NLS的整体性能和SLS是可比的。作为先验信息的质量减少,右边的点云传播,这表明SLS开始执行明显比NLS更好。此外,与表1和2散点图和帧范围(见[57];页130 - 132)传达的印象估计结果的可变性在多个数据集:NLS比SLS视觉上更多的变量。

我们从图的结论2确认的面板(图)3礼物箱线图的NLS和SLS损失(在对数尺度)测量根据标准(5)和(7)。模式是明确的:比NLS SLS性能更好,NLS变得更加戏剧性的自卑有辱人格的先验信息。

图3

NLS和SLS的情节提供了一个比较。在面板(一)箱线图的损失(5)和(7)(在对数尺度)评估显示在最优参数估计。高质量的信息之前,NLS和SLS损失分布接近。作为先验信息的质量会降低,NLS损失开始承担更高的价值比SLS,及其变异性增加,就是明证箱线图的伸长。在面板(b)相比,计算时间。NLS计算时间往往超过SLS和之前的质量信息的增加而增加。在两个面板,SLS的性能不随质量的先验信息,符合实验设计。

面板(图b)3总结了计算时间。SLS是快得多。NLS的执行时间是影响质量的先验信息,有趣的是,这种质量增加。结果对于所有其他模型(噪音)相似,因此省略了。


之前	低噪声				高噪音
之前	先生	LV	GMA	FHN	先生	LV	GMA	FHN

低	23.0	1.7	1.1	1.1	6.6	1.1	1.0	1.0
媒介	8.7	1.2	1.0	1.0	2。6	0.9	1.0	1.0
高	1.0	1.0	0.9	1.0	0.4	0.9	0.9	1.0

表显示了MSE比率(通过平均平方误差在蒙特卡罗模拟计算)的NLS和SLS估计的非线性参数。实验设置如表1。值大于1表中对应SLS执行比NLS的情况。自前信息非线性参数保持不变(见部分3所示。1详情),尤其是表显示了影响质量的初始猜测线性参数估计精度的NLS的非线性的。结果表明,在某些设置,模糊先验知识对线性参数可能有对手NLS的准确性影响的非线性参数。

最后,表3和4提供信息的非线性参数。在NLS的情况下,一个人可以观察关于线性参数先验知识传播为非线性参数估计精度。特别是,不到理想的线性参数先验信息,SLS对NLS拥有明显的优势,甚至在非线性参数。


之前	低噪声				高噪音
之前	先生	LV	GMA	FHN	先生	LV	GMA	FHN

低	29.0	4.1	1.1	1.6	6.5	1.3	1.0	1.3
媒介	8.2	2。1	0.9	1.0	2。2	1.1	0.9	1.0
高	0.9	1.2	0.8	1.0	0.7	0.9	0.8	1.0

设置如表2。解释的结果,见表3。

4所示。前景

数据拟合复杂动力系统仍然是一个具有挑战性的问题,不能傲慢的方式处理,即使一个人可分性的优势。例如,为了揭开模式部分3这项工作,我们必须仔细设计实验研究,否则模拟可能没有聚合或可能聚合为贫穷的解决方案。NLS和SLS是如此,但当他们观察,收敛NLS问题严重得多;他们特别敏感的FitzHugh-Nagumo系统。这个结果强调了至关重要的作用之前的信息有关的参数,或者表达不同,所用的初始参数的猜测的质量优化。我们这里主要关注的影响之前关于线性参数的信息。然而,它也变得清楚,之前信息的非线性参数优化目的的同样至关重要的作用,这是真正的NLS和SLS(数据没有显示)。

由于我们的探索性工作,我们设想以下承诺对未来的研究方向。

4.1。SLS对动态系统的数值实现

在我们的分析中完成所有计算R使用simode包Yaari和达特(25]。然而,利用常微分方程的可分性性质的想法是独立于特定的编程语言,可以实现在其他软件包。事实上,已经完成了大量的工作的上下文变量投影方法,因为它首次引入Golub和Pereyra [21]。在非线性回归的背景下,Golub变量投影方法和Pereyra [21是实现的R在nls命令;看到维纳布尔斯,里普利(58),218 - 220页。其应用的一个例子。此外,我们都知道TIMP马伦和van Stokkum包(59];它实现了变量投影方法。因此,下一步可以结合不同的包的优势,例如,simode和TIMP为了发展先进的软件变量投影动态系统的上下文中。

4.2。自定义算法为特定类型的复杂的动态系统

众所周知,一个优化方案的性能至关重要的是取决于底层的数学模型用于描述数据。因此,看来,不同类型的动态模型需要特定算法根据他们的特点。例如,GMA系统参数估计比遇到不同的挑战在处理先生(参见3)。我们希望有很大收获未来的研究关注特定的类模型和发展稳定的参数估计算法。

4.3。SLS的理论属性的动态系统

Gugushvili和克拉森37)研究了NLS的统计特性的一般背景平滑,而达特和克拉森(20.)专门解决歌唱中线性系统(功能)的参数。也许有人会认为,一些假设用于Gugushvili和克拉森(37)时可以放松Dattner问题更接近一个被认为是在和克拉森20.]。

4.4。扩展部分观察、高维、Misspecified动态系统

最近的工作处理高维ODE模型推断表明,利用线性参数是至关重要的发展中一个成功的评估方法(见例如,[24,39])。更一般的,这将是有趣的使用变量投影方法研究部分病例观察,高维,可能misspecified动态系统。这项工作可能还需要使用高维正则化技术(例如,39])平衡数据和模型,特别是考虑到潜在的模型misspecification(见[55])。

5。结论

在这项工作中,我们设计了一个广泛的模拟研究探索两个优化方案的相对性能统计和计算推理的动态系统:典型的非线性最小二乘(NLS)方法和一部小说,可分离的非线性最小二乘(SLS)的方法。作为基准,我们考虑几个广泛使用ODE模型在各种生物领域的出现。我们测量的统计性能的两种方法估计的均方误差(MSE)。作为另一个性能指标,我们采用最优参数估计的损失函数值。计算方法的性能也比较了所需的执行时间完成每个优化。

我们的总体建议如下:当一个复杂的动态系统包含一个可观数量的线性参数,其参数估计应该可分离的非线性最小二乘法,解决而不是更常用,一般非线性最小二乘法。一般模式正从我们的研究是SLS执行至少一样,经常比,NLS,尤其是前信息系统并不理想,在实践中通常是这样。这句话被发现均匀真的在所有模型测试。

数据可用性

复制的代码可以访问我们的数值结果https://github.com/haroldship/complexity - 2019 code/tree/master/final_code_first_submission。

信息披露

的文章可以在ArXiv预印本https://arxiv.org/abs/1908.03717。

的利益冲突

作者宣称没有利益冲突。

确认

Dattner Itai受到了以色列科学基金会数量387/15。埃伯哈德我们是NSF-MCB赠款支持1615373(π:戴安娜波动)和NIH 2 p30es019776-05 (PI:卡门Marsit)。资助机构不是本文的内容负责。

引用

a·j·洛特卡,元素的数学生物学,多佛出版公司,纽约,纽约,美国,1956年。
r . m .,生态系统稳定性和复杂性的模型。用一个新的介绍作者美国新泽西州普林斯顿大学,普林斯顿大学出版社,第二版,2001年版。
佩舍尔和w·曼德捕食模型:我们生活在一个沃尔泰拉的世界吗?施普林格,纽约,纽约,美国,1986年。
诉沃尔泰拉”,丰富的波动一个物种被认为是数学,”自然,卷118,不。2972年,第560 - 558页,1926年。视图:出版商的网站|谷歌学术搜索
m·a·Savageau“生化系统分析,”功能和设计的研究在分子生物学、卷。6739计划先进的书美国,addison - wesley出版公司,波士顿,MA, 1976。视图:谷歌学术搜索
e . o .我们“生化系统理论:一个评论,”ISRN生物数学卷,2013篇文章ID 897658、53页,2013。视图:出版商的网站|谷歌学术搜索
I.-C。周和e·o·我们最近的事态发展在参数估计和结构鉴定的生化和基因系统,”数学生物科学,卷219,不。2,页57 - 83,2009。视图:出版商的网站|谷歌学术搜索
p . Gennemark和d . Wedelin高效算法为常微分方程模型识别的生物系统,”专业系统生物学,1卷,不。2、120 - 129年,2007页。视图:出版商的网站|谷歌学术搜索
m . Girolami和b . Calderhead黎曼流形朗之万和哈密顿蒙特卡罗方法,”英国皇家统计学会杂志》:系列B(统计方法),卷73,不。2、123 - 214年,2011页。视图:出版商的网站|谷歌学术搜索
k . McGoff s·穆克吉,n .皮拉伊”动力系统的统计推断:审查。”统计调查9卷,第252 - 209页,2015年。视图:出版商的网站|谷歌学术搜索
j·拉姆齐和g .妓女动态数据分析。与微分方程建模数据施普林格,纽约,纽约,美国,2017年。
k . Schittkowski在动力系统数值数据拟合。一个实际的介绍与应用程序和软件Kluwer学术出版商,多德雷赫特,荷兰,2002年。
看到e·o·j·阿尔梅达,“脱钩动力系统从代谢通路识别,”生物信息学,20卷,不。11日,第1681 - 1670页,2004年。视图:出版商的网站|谷歌学术搜索
Dolatshahi和e·o·我们”,代谢途径的识别系统”,遗传学前沿卷7,p . 2016。视图:出版商的网站|谷歌学术搜索
m . Faraji和e·o·我们逐步推理可能动态通量分布的代谢时间序列数据,”生物信息学,33卷,不。14日,第2172 - 2165页,2017年。视图:出版商的网站|谷歌学术搜索
g .高尔I.-C。周,e·o·我们“系统估计从代谢时间序列数据,生物信息学,24卷,不。21日,第2511 - 2505页,2008年。视图:出版商的网站|谷歌学术搜索
j·m·瓦拉”样条最小二乘方法数值微分方程参数估计,“暹罗在科学杂志和统计计算,3卷,不。1,28-46,1982页。视图:出版商的网站|谷歌学术搜索
e . o .我们生物化学系统的计算分析:生物化学家和分子生物学家的实用指南英国剑桥,剑桥大学出版社,2000年。
d·m·库普c·r·琼斯和k b•比绍夫”速率常数的确定对于复杂的动力学模型,”工业化学与工程化学基础》第六卷,没有。4、539 - 543年,1967页。视图:出版商的网站|谷歌学术搜索
Dattner i c·a·j·克拉森,“最优的速度直接估计系统的常微分方程线性函数的参数,“电子杂志的统计数据,9卷,不。2、1939 - 1973年,2015页。视图:出版商的网站|谷歌学术搜索
g·h·戈卢布和诉Pereyra”,伪逆的分化和非线性最小二乘问题的变量不同,“暹罗在数值分析》杂志上,10卷,不。2、413 - 432年,1973页。视图:出版商的网站|谷歌学术搜索
孩子们和p。Wedin,“可分离的非线性最小二乘问题的算法,暹罗审查,22卷,不。3、318 - 337年,1980页。视图:出版商的网站|谷歌学术搜索
Dattner i, e·米勒,m . Petrenko d e . Kadouri e . Jurkevitch和a·于佩尔”造型和参数推理中捕食动态异构环境使用的直接积分方法,”《英国皇家学会界面,14卷,不。126年,文章ID 20160525, 2017。视图:出版商的网站|谷歌学术搜索
l .吴裘x, y。元,h·吴”,参数估计和变量选择大线性常微分方程组:基于矩阵的方法,”美国统计协会杂志》上,卷114,不。526年,第667 - 657页,2019年。视图:出版商的网站|谷歌学术搜索
R . Yaari和i Dattner Simode:统计推断使用分离integral-matching常微分方程组,R包版本1.1.4,”2019年1月,https://CRAN.R-project.org/package=simode。视图:谷歌学术搜索
g . Golub和诉Pereyra”,可分离的非线性最小二乘:变量投影方法和它的应用程序,“逆问题,19卷,不。2,1-26,2003页。视图:出版商的网站|谷歌学术搜索
k·m·马伦可分离的非线性模型:物理和化学的理论、实现和应用sccp,荷兰阿姆斯特丹,2008年博士论文。
j .钟和j·g·伊”,一种有效的迭代方法对大规模可分离的非线性逆问题,“暹罗期刊在科学计算没有,卷。31日。6,4654 - 4674年,2010页。视图:出版商的网站|谷歌学术搜索
m . Gan c·l·p·陈,G.-Y。陈,陈l .,“对一些分离算法可分离的非线性最小二乘问题,“IEEE控制论,48卷,不。10日,2866 - 2874年,2018页。视图:出版商的网站|谷歌学术搜索
n . b . Erichson p .郑主席k, l·勃氏,j . n . Kutz和a . y . Aravkin“通过变量投影稀疏主成分分析,”2018年,https://arxiv.org/abs/1804.00341。视图:谷歌学术搜索
巴苏和y Bresler”,非线性最小二乘问题的稳定性和Cramer-Rao绑定,”IEEE信号处理,48卷,不。12日,第3436 - 3426页,2000年。视图:出版商的网站|谷歌学术搜索
m·w·赫希r . l . Devaney和s·斯梅尔微分方程、动力系统和线性代数,60卷,学术出版社,剑桥,妈,美国,1974年。
j .风扇和i Gijbels局部多项式模型及其应用查普曼&大厅,伦敦,英国,1996,第66卷专著统计和应用概率。
p . j .绿色和b·w·西尔弗曼非参数回归和广义线性模型:一个粗糙度处罚方法查普曼&大厅,伦敦,英国,1994年,卷。58专著统计和应用概率。
l·沃瑟曼所有的非参数统计施普林格,纽约,纽约,美国,2006年。
n J.-B。布鲁内尔,“常微分方程的参数估计通过非参数估计,”电子杂志的统计数据,2卷,第1267 - 1242页,2008年。视图:出版商的网站|谷歌学术搜索
美国Gugushvili和c·a·j·克拉森。”一致的系统的常微分方程的参数估计:绕过通过平滑数值积分。”伯努利,18卷,不。3、1061 - 1098年,2012页。视图:出版商的网站|谷歌学术搜索
m . Vilela c·c·h·博尔赫斯s Vinga et al .,“自动平滑的数值解耦动力学模型,”BMC生物信息学,8卷,不。1,p。305年,2007。视图:出版商的网站|谷歌学术搜索
陈,a . Shojaie和d·m·威滕”网络重建从高维常微分方程,美国统计协会杂志》上,卷112,不。520年,第1707 - 1697页,2017年。视图:出版商的网站|谷歌学术搜索
Dattner i”,一个基于模型的初始猜测估计参数常微分方程组时,“生物识别技术,卷71,不。4、1176 - 1184年,2015页。视图:出版商的网站|谷歌学术搜索
Dattner i s Gugushvili,“一步到位的方法应用在ODE模型参数估计,“Statistica Neerlandica,卷72,不。2、126 - 156年,2018页。视图:出版商的网站|谷歌学术搜索
Dattner i和a·于佩尔、“现代统计工具使用数学模型推理和预测传染病的,”医学研究统计方法,27卷,不。7,1927 - 1929年,2018页。视图:出版商的网站|谷歌学术搜索
f . vis米凯尔森和n·r·汉森”学习大规模常微分方程系统”,2017年,https://arxiv.org/abs/1710.09308。视图:谷歌学术搜索
Dattner Vujačić,i, j·冈萨雷斯和e .智慧,“时间进程窗口估计线性常微分方程的参数,“统计和计算,25卷,不。6,1057 - 1070年,2015页。视图:出版商的网站|谷歌学术搜索
Dattner R . Yaari,即“Simode: R包使用分离integral-matching常微分方程的统计推断,“2018年,https://joss.theoj.org/papers/10.21105/joss.01850。视图:谷歌学术搜索
Dattner r . Yaari i, A·于佩尔、“两阶段方法估计发病率的同龄组流行病模型的参数数据,”医学研究统计方法,27卷,不。7,1999 - 2014年,2018页。视图:出版商的网站|谷歌学术搜索
w·h·劳顿和e·a·叶“消除线性参数非线性回归,”技术计量学,13卷,不。3、461 - 467年,1971页。视图:出版商的网站|谷歌学术搜索
h .韦翰Ggplot2。优雅的图形进行数据分析施普林格,纽约,纽约,美国,2009年。
i m·约翰斯通和b·w·西尔弗曼”经验贝叶斯小波阈值的选择。”统计年报,33卷,不。4、1700 - 1752年,2005页。视图:出版商的网站|谷歌学术搜索
h·w·Hethcote”传染病的数学。”暹罗审查,42卷,不。4、599 - 653年,2000页。视图:出版商的网站|谷歌学术搜索
r·菲茨休”的冲动和生理状态的理论模型神经膜”生物物理期刊,1卷,不。6,445 - 466年,1961页。视图:出版商的网站|谷歌学术搜索
r·菲茨休”神经,激发和传播的数学模型”生物工程惠普施万,艾德。,页1 - 85,麦格劳-希尔,纽约,纽约,美国,1969年,卷。9校际电子产品系列。视图:谷歌学术搜索
j . Nagumo s Arimoto,吉泽章,“一个活跃的脉冲传输线模拟神经轴突,”《愤怒,50卷,不。10日,2061 - 2070年,1962页。视图:出版商的网站|谷歌学术搜索
A . l .霍奇金和A·f·赫胥黎“膜电流的定量描述及其应用在神经传导和兴奋,”《生理学,卷117,不。4、500 - 544年,1952页。视图:出版商的网站|谷歌学术搜索
j . o·拉姆齐·g·胡克,d·坎贝尔和j .曹“微分方程的参数估计:广义平滑的方法,”英国皇家统计学会杂志》:系列B(统计方法),卷69,不。5,741 - 796年,2007页。视图:出版商的网站|谷歌学术搜索
d·坎贝尔和r·j·斯蒂尔“平滑功能回火对非线性微分方程模型,”统计和计算,22卷,不。2、429 - 443年,2012页。视图:出版商的网站|谷歌学术搜索
e·r·塔夫特定量信息的视觉显示美国、图形出版社,柴郡,CT,第二版,2001年版。
w·n·维纳布尔斯和b·d·里普利现代应用统计与统计和计算施普林格,纽约,纽约,美国第四版,2002年版。
k·马伦和i . van Stokkum TIMP: R包多路光谱测量,建模”杂志的统计软件,18卷,不。3,1-46,2007页。视图:出版商的网站|谷歌学术搜索

复杂性

生物系统的动力学分析

文摘

1。介绍

2。可分离的非线性最小二乘(SLS)和瓦拉的想法

2.1。概论

2.2。解决方案策略

3所示。仿真框架和结果

3.1。蒙特卡罗研究设计

3.1.1。同龄组先生

3.1.2。季节性生态迫使

3.1.3。GMA系统

3.1.4。FitzHugh-Nagumo系统

3.2。蒙特卡罗分析的结果

4所示。前景

4.1。SLS对动态系统的数值实现

4.2。自定义算法为特定类型的复杂的动态系统

4.3。SLS的理论属性的动态系统

4.4。扩展部分观察、高维、Misspecified动态系统

5。结论

数据可用性

信息披露

的利益冲突

确认

引用

版权

相关文章

相关文章

复杂性

生物系统的动力学分析

可分离的非线性最小二乘参数估计的复杂的动态系统

文摘

1。介绍

2。可分离的非线性最小二乘(SLS)和瓦拉的想法

2.1。概论

2.2。解决方案策略

3所示。仿真框架和结果

3.1。蒙特卡罗研究设计

3.1.1。同龄组先生

3.1.2。季节性生态迫使

3.1.3。GMA系统

3.1.4。FitzHugh-Nagumo系统

3.2。蒙特卡罗分析的结果

4所示。前景

4.1。SLS对动态系统的数值实现

4.2。自定义算法为特定类型的复杂的动态系统

4.3。SLS的理论属性的动态系统

4.4。扩展部分观察、高维、Misspecified动态系统

5。结论

数据可用性

信息披露

的利益冲突

确认

引用

版权

相关文章

更多相关文章

更多相关文章

相关文章