使用混合模型进行时间依赖预测因子分析介导的数据

抽象的

线性混合模型（LMMS）经常用于分析纵向数据。虽然这些模型可用于评估调解，但它们不直接模拟因果途径。结构方程模型（SEM）是一种允许显式建模的替代技术。本文的目的是评估LMMS相对于SEM的性能，在介导的纵向数据与时间依赖预测器和介质分析。我们模拟了来自SEM的介导的纵向数据和预测器的特定延迟效果。评估各种模型规格，并在偏差，覆盖概率，功率和I型错误时评估LMMS和SEM。在模拟中评估的模型也应用于来自艾滋病毒感染群体的观察队列的数据。我们发现，当仔细构造时，LMM充分模型，即使数据从SEM出现，也会在调解的情况下随时间变化的介导的暴露效果。

1.介绍

在临床研究中，随着时间的推移，结果和预测因子经常被反复收集，在感兴趣的变量中可能存在复杂的中介关系。例如，在一项关于饮酒与艾滋病毒疾病进展关系的研究中，大量饮酒可能会影响抗逆转录病毒治疗的坚持，而这反过来又会影响CD4细胞计数。然而，饮酒本身也可能直接影响CD4计数。如果目标是评估主要自变量(如饮酒)对结果(CD4计数)的总影响，则采用单线性混合效应模型(LMM) [1]可以适应数据。LMMS占个人内部反复观测之间的相关性，并且经常用于分析纵向数据。为了解开直接与酒精使用对艾滋病毒疾病的间接影响，然而，根据Baron和Kenny描述的步骤，可以适合一系列LMMS [2]并由Krull和Mackinnon展示[3.]在混合模型设置中。相比之下，使用结构方程模型（SEM）分析这些数据[4[因果途径中的变量可以通过将粘附到SEM中作为重质醇消费和艾滋病毒疾病进展之间的介质变量直接进行建模。鉴于目标是评估主要独立变量的总效果，目前尚不清楚是否有利益在偏见，覆盖范围和主要研究目标的偏差方面建模介导关系。

SEMS和LMMS之间的权衡已经在常规设置中进行了评估，并且在某些没有调解的某些设置中的LMMS和SEM的等价物在SEM文献中已经充分记录了[5- - - - - -12.］.使用过LMMS的潜在优点来分析纵向或分层数据，包括明确模拟复杂关系的能力，例如调解[4，5，7，13- - - - - -16]，建模协方差结构的灵活性[7，15] FIT指数的可用性[8，9]，以及解释测量误差的能力[5，9，10.，15］.一个缺点是SEM模型的潜在复杂性，因此，有可能出现模型不规范。此外，从实际的角度来看，由于需要专门的软件，SEM可能不太方便实现。尽管如此，它在因果路径中直接建模变量的灵活性和能力使其成为一种有吸引力的中介纵向数据建模技术。

在没有调解的情况下，本文评估的SEM的类型通常被称为潜在的生长曲线模型[13，17- - - - - -20.］.掺入调解成潜生长曲线框架已经使用一个非时变中介因子证实的结果轨迹的影响潜截距和斜率因子[14或一个时变的中介，假定一个平行的增长过程，在这个过程中，中介和结果都遵循增长轨迹[21，22］.对于这两种方法来说，调解发生在随机效应水平（个体），而不是观察水平，因此，不能随时间变化。使用单独的线性混合效果模型描述了在纵向数据中发生的多个级别发生的建模调解[3.，23，24］.这些多水平模型允许在个人和观察水平上进行调解，但间接和总影响是由单独的回归估计的。在多层次背景下，在观察水平上评估中介作用的方法已被描述，但增加了复杂性，即所有中介效应都是随机的[25，26］.最后，使用自回归结构方程模型在潜伏的生长曲线框架之外描述了纵向调解[24，27］.这些模型假定随着时间而变化，其中观测值之间的相关性不是由于潜在的随机效应(潜在截距和潜在斜率)，而是由于结果与其在前一个时间点的值之间的直接关联。因此，自回归模型不是lmm的直接扩展，而是对模型中介的纵向数据的替代方法。在本文中，我们检查了一个SEM，其中中介在每个时间点都存在，因此，可以在观察水平上变化。我们不假设中介遵循平行的成长过程，并假设中介对结果的影响是固定的，而不是随机的。中介效应是同时估计，而不是通过单独的多层次模型。

先前已经研究了仅在具有纵向结果的基线测量的预测和介体在具有预测和调解器中测量的纵向数据设置中的LMMS相对于SEM的性能。28］.在估计主要自变量的总效应时，LMM在各种设置下都是准确和有效的。SEM的主要优点是能够同时模拟主自变量的直接和间接影响。本研究的目的是将之前的工作扩展到预测器和中介器都是时间依赖的，且随时间变化的固定效应。

2.方法

在目前的研究中，我们在用时变预测器和介体分析介导的纵向数据中，评估LMM相对于SEM的性能。作为一个例子，我们考虑了一项预期的队列研究，评估了重质醇消耗对艾滋病毒疾病进展的影响[29］.连续的结果，CD4细胞计数，用．主要自变量是酗酒量，是一个时变的二元变量，用表示；作为中介变量的ART坚持度是一个时变变量，用表示；和基线时代，一个连续的协变量，表示为．如果主要独立变量，重饮酒，则通过艺术遵守间接影响CD4计数，艺术遵守件。除了间接效应外，重均多酒精使用还可对未被艺术粘附或其他变量进行介导的CD4细胞计数直接影响。我们专注于初级目标是确定重质醇类在CD4细胞计数上的总效果（直接和间接效应），同时适当地核对艺术粘附的介导效果。我们任意假设有六个时间点，其中衡量结果，预测值和介体。时间是表示的，时间的间隔是等的。在这种情况下，LMM可用于评估酒精消费对CD4细胞计数的总影响，同时考虑来自同一个人的多次评估和协变量的混杂影响的相关性。然而，使用LMM将不允许在变量之间直接建模中介。sme是一种替代方法，具有同时模拟饮酒对CD4细胞计数的直接和间接影响的优势。本文的目的是评估当目标是确定酒精消费的总影响时，LMM相对于SEM是否表现充分，而不是评估一个变量(例如，坚持)是否是一个中介变量。在不同的条件下进行了一系列的仿真研究，以评估几种lmm和sme的性能。我们还描述了从前瞻性队列研究评估酒精使用对艾滋病毒疾病进展影响的各种模型的应用数据。

2.1。综合组织统治调解

SEM有两个组成部分，测量模型和结构模型[4］.测量模型将不观察室的潜在变量和协调因子涉及结果和曝光指标。在测量模型中，观察结果变量，而可以观察到预测器或潜伏的变量。该模型试图捕获观察到的变量中的测量误差。在SEM中，CD4计数的重复观察是测量模型中的结果。该模型中的预测器包括底层各个截距和斜率变量以及时变的主要独立变量（重酒精使用）和时变介体（艺术遵守）。

第二组分的SEM，结构模型，模型潜在变量如观察到的变量和其它潜在变量的函数。这种模式的尝试捕捉个体差异的潜在变量。在我们的模型中，下面的各截距和斜率的变量被视为潜在变量和建模为结构模型的结果。在SEM的情况下结合时间变化的介质中，重复的介质（ART附着），而不是潜在变量，也结果与由随时间变化的初级自变量（酒精使用）一些错误预测，以便它们在所并入的结构模型。

下面的方程描述了包含中介的一般SEM。为了简单起见，下面的公式中已经去掉了主题索引: 为了到6，在哪里和和．

上述等式中的参数和潜在变量被解释如下。（一世）是重复结果的随机拦截。（ii）是重复结果的随机斜率。(3) 代表了调解员对结果的影响．（iv）代表主要的独立变量的调解员在时间的影响．（v）表示主要自变量对时刻结果的直接影响．（vi）该产品表示主要独立变量在结果上的主要变量的间接效应．（vii）表示连续协变化对重复结果的常量效果。

SEM中介模型在图中表示1．在下图中，我们使用了SEM路径图的约定，包括表示观察到的变量的矩形，表示潜在变量的椭圆形，表示截距段的三角形，以及表示变量之间的回归关系的箭头。

２.２.SEM用于数据生成

本研究的模拟介导数据是从SEM生成的，因为我们的目标是评估LMM在假设SEM的设置中的性能。我们考虑了一个含酒精，主要独立变量的效果，改变了一段时间。具体而言，我们在第一个三个时间点的CD4计数上占酒精的恒定短期效果，以及在过去三个时间点的持续长期效果。我们将此称为主要独立变量的“延迟效果”。为了模拟这种延迟效果，我们允许在（1）改变。具体来说，我们设置了前三名平等和最后三个平等，在哪里．类似地定义了短期和长期效果和．在这些假设下，可以得到某一时刻给定结果的预测公式,因为是而对于是该模型假设结果的线性效果。

2.2.1。仿真程序

对于初始模拟集，我们改变了预测因子对结果的总效果的分布。We evaluated three situations: (i) the total effect was equally distributed between the direct and indirect effect, (ii) the total effect was primarily direct (i.e., the direct effect was larger than the indirect effect through the mediator), and (iii) the total effect was primarily indirect (i.e., the indirect effect through the mediator was larger than the direct effect of the predictor on the outcome).

根据Cohen[的定义，这些模拟考虑了这样一种设置，即主要自变量的真实总影响在前三个时间点是小的(0.05)，在后三个时间点是小到中等的(0.25)。30.］.这些效果大小被选中，因为它们被认为是可行和现实的广泛的临床环境。效果大小被定义为回归参数的真值除以残差术语的真正标准偏差（）.我们将模拟数据中所有残差术语的真正标准偏差固定为一个，因此效果大小等于回归系数的真实值。我们使用了350的样本大小，因为该样本大小产生了第二个三个时间点的足够功率，我们假设的效果大小。

除了最初的模拟集，我们还进行了模拟，评估样本大小从100-500和其他效应大小，例如，在本节描述的示例数据集中观察到的小的负面效应大小4，由COHEN定义的中等效果大小（0.50）[30.]和空效果大小评估模型的I型错误属性。

对于每个时间点，单独评估关于突出变量上的主要独立变量的模型性能。

我们使用上面描述的SEM产生了数据，其中具有连续结果的重复测量，随机截距和斜率和时变的主要独立预测器和调解变量。每次评估结果，主要的独立变量和调解剂，每次评估6个时间点。采取以下步骤来产生介导的纵向数据。（1）生成两个多变量正常随机变体，对应于潜在截距的残余方差，一个是潜伏斜率的残余方差。（2）产生6个多元正态随机变量，对应中介变量的残差。（3）基于方程式（2)和(3.），计算潜在截距和潜伏的值。（4）根据公式(4），确定介体变量的值。（5）生成6个独立的标准正态随机变量，对应6个残差s。（6）根据公式(1），价值生成了。（7）步骤（1）到（6）重复1000次以创建每个模拟的1000个数据集。

拟合模拟数据的模型的评估方法为:(i)偏差:估计为真实参数值与观测参数均值的差除以真实参数值。(ii)覆盖率概率:估计为包含真参数值的1000个95%置信区间的百分比。(iii)功率:估计为对感兴趣的参数进行假设检验在统计上显著性的1000个数据集的百分比和(iv)第一类错误:对于假设无效效应(对于直接和间接效应)的设置，I型误差估计为对感兴趣的参数进行假设检验在统计上显著性的1000个数据集的百分比。

２.３.最小二乘和最小二乘与模拟数据拟合

在如上所述生成模拟数据之后，数据适合三个SEM，其中五个LMMS表示可以适合介导的纵向数据的一系列可能的模型。

2.3.1。恒定效果SEM.

我们评估的第一个SEM代表了可以适合的最简单和最常见的模型之一。该模型假设醇对CD4计数的直接影响是恒定的（即，），酒精对艺术粘附的影响是恒定的（即，），并且艺术粘附对CD4计数的影响是恒定的（即，）.因此，重复的主要变量对重复结果的总效果是表示的．我们把这个模型称为恒效应SEM (CESEM)。

2.3.2。延迟效果SEM.

拟合模拟数据的第二个SEM是用于模拟数据和在部分中定义的模型2．2；也就是说，它假设早期与晚期效应。在该模型中，CD4计数对酒精的短期总影响（假设前三个时间点的假设，并在第二个三个时间点假设醇对CD4计数的长期效果（）.

2.3.3。无限制的sem.

最后评估的SEM是(1) - (4）并在图中表示1．不受限制的SEM是可用于评价的酒精和HIV疾病进展之间的介导的纵向关系的性质，而不假定的影响可能如何在时间变化的模型。

2.3.4。恒定效果线性混合模型

适合模拟数据的第一混合模型假定重复的主自变量随时间保持恒定的效果。该常量效果混合模型的公式是在哪里和．

在该模型中，参数的解释如下。（一世）是重复结果的拦截。（ii）是连续协变量的影响，，关于重复的结果。(3) 是时间的效果，，重复的结果。（iv）为重复主自变量的影响，，关于重复的结果。（v）是重复结果的随机拦截。（vi）是重复结果的随机斜率。

我们注意到，中介变量已经被排除在这个模型中，因为我们的目标是评估的主要自变量的总效应。如果已知的介体包括在一个模型中，然后与主预测器相关联的参数估计估计直接，而不是总的效果，即预测的对结果[28］.在恒定效果LMM（7），在任何时间点都表示醇对CD4计数的总效果．

2.3.5。全延迟效果混合模型

为了捕捉潜在的短期和长期效果，我们允许在前三个时间点的饮酒效果与最后三个时间点不同。为实现这一点，将代表从最后三个时间点的观察的指示变量输入到模型中（即，指示灯变量在时间点6和否则））和以下模型适合：因此，回归模型为将

而对于，它将是

在该模型中，重复主自变量的总效应用表示对于前三个时间点和对于第二个三个时间点。此外，重复结果的截距由前三个时间段，并通过对于第二个三次时间。因此，该模型允许（a）估计酒精的可能延迟效果（）和（b）通过允许早期和后期时间段的不同截距值核算期限效应。期间效应可以通过调解员的改变直接效果引起（在生成数据的SEM中，调解员效应是从(5)，前三个时间点从(6）最后三个时间点）。

2.3.6。天真的延迟效果混合模型

如上所述，模拟数据由介质效果随时间变化的效果而产生的模拟数据。在实践中，可以使用SEM将这种时间依赖效果直接建模为中介过程的一部分。相比之下，在LMM模型中，可以通过时变截距来捕获早期与晚期效果的平均结果值的这种差异。然而，当在该设置中拟合混合模型时，对时变截距项的需要不会立即清除，因此，没有时变截距的模型可能更常用。我们将这样的模型称为天真延迟效果模型该模型与完全延迟模型相似，但假设重复结果的截距，，所有六个时间段都是一样的。在这个天真的模型中，酒精对艾滋病毒疾病进展的总效果是给出的前三个时间点对于第二个三个时间点。

2.3.7。时间交互线性混合模型

在混合模型中，通常包括时间和主要变量之间的相互作用，以评估独立变量的效果是否线性变化横跨时间在这个模型中，酒精()模型为时间的线性函数，，表示为．

2.3.8。无限制的混合模型

我们评估了允许对CD4醇的作用的最后混合模型计数在每个时间点而变化，而无需假设线性。这个无限制LMM的公式为在哪里是时间点的指标，被定义为如果和否则。在这个模型中是时间的函数，由．这是限制性的最少的模型，有时称为简介分析[31］.

2.4。模型比较

为了评估LMM相对于SEM的性能，我们提出了以下五个比较。（1）恒定效果SEM（CESEM）与恒定效果混合模型（CEMM）。（2）延迟效应SEM（DESEM）与全延迟效果混合模型（FDEMM）。（3）不受限制的SEM（USEM）与无限制的混合模型（UMM）。（4）延迟效应SEM (DESEM)与原始延迟效应混合模型(NDEMM)。（5）不受限制的SEM（USEM）与时间交互混合模型（TIMM）。

我们在截面中定义的SEM下模拟数据2．2．SEMS作为参考标准符合与LMM结果进行比较，因为目标是在假设SEM的设置中评估LMM的性能。对于比较（1），（2）和（3），模型之间的主要区别是SEM明确地模拟了调解，而LMM没有。模型的所有其他方面都是相同的。比较4是感兴趣的，因为在时变的介导的数据中，天真延迟效果模型通常适用于混合模型框架。然而，如前所述，该模型并未完全捕获时变调解过程，因此，评估其对SEM的性能是有用的。评估比较（5），因为当怀疑时变关系时，相互作用混合模型也是混合模型框架中的常见方法。然而，它依赖于假设醇的影响是时间的线性函数。因此，将该模型与不受限制的SEM进行比较，这是有意义的，这不承担线性度。

3.模拟研究结果

3．1.恒效应SEM与恒效应混合模型

在真实效应量随时间变化的情况下，假设一个模型的效应是恒定的，估计检测主要自变量对结果的真实效应的能力通常是不充分的，样本量为350 (对于所有情况下SEM和LMM）（表格1）.当影响在直接和间接影响之间平均分配时，两个模型的估计功率相似，尽管SEM略高(65% vs 62%)。CESEM和CEMM的偏差估计都相当大(分别为180%和171%)。,因为−44%、−45%。,因为），高估较小的短期效果，低估了预期的更大的长期效果。覆盖概率也相当低，但对于两种模型，与后续三个时间点相比，它更高。当效应主要直接时，观察到类似的结果，并且当它们主要间接时。我们注意到，我们故意在前三个时间点创造了一个小效果，以模拟治疗对结果的延迟效果，因此，并未指望在评估样本大小的前三个时间点检测效果的足够的功率。用不同的样本尺寸和效果大小观察到类似的图案。对于小于350的样品尺寸和减少效果尺寸，功率显着降低。


模拟数据场景				恒定效果SEM.			恒定效果LMM
时间点	规模效应	样本大小	效果分布	偏见（％）	覆盖概率(%)	力量（％）	偏见（％）	覆盖概率(%)	力量（％）

	0.05	350.	平等的	180.	67.	65.	171.	71.	62.
	0.25	350.	平等的	−44	56.	65.		53.	62.

	0.05	350.	主要是间接的	179.	70	60.	164.	73.	55.
	0.25	350.	主要是间接的		55.	60.		51.	55.

	0.05	350.	主要是直接的	173.	69.	66.	169.	69.	65.
	0.25	350.	主要是直接的	−45	50.	66.		49.	65.

	0.05	100.	平等的	168.	86.	24	159.	88.	22
	0.25	100.	平等的	−46	82.	24		81.	22

	0.05	200	平等的	178.	80	41.	169.	81.	38
	0.25	200	平等的	−44	73.	41.		70	38

	0.05	400	平等的	175.	65.	67.	165.	69.	64.
	0.25	400	平等的	−45	49.	67.		46.	64.

	0.05	350.	平等的	395.	3.	97.	369	2	94.
	0.5	350.	平等的	−50	16	97.	−53	21	94.

	0.05	400	平等的	−148	73.	8		76.	6
		400	平等的	−78	63.	8		60.	6

基于1000个模拟数据集。

3.2。延迟效果SEM与全延迟效果混合模型

DESEM和FDEMM具有类似的力量来检测长期总效果，独立于效果是否同样分布，主要是直接的，主要是间接（表2）.与350的样品尺寸和0.25的效果的大小，估计功率为用于DESEM最后三个时间点比用于FDEMM（82％-84％）略高（83％-85％）。两种型号的偏置低（-0.1％-1.7％和-0.3％-1.4％，RESP）和覆盖概率很高（95％，对于DESEM和FDEMM，RESP 94％。）。观察到对其他样本大小具有相同效果的大小类似的模式。对于较小的样本大小（100和200），所述功率下降到不可接受的水平（32％-63％）。


模拟数据场景			延迟效果SEM.			天真的延迟效果lmm			完全延迟效应LMM
时间点	规模效应	样本大小	偏见（％）	覆盖概率(%)	力量（％）	偏见（％）	覆盖概率(%)	力量（％）	偏见（％）	覆盖概率（％）	力量（％）

	0.05	350.	10.	95.	13	390.	23	53.	9.6	95.	13
	0.25	350.	-0.1.	95.	83.	109.	9	100.	-0.3	94.	82.

	0.05 *	350.	-4.2	95.	11.	522.	6	82.	-5.0	95.	10.
	0.25 *	350.	1．7	95.	83.	144.	0.8	100.	1．4	94.	82.

	0.05 * *	350.	2．2	94.	11.	−234	61.	17	2．2	94.	12.
	0.25 **	350.	-0.7	95.	85.	633.	48.	100.	-0.7	96.	84.

	0.05	100.	-0.2	94.	8	−397	68.	20.	-0.9	94.	7
	0.25	100.	-2.9	94.	34	107.	58.	92.	-2.5	94.	32

	0.05	200	0.2	95.	10.	−396	45.	34	-0.9	95.	9
	0.25	200	0.8	95.	63.	109.	28	99.	0.7	96.	61.

	0.05	400	0.2	94.	14	-400	17	60.	-1.4	94.	12.
	0.25	400	8.0	96.	88.	109.	6	100.	-0.8.	94.	86.

	0.05	350.	4.2	96.	11.	-684	0.2	97.	4.1	96.	9
	0.5	350.	0.5	95.	100.	98.	0	100.	0.09	95.	100.

	0.05	400	0.4	95.	11.	−148	80	6	0.6	95.	10.
	−0.11	400	1．5	95.	30.	-90	74.	6	2	95.	30.

基于1000个模拟数据集。
结果来自于模拟数据，直接和间接效应之间的总效应平均分布，除非有说明。
*总的影响主要是直接的。
**总的影响主要是间接的。

同样，由于效果在第一三个时间点的幅度很小，没想到我们有足够的力量来检测与350的样本大小在这两种模式中的任何建模框架这样的效果，电源检测前三个时间段总的效果比在过去三年（10％-13％中的前三个时间点与82％-85％，第二个时间点为两个模型），其中影响是显着更低较大规模。为400的样品尺寸，功率维持在低水平，以检测这两种模式的影响小（-0.11，从由残留标准偏差标准化的实际数据例如观察到的效应大小）（对于DESEM和FDEMM 30％）。在所有样本和影响大小，结果没有实质上的建模框架之间的不同。

３．３．无限制SEM与无限制混合模型

具有350的样本大小，无论何种效果是否同样地分布，主要是直接，或主要间接（表格），USEM和UMM的性能都非常相似。3.）.如前面的模型所示，两种型号检测前三个时间点的效果的功率为低（6％-9％）。对于最后三个时间点，检测效果的力量对于两种型号也很低（USEM的36％-58％，umm的36％-55％）。然而，偏差对于两种型号而言，两种型号也很低（USEM的-0.08％至2.9％，umm的-2.6％至2.6％）。两种模型的覆盖概率很好（USEM和UMM的93％-96％），不同效果分布。在这些模型中，在LMM或SEM中假设与时间的特定关系，因此两种模型都自由地估计随时间变化的主要独立变量的效果。然而，这一点的成本是必须估计几个参数，因此，减少了检测效果的功率。观察到类似的图案，用于其他样本尺寸和效果尺寸。


模拟数据场景			usem.			蒂姆姆			umm.
时间点	规模效应	样本大小	偏见（％）	覆盖概率(%)	力量（％）	偏见（％）	覆盖概率(%)	力量（％）	偏见（％）	覆盖概率(%)	力量（％）

	0.05	350.	16	95.	8		93.	6	16	96.	7
	0.05	350.	9.4	94.	8	51.	94.	19	8．6	94.	8
	0.05	350.	7．4	94.	9	153.	75.	56.	4.9	95.	8
	0.25	350.	-0.6.	94.	54.	-29	81.	76.	−0.09	94.	54.
	0.25	350.	-0.4	94.	48.	-8.9	94.	73.	-0.5.	93.	48.
	0.25	350.	−0.08	93.	40	11.	93.	66.	-1.0	94.	38

	0.05 *	350.	-4.0	94.	8	−71	94.	5	−6.3	95.	7
	0.05 *	350.	-9.6	96.	7	38	94.	15	-9.8	95.	6
	0.05 *	350.	-1.4	95.	8	146.	78.	49.	1．3	95.	7
	0.25 *	350.	2．9	95.	55.	-29	81.	70	2．6	94.	54.
	0.25 *	350.	2．2	95.	49.	-7.4	94.	71.	1．6	94.	48.
	0.25 *	350.	0.4	95.	36	14	94.	66.	-0.5.	95.	36

	0.05 * *	350.	10.	95.	7	−60	94.	6	8．7	95.	7
	0.05 * *	350.		93.	7	44.	95.	18		93.	7
	0.05 * *	350.	11.	94.	8	148.	75.	56.	12.	94.	9
	0.25 **	350.	-0.4	95.	58.	-29	81.	79.	-0.3	95.	55.
	0.25 **	350.	0.0	96.	50.	-8.6	95.	77.	0.2	96.	48.
	0.25 **	350.	-0.2	96.	37	12.	95.	70	-2.6	96.	36

	0.05	100.		94.	7	-26	94.	6		93.	6
	0.05	100.	8．8	94.	6	7．2	93.	6	36	94.	9
	0.05	100.	10.	96.	5	14	95.	5	141.	90.	20.
	0.25	100.	−2.0	94.	20.	-2.2	93.	20.		90.	30.
	0.25	100.	-3.8	94.	17	-3.2	94.	17	-9.8	95.	29
	0.25	100.	-2.5	94.	16	-2.2	94.	16	11.	95.	26

	0.05	200	8.2	95.	7	−60	95.	5	7．7	95.	7
	0.05	200	1．2	95.	7	45.	95.	13	0.4	95.	6
	0.05	200	-7.8	95.	7	150.	83.	34	-9.2	95.	6
	0.25	200	4.0	96.	38	-29	97.	52.	4.1	95.	36
	0.25	200	-3.0	95.	28	-8.1.	95.	50.	-2.6	95.	28
	0.25	200	-0.7	94.	24	13	95.	45.	-1.3	94.	25

	0.05	400	41.	95.	8	−65	94.	5	2．7	95.	7
	0.05	400	-3.2	94.	7	41.	94.	19	-4.7	97.	6
	0.05	400	-0.2	95.	9	146.	74.	58.	-2.3.	96.	7
	0.25	400	-1.3	95.	60.	-30	76.	80	-1.7	95.	58.
	0.25	400	1．2	95.	54.	-8.6	95.	79.	1．0	94.	53.
	0.25	400	-0.5.	96.	43.	12.	95.	73.	-1.9	96.	40

	0.05	400	−6	95.	7	52.	94.	14	−7	95.	7
	0.05	400	4	97.	6	-33	95.	8	3.	97.	7
	0.05	400	2	95.	8	−119	82.	5	5	95.	7
	−0.11	400	0.4	95.	17	−52	83.	14	0.9	95.	17
	−0.11	400	2．5	95.	17	-13	95.	23	4	95.	17
	−0.11	400	1	95.	13	26	94.	26	2	95.	13

3.4。延迟效应SEM与天真延迟效果混合模型

随着350的样品尺寸，当效果的分布同样分布时，检测到最后三个时间点的总效果的功率对DESEM（83％）非常好，偏差低（0.1％），并且覆盖概率很高（95％）（表2）.相比之下，对于NDEMM，在估计最后三个时间点的总效应时存在很大的偏差(109%)。这个幼稚的模型显然没有正确地估计主要自变量对结果的影响。在比较两个模型时，无论总效应如何分布、样本量或效应量如何，都观察到类似的趋势。

3.5。不受限制的SEM与时间交互混合模型

不管作用的分布，样本大小，或效果的大小，所述TIMM和USEM具有低的功率，以检测针对所述第一三个时间点重复结果重复初级独立变量的影响（表3.），正如预期的那样。样品大小为350，功率为USEM的7％-9％，TIMM为5％-56％。对于此样本大小的最后三个时间点，与TIMM相比，USEM具有较低的偏置，但也具有较低的功率。对于TIMM，不正确强制迫使线性趋势导致更大程度的偏差。虽然TIMM在所有时间点都有很大程度的偏差，但它在大多数时间点具有比USEM更高的功率。这种相对于USEM的功率增加可能至少部分地到期估计更少的参数。对于其他样本尺寸和效果尺寸，还观察到Timm相对于USEM的较高功率和偏差（表3.）.

3.6。第一类错误率

桌子4显示了在一系列样本大小下估计的第一类错误率。名义上的I型错误率为0.05。在类似的SEM和LMM模型之间，I型误差非常相似。在所有模型中，观察到的I型错误率从0.030 (CESEM，样本量为350)到0.072 (UMM，样本量为100)不等。


模拟数据		不受限制的		延迟效果		恒定效果		时间互动
时间点	样本大小	扫描电镜	lmm.	扫描电镜	lmm.	扫描电镜	lmm.	lmm.

	100.	0.050	0.050	0.053	0.053	0.05	0.053	0.053
	100.	0.064	0.072	0.053	0.053	0.05	0.053	0.065
	100.	0.038	0.039	0.053	0.053	0.05	0.053	0.053
	100.	0.047	0.051	0.045	0.043	0.05	0.053	0.045
	100.	0.048	0.051	0.045	0.043	0.05	0.053	0.041
	100.	0.050	0.053	0.045	0.043	0.05	0.053	0.038

	350.	0.053	0.053	0.048	0.046	0.030	0.031	0.054
	350.	0.044	0.044	0.048	0.046	0.030	0.031	0.047
	350.	0.051	0.051	0.048	0.046	0.030	0.031	0.032
	350.	0.049	0.049	0.046	0.045	0.030	0.031	0.038
	350.	0.038	0.038	0.046	0.045	0.030	0.031	0.046
	350.	0.052	0.052	0.046	0.045	0.030	0.031	0.049

	500.	0.058	0.064	0.047	0.045	0.054	0.053	0.052
	500.	0.048	0.048	0.047	0.045	0.054	0.053	0.049
	500.	0.049	0.046	0.047	0.045	0.054	0.053	0.054
	500.	0.049	0.050	0.048	0.048	0.054	0.053	0.047
	500.	0.051	0.048	0.048	0.048	0.054	0.053	0.048
	500.	0.046	0.047	0.048	0.048	0.054	0.053	0.044

基于1000个模拟数据集。

4.实时数据示例：酒精和HIV疾病进展

为了证明在模拟研究中评估的各种LMMS和SEM的应用，我们分析了从预期队列研究中的数据评估了醇类使用对艾滋病毒疾病进展的影响。Samet等人。此前报道了这种纵向队列研究的分析[29］.原始分析来自两个队列（HIV-ALC和HIV-LIVE COHORTS）的组合数据。为了说明本文中评估的模型，我们已经使用来自艾滋病毒实时研究的数据并适合各种LMM和兴趣的SEM。为清楚起见，我们将分析限制在受试者报告的任何艺术期间使用的观察并且只包括以下关键变量：大量饮酒（是相对于没有），主要的独立变量，ART依从性（在过去三天内用过药的百分比），调解员;年龄，一个潜在的混杂因素，以及CD4细胞计数，主要结果。每个变量，每半年长达四年评估。

饮酒对CD4计数的总体影响在符合数据的任何中小样本或中小样本中都没有统计学意义。估计的总影响详列于表中5．恒定效果模型均显示出小的负面影响（CESEM中的-3.7和CEMM中的-3.0）。延迟效应SEM和LMM在最后四个时间点中显示出相似的负面影响，尽管DESEM中的效果幅度略大（-10.3）比DEMM（-4.1）略大。在两个延迟效果模型中，前三个时间点的效果的幅度非常小，但在DESEM（0.41）和DEMM（-2.3）中的签名中不同，尽管既不与零有明显不同。不受限制的模型通常显示出类似的结果，其效果在USEM中的-41.8至5.7范围，从umm中的-15.8到9.5范围。估计的酒精效应的方向在模型之间是一致的，除了USEM（-1.4）中具有小估计的负效应和umm（6.9）中的小估计积极效果的较小估计的负效应;然而，两种效果都没有统计学意义。蒂姆和USEM之间的效果的大小相似。然而，由于在TIMM中假设时间的线性效果，因此在时间点2之后的所有效果是负的，而在USEM中，效果方向在负极和正上变化。


扫描电镜				lmm.
时间点	恒定效果	延迟效果	不受限制的	恒定效果	延迟效果	时间互动	不受限制的

	−3.7 (9.6)	0.41（11.6）	−4.8 (19.6)	−3.0 (11.3)	-2.3（13.8）	0.44（22.0）	-7.7（23.9）
	−3.7 (9.6)	0.41（11.6）	0.13（20.1）	−3.0 (11.3)	-2.3（13.8）	-0.41（18.1）	6.2（24.1）
	−3.7 (9.6)	0.41（11.6）	-1.4（20.4）	−3.0 (11.3)	-2.3（13.8）	-1.3（14.7）	6.9 (23.7)
	−3.7 (9.6)	0.41（11.6）	5.7（18.9）	−3.0 (11.3)	-2.3（13.8）	-2.1（12.3）	0.68（22.3）
	−3.7 (9.6)	-10.3（14.0）	-3.4（20.2）	−3.0 (11.3)	−4.1 (16.5)	−3.0 (11.3)	-4.6（24.1）
	−3.7 (9.6)	-10.3（14.0）	3.8 (22.0)	−3.0 (11.3)	−4.1 (16.5)	−3.8 (12.3)	9.5（25.1）
	−3.7 (9.6)	-10.3（14.0）	−13.1 (25.9)	−3.0 (11.3)	−4.1 (16.5)	-4.7（14.8）	-13.6（30.3）
	−3.7 (9.6)	-10.3（14.0）	−41.8 (31.6)	−3.0 (11.3)	−4.1 (16.5)	-5.5（18.2）	-15.8（35.1）

5.讨论

混合模型是分析纵向数据的有用技术，具有时间相关的变量。它们可以应用于介导的纵向数据，并且一系列模型可以适合解开直接与暴露的间接影响。然而，它是未知它们是否相对于SEM的表现良好，一种用于媒体分析的方法。在本文中，我们在进行时间依赖预测器和介体的设置中评估了线性混合模型相对于SEM的性能，其中两种变化随时间的影响。

主要仿真研究假设主要独立预测因子对结果产生延迟影响（即，在前三个时间点的少量效果和最后三个时间点的中等效果）。一系列SEM（恒定效果SEM，延迟效果SEM和不受限制的SEM）和LMMS（恒定效果混合模型，Naive延迟效果混合模型，全延迟效果混合模型，时间交互混合模型和不受限制的混合模型）都适合到模拟数据。

在“类似”模型之间进行了三次比较，其中模型之间的主要区别是SEM明确地模拟了中介，而在混合模型中，中介被从模型中移除。模拟模型为恒效应SEM与恒效应混合模型、延迟效应SEM与完全延迟效应混合模型、无限制SEM与无限制混合模型。对于这三种比较，SEM和LMM得到了相似的结果。SEM和LMM的功率、偏倚和覆盖概率均相似。一项前瞻性队列研究评估了饮酒对艾滋病毒疾病进展的影响，对该研究数据的分析结果进一步说明了类似的中小样本调查和低样本调查结果的相似性。

我们还考虑了两种非洲模型的两种比较。第一个比较是延迟效应SEM和Naive延迟效果混合模型。在SEM框架中，调解可以在每个时间点直接建模，因此，容易掺入时变预测器的介导的延迟效果。然而，在混合模型框架中，中介不直接建模。相反，如果目标是在结果上获得时变预测器的总效果，则从模型中移除调解器[28］.因此，在混合模型框架中，可能概不是在模型中必要的时间变化截距项，以适当地考虑预测器和结果之间的介导关系。我们的模拟表明，Naive延迟混合模型产生了短期和长期曝光效果的极其偏见估计，并且覆盖概率差。因此，尽管Naive延迟效果混合模型代表了混合模型框架中可能是自然选择的模型，但它可能不会产生有效估计。为了获得混合模型的准确估计，需要拟合完整的延迟效果模型（具有特定于时间的拦截条款）。然而，如前所述，该模型可能是非平坦的。这是混合模型框架的独特缺点，因为可能是最自然的模型可能导致不准确的估计，而SEM的自然选择是完全延迟效果模型，这是一个相对良好的模型。第二组非大学模型与不受限制的SEM和时间交互混合模型进行了比较。这两种模型反映了在两个框架中处理时间的潜在差异。在纵向数据分析中，SEM在测量模型中将时间值纳入固定回归系数。 Treatment of time is usually limited to a linear main effect of time. If some unspecified nonlinear relationship over time between the predictor and outcome is suspected, the most natural way to evaluate this is to leave the relationship between the time-varying predictor and outcome unrestricted and obtain separate estimates at each time-point as is done in the unrestricted SEM. In mixed models, however, interactions between time and other predictors (time invariant or time varying) are frequently incorporated. In our simulation study, the time interaction mixed model had substantially larger bias compared to the unrestricted SEM. Power was generally higher for the mixed model, possibly due in part to the fewer number of parameters being estimated. The difference between the time-interaction mixed model and the unrestricted SEM was also observed in the real-data example.

在介导的纵向数据的设置中，曝光效果随时间变化的变化，混合模型相对于类似的SEM进行良好。延迟效果SEM和全延迟效果混合模型在偏置，覆盖概率和建模变量之间的时间特定关系方面具有最佳性能。应当注意，在介导的时间特异性效果的设置中，延迟效应SEM是SEM框架内模型的自然选择，产生的结果与天真延迟混合模型，是在LMM内选择的自然模型框架。然而，在偏差和覆盖概率方面，两种可能适合的其他常见模型，无限制的SEM和混合模型，两者都具有较低的功率，因为对给定的样本大小估计了相对大的参数。我们注意到，本研究中观察到的结果可能不完全普遍于其他设置，例如，具有更复杂的途径的情景和变量之间的关系可能会影响LMM的性能。

线性混合模型可以相对于介导的预测器和介体分析介导的纵向数据中的SEM。但是，必须注意确定适当的模型，例如，通过包括时变截距和因果通道中的变量排除变量来充分考虑介质效果。在时变预测器的延迟效果的具体设置中，在混合模型框架内拟合的共同模型可能在该介导的纵向数据设置中不充分地执行。然而，适当指定的混合模型可以在评估时变预测器的整体效果时具有相对于SEM的良好性能。

致谢

作者希望感谢Howard Cabral和Timothy Heeren对问题的周到讨论，以及匿名期刊评论员的建设性和有用的评论。我们还感谢艾滋病毒直播学习（NIAAA：R01-AA13216）的PI，用于使用数据。

参考

N. M. Laird和J. H. Ware，“纵向数据的随机效果模型”生物识别技术，卷。38，不。4，pp。963-974，1982。视图:谷歌学术
R. M. Baron和D. A. Kenny，“主持人 - 介体变化在社会心理学研究中的区别。概念，战略和统计因素，“人格与社会心理学杂志，卷。51，没有。6，PP。1173-1182,1986。视图:出版商的网站|谷歌学术
J. L.克鲁尔和D P.麦金农，“在基于组的干预研究多层次的调解造型，”评估审查，卷。23，不。4，pp。418-444，1999。视图:谷歌学术
k·a·博伦具有潜在变量的结构方程，约翰瓦里和儿子，纽约，纽约，美国，1989年。
B. Muthen，“利用可变参数的潜在变量模型分析纵向数据”，刊于改变分析的最佳方法：最近的进展，未答造的问题，未来的方向，第1-17页，APA，华盛顿特区，美国，1991年。视图:谷歌学术
P. D. Mehta和S. West，“将个人恢复到个体增长曲线”，心理方法，卷。5，不。1，pp。23-43,2000。视图:谷歌学术
M. J. ROVINE和P. C. M.MOM.MOLENAAR，“多级随机系数模型的结构建模方法”，多变量行为研究，卷。35，不。1，pp。51-88,2000。视图:谷歌学术
P. J. Curran，“有多级模型一直都是结构方程模型？”多变量行为研究，卷。38，不。4，第529-569，2003。视图:谷歌学术
D. J. Bauer，“估计多级线性模型作为结构方程式模型”教育行为统计学报，卷。28，不。2，第135-167，2003。视图:谷歌学术
R. D. Stoel，G.Van Den Wittenboer和J. Hox，“估计多级线性模型作为结构方程模型”，Metodologia de las ciencias del Comportamiento， 2003年第5卷，第21-23页。视图:谷歌学术
P. D. Mehta和M. C. Neale，“人是变量：多级结构方程建模，”心理方法，卷。10，不。3，pp。259-284,2005。视图:出版商的网站|谷歌学术
B. N. Sánchez, E. Budtz-Jørgensen, L. M. Ryan, H. Hu，“结构方程模型:环境流行病学应用综述”，美国统计协会杂志，卷。100，不。472，第1443至1455年，2005年。视图:出版商的网站|谷歌学术|Mathscinet.
J. J. Mcardle和D. Epstein，“发展结构方程模型中的潜在增长曲线”，儿童发展，第58卷，第2期1，页110-133,1987。视图:谷歌学术
B. O. Muthén和P. J. Curran，“实验设计中个体差异的一般纵向建模:分析和功率估计的潜在变量框架，”心理方法，卷。2，不。4，pp。371-402，1997。视图:谷歌学术
M. J. Rovine和P. C. M. Molenaar，“一般线性混合模型的结构方程建模方法”，刊于分析变化的新方法，第67-96页，APA，华盛顿特区，美国，2001。视图:谷歌学术
J. J. McARDLE和M. S. Aber，“潜在变量结构方程模型的变化模式，”纵向研究中的统计方法，第151-224页，学术出版社，美国纽约，1990。视图:谷歌学术
W. Meredith和J. Tisak，“潜在曲线分析”，Psychometrika，卷。55，不。1，pp。107-122,1990。视图:出版商的网站|谷歌学术
J. B. Willett和A.G. Sayer，“使用协方差结构分析来检测个人变化的相关性和预测因子随着时间的推移，”心理公报，卷。116，没有。2，第363-381，1994。视图:谷歌学术
B. Muthen，“纵向和多级数据的潜在变量建模”社会学方法论，pp.53-480，Blackwell，华盛顿，DC，美国，1997。视图:谷歌学术
K. A. Bollen和P. J. Curran，潜在曲线模型：结构方程视角， John Wiley & Sons，美国新泽西州霍博肯，2006年。
J. Cheong，D.P.Mackinnon和S. T.Khoo“使用平行过程潜在生长曲线建模的媒体进程调查”，结构方程建模，卷。10，不。2，pp。238-262,2003。视图:出版商的网站|谷歌学术
D. P. Mackinnon，统计调解分析简介，劳伦斯·埃尔巴姆associates，纽约，纽约，美国，2008年。
J.L.Krull和D.P.Mackinnon，“个体和群体级别介导的效果的多级建模”，多变量行为研究第36卷第2期2，页249-277,2001。视图:谷歌学术
S. E. Maxwell和D. A.科尔，“偏置在纵向调解的横截面的分析，”心理方法，卷。12，不。1，pp。23-44,2007。视图:出版商的网站|谷歌学术
D. A. Kenny, J. D. Korchmaros, N. Bolger，《多水平模型中的低水平中介》，心理方法，第8卷，第2期2, pp. 115-128, 2003。视图:出版商的网站|谷歌学术
D. J. Bauer，K. j.牧师和K. M. Gil，“概念化和测试多级模型中的随机间接效应和适度调解：新程序和建议，”心理方法，卷。11，不。2，pp。142-163,2006。视图:出版商的网站|谷歌学术
D. A. COLE和S. Maxwell，“测试具有纵向数据的媒体模型：使用结构方程模型的问题和提示，”变态心理学杂志，第112卷，第112期。4，页558-577,2003。视图:出版商的网站|谷歌学术
E. A. Blood, H. Cabral, T. Heeren，和D. M. Cheng，“混合效应模型在中介纵向数据分析中的表现”，医学研究方法，卷。10，2010年第16,10股。视图:出版商的网站|谷歌学术
J. H. Samet，D. Cheng，H. Libman，D.P.Nunes，J.K. Alperen，以及R. Saitz，“酒精消费和艾滋病毒疾病进展”中国患有免疫缺陷综合征杂志，卷。46，没有。2，pp。194-199,2007。视图:出版商的网站|谷歌学术
J. Cohen，行为科学的统计能力分析，劳伦斯·埃尔巴姆associates，山地代尔，美国新泽，1988年。
G. M. Fitzmaurice，N. M. Laird和J. H. Ware，应用纵向分析，约翰威利和儿子，霍博肯，NJ，美国，2004年。

中国环境与公共卫生杂志

抽象的