多水平模型在交叉设计资料分析中的应用
作者:李晓松 张文彤 倪宗瓒
单位:华西医科大学卫生统计学教研室(610041)
关键词:多水平模型;交叉设计;顺序效应
中国卫生统计990506 【提 要】 目的 探讨多水平模型在交叉设计资料分析中的应用价值。方法 通过两水平随机系数模型以及顺序效应的拟合,估计处理效应的大小及其在个体间的变异。结果 分别获得处理效应、阶段效应、顺序效应以及个体变异的估计。结论 在交叉设计资料分析中,当存在顺序效应时,多水平模型可分解并检验顺序效应的大小,同时得到处理效应和阶段效应的估计。
Multilevel Models in Analysis of Crossover Design
Li Xiaosong,Zhang Wentong,Ni Zongzan.
, 百拇医药
Department of Health Statistics,West China University of Medical Sciences(610041),Chengdu
【Abstract】 Objective To explore the special applicability of the multilevel models in analysis of crossover design.Methods Fitting two-level random coefficient model and sequence effect to estimate the treatment effect and its variation between individuals.Results Obtain the estimates of treatment effect,time period effect,sequence effect and individual variation separately.Conclusion While the sequence effect exists in analysis of crossover design,the sequence effect can be decomposed and tested,meanwhile,the treatment effect and the time period effect can be estimated by fitting multilevel models.
, 百拇医药
【Key words】 Multilevel model Crossover design Sequence effect
交叉设计(crossover design)是临床试验中比较两种处理措施A和B效果的常用方法。它可分析试验结果在处理措施间、阶段间以及个体间的差别,尤其是可将个体间变异从处理措施的比较中排除〔7〕。一般认为,A、B两种处理先后试验的机会均等,平衡了试验顺序对结果的影响。如果A、B两种处理均对下一阶段无影响或影响相同,则结果与试验顺序无关;反之,如A处理的效应影响下一阶段B处理的效应,而B不影响A,或者A处理对下一阶段B处理的影响不等于 B对 A的影响,则两种顺序的效应不同〔5,6〕。因此,顺序效应(sequence effect)在一定程度上反映了残留效应(carry-over effect)的大小,即上一阶段的处理由于效应去除时间(washout time)不足或其他原因干扰了下一阶段的处理效果。目前交叉设计常用的统计方法,一般未考虑残留效应对试验结果可能产生的潜在影响。
, http://www.100md.com
资料与方法
为研究A、B两种治疗方案对白细胞减少症患者疗效的差别,用随机的方法让50名患者先以A方案治疗,间隔一段时间后再以B方案治疗,另外50名患者则先用B方案,间隔同样时间再用A方案治疗,同时记录治疗后的白细胞数。这是临床试验中常见的完全随机交叉设计,它对每个受试对象作两次重复测量,重复测量数据属非独立数据,它具有两个水平的结构,即患者水平(水平2)与重复测量点(水平1)。多水平模型(multilevel model)可从测量值的随机误差中分解出患者间的随机变异,并为进一步拟合患者水平或测量点水平的复杂误差结构提供了可能性〔1〕。本文将多水平模型应用于交叉设计资料的分析,通过两水平随机系数模型以及顺序效应的拟合,估计处理效应的大小及其在患者间的变异。
现以yij表示第j个患者的第i次白细胞测量数,以x1ij表示A、B两种治疗方案(处理)的哑变量,x2ij表示两个试验阶段的哑变量,它们均为0、1变量。基本的两水平模型(模型1)可表达为:
, 百拇医药
yij=β0+β1x1ij+β2x2ij+u0j+eij
(1)
j=1,2,…,100,示患者(水平2单位),i=1,2,示重复测量值(水平1单位)。β为固定效应估计值,水平2残差u0j为随机变量,u0j~N(0,),残差方差估计反映了患者间变异。水平1残差eij即通常的残差项,eij~N(0,),反映了患者内变异。
, 百拇医药
如果处理组间的差别在水平2的患者间存在变异,可在模型水平2随机部分拟合x1ij的随机系数,它反映了两种治疗方案对每个患者升白细胞的作用都存在着差异。两水平随机系数模型(模型2)可表达为:
yij=β0+β1x1ij+β2x2ij+u0j+u1jx1ij+eij
(2)
如前所述,交叉设计可能存在的主要问题之一,是所谓的残留效应,即先前治疗方案的效应或多或少地影响到某些患者对第二种治疗方案的反应,换言之,u1j或许与实施处理的顺序有关。为了拟合这种效应,可在模型的随机部分添加一个额外项u3jδ3ij〔1〕,δ3ij为表示试验顺序的哑变量,若为AB顺序,δ3ij取1,反之,BA顺序取0,其随机系数u3j的参数估计值σ2u3即为顺序效应的估计,它是将水平2方差拟合为处理顺序的函数,即顺序不同,试验结果在患者间的变异不同,实际上是在患者间变异中进一步分解出顺序的效应。模型3可表达为:
, http://www.100md.com
yij=β0+β1x1ij+β2x2ij+u0j+u1jx1ij+u3jδ3ij+eij
(3)
模型2与3均未拟合水平2随机系数间的协方差,其方差协方差结构为:
结果与分析
表1 模型1的拟合结果
估计值
标准误
, http://www.100md.com
固定部分β0
5.7140
0.2230
β1
1.3990
0.2364
β2
0.2563
0.2642
随机部分
水平2 σ2u0
, http://www.100md.com
2.2770
0.6280
水平1 σ2e0
8.3810
0.6829
-2log-likelihood
2108.34
模型固定部分参数估计值的假设检验可采用Walds检验,第k个参数的χ2值为[βk/SE(βk)]2,自由度为1。结果表明,A、B两种处理效应的差别具有统计学意义(χ2=35.02,P<0.005),而两个阶段效应的差别无统计学意义(χ2=0.94,P>0.25),故在模型2中进一步拟合处理效应在水平2患者间的随机变异(表2)。表2 模型2的拟合结果
, http://www.100md.com
估计值
标准误
固定部分β0
5.9760
0.1510
β1
1.4016
0.2340
β2
0.1624
0.1875
随机部分
, 百拇医药
水平2 σ2u0
2.0040
0.4936
σ2u1
12.9700
1.4160
水平1 σ2e0
2.1610
0.4931
-2log-likelihood
1964.02
, 百拇医药
从表2可见,处理效应在患者间存在较大的变异。模型随机部分参数估计值一般采用对数似然比检验,结果表明,处理间的差别在水平2患者间的随机变异具有统计学意义(χ2=144.32,P<0.005)。同时,水平1残差方差从模型1的8.3810下降为2.1610,提示水平1的患者内变异主要是由处理效应所至。表3 模型3的拟合结果
估计值
标准误
固定部分β0
6.0430
0.1354
β1
1.4210
, 百拇医药
0.2407
β2
0.1413
0.1826
随机部分
水平2 σ2u0
1.3760
0.5080
σ2u1
13.8400
1.4540
, 百拇医药
σ2u3
1.8880
0.6483
水平1 σ2e0
1.7450
0.4715
-2log-likelihood
1955.92
模型2和3的对数似然比检验结果表明,顺序效应具有统计学意义(χ2=8.10,P<0.005)。模型3随机部分的拟合结果表明,水平2总方差为x1ij和δ3ij的函数,即试验结果在患者间的总变异随着治疗方案和试验顺序的变化而变化。讨 论
, 百拇医药
残留效应通常指药物残留效应(drug carry—over effect)。此外,还有第一阶段用药导致耐药性而产生的撤退效应(withdrawal effect)、心理效应(psychological carry—over effect)、患者身体状况因用药而改变所导致的遗留效应(nonuniform carry -effect)等等〔4〕。如果设计合理,如两次试验之间间隔足够的时间以及严格遵循双盲法等,以上各种效应的影响很小,可采用通常的交叉设计方差分析或差数的方差分析、 t检验或秩和检验来分析处理、阶段以及个体的效应〔7〕。反之,则应考虑到残留效应及其对试验结果的潜在影响。
交叉设计数据的变异来源可分解为处理效应、阶段效应、顺序效应和个体变异。对顺序效应的分解及检验,常用的有方差分析,即以顺序效应的变异(均方)与同一顺序组内个体间变异(均方)之比计算检验统计量F〔5,9〕;另一种方法是所谓和数法,即将同一个体的两个效应相加,以AB和BA两个顺序作成组t检验或秩和检验〔3,8〕,这两种方法实质上是等价的。本资料采用方差分析表明,F值为10.52, P<0.01,顺序效应的差别有统计学意义;采用和数法亦表明了顺序效应的差别(t值为3.24, P<0.01)。在顺序效应存在时,对处理效应所作统计推断存在一定问题〔2〕,如采用上述的方差分析以及差数的方差分析等方法存在一定问题。因顺序效应仅存在于试验的第二阶段,故有文献提出采用成组t检验或秩和检验分析第一阶段数据〔8〕。这种方法将交叉设计作为成组设计进行分析,避免了顺序效应对处理效应的干扰,对处理效应所作的统计推断是无偏的,但只利用了全部数据一半的信息,所以检验效能较低〔2〕。本文对资料第一阶段数据所作的成组t检验表明, t值为1.72, P>0.05,处理效应无统计学意义。
, http://www.100md.com
多水平模型方法将顺序效应进一步从个体间变异中分解出来并检验有无统计学意义,同时也可得到处理和阶段效应的估计,基本的两水平模型(模型1)可分别得到处理、阶段固定效应的估计,以及个体随机效应的估计,在随机抽取受试对象的试验中,后者反映了受试对象总体的变异信息;随机系数模型(模型2)可拟合两种处理措施对每个受试对象的效应;模型3则将试验结果在受试对象间的总变异拟合为试验顺序以及处理措施的函数,同时,获得处理和阶段固定效应的估计。依此方法,可将多水平模型的应用扩展到多种处理或多个处理阶段,如常见的两种处理的两重交叉设计〔1〕。此外,水平1方差即个体内的变异尚包括了处理与阶段的效应,我们可进一步构造水平1复杂方差结构,将个体内变异分解为处理间变异和阶段间变异以及随机误差,另外在某些情况下,也可拟合水平1残差的自相关结构或时间序列模型〔1〕,此问题将另文讨论。
参考文献
1.Goldstein H.Multilevel Statistical Models.London:Edward Arnold,1995,94-95.
, 百拇医药
2.Senn SJ.The AB/BA crossover:past,present and future?Statistical Methods in Medical Research,1994,3:303.
3.Grizzle JE.The two-period change-over design and its use in clinical trials.Biometrics,1965,21:467.
4.Woods JR.The two-period crossover design in medical research.Annals of Internal Medicine,1989,110:560.
5.郭祖超.医用数理统计方法.第3版.北京:人民卫生出版社,1988,780-781.
6.杨树勤.中国医学百科全书*医学统计学分册.上海:上海科学技术出版社,1985.
7.倪宗瓒.医学统计学.第2版.北京:人民卫生出版社,1998,87-90.
8.谢隆化.交叉设计治疗试验的统计分析.中国卫生统计,1991,8(3):21.
9.苏炳华,何清波.交叉试验计量资料分析的SAS程序.中国卫生统计,1997,14(3):52., 百拇医药
单位:华西医科大学卫生统计学教研室(610041)
关键词:多水平模型;交叉设计;顺序效应
中国卫生统计990506 【提 要】 目的 探讨多水平模型在交叉设计资料分析中的应用价值。方法 通过两水平随机系数模型以及顺序效应的拟合,估计处理效应的大小及其在个体间的变异。结果 分别获得处理效应、阶段效应、顺序效应以及个体变异的估计。结论 在交叉设计资料分析中,当存在顺序效应时,多水平模型可分解并检验顺序效应的大小,同时得到处理效应和阶段效应的估计。
Multilevel Models in Analysis of Crossover Design
Li Xiaosong,Zhang Wentong,Ni Zongzan.
, 百拇医药
Department of Health Statistics,West China University of Medical Sciences(610041),Chengdu
【Abstract】 Objective To explore the special applicability of the multilevel models in analysis of crossover design.Methods Fitting two-level random coefficient model and sequence effect to estimate the treatment effect and its variation between individuals.Results Obtain the estimates of treatment effect,time period effect,sequence effect and individual variation separately.Conclusion While the sequence effect exists in analysis of crossover design,the sequence effect can be decomposed and tested,meanwhile,the treatment effect and the time period effect can be estimated by fitting multilevel models.
, 百拇医药
【Key words】 Multilevel model Crossover design Sequence effect
交叉设计(crossover design)是临床试验中比较两种处理措施A和B效果的常用方法。它可分析试验结果在处理措施间、阶段间以及个体间的差别,尤其是可将个体间变异从处理措施的比较中排除〔7〕。一般认为,A、B两种处理先后试验的机会均等,平衡了试验顺序对结果的影响。如果A、B两种处理均对下一阶段无影响或影响相同,则结果与试验顺序无关;反之,如A处理的效应影响下一阶段B处理的效应,而B不影响A,或者A处理对下一阶段B处理的影响不等于 B对 A的影响,则两种顺序的效应不同〔5,6〕。因此,顺序效应(sequence effect)在一定程度上反映了残留效应(carry-over effect)的大小,即上一阶段的处理由于效应去除时间(washout time)不足或其他原因干扰了下一阶段的处理效果。目前交叉设计常用的统计方法,一般未考虑残留效应对试验结果可能产生的潜在影响。
, http://www.100md.com
资料与方法
为研究A、B两种治疗方案对白细胞减少症患者疗效的差别,用随机的方法让50名患者先以A方案治疗,间隔一段时间后再以B方案治疗,另外50名患者则先用B方案,间隔同样时间再用A方案治疗,同时记录治疗后的白细胞数。这是临床试验中常见的完全随机交叉设计,它对每个受试对象作两次重复测量,重复测量数据属非独立数据,它具有两个水平的结构,即患者水平(水平2)与重复测量点(水平1)。多水平模型(multilevel model)可从测量值的随机误差中分解出患者间的随机变异,并为进一步拟合患者水平或测量点水平的复杂误差结构提供了可能性〔1〕。本文将多水平模型应用于交叉设计资料的分析,通过两水平随机系数模型以及顺序效应的拟合,估计处理效应的大小及其在患者间的变异。
现以yij表示第j个患者的第i次白细胞测量数,以x1ij表示A、B两种治疗方案(处理)的哑变量,x2ij表示两个试验阶段的哑变量,它们均为0、1变量。基本的两水平模型(模型1)可表达为:
, 百拇医药
yij=β0+β1x1ij+β2x2ij+u0j+eij
(1)
j=1,2,…,100,示患者(水平2单位),i=1,2,示重复测量值(水平1单位)。β为固定效应估计值,水平2残差u0j为随机变量,u0j~N(0,),残差方差估计反映了患者间变异。水平1残差eij即通常的残差项,eij~N(0,),反映了患者内变异。
, 百拇医药
如果处理组间的差别在水平2的患者间存在变异,可在模型水平2随机部分拟合x1ij的随机系数,它反映了两种治疗方案对每个患者升白细胞的作用都存在着差异。两水平随机系数模型(模型2)可表达为:
yij=β0+β1x1ij+β2x2ij+u0j+u1jx1ij+eij
(2)
如前所述,交叉设计可能存在的主要问题之一,是所谓的残留效应,即先前治疗方案的效应或多或少地影响到某些患者对第二种治疗方案的反应,换言之,u1j或许与实施处理的顺序有关。为了拟合这种效应,可在模型的随机部分添加一个额外项u3jδ3ij〔1〕,δ3ij为表示试验顺序的哑变量,若为AB顺序,δ3ij取1,反之,BA顺序取0,其随机系数u3j的参数估计值σ2u3即为顺序效应的估计,它是将水平2方差拟合为处理顺序的函数,即顺序不同,试验结果在患者间的变异不同,实际上是在患者间变异中进一步分解出顺序的效应。模型3可表达为:
, http://www.100md.com
yij=β0+β1x1ij+β2x2ij+u0j+u1jx1ij+u3jδ3ij+eij
(3)
模型2与3均未拟合水平2随机系数间的协方差,其方差协方差结构为:
结果与分析
表1 模型1的拟合结果
估计值
标准误
, http://www.100md.com
固定部分β0
5.7140
0.2230
β1
1.3990
0.2364
β2
0.2563
0.2642
随机部分
水平2 σ2u0
, http://www.100md.com
2.2770
0.6280
水平1 σ2e0
8.3810
0.6829
-2log-likelihood
2108.34
模型固定部分参数估计值的假设检验可采用Walds检验,第k个参数的χ2值为[βk/SE(βk)]2,自由度为1。结果表明,A、B两种处理效应的差别具有统计学意义(χ2=35.02,P<0.005),而两个阶段效应的差别无统计学意义(χ2=0.94,P>0.25),故在模型2中进一步拟合处理效应在水平2患者间的随机变异(表2)。表2 模型2的拟合结果
, http://www.100md.com
估计值
标准误
固定部分β0
5.9760
0.1510
β1
1.4016
0.2340
β2
0.1624
0.1875
随机部分
, 百拇医药
水平2 σ2u0
2.0040
0.4936
σ2u1
12.9700
1.4160
水平1 σ2e0
2.1610
0.4931
-2log-likelihood
1964.02
, 百拇医药
从表2可见,处理效应在患者间存在较大的变异。模型随机部分参数估计值一般采用对数似然比检验,结果表明,处理间的差别在水平2患者间的随机变异具有统计学意义(χ2=144.32,P<0.005)。同时,水平1残差方差从模型1的8.3810下降为2.1610,提示水平1的患者内变异主要是由处理效应所至。表3 模型3的拟合结果
估计值
标准误
固定部分β0
6.0430
0.1354
β1
1.4210
, 百拇医药
0.2407
β2
0.1413
0.1826
随机部分
水平2 σ2u0
1.3760
0.5080
σ2u1
13.8400
1.4540
, 百拇医药
σ2u3
1.8880
0.6483
水平1 σ2e0
1.7450
0.4715
-2log-likelihood
1955.92
模型2和3的对数似然比检验结果表明,顺序效应具有统计学意义(χ2=8.10,P<0.005)。模型3随机部分的拟合结果表明,水平2总方差为x1ij和δ3ij的函数,即试验结果在患者间的总变异随着治疗方案和试验顺序的变化而变化。讨 论
, 百拇医药
残留效应通常指药物残留效应(drug carry—over effect)。此外,还有第一阶段用药导致耐药性而产生的撤退效应(withdrawal effect)、心理效应(psychological carry—over effect)、患者身体状况因用药而改变所导致的遗留效应(nonuniform carry -effect)等等〔4〕。如果设计合理,如两次试验之间间隔足够的时间以及严格遵循双盲法等,以上各种效应的影响很小,可采用通常的交叉设计方差分析或差数的方差分析、 t检验或秩和检验来分析处理、阶段以及个体的效应〔7〕。反之,则应考虑到残留效应及其对试验结果的潜在影响。
交叉设计数据的变异来源可分解为处理效应、阶段效应、顺序效应和个体变异。对顺序效应的分解及检验,常用的有方差分析,即以顺序效应的变异(均方)与同一顺序组内个体间变异(均方)之比计算检验统计量F〔5,9〕;另一种方法是所谓和数法,即将同一个体的两个效应相加,以AB和BA两个顺序作成组t检验或秩和检验〔3,8〕,这两种方法实质上是等价的。本资料采用方差分析表明,F值为10.52, P<0.01,顺序效应的差别有统计学意义;采用和数法亦表明了顺序效应的差别(t值为3.24, P<0.01)。在顺序效应存在时,对处理效应所作统计推断存在一定问题〔2〕,如采用上述的方差分析以及差数的方差分析等方法存在一定问题。因顺序效应仅存在于试验的第二阶段,故有文献提出采用成组t检验或秩和检验分析第一阶段数据〔8〕。这种方法将交叉设计作为成组设计进行分析,避免了顺序效应对处理效应的干扰,对处理效应所作的统计推断是无偏的,但只利用了全部数据一半的信息,所以检验效能较低〔2〕。本文对资料第一阶段数据所作的成组t检验表明, t值为1.72, P>0.05,处理效应无统计学意义。
, http://www.100md.com
多水平模型方法将顺序效应进一步从个体间变异中分解出来并检验有无统计学意义,同时也可得到处理和阶段效应的估计,基本的两水平模型(模型1)可分别得到处理、阶段固定效应的估计,以及个体随机效应的估计,在随机抽取受试对象的试验中,后者反映了受试对象总体的变异信息;随机系数模型(模型2)可拟合两种处理措施对每个受试对象的效应;模型3则将试验结果在受试对象间的总变异拟合为试验顺序以及处理措施的函数,同时,获得处理和阶段固定效应的估计。依此方法,可将多水平模型的应用扩展到多种处理或多个处理阶段,如常见的两种处理的两重交叉设计〔1〕。此外,水平1方差即个体内的变异尚包括了处理与阶段的效应,我们可进一步构造水平1复杂方差结构,将个体内变异分解为处理间变异和阶段间变异以及随机误差,另外在某些情况下,也可拟合水平1残差的自相关结构或时间序列模型〔1〕,此问题将另文讨论。
参考文献
1.Goldstein H.Multilevel Statistical Models.London:Edward Arnold,1995,94-95.
, 百拇医药
2.Senn SJ.The AB/BA crossover:past,present and future?Statistical Methods in Medical Research,1994,3:303.
3.Grizzle JE.The two-period change-over design and its use in clinical trials.Biometrics,1965,21:467.
4.Woods JR.The two-period crossover design in medical research.Annals of Internal Medicine,1989,110:560.
5.郭祖超.医用数理统计方法.第3版.北京:人民卫生出版社,1988,780-781.
6.杨树勤.中国医学百科全书*医学统计学分册.上海:上海科学技术出版社,1985.
7.倪宗瓒.医学统计学.第2版.北京:人民卫生出版社,1998,87-90.
8.谢隆化.交叉设计治疗试验的统计分析.中国卫生统计,1991,8(3):21.
9.苏炳华,何清波.交叉试验计量资料分析的SAS程序.中国卫生统计,1997,14(3):52., 百拇医药