随机效应Logistic回归模型在致畸研究中的应用
作者:孟虹 张天宝
单位:孟 虹 (第二军医大学卫生统计学教研室 上海 200433); 张天宝 (第二军医大学卫生毒理学教研室)
关键词:
卫生毒理学杂志990120 1.问题的提出
在致畸试验研究资料中,传统的统计方法是以各处理组中孕鼠的仔鼠为观察单位,用统计学中两个率的u检验或χ2检验分析各组胎鼠死亡率或致畸率等有无差别,评价受试物有无毒作用。这种统计处理忽视了一个可能的影响因素,即窝别效应(litermata effects)。由于窝别效应的存在,各比较组仔鼠间发生毒作用的概率不完全相互独立。从统计学角度认为,这类资料的数据不服从二项分布(该分布要求各个观察单位是否发生某事件应相互独立)。由于窝别效应作用和用仔鼠作为观察单位,人为增大样本例数,会低估两率差的标准误(率的U检验),得到较大的u值或χ2值,增大了犯1型误差(即假阳性)的概率。因此,近年来一些统计学家和毒理学家认为对类似资料作统计学处理时,应考虑窝别效应对结果的影响[1,2],在扣除窝别效应的前提下,比较组间的差别,才能更真实的反映受试物的毒作用。随机效应(random effect) logistic回归模型可克服传统方法的不足,适用于结果变量为两分类且以窝别(litter)为处理单位的资料。
, http://www.100md.com
2.随机效应logistic回归模型的基本原理
随机效应Logistic回归是logistic回归模型的扩展。如以致畸试验资料为例,它假定各处理组(i=1,2,3…k组)有各自发生毒性事件的平均率,记为pi,第i个处理组中的第j只孕鼠发生毒性事件的发生率为毒作用和窝别作用之和,即为pij=pi+vij,则vij为第i组第j只孕鼠的窝别效应概率,也称为随机效应。第i组中发生某事件的平均发生率pi与各孕鼠发生某事件发生率及窝别效应的关系如下:
由于各孕鼠窝别效应的发生率是不同的,其变异分布即随机效应发生率的分布可能是服从平均发生率的均数为μ,标准差为σ的正态分布或是β-二项分布等。其在实验中变异的大小可以用标准差(σ)描述。随机效应logistic回归模型用下式中公式1表示:随机效应logistic回归模型logit(p)=α+βX+σ (公式1)
, 百拇医药
一般logistic回归模型
logit(p)=α+βX (公式2)
公式1中σ为随机效应参数,通过拟合两模型并检验假设:H0:σ=0(假设不存在随机效应的变异),H1:σ>0(存在随机效应的变异),当σ>0时,说明发生率存在窝别效应;当σ=0(即经统计检验无显著性),说明窝别效应不存在,则上述模型就为一般的logistic回归模型[3]。随机效应logistic回归模型拟合的过程与一般logistic回归模型的拟合基本相同,不同之处是在方程中考虑了随机效应参数σ。随机效应模型的计算较复杂,一般通过计算机来完成。
3.应用实例
为评价五氧化二钒对大鼠致畸等发育毒性,用不同剂量对孕鼠进行染毒后,观察了对胚胎/胎儿的致死情况(表1)。
, http://www.100md.com
表1 不同剂量的五氧化二钒对大鼠胚胎/胎儿致死性的比较 剂量组
(mg/kg)
孕鼠
窝数
仔鼠
总数
死胎+吸收
胎数
死胎+吸收
胎数率(%)
0
12
126
, 百拇医药
8
6.20
0.33
15
176
32*
18.18**
1.0
12
124
20
16.13**
, http://www.100md.com
3.0
13
160
29
18.13**
与对照组比较**P<0.01
用χ2检验,表1中各剂量组与对照组比较,P<0.01均有显著性。结论为各组毒性作用的发生率均高于对照组。但本资料中0.33mg/kg剂量组中的第3号孕鼠着床仔鼠数10个,其中9个死胎;第5号孕鼠着床仔鼠数15个,吸收胎4个,死胎11个,这两只孕鼠结果使该组的死胎+吸收胎率达18.18%,发生率高于后两个高剂量组,结论不好解释。这可能是毒物的作用,也可能是母体自身的作用(即窝别效应)。
用剂量组作为分类变量(x=0,1,2,3),各组每一孕鼠的仔鼠数即窝大小(n)为观察单位数,各孕鼠的死胎+吸收胎数为Y变量,用EGRET软件的随机效应logistic回归模型对上述资料处理结果如下:
, http://www.100md.com
用随机效应logistic回归模型做拟合时,先对各组孕鼠是否存在着窝别效应做检验,即检验模型中是否存在窝别效应,先拟合随机效应logistic回归模型与logistic回归模型做比较,即拟合两模型中有随机效应参数和无随机效应参数的差值,本例中随机效应logistic回归模型的差值(Dμ.β.σ)=97.897,一般的logistic回归模型差值(Dμ.β)=123.393,通过比较上述两个模型,做似然比检验得χ2=123.393-97.897=25.496,P<0.001,有统计学意义,即随机效应回归模型中的参数σ>0,表示本资料各组的孕鼠间存在着窝别效应。
表2结果是各剂量组在随机效应logistic回归模型下的回归系数及OR和P值,由该系数可见,五氧化二钒剂量与致死反应参数(OR值)之间存在着剂量-反应关系,即死胎+吸收胎发生率随剂量增加而增加。考虑窝别作用后,在α=0.05水准上,1.0mg/kg和3.0mg/kg两个剂量组与对照组的死胎和吸收胎的发生率间差别有显著性,P<0.05,其发生率是对照组的4.7倍以上,而0.33mg/kg剂量组与对照组的发生率间无统计学意义。说明0.33mg/kg组的胎鼠的毒作用发生率有部分是窝别(母体)的作用。
, 百拇医药
表2 随机效应logistic回归模型计算结果 剂量组
(mg/kg)
回归系数
s
P
OR值
0
-3.460
0.649
<0.001
0.33
, 百拇医药
0.4868
0.772
0.528
1.627
1.0
1.550
0.792
0.05
4.713
3.0
1.574
0.774
0.042
, 百拇医药
4.825
随机效应
(窝别作用)
2.104
0.285
小 结
随机效应logistic回归模型是近年发展起来的一种用于比较以窝别为观察单位且结果为两项分类变量的统计方法,适用于毒理试验中致畸试验、发育毒性试验、显性致死试验及观察生殖后果的生殖毒性试验资料的分析。该方法的优点是:
1.检验资料是否存在窝别效应对结果的影响,可在考虑窝别效应的情况下比较两组或多组率间的差别;降低了统计结论中犯假阳性错误的概率。
2.该模型同时可以控制一个或多个混杂因素对处理作用的影响。
, 百拇医药
3.通过比较各组回归系数的OR值,可估计各处理组与对照组比较的相对危险度。
参考文献
1.Piegorsch WW,Haseman JK.Statistical methods for analyzing developmental toxicity data.Teratog Carcinog Mutagenesis,1991,11:15
2.Kupper LL,Portier C.The impact of litter effects on dose-response modeling in teratology.Biometrics,1986;42:85.
3.Kupper LL,Haseman JK.The use of a correlated binomial models for analysis of certain toxicological experiments.Biometrics,1978,34:69
(修回日期 1998年5月), 百拇医药
单位:孟 虹 (第二军医大学卫生统计学教研室 上海 200433); 张天宝 (第二军医大学卫生毒理学教研室)
关键词:
卫生毒理学杂志990120 1.问题的提出
在致畸试验研究资料中,传统的统计方法是以各处理组中孕鼠的仔鼠为观察单位,用统计学中两个率的u检验或χ2检验分析各组胎鼠死亡率或致畸率等有无差别,评价受试物有无毒作用。这种统计处理忽视了一个可能的影响因素,即窝别效应(litermata effects)。由于窝别效应的存在,各比较组仔鼠间发生毒作用的概率不完全相互独立。从统计学角度认为,这类资料的数据不服从二项分布(该分布要求各个观察单位是否发生某事件应相互独立)。由于窝别效应作用和用仔鼠作为观察单位,人为增大样本例数,会低估两率差的标准误(率的U检验),得到较大的u值或χ2值,增大了犯1型误差(即假阳性)的概率。因此,近年来一些统计学家和毒理学家认为对类似资料作统计学处理时,应考虑窝别效应对结果的影响[1,2],在扣除窝别效应的前提下,比较组间的差别,才能更真实的反映受试物的毒作用。随机效应(random effect) logistic回归模型可克服传统方法的不足,适用于结果变量为两分类且以窝别(litter)为处理单位的资料。
, http://www.100md.com
2.随机效应logistic回归模型的基本原理
随机效应Logistic回归是logistic回归模型的扩展。如以致畸试验资料为例,它假定各处理组(i=1,2,3…k组)有各自发生毒性事件的平均率,记为pi,第i个处理组中的第j只孕鼠发生毒性事件的发生率为毒作用和窝别作用之和,即为pij=pi+vij,则vij为第i组第j只孕鼠的窝别效应概率,也称为随机效应。第i组中发生某事件的平均发生率pi与各孕鼠发生某事件发生率及窝别效应的关系如下:
由于各孕鼠窝别效应的发生率是不同的,其变异分布即随机效应发生率的分布可能是服从平均发生率的均数为μ,标准差为σ的正态分布或是β-二项分布等。其在实验中变异的大小可以用标准差(σ)描述。随机效应logistic回归模型用下式中公式1表示:随机效应logistic回归模型logit(p)=α+βX+σ (公式1)
, 百拇医药
一般logistic回归模型
logit(p)=α+βX (公式2)
公式1中σ为随机效应参数,通过拟合两模型并检验假设:H0:σ=0(假设不存在随机效应的变异),H1:σ>0(存在随机效应的变异),当σ>0时,说明发生率存在窝别效应;当σ=0(即经统计检验无显著性),说明窝别效应不存在,则上述模型就为一般的logistic回归模型[3]。随机效应logistic回归模型拟合的过程与一般logistic回归模型的拟合基本相同,不同之处是在方程中考虑了随机效应参数σ。随机效应模型的计算较复杂,一般通过计算机来完成。
3.应用实例
为评价五氧化二钒对大鼠致畸等发育毒性,用不同剂量对孕鼠进行染毒后,观察了对胚胎/胎儿的致死情况(表1)。
, http://www.100md.com
表1 不同剂量的五氧化二钒对大鼠胚胎/胎儿致死性的比较 剂量组
(mg/kg)
孕鼠
窝数
仔鼠
总数
死胎+吸收
胎数
死胎+吸收
胎数率(%)
0
12
126
, 百拇医药
8
6.20
0.33
15
176
32*
18.18**
1.0
12
124
20
16.13**
, http://www.100md.com
3.0
13
160
29
18.13**
与对照组比较**P<0.01
用χ2检验,表1中各剂量组与对照组比较,P<0.01均有显著性。结论为各组毒性作用的发生率均高于对照组。但本资料中0.33mg/kg剂量组中的第3号孕鼠着床仔鼠数10个,其中9个死胎;第5号孕鼠着床仔鼠数15个,吸收胎4个,死胎11个,这两只孕鼠结果使该组的死胎+吸收胎率达18.18%,发生率高于后两个高剂量组,结论不好解释。这可能是毒物的作用,也可能是母体自身的作用(即窝别效应)。
用剂量组作为分类变量(x=0,1,2,3),各组每一孕鼠的仔鼠数即窝大小(n)为观察单位数,各孕鼠的死胎+吸收胎数为Y变量,用EGRET软件的随机效应logistic回归模型对上述资料处理结果如下:
, http://www.100md.com
用随机效应logistic回归模型做拟合时,先对各组孕鼠是否存在着窝别效应做检验,即检验模型中是否存在窝别效应,先拟合随机效应logistic回归模型与logistic回归模型做比较,即拟合两模型中有随机效应参数和无随机效应参数的差值,本例中随机效应logistic回归模型的差值(Dμ.β.σ)=97.897,一般的logistic回归模型差值(Dμ.β)=123.393,通过比较上述两个模型,做似然比检验得χ2=123.393-97.897=25.496,P<0.001,有统计学意义,即随机效应回归模型中的参数σ>0,表示本资料各组的孕鼠间存在着窝别效应。
表2结果是各剂量组在随机效应logistic回归模型下的回归系数及OR和P值,由该系数可见,五氧化二钒剂量与致死反应参数(OR值)之间存在着剂量-反应关系,即死胎+吸收胎发生率随剂量增加而增加。考虑窝别作用后,在α=0.05水准上,1.0mg/kg和3.0mg/kg两个剂量组与对照组的死胎和吸收胎的发生率间差别有显著性,P<0.05,其发生率是对照组的4.7倍以上,而0.33mg/kg剂量组与对照组的发生率间无统计学意义。说明0.33mg/kg组的胎鼠的毒作用发生率有部分是窝别(母体)的作用。
, 百拇医药
表2 随机效应logistic回归模型计算结果 剂量组
(mg/kg)
回归系数
s
P
OR值
0
-3.460
0.649
<0.001
0.33
, 百拇医药
0.4868
0.772
0.528
1.627
1.0
1.550
0.792
0.05
4.713
3.0
1.574
0.774
0.042
, 百拇医药
4.825
随机效应
(窝别作用)
2.104
0.285
小 结
随机效应logistic回归模型是近年发展起来的一种用于比较以窝别为观察单位且结果为两项分类变量的统计方法,适用于毒理试验中致畸试验、发育毒性试验、显性致死试验及观察生殖后果的生殖毒性试验资料的分析。该方法的优点是:
1.检验资料是否存在窝别效应对结果的影响,可在考虑窝别效应的情况下比较两组或多组率间的差别;降低了统计结论中犯假阳性错误的概率。
2.该模型同时可以控制一个或多个混杂因素对处理作用的影响。
, 百拇医药
3.通过比较各组回归系数的OR值,可估计各处理组与对照组比较的相对危险度。
参考文献
1.Piegorsch WW,Haseman JK.Statistical methods for analyzing developmental toxicity data.Teratog Carcinog Mutagenesis,1991,11:15
2.Kupper LL,Portier C.The impact of litter effects on dose-response modeling in teratology.Biometrics,1986;42:85.
3.Kupper LL,Haseman JK.The use of a correlated binomial models for analysis of certain toxicological experiments.Biometrics,1978,34:69
(修回日期 1998年5月), 百拇医药