CMH统计分析方法在多中心试验s×r表资料的应用
作者:史周华 俞戟 蔡雪亚 梁泉峰
单位:史周华 梁泉峰 山东中医药大学(250014); 俞戟 蔡雪亚 上海医科大学
关键词:
中国卫生统计990322 多中心试验中,有时试验的对象分为两组或两组以上,分别给予不同的处理,其结果作为反应变量不仅仅是二分类,也可能是多分类,且属性可能是有序的,也可能是无序的或名义的,这样构成分层的s×r列联表资料。多中心试验的2×2、2×r(列变量为有序变量)和s×2(行变量为有序变量)列联表资料是s×r列联表资料的特殊情况。本文阐述CMH统计分析方法在多中心(或分层)试验广义s×r列联表资料的应用。
CMH作为扩展的MH检验,从一定意义上讲,是一种概括统计方法,它在考虑多中心(或分层)试验混杂因素影响的前提下,根据s×r表格中行变量与列变量的属性不同,给出三种检验统计量。当行变量与列变量均为有序变量时,给出非零相关统计量(Nonzero Correlation);当行变量为无序变量而列变量为有序变量时,给出行平均秩分差异统计量(Row Mean Scores Differ),即方差分析统计量;当行变量与列变量均为无序变量或行变量是有序变量列变量为无序变量时,给出一般联系统计量(General Association)。
, 百拇医药
下面以简表形式表示第h试验中心(或第h层)的s×r表,h=1,2,…,q。q为层数,s为行数,r为列数。
表1 第h层s×r列联表 处理组
反应变量水平
1
2…
r
合计
1
nh11
nh12…
nh1r
, 百拇医药
nh1+
2
nh21
nh22…
nh2r
nh2+
, 百拇医药
s
nhs1
nhs2…
nhsr
nhs+
合计
nh+1
nh+2…
nh+r
nh
以向量形式表示,则有:n′h=(nh11,nh12,…,nh1r,…,nhs1,nhs2,…,nhsr)
, 百拇医药
依据重超几何分布的原理,在周边合计不变的情况下,H0成立时,向量nh的概率分布可以写成
这里nhij表示第h层第i行(组)第j列(反应变量水平)所对应的实际数,nhi+为第h层第i组合计数,i=1,2,…,s。nh+j为第h层第j列合计数,j=1,2,…,r。nh为第h层的合计数,Phi+=nhi+/nh,Ph+j=nh+j/nh,nhij的期望值为:
以向量形式表示,则有:
, 百拇医药
P′h*+=(Ph1+,Ph2+,…,Phs+)
P′h+*=(Ph+1,Ph+2,…,Ph+r)
nh的期望值及方差分别为:
这里,DPh+*是以向量Ph+*中元素作为主对角元素的对角阵,DPh*+是以向量Ph*+中元素作为主对角元素的对角阵,表示克罗内克积。这样,多中心(或分层)试验s×r表的CMH统计量为:
, 百拇医药
Ah是{nh-mh}的线性函数矩阵,它有如下三种情况:
(1)当CMH为一般联系统计量QGMH时:
Ah={[I(r-1),O(r-1)][I(s-1),O(s-1)]}
自由度v=(s-1)(r-1)
(2)当CMH为行平均秩分统计量QSMH时:
Ah=a′h[I(s-1),O(s-1)] 自由度v=s-1
, 百拇医药
(3)当CMH为非零相关统计量QCSMH时:
Ah=[a′hc′h]自由度v=1
这里,{ah}={ah1,ah2,…,ahr}为第h层第j列反应变量水平秩分矩阵(j=1,2,…,r);{ch}={ch1,ch2,…,chs}为第h层第i行变量水平秩分矩阵(i=1,2,…,s)。
需要说明的是:对多中心(或分层)试验s×r列联表资料的CMH统计量计算,涉及到矩阵知识,手工计算是很繁杂的,现在一般用计算机来实现。由于SAS软件(6.10版本以上较好)提供了CMH在此方面的应用程序,所以本文实例均用SAS程序来实现。
, 百拇医药
表1属于行变量与列变量均为有序变量的三个中心试验4×3列联表资料,SAS给出的CMH统计量应取非零相关统计量,采取整数评分法:QCSMH=12.627,v=1,P=0.001;采取修正Ridit评分法:QCSMH=12.840,v=1,P=0.001。说明病程与依沙酰胺疗效有相关关系,病程越短,其疗效越好。
表1 病程与依沙酰胺疗效的关系 试验中心
病 程
疗 效
合计
治愈
好转
无效
中心1
, 百拇医药
<1月
24
10
3
37
1~3月
10
4
2
16
3月~5年
35
26
10
, 百拇医药
71
>5年
10
8
4
22
中心2
<1月
25
12
3
40
1~3月
11
, http://www.100md.com
4
2
17
3月~5年
30
22
8
60
>5年
10
10
5
25
中心3
, http://www.100md.com
<1月
20
8
2
30
1~3月
10
4
1
15
3月~5年
20
17
5
, 百拇医药
42
>5年
12
10
6
28
表2属于行变量无序,列变量有序的三中心试验4×4列联表资料,SAS给出的CMH统计量应取行平均秩分差异统计量,采取整数评分法,QSMH=41.127,v=s-1=4-1=3,P=0.001;采取修正Ridit评分法,QSMH=41.891,v=s-1=3,P=0.001,说明该病A、B、C、D型与痰液中SB含量有关。
表2 患者病程与痰液中SB含量的关系 试验中心
, http://www.100md.com 病 型
嗜酸细胞含量
合计
-
+
++
+++
中心1
A型
0
2
9
6
17
, 百拇医药
B型
3
5
5
2
15
C型
5
7
3
2
17
D型
3
, 百拇医药
5
3
0
11
中心2
A型
1
3
7
5
16
B型
4
6
, http://www.100md.com
4
2
16
C型
5
9
3
2
19
D型
3
5
4
0
, 百拇医药
12
中心3
A型
0
3
10
7
20
B型
5
6
5
3
19
, http://www.100md.com
C型
7
9
4
2
22
D型
4
6
2
1
13
表3属于行变量与列变量均为无序变量的四中心试验4×3列联表资料,SAS给出的CMH统计量应取一般联系统计量,采取整数评分法,QGMH=0.643,v=(s-1)(r-1)=(4-1)(3-1)=6,P=0.423;采取修正Ridit评分法,QGMH=0.517,v=(s-1)(r-1)=6,P=0.472。说明两种血型划分系统之间互相独立,它们之间没有确定的倾向性。
, 百拇医药
表3 某地5 688人按2种血型划分的结果 研究中心
ABO
血型
MN血型
合计
M
N
MN
中心1
O
101
112
203
, http://www.100md.com
426
A
88
122
201
411
B
108
146
248
502
AB
23
, 百拇医药 36
64
123
中心2
O
87
122
192
401
A
90
125
194
409
, 百拇医药
B
112
146
229
487
AB
20
33
58
111
中心3
O
93
130
, 百拇医药
189
412
A
90
107
206
403
B
106
135
257
498
AB
, http://www.100md.com 25
32
46
103
中心4
O
98
111
211
420
A
90
115
212
, http://www.100md.com
417
B
113
132
231
476
AB
18
29
42
89
小 结
CMH统计分析方法在多中心试验s×r表资料的应用,需要根据行变量与列变量的属性特征,采用不同的统计量。当行变量与列变量均为有序变量时,采用非零相关统计量,自由度为1;当行变量为无序变量列变量为有序变量时,采用行平均秩分差异统计量(即方差分析统计量),自由度为s-1;当行变量与列变量均为无序变量或行变量是有序变量列变量为无序变量时,采用一般联系统计量,自由度为(s-1)(r-1)。P值取各自统计量相对应的P值。
, 百拇医药
参考文献
1.Maura E.Stokes,Categorical Data Analysis Using SAS System.North Carolina:SAS Institute Inc,1997,105~140.
2.金丕焕,苏炳华.临床试验设计与统计分析.上海:上海科学技术文献出版社,1997,44.
3.金丕焕.医用统计方法..上海:上海医科大学出版社,1993,170~177.
4.胡良平.现代统计学与SAS应用.北京:军事医学科学出版社,1996:164~190,191~197.
5.倪宗瓒.医学统计学.北京:人民卫生出版社,1990,19~21.
6.高惠璇.SAS/STAT软件使用手册.北京:中国统计出版社,1997,394~400., http://www.100md.com
单位:史周华 梁泉峰 山东中医药大学(250014); 俞戟 蔡雪亚 上海医科大学
关键词:
中国卫生统计990322 多中心试验中,有时试验的对象分为两组或两组以上,分别给予不同的处理,其结果作为反应变量不仅仅是二分类,也可能是多分类,且属性可能是有序的,也可能是无序的或名义的,这样构成分层的s×r列联表资料。多中心试验的2×2、2×r(列变量为有序变量)和s×2(行变量为有序变量)列联表资料是s×r列联表资料的特殊情况。本文阐述CMH统计分析方法在多中心(或分层)试验广义s×r列联表资料的应用。
CMH作为扩展的MH检验,从一定意义上讲,是一种概括统计方法,它在考虑多中心(或分层)试验混杂因素影响的前提下,根据s×r表格中行变量与列变量的属性不同,给出三种检验统计量。当行变量与列变量均为有序变量时,给出非零相关统计量(Nonzero Correlation);当行变量为无序变量而列变量为有序变量时,给出行平均秩分差异统计量(Row Mean Scores Differ),即方差分析统计量;当行变量与列变量均为无序变量或行变量是有序变量列变量为无序变量时,给出一般联系统计量(General Association)。
, 百拇医药
下面以简表形式表示第h试验中心(或第h层)的s×r表,h=1,2,…,q。q为层数,s为行数,r为列数。
表1 第h层s×r列联表 处理组
反应变量水平
1
2…
r
合计
1
nh11
nh12…
nh1r
, 百拇医药
nh1+
2
nh21
nh22…
nh2r
nh2+
, 百拇医药
s
nhs1
nhs2…
nhsr
nhs+
合计
nh+1
nh+2…
nh+r
nh
以向量形式表示,则有:n′h=(nh11,nh12,…,nh1r,…,nhs1,nhs2,…,nhsr)
, 百拇医药
依据重超几何分布的原理,在周边合计不变的情况下,H0成立时,向量nh的概率分布可以写成
这里nhij表示第h层第i行(组)第j列(反应变量水平)所对应的实际数,nhi+为第h层第i组合计数,i=1,2,…,s。nh+j为第h层第j列合计数,j=1,2,…,r。nh为第h层的合计数,Phi+=nhi+/nh,Ph+j=nh+j/nh,nhij的期望值为:
以向量形式表示,则有:
, 百拇医药
P′h*+=(Ph1+,Ph2+,…,Phs+)
P′h+*=(Ph+1,Ph+2,…,Ph+r)
nh的期望值及方差分别为:
这里,DPh+*是以向量Ph+*中元素作为主对角元素的对角阵,DPh*+是以向量Ph*+中元素作为主对角元素的对角阵,表示克罗内克积。这样,多中心(或分层)试验s×r表的CMH统计量为:
, 百拇医药
Ah是{nh-mh}的线性函数矩阵,它有如下三种情况:
(1)当CMH为一般联系统计量QGMH时:
Ah={[I(r-1),O(r-1)][I(s-1),O(s-1)]}
自由度v=(s-1)(r-1)
(2)当CMH为行平均秩分统计量QSMH时:
Ah=a′h[I(s-1),O(s-1)] 自由度v=s-1
, 百拇医药
(3)当CMH为非零相关统计量QCSMH时:
Ah=[a′hc′h]自由度v=1
这里,{ah}={ah1,ah2,…,ahr}为第h层第j列反应变量水平秩分矩阵(j=1,2,…,r);{ch}={ch1,ch2,…,chs}为第h层第i行变量水平秩分矩阵(i=1,2,…,s)。
需要说明的是:对多中心(或分层)试验s×r列联表资料的CMH统计量计算,涉及到矩阵知识,手工计算是很繁杂的,现在一般用计算机来实现。由于SAS软件(6.10版本以上较好)提供了CMH在此方面的应用程序,所以本文实例均用SAS程序来实现。
, 百拇医药
表1属于行变量与列变量均为有序变量的三个中心试验4×3列联表资料,SAS给出的CMH统计量应取非零相关统计量,采取整数评分法:QCSMH=12.627,v=1,P=0.001;采取修正Ridit评分法:QCSMH=12.840,v=1,P=0.001。说明病程与依沙酰胺疗效有相关关系,病程越短,其疗效越好。
表1 病程与依沙酰胺疗效的关系 试验中心
病 程
疗 效
合计
治愈
好转
无效
中心1
, 百拇医药
<1月
24
10
3
37
1~3月
10
4
2
16
3月~5年
35
26
10
, 百拇医药
71
>5年
10
8
4
22
中心2
<1月
25
12
3
40
1~3月
11
, http://www.100md.com
4
2
17
3月~5年
30
22
8
60
>5年
10
10
5
25
中心3
, http://www.100md.com
<1月
20
8
2
30
1~3月
10
4
1
15
3月~5年
20
17
5
, 百拇医药
42
>5年
12
10
6
28
表2属于行变量无序,列变量有序的三中心试验4×4列联表资料,SAS给出的CMH统计量应取行平均秩分差异统计量,采取整数评分法,QSMH=41.127,v=s-1=4-1=3,P=0.001;采取修正Ridit评分法,QSMH=41.891,v=s-1=3,P=0.001,说明该病A、B、C、D型与痰液中SB含量有关。
表2 患者病程与痰液中SB含量的关系 试验中心
, http://www.100md.com 病 型
嗜酸细胞含量
合计
-
+
++
+++
中心1
A型
0
2
9
6
17
, 百拇医药
B型
3
5
5
2
15
C型
5
7
3
2
17
D型
3
, 百拇医药
5
3
0
11
中心2
A型
1
3
7
5
16
B型
4
6
, http://www.100md.com
4
2
16
C型
5
9
3
2
19
D型
3
5
4
0
, 百拇医药
12
中心3
A型
0
3
10
7
20
B型
5
6
5
3
19
, http://www.100md.com
C型
7
9
4
2
22
D型
4
6
2
1
13
表3属于行变量与列变量均为无序变量的四中心试验4×3列联表资料,SAS给出的CMH统计量应取一般联系统计量,采取整数评分法,QGMH=0.643,v=(s-1)(r-1)=(4-1)(3-1)=6,P=0.423;采取修正Ridit评分法,QGMH=0.517,v=(s-1)(r-1)=6,P=0.472。说明两种血型划分系统之间互相独立,它们之间没有确定的倾向性。
, 百拇医药
表3 某地5 688人按2种血型划分的结果 研究中心
ABO
血型
MN血型
合计
M
N
MN
中心1
O
101
112
203
, http://www.100md.com
426
A
88
122
201
411
B
108
146
248
502
AB
23
, 百拇医药 36
64
123
中心2
O
87
122
192
401
A
90
125
194
409
, 百拇医药
B
112
146
229
487
AB
20
33
58
111
中心3
O
93
130
, 百拇医药
189
412
A
90
107
206
403
B
106
135
257
498
AB
, http://www.100md.com 25
32
46
103
中心4
O
98
111
211
420
A
90
115
212
, http://www.100md.com
417
B
113
132
231
476
AB
18
29
42
89
小 结
CMH统计分析方法在多中心试验s×r表资料的应用,需要根据行变量与列变量的属性特征,采用不同的统计量。当行变量与列变量均为有序变量时,采用非零相关统计量,自由度为1;当行变量为无序变量列变量为有序变量时,采用行平均秩分差异统计量(即方差分析统计量),自由度为s-1;当行变量与列变量均为无序变量或行变量是有序变量列变量为无序变量时,采用一般联系统计量,自由度为(s-1)(r-1)。P值取各自统计量相对应的P值。
, 百拇医药
参考文献
1.Maura E.Stokes,Categorical Data Analysis Using SAS System.North Carolina:SAS Institute Inc,1997,105~140.
2.金丕焕,苏炳华.临床试验设计与统计分析.上海:上海科学技术文献出版社,1997,44.
3.金丕焕.医用统计方法..上海:上海医科大学出版社,1993,170~177.
4.胡良平.现代统计学与SAS应用.北京:军事医学科学出版社,1996:164~190,191~197.
5.倪宗瓒.医学统计学.北京:人民卫生出版社,1990,19~21.
6.高惠璇.SAS/STAT软件使用手册.北京:中国统计出版社,1997,394~400., http://www.100md.com