正确理解和引用统计分析软件中确切概率的计算结果
作者:杨永生
单位:苏州医学院卫生统计教研室,苏州,215007
关键词:四格表;确切概率
苏州医学院学报990924 摘要 对不同统计分析软件确切概率的计算方法与结果进行了讨论,正确理解与引用其计算结果的重要性。
中图法分类 R195.1
Correct Understanding of the Results of Exact Probability Calculated with Statistical Program Packages and Quoting from Them
Yang Yongsheng
, 百拇医药 (Division of Health Statistics,Suzhou Medical College,Suzhou,215007)
Abstract Calculating methods of exact probability with diverse statistical program packages and their results have been discussed in order to explain the importance of correct understanding of and quoting from them.
Key words fourfole table;exact probability
在无序分类的四格表资料假设检验工作中,经常需要计算确切概率。一般的四格表数据结构可表示为:
, 百拇医药
(+)
(-)
甲法
a
b
a+b
p1=a/(a+b)
乙法
c
d
c+d
p2=c/(c+d)
a+c
, 百拇医药
b+d
n=a+b+c+d
计算确切概率的基本步骤为:
(1)固定边缘合计,改变a,b,c,d四个值构造出边缘合计中最小数+1个可能的四格表;
(2)根据专业需要确定的单双侧及备选假设H1,从上述构造出的四格表中选出|A-T|值(或|p1-p2|值)大于等于实际观测到的样本的|A-T|值(或|p1-p2|值)的四格表,对选出的每个四格表按下式计算pi值:
(3)将所有得到的pi值相加即为确切概率P值。
, 百拇医药
现常用统计分析软件来进行上述的计算。统计分析软件种类繁多,对给出的计算结果必须正确理解和引用。
例:甲乙两种疗法对某病的治疗结果如下:
有效
无效
有效率
甲法
33
11
44
p1=75.0
乙法
4
, 百拇医药
6
10
p2=40.0
37
17
54
p1-p2=35.0
|A-T|=2.852
本例可构造出10+1=11个四格表,结果如下: 构造出的四格表
p1(%)
p2(%)
, 百拇医药
p1-p2(%)
|A-T|
pi
(1)
37
7
84.1
0.0
84.1
6.852
0.00000
0
, 百拇医药
10
(2)
36
8
81.8
10.0
71.8
5.852
0.00004
1
9
(3)
35
, 百拇医药
9
79.5
20.0
59.5
4.852
0.00068
2
8
(4)
34
10
77.3
30.0
, 百拇医药
47.3
3.852
0.00631
3
7
(5)
33
11
75.0
40.0
35.0
2.852
0.03416
, http://www.100md.com
4
6
(6)
32
12
72.7
50.0
22.7
1.852
0.11271
5
5
(7)
, 百拇医药
31
13
70.5
60.6
10.5
0.852
0.23121
6
4
(8)
30
14
68.2
, 百拇医药
70.0
-1.8
0.148
0.29255
7
3
(9)
29
15
65.9
80.0
-14.1
1.148
, 百拇医药
0.21941
8
2
(10)
28
16
63.6
90.0
-26.4
2.148
0.08837
9
1
, http://www.100md.com
(11)
27
17
61.4
100.0
-38.6
3.148
0.01456
10
0
在进行双侧检验时,H0:甲乙两法有效率相同,即π1=π2;H1:甲乙两法有效率不同,即π1≠π2;α=0.05。符合要求的四格表(1)、(2)、(3)、(4)、(5)、(11),P=0.056。按α=0.05水准不拒绝H0,尚不能认为甲乙两法有效率不同。此时,国产统计分析软件PEMS、SDAS与国外统计分析软件SAS、SPSS、STATISTICA、EpiInfo均给出同样分析结果,仅在小数点保留位数上有所差别。但在SAS软件中其步骤(2)的实现是在所有构造出的四格表中,选出Pi小于等于实际观测所得到的四格表的P值的那些四格表Pi值之和来求得的。本例中符合要求的四格表亦为(1)、(2)、(3)、(4)、(5)、(11)。
, 百拇医药
在进行单侧检验时,H0:甲乙两法有效率相同,即π1=π2;H1:甲法有效率高于乙法,即π1>π2;α=0.05。符合要求的四格表为(1)、(2)、(3)、(4)、(5),P=0.041。按α=0.05水准拒绝H0,可认为甲法有效率高于乙法。此时,国产统计分析软件PEMS与国外统计分析软件SPSS、STATISTICA、EpiInfo除在小数点保留位数上有所差别外均给出同样分析结果。它们都按实际给定的样本提供的有利于H1的信息方向自动选择相应的四格表进行计算。此时应从专业知识审核H1的合理性。国产统计分析软件SDAS不具备计算单侧概率的功能。特别需要注意的是国外统计分析软件SAS给出的分析结果要由使用者来判断选择,其结果为:
Prob
Fisher's Exact Test(Left) 0.993
, 百拇医药
(Right) 0.041
(2-Tail) 0.056
其中Left的概率表示从实际观测的四格表开始向第一行第一列的取值减少方向的所有构造出的四格表的概率之和,本例为表(5)、(6)、(7)、(8)、(9)、(10)、(11)的概率之和0.993;Right的概率表示从实际观测的四格表开始向第一行第一列的取值增大方向的所有构造出的四格表的概率之和,本例为表(5)、(4)、(3)、(2)、(1)的概率之和0.041。因此,必须按照H1正确选用左右方向的单侧概率,这是要特别加以注意的。本例应选Right的概率0.041。
在进行单侧检验时还要特别注意H1与所观测结果的一致性,若不一致时应认真核查,否则应进行双侧检验为宜。
参考文献
1 杨树勤,主编.中国医学百科全书医学统计学.上海∶上海科学技术出版社,1985∶96~97
2 胡良平,主编.现代统计学与SAS应用.北京∶军事医学科学出版社,1996∶157~159
(1999年5月6日收稿), http://www.100md.com
单位:苏州医学院卫生统计教研室,苏州,215007
关键词:四格表;确切概率
苏州医学院学报990924 摘要 对不同统计分析软件确切概率的计算方法与结果进行了讨论,正确理解与引用其计算结果的重要性。
中图法分类 R195.1
Correct Understanding of the Results of Exact Probability Calculated with Statistical Program Packages and Quoting from Them
Yang Yongsheng
, 百拇医药 (Division of Health Statistics,Suzhou Medical College,Suzhou,215007)
Abstract Calculating methods of exact probability with diverse statistical program packages and their results have been discussed in order to explain the importance of correct understanding of and quoting from them.
Key words fourfole table;exact probability
在无序分类的四格表资料假设检验工作中,经常需要计算确切概率。一般的四格表数据结构可表示为:
, 百拇医药
(+)
(-)
甲法
a
b
a+b
p1=a/(a+b)
乙法
c
d
c+d
p2=c/(c+d)
a+c
, 百拇医药
b+d
n=a+b+c+d
计算确切概率的基本步骤为:
(1)固定边缘合计,改变a,b,c,d四个值构造出边缘合计中最小数+1个可能的四格表;
(2)根据专业需要确定的单双侧及备选假设H1,从上述构造出的四格表中选出|A-T|值(或|p1-p2|值)大于等于实际观测到的样本的|A-T|值(或|p1-p2|值)的四格表,对选出的每个四格表按下式计算pi值:
(3)将所有得到的pi值相加即为确切概率P值。
, 百拇医药
现常用统计分析软件来进行上述的计算。统计分析软件种类繁多,对给出的计算结果必须正确理解和引用。
例:甲乙两种疗法对某病的治疗结果如下:
有效
无效
有效率
甲法
33
11
44
p1=75.0
乙法
4
, 百拇医药
6
10
p2=40.0
37
17
54
p1-p2=35.0
|A-T|=2.852
本例可构造出10+1=11个四格表,结果如下: 构造出的四格表
p1(%)
p2(%)
, 百拇医药
p1-p2(%)
|A-T|
pi
(1)
37
7
84.1
0.0
84.1
6.852
0.00000
0
, 百拇医药
10
(2)
36
8
81.8
10.0
71.8
5.852
0.00004
1
9
(3)
35
, 百拇医药
9
79.5
20.0
59.5
4.852
0.00068
2
8
(4)
34
10
77.3
30.0
, 百拇医药
47.3
3.852
0.00631
3
7
(5)
33
11
75.0
40.0
35.0
2.852
0.03416
, http://www.100md.com
4
6
(6)
32
12
72.7
50.0
22.7
1.852
0.11271
5
5
(7)
, 百拇医药
31
13
70.5
60.6
10.5
0.852
0.23121
6
4
(8)
30
14
68.2
, 百拇医药
70.0
-1.8
0.148
0.29255
7
3
(9)
29
15
65.9
80.0
-14.1
1.148
, 百拇医药
0.21941
8
2
(10)
28
16
63.6
90.0
-26.4
2.148
0.08837
9
1
, http://www.100md.com
(11)
27
17
61.4
100.0
-38.6
3.148
0.01456
10
0
在进行双侧检验时,H0:甲乙两法有效率相同,即π1=π2;H1:甲乙两法有效率不同,即π1≠π2;α=0.05。符合要求的四格表(1)、(2)、(3)、(4)、(5)、(11),P=0.056。按α=0.05水准不拒绝H0,尚不能认为甲乙两法有效率不同。此时,国产统计分析软件PEMS、SDAS与国外统计分析软件SAS、SPSS、STATISTICA、EpiInfo均给出同样分析结果,仅在小数点保留位数上有所差别。但在SAS软件中其步骤(2)的实现是在所有构造出的四格表中,选出Pi小于等于实际观测所得到的四格表的P值的那些四格表Pi值之和来求得的。本例中符合要求的四格表亦为(1)、(2)、(3)、(4)、(5)、(11)。
, 百拇医药
在进行单侧检验时,H0:甲乙两法有效率相同,即π1=π2;H1:甲法有效率高于乙法,即π1>π2;α=0.05。符合要求的四格表为(1)、(2)、(3)、(4)、(5),P=0.041。按α=0.05水准拒绝H0,可认为甲法有效率高于乙法。此时,国产统计分析软件PEMS与国外统计分析软件SPSS、STATISTICA、EpiInfo除在小数点保留位数上有所差别外均给出同样分析结果。它们都按实际给定的样本提供的有利于H1的信息方向自动选择相应的四格表进行计算。此时应从专业知识审核H1的合理性。国产统计分析软件SDAS不具备计算单侧概率的功能。特别需要注意的是国外统计分析软件SAS给出的分析结果要由使用者来判断选择,其结果为:
Prob
Fisher's Exact Test(Left) 0.993
, 百拇医药
(Right) 0.041
(2-Tail) 0.056
其中Left的概率表示从实际观测的四格表开始向第一行第一列的取值减少方向的所有构造出的四格表的概率之和,本例为表(5)、(6)、(7)、(8)、(9)、(10)、(11)的概率之和0.993;Right的概率表示从实际观测的四格表开始向第一行第一列的取值增大方向的所有构造出的四格表的概率之和,本例为表(5)、(4)、(3)、(2)、(1)的概率之和0.041。因此,必须按照H1正确选用左右方向的单侧概率,这是要特别加以注意的。本例应选Right的概率0.041。
在进行单侧检验时还要特别注意H1与所观测结果的一致性,若不一致时应认真核查,否则应进行双侧检验为宜。
参考文献
1 杨树勤,主编.中国医学百科全书医学统计学.上海∶上海科学技术出版社,1985∶96~97
2 胡良平,主编.现代统计学与SAS应用.北京∶军事医学科学出版社,1996∶157~159
(1999年5月6日收稿), http://www.100md.com