一种实用的显著性检验法——中位数检验
作者:成军 孙关忠 李早荣
单位:成军(南京军区医学检验质控中心、解放军第117医院 杭州310013);孙关忠(南京军区医学检验质控中心、解放军第117医院 杭州310013);李早荣(南京军区医学检验质控中心、解放军第117医院 杭州310013)
关键词:中位数;显著性检验;统计推断;χ2检验
数理医药学杂志000323
摘 要 建立了一种实用的统计学显著性检验方法中位数检验,该方法依据统计推断的基本思想将样本资料转化为构成比或率来进行χ2显著性检验。结果显示,该法可以应用于多种总体分布或总体分布不明确的资料,尤其适用于某些不能用变量变换法进行数据处理使其转化为某一有标准理论的分布或近似该分布的资料(如正态分布的计量资料)。
, 百拇医药 中图分类号:R 195.1 文献标识码:A
文章编号:1004-4337(2000)03-0226-02
在进行医学研究时,由于受样本个体差异、病例分布的不确定性以及方法学的局限性等客观条件的限制,所收集到的资料往往不尽人意,这时我们就要借助于统计学手段来处理数据。统计学处理的目的是:①对所研究的对象作出统计描述(如均数、标准差、百分位数、频数分布表等);②通过所研究的对象(样本)来对该对象所在的群体(总体)作出统计推断,即显著性检验。然而这些检验方法的应用常有一个关于总体分布的前提,例如t检验法要求总体分布为正态分布、F分析要求方差齐性等,如果与正态分布相差太大则该方法就不适用。而在实际工作中的确有许多资料不符合这些条件,有时我们可以用变量变换的方法(如用对数转换等)将其转换为正态或近似正态分布来采用相应的方法,但有些资料没有适合的转换方法,或者有时其总体分布不能确定,这时则需要应用一种不必依赖某一专门的总体分布的统计方法中位数检验法[1]。本文旨在将这一方法作一介绍,并结合实例进行述评性的讨论,以给同行在应用时提供参考。
, 百拇医药
1 中位数检验法的基本思想及计算步骤
1.1 基本思想
如果各组样本(所研究的对象n1、n2…)的测定数据的分布无差异,各样本的资料分布相近,则各组资料合并后算得的中位数的上下每组样本应各有一半数目,故可检验其中位数上下各有观察值数目的差异在各组之间是否有统计意义,从而作出统计推断。
1.2 计算步骤
1.2.1 将各组样本(A、B…)资料混合由小到大排列。
1.2.2 求混合资料的中位数md。
1.2.3 对每一样本分别计数超过混合资料的中位数的数目,记为m1、m2…。
, http://www.100md.com
1.2.4 用m1、m2…及各组样本含量n1、n2…列出四格表或2×k表。
表1 中位数检验用表 样本
A
B
合计
>md数
m1
m2
n1+n2-c
≤md数
, 百拇医药
n1-m1
n2-m2
c
合计
n1
n2
n1+n2
1.2.5 用χ2检验法或理论频数小于5时用精确概率法进行检验。2 实例应用
2.1 对成组资料的检验
例1 某实验室测定了37例卵巢癌病人(病例组,均经临床确诊)和34例正常妇女(对照组)血清中的CA125含量(见表2,CA125采用ELISA法测定,试剂盒为美国Maxgene Biotechnologies公司进口,线性范围0~400u/ml),试问CA125含量在病例组与对照组中是否存在差异或者说前者是否高于后者?因所有理论频数均>5,故可以用一般的χ2检验计算公式:
, 百拇医药
查表χ20.01=6.63 χ20.05=3.84,P<0.01。
结论:认为患有卵巢癌病人血清中的CA125含量显著高于对照组人群(拒绝无效假设H0,接受备择假设H1)。
表2 71份血样CA125原始测定数据
CA125(u/ml)
病例数
(n1=37)
18,>400,34.3,276,348.3,60.6,33,375,72,36,44.7,90,378.6,398,105,67.5,>400,>400,123.7,176.5,243,352,>400,368.5,68,400,>400,>400,72,257.5,29,241,372,13,31.5,89.5,62
, http://www.100md.com
对照组
(n1=34)
0,18,20,0,20.7,66,12,17,25.3,0.5,27,34,30,0,0.8,15.5,32,27.5,2.5,4.5,10.3,0,3.9,3.9,48.8,6.5,17.5,12,8.0,33,4.1,35.2,27.6,29.1
应用上述方法可以计算出表2的中位数为第36个数据[(37+34+1)/2=36],即md=34u/ml,从而列出四格表(见表3)。表3 CA125含量在两组人群中的分布(md=34u/ml)
病例组
对照组
合计
, 百拇医药
>md数
32(18.24)
3(16,76)
35
≤md数
5(18.76)
31(17.24)
36
合计
37
34
71
, 百拇医药
注:括号内为理论频数
2.2 对等级分组资料的检验
例2 进一步对37例不同分期卵巢癌病人(根据医疗护理技术操作常规卵巢癌临床分期标准进行分类)的CA125水平进行考察,其CA125含量分布情况见表4,试问CA125含量在不同分期卵巢癌病人分布是否有差异?
表4 37例不同分期卵巢癌病人的CA125含量分布情况 Ⅰ~Ⅱ期(11例)*
44.7,18,36,33,67.5,68,72,13,89.5,62,31.5
Ⅲ期(14例)
243,123.7,34.3,105,60.6,176.5,400,90,>400,72,368.5,352,29,241
, http://www.100md.com
Ⅳ期(12例)
>400,>400,348.3,375,398,>400,176,>400,278.6,>400,372,257.5
注:* 因为例数太少,故将Ⅰ~Ⅱ期的病例数合并。
本例中位数为第19例个数据[(11+14+12+1)/2=19],即md=176u/ml,列出2×k表(见表5)。
表5 CA125含量在不同分期卵巢癌病人中
的分布(md=176u/ml)
Ⅰ~Ⅱ期
Ⅲ期
Ⅳ期
, 百拇医药
合计
>md数
0(5.65)
7(7.19)
12(6.16)
19
≤md数
11(5.35)
7(6.81)
0(5.84)
18
合 计
, http://www.100md.com
11
14
12
37
注:括号内为理论频数。
因所有理论频数均>5,故可以用行×列表资料的χ2检验法计算:
查表χ20.01=9.21 χ20.05=5.99,P<0.01。
结论:认为卵巢癌病人血清中的CA125含量与不同临床分期呈高度相关(拒绝无效假设H0,接受备择假设H1)。
, 百拇医药
2.3 与其他显著性检验方法的比较
例3 为了解不同饲料对雌鼠体重增加的关系,某实验室对其进行了研究,资料见表6。
表6 不同饲料的两组雌鼠在八周内所增加的体重 饲料
鼠数
各组所增加的体重(克)
高蛋白
12
134,146,104,119,124,161,107,83,113,129,97,123
低蛋白
7
, http://www.100md.com
70,118,101,85,107,132,94
① 用两样本的等级和检验(即两样本的秩和检验)[2] n1=7,n2=12,统计量T=49.5,u=1.73,查T或u界值表得:T=49.5>T0.05=46;u=1.730.05=1.96,故P>0.05,差别无统计意义。
② 用两样本均数的t检验 t=1.89,v=17,查t界值表,0.10>P>0.05,认为两样本之间的差别是随机的。
③ 用本文的中位数检验法 因低蛋白组中的理论频数小于5,故用精确概率检验法:
同理:
, 百拇医药
P=P1+P2+P3=0.21994,P>0.05,差别无统计意义,结论相同。
3 讨论
3.1 中位数检验法属于非参数统计范畴,是众多非参数统计方法中的一种,它除了具有非参数统计方法所具有的许多优点以外(如可以应用于总体分布不明确的资料及在收集资料时可以方便且容易的用“等级”或“符号”来评定观察结果的资料等),还特别适用于某些不能用变量变换法进行数据处理使其转化为正态或近似正态的计量资料(如本例中的CA125含量为0u/ml的病例数有4个之多,>400u/ml的病例数则高达6个,无法采用诸如对数等方法来转换数据)和所收集的等级资料中出现太多相同秩次的数据。对于后者,如果采用样本的等级和来检验势必造成所求得的u值偏小,P值增大,从而对处于0.05水准附近的样本资料进行比较易得出错误或相反的结论。
, http://www.100md.com 3.2 中位数检验法在将资料转换成χ2检验时,要求理论频数不宜太小,否则将导致分析的偏性,一般认为行×列表中不宜有1/5以上格子的理论频数小于5,或有一个理论频数小于1。对理论频数太小有三种处理方法:①最好增加样本含量以增大理论频数;②删去上述理论频数太小的行和列;③将太小理论频数所在行或列与性质相近的邻近行列中的实际频数合并,使重新计算的理论频数增大(见例2)。但后两种方法可能会损失信息,也会损害样本的随机性,不同合并方式有可能影响推断结论,故不宜作为常规方法[2]。
3.3 中位数检验法适用范围虽然较广(如可用于成组、完全随机设计、等级分组的资料等),但如果资料的总体分布接近某一有标准理论的分布(如正态分布),或资料可以转换成这种分布,那么应该尽可能不要用非参数方法来统计处理。因为此时如无效假设(H0)是正确的,则非参数法(中位数检验)与参数法效果一样好(见例3)。但如果无效假设(H0)是错误的,则非参数法效果较差,如需检验出同样大小差异往往需要较多的资料。
参考文献
1,金丕焕主编.医用统计方法.第一版.上海:上海医科大学出版社,1992,215.
2,杨树勤主编.卫生统计学.第一版.北京:人民卫生出版社,1985,85.
收稿日期:1999-12-14, 百拇医药
单位:成军(南京军区医学检验质控中心、解放军第117医院 杭州310013);孙关忠(南京军区医学检验质控中心、解放军第117医院 杭州310013);李早荣(南京军区医学检验质控中心、解放军第117医院 杭州310013)
关键词:中位数;显著性检验;统计推断;χ2检验
数理医药学杂志000323
摘 要 建立了一种实用的统计学显著性检验方法中位数检验,该方法依据统计推断的基本思想将样本资料转化为构成比或率来进行χ2显著性检验。结果显示,该法可以应用于多种总体分布或总体分布不明确的资料,尤其适用于某些不能用变量变换法进行数据处理使其转化为某一有标准理论的分布或近似该分布的资料(如正态分布的计量资料)。
, 百拇医药 中图分类号:R 195.1 文献标识码:A
文章编号:1004-4337(2000)03-0226-02
在进行医学研究时,由于受样本个体差异、病例分布的不确定性以及方法学的局限性等客观条件的限制,所收集到的资料往往不尽人意,这时我们就要借助于统计学手段来处理数据。统计学处理的目的是:①对所研究的对象作出统计描述(如均数、标准差、百分位数、频数分布表等);②通过所研究的对象(样本)来对该对象所在的群体(总体)作出统计推断,即显著性检验。然而这些检验方法的应用常有一个关于总体分布的前提,例如t检验法要求总体分布为正态分布、F分析要求方差齐性等,如果与正态分布相差太大则该方法就不适用。而在实际工作中的确有许多资料不符合这些条件,有时我们可以用变量变换的方法(如用对数转换等)将其转换为正态或近似正态分布来采用相应的方法,但有些资料没有适合的转换方法,或者有时其总体分布不能确定,这时则需要应用一种不必依赖某一专门的总体分布的统计方法中位数检验法[1]。本文旨在将这一方法作一介绍,并结合实例进行述评性的讨论,以给同行在应用时提供参考。
, 百拇医药
1 中位数检验法的基本思想及计算步骤
1.1 基本思想
如果各组样本(所研究的对象n1、n2…)的测定数据的分布无差异,各样本的资料分布相近,则各组资料合并后算得的中位数的上下每组样本应各有一半数目,故可检验其中位数上下各有观察值数目的差异在各组之间是否有统计意义,从而作出统计推断。
1.2 计算步骤
1.2.1 将各组样本(A、B…)资料混合由小到大排列。
1.2.2 求混合资料的中位数md。
1.2.3 对每一样本分别计数超过混合资料的中位数的数目,记为m1、m2…。
, http://www.100md.com
1.2.4 用m1、m2…及各组样本含量n1、n2…列出四格表或2×k表。
表1 中位数检验用表 样本
A
B
合计
>md数
m1
m2
n1+n2-c
≤md数
, 百拇医药
n1-m1
n2-m2
c
合计
n1
n2
n1+n2
1.2.5 用χ2检验法或理论频数小于5时用精确概率法进行检验。2 实例应用
2.1 对成组资料的检验
例1 某实验室测定了37例卵巢癌病人(病例组,均经临床确诊)和34例正常妇女(对照组)血清中的CA125含量(见表2,CA125采用ELISA法测定,试剂盒为美国Maxgene Biotechnologies公司进口,线性范围0~400u/ml),试问CA125含量在病例组与对照组中是否存在差异或者说前者是否高于后者?因所有理论频数均>5,故可以用一般的χ2检验计算公式:
, 百拇医药
查表χ20.01=6.63 χ20.05=3.84,P<0.01。
结论:认为患有卵巢癌病人血清中的CA125含量显著高于对照组人群(拒绝无效假设H0,接受备择假设H1)。
表2 71份血样CA125原始测定数据
CA125(u/ml)
病例数
(n1=37)
18,>400,34.3,276,348.3,60.6,33,375,72,36,44.7,90,378.6,398,105,67.5,>400,>400,123.7,176.5,243,352,>400,368.5,68,400,>400,>400,72,257.5,29,241,372,13,31.5,89.5,62
, http://www.100md.com
对照组
(n1=34)
0,18,20,0,20.7,66,12,17,25.3,0.5,27,34,30,0,0.8,15.5,32,27.5,2.5,4.5,10.3,0,3.9,3.9,48.8,6.5,17.5,12,8.0,33,4.1,35.2,27.6,29.1
应用上述方法可以计算出表2的中位数为第36个数据[(37+34+1)/2=36],即md=34u/ml,从而列出四格表(见表3)。表3 CA125含量在两组人群中的分布(md=34u/ml)
病例组
对照组
合计
, 百拇医药
>md数
32(18.24)
3(16,76)
35
≤md数
5(18.76)
31(17.24)
36
合计
37
34
71
, 百拇医药
注:括号内为理论频数
2.2 对等级分组资料的检验
例2 进一步对37例不同分期卵巢癌病人(根据医疗护理技术操作常规卵巢癌临床分期标准进行分类)的CA125水平进行考察,其CA125含量分布情况见表4,试问CA125含量在不同分期卵巢癌病人分布是否有差异?
表4 37例不同分期卵巢癌病人的CA125含量分布情况 Ⅰ~Ⅱ期(11例)*
44.7,18,36,33,67.5,68,72,13,89.5,62,31.5
Ⅲ期(14例)
243,123.7,34.3,105,60.6,176.5,400,90,>400,72,368.5,352,29,241
, http://www.100md.com
Ⅳ期(12例)
>400,>400,348.3,375,398,>400,176,>400,278.6,>400,372,257.5
注:* 因为例数太少,故将Ⅰ~Ⅱ期的病例数合并。
本例中位数为第19例个数据[(11+14+12+1)/2=19],即md=176u/ml,列出2×k表(见表5)。
表5 CA125含量在不同分期卵巢癌病人中
的分布(md=176u/ml)
Ⅰ~Ⅱ期
Ⅲ期
Ⅳ期
, 百拇医药
合计
>md数
0(5.65)
7(7.19)
12(6.16)
19
≤md数
11(5.35)
7(6.81)
0(5.84)
18
合 计
, http://www.100md.com
11
14
12
37
注:括号内为理论频数。
因所有理论频数均>5,故可以用行×列表资料的χ2检验法计算:
查表χ20.01=9.21 χ20.05=5.99,P<0.01。
结论:认为卵巢癌病人血清中的CA125含量与不同临床分期呈高度相关(拒绝无效假设H0,接受备择假设H1)。
, 百拇医药
2.3 与其他显著性检验方法的比较
例3 为了解不同饲料对雌鼠体重增加的关系,某实验室对其进行了研究,资料见表6。
表6 不同饲料的两组雌鼠在八周内所增加的体重 饲料
鼠数
各组所增加的体重(克)
高蛋白
12
134,146,104,119,124,161,107,83,113,129,97,123
低蛋白
7
, http://www.100md.com
70,118,101,85,107,132,94
① 用两样本的等级和检验(即两样本的秩和检验)[2] n1=7,n2=12,统计量T=49.5,u=1.73,查T或u界值表得:T=49.5>T0.05=46;u=1.730.05=1.96,故P>0.05,差别无统计意义。
② 用两样本均数的t检验 t=1.89,v=17,查t界值表,0.10>P>0.05,认为两样本之间的差别是随机的。
③ 用本文的中位数检验法 因低蛋白组中的理论频数小于5,故用精确概率检验法:
同理:
, 百拇医药
P=P1+P2+P3=0.21994,P>0.05,差别无统计意义,结论相同。
3 讨论
3.1 中位数检验法属于非参数统计范畴,是众多非参数统计方法中的一种,它除了具有非参数统计方法所具有的许多优点以外(如可以应用于总体分布不明确的资料及在收集资料时可以方便且容易的用“等级”或“符号”来评定观察结果的资料等),还特别适用于某些不能用变量变换法进行数据处理使其转化为正态或近似正态的计量资料(如本例中的CA125含量为0u/ml的病例数有4个之多,>400u/ml的病例数则高达6个,无法采用诸如对数等方法来转换数据)和所收集的等级资料中出现太多相同秩次的数据。对于后者,如果采用样本的等级和来检验势必造成所求得的u值偏小,P值增大,从而对处于0.05水准附近的样本资料进行比较易得出错误或相反的结论。
, http://www.100md.com 3.2 中位数检验法在将资料转换成χ2检验时,要求理论频数不宜太小,否则将导致分析的偏性,一般认为行×列表中不宜有1/5以上格子的理论频数小于5,或有一个理论频数小于1。对理论频数太小有三种处理方法:①最好增加样本含量以增大理论频数;②删去上述理论频数太小的行和列;③将太小理论频数所在行或列与性质相近的邻近行列中的实际频数合并,使重新计算的理论频数增大(见例2)。但后两种方法可能会损失信息,也会损害样本的随机性,不同合并方式有可能影响推断结论,故不宜作为常规方法[2]。
3.3 中位数检验法适用范围虽然较广(如可用于成组、完全随机设计、等级分组的资料等),但如果资料的总体分布接近某一有标准理论的分布(如正态分布),或资料可以转换成这种分布,那么应该尽可能不要用非参数方法来统计处理。因为此时如无效假设(H0)是正确的,则非参数法(中位数检验)与参数法效果一样好(见例3)。但如果无效假设(H0)是错误的,则非参数法效果较差,如需检验出同样大小差异往往需要较多的资料。
参考文献
1,金丕焕主编.医用统计方法.第一版.上海:上海医科大学出版社,1992,215.
2,杨树勤主编.卫生统计学.第一版.北京:人民卫生出版社,1985,85.
收稿日期:1999-12-14, 百拇医药