当前位置: 首页 > 期刊 > 《广西医学》 > 1999年第2期
编号:10497541
非参数统计与秩和检验
http://www.100md.com 《广西医学》 1999年第2期
     作者:黄高明 梁秋萍

    单位:广西医科大学

    关键词:

    广西医学990220

    前面几讲所介绍的t检验、方差分析等统计推断方法,都要求样本来自的总体分布型是已知的,然后再对总体参数(如μ、π等)进行估计和检验,称为参数统计。如果样本来自的总体分布型未知或不符合检验要求的条件,如非正态分布、方差不齐等,此时不能做参数间的比较,而是做分布间的比较。这种不基于参数间比较的方法称非参数统计,亦称非参数检验。

    非参数检验主要优点是:适用范围广。由于不受总体分布型的限定,可适用于任何分布型的资料。尤其是以下几处情况:①总体分布型未知或分布呈明显偏态的资料;②只能以严重程度、优劣等级、次序先后等表示的等级资料;③数据一端或两端为不确定值的资料。例如“>50”或“<0.1”等,俗称开口资料。而非参数检验主要缺点是:没有充分利用资料提供的信息,检验效能低于参数检验。故在实际工作中,符合参数检验条件的资料应首选参数检验,对不满足参数检验条件的资料才考虑用非参数检验。
, 百拇医药
    非参数检验的方法很多,这里主要介绍秩和检验。

    1 配对设计差值的符号秩和检验

    亦称Wilcoxon符号秩和检验。适用于配对设计的资料,主要用于观察指标不能准确测定的资料。

    例1 应用一种新的抗精神病药治疗精神忧郁症患者。病人一星期服用对照药,另一星期服用新药,两药间隔一定时间、次序随机。在服药的星期末采用询问法对病人的忧郁程度由轻到重用0~10评分。结果见表1。

    表1两种抗精神病药的评分 病人号

    对照药评分

    新药评分

    差值

    秩次
, 百拇医药
    1

    8

    2

    6

    4

    2

    10

    3

    7

    7

    3

    10

    1

    9
, 百拇医药
    9

    4

    6

    6

    0

    -

    5

    4

    9

    -5

    -2

    6

    7

    1
, 百拇医药
    6

    5

    7

    3

    8

    -5

    -2

    8

    8

    1

    7

    8

    9

    7
, 百拇医药
    1

    6

    6

    10

    9

    4

    5

    2

    T+=5 T-=4

    由于评分结果带有一定的主观性,不是准确测量的结果,故最好采用非参数检验方法。

    方法与步骤:

    (1)先求出每对数据的差值(用A-B或B-A结论一样)。
, 百拇医药
    (2)编秩。不管差值的正负号,按差值的绝对值由小到大编秩。如有差值为零,舍去不计;如差值相等,符号相同,仍按顺序编秩;若差值相等,符号不同,则取平均秩次,再加上原来的符号。例如,表1第(4)栏中差值绝对值等于5有三个,其符号不同,它们的位次是1、2、3,其平均秩次为(1+2+3)/3=2;绝对值等于6的也有三个,但其符号相同,故仍按原顺序编秩。

    (3)求秩和并确定检验统计量。分别求正、负秩次之和,正秩和以T+表示,负秩和的绝对值以T-表示。本例T+=51,T-=4,任取T+或T-作检验统计量T,本例取T=4。

    (4)确定P值和作出推断结论。当n≤25时,查T界值表(1),若检验统计量T值在界值表n所对应的上下界值范围内,则P值大于表上方相应的概率水平;若T值在界值表n所对应的上下界值范围之外,则P值小于表上方相应的概率水平;若T值恰好等于上界或下界值,则P值等于相应的概率水平。本例n=9,T=4,查T界值表得双侧P<0.05,即可认为新药与对照药的效果不同,新药较好。
, 百拇医药
    当对子数较多时,即n>25,超出了T界值表的范围,此时,T分布近似u分布,可用u检验:

    当相同“差值”(以绝对值计)较多时,应改用以下校正公式:

    式中tj为第j(j=1,2,……)个相同差值的个数。本例有3个5,3个6,2个7,则t1=3,t2=3,t3=2,Σ(t3j-tj)=(33-3)+(33-3)+(23-2)=54。

    本例如应用配对t检验,得d-=3.7,Sd=5.12,t=2.240,v=9,P>0.05。因此得出新药的效果与对照药无差别的结论。这是由于表1中差值的分布严重偏离正态分布,t检验的效率不如秩和检验。
, 百拇医药
    2 两样本比较的秩和检验

    2.1 原始数据的两样本比较

    两组计量资料比较,如果呈偏态分布、方差不齐或为开口资料等不符合t检验的应用条件,须改用秩和检验。

    例2 某医生用新法治疗流行性出血热患者,以用药开始到体温降至正常的时间(小时)为疗效指标(每天固定时间测量体温四次)。结果如表2所示。问新疗法与传统疗法的退热时间有无差别?

    表2两种疗法退热时间(小时) 新疗法

    传统疗法

    退热时间

    秩次

    退热时间
, 百拇医药
    秩次

    25

    1

    36

    5

    30

    2

    40

    9

    32

    3

    44

    11

    35
, http://www.100md.com
    4

    48

    13.5

    37

    6

    50

    15

    39

    7

    56

    16

    39

    8

    59
, http://www.100md.com
    17

    42

    10

    60

    18

    46

    12

    64

    19

    48

    13.5

    195

    20

    240
, 百拇医药
    21

    n1=10

    T1=66.5

    n2=11

    T2=164.5

    本例由于退热时间不是连续动态观察,不是准确测定的结果,而且个体差异较大,不宜用t检验,应该用秩和检验。

    方法与步骤:

    (1)编秩。先将两组数据分别由小到大排队,再将两组数据由小到大统一编秩。如有原始数据相同时,可按相同数据全在同组内不用求平均秩次,不同组间有相同数据须求平均秩次的原则处理。如新疗法第6、7个数据均为39,但为同组内数据,其秩次仍按原顺序记为6、7;而有两个48分别在新疗法组和传统疗法组,其相应顺序为13、14,取其平均秩次(13+14)/2=13.5。
, 百拇医药
    (2)求秩和并确定检验统计量。当两样本例数不等时,以例数小者为n1,其秩和为检验统计量T;当两样本例数相等时,可任取一组的秩和为检验统计量T。本例n1=10,n2=11,T=66.5。

    (3)确定P值和作出推断结论。查T界值表(附表11)(2)。先找到n1与n2-n1相交所对应的4行界值,由上往下逐行考虑:若T值在界值范围内,则P值大于相应的概率;若T值恰好等于界值,则P值等于相应的概率;若T值在界值范围外,则P值小于相应的概率。本例n1=10,n2=11,T=66.5,查表得双侧P<0.01。其中,新疗法组平均秩次为6.65(66.5/10);传统疗法组平均秩次为14.95(164.5/11),故可认为新疗法组的退热时间较传统疗法组短。

    当n1或n2-n1超出附表11的范围,可用近似u检验:
, 百拇医药
    式中,N=n1+n2。在有相同秩次较多(如个数占总例数的25%以上时),需求校正值:

    式中C=1-Σ(t3j-tj)/(N3-N),tj的涵义同前。

    2.2 等级资料(或频数表资料)的两样本比较

    当原始数据为等级资料或整理成频数表,欲比较两组是否有差别,可采用本法。

    例3 分别用消炎痛与消炎痛加皮质激素制剂(简称合剂)治疗肾小球肾病,全程用药后病情按完全缓解、基本缓解、部分缓解与无效四个等级,结果见表3第(1)至(3)栏。问两组的疗效有无差别?
, 百拇医药
    表3两种疗效对肾小球肾病的疗效比较 疗效(1)

    患 者 数

    秩次

    范围

    (5)

    平均

    秩次

    (6)

    秩 和

    消炎痛(2)

    合剂(3)

    合计(4)

    消炎痛
, 百拇医药
    (7)=(2)(6)

    合剂

    (8)=(3)(6)

    完全缓解

    0

    6

    6

    1-6

    3.5

    21

    基本缓解

    0

    1
, http://www.100md.com
    1

    7

    7

    7

    部分缓解

    1

    2

    3

    8-10

    9

    9

    18

    无 效

    4
, http://www.100md.com
    0

    4

    11-14

    12.5

    50

    合 计

    n1=5

    n2=9

    14

    T1=59

    T1=46

    由于本例为等级资料,要比较两组疗效有无差别,只能用秩和检验而不能用χ2检验。
, 百拇医药
    方法与步骤:

    (1)编秩。先计算各等级的合计人数(见第(4)栏),再确定秩次范围。如完全缓解共6例,其秩次范围1-6,平均秩次为(1+6)/2=3.5。仿此得(5)(6)栏。

    (2)计算检验统计量,先分别求各组的秩和,见(7)(8)栏合计。较小例数为n1,其相应的秩和为统计量T。本例n1=5,n2=9,T=59。

    (3)确定P值和作出推断结论。方法与原始数据的两样本比较相同。查附表11(2)得双侧P<0.01。消炎痛组的平均秩次为11.8(59/5),消炎痛+激素组的平均秩次为5.11(46/9)。由于编秩是由好到差排列,故平均秩次越小,效果越好。可认为消炎痛+激素组的疗效较单用消炎痛好。

    3 多个样本比较的秩和检验
, 百拇医药
    两组以上比较的秩和检验,其编秩方法与两组比较的秩和检验完全一样,不同之处是检验统计量不同。也有原始数据和等级资料(频数表资料)之分,现分述如下。

    3.1 原始数据多组比较

    例4 比较三种青霉素的抑菌效力,表4第(1)(3)(5)栏为抑菌圈直径(mm)。问三种青霉素的抑菌效力有无差别?

    表4三种青霉素抑菌效力比较 一号青霉素

    二号青霉素

    三号青霉素

    抑菌圈

    (1)

    秩次

, 百拇医药     (2)

    抑菌圈

    (3)

    秩次

    (4)

    抑菌圈

    (5)

    秩次

    (6)

    26

    8

    23

    2.5

    20
, http://www.100md.com
    1

    27

    9

    24

    5

    23

    2.5

    28

    10

    24

    5

    24

    5

    29
, 百拇医药
    11

    25

    7

    Ri

    38

    19.5

    8.5

    ni

    4

    4

    3

    R-i

    9.5
, 百拇医药
    4.9

    2.8

    方法与步骤:

    (1)编秩。先将三种青霉素的抑菌圈直径分别由小到大排队,再将三组数据统一编秩,组内数据仍按原顺序编,组间相同取平均秩次。见表4的(2)(4)(6)栏。

    (2)求秩和。将各组秩次分别相加得Ri

    (3)计算检验统计量H值。

    式中,ni为各组例数,N为总例数,Ri为各组秩和。

    本例
, 百拇医药
    (4)确定P值和作出推断结论。若组数k=3,每组例数≤5,可查附表12(H界值表)(3)得出P值。若k>3或每组例数>5,则H近似服从v=k-1的χ2分布,即以v=k-1,查χ2界值表确定P值。

    本例k=3,ni<5,因此H不用χ2近似。查附表12(3)得双侧P<0.01,可认为三种青霉素的抑菌效力有差别。注:这里只说明三组总的有差别,每两组间有无差别还要进一步作两两比较(见下)。

    当相同秩次较多时(如占比例>25%)则需进行校对:

    Hc=H/C (6)式中,C=1-Σ(t3j-tj)/(N3-N),tj的涵义同前。
, 百拇医药
    3.2 等级资料(或频数表资料)多样本比较

    例6 用冠心丸治疗不同程度的心绞痛病人的疗效中,病人服药后的疗效按显效、改善、无效、恶化分四个等级,结果见表5。问冠心丸对不同程度的心绞痛病人的疗效是否有差别?

    表5冠心丸对不同程度心绞痛病人的疗效比较 疗效

    病情程度

    合计

    秩次范围

    平均秩次

    (1)

    轻度(2)

    中度(3)
, 百拇医药
    重度(4)

    (5)

    (6)

    (7)

    显效

    1

    0

    1

    2

    1-2

    1.5

    改善

    26

    11
, 百拇医药
    1

    39

    3-41

    22

    无效

    9

    8

    2

    19

    42-60

    51

    恶化

    3

    0
, 百拇医药
    1

    4

    61-64

    62.5

    Ri

    1220

    650

    210

    64

    ni

    39

    19

    6
, 百拇医药
    R-i

    31.3

    34.2

    35

    方法与步骤:

    (1)编秩。先计算各等级的合计,见表5第(5)栏,再确定秩次范围,见(6)栏。

    (2)求秩和。各组的秩和等于各组各等级的频数与平均秩次相乘再求和。如第一组R1=1×1.5+26×22+9×51+3×62.5=1220。

    (3)计算检验统计量H。所用公式为式(5)。由于相同秩次个数较多,宜计算校正H值,即Hc。
, http://www.100md.com
    Hc=H/C=0.435/0.747=0.582 (4)确定P值和作出推断结论。本例ni均大于5,H值近似服从v=k-1=3-1=2的χ2分布,即以v=2,查χ2界值表,得P>0.50。因此,可认为冠心丸的疗效与心绞痛程度无关。

    4 多个样本两两比较的秩和检验

    当经多个样本比较的秩和检验,结论是各组有显著性差别时,常需要进一步作两两比较的秩和检验,以推断哪两组间有差别,哪两组间无差别。

    例6 对例4的资料作三个样本间的两两比较。方法与步骤如下:

    (1)计算任意两个对比组平均秩和之差,见表6第(4)栏。

    (2)按公式(7)分别求α=0.05,α=0.01时的界值。
, http://www.100md.com
    式中,C为校正数,涵义同上,当相同秩次个数所占比例小于25%时,C=1;χ2α,k-1,由χ2界值表查得;N为总例数。例如“一与二”比较:

    α=0.05时,

    详见表6第(5)(6)栏。

    (3)确定P值和作出推断结论。将第(4)栏与第(5)、(6)栏比较,如第(4)栏的数值大于第(5)或第(6)栏,则P<0.05或P<0.01;反之,第(4)栏小于第(5)栏,则P>0.05。见表6第(7)栏。

    表6三个样本间两两比较的秩和检验 对比组

    A与B
, 百拇医药
    (1)

    样本含量

    两组平均

    秩和之差

    |RA-RB|

    (4)

    界 值

    P值

    (7)

    nA

    (2)

    nB

    (3)
, http://www.100md.com
    0.05

    (5)

    0.01

    (6)

    一与二

    4

    4

    4.6

    5.34

    7.12

    >0.05

    一与三

    4
, http://www.100md.com
    3

    6.7

    6.20

    7.69

    <0.05

    二与三

    4

    3

    2.1

    6.20

    7.69

    >0.05

    由表6第(7)栏可知,只有一号青霉素与三号青霉素抑菌效果有差别;一号与二号青霉素、二号与三号青霉素的抑菌效果无差别。

    参考文献

    [1]杨树勤主编.卫生统计学.第3版.北京:人民卫生出版社,1994:206

    [2]杨树勤主编.卫生统计学.第3版.北京:人民卫生出版社,1994:207

    [3]杨树勤主编.卫生统计学.第3版.北京:人民卫生出版社,1994:208, http://www.100md.com