当前位置: 首页 > 期刊 > 《实用骨科杂志》 > 2007年第1期
编号:11376895
可信限的计算在骨科研究中的应用
http://www.100md.com 《实用骨科杂志》 2007年第1期
     在医学研究中,结果常需做统计学分析,人们越来越对有统计学的显著性差异感兴趣,而忽略了所研究内容差异的大小,甚至发展到在文章中不提具体的数据结果,而只讲P值的大小。实际上大部分医学研究的目的正是后者。读者最关心的是新的方法与其他方法有多大的差异,而不仅仅是一个P值的大小。可信限要比一个单纯的P值提供更多的信息。可信限将一个样本的单一估计值(如样本均数)转变为一个能反映总体均数所在的范围。有许多杂志如British Medical Journal、Lancet等已要求作者在可能的情况下使用可信限,而不只是单纯的P值和有无显著性差异。但使用可信限对广大骨科工作者来说仍有一定的难度,因为在大多数普通统计学著作中没有将此类内容归纳整理,以便于应用。每一个研究结果作为一个样本均给总体一个大致的估计,而这种大致的程度是由可信限的宽度(或范围)来决定的。可信限的范围越大,这种估计就越不准确。可信限的范围主要取决于三个因素:第一,样本的大小,样本数越大,可信限范围越小,可信限范围很大表示所得的结果来自一个小样本,结果不可靠;第二,研究特征的变异性,变异性小,可信限范围就小;第三,可信的程度,最常运用的是95%可信度。可信限与显著性检验的关系。应用可信限与双侧假设检验之间有密切联系,从可信区间的结果可以推知假设检验显著性的水平。如在两个均数差的95%可信区间中不包含0,即表示统计学检验时P值小于0.05;如在两个均数差的99%可信区间中不包含0,则表示统计学检验时P值小于0.01。相反,在95%可信区间中包含0则表明统计学检验无显著性差异,即P大于0.05。95%可信区间给我们提供了总体均数可能存在的范围。但是,最有可能的仍是靠近可信区间的中间,而不是两端。人们常常批评在骨科研究中病例数太少,不易得出有统计学意义的结果。但实际上任何一个研究无论病例数多么少,均包含一定的信息。通过计算可信区间使我们在某种可信度上相信这个小样本所在总体某一事件发生的状况。当我们在比较两种或多种治疗方法时,在作出某一种方法优于其他方法的判断前,大多数杂志要求我们给出检验假设的P值,如果P值足够小,我们有理由拒绝检验假设,并确定这种差异是真正存在的而不是因抽样误差造成的。然而,当P值大于某一个人为的界限时(如0.05),我们就拒绝检验假设,认为各种治疗方法间没有差别而不论实际情况如何。显然这种一刀切的方法是不妥的。而且即使统计学检验有显著性差异,我们也不知这种差异的大小。可信限给了我们一定范围,使我们在某种水平的可信度上相信总体真正值在这个范围内。下面我们用一个例子来加以说明。假定我们在治疗结核性关节炎时使用的某类抗结核药物有A和B两种药物可供选择,由于A药比B药价格贵,我们想知道两药对结核性关节炎的治愈率是否相同。A药和B药在四所医院进行临床试验,结果如表1所示。如果我们单作统计学差异显著性分析,从甲医院结果来看,A和B两种药物无显著性差异(P>0.05),人们很容易错误地认为A和B两种药物在治疗结核性关节炎时疗效相同。实际上这是由于甲医院所用的病例数较少,因而在做显著性检验能力时较低,不能发现可能存在的差异。从乙和丙
, http://www.100md.com
    表1 四所医院两种药物治疗结核性关节炎的结果 略

    医院的结果来看,A和B两种药物对结核性关节炎的治愈效果是相同的,但我们单看显著性检验时,在乙医院A和B两种药物无显著性差异(P>0.05),而在丙医院A和B两种药物有显著性差异(P<0.05),由此得出截然不同的结论。显然,此时我们不能得出A和B两种药物在所有结核性关节炎病人中的治愈率是否相同。只有从丁医院的结果我们可以较为肯定地得出结论:A药物在治疗结核性关节炎时疗效优于B药。然而由于所得的结论是从一个样本(丁医院)中得出,所以在人群中应用时我们不知A药对结核性关节炎的治愈率究竟高于多少。此时可信限的计算可告诉我们两种药物可能具有差别的大小。如果我们对上述资料做可信限的计算,从中可以看出可信限比仅仅表明有无统计学显著性差异提供更多的信息。从甲医院的结果来看,其治愈率差数的可信限为-19.4%~35.4%。当两组率差数的可信限中包含有0时意味着两组率之间统计学上无显著性差异,任何一种治疗可能好于另一种治疗。使用A药对结核性关节炎的治愈率可高于B药35.4%,而使用B药对结核性关节炎的治愈率可高于A药19.4%。从乙医院和丙医院的结果来看,其治愈率差数的可信限分别为-0.1%~38.1%和0.8%~39.2%,由此可知A药在治疗结核性关节炎的治愈率可能与B药相同或高于B药最多39%。也就是说在人群中应用时A药治疗结核性关节炎的治愈率可能与B药相同或高于B药最多39%。从丁医院的结果来看,其治愈率差数的可信限为10.4%~29.6%,我们不仅得出结论A药在治疗结核病关节炎时疗效优于B药,而且可知其好于B药的程度:我们有95%的把握说A药至少好于B药10.4%,最多可好于B药29.6%。从该例可看出当比较不同治疗效果时,可信限的计算比P值更有意义。前者不仅表明两种疗法是否有统计学显著性差异,而且提供了两种疗法可能具有的差别的大小,而不论P值有多小。当用可信限时我们可看出是否有临床意义的差别而不只是统计学显著性差异,因为有统计学显著性差异并不意味着具有临床意义的差异。在骨科研究的实际工作中,当比较不同文献中的研究结果时或将自己的研究结果与文献中的结果进行比较时,或者对文献中的统计学结果有疑问时,由于在文献中往往没有原始资料,无法进行统计学显著性差异检验,此时根据文献中提供的一些结果,如率、均数及其标准差、样本例数等可进行可信限的计算,从而得出不同结果间可能存在的差异。应当说明的一点是可信限并不是可以用在所有研究中,如描述性的资料就无法使用可信限,在某些情况下,计算可信限是极其复杂的或是不可能的。下面例举各种情况下可信限的计算(均采用95%的水平)。
, 百拇医药
    1 大样本率的可信限计算[1,2]

    近似正态分布的二项分布,样本率在15%~85%之间,np和n(1-p)两者均大于5时,可信限为:p±u SEp,SEp=p(1-p) np:样本率,以小数形式表示;SEp:样本率的标准误;n:样本数;u:标准正态曲线下的值,90%、95%、99%时分别为1.65、1.96、2.58。例1:王氏从北京地区常规健康体检的男性老人中随机抽样139 例,测定腰椎的骨密度,发现骨质疏松的发生率为7.9%[3]。通过计算我们得出95%可信限是3.4%~12.4%,具体计算方法是:0.079±1.96×[0.079×(1-0.079)÷139]=0.034~0.124通过计算可信限区间,我们从该研究中获得了更多的信息。我们有95%把握说,样本所在的总体人群中骨质疏松的发生率在3.4%~12.4%之间。

    2 小样本(如小于20)率和样本率特小、特大时可信限的计算[1]
, http://www.100md.com
    (n n+u2)(p+u2 2n±up(1-p) n+u2 4n2)p:样本率,以小数形式表示;n:样本数;u:标准正态曲线下的值,90%、95%、99%分别为1.65、1.96、2.58。例2:有医生对30 例髋关节感染者直接行关节置换,2年随访感染复发率为0。显然,我们不能相信总体上2年感染复发率为0,为了正确地评价这个样本,可计算95%可信限。很明显其下限为0,上限为: [30÷(30+1.962)]×{0+[1.962÷(2×30)]+1.96×[(0×[1-0])÷30]+[1.962÷(4×302)]}=0.114我们有95%把握说这个样本所在的总体真正的髋关节感染直接行关节置换2年随访感染复发率不会超过11.4%。显然,可信限的计算为我们提供了更多的信息。

    3 两个样本率之差的可信限计算

    3.1 两个非配对样本率之差的可信限计算(大样本时)[1,2]。本法不适应于样本数较小者,如每组小于30,或样本率特小特大时,如在0.1~0.9范围以外者。(p1-p2)±u SE(p1-p2)式中,SE(p1-p2)=p1(1-p1) n1+p2(1-p2) n2p1:样本1的率;p2:样本2的率;n1:样本1 例数;n2:样本2 例数。SE(p1-p2):两率之差的标准误(也是标准差)。u:标准正态曲线下的值,90%、95%、99%时分别为1.65、1.96、2.58。例3:有作者对股骨颈骨折行全髋置换术(80 例)和内固定术(82 例)后功能优良率进行了比较,前者为88.7%,后者为73.2%,统计学检验P<0.05。结论:全髋置换术的功能优于内固定术[4]。如果进行可信限的分析,从该资料中可得到更多的信息。按上式计算95%可信限为3.7%~27.3%。我们有95%的把握说全髋置换术的功能至少优于内固定术3.7%,最多可达27.3%。
, 百拇医药
    3.2 两个配对样本率之差的可信限计算[2]如有一个样本在处理前后观察某特征是否发生,可列表2如下。

    表2 某特征处理前后的发生情况 略

    4 单个样本均数的可信限计算[5]

    ±t S 式中,S=s n:样本均数;t:在v自由度下的t值;v=n-1;s:标准差。S:样本均数标准差即标准误。

    5 两个相等小样本均数差的可信限计算[5]

    条件:小样本且已知两个样本均数1和2,标准差s1和s2,n1=n2可信限为:(1-2)±t SE(1-2)式中,SE(1-2)=S(1-2)1 n1+1 n2, S(1-2)=s1+s2 2S(1-2):均数差数的标准差,SE(1-2):均数差数的标准误,t:为v(v=n1+n2-2)自由度下95%水平的t值。当求两个样本的可信限或两样本(配对或非配对)差数的可信限时,如样本不是正态分布,可将其转化为对数,如能求得近似正态分布,可按对数值计算可信限,然后取反对数转回原数值单位[2]。
, 百拇医药
    6 两个相等大样本均数差的可信限计算[5]

    条件:大样本且已知两个样本均数1和2,标准差s1和s2,n1=n2可信限为:(1-2)±u SE(1-2)式中,SE(1-2)=S(1-2)1 n1+1 n2, S(1-2)=s1+s2 2,S(1-2):均数差数的标准差,SE(1-2):均数差数的标准误。

    7 两个不相等小样本均数差的可信限计算[6]

    条件:小样本且已知两个样本均数1和2,标准差s1和s2,n1不等于n2可信限为:(1-2)±t SE(1-2)式中,SE(1-2)=n1+n2 n1n2(n1+n2-2)[(n1-1)s21+(n2-1)s22]SE(1-2):均数差数的标准误,t:为υ1(υ1=n1+n2-2)自由度下95%水平的t值。
, http://www.100md.com
    8 两个不相等大样本均数差的可信限计算[6]

    条件:大样本且已知两个样本均数1和2,标准差s1和s2,n1不等于n2可信限为:(1-2)±u SE(1-2)式中,SE(1-2)=n1+n2 n1n2(n1+n2-2)[(n1-1)s21+(n2-1)s22]SE(1-2):均数差数的标准误。u:标准正态曲线下的值,90%、95%、99%分别为1.65、1.96、2.58。

    参考文献:

    [1]Dorey F,Amstutz H.The need for confidence intervals in the presentation of orthopaedic data[J].J Bone Joint Surg(Am),1993,75:18441852.〖1〗
, http://www.100md.com
    [2]Gardner MJ,A1tman DG.Confidence intervals rather than p values:estimation rather than hypothesis testing[J].British Medical Journal,1986,292:746750.〖1〗

    [3]王福权,蔡恒江,茅皖如,等.男性骨质疏松症发生率与诊治的研究[J].中华骨科杂志,1999,19:389392.〖1〗

    [4]王裕民,张铁良,于建华.全髋关节置换术及骨折内固定术治疗老年股骨颈骨折临床随访结果比较[J].中华骨科杂志,2000,20:204206.〖1〗

    [5]Hassard TH.Understanding Biostatistics[M].St.Louis:Mosby Year Book,Inc,1991:59.〖1〗

    [6]Glantz SA.Primer of Biostatistics[M].3ed.New York:Mcgrawhill,Inc,1992:396.

    作者简介:卫小春(1959- ),男,主任医师,教授,山西医科大学第二医院骨科,030001。

    山西医科大学第二医院骨科,山西 太原 030001, http://www.100md.com