当前位置: 首页 > 期刊 > 《中华放射肿瘤学杂志》 > 1999年第1期
编号:10241308
随访资料分析方法简介
http://www.100md.com 《中华放射肿瘤学杂志》 1999年第1期
     作者:孙可淳 秦小棋

    单位:100034 北京医科大学第一临床学院医学统计室

    关键词:

    中华放射肿瘤学杂志990125 病例随访资料的分析方法是医学统计学的一个分支,是以生存时间为观察指标,研究生存期的统计方法。常用生存期分析可分为非参数法、参数法和多元分析方法。生存期分析方法是肿瘤疾病科研最常用的方法之一。

    临床疗效的观察常选用治愈率,有效率和病死率等指标,这些指标可用于预后在较短的时间里能够确定的疾病,例如,目前常用洛塞克治疗溃疡病,很快可以见到其治疗效果,经过一个疗程后,统计治愈、好转、无效的人数,计算治愈率,有效率。但是,肿瘤疾病的病死率不是手术后很快能观察到的,必须经过一定时间跟踪随访才能知道。肿瘤临床疗效的指标常选用生存率、复发率、中位生存时间和平均生存时间。生存率或复发率随着时间延长而改变,例如某肿瘤手术后1年生存率0.980,2年生存率0.889…,往往时间越长生存率越低,复发率越高。
, http://www.100md.com
    随访病例,要有一个明确的标准起始时间,如诊断、手术后第1天、放射治疗结束后第1天等为开始时间,并有同一个截止时间,如1997年12月31日。随访的结果有4种情况:(1)死(或复发)于本病或死于本病的并发症。(2)死于其他疾病。(3)观察到截止日期还活着。(4)随访中失去联系。以上4种情况观察值均未能观察到预定的观察点,都不能提供完全信息,这种观察值称为终检值。失访病例由于没有提供完全的信息,不能按死亡处理。例如,乳癌术后生存,以手术后第1天开始,观察到1997年12月31日。某患者1991年12月手术,1995年12月死于乳癌的并发症,她的随访时间是48个月,结局死亡,属于非终检值。另一患者1996年1月手术,1997年12月还生存,随访时间24个月,结局生存,属于终检值。从开始观察到出现结果(死亡或复发)称为生存(或复发)时间。临床工作者为了解肿瘤治疗效果,计算生存率,往往还要知道生存率与各种影响因素,如性别、年龄、手术后开始放射治疗时间、放射治疗剂量、淋巴结是否有转移、病理类型等的关系。下面就这两个问题进行讨论。

, 百拇医药     1 生存率的计算

    计算生存率有两种方法:直接法和生存率法。

    1.1 直接法:

    以计算放射治疗5年生存率为例,以放射治疗后第1天为开始时间,分子是活过5年病例数,分母是期初的观察数,应包括放射治疗后活过5年的病例数和5年内死亡的病例数。例如,病理分级3级的子宫内膜癌生存率的计算,原始资料见表1。

    表1 子宫内膜癌原始资料 患者编号

    1

    2

    3

    4
, 百拇医药
    5

    6

    7

    8

    9

    10

    11

    12

    13

    14

    随访时间(个月)

    6

    9

    12
, 百拇医药
    12

    21

    24

    26

    27

    34

    36

    40

    48

    48

    60

    结局*

    1
, http://www.100md.com
    1

    1

    0

    1

    1

    1

    1

    1

    1

    1

    1

    1

    1

    注:*:1为非终检值,0为终检值
, http://www.100md.com
    1年生存率:11/14×100%=78.6%,2年生存率:9/13×100%=69.2%,3年生存率:5/13×100%=38.5%,5年生存率:0/13×100%=0。

    直接计算生存率法的优点是方法简单,在样本含量较大的情况下,可以得到满意的结果。由于病例要求必须观察满n年,未满n年的病例则必须剔除,丢掉了部分信息。本例中第4例患者因为是终检值,在计算2,3,5年的生存率时不能参与计算。还可能出现不合理的情况,如在计算几个不同年限的生存率时,有时会出现后1年的生存率比前1年的生存率高的不合理的现象,这可能与例数少有关。临床科研中病例数相对较少,终检值多,一般不采用直接计算法。

    1.2 生存率曲线

    生存率曲线又分为积极限(PL)法和寿命表法,属于非参数法。

    积极限(PL)法或称Kaplan-Meier估计法。其图示为生存曲线,它是以时间t为横坐标,生存(或缓解)率为纵坐标,表示时间与生存率函数曲线。根据曲线图可以对某一病例预期生存大于t的概率做出估计。仍以上例如某癌手术后病理分级为3级的生存率计算见表2。
, 百拇医药
    表2 生存率的计算 随访时间(个月)

    例数

    随访结果

    期初人数

    时点生存概率

    生存率

    生存率标准差

    6

    1

    1

    14

    0.928 6

    0.928 6
, http://www.100md.com
    0.068 8

    9

    1

    1

    13

    0.923 0

    0.857 1

    0.093 5

    12

    1

    1

    12

    0.916 6
, http://www.100md.com
    0.785 7

    0.109 7

    12

    1

    0

    11

    1.000 0

    0.785 7

    0.109 7

    21

    1

    1

    10
, 百拇医药
    0.900 0

    0.707 1

    0.123 6

    24

    1

    1

    9

    0.888 8

    0.628 6

    0.132 5

    26

    1

    1
, 百拇医药
    8

    0.875 0

    0.550 0

    0.137 3

    27

    1

    1

    7

    0.857 1

    0.471 4

    0.138 3

    34

    1
, 百拇医药
    1

    6

    0.833 3

    0.392 8

    0.135 7

    36

    1

    1

    5

    0.800 0

    0.314 2

    0.129 3

    40
, http://www.100md.com
    1

    1

    4

    0.750 0

    0.235 8

    0.118 5

    48

    2

    1

    3

    0.333 3

    0.078 6

    0.075 3
, 百拇医药
    60

    1

    1

    1

    0

    0

    0

    上表计算方法:首计算各时点的生存概率,例:随访6个月时共有14人(后面的每个人都经过6个月这一时点且生存),死亡1例,生存13例,时点的生存概率0.928 5,9个月时点共有13人,死亡1例,生存12人,时点的生存概率0.923 0,12个月时点共有12人,死亡1人时点的生存概率0.916 6,48个月共有3人死亡2人,生存概率0.333。然后将各时点生存概率求积,就是该点的生存率,又称累积生存率。6个月0.928 5,9个月0.928 5×0.923 0是0.857 1,12个月0.857 1×0.916 6是0.785 6…。生存率曲线计算方法的优点:不论是死亡、失访、死于他病、截止时还活着的病例都能参加生存率的计算,因而能够最充分利用了每1例病人的信息。此种方法特别是终检值较多时是临床随访资料常用的方法。
, 百拇医药
    根据不同要求,如按不同年龄、不同性别、不同危险度等,可以计算不同的生存率曲线(Kaplan-Meier曲线)。

    2 不同样本的生存率的比较

    临床科研工作者需要探讨影响生存率的因素,即对不同样本生存率的比较,有终检值时,常用gehen比分法、Log-rank检验、wilcoxon比分法检验。这些检验方法是对某一个因素的检验,单因素方法。这些方法属于非参数方法。现以Log-rank法(又称时序检验)说明其意义。

    例如某癌手术后病理分级2,3级比较,病理2级1,3,5年生存率0.833 3,0.694 0,0.574 0。3级1,3,5年生存率为0.785 7,0.314 2,0.0。用Log-rank检验是对两条生存率曲线做检验,虽然选用χ2统计量,但是与一般的四格表两个率的χ2检验计算过程不同。计算方法从略,结果见表3。
, 百拇医药
    表3 Log-rank检验 级别

    病例数

    实际死亡数

    理论死亡数

    2

    24

    10

    16.34

    3

    14

    13

    6.66

    经Logr-ank检验χ2=8.49,P=0.003。根据以上检验结果可以认为病理分级不同生存率也不同。病理分级2级生存率高于3级。
, 百拇医药
    3 Cox回归模型

    上面不同样本生存率的检验方法只能用于单因素分析,不能用于多因素分析,Cox回归模型是用于随访资料的单因素和多因素统计分析,Cox回归模型是一种比例风险函数,属于半参数方法。基本公式如下:

    h(t)=h0(t)e1x12x2+…βkxk) (1)

    如果以死亡作为风险度,h(t)表示某患者在t时点出现的死亡率,t指生存时间;h0表示某患者在t的本底死亡率(即x1 x2 …xk为0时);x1 x2 …xk表示可能与生存率有关的个体特征变量,如年龄,病理类型等;β1β2…βk 表示Cox模型的回归系数,根据资料的实际数据计算而得;β1x1:表示第一个因素x1如(年龄)所产生的作用,使病死率由h(t)增加至h0(t)eβ1x1,常数e=2.718。从式(1)可见死亡风险度与βixi有关,当βi为正数时增加死亡风险度,当βi为负数时降低死亡风险度。
, 百拇医药
    4 Cox回归模型的用途:

    4.1 对生存率危险因素的筛选,计算Cox模型的回归系数(β1β2…βk)。并进行显著性检验,可以在众多的影响预后的因素中挑选出有显著性的因素。

    4.2 对病人的预后预测预报,由式(1)可见β1x12x2+…βkxk直接影响到危险度,其值大病死率高预后差,其值小病死率低预后好。可以反映预后,称为危险度,又称预后指数(PI)。

    PI=β1(x1-1)/S1+β2(x2-2)/S2+…βk(xk-k)/Sk (2)
, 百拇医药
    式中i为xi的平均数,Si为标准差,β1β2…βp为有显著性的回归系数值。根据式(2)可以计算出全部病人的PI值,根据PI值可将病人分为3~5组分别计算不同PI值组别的生存率,可用Breslow法(Cox模型)或Kaplan-Meier法。

    4.3 计算相对危险度(PR)

    PRk=eβk (3)

    上面公式适合变量值xi是0和1的资料。

    现用83例子宫内膜癌为例,对Cox回归模型结果做解释,见表4。

    表4 83例子宫内膜原始数据 患者编号
, 百拇医药
    x1

    x2

    x3

    x4

    x5

    x6

    x7

    x8

    time

    cen

    1
, http://www.100md.com
    41

    0

    1

    2

    1

    0

    2

    2

    276

    0

    2

    54

    1

    1
, 百拇医药
    1

    0

    0

    2

    1

    262

    0

    ┇

    ┇

    ┇

    ┇

    ┇

    ┇

    ┇
, 百拇医药
    ┇

    ┇

    ┇

    ┇

    83

    52

    5

    1

    2

    1

    1

    3

    4

    42
, 百拇医药
    1

    表中x1年龄,x2手术方法,x3病理类型,x4病理分级,x5肌层浸润,x6颈管累及,x7临床分期(旧法),x8临床分期(新法),time随访时间,cen随访结果。1号患者年龄41岁,手术方法为子宫全切,病理类型属腺癌,病理分级属2级,无肌层浸润,未累及颈管,临床分期(旧法)属于

    Ⅰa,临床分期(新法)属于Ⅰa,随访时间276个月,随访结果:生存(或死于其他疾病,或失访)影响子宫内膜癌生存率的8个影响因素,通过Cox回归模型回归分析,计算回归系数,并对回归系数进行显著性检验,筛选出生存率的影响因素,结果见表5。表5 Cox回归模型的筛选结果 因 素

    x
, http://www.100md.com
    s

    病理分级(x4)

    1,2,3

    1.63

    0.76

    肌层浸润(x5)

    0,1,2

    1.07

    0.71

    临床新法分期(x8)

    1~5

    2.78
, 百拇医药
    1.47

    因 素

    回归系数

    (β)

    标准误

    病理分级(x4)

    1.174 5

    0.385 9

    肌层浸润(x5)

    1.354 2

    0.495 8

    临床新法分期(x8)
, 百拇医药
    0.600 8

    0.214 4

    因 素

    t

    P

    病理分级(x4)

    3.042

    0.003

    肌层浸润(x5)

    2.731

    0.008

    临床新法分期(x8)
, 百拇医药
    2.802

    0.006

    表5可见生存率与病理分级,肌层浸润、临床新法分期有关(P<0.05),回归系数值均为正数,显示出正相关关系。病理分级越高、肌层浸润越深、临床新法分期越高,预后越差,病死率越高。

    从表5显示出的回归系数可得到预后指数公式。

    PI=1.174 5×(x4-1.63)/0.76+1.354 2×(x5-1.07)/0.71+0.600 8×(x8-2.78)/1.47

    根据上式,可计算出每1例患者的PI值。例如某患者x4=1,x5=0,x8=1,PI=-3.74。83例患者的PI值范围在-3.74至4.80,以PI值为0时为界,将全部资料分为两个组,PI<0共43例,其中随访时间最短24个月,最长278个月,无1例死亡。PI≥0,40例,最短3个月,最长278月,死亡24例。用Kaplan-Meier计算生存率,并绘制生存曲线。见表6及图1。表6 不同PI值子宫内膜癌生存率 时间(年)
, http://www.100md.com
    PI<0

    PI≥0

    0

    1.0±0.0

    1.000±0.00

    1

    1.0±0.0

    0.825±0.06

    2

    1.0±0.0

    0.696±0.07

    3

    1.0±0.0
, 百拇医药
    0.545±0.08

    4

    1.0±0.0

    0.417±0.08

    5

    1.0±0.0

    0.341±0.08

    6

    1.0±0.0

    0.341±0.08

    7

    1.0±0.0

, 百拇医药     0.299±0.08

    8

    1.0±0.0

    0.299±0.08

    9

    1.0±0.0

    0.299±0.08

    10

    1.0±0.0

    0.299±0.08

    图1 生存率曲线

    从表6,图1可见子宫内膜癌手术治疗后,生存率与病理分级、肌层浸润、临床分期(新法)有关。以PI是0为界将资料分为两组:PI<0,观察43例,无1例死亡,1,3,5年生存率为1.000;PI≥0时,观察40例死亡24例,1,3,5年生存率分别为0.825,0.545,0.341。对于新病例先计算PI值并估计其预后。所以Cox回归模型的分析在临床中得到广泛的应用。

    计算机的通用统计软件如SPSS,SAS,STATA软件包均有生存分析的程序,可用于Cox回归模型分析,以上资料分析用STATA软件完成。

    (收稿:1998-08-01 修回:1998-09-17), http://www.100md.com