当前位置: 首页 > 医学版 > 医学理论 > 临床医学 > 临床生物化学和生物化学检验
编号:98327
第四节 临床生化方法学性能判断
http://www.100md.com 《临床生物化学和生物化学检验》

第四节 临床生化方法学性能判断

候选方法可否被接受,最后根据评价实验中的误差结果进行归纳,作出判断。West-gard曾经对医学决定水平上的分析误差,采用统计学方法制定出一套判断指标,首先是制定“可允许误差的95%限度”,然后计算各项误差并与其比较,任何一项指标大于可允许误差都不能被接受。

一、方法学性能标准及其制定

(一)性能标准

性能标准(performance standards,PS)也称分析目标,应根据不同的应用目的(筛选、诊断、预后、监测)而异。由允许分析误差(allowable analyticalerror)和医学决定水平(medical decision level)这两项内容决定。

⒈允许分析误差 用EA表示,它被规定为95%样品的允许误差限度,即95%的病人样品其误差应小于这个限度。

⒉医学决定水平 用Xc表示,临床判断结果具有意义的分析物浓度。

EA和Xc两项内容,就是一个测定方法的性能指标。但对于每一医学决定水平都应规定相应的性能标准,即在一定Xc值下的EA值。以血清葡萄糖测定为例。在Xcl=2.8mmol/L,Xc2=6.7mmol/L,Xc3=8.9mmol/L时,其相应的EA均为0.56mmol/L,而在Xc4=16.8mmol/L,其EA为1.4mmol/L。

这表示当葡萄糖浓度在2.8mmol/L、6.7mmol/L和8.9mmol/L时,95%的样品具有的误差不得大于0.56mmol/L,而浓度在16.8mmol/L时,95%的样品所具有的误差不得大于1.4mmol/L。这里指的是总误差。

(二)性能标准的制定

制定的性能标准,既应反映临床应用与解释结果的要求,称为医学效用限度(medical usefulness limits),又应基本符合实验室所能达到的技能状态(state of art)。因此,需要由临床医学家和临床化学家共同研究制定。

⒈根据参考值与参考范围而定的标准这是Tonks于1963年提出的,其公式是:

最大的可允许误差定为±10%,但对某些物质(如酶)则提高到±20%。由于其允许误差以参考范围表示,有临床实用意义,但缺点是参考范围的宽度与试验本身的不精密度有关,一项不精密的方法由于测出的参考范围较宽,以致可制定出较宽的可允许误差限度,就会使一项性能不够好的分析方法的应用合法化。

⒉根据临床观察制定的标准 这往往反映参与与制定的医生的经验,综合临床及实验室的意见,提出在医学决定水平上的不精密度标准。还有不准确度及综合不精密度与不准确度的标准。一般说来,在参考范围内的中间及很不正常的水平时,医生允许有较大的变异系数。特别是用于诊断,而不是用于监视疗效的。但在医学决定水平需要最严格的指标。这种方法的缺点是主观成分较大,而且收集临床的意见也很困难,它依赖于临床医生对实验室工作的充分了解。

⒊根据生物学变异制定的不精密度标准 生物学变异或称生理变异(CVB)包括个体内变异(CVP)及个体间变异(CVg),也就是通常所说的生理波动。

美国病理学会建议,为了在人群中筛选某些疾病,不精密度(CV)应等于或小于个体内及个体间变异的二分之一(即≤1/2CVB)。对于个别试验,目的在于辅助诊断或监测治疗效果,则CV应小于或等于1/2CVP。但目前文献报告的生物学变异数据不一致,由于这种方法比较好,将来可能会有更多的研究。

⒋根据实验室技能状态制定的标准 技能状态是根据技术熟练而且误差最小的一组实验室的数据,计算出在参考范围高限的变异系数作为标准的,这实际上是指当前技术水平所可能达到的技能状态。当然,技能状态有继续进步的趋势,在没有更好的标准以前,技能状态还会继续用作实验室工作性能的标准。对于生物变异相当大的项目,以技能状态作为不精密度的标准更为合适。

二、使用单值判断指标判断

单值判断指标(single-value criteria)较简单,在评价过程中用于初步估量。

⒈计算公式 单值判断指标的计算公式见表20-3

表20-3 单值判断指标

误差类别

判断指标

备注

随机误差(RE)

1.96TMA

Xc

STM=重复试验的标准差

比例误差(PE)

(|R-100|)(棧?/EA

100

R=平均回收率

恒定误差(CE)

|偏差|A

由干扰试验测出

系统误差(SE)

|(a+bXc)-XcA

对比试验回归方程

总误差(TE=RE+SE)

1.96STM+|(a+bXc)|A

包括偶然及系统误差

⒉结果判断 单值判断指标是可接受性能的估计指标。对前述各项实验

结果经计算得到各项误差值后,分别与EA值比较,必须都比EA小,该方法才初步判断为可接受,否则为不可接受,可改进分析方法减少误差或排除该方法。

判断举例:用单值判断指标判断某法测定血肌酐的结果:

设Xc=176.8μmol/L时,EA=35.4μmol/L,

⑴偶然误差

重复性误差:n=20,X=176.8μmol/L,STM=3.536μmol/L

判断:1.96STM=1.96×3.563μmol/L=6.93μmol/L,因REA,偶然误差可以接受。

⑵系统误差:回归方程:n=50,a=-0.98,b=0.925,Y=-0.98+0.925X。

SE=|(a+bXc)-Xc|=|(-0.98+0.925×176.8)-176.8|=14.24μmol/L

判断:|(a+bXc)Xc|A,系统误差可以接受。

⑶总误差:RE=6.93μmol/L,SE=14.24μmol/L

判断:RE+SE=6.93+14.24=21.17μmol/LA,总误差可以接受,故该方法为可接受。

对于一个判断为不能接受的方法,为了减少某一误差而作了改进,则各个评价试验都须重新进行做。

单值判断指标虽简单,但主要问题是各项试验的样品数都较小,使测定值极可能是分析误差的不可靠测量,最后使实验估计发生错误。因此,只有在假设所有实验结果是绝对正确的前提下,才能进行上述计算。为了在适当的样品数下,能以最小的代价取得实验误差测定的最大可靠性,可用可信区间判断指标。

三、使用可信区间判断指标判断

可信区间判断指标比较复杂,但能对方法性能提供更客观的决定,起最后判断作用。

⒈90%可信区间,可信上限及可信下限 统计学的规律说明,每种测定结果的可靠性与测定次数有关,次数愈多,结果反映真实性愈强;但实际上,不可能进行大量的测定。在统计学中为了估量分析误差的不确定性,对于每一误差可计算其可信区间,用可信上限与可信下限代替单值的估量,EU为误差的可信上限,EL为误差的可信下限。West-gard推荐用90%的可信区间,这样,EU将是误差单侧的95%上限,用此判断候选方法的可接受性比较可靠。假如,EUA,则方法性能为可接受;假如EL>EA,则方法必须改进,以减少误差,否则排除。假如EU>EA,但ELA,说明仅有的数据不足以作出任何有关可接受性的结论,还需继续实验以收集更多的数据,以便对分析误差作出较好的估量。可信区间判断指标见表20-4

表20-4 可信区间判断指标

这些指标在形式上与表20-3的单值判断指标相似,最明显的差别是对每一类型误差用两个判断指标,其一是判断可接受性,其二是判断排除。对RE、PE及CE的判断指标,仅用了误差估量的上限和下限。SE和TE的判断指标较为复杂,引入了一个新的术语“W”。

W是回归线可信区间的宽度(与给定的Xc相对应的Yc值范围),对于一给定的Xc,Yc的上下可信限由方程(a+bXc)±W计算得到。W计算式如下:

W=t(SY/X)〔1/N+(Xc-X)2/∑(Xi-X)21/2

W的大小取决于选择的百分区间(这里是90%),即和选择的值有关(这里选双侧)。W也和回归线标准差SY/x成正比关系,SY/x直接反应方法对比数据的不确定性。中括号内的式子表明,在N很大,Xc=X,W很小,若Xc无论在哪一方向逐渐偏高X,则(Xc-X)之差增大,W也增大。如图20-3表示。

图20-3 回归线的可信区间

⒉计算举例 这里介绍某血清钙测定方法的各种评价实验数据,用五个例子概括说明。需指出的是,作为误差估量的上下限,必须具有相同的代数符号,否则下限应取作零。

例一 用可信区间判断指标确定偶然误差(RE)是否为可接受。

由重复性试验获得:N=21,Y=11.0mmol/L,STM=0.08mmol/L

假设Xc=11.0mmol/L时,EA=0.5mmol/L,

⑴计算STN的95%可信限

STMU=STM×fu STML=STM×fL

由表20-5查自由度

df=(N-1)fU、fL的值(f为计算因素)

现N=21,df=20,fU=1.358,fL=0.7979

则:STMU=0.08×1.358=0.11mmol/L

STML=0.08×0.7979=0.06mmol/L

表20-5计算单侧可信限(95%)的f值

df

fu

fl

10

1.593

0.7391

20

1.358

0.7979

30

1.274

0.8279

40

1.228

0.8480

60

1.179

0.8710

80

1.151

0.8860

100

1.133

0.8968

⑵计算REU和REL

REU=1.96STMU=1.96×0.11=0.22mmol/L

REL=1.96STML=1.96×0.06=0.12mmol/L

⑶将以上估量值与EA比较

REUA即0.22<0.5。因此,由重复性试验所得的RE是在可接受的低水平上。

例二 由可信区间判断指标判断比例误差(PE)是否为可接受。

回收试验的数据:N=9,R=99、98、98、99、100、98、99、100(%)

设:Xc=11.0mmol/L,EA=0.5mmol/L

⑴计算平均回收率R及标准误SR

R=98.9% SR=0.78%

⑵计算平均回收率的标准误SR

表20-6 90%可信区间或95%可信限的t值

df

T

df

t

3

2.35

12

1.78

4

2.13

14

1.76

5

2.02

16

1.75

6

1.94

20

1.72

7

1.90

25

1.71

8

1.86

30

1.70

9

1.83

40

1.68

10

1.81

120

1.66

⑶计算R的95%可信限

RU=R+t×SR RL=R-t×SR

从表20-6 t值表中查t值

现N=9,df=8,t0.01=1.86

则:RU=98.9+1.86×0.26

98.9+0.48=99.4%

RL=98.9-1.86×0.26

=98.9-0.484=98.42%

⑷计算%PE的上下可信限:

%PEU=|RUL-100|U

%PEL=|RUL-100|L

%PEU=|98.4-100|=1.6%

%PEL=|99.4-100|=0.6%

⑸将%PEU及%PEL与Xc相乘,换算成浓度单位%PEU及%PEL

PEU=%PEU·Xc=1.6%×11.0mmol/L=0.18mmol/L

PEL=%PEL×Xc=0.6×11.0mmol/L=0.07mmol/L

⑹将以上测得的PRU值与EA作比较

PEUA即0.18<0.5。因此,作为回收试验测得的PE值是在可接受的低水平上。

例三 用可信区间判断指标确定恒定误差(CE)是否为可接受。

由干扰试验得到下列数据表20-7

表20-7 干扰试验结果

, 百拇医药(郑铁生)

标本号

测得浓度mmol/L

干扰值

Mmol/L

未加干扰物

加干扰物

1

10.72

10.69

-0.03

2

8.56

8.51

-0.05

3

11.60

11.58

-0.02

4

6.45

6.41

-0.04

5

14.12

14.08

-0.04

6

12.30

12.27

-0.03

7