关键词:
一、问题的提出
百分位数是统计资料描述的重要指标。特别是中位数,不仅具有很好的稳定性,且适用范围广泛,可用于偏态资料,分布不明的资料和分布两端无确定值的资料。频数表中计算中位数和百分位数的方法在医学统计学的有关专著和教科书中均有详细介绍〔1,2〕 ,但对于原始数据,却都仅给出了计算中位数(M)的公式:
(1)
式中n为一组观察值的总个数,(),()及()为有序数列中观察值的位次,,及为相应位次上的观察值。
(1)式只适用于中位数的计算,而用原始资料计算百分位数的方法,尚未见到有关的报道。这给教学工作和实际应用带来了诸多不便。本文通过研究,给出了用原始数据计算百分位数的通用公式。
二、计算百分位数、中位数的通用公式
用原始资料计算百分位数Xp 时,关键是找出相应的百分位数在最小值(有序数列中的第1个值)和最大值(有序数列中的第n个值)之间的位次,并要求该位次的左边占第一个数到第n个数间距(n-1)的p部分,右边占整个间距的1-p部分。因此,若以d表示百分位数Xp 所在位次,则有
(2)
公式(2)中〔d〕表示取d的整数部分,X(〔d〕) 、X(〔d+1〕) 分别表示位次为〔d〕,〔d+1〕上的观察值。应用公式(2)可对原始资料求百分位数和中位数,因此,公式(2)可代替公式(1)。
三、计算实例
测得19名新生儿出生时体重(kg),排序后结果如下:
1 2 3 4 5 6 7 … 19
2.4 2.5 3.0 3.0 3.1 3.1 3.1 … 3.9
试求其10%分位数。
由公式(2),得d=1+(19-1)×0.10=2.8,
X10% =X(2) +(X(3) -X(2) )×(2.8-2)
=2.5+(3.0-2.5)×0.8=2.9(kg)
即10%分位数为2.9kg。若用例数乘百分数,所得位次为19×0.10=1.9,百分位数为2.4+(2.5-2.4)×(1.9-1)=2.49,因最小值(位次为1)距该位次的距离仅为0.9,占总距离的×100%=5%。显然与百分位数定义不相符。
参考文献
1.郭祖超主编.医用数理统计方法.第3版,北京:人民卫生出版社,1988,25~30.
2.杨树勤主编.卫生统计学.第3版,北京:人民卫生出版社,1996,8~17