当前位置: 首页 > 期刊 > 《数理医药学杂志》 > 1999年第3期
编号:10261319
线性回归预测模型有效超前期的确定方法
http://www.100md.com 《数理医药学杂志》 1999年第3期
     作者:薛付忠 王洁贞 韩向远* 马希兰**

    单位:薛付忠 王洁贞 韩向远* 马希兰**(山东医科大学公共卫生学院卫生统计学 教研室 济南250012)

    关键词:

    990302

    线性回归预测模型是应用线性回归技术,根据历史数据建立回归方程,用此回归方程进行超前预测。然而,建立了一个线性回归模型能否用其做无限期的超前预测呢?显然,一个预测模型的预测精度随着超前期的增加而逐渐降低,即预测误差越来越大。当外推至某一期时,预测误差之大,使该模型继续作外推预测几乎不再有什么实际意义,此时的预测超前期的长度我们称之为有效超前期。下面讨论线性回归预测模型有效超前期的一种确定方法。

    1 确定方法
, 百拇医药
    对于一元线性回归预测模型

    Yi12xi+ei;ei~N(0,σ2),(i=1,2,…n) (1)

    此模型参数的最小二乘估计为: (2)

    未来观察值

    因此, (3) (4)
, 百拇医药
    这里,

    如果将来在第k+1期时,实际观察值超出了95%的预测置信区间,就认为该模型再继续做外推预测已没有意义,该模型有效超前期就为k期,换言之,上述条件等价于 (5)

    或 (6)

    这里需要指出的是,选择置信度为95%,是因为它在实际预测中应用最广,当然也可以根据实际需要选择其它置信度。

    以上结果不难推广到一般多元线性回归预测模型(包括可线性化模型): (7,8)
, 百拇医药
    2 实例

    下面以某流行性出血热监测区流行性出血热(EHF)年发病率的预测为例,讨论线性回归预测模型有效超前期的确定方法。

    表1是该区EHF历年发病率及其相关因素。1993年时,为预测该监测区今后EHF年发病率,用1984~1993年数据建立直线模型和二元线性模型如下。

    表1 某流行性出血热监测区历年发病情况及其相关因素 年

    份

    年度缩

    减值

    t

    年发病率

    (1/10万)
, 百拇医药
    Y

    当年一季度

    平均鼠密度(%)

    x1

    去年第四季度平均

    人群阴性感染率(%)

    x2

    1984

    1

    10.02

    2.75

    8.41
, 百拇医药
    1985

    2

    13.02

    2.71

    7.00

    1986

    3

    16.06

    2.61

    6.31

    1987

    4

    14.05
, 百拇医药
    2.57

    6.02

    1988

    5

    22.98

    3.14

    6.49

    1989

    6

    20.90

    2.80

    6.03

    1990
, http://www.100md.com
    7

    22.01

    2.79

    6.39

    1991

    8

    24.00

    3.21

    6.51

    1992

    9

    28.01

    3.36
, 百拇医药
    6.91

    1993

    10

    27.99

    2.89

    5.61

    1994

    11

    27.96

    2.89

    4.37

    1995

    12
, http://www.100md.com
    11.15

    2.79

    8.12

    1996

    13

    13.52

    3.90

    5.91

    1997

    14

    52.97

    2.62

    8.32
, http://www.100md.com
    直线模型:

    s=1.9543,F=85.440,P<0.01;t=9.243,P<0.01

    二元线性模型:=-1.697982+18.295931x1-4.741959x2

    s=2.4489,F=26.255,P<0.01;t1=5.950,P<0.01;t2=4.456,P<0.01

    两模型的外推预测结果见表2。

    下面考察上述两模型的预测有效超前期。
, http://www.100md.com
    对于直线模型,据(6)、(7)式:

    当外推到1994年时

    同理,当外推到1995年时,t1995=8.7374>t0.05/2(8)

    或

    由此可见,当直线模型外推至1995年时,实际值已超出95%的置信区间。因此其预测有效超前期为1年。

    表2 两模型外推预测结果 年份

    tt12
, 百拇医药
    1994

    11

    27.96

    30.8421

    2.8821

    0.1031

    30.4549

    2.4949

    0.0892

    1995

    12

    11.15

    32.8309
, 百拇医药
    21.6809

    1.9445

    10.8430

    -0.3070

    0.0275

    1996

    13

    13.52

    34.8197

    21.2997

    1.5754

    41.6312

, 百拇医药     28.1112

    2.0792

    1997

    14

    52.97

    36.8085

    -16.161

    0.3051

    6.7843

    46.0057

    0.8715

    对于二元线性预测模型,据(9)、(10)式:
, 百拇医药
    当外推到1994年时

    同理,当外推到1995年时,t1995=0.09930.05/2(7)

    当外推到1996年时,t1996=6.8274>t0.05/2(7)

    当外推到1997年时,t1997=11.1732>t0.05/2(7)

    或

    因此,二元线性预测模型的预测有效超前期为2年。

    本法对线性回归预测模型及可线性化的模型有效,有关非线性模型预测有效超前期的确定方法及线性预测模型的有效超前期显著性检验方法作者将另文讨论。

    * 山东省平邑县地方镇中心医院 ** 山东省平邑县卫生防疫站

    收稿日期:1999-01-15, 百拇医药