线性回归预测模型有效超前期的确定方法
作者:薛付忠 王洁贞 马希兰
单位:薛付忠 王洁贞 山东医科大学公共卫生学院(210012); 马希兰 山东省平邑县卫生防疫站
关键词:
中国卫生统计990310 线性回归预测模型是应用线性回归技术,根据历史数据建立回归方程,用此回归方程进行超前预测。然而,建立了一个线性回归模型能否用其做无限期的超前预测呢?显然,一个预测模型的预测精度随着超前期的增加而逐渐降低,即预测误差越来越大。当外推至某一期时,预测误差之大,使该模型继续作外推预测几乎不再有什么实际意义,此时的预测超前期的长度我们称之为有效超前期。下面讨论线性回归预测模型有效超前期的一种确定方法。
对于一元线性回归预测模型
yi=β1+β2xi+ei;ei~N(0,σ2),(i=1,2,…n)
, http://www.100md.com
(1)
此模型参数的最小二乘估计为:
(2)
未来观察值
因此
(3)
(4)
, 百拇医药
这里:
如果将来在第k+1期时,实际观察值超出了95%的预测置信区间,就认为该模型再继续做外推预测已没有意义,该模型有效超前期就为k期,换言之,上述条件等价于
(5)
或
(6)
这里需要指出的是,选择置信度为95%,是因为它在实际预测中应用最广,当然也可以根据实际需要选择其他置信度。
以上结果不难推广到一般多元线性回归预测模型(包括可线性化模型)
, 百拇医药
(7)
(8)
下面以某流行性出血热监测区流行性出血热(EHF)年发病率的预测为例,讨论线性回归预测模型有效超前期的确定方法:
表1是该区EHF历年发病率及其相关因素。1993年时,为预测该监测区今后EHF年发病率,用1984~1993年数据建立直线模型和二元线性模型如下:
直线模型:=8.9653+1.9888t
s=1.9543 F=85.440 P<0.01 t=9.243 P<0.01
, 百拇医药
二元线性模型:=-1.697982+18.295931x1-4.741959x2
s=2.4489,F=26.255,P<0.01,t1=5.950,P<0.01;t2=4.456,P<0.01;
表1 某流行性出血热监测区历年
发病情况及其相关因素 年 份
年度缩
减值t
年发病率
(1/10万)y
, http://www.100md.com
当年一季度平均
鼠密度(%) x1
去年第四季度平
均人群阴性感
染率(%) x2
1984
1
10.02
2.75
8.41
1985
2
, http://www.100md.com
13.02
2.71
7.00
1986
3
16.06
2.61
6.31
1987
4
14.05
2.57
6.02
, 百拇医药
1988
5
22.98
3.14
6.49
1989
6
20.90
2.80
6.03
1990
7
22.01
, http://www.100md.com
2.79
6.39
1991
8
24.00
3.21
6.51
1992
9
28.01
3.36
6.91
1993
, http://www.100md.com
10
27.99
2.89
5.61
1994
11
27.96
2.89
4.37
1995
12
11.15
2.79
, 百拇医药
8.12
1996
13
13.52
3.90
5.91
1997
14
52.97
2.62
8.32
两模型的外推预测结果见表2。表2 两模型外推预测结果 年份
, 百拇医药 tt11-22-
, 百拇医药
1994
11
27.96
30.8421
2.8821
0.1031
30.4549
2.4949
0.0892
1995
12
11.15
32.8309
, http://www.100md.com
21.6809
1.9445
10.8430
-0.3070
0.0275
1996
13
13.52
34.8197
21.2997
1.5754
41.6312
, 百拇医药 28.1112
2.0792
1997
14
52.97
36.8085
-16.161
0.3051
6.7843
46.0057
0.8715
下面考察上述两模型的预测有效超前期:
, 百拇医药
对于直线模型,据(6)、(7)式:
当外推到1994年时
同理,当外推到1995年时,t1995=8.7374>t0.05/2(8)
或
由此可见,当直线模型外推至1995年时,实际值已超出95%的置信区间。因此其预测有效超前期为1年。
对于二元线性预测模型,据(9)、(10)式:
当外推到1994年时
, 百拇医药
c1994=1+(1 2.89 4.37)
同理,当外推到1995年时 t1995=0.09930.05/2(7)
当外推到1996年时 t1996=6.8274>t0.05/2(7)
当外推到1997年时 t1997=11.1732>t0.05/2(7)
或
所以,二元线性预测模型的预测有效超前期为2年。
本法对线性回归预测模型及可线性化的模型有效,有关非线性模型预测有效超前期的确定方法及线性预测模型有效超前期显著性检验方法作者将另文讨论。
参考文献
1.周概容.概率论与数理统计.高等教育出版社,1987,575~643., 百拇医药
单位:薛付忠 王洁贞 山东医科大学公共卫生学院(210012); 马希兰 山东省平邑县卫生防疫站
关键词:
中国卫生统计990310 线性回归预测模型是应用线性回归技术,根据历史数据建立回归方程,用此回归方程进行超前预测。然而,建立了一个线性回归模型能否用其做无限期的超前预测呢?显然,一个预测模型的预测精度随着超前期的增加而逐渐降低,即预测误差越来越大。当外推至某一期时,预测误差之大,使该模型继续作外推预测几乎不再有什么实际意义,此时的预测超前期的长度我们称之为有效超前期。下面讨论线性回归预测模型有效超前期的一种确定方法。
对于一元线性回归预测模型
yi=β1+β2xi+ei;ei~N(0,σ2),(i=1,2,…n)
, http://www.100md.com
(1)
此模型参数的最小二乘估计为:
(2)
未来观察值
因此
(3)
(4)
, 百拇医药
这里:
如果将来在第k+1期时,实际观察值超出了95%的预测置信区间,就认为该模型再继续做外推预测已没有意义,该模型有效超前期就为k期,换言之,上述条件等价于
(5)
或
(6)
这里需要指出的是,选择置信度为95%,是因为它在实际预测中应用最广,当然也可以根据实际需要选择其他置信度。
以上结果不难推广到一般多元线性回归预测模型(包括可线性化模型)
, 百拇医药
(7)
(8)
下面以某流行性出血热监测区流行性出血热(EHF)年发病率的预测为例,讨论线性回归预测模型有效超前期的确定方法:
表1是该区EHF历年发病率及其相关因素。1993年时,为预测该监测区今后EHF年发病率,用1984~1993年数据建立直线模型和二元线性模型如下:
直线模型:=8.9653+1.9888t
s=1.9543 F=85.440 P<0.01 t=9.243 P<0.01
, 百拇医药
二元线性模型:=-1.697982+18.295931x1-4.741959x2
s=2.4489,F=26.255,P<0.01,t1=5.950,P<0.01;t2=4.456,P<0.01;
表1 某流行性出血热监测区历年
发病情况及其相关因素 年 份
年度缩
减值t
年发病率
(1/10万)y
, http://www.100md.com
当年一季度平均
鼠密度(%) x1
去年第四季度平
均人群阴性感
染率(%) x2
1984
1
10.02
2.75
8.41
1985
2
, http://www.100md.com
13.02
2.71
7.00
1986
3
16.06
2.61
6.31
1987
4
14.05
2.57
6.02
, 百拇医药
1988
5
22.98
3.14
6.49
1989
6
20.90
2.80
6.03
1990
7
22.01
, http://www.100md.com
2.79
6.39
1991
8
24.00
3.21
6.51
1992
9
28.01
3.36
6.91
1993
, http://www.100md.com
10
27.99
2.89
5.61
1994
11
27.96
2.89
4.37
1995
12
11.15
2.79
, 百拇医药
8.12
1996
13
13.52
3.90
5.91
1997
14
52.97
2.62
8.32
两模型的外推预测结果见表2。表2 两模型外推预测结果 年份
, 百拇医药 tt11-22-
, 百拇医药
1994
11
27.96
30.8421
2.8821
0.1031
30.4549
2.4949
0.0892
1995
12
11.15
32.8309
, http://www.100md.com
21.6809
1.9445
10.8430
-0.3070
0.0275
1996
13
13.52
34.8197
21.2997
1.5754
41.6312
, 百拇医药 28.1112
2.0792
1997
14
52.97
36.8085
-16.161
0.3051
6.7843
46.0057
0.8715
下面考察上述两模型的预测有效超前期:
, 百拇医药
对于直线模型,据(6)、(7)式:
当外推到1994年时
同理,当外推到1995年时,t1995=8.7374>t0.05/2(8)
或
由此可见,当直线模型外推至1995年时,实际值已超出95%的置信区间。因此其预测有效超前期为1年。
对于二元线性预测模型,据(9)、(10)式:
当外推到1994年时
, 百拇医药
c1994=1+(1 2.89 4.37)
同理,当外推到1995年时 t1995=0.0993
当外推到1996年时 t1996=6.8274>t0.05/2(7)
当外推到1997年时 t1997=11.1732>t0.05/2(7)
或
所以,二元线性预测模型的预测有效超前期为2年。
本法对线性回归预测模型及可线性化的模型有效,有关非线性模型预测有效超前期的确定方法及线性预测模型有效超前期显著性检验方法作者将另文讨论。
参考文献
1.周概容.概率论与数理统计.高等教育出版社,1987,575~643., 百拇医药