线性回归预测模型有效超前期的确定方法
作者:薛付忠 王洁贞 韩向远* 马希兰**
单位:薛付忠 王洁贞 韩向远* 马希兰**(山东医科大学公共卫生学院卫生统计学 教研室 济南250012)
关键词:
990302
线性回归预测模型是应用线性回归技术,根据历史数据建立回归方程,用此回归方程进行超前预测。然而,建立了一个线性回归模型能否用其做无限期的超前预测呢?显然,一个预测模型的预测精度随着超前期的增加而逐渐降低,即预测误差越来越大。当外推至某一期时,预测误差之大,使该模型继续作外推预测几乎不再有什么实际意义,此时的预测超前期的长度我们称之为有效超前期。下面讨论线性回归预测模型有效超前期的一种确定方法。
1 确定方法
, 百拇医药
对于一元线性回归预测模型
Yi=β1+β2xi+ei;ei~N(0,σ2),(i=1,2,…n) (1)
此模型参数的最小二乘估计为: (2)
未来观察值
因此, (3) (4)
, 百拇医药
这里,
如果将来在第k+1期时,实际观察值超出了95%的预测置信区间,就认为该模型再继续做外推预测已没有意义,该模型有效超前期就为k期,换言之,上述条件等价于 (5)
或 (6)
这里需要指出的是,选择置信度为95%,是因为它在实际预测中应用最广,当然也可以根据实际需要选择其它置信度。
以上结果不难推广到一般多元线性回归预测模型(包括可线性化模型): (7,8)
, 百拇医药
2 实例
下面以某流行性出血热监测区流行性出血热(EHF)年发病率的预测为例,讨论线性回归预测模型有效超前期的确定方法。
表1是该区EHF历年发病率及其相关因素。1993年时,为预测该监测区今后EHF年发病率,用1984~1993年数据建立直线模型和二元线性模型如下。
表1 某流行性出血热监测区历年发病情况及其相关因素 年
份
年度缩
减值
t
年发病率
(1/10万)
, 百拇医药
Y
当年一季度
平均鼠密度(%)
x1
去年第四季度平均
人群阴性感染率(%)
x2
1984
1
10.02
2.75
8.41
, 百拇医药
1985
2
13.02
2.71
7.00
1986
3
16.06
2.61
6.31
1987
4
14.05
, 百拇医药
2.57
6.02
1988
5
22.98
3.14
6.49
1989
6
20.90
2.80
6.03
1990
, http://www.100md.com
7
22.01
2.79
6.39
1991
8
24.00
3.21
6.51
1992
9
28.01
3.36
, 百拇医药
6.91
1993
10
27.99
2.89
5.61
1994
11
27.96
2.89
4.37
1995
12
, http://www.100md.com
11.15
2.79
8.12
1996
13
13.52
3.90
5.91
1997
14
52.97
2.62
8.32
, http://www.100md.com
直线模型:
s=1.9543,F=85.440,P<0.01;t=9.243,P<0.01
二元线性模型:=-1.697982+18.295931x1-4.741959x2
s=2.4489,F=26.255,P<0.01;t1=5.950,P<0.01;t2=4.456,P<0.01
两模型的外推预测结果见表2。
下面考察上述两模型的预测有效超前期。
, http://www.100md.com
对于直线模型,据(6)、(7)式:
当外推到1994年时
同理,当外推到1995年时,t1995=8.7374>t0.05/2(8)
或
由此可见,当直线模型外推至1995年时,实际值已超出95%的置信区间。因此其预测有效超前期为1年。
表2 两模型外推预测结果 年份
tt12
, 百拇医药
1994
11
27.96
30.8421
2.8821
0.1031
30.4549
2.4949
0.0892
1995
12
11.15
32.8309
, 百拇医药
21.6809
1.9445
10.8430
-0.3070
0.0275
1996
13
13.52
34.8197
21.2997
1.5754
41.6312
, 百拇医药 28.1112
2.0792
1997
14
52.97
36.8085
-16.161
0.3051
6.7843
46.0057
0.8715
对于二元线性预测模型,据(9)、(10)式:
, 百拇医药
当外推到1994年时
同理,当外推到1995年时,t1995=0.09930.05/2(7)
当外推到1996年时,t1996=6.8274>t0.05/2(7)
当外推到1997年时,t1997=11.1732>t0.05/2(7)
或
因此,二元线性预测模型的预测有效超前期为2年。
本法对线性回归预测模型及可线性化的模型有效,有关非线性模型预测有效超前期的确定方法及线性预测模型的有效超前期显著性检验方法作者将另文讨论。
* 山东省平邑县地方镇中心医院 ** 山东省平邑县卫生防疫站
收稿日期:1999-01-15, 百拇医药
单位:薛付忠 王洁贞 韩向远* 马希兰**(山东医科大学公共卫生学院卫生统计学 教研室 济南250012)
关键词:
990302
线性回归预测模型是应用线性回归技术,根据历史数据建立回归方程,用此回归方程进行超前预测。然而,建立了一个线性回归模型能否用其做无限期的超前预测呢?显然,一个预测模型的预测精度随着超前期的增加而逐渐降低,即预测误差越来越大。当外推至某一期时,预测误差之大,使该模型继续作外推预测几乎不再有什么实际意义,此时的预测超前期的长度我们称之为有效超前期。下面讨论线性回归预测模型有效超前期的一种确定方法。
1 确定方法
, 百拇医药
对于一元线性回归预测模型
Yi=β1+β2xi+ei;ei~N(0,σ2),(i=1,2,…n) (1)
此模型参数的最小二乘估计为: (2)
未来观察值
因此, (3) (4)
, 百拇医药
这里,
如果将来在第k+1期时,实际观察值超出了95%的预测置信区间,就认为该模型再继续做外推预测已没有意义,该模型有效超前期就为k期,换言之,上述条件等价于 (5)
或 (6)
这里需要指出的是,选择置信度为95%,是因为它在实际预测中应用最广,当然也可以根据实际需要选择其它置信度。
以上结果不难推广到一般多元线性回归预测模型(包括可线性化模型): (7,8)
, 百拇医药
2 实例
下面以某流行性出血热监测区流行性出血热(EHF)年发病率的预测为例,讨论线性回归预测模型有效超前期的确定方法。
表1是该区EHF历年发病率及其相关因素。1993年时,为预测该监测区今后EHF年发病率,用1984~1993年数据建立直线模型和二元线性模型如下。
表1 某流行性出血热监测区历年发病情况及其相关因素 年
份
年度缩
减值
t
年发病率
(1/10万)
, 百拇医药
Y
当年一季度
平均鼠密度(%)
x1
去年第四季度平均
人群阴性感染率(%)
x2
1984
1
10.02
2.75
8.41
, 百拇医药
1985
2
13.02
2.71
7.00
1986
3
16.06
2.61
6.31
1987
4
14.05
, 百拇医药
2.57
6.02
1988
5
22.98
3.14
6.49
1989
6
20.90
2.80
6.03
1990
, http://www.100md.com
7
22.01
2.79
6.39
1991
8
24.00
3.21
6.51
1992
9
28.01
3.36
, 百拇医药
6.91
1993
10
27.99
2.89
5.61
1994
11
27.96
2.89
4.37
1995
12
, http://www.100md.com
11.15
2.79
8.12
1996
13
13.52
3.90
5.91
1997
14
52.97
2.62
8.32
, http://www.100md.com
直线模型:
s=1.9543,F=85.440,P<0.01;t=9.243,P<0.01
二元线性模型:=-1.697982+18.295931x1-4.741959x2
s=2.4489,F=26.255,P<0.01;t1=5.950,P<0.01;t2=4.456,P<0.01
两模型的外推预测结果见表2。
下面考察上述两模型的预测有效超前期。
, http://www.100md.com
对于直线模型,据(6)、(7)式:
当外推到1994年时
同理,当外推到1995年时,t1995=8.7374>t0.05/2(8)
或
由此可见,当直线模型外推至1995年时,实际值已超出95%的置信区间。因此其预测有效超前期为1年。
表2 两模型外推预测结果 年份
tt12
, 百拇医药
1994
11
27.96
30.8421
2.8821
0.1031
30.4549
2.4949
0.0892
1995
12
11.15
32.8309
, 百拇医药
21.6809
1.9445
10.8430
-0.3070
0.0275
1996
13
13.52
34.8197
21.2997
1.5754
41.6312
, 百拇医药 28.1112
2.0792
1997
14
52.97
36.8085
-16.161
0.3051
6.7843
46.0057
0.8715
对于二元线性预测模型,据(9)、(10)式:
, 百拇医药
当外推到1994年时
同理,当外推到1995年时,t1995=0.0993
当外推到1996年时,t1996=6.8274>t0.05/2(7)
当外推到1997年时,t1997=11.1732>t0.05/2(7)
或
因此,二元线性预测模型的预测有效超前期为2年。
本法对线性回归预测模型及可线性化的模型有效,有关非线性模型预测有效超前期的确定方法及线性预测模型的有效超前期显著性检验方法作者将另文讨论。
* 山东省平邑县地方镇中心医院 ** 山东省平邑县卫生防疫站
收稿日期:1999-01-15, 百拇医药