注重散点图在直线相关回归分析中的作用
作者:杨永生
单位:苏州医学院卫生统计学教研室,苏州,215007
关键词:直线相关;直线回归
苏州医学院学报ACTA ACADEMIAE MEDICINAE SUZHOU1999年 第19卷 第8期 Vol 摘要 通过不同类型数据的分析,讨论了散点图在直线相关回归分析中的重要作用。
中图法分类 R195.1
在医学研究中经常探讨两个数值变量间的相互关系,其中最简单的关系是直线相关与直线回归关系。直线相关系数是描述直线相关关系密切程度与相关方向的统计指标,直线回归方程是描述两个数值变量间的直线回归关系,而不是描述曲线关系或其它关系。在直线相关回归分析中,所需满足的条件中最起码的条件是两个数值变量间必须有一定的线性趋势和具有实际意义。两个数值变量间是否存在线性趋势可以通过绘制散点图进行观察与确定。通过任何一组数值变量的观测数据值都能计算出一个直线相关系数和直线回归方程,但其结果却不一定正确。例如对附表中所示的4组不同观测数据y1~x1、y2~x2、y3~x3和y4~x4,可以计算出相应的直线相关系数和直线回归方程,结果为:r1=0.81,1=3.0+5.0x1,P<0.01;r2=0.79,2=3.0+5.0x2,P<0.01;r3=0.80,3=3.0+5.0x3,P<0.01;r4=0.80,4=3.0+5.0x4,P<0.01。直线相关系数很接近,直线回归方程基本相同,而且都在α=0.01的水准上有显著意义。然而绘制出相应的散点图却大不相同,绘制出相应的回归直线却不全合理,结果示于附图中。
, 百拇医药
附图 4组不同观测数据的散点图与回归直线
附表 4组不同观测数据 X1
Y1
X2
Y2
X3
Y3
X4
Y4
3.90
, 百拇医药 3.08
5.70
3.83
3.70
5.25
8.30
5.36
5.00
5.98
6.30
4.83
4.70
5.45
, http://www.100md.com
8.30
5.72
6.10
8.48
6.50
6.23
6.00
5.95
8.30
6.01
7.00
4.98
7.40
, 百拇医药
7.43
7.00
6.45
8.30
6.56
8.00
7.11
8.20
8.13
8.30
6.85
8.30
7.06
, 百拇医药
9.20
8.78
9.00
8.93
9.10
7.05
8.30
7.32
9.80
7.78
10.50
9.53
10.70
, http://www.100md.com
7.65
8.30
7.72
11.00
8.08
11.70
9.93
11.70
8.15
8.30
7.96
12.80
10.31
, http://www.100md.com
12.50
9.83
12.70
13.45
8.30
8.72
14.30
8.48
13.80
9.53
13.30
8.85
8.30
, http://www.100md.com
9.16
14.70
10.78
15.30
8.63
14.80
9.45
19.00
12.52
附图中(A)说明y1~x1间有直线趋势,模型正确,但不一定是因果关系,应根据专业知识判定是否有实际意义。附图中(B)说明y2~x2间无直线趋势,模型不正确,但有曲线趋势,应进一步拟合曲线关系。附图中(C)说明y3~x3中大部分观测值间有直线趋势,但有一偏离很远的观测值对分析结果带来了严重的影响,模型不正确,应对该观测值进行认真核查与深入分析。附图中(D)说明y4~x4间不一定有直线趋势,有一个观测值对分析结果带来了严重的影响,模型不正确,应增加对不同的自变量x增加一定的观测值再进行认真分析。综上所述在进行直线相关回归分析中要特别注重散点图的作用。绘制散点图在Office和统计分析软件中都是很容易实现的,千万不要只从单纯的数值计算结果下结论。当然在分析过程中对观测值的独立性、正态性与方差齐性也是必须注意的。
参考文献
1 杨树勤,主编.中国医学百科全书医学统计学.上海:上海科学技术出版社,1985,145~153
(1999年5月6日收稿), 百拇医药
单位:苏州医学院卫生统计学教研室,苏州,215007
关键词:直线相关;直线回归
苏州医学院学报ACTA ACADEMIAE MEDICINAE SUZHOU1999年 第19卷 第8期 Vol 摘要 通过不同类型数据的分析,讨论了散点图在直线相关回归分析中的重要作用。
中图法分类 R195.1
在医学研究中经常探讨两个数值变量间的相互关系,其中最简单的关系是直线相关与直线回归关系。直线相关系数是描述直线相关关系密切程度与相关方向的统计指标,直线回归方程是描述两个数值变量间的直线回归关系,而不是描述曲线关系或其它关系。在直线相关回归分析中,所需满足的条件中最起码的条件是两个数值变量间必须有一定的线性趋势和具有实际意义。两个数值变量间是否存在线性趋势可以通过绘制散点图进行观察与确定。通过任何一组数值变量的观测数据值都能计算出一个直线相关系数和直线回归方程,但其结果却不一定正确。例如对附表中所示的4组不同观测数据y1~x1、y2~x2、y3~x3和y4~x4,可以计算出相应的直线相关系数和直线回归方程,结果为:r1=0.81,1=3.0+5.0x1,P<0.01;r2=0.79,2=3.0+5.0x2,P<0.01;r3=0.80,3=3.0+5.0x3,P<0.01;r4=0.80,4=3.0+5.0x4,P<0.01。直线相关系数很接近,直线回归方程基本相同,而且都在α=0.01的水准上有显著意义。然而绘制出相应的散点图却大不相同,绘制出相应的回归直线却不全合理,结果示于附图中。
, 百拇医药
附图 4组不同观测数据的散点图与回归直线
附表 4组不同观测数据 X1
Y1
X2
Y2
X3
Y3
X4
Y4
3.90
, 百拇医药 3.08
5.70
3.83
3.70
5.25
8.30
5.36
5.00
5.98
6.30
4.83
4.70
5.45
, http://www.100md.com
8.30
5.72
6.10
8.48
6.50
6.23
6.00
5.95
8.30
6.01
7.00
4.98
7.40
, 百拇医药
7.43
7.00
6.45
8.30
6.56
8.00
7.11
8.20
8.13
8.30
6.85
8.30
7.06
, 百拇医药
9.20
8.78
9.00
8.93
9.10
7.05
8.30
7.32
9.80
7.78
10.50
9.53
10.70
, http://www.100md.com
7.65
8.30
7.72
11.00
8.08
11.70
9.93
11.70
8.15
8.30
7.96
12.80
10.31
, http://www.100md.com
12.50
9.83
12.70
13.45
8.30
8.72
14.30
8.48
13.80
9.53
13.30
8.85
8.30
, http://www.100md.com
9.16
14.70
10.78
15.30
8.63
14.80
9.45
19.00
12.52
附图中(A)说明y1~x1间有直线趋势,模型正确,但不一定是因果关系,应根据专业知识判定是否有实际意义。附图中(B)说明y2~x2间无直线趋势,模型不正确,但有曲线趋势,应进一步拟合曲线关系。附图中(C)说明y3~x3中大部分观测值间有直线趋势,但有一偏离很远的观测值对分析结果带来了严重的影响,模型不正确,应对该观测值进行认真核查与深入分析。附图中(D)说明y4~x4间不一定有直线趋势,有一个观测值对分析结果带来了严重的影响,模型不正确,应增加对不同的自变量x增加一定的观测值再进行认真分析。综上所述在进行直线相关回归分析中要特别注重散点图的作用。绘制散点图在Office和统计分析软件中都是很容易实现的,千万不要只从单纯的数值计算结果下结论。当然在分析过程中对观测值的独立性、正态性与方差齐性也是必须注意的。
参考文献
1 杨树勤,主编.中国医学百科全书医学统计学.上海:上海科学技术出版社,1985,145~153
(1999年5月6日收稿), 百拇医药