恒牙患龋与若干危险因素的关系的Logistic分析
作者:张丕德 黄少宏 陈少贤
单位:张丕德(广东药学院社会医学与卫生统计教研室 广州510224);黄少宏(广东药学院社会医学与卫生统计教研室 广州510224);陈少贤(广东药学院社会医学与卫生统计教研室 广州510224)
关键词:Logistic回归;相对危险度;优势比;龋齿
数理医药学杂志000346
摘 要 为分析恒牙患龋与若干危险因素的关系,采用Logistic回归进行了分析。结果显示,年龄与性别是恒牙患龋的不利因素,城市、职业、教育和水氟度是调节预防患龋的有利因素。
中图分类号:R 781.1 文献标识码:A
文章编号:1004-4337(2000)03-0265-02
, 百拇医药
在口腔流行病学研究中,龋齿是主要研究对象之一,有关龋齿的一系列概率与均数的比较,往往直接用t检验、方差分析或χ2检验处理,方法简便。但有时难以反映各种危险因素的综合影响程度和个别因素在其它因素作用的条件下对患龋影响程度的大小和方向。本文采用Logistic回归模型分析恒牙患龋率与年龄等危险因素的关系,它不仅能够定量地给出患龋率与各危险因素的关系表达式,而且能够比较各因素之间对恒牙患龋的影响程度的大小和方向。
1 资料来源及整理
资料采用第二次全国口腔健康调查广东省调查资料,剔除有缺失值的观察样品,共得8528例,选取指标及记分如下:年龄(Age)1=15岁,2=18岁,3=35~44岁,4=65岁以上;性别(Sex)1=男,2=女;城市1=珠海,2=广州,3=韶关;教育(Educ)1=文盲,2=小学,3=中学以上;职业(Occ) 0=无业,1=农林牧渔,2=科教文化,3=工人,4=机关干部,5=商业服务,6=学生;水氟度(Fc) 0=0.5ppm以下,1=高于0.5ppm;患龋(Dc) 0=无龋,1=有龋,即至少有一颗牙有龋。全部资料在SAS6.12下进行统计分析。
, 百拇医药
2 Logistic回归简介
Logistic回归是比较理想的拟合二值响应概率与危险因素的回归关系。若记Y=1,表示事件发生;Y=0,表示事件不发生;X1、X2、…Xm为m个危险因素,为连续、离散或等级变量。只要给以适当记分,则模型假定暴露于危险因素X1、X2、…、Xm条件下,事件发生(Y=1)的条件概率为:
其中b0为截距,b1、b2、…bm为回归系数,一般采用极大似然法求系数估计。当其它危险因素水平固定或为0时,某个因素Xi变化一个单位,事件发生的优势比为:
因此,若bi>0,则Odds=ebi>1,即危险因素Xi的水平每上升一个单位,事件发生(Y=1)的相对危险度便提高ebi倍,这时危险因素的水平增高使事件发生的概率增大;若bi<0,则Odds=ebi<1,即危险因素Xi的水平每上升一个单位,事件发生(Y=1)的相对危险度便降低ebi倍,这时危险因素的水平增高使事件发生的概率降低;若bi=0,则Odds=ebi=1,即暴露于危险因素Xi的各水平单位,事件发生(Y=1)的相对危险度一致,表明该因素对事件发生没有影响。若X1、X2、…、Xm的量刚不同,则可将数据标准化,得标准系数b*i,i=1,2,…,m。标准化系数的绝对值越大,其对事件发生的影响也越大。
, 百拇医药
各危险因素不同水平的组合对事件的影响由b0+b1X1+…+bmXm决定。
3 分析结果
首先考察模型拟合效果,即检验总体假设H0:b1=b2=…=bm=0,结果见表1。
表1 模型拟合检验结果 模型拟合球性检验 H0:b1=b2=…=bm=0
检验准则
只有截距
带协变量
, http://www.100md.com 协变量卡方值、自由度、P值
AIC
6967.186
5423.964
SC
6974.237
5473.322
-2 LOGL
6965.186
5409.964
1555.222with 6 DF(p=0.0001)
Score
, 百拇医药
1251.607 with 6DF(p=0.0001)
由P=0.0001知,显著拒绝原假设,拟合效果非常理想。然后,对回归系数进行估计和检验,并计算优势比及其区间估计,结果见表2和表3。表2 系数极大似然估计和条件优势比估计 变量
自由度
系数估计
标准误
Wald卡方
P值
系数标准化估计
优势比
INTERCPT
, 百拇医药
1
7.2567
0.6047
144.0209
0.0001
SEX
1
0.3346
0.0687
23.7324
0.0001
0.092239
1.397
, 百拇医药
AGE
1
0.3316
0.0639
26.8903
0.0001
0.204393
1.393
CITY
1
-0.7797
0.0512
231.6574
, 百拇医药
0.0001
-0.338268
0.459
FC
1
-0.3404
0.0743
20.9781
0.0001
-0.093504
0.712
OCC
1
, http://www.100md.com
-0.6167
0.0563
120.1994
0.0001
-0.693140
0.540
EDUC
1
-0.8529
0.2399
12.6371
0.0004
, http://www.100md.com -0.323789
0.426
表3 条件优势比及其95%可信区间估计 变量
变化单位
优势比
下限
上限
SEX
1.0000
1.397
1.222
1.599
AGE
, 百拇医药
1.0000
1.393
1.229
1.580
CITY
1.0000
0.459
0.414
0.506
FC
1.0000
0.712
0.615
, http://www.100md.com
0.823
OCC
1.0000
0.540
0.482
0.601
EDUC
1.0000
0.426
0.256
0.660
各系数显著不为零(P<0.001),性别系数为正数,优势比区间约为1.2~1.6,表明女性比男性患龋的概率大,女性患龋的相对危险度是男性的1.2~1.6倍;年龄增长时,每上升一个等级,患龋的概率便相对提高,相对危险度提高约1.2~1.6倍;城市的系数为负数,优势比区间为0.4~0.5,表明相邻两个记分等级的城市,高分城市居民患龋的概率趋于降低,相对危险度降低0.4~0.5倍,即广州是珠海0.4~0.5倍,韶关是广州的0.4~0.5倍,究竟城市的哪些因素影响患龋的概率及相对危险度值得进一步调查研究;同理说明教育、职业和水氟度对龋齿的影响。根据系数标准化估计的绝对值大小,可以发现职业对龋齿的影响最大,其次是城市、年龄和教育,性别和水氟度作用最小,相对于其他因素,性别和水氟度对龋齿的影响几乎可以忽略。总之,年龄和性别的高分对预防龋齿不利,而教育、城市等因素的高分有利于预防龋齿的发生,除年龄和性别不可改变外,可以调整其他几个因素的水平以便降低龋齿的发病率。
, http://www.100md.com
各因素对龋齿的综合影响及预测概率公式为:
4 讨论
应用Logistic回归,若危险因素为分类变量,则不同的记分法会影响系数估计值,所以可以根据专业知识或实际情况采用多种记分法进行拟合模型,从中选取拟合效果好且最易解释的一种。若检验危险因素是否存在乘积交互作用或二次效应,可增加分析指标,如X2i或Xi×Xj进行模型拟合,如果模型检验卡方值有明显增高,则认为增加指标X2i或Xi×Xj是合理的,否则不必增加。若危险因素存在共线性,可采用逐步回归法或主成分法压缩因子。
参考文献
1,J.F.Lawless著,茆诗松等译.寿命数据中的统计模型与方法.中国统计出版社,1998.
2,SAS Institute inc. SAS/STAT Guide for Personal Computers, Version 6, Fouth Edition, 1990.
收稿日期:1999-10-03, http://www.100md.com
单位:张丕德(广东药学院社会医学与卫生统计教研室 广州510224);黄少宏(广东药学院社会医学与卫生统计教研室 广州510224);陈少贤(广东药学院社会医学与卫生统计教研室 广州510224)
关键词:Logistic回归;相对危险度;优势比;龋齿
数理医药学杂志000346
摘 要 为分析恒牙患龋与若干危险因素的关系,采用Logistic回归进行了分析。结果显示,年龄与性别是恒牙患龋的不利因素,城市、职业、教育和水氟度是调节预防患龋的有利因素。
中图分类号:R 781.1 文献标识码:A
文章编号:1004-4337(2000)03-0265-02
, 百拇医药
在口腔流行病学研究中,龋齿是主要研究对象之一,有关龋齿的一系列概率与均数的比较,往往直接用t检验、方差分析或χ2检验处理,方法简便。但有时难以反映各种危险因素的综合影响程度和个别因素在其它因素作用的条件下对患龋影响程度的大小和方向。本文采用Logistic回归模型分析恒牙患龋率与年龄等危险因素的关系,它不仅能够定量地给出患龋率与各危险因素的关系表达式,而且能够比较各因素之间对恒牙患龋的影响程度的大小和方向。
1 资料来源及整理
资料采用第二次全国口腔健康调查广东省调查资料,剔除有缺失值的观察样品,共得8528例,选取指标及记分如下:年龄(Age)1=15岁,2=18岁,3=35~44岁,4=65岁以上;性别(Sex)1=男,2=女;城市1=珠海,2=广州,3=韶关;教育(Educ)1=文盲,2=小学,3=中学以上;职业(Occ) 0=无业,1=农林牧渔,2=科教文化,3=工人,4=机关干部,5=商业服务,6=学生;水氟度(Fc) 0=0.5ppm以下,1=高于0.5ppm;患龋(Dc) 0=无龋,1=有龋,即至少有一颗牙有龋。全部资料在SAS6.12下进行统计分析。
, 百拇医药
2 Logistic回归简介
Logistic回归是比较理想的拟合二值响应概率与危险因素的回归关系。若记Y=1,表示事件发生;Y=0,表示事件不发生;X1、X2、…Xm为m个危险因素,为连续、离散或等级变量。只要给以适当记分,则模型假定暴露于危险因素X1、X2、…、Xm条件下,事件发生(Y=1)的条件概率为:
其中b0为截距,b1、b2、…bm为回归系数,一般采用极大似然法求系数估计。当其它危险因素水平固定或为0时,某个因素Xi变化一个单位,事件发生的优势比为:
因此,若bi>0,则Odds=ebi>1,即危险因素Xi的水平每上升一个单位,事件发生(Y=1)的相对危险度便提高ebi倍,这时危险因素的水平增高使事件发生的概率增大;若bi<0,则Odds=ebi<1,即危险因素Xi的水平每上升一个单位,事件发生(Y=1)的相对危险度便降低ebi倍,这时危险因素的水平增高使事件发生的概率降低;若bi=0,则Odds=ebi=1,即暴露于危险因素Xi的各水平单位,事件发生(Y=1)的相对危险度一致,表明该因素对事件发生没有影响。若X1、X2、…、Xm的量刚不同,则可将数据标准化,得标准系数b*i,i=1,2,…,m。标准化系数的绝对值越大,其对事件发生的影响也越大。
, 百拇医药
各危险因素不同水平的组合对事件的影响由b0+b1X1+…+bmXm决定。
3 分析结果
首先考察模型拟合效果,即检验总体假设H0:b1=b2=…=bm=0,结果见表1。
表1 模型拟合检验结果 模型拟合球性检验 H0:b1=b2=…=bm=0
检验准则
只有截距
带协变量
, http://www.100md.com 协变量卡方值、自由度、P值
AIC
6967.186
5423.964
SC
6974.237
5473.322
-2 LOGL
6965.186
5409.964
1555.222with 6 DF(p=0.0001)
Score
, 百拇医药
1251.607 with 6DF(p=0.0001)
由P=0.0001知,显著拒绝原假设,拟合效果非常理想。然后,对回归系数进行估计和检验,并计算优势比及其区间估计,结果见表2和表3。表2 系数极大似然估计和条件优势比估计 变量
自由度
系数估计
标准误
Wald卡方
P值
系数标准化估计
优势比
INTERCPT
, 百拇医药
1
7.2567
0.6047
144.0209
0.0001
SEX
1
0.3346
0.0687
23.7324
0.0001
0.092239
1.397
, 百拇医药
AGE
1
0.3316
0.0639
26.8903
0.0001
0.204393
1.393
CITY
1
-0.7797
0.0512
231.6574
, 百拇医药
0.0001
-0.338268
0.459
FC
1
-0.3404
0.0743
20.9781
0.0001
-0.093504
0.712
OCC
1
, http://www.100md.com
-0.6167
0.0563
120.1994
0.0001
-0.693140
0.540
EDUC
1
-0.8529
0.2399
12.6371
0.0004
, http://www.100md.com -0.323789
0.426
表3 条件优势比及其95%可信区间估计 变量
变化单位
优势比
下限
上限
SEX
1.0000
1.397
1.222
1.599
AGE
, 百拇医药
1.0000
1.393
1.229
1.580
CITY
1.0000
0.459
0.414
0.506
FC
1.0000
0.712
0.615
, http://www.100md.com
0.823
OCC
1.0000
0.540
0.482
0.601
EDUC
1.0000
0.426
0.256
0.660
各系数显著不为零(P<0.001),性别系数为正数,优势比区间约为1.2~1.6,表明女性比男性患龋的概率大,女性患龋的相对危险度是男性的1.2~1.6倍;年龄增长时,每上升一个等级,患龋的概率便相对提高,相对危险度提高约1.2~1.6倍;城市的系数为负数,优势比区间为0.4~0.5,表明相邻两个记分等级的城市,高分城市居民患龋的概率趋于降低,相对危险度降低0.4~0.5倍,即广州是珠海0.4~0.5倍,韶关是广州的0.4~0.5倍,究竟城市的哪些因素影响患龋的概率及相对危险度值得进一步调查研究;同理说明教育、职业和水氟度对龋齿的影响。根据系数标准化估计的绝对值大小,可以发现职业对龋齿的影响最大,其次是城市、年龄和教育,性别和水氟度作用最小,相对于其他因素,性别和水氟度对龋齿的影响几乎可以忽略。总之,年龄和性别的高分对预防龋齿不利,而教育、城市等因素的高分有利于预防龋齿的发生,除年龄和性别不可改变外,可以调整其他几个因素的水平以便降低龋齿的发病率。
, http://www.100md.com
各因素对龋齿的综合影响及预测概率公式为:
4 讨论
应用Logistic回归,若危险因素为分类变量,则不同的记分法会影响系数估计值,所以可以根据专业知识或实际情况采用多种记分法进行拟合模型,从中选取拟合效果好且最易解释的一种。若检验危险因素是否存在乘积交互作用或二次效应,可增加分析指标,如X2i或Xi×Xj进行模型拟合,如果模型检验卡方值有明显增高,则认为增加指标X2i或Xi×Xj是合理的,否则不必增加。若危险因素存在共线性,可采用逐步回归法或主成分法压缩因子。
参考文献
1,J.F.Lawless著,茆诗松等译.寿命数据中的统计模型与方法.中国统计出版社,1998.
2,SAS Institute inc. SAS/STAT Guide for Personal Computers, Version 6, Fouth Edition, 1990.
收稿日期:1999-10-03, http://www.100md.com