当前位置: 首页 > 期刊 > 《广东药学院学报》 > 2000年第1期
编号:10975544
用有序Logistic模型分析恒牙患龋程度与若干暴露因素的关系
http://www.100md.com 《广东药学院学报》 2000年第1期
     作者:张丕德 黄少宏 陈少贤

    单位:张丕德 陈少贤(广东药学院社会医学与卫生统计教研室,广东广州510224);黄少宏(广东省口腔医院)

    关键词:有序Logistic回归;相对危险度;优势比;龋齿

    广东药学院学报000107

    摘 要 目的:进一步分析恒牙患龋程度与若干暴露因素的关系;方法:采用有序Logisti c回归进行分析;结果:年龄是患龋的最大危险因素,随着年龄的增长患龋的牙数有增多的 趋势,同样,性别、城市、职业、教育和水氟度也是患龋的重要影响因素;结论:可以将暴 露因素对恒牙患龋的影响程度的大小和方向定量化,测定各因素对恒牙患龋程度的综合作用 及趋势,利用预测概率公式可以预测任何给定条件下个体平均恒牙患龋牙数的概率,根据模 型可适当改变某些暴露因素的水平预防恒牙患龋。
, 百拇医药
    中图号 R195.1;R781.102 文献标识码:A 文章编号:1006-8783(2000)01-0024-04

    Analysis of the Relationship between the Decaying

    Degree of Permanent Teeth and Certain Exposure

    Factors with Ordinal Logistic Model

    ZHANG Pi-de,CHEN Shao-xian

    (Guangdong College of Pharmacy,Guangzhou,P.R.China,510224)

    HUANG Shao-hong
, 百拇医药
    (The Stomatology Hospital of Guangdong Province)

    Abstract Objective: To analyze the relationship between the decaying degree of permanent teeth and some exposure factors. Method:Ordinal logistic regression model was us ed in this study. Results:It was shown that age was the most important factor an d with the age increase,the number of decayed teeth tended to increase. Sex,city of residence,occupation,education and fluorine concentration in water were amon g the other important factors. Conclusion: With this model the degree and the di rection of the effect of the risk factors on permanent teeth decaying could be q uantified,and their synthetical effect and the tendency could be determined. Usi ng the probability-forecasting formular,the probability of the average number of decayed teeth in individuals could be calculated under giving conditions.
, http://www.100md.com
    Key Words Ordinal Logistic model, Relative risk, Odds ratios, Teeth decaying

    CLC number R195.1;R781.102 Document code:A Article ID:1006-8783(2000)01-0024-04

    在对第二次全国口腔健康调查广东省调查资料进行统计分析的过程中,分别讨论了与龋 齿有关的一系列率与均数在不同年龄、不同性别、不同城市等层次或类别之间的差异,并采 用简单的t检验、方差分析或χ2检验进行显著性检验,有显著意义的结果较多但很 分散,不能 综合反映各种因素的综合作用以及各因素之间的相对重要性,此外,考虑到一个人有一颗牙 患龋跟两颗牙患龋程度有所不同,即患龋牙数多少的程度本身存在内在的等级和顺序,于是 本文尝试根据个体的患龋牙数定义一个响应变量并将响应值分为三个等级:无龋、只有一颗 牙患龋、至少有两颗牙患龋,这个响应变量描述了恒牙患龋的倾向和严重程度,于是应用有 序Logistic回归模型可以进一步定量地分析恒牙患龋程度与性别、年龄等层次或类别因素的 关系及趋势性,并给出累积概率表达式,以便预测。
, 百拇医药
    1 资料来源及整理

    本文资料采用第二次全国口腔健康调查广东省调查资料,剔除有缺失值的观察样品,共 得8528例。选取指标及记分如下:年龄(AGE):1=15岁,2=18岁,3=35~44岁,4=65岁以上 ;性别(SEX):1=男,2=女;城市:1=珠海,2=广州,3=韶关;教育(EDUC):1=文盲,2=小 学,3=中学以上;职业(OCC):0=无业,1=农林牧渔,2=科教文化,3=工人,4=机关干部,5 =商业服务,6=学生; 水氟度(FC):0=0.5ppm以下,1=高于0.5ppm;患龋(DC):0=无龋,1= 一颗牙有龋,2=至少两颗有龋。全部资料在SAS 6.12下进行统计分析。

    2 有序Logistic回归简介

    有序Logistic回归[1, 2]是拟合多值有序响应概率与暴露因素的回归关系的模型。 若 记Y=1,2,3,…,k表示事件发生的有序响应值;X1、X2、…Xm为m个暴露因素,为连续 、 离散或等级变量,只要给以适当记分,则模型假定暴露于因素X1、X2、…、Xm条件下,事件 (Y≤i)发生的条件概率为
, 百拇医药
    P(Yi|X1,X2,…,Xm)=

    (exp(ai+b1X1+b2X2+…+bmXm))/(1+exp(ai+b1X1+b2X2+…+bmXm))

    其中ai为截距,i=1,2,…,k,k-1,b1、b2、…、bm为回归系数,一般采用极大似 然法求系数估计。有序Logistic回归基 于响应水平的累积概率具有相同的回归斜率或优比比率,而对于不同的累积水平截距可以不 同。于是当其他暴露因素水平固定或为0时,某个因素Xj变化一个单位,事件(Y≤i)发生 的优势比为

    Odds=

    (P(Yi|Xj=x*+1)/P(Y>i|Xj=x*+1))/(P(Yi|Xj=x*)/P(Y>i|Xj=x*))=ebj
, 百拇医药
    因此系数bj取值大小及符号说明危险因素Xj对事件(Yi)发生的影响大小和方向,具体地说 :若bj>0,则Odds=ebj>1,即暴露因素Xj的水平每增加一个单位,事件(Y≤i) 发生的相对危险度便提 高ebj倍,且Xj处于高水平时,响应变量Y趋于低水平(等级)发生,Xj处于低水平 时,响应变 量趋于高水平(等级)发生;若bj<0,则Odds=ebj<1,即暴露因素Xi的水平每增 加一个单位事件(Y≤i )发生的相对危险度便降低ebj倍,那么Xj处于高水平时,响应变量Y趋于高水平( 等级)发生 ,Xj处于低水平时,响应变量Y趋于低水平(等级)发生;若bj=0,则Odds=ebj= 1,即暴露于因素Xj的 各水平事件(Y≤i)发生的相对危险度一致,表明该因素对事件发生没有影响。若X1、X2、 …、Xm的量刚不同,则可将数据标准化,得标准系数,标准化系数的绝对值越大,其对事件 发生的影响也越大。同理可以解释截距ai的含义。各危险因素不同水平的组合对事件(Y ≤i)的影响由预后指数W=b0+b1X1+…+bmXm决定,根据W>0、W<0和W=0可以作出类似 上面的说明。
, http://www.100md.com
    3 分析结果

    为方便起见,调用SAS过程[1, 2]进行有序Logistic回归分析时,将患龋变量( DC)按降 序排列,模型拟合检验结果见表1,其中优比检验,P=0.4436,说明该模型非常适合本 资料 ;总体斜率BETA=0的检验,P=0.0001,说明总体斜率显著不为0,总之,用有序Logisti c回归拟合本资料效果较理想。

    表1 模型拟合比例优比及斜率检验结果 比例优比得分检验H0:优比比率相等

    Chi-Square(卡方值) = 5.8201 with 6 DF (P=0.4436)

    模型总体系数检验H0:b1=b2=…=bm=0

    检验准则
, 百拇医药
    只有截距

    带回归变量

    模型卡方值、自由度、P值

    AIC

    14480.067

    12493.188

    .

    SC

    14494.616

    12551.382

    .

    -2 LOG L

, 百拇医药     14476.067

    12477.188

    1998.880 with 6 DF (p=0.0001)

    Score

    .

    .

    1298.860 with 6 DF (p=0.0001)

    模型参数的极大似然估计和优势比区间估计结果分别见表2和表3,其中,年龄(AGE) 的系数为正数,优势比的区间估计为1.4~1.6,说明其它因素一致的条件下,年龄每上升 一 个阶段,恒牙患龋的相对危险度便提高1.4~1.6倍,当年龄较大时,患龋的牙数趋于增多, 年龄较小时,患龋的牙数相对偏低;性别(SEX)的系数为正数,优势比区间估计为1.1~1. 3,说明其它因素一致的条件下,女性患龋的相对危险度是男性的1.1~1.3倍,女性患龋的 牙数偏多,男性患龋的牙数相对偏少;城市(CITY)的系数为负数,优势比区间估计为0.5 ~0.6,说明其它因素一致的条件下,珠海、广州、韶关三个城市相比,珠海患龋的相对危 险度是广州0.5~0.6倍,广州是韶关的0.5~0.6倍,韶关患龋偏重,广州次之,珠海较轻, 城市对患龋的影响是许多因素如环境、文化和卫生习惯等因素的综合结果,值得进一步分解 研究;同样可以解释文化程度(EDUC)、职业(OCC)、水氟度(FC)对患龋的作用大小和 方向。从各因素的标准系数估计看,年龄的系数绝对值最大,说明年龄对患龋的影响最大, 其次为职业和文化程度,再次为城市和水氟度,而性别的标准系数估计接近于零,相对于其 他危险因素性别作用几乎可以忽略,但由于本资料样本含量非常大,性别的影响经检验仍然 是显著的。 表2 参数极大似然估计及条件优势比估计 变量
, 百拇医药
    自由度

    参数估计

    标准误

    Wald卡方值

    P值

    标准参数估计

    INTERCP1

    1

    7.6689

    0.4209

    331.9615

    0.0001

    .
, 百拇医药
    INTERCP2

    1

    8.3209

    0.4221

    388.5873

    0.0001

    .

    SEX

    1

    0.1870

    0.0496

    14.2075

    0.0002
, 百拇医药
    0.051554

    AGE

    1

    0.4044

    0.0376

    115.5067

    0.0001

    1.314956

    CITY

    1

    -0.5794

    0.0465

    155.5460
, 百拇医药
    0.0001

    -0.264458

    EDUC

    1

    -0.2557

    0.0132

    377.5455

    0.0001

    -0.548794

    OCC

    1

    -0.4336

    0.0331
, 百拇医药
    171.5944

    0.0001

    -0.564321

    FC

    1

    -0.7751

    0.0800

    93.8332

    0.0001

    -0.210402

    表3 条件优势比及其95%可信区间估计 变量

    变化单位
, 百拇医药
    优势比

    比值

    下限

    上限

    SEX

    1.0000

    1.206

    1.094

    1.329

    AGE

    1.0000

    1.498

    1.393
, 百拇医药
    1.615

    CITY

    1.0000

    0.560

    0.511

    0.613

    EDUC

    1.0000

    0.774

    0.754

    0.794

    OCC

    1.0000
, http://www.100md.com
    0.648

    0.606

    0.689

    FC

    1.0000

    0.461

    0.393

    0.539

    可见,按本资料的记分法,年龄和性别的水平高患龋便较严重,患龋的牙数趋于增多,因此 在暴露因素中,年龄和性别为危险因素,年龄记分在3~4间患龋数明显增加,女性可能喜欢 零食及甜品等,从而患龋数较男性多,年龄和性别是无法改变的,但可以加强口腔卫生、少 食甜食寒食以利预防,使暴露因素的影响尽量降低。同时,根据实际等级分类和分析结果知 ,城市、文化程度、职业、水氟度属保护因子,说明整洁城市、文化教育等间接与患龋有关 ,这与一般报道一致,由于城市、文化程度、职业、水氟度的水平是可以改变的,因此人们 可以通过适当改变保护因子的水平来预防恒牙患龋。对于上述各个危险因素的综合作用,可 以概括到预测概率公式,即至少有一牙患龋的概率为:P(DC1)=(exp(8.3+0.19SEX+0.4AGE-0.58CITY-0.26EDUC-0.43OCC-0.76FC))/(1+exp(8.3+0.19SEX+0.4AGE-0.58CITY-0.26EDUC-0.43OCC-0.76FC))
, 百拇医药
    至少有两个牙患龋的概率为:

    P(DC2)=(exp(7.7+0.19SEX+0.4AGE-0.58CITY-0.26EDUC-0.43OCC-0.76FC))/(1+exp(7.7+0.19SEX+0.4AGE-0.58CITY-0.26EDUC-0.43OCC-0.76FC))。

    4 讨论

    4.1 应用有序Logistic回归,响应变量应该是有序分类的资料,其特点是 可以将多个响 应的事件同时考虑,因变量的分类可以详细也可以合并,根据样本例数的大小而定。当回归 变量均为分类变量时,有序Logistic回归相当于有序列联表分析,此外,它也是一般Logist ic回归的推广。若危险因素为分类变量,不同的记分法会影响系数估计值,可以根据专业知 识或实际情况采用多种记分法进行拟合模型,从中选取拟合效果好且最易解释的一种。

, http://www.100md.com     4.2 若检验危险因素存在乘积交互作用或二次效应,可增加分析指 标如或进行模型拟合 ,如果模型检验卡方值有明显增加,则认为增加指标如或是合理的,否则不必增加。若有乘 积交互作用或二次效应,则在所有因素各水平的可能组合之中,可以找到最佳或最差的搭配 ,即在某个组合的条件下事件发生的概率可达到最小或最大。

    4.3 若危险因素存在共线性,可采用逐步回归法或主成分法压缩因子, 消除共线性,以保证系数估计的稳定性及可解释性。

    参考文献

    [1]高惠璇等编译. SAS/STAT软件使用手册. 北京:中国统计出版社.1998.458~47 2.

    [2]SAS Institute Inc., SAS/STAT Software: Changes and Enhancements throu gh Release 6.12, SAS Campus Drive,Cary,NC,USA.1997.421~531.

    (收稿日期 1999-11-15), 百拇医药