当前位置: 首页 > 期刊 > 《卫生研究》 > 1999年第1期
编号:10260672
利用多水平方差成份模型探讨个人动物蛋白摄入量的影响因素*
http://www.100md.com 《卫生研究》 1999年第1期
     作者:何岳娟 金水高 范立新 翟凤英

    单位:何岳娟(中国预防医学科学院流行病与微生物学研究所,北京 102206);金水高 范立新(中国预防医学科学院公共卫生信息中心);翟凤英(中国预防医学科学院营养与食品卫生研究所)

    关键词:多水平模型;动物蛋白摄入比例

    卫生研究990118 摘要 以中国8省人口、经济与营养健康调查的资料为例,利用多水平模型探讨了在平衡个人因素后省、县、家庭三个水平上的因素对动物蛋白摄入比例的影响。发现家庭因素如平均收入、饮食习惯、对饮食营养的认识程度等是影响动物蛋白摄入的较重要因素;此外,还发现不同省、不同县动物蛋白的摄入存在差异,揭示出摄入动物蛋白比例的增长还可能与各地区饮食文化和种植特点有关。从而可以为改善我国营养结构提供一些较为客观的依据。对于不同模型的比较认为多水平模型可以有效地用于当前许多大型卫生调查中具有层次结构的数据的分析,克服普通回归模型的不足。
, 百拇医药
    中图分类号 R151.42 R151.2

    Studies on the factors affecting the individual's

    animal protein intake by a multi-level model

    He Yuejuan, Jin Shuigao, Fan Lixin, Zhai Fengying

    Institute of Epidemiology and Microbiology, Chinese Academy of Preventive Medicine, Beijing 102206, China

    In this article, the influence of factors related to different levels (seg, provincial, county and household) on the proportion of protein intake from animal food was evaluated by using multi-level modeling. It was found that after being adjusted by individual factors, the factors related to the household, such as household income, dietary habit and knowledge of nutrition were the most important factors affecting the individual's showed animal protein intake. In addition, the results showed that the difference of animal protein intake in various places depended not only on the increase of household income, but also dietary behavior and agriculture crops in different areas. Comparison of diffiferent models indicates that in analyzing the data from large-scale health survey with hierechical structure, multi-level modeling is strongly recommended.
, http://www.100md.com
    Key words:multi-level model, intake of animal protein

    1 资料来源

    资料来源于中国预防医学科学院与美国北卡罗来纳大学人口中心进行的合作课题。该课题从1989年起在我国辽宁、江苏、山东、河南、湖北、湖南、广西及贵州八省对经济、人口与营养健康状况进行纵向调查[1]

    本研究使用了1991年的资料,并从中选取在县城居住的18岁以上人群的住户调查和膳食调查数据,共有观察对象1601人。

    2 研究目的和指标

    主要目的是研究影响个人动物蛋白摄入量的因素。研究指标有动物蛋白占总蛋白质摄入的比例、家庭收入水平、性别、年龄、婚姻状况。家庭收入水平按三等份法分为低、中、高三个收入组;年龄分为三段,18~29岁为青年人,30~49岁为中年人,50岁及以上者为老年人;婚姻状况有未婚、已婚、其他三个状况。
, http://www.100md.com
    3 单因素分析的结果

    收入水平按三等份法分为低、中、高三个收入组。不同收入人群的动物蛋白占总蛋白摄入比例,为16.01%,22.83%,27.82%。

    很显然,家庭经济状况是影响动物蛋白摄入的一个重要因素,高经济收入的家庭摄入动物蛋白往往高于低收入家庭[2]。表1的结果与文献报道完全一致,就总体来看,摄入动物蛋白占总蛋白的比例随着收入增多而增高,最高收入住户与最低收入住户比较,摄入动物蛋白占总蛋白的比例平均高出11个百分点。

    动物蛋白摄入比例在省间存在较大差异早已为许多学者所认识[3],本文对八个省的初步分析也发现了相同结果(表1)。在八个调查省中,以河南省人群摄入动物蛋白最低,只有总蛋白摄入的8.8%,而广西壮族自治区动物蛋白摄入比例最高,达到36.2%,相差27个百分点。从表1中还可看到,这省的年人均收入相差悬殊。广西高出河南省529.6元。而且,一般地,收入高的省动物蛋白摄入比例也较高。但也有例外,如湖南省,年人均收入较低,只有900多元,但动物蛋白摄入比例却相当高,达到30.9%。由此可见省间差异不仅受收入的影响,而且还可能受省间其他因素如食物结构、饮食习惯、文化背景等的影响。
, 百拇医药
    表1 1991年八省人群动物蛋白摄入情况 省份

    年人均收入

    (元)

    动物蛋白摄入比

    (%)

    河南

    740.01

    8.81

    湖北

    835.51

    13.34

    山东

, http://www.100md.com     1124.60

    17.16

    贵州

    1217.59

    21.17

    辽宁

    1618.87

    26.24

    江苏

    1466.50

    26.61

    湖南

    939.60
, 百拇医药
    30.85

    广西

    1269.65

    36.19

    4 多水平模型的分析结果

    在许多大型的流行病学调查中,样本往往是根据自然行政结构进行多阶段随机抽样得到的,因此数据具有若干层次。如在本次调查中,调查对象的抽取是由省→县→社区(居委会/村)→家庭→个人,数据具有个人、家庭、社区、县、省5个层次。但因本研究只涉及县城居民,因此本研究中的数据只具有4个层次。在这种数据结构下,如果以动物蛋白的摄入比例作为因变量,以个人特征及家庭指标作为自变量(模型A)或以个人特征及地区指标作为自变量(模型B)利用通常的方法拟合回归方程,模型如下:

    y=βhxh+e……(模型A)
, 百拇医药
    其中因变量y表示动物蛋白摄入比例,xh为代表个人特征如性别、年龄和婚姻状况及家庭指标如经济收入的自变量,e表示残差。

    y=βhxh+r1+…+r7+e……(模型B)

    其中除r1~r7外,其他变量与模型A相同,r1~r7为以辽宁省为对照组设置的哑变量,代表江苏、山东、河南、湖北、湖南、广西和贵州7省。

    以上两方程的残差项将既包含有抽样误差,还将不可避免地包含家庭、地区水平等的误差成分。即难以分析家庭、地区水平等对于个人动物蛋白的摄入比例的影响。多水平分析的思想就是将数据的不同层次设置为不同水平,根据不同水平将残差进行分解[4,5],从而有助于研究不同层次(省、县等)对于因变量的影响。本文设置个人为一水平,家庭为二水平,县为三水平,省为四水平,各水平的单位数分别为1601、640、32、8,表示有1601个个体,640户家庭,32个县和8个省。可以构造多水平模型如下:
, 百拇医药
    yijk1=βhxhijk1+s01+v0k1+u0jk1+eoijk1

    其中因变量yijk1表示动物蛋白摄入比例,xhijk1表示自变量,有性别、年龄、婚姻状况、收入水平。s01、v0k1、u0jk1、eoijk1分别表示四、三、二、一水平残差,皆服从均数为0,方差分别为σ2s0、σ2v0、σ2u0、σ2e0的正态分布。
, http://www.100md.com
    表2中C模型估计值为多水平模型的拟合结果。根据似然比检验,四个水平上的残差方差σ2s0、σ2v0、σ2u0、σ2e0与零比较在10%水平上都有显著性意义,说明不同省、县、家庭的人群动物蛋白摄入比例有差异,进一步说明了动物蛋白摄入比例的差异不仅来源于个人因素,而且还来源于宏观因素。在总残差方差中,省、县、家庭、个人水平的残差方差各占20.5%、17.1%、37.6%和24.9%。即在随机变异中家庭的变异所占比例最大(37.6%)说明家庭因素对动物蛋白摄入起着最重要的作用。高收入组、中等收入组与低收入组比较有显著性意义(P<0.05),说明家庭的年人均收入对家庭内个人的动物蛋白摄入比例有很大的影响作用,家庭人均收入越高,动物蛋白摄入比例就越高。对于获取更多更高质量的食品来说,收入是一个非常重要的约束条件,较多的收入将导致较高的蛋白质消费水平,尤其是对于动物食品的需求更为强烈。另外,家庭的其他因素,如饮食习惯、对饮食营养的认识程度等对摄入动物蛋白也有影响。这些作用均体现在二水平随机变异σ2u0上。但在本调查中,由于未涉及此类问题,因而尚难以直接分析。
, http://www.100md.com
    不同省、县人群动物蛋白摄入的差异,反映了地区经济状况、种植养殖特点及地区(尤其是县)饮食习惯对于蛋白质摄入的影响。

    在影响动物蛋白摄入的个人因素中,年龄是一个较为重要的因素。从表2中看到,中年人摄入动物蛋白比例明显低于老年人(P<0.05)及青年人(P<0.10),而老年人与青年人差异不显著。

    表2 方差成份模型与普通回归模型的比较(1) 参数

    A模型

    B模型

    C模型

    估计值

    标准误

    估计值
, 百拇医药
    标准误

    估计值

    标准误

    常数

    0.1496

    0.0120

    0.1729

    0.0167

    0.1896

    0.0312

    性别

    0.0087

    0.0081
, 百拇医药
    0.0086

    0.0070

    0.0059

    0.0043

    年龄:

    中年

    -0.0100

    0.0122

    -0.0162

    0.0106

    -0.0171

    0.0089

, 百拇医药     老年

    0.0020

    0.0117

    -0.0002

    0.0103

    0.0040

    0.0080

    婚姻:

    已婚

    0.0090

    0.0135

    0.01790

    0.0120
, 百拇医药
    0.0115

    0.0090

    其他

    0.0410

    0.0211(2)

    0.0410

    0.0184

    0.0274

    0.0137(2)

    收入:

    中等

    0.0670
, http://www.100md.com
    0.0098(2)

    0.0479

    0.0087(2)

    0.0306

    0.0127(2)

    高等

    0.1170

    0.0098(2)

    0.0857

    0.0094(2)

    0.0530
, http://www.100md.com
    0.0147(2)

    省:

    江苏

    0.0130

    0.0145

    山东

    -0.0614

    0.0148(2)

    河南

    -0.1235

    0.0156(2)

    湖北
, http://www.100md.com
    -0.0855

    0.0153(2)

    湖南

    0.0803

    0.0164(2)

    广西

    0.1319

    0.0147(2)

    贵州

    -0.0271

    0.0148(2)
, 百拇医药
    随机:

    σ2s0

    0.0055

    0.0035(2)

    σ2v0

    0.0046

    0.0016(2)

    σ2u0

    0.0101

    0.0008(2)
, 百拇医药
    σ2e0

    0.0067

    0.0003(2)

    R2

    8.23%

    30.92%

    68.95%

    注:(1)在年龄变量中以青年为对照组、在婚姻状况变量中以未婚为对照组、在家庭收入水平变量中以低收入为对照组、在省变量中以辽宁省为对照组

    (2)相对于对照组在0.10为水平上有显著性意义

    5 讨论
, 百拇医药
    为了比较单水平模型与多水平模型应用在具有层次结构的数据中的优劣,本文拟合了三个模型。A、B为普通的多元线性回归模型,C为方差成份模型。

    模型A与B的区别在于B中引入了表示省的哑变量。在单因素分析中,知道动物蛋白摄入比例在省间存在差异,因而,由于模型A中没有表示省的变量,则拟合结果不好,R2很小,模型只能解释8.23%的变异。但在模型A中加入了表示省的哑变量,即建立了模型B后,R2大大增加了,从8.23%上升到30.92%。而且还可看到,在单因素分析中的省间差异也在模型中得到了体现。对模型B中有关省间变异见表3。除了少数几个省之间外,各省间动物蛋白摄入比例有显著差异。正确地反映了单因素分析的结果。

    表3 各省间动物蛋白摄入比例差异的显著性检验 省

    山东

    河南
, http://www.100md.com
    湖北

    湖南

    广西

    贵州

    辽宁

    江苏

    <0.01

    <0.01

    <0.01

    <0.01

    <0.01

    <0.01

    NS
, 百拇医药
    山东---

    <0.01

    NS

    <0.01

    <0.01

    NS

    <0.01

    河南---

    <0.01

    <0.01

    <0.01

    <0.01

    <0.01
, 百拇医药
    湖北---

    <0.01

    <0.01

    <0.01

    <0.01

    湖南---

    <0.05

    <0.01

    <0.01

    广西---

    <0.01

    <0.01

    贵州---
, 百拇医药
    <0.01

    但对于另一个变量——县,由于县数较多(32个),难以对此象对省那样建立哑变量。用普通的多元回归模型已很难分析它们对于动物蛋白摄入比例的影响。为此引入了多水平模型C,考虑数据的层次结构,将各层次作为不同的水平进行拟合。从对该模型的估计值与B模型比较,固定系数变化不大,二者的差别主要在残差部分。模型C将模型B的残差进一步分解到二、三、四水平上,即将模型B不能解释的部分分解为可以解释的部分s01、v0k1、u0jk1和不能解释的部分e0ijk1(随机误差),从而大大降低了模型不能解释的部分占总变异的比例。因而增大了R2(0.6895),极大地改善了拟合结果,也将不同层次的影响较真实地反映了出来。

    *与美国北卡罗来纳大学人口中心合作课题

    作者简介:何岳娟,女,硕士,助理研究员
, http://www.100md.com
    参考文献

    1 翟凤英,金水高,葛可佑.中国人群健康与营养状况调查阶段报告:8省实例研究.卫生研究,1996,(25)增刊:3—6

    2 陈春明,邵宗明.中国七省市食物营养与健康状况.北京:中国统计出版社,1990.21—24

    3 翟凤英.中国不同地区经济水平成人膳食营养素摄入与体质分析.中国食物与营养,1995,1:19—22

    4 Goldstein H. Multilevel statistical models. Halsted Press,1995.15—95

    5 杨珉.多元分析的发展多水平模型简介.中国卫生统计,1994,11(5):32—35

    1998-05-06收稿, 百拇医药