当前位置: 首页 > 期刊 > 《中国卫生统计》 > 1999年第3期
编号:10260033
用多元回归分析小儿手术麻醉期间潮气量影响因素
http://www.100md.com 《中国卫生统计》 1999年第3期
     作者:刘嵘 刘延龄 孟凡东

    单位:刘嵘 刘延龄 中国医科大学卫生统计学教研室(110001); 孟凡东 中国医科大学第一临床学院

    关键词:潮气量;残差分析;共线诊断;岭估计

    中国卫生统计990307 【提 要】 目的 确定小儿手术麻醉期间机械通气时潮气量的影响因素。方法 采用SAS软件对资料进行残差分析,共线诊断并利用原点迫近回归实现岭回归分析。结果 在残差图上,学生化残差大致落在|r|≤=2的水平带状区域内且无任何趋势。一般回归分析的标准误大多大于1.5;身高和体重的方差构成比分别为90.87%和51.39%,均超过了50%;在岭迹图2中,当k=0.3时,岭迹大体稳定,据此所拟合的岭回归方程的所有回归系数标准误均小于0.1。结论 残差分析表明本资料近似满足误差方差齐性假设,模型正态性假设;但由于回归系数标准误偏大,因此利用一般回归分析方法所建立的回归方程系数不够稳定,加之用诊断检验查出身高和体重间存在多重共线性,故本资料用一般回归分析方法拟合并不适合;采用岭估计重新分析,不仅减小了多元共线性的效应,而且降低了回归系数的标准误,获得了较为可靠的结果:确认体重、年龄、平均动脉压对潮气量起重要作用。
, 百拇医药
    Diagnosis Test and Ridge Regression for the Effect Factors of Tidal Volume

    Liu Rong,Liu Yanling,Meng FanDong,China Medical University(110001),Shenyang

    【Abstract】 Objective To determine factors which have important effects on the tidal volume during anaesthesia preshool children with mechanical ventilation in operation.Methods First we utilize Proc Reg in SAS software which performs residual analysis and collinearity diagnosis. Then we complete 'ridge regression with the help of the option of Restrict and the Proc Standard.Results A scatterplot of studentized residual shows the random and uniform dispersion about the zero line of the residual ; Most of standard errors are larger than 1. 5 in the classical regression analysis ; The variance decomposition proportions of height and weight all exceed 0. 5 ; In ridge regression analysis ,all of standard error is smaller than0.1.Conclusion Although the analysis of residual plot shows that the data comform to the assumptions of equal variance and normal distribution,we think it improper to apply the classical regression analysis for the data because of the instability of regression coefficients and the collinearity between height and weight ; While ridge estimate eliminates these problems ; We conclude that the most important factors which have effects on tidal volume is WEIGHT , and the next are AGE and mean airway pressure (MAP).
, http://www.100md.com
    【Key words】 Tidal volume Residual analysis Collinearity diagnosis Ridge estimate

    小儿手术麻醉期间机械通气的实施起到代替病人自主呼吸,维持有效肺泡通气,保持呼吸道通畅,减少呼吸功的作用。在临床上,通气不足时,易造成缺氧和二氧化碳蓄积。而过度通气,则可致低碳酸血症,氧解离曲线左移,使氧和血红蛋白亲和力增强,在组织中氧和血红蛋白难以解离,导致组织缺氧并且影响回心血量等。因此,合理应用机械通气,确定适宜的潮气量是非常重要的。

    曾有国外学者研究过正常儿童潮气量的影响因素〔1〕。而对处于麻醉中小儿潮气量影响因素的分析迄今还未见报道。影响麻醉中小儿潮气量的因素很多,多元回归是一个易想到的分析手段。但问题是〔2〕:①一般多元回归是否适合分折这类研究资料?②所得回归方程的参数是否稳定?③如不稳定,应如何解决?
, 百拇医药
    本文的目的就是想就这类研究的一个实际资料来讨论一下以上几个问题,以供人们在分析时参考。

    资料与方法

     1.资料来源:资料来自某院139名3~7岁患儿(心肺功能正常且无水电解质紊乱)ASAI级择期手术(非心肺及上腹部手术且时间超过一小时)的术中记录:体温X5(摄氏度),吸入异氟醚浓度X6(百分比),平均动脉压X7(千帕),心率X8(次/分)和潮气量Y(毫升/次)以及患儿的性别X1(男,女),年龄X2(周岁),身高X3(厘米),体重X4(公斤)。

    2.分析方法

    (1)利用SAS软件中的回归过程(PROC REG)进行一般多元回归,目的是考察利用这种回归所得结果及存在的问题。
, 百拇医药
    (2)利用绘图过程(PROC PLOT)绘制学生化残差图,目的是考察所用的资料是否适合使用多元回归分析方法。这种图是一 种以回归方程估计值为横坐标,以学生化残差r为纵坐标的散点图(图1)。当图中散点95%分布在(,r)平面上|r| ≤2的带状区域内且无任何趋势,可利用PROC REG;否则,不宜用。

    图1 潮气量影响因素的学生化残差图

    (3)观察回归系数的标准误,推测回归系数是否稳定,如对稳定性有怀疑,可利用共线诊断语句(COLLINOINT)找出最大条件数ηj及较大的自变量方差构成比πkj,这两个指标值可分别反映自变量共线程度及引起这种共线性的主要变量作用大小。事实上,条件数越大,共线性越强;自变量方差构成比越大,它对共线性的作用越大。
, 百拇医药
    这里使用COLLINOINT及其产生的相应指标:条件数及方差构成比,是因为回归系数稳定与否及稳定程度取决于自变量间是否存在强烈的共性关系,按BKW准则,二个自变量方差构成比超过0.5所引起的共线性是强烈的共线性〔3~4〕

    (4)如果发现回归系数不稳定,可用岭回归方法去估计回归系数,新近出版的统计软件有这种程序。如果没有,可用原点迫近法借助PROC REG来完成〔5〕

    岭回归系数的估计方法是:在求标准回归系数Bi的正规方程组的系数矩阵对角线上加上一个常数k(0≤k≤1,称岭回归参数),然后解这个新的方程组,其解Bi*(k)就是岭回归系数。作Bi*(k)随k变动的曲线(称岭迹图),使所有Bi*(k)都达到平稳的Bi*(k)就是所求的系数(图2)。
, 百拇医药
    图2 一次岭回归的岭迹图

    加入k的目的是削弱原有自变量的共线性,因而削弱了原回归系数的不稳定性。

    结果与分析

    1.一般多元回归分析结果

    由表1中的F值和决定系数R2可见,本资料使用一般多元回归拟合似乎恰当。

    表1 方差分析 变异来源

    SS

    ν

    MS

    F

    R2
, 百拇医药
    总变异

    99022.69347

    138

    回 归

    67457.36196

    8

    8432.17025

    34.727

    0.68

    剩 余

    31565.33151

    130

, 百拇医药     242.81024

    残差图(图1)中散点分布状况表明学生化残差r近似服从N(0,1),因此误差满足方差齐性假设,多元回归方法是可行的。

    虽然残差图和方差分析均表明用一般多元回归拟合此资料似乎是满意的,但是当我们试图解释这些回归系数时问题出现了。回归系数估计(表2)中,身高出现了与实际不符的负号。另外,多数回归系数估计的标准误相对于其参数估计值的变异较大,使人怀疑其回归系数不稳定,自变量间可能存在共线性。表2 参数估计 变量

    参数

    标准误

    t

    X1

    -1.2328
, 百拇医药
    2.7316

    -0.457

    X2

    5.1215

    1.6446

    3.114

    X3

    -0.0695

    0.2505

    -0.278

    X4

    4.9045
, http://www.100md.com
    0.5709

    8.591

    X5

    0.5835

    3.7954

    0.154

    X6

    -9.3073

    4.3158

    -2.157

    X7

    0.3487
, 百拇医药
    0.1721

    2.026

    X8

    0.1142

    0.0935

    1.222

    2.共线性诊断结果

    显示最大条件数η8=3.887466,相应的两个较大的方差构成比(身高,体重) π83=90.87%和π84=51.39%,由于这二个方 差构成比均超过了50%,根据BKW准则,自变量间存在强烈共线 性,而且变量身高和体重对这种共线性作用最大,因而表明一般多元回归的回归系数不稳定且这种不稳定是因为身高和体重间有关联所致。
, 百拇医药
    (三)岭回归分析结果

    图2表明一般多元回归系数的稳定性较差,这反映在当k与零略有偏离时,B*(k)与B*(0)(一般多元回归系数)就有较大的差距,特别是自变量体重的岭回归系数绝对值下降最多。计算结果表明,当k从0增如到0.1时,‖B*(k)‖2下降到相当于‖B*(0)‖2的67.6%,这些现象在直观上使人怀疑,一般回归估计B*(0)是否反映了B的真实面目。

    另外当k增加时自变量身高的岭回归系数B*3(k)迅速上升且变为正的;与此相反,自变量体重的岭回归系数迅速下降。结合按BKW准则识别出这两个变量间存在共线关系,故可去掉一个:即身高X3
, 百拇医药
    自变量X1的岭回归系数B1*(k)绝对值较小,当k增加时,B1*(k)比较稳定,根据变量的筛选原则可去掉X1。至于X6,当k增加时,|(k)|下降较快,且趋于稳定,这意味着一般多元回归对其重要性估计过高。

    剔除自变量X1和X3,重新作岭回归分析,结果见图3。

    图3 二次岭回归的岭迹图

    由图3可看出,在k=0.3处,岭迹大体稳定,借助标准化变量表示的拟合方程为:
, 百拇医药
    Y=0.224X2+0.488X4+0.037X5

    -0.090X6+0.101X7-0.019X8

    对上述岭回归方程进行方差分析,结果见表3。

    表3 方差分析 变异来源

    SS

    ν

    MS

    F

    R2

    总变异
, http://www.100md.com
    99022.69347

    138

    回 归

    30987.00907

    6

    5164.50151

    10.02

    0.56

    剩 余

    68035.68440

    132

    515.42185
, 百拇医药
    表3和表1相比,剩余方差增大, F值减小但仍保持在α=0.01 水准上显著。表4 参数估计 变量

    参数

    标准误

    t

    X2

    0.2237

    0.0565

    3.961

    X4

    0.4875

    0.0585
, 百拇医药
    8.335

    X5

    0.0367

    0.0505

    0.726

    X6

    -0.0898

    0.0505

    -1.778

    X7

    0.1005

    0.0503
, http://www.100md.com
    1.999

    X8

    -0.0188

    0.0549

    -0.342

    把表4和表2对比,会发现6个标准化岭回归系数的标准误,都较一般回归系数的标准误为小。因此从这8个变量的数据中所选出的6个变量构成的回归子集来建立模型,其回归系数是稳定的。其中潮气量与X2, X4,X5,X7正相关,与X6,X8负相关,且X2和X4的影响最为显著,这种结果与国外学者对正常儿童的研究是一致的。这一点是容易想到的(本资料虽对患儿观测结果,但因这些患儿心肺功能正常且无水电解质紊乱,所以相对呼吸系统而言是正常儿)。讨 论
, 百拇医药
    1.共线性考核指标的选定:国内的一些文献往往仅依据条件数或特征值来判定变量之间是否存在共线性。我们认为用BKW提出的回归系数方差构成比(即RCVD)法来识别是否存在有疑问的共线性及判定这种共线性对回归系数的影响更宜,其优点在于它能识别出卷入某种特殊依赖关系中的变量并且有助于判定到底哪个回归系数受到了不良影响。

    2.多元岭回归方法的选用:本文采用岭估计对小儿机械通气潮气量影响因素资料加以分析,不仅减小了多元共线性的效应,而且由于所获得的岭回归系数为标准化系数,因此更可通过它们直观地比较各因素对潮气量作用的大小(即|B*i(k)|值越大,影响因素Xi对潮气量Y的作用越大)。

    3.岭回归的计算机实现:由于岭回归分析较一般的回归分析计算量大得多,因此一般需用统计软件上计算机计算,但由于手头没有现成的岭回归程序,因此开发利用SAS软件中的原点迫近回归程序,通过原始数据中心标化,预设k值及增加伪样本,岭迹分析等方法,以实现多元岭回归,从而确定了与潮气量有关的重要因素,获得了较为可靠的分析结果。
, 百拇医药
    结 论

    1.本资料使用一般的回归分析并不合适。

    2.通过诊断发现潮气量的影响因素间确实存在多重共线性。

    3.岭估计可对多重共线性资料有较好的处理。本文采用多元岭回归技术,确认体重、年龄、平均动脉压对潮气量起重要作用。

    参考文献

    1.Smith R.M.Respirtory Physiology in Infants and Children.Anaesthesia for Infants and Children,4th ed.CV Masby.S tLouis.1980,15~21,40~44,891.

    2.陈希儒,王松桂.近代回归分析——原理方法及应用.安徽教育出版社,1984.
, 百拇医药
    3.Smith RR,Slattery ML et al.Collinear nutrients and the risk of colon cancer 1991,44(7):715~723.

    4.Wax Y.Collinearity diagnosis for a relative risk regression analysis:an application to assessment of diet-cancer relationship in epidemiological studies Statistics in Medicine 1992,11:1273~1285.

    5.黄正南.医用多因素分析.长沙:湖南科学技术出版社,1980,64~73., http://www.100md.com