当前位置: 首页 > 期刊 > 《心理学报》 > 2016年第11期
编号:1061604
缺失数据的结构方程建模:全息极大似然估计时辅助变量的作用*
http://www.100md.com 2016年2月1日 心理学报 2016年第11期
参数估计,样本量,偏差,1引言,1数据的缺失机制与现代的处理方法,2辅助变量,2问题提出,1先前类似研究,2本研究的目的,3研究设计,1模拟研究设计,1.1研究假设模型,1.2缺失机制,1.3样本量和
     王孟成 邓俏文

    (广州大学心理系; 广州大学心理测量与潜变量建模研究中心, 广州 510006)

    1 引言

    在对心理学等社科调查的数据进行建模时, 常常遇到数据缺失的情况。例如, 研究参与者拒绝接受调查、不愿意回答或遗漏某些问题。毫不夸张的说, 数据缺失无法避免, 因此如何处理缺失数据就成了摆在研究者面前重要而又无法回避的问题。

    全息极大似然估计(Full Information Maximum Likelihood, FIML)和多重插补(Multiple Imputation,MI)是目前缺失数据建模最为学者推崇的方法(Graham, 2009; Schafer & Graham, 2002)。这两种方法在特定条件下所得结果是等价的, 但鉴于建模软件的可获得性、统计处理的便捷性以及结果的稳健性(e.g., Yuan, Yang-Wallentin, & Bentler, 2012), 在方法学实践中FIML更加方便和灵活(Yuan et al.,2012; 王孟成, 叶浩生, 2014)。

    在缺失数据建模实践中, 方法学者通常会建议纳入辅助变量(auxiliary variable)来提高结果的稳健性。采用FIML处理缺失数据时, 合理利用辅助变量可以使与FIML密切相关的缺失机制得到满足,从而产生更可靠的参数估计, 增加统计功效(Collins,Schafer, & Kam, 2001; Graham, 2009)。然而, 当前方法学领域对纳入辅助变量的研究还有些重要的问题尚未探明。例如, 纳入自身就存在缺失的辅助变量是否有益?因此, 本研究拟采用蒙特卡洛模拟的方法对尚存的问题做进一步的探索, 希望为应用研究者合理使用辅助变量提供有益的指引。

    1.1 数据的缺失机制与现代的处理方法

    美国统计学家Rubin (1976)最早将缺失机制分为3类:完全随机缺失、随机缺失和非随机缺失。完全随机缺失(Missing Completely at Random,MCAR)指变量缺失发生的可能性与变量自身及其他变量都无关, 即变量出现缺失这一事件是随机事件。随机缺失(Missing at Random, MAR)指变量缺失发生的可能性与模型中某些观测变量有关而与该变量自身无关, 即缺失发生的可能性与其他变量有关。非随机缺失(Missing Not at Random, MNAR)指变量缺失发生的可能性只与自身相关。

    现代处理缺失数据的方法中, 最为研究者推崇的是全息极大似然估计和多重插补(Enders &Bandalos, 2001; Graham, 2009; Schafer & Graham,2002) ......

您现在查看是摘要页,全文长 26102 字符