多维题组反应模型:多维随机系数多项Logistic模型的应用拓展*
参数估计,计分,1研究背景,1文献综述,2问题提出,2多维题组反应模型,1能力多维性概念,3参数估计,3模拟研究1:多维题组反应模型参数估计返真性及其影响因素探究,1模拟研究设计,2被试反应数
魏 丹 刘红云 张丹慧(1北京师范大学中国基础教育质量监测协同创新中心, 北京 100875) (2北京师范大学心理学院, 北京 100875)
1 研究背景
1.1 文献综述
传统测验中, 如果项目之间存在关联, 被试对不同项目的反应会受到项目之间的相互影响, 这违背了标准IRT模型对项目局部独立性的假设, 从而影响对被试能力的估计。然而, 在各类测验中, 基于某一刺激材料研发多个项目的做法被广泛使用。例如在英语水平测验中, 一篇阅读材料往往会包含多个项目, 被试对这些项目的反应会受到相同阅读材料和背景的影响。这类受到共同刺激影响的项目集合称为题组(Wang & Wilson, 2005)。
众多研究已经表明, 随着各种测验中题组的出现, 传统 IRT模型(满足项目局部独立性假设)已经不能适应准确估计被试能力的要求。詹沛达、王文中和王立君(2013)指出, 在包含题组的测验中, 如果忽略项目依赖性而直接运用标准IRT模型, 将会错误估计测验信度和标准误差(Bradlow, Wainer, &Wang, 1999; Marais & Andrich, 2008; Sireci, Thissen, &Wainer, 1991; Wainer & Wang, 2000; Yen, 1993)、导致等值误差和收缩误差(Lee, Kolen, Frisbie, & Ankenmann,2001; Li, Bolt, & Fu, 2006)、导致项目区分度参数的估计误差(Bradlow et al., 1999; Wainer & Wang, 2000;刘玥, 刘红云, 2012)以及模型对项目的不适用性(misfit) (Marais & Andrich, 2008)、也会导致信息量估计不准确(Ip, 2010; Wainer & Wang, 2000)。
针对包含题组测验的分析, 其中一种处理方法是分步计分模型, 即将同一题组内的项目看成一个多级计分的“超级项目”, 这种处理方法因为将多个项目看作一个多级计分的项目, 没有充分利用到每个项目的信息, 存在一定不足。此外, 众多研究者提出各种题组模型, 如贝叶斯题组反应模型、Rasch题组模型、双因子模型、多水平题组模型和Copula模型等。其中, 贝叶斯题组反应模型(Bradlow et al., 1999; Wainer & Wang, 2000; Wang, Bradlow,& Wainer, 2002)和Rasch题组模型(Wang & Wilson,2005)通过在标准 IRT模型中加入题组效应参数,形成相应的题型反应模型, 通过题组的方差来反应题组效应的大小; 双因子模型(Gibbons & Hedeker,1992; Gibbons et al., 2007)源于对连续项目反应的验证性因子分析, 模型中分为包含所有项目的主要维度(即被试能力)和仅包含部分项目子集的次要维度(即题组效应), 双因子多维 IRT模型(DeMars,2006; Li et al., 2006), 通过次要维度的载荷与主要维度的载荷之比来反映题组效应的大小 ......
您现在查看是摘要页,全文长 25625 字符。