多维题组效应Rasch模型*
参数估计,测验,1引言,2多维题组效应Rasch模型的开发,1“题组(testlet)”的本质,2题组效应,2.1项目内单维题组效应,2.2项目内多维题组效应,3多维题组效应Rasch模型,3多维题组效应Rasch模型的参数估计
詹沛达 王文中 王立君 李晓敏(1浙江师范大学心理系, 金华 321004) (2香港教育学院评估研究中心, 香港)
1 引言
在实际心理或教育测验中, 经常出现多个项目共用相同刺激(stimulus)的情况, 这种受共同刺激影响和制约的项目集合通常被称为题组(testlet)(Wainer & Kiely, 1987)或项目束(item bundle)(Rosenbaum, 1988)。使用题组可以节约考生阅读材料的时间, 提高测验的效率, 提供逻辑关系更强的材料(Bradlow, Wainer, & Wang, 1999; Wainer,Bradlow, & Du, 2000; DeMars, 2006; Wainer,Bradlow, & Wang, 2007; Huang & Wang, 2013)。目前, 如全国硕士研究生入学统一考试、CET、TOEFL、GRE、PISA等均涉及了大量的题组, 可以说测验已经出现了由采用大量的独立多选题向采用题组的过渡趋势(Wainer et al., 2007), 对题组进行研究的必要性日显重要。
当测验存在题组时, 由于嵌在题组内的项目共用相同的题组刺激, 这时题组项目反应间就存在一定的相依性, 即局部项目依赖性。若直接使用标准项目反应模型(standard item response model)去拟合存在局部项目依赖性的反应数据会导致诸多问题,如:高估测验精度(低估测验的标准误)、项目参数的偏差估计、增加测验等值误差、 DIF检验不合理等(Wang & Wilson, 2005a; Wang & Wilson, 2005c;Li, Bolt, & Fu, 2005; Marais & Andrich, 2008;Fukuhara & Kamata, 2011; DeMars, 2012; He, Li,Wolfe, & Mao, 2012; Jiao, Kamata, Wang, & Jin,2012; Huang & Wang, 2013; 吴锐, 丁树良, 甘登文,2010; 郑蝉金, 郭聪颖, 边玉芳, 2011; 刘玥, 刘红云, 2012)。此外, 当局部项目依赖性适中或题组项目占全部测验项目的比例较小时(Wainer, 1995), 也可将整个题组看成一个多级评分的超级项目(super item) (Sireci, Thissen, & Wainer, 1991), 并采用多级评分模型去拟合超级项目的反应数据(Cook, Dodd,& Fitzpatrick, 1999; Marais & Andrich, 2008) ......
您现在查看是摘要页,全文长 38859 字符。