变长CD-CAT中的曝光控制与终止规则*
后验,题库,测验,1引言,2变长CD-CAT终止规则,1HSU法,2属性标准误法(standarderrorofattributemethod,SEA),3二等分法(halvingalgorithm,HA),4邻近后验
郭 磊 郑蝉金 边玉芳1 引言
近些年来, 国内外对认知诊断计算机化自适应测验(Cognitive Diagnostic Computerized Adaptive Testing, CD-CAT)的研究越来越多。CD-CAT结合了认知诊断理论和 CAT的双重优势, 比起传统的测验形式, 它可以更精确、更迅速、更灵活地测量出被试的潜在知识结构, 也称为知识状态(Knowledge State, KS), 从而获得被试在知识点上的掌握情况,为教育教学工作提供有针对性的指导, 促进学生的个性化发展。
CD-CAT和传统CAT的组成部分是相似的, 主要包括五部分:(1)参数已知的题库; (2)初始项目选择方法; (3)知识状态或能力值的估计; (4)选题策略;(5)终止规则(陈平, 2011)。由于CD-CAT发展较晚,截止目前, CD-CAT的研究主要集中在选题策略(Cheng, 2009, 2010; Wang, 2013; Wang, Chang, &Douglas, 2012; Xu, Chang, & Douglas, 2003; 毛秀珍, 辛涛, 2011)、项目曝光控制(Wang, Chang, &Huebner, 2011; 陈平, 2011; 毛秀珍, 辛涛, 2013)和属性在线标定(Chen, Xin, Wang, & Chang, 2012; 陈平, 辛涛, 2011; 汪文义, 丁树良, 游晓锋, 2011)方面, 对终止规则的研究相对较少。在查阅国内外关于CD-CAT终止规则的文献后发现, 仅有Hsu, Wang和Chen (2013)专门对变长CD-CAT的终止规则进行过模拟研究, 而大部分的研究还是围绕选题策略、曝光控制和属性在线标定这三方面展开的。但关于这三方面的研究均是以定长(fixed-length) CAT的形式作为终止规则, 即固定每次测验的长度, 当被试完成测验后, 根据被试的作答反应估计知识状态。定长CAT由于固定了测验长度, 施测较为方便,但对不同的被试会有不同的测量精度。一个更加合理的做法是, 应该使得 CAT形式的测验对每个被试的测量精度相同, 这也正是自适应测验的优势所在(Weiss & Kingsbury, 1984)。与定长CAT相对应的终止规则为变长(variable-length)CAT, 变长 CAT能够达到每个被试具有相同测量精度的目标, 具有更高的估计精度(Babcock & Weiss, 2009)。Kingsbury和 Houser (1993)的研究表明, 不管是在多级评分CAT还是0-1评分CAT中, 变长CAT在测验效率、能力估计的收敛和能力估计精度等方面均优于定长 CAT ......
您现在查看是摘要页,全文长 27438 字符。