使用似然比D2统计量的题目属性定义方法*
测验,成功率,矩阵,1引言,2IRT下的模型拟合度评价方法,3使用D2统计量来估计题目属性向量和Q矩阵,1DINA模型,2DINA模型下的D2统计量,3Q矩阵和题目参数的在线估计算法,4模拟研究,1研究设计,2研究结果
喻晓锋 罗照盛 高椿雷 李喻骏 王 睿 王钰彤(1江西师范大学心理学院, 南昌 330022) (2亳州师范高等专科学校, 亳州 236800)
1 引言
我国中长期教育改革和发展规划纲要(2010-2020年)明确提到:要注重因材施教, 要改进教育教学评价, 探索促进学生发展的多种评价方式。要做到因材施教, 首先就必须深入地了解学生的认知特点, 对其长处和短处进行诊断性分析, 即实施认知诊断评价(也简称认知诊断)。相对于其它的评价形式, 认知诊断评价不但能提供被试在测验上的总体评价指标, 而且能提供被试在测验领域上的详细的诊断报告。著名的“分数减法”数据(Tatsuoka,1990)中包含 20个题目, 界定了将整数化为分数、从带分数中分离出整数、在减法运算前进行化简等8个属性。如果某被试的属性掌握模式为[1 0 0 0 0 0 0 0], 表明该被试只掌握了第1个属性(即将整数转化为分数), 对其他7个属性都没有掌握。有了诊断性分析报告, 就可以进行有针对性的补救教学和学习。由此可见, 认知诊断报告中可提供丰富的信息,对被试的学习、教师的教学和教学效果的评价都有很重要的参考作用。
属性是指测验所考察的被试的潜在特质, 包括知识、技能、策略等(Leighton, Gierl, & Hunka,2004)。Q矩阵(Tatsuoka, 1983)描述了测验中的所有题目和属性之间的关联关系, 通常用1来表示题目考察了某属性, 用0来表示题目没有考察某属性。丁树良等人对 Q矩阵理论进行了深入研究(丁树良,罗芬, 汪文义, 2012; 丁树良, 毛萌萌, 汪文义, 罗芬, Cui, 2012; 丁树良, 汪文义, 罗芬, 2012; 丁树良, 汪文义, 杨淑群, 2011; 丁树良, 杨淑群, 汪文义, 2010)。Q矩阵的建立包括题目属性的定义和题目属性向量的验证。被试在测验属性(通常有多个)上的掌握情况就构成了被试的属性掌握模式。
认知诊断模型借助Q矩阵, 以作答数据为基础去推断被试的属性掌握模式。题目属性(在本文中,如无特别说明, 题目属性是指题目的属性向量)的定义和认知诊断模型对认知诊断评价很重要。测验中题目属性向量(即Q矩阵)的定义是否正确对于认知诊断模型的识别和被试的分类都是十分关键的(Rupp & Templin, 2008)。通常情况下, 题目属性是由领域专家根据自己的知识或经验进行定义的, 但这容易受到专家主观因素的影响, 从而导致题目属性的定义出现偏差。上述“分数减法”测验(Tatsuoka,1990), 直到今天, 其题目属性定义仍然存在争议 ......
您现在查看是摘要页,全文长 26196 字符。