基于基尼指数的双目标CD-CAT选题策略*
题库,测验,1引言,2已有双目标CD-CAT选题策略简述,1ASI策略,2IPA策略,3JSD策略,3基于基尼指数的双目标CD-CAT选题策略,1基于基尼指数的CD-CAT选题策略,2基于基尼指数的IRT-CAT选题
罗 芬 王晓庆 蔡 艳 涂冬波(1 江西师范大学心理学院,南昌 330022)
(2 江西师范大学计算机信息工程学院,南昌 330022)
1 引言
终结性评价用一个连续标量θ(常称为潜在特质或能力)来刻画学生在某个学习阶段的学习效果,基于项目反应理论(item response theory,IRT)的计算机化自适应测验(computerized adaptive testing,CAT)以“量体裁衣”的方式能更高效地实施终结性评估。形成性评价用一个离散向量α(常称为潜在认知模式或知识状态)来帮助教师了解每个学生的潜在认知状态,为教师提供教学反馈,以便更好地“因材施教”,这有利于学生学业和教师职业发展,基于认知诊断理论(cognitive diagnostic theory,CDT)的CAT 以“个性化”测验方式快速诊断被试认知的长处和短板。教学需要终结性评价与形成性评价相互结合,既关注结果又关注过程,使学习过程和对学习结果的评价达到和谐统一。IRT-CAT 关注终结性评价,CD-CAT (cognitive diagnostic computerized adaptive testing,CD-CAT)关注形成性评价,两者结合的双目标 CD-CAT (dual objective CD-CAT,Dual-CAT)可以将它们的优势互补,从而更好地完成测验目标。
Dual-CAT 的两个重点研究主题:一是建构题库的心理计量学指标,正如IRT-CAT 依赖于项目反应模型(item response method,IRM),CD-CAT 依赖于认知诊断模型(cognitive diagnostic model,CDM),Dual-CAT 也依赖于测验模型,测验模型与题库的心理计量学指标息息相关。现有文献,只有统一模型(unified model,也称为 fusion model) (Hartz,2002; Rupp et al.,2010)和高阶模型(de la Torre &Douglas,2004)将被试的知识状态α与能力θ建构在一个模型中,但统一模型所含参数较多,在统计上难以估计(Hartz,2002),因此实际应用较少。而高阶模型采用层级结构,将潜在特质视为比潜在属性更高层的一般能力,能力θ与项目的正确作答概率之间的关系是通过被试知识状态α间接相关,只有当属性个数较多时(例如大于10),能力θ的估计才会比较准确(de la Torre & Douglas,2004; Hsu & Wang,2015; Huang,2020) ......
您现在查看是摘要页,全文长 29311 字符。