考试抄袭识别的心理测量学研究回顾(2)
第5页 |
第1页 |
参见附件(744KB,9页)。
相对于ACS,关于PFS统计量的研究和应用较少,Cizek认为其统计检验力比较低[7]。造成这一现象的原因是:PFS主要用于识别各种异常行为[19],如:作弊,猜测、预先知道答案、默认反应风格,社会期望性反应等,识别出来的异常行为不仅仅局限于抄袭答案。也就是说如果被试的得分模式与项目反应理论的模式不拟合,我们也不能断定被试间存在抄袭的行为,因为其它的异常行为也能导致不拟合。而ACS主要是针对抄袭答案这种作弊的方式提出的一种统计识别方法,因此更有针对性。
3 关于各抄袭统计量性能的实验研究
在ACS的发展过程中,新的统计量不断提出,新统计量的提出者一般要对其识别率和错误率进行检验,并与其他统计量进行对比。国外的相关研究可分两类,一类是模拟研究,一类是真实数据研究。模拟研究一般是用Monte Carlo等程序生成被试数据,再从中选择一定比例的被试(如5%),将其对部分题目的回答修改为与其他被试(即被抄袭者s)相同,这些被试就是抄袭者(c)。真实数据则是选择某个真实测验中的数据,将一部分被试的部分题目改为与其他被试相同,分别作为抄袭者(c)和被抄袭者(s)。这两类研究都是人为地生成抄袭者,目前还没有见到对真实抄袭者的研究。
以下我们重点介绍关于近期提出的ACS统计量的有影响的几个模拟研究和真实数据研究。
3.1模拟研究
4 总结与展望
4.1 各抄袭统计量性能的综合比较
自抄袭研究的统计方法产生以来,被提出的抄袭统计量有20多种,每一个统计量的提出都以改进识别率为目的,并把I型错误率控制在理论值之下。研究者对这些统计量的性能进行了反复对比。
ω是研究最多的统计量,它能很好地控制I型错误率。在大样本和小样本条件下识别率都高于其它统计量。Sotaridona和Meijer指出如果称名反应模型的项目参数能被可靠的估计,ω可能是识别抄袭答案的最好选择,因为它对所有能力水平的抄袭者和小样本条件的下的抄袭者都灵敏[2]。但估计IRT模型的项目参数时需要大量的样本,这与小样本条件下ω统计量可以很好的识别抄袭者相矛盾。因此,Wollack和Cohen研究了小样本(100)对ω统计量的影响,研究表明即使不能精确的估计称名反应模型的项目参数,也不会显著降低ω统计量的性能[20]。但在项目反应理论的假设条件被违背时ω统计量是否具有稳健性目前还缺乏研究 ......
您现在查看是摘要介绍页,详见PDF附件(744KB,9页)。