当前位置: 首页 > 期刊 > 《心理学报》 > 2023年第7期
编号:569003
认知诊断测评中缺失数据的处理:随机森林阈值插补法*
閸忔娊鏁拠宥忕窗诊断模型,正确率,比例,1引言,2随机森林阈值插补法(RFT)的提出,1认知诊断模型:DINA模型,2随机森林插补法,3随机森林阈值插补方法,3研究1:随机森林阈值插补方法的插补率和正确率,1数据缺失机制,2

     游晓锋 杨建芹 秦春影 刘红云

    认知诊断测评中缺失数据的处理:随机森林阈值插补法*

    游晓锋1杨建芹1秦春影1刘红云2, 3

    (1南昌师范学院数学与信息科学学院, 南昌 330032) (2应用实验心理北京市重点实验室;3北京师范大学心理学部, 北京 100875)

    认知诊断测评中缺失数据的处理是理论和实际应用者非常关注的研究主题。借鉴随机森林插补法(RFI)不依赖于缺失机制假设的特点, 对已有的RFI方法进行改进, 提出采用个人拟合指标(RCI)确定插补阈值的新方法: 随机森林阈值插补方法(RFTI)。模拟研究表明, RFTI在插补正确率上明显高于RFI方法; 与RFI和EM方法相比, RFTI在被试属性模式判准率和边际判准率上表现出明显优势, 尤其是非随机缺失和混合缺失机制, 以及缺失比例较高的条件下, 其优势更加明显。但对项目参数的估计, RFTI方法与EM方法相比不具有优势。

    缺失数据, 认知诊断测评, 随机森林阈值插补, 随机森林插补, EM算法

    1 引言

    近年来, 教育与心理评估的实践越来越关注测评结果的应用, 随着信息技术的发展和精准测评服务的需求, 测评日益融入日常的教学和学习过程(Bennett, 2010)。认知诊断测评(cognitive diagnosis assessment, CDA)通过被试在测验上的反应模式对其特定的知识结构(knowledge structure)和加工技能(processing skills)进行评价, 而推知被试的知识状态(knowledge state, KS), 从而对其优势和劣势提供更具诊断性的信息。认知诊断测评由于其在测评结果反馈上的优势备受研究者和实践应用者的青睐, 然而, 实际测验中往往不可避免存在缺失数据。造成数据缺失的原因有多种, 一方面测验设计上可能带来作答数据缺失, 例如, 国际大规模PISA测试、分层教学等个性化学习的测试, 每个学生只完成全部测试的部分题目; 另一方面, 除设计造成的缺失数据外, 由于其他原因产生的缺失数据也很常见, 例如, 由于测验时间限制或测验安全方面的考虑, 以及测试者有意忽略测验中某些题目等(Cheema, 2014; Mislevy & Wu, 1988; Pohl et al., 2014; Rose et al., 2010)。大量的研究证实不同缺失值处理方法会对个体知识状态的估计精度带来不同影响(Dai, 2017; Pan & Zhan, 2020)。因此, 在实际 CDA 测验中应重视缺失数据问题, 并选用合适方法处理, 以提升诊断精度(宋枝璘等, 2022) ......

您现在查看是摘要页,全文长 41192 字符
婵″倹鐏夐幃銊ユ躬娴h法鏁ら幍瀣簚缁涘绁︾憴鍫熸閺冪姵纭堕弻銉ф箙閹存牔绗呮潪钘夊弿閺傚浄绱濋崣顖濆厴閺勵垵顫﹂幖婊呭偍瀵洘鎼告径杈╂埂閳ユ粏娴嗛惍浣测偓婵撶礉鐠囬鍋i崙璇茬潌楠炴洘娓舵稉瀣煙閻ㄥ嫧鈧粎鏁搁懘鎴犲閳ユ繃鍨ㄩ垾婊冨斧缂冩垿銆夐垾婵婎問闂傤喓鈧拷


闂勬劒绨張宥呭閸c劌甯囬崝娑崇礉缂冩垹鐝柈銊ュ瀻娣団剝浼呴崣顏冪返閻栧崬绺炬导姘喅閹存牗婀佹稉鈧€规氨袧閸掑棛娈戝▔銊ュ斀娴兼艾鎲冲ù浣筋潔閵嗭拷
濮濓拷娣団剝浼�闂団偓鐟曪拷 2 缁夘垰鍨庨敍鍫濆帳鐠愯鏁為崘宀€娅ヨぐ鏇炴倵濮e繐銇夐崣顖欎簰妫板棗褰�10娑擃亞袧閸掞拷閿涘鈧拷
    娣団剝浼呮禒鍛返閸欏倽鈧喛绱濇稉宥嗙€幋鎰崲娴f洑绠e楦款唴閵嗕焦甯归懡鎰灗閹稿洤绱╅妴鍌涙瀮缁旂姷澧楅弶鍐ㄧ潣娴滃骸甯拋妞剧稊閺夊啩姹夐敍宀冨閹劏顓绘稉鐑橆劃閺傚洣绗夌€规粏顫﹂弨璺虹秿娓氭稑銇囩€硅泛鍘ょ拹褰掓鐠囦紮绱濈拠鐑藉仏娴犺埖鍨ㄩ悽浣冪樈闁氨鐓¢幋鎴滄粦閿涘本鍨滄禒顒佹暪閸掍即鈧氨鐓¢崥搴礉娴兼氨鐝涢崡鍐茬殺閹劎娈戞担婊冩惂娴犲孩婀扮純鎴犵彲閸掔娀娅庨妴锟�

   瀵邦喕淇婇弬鍥╃彿  閸忚櫕鏁為惂鐐  鐠囧嫯顔戦崙鐘插綖  閹兼粎鍌ㄩ弴鏉戭樋