从效应量应有的性质看中介效应量的合理性*
显著性,单调,1效应与效应量,1显著性检验不能满足需要,2效应通常缺少可比性,3常见效应量,2效应量与效应的显著性,3效应量应当有的性质,1与测量单位无关,2相对于效应而言具有单调性,3不受样本容量的影响,4效应量的其
温忠麟范息涛叶宝娟陈宇帅(1华南师范大学心理应用研究中心/心理学院,广州 510631)(2澳门大学,澳门)(3江西师范大学心理学院,南昌 330022)
国际上对心理学和其他社科领域的方法研究有重要影响的期刊Psychological Methods(2014年影响因子7.34)发表了Preacher和Kelley(2011)的论文讨论中介效应量,经过一番评长论短,对当时已有的中介效应量都有不满,最终推荐的是他们新提出的κ作为中介效应量。从此κ在国际上流行开来,不仅有论著介绍(Athay,2012;方杰,张敏强,邱皓政,2012;Field,2013),而且有许多实际应用(例如,Koletzko,Herrmann,&Brandst?tter,2015;Labelle,Lawlor-Savage,Campbell,Faris,&Carlson,2015;Rivera&Fincham,2015),在互联网上也有κ的计算器(如http://stats.myresearchsurvey.com/kappasquared/),很方便使用。然而,Wen和Fan(2015)通过逻辑判断和数学推演,证明了κ不仅计算错误,而且从定义开始就有问题。他们的研究结果终结了κ作为中介效应量的合法性。κ的问题出在哪里、又是如何被发现的?这要从效应量的作用和性质寻找答案。本文首先介绍效应量的相关知识,如何根据统计显著性和效应量作出统计结论;接着讨论效应量应当具有哪些基本性质;然后根据这些性质检视包括κ在内的主要中介效应量的合理性;最后,讨论了如何报告中介效应量以及有待研究的问题。
1 效应与效应量
1.1 显著性检验不能满足需要
尽管争论不断,零假设显著性检验(NHST)仍然是大多数统计分析不可或缺的重要环节,至少“显著性”的结果能告诉我们,效应(effect)不太可能是由样本的抽样误差而产生的,提高了对研究假设(即备择假设
H)的信心(温忠麟,吴艳,2010)。不过,单单一个“显著性”的结果,所得结论是很弱的。以通常的两组差异检验为例,差异显著说明“差异在统计上可以分辨出来”,但并没有指出差异有多大(温忠麟,侯杰泰,2008)。再以相关分析为例,相关显著说明“相关系数不是零”,但并没有指出相关有多高。这就不难理解,诸如检验测验信度系数(如重测信度)的显著性那样的统计分析是没有意义的,因为人们感兴趣的是“信度有多高”,而不是“信度是否为零”。
为了弥补显著性检验的不足,在统计分析结果中报告效应量(effect size)受到重视(Fan&Konold,2010;Thompson,2007;Wilkinson,1999),不仅多数国际期刊要求报告效应量,国内不少重要期刊也要求报告效应量 ......
您现在查看是摘要页,全文长 26915 字符。