这才是心理:学看穿伪科学的批判性思维.pdf
http://www.100md.com
2021年1月22日
第1页 |
第7页 |
第13页 |
第27页 |
第31页 |
第117页 |
参见附件(3319KB,342页)。
这才是心理:学看穿伪科学的批判性思维
《这才是心理学》与常见的心理学入门教材不同,它并不系统性地全面介绍心理学各个门类的知识,也不涉及技术化较强的统计学、实验设计、心理测量,而是专注于心理学的研究方法和思维方式。感兴趣的欢迎学习
内容简介
在今天的大众媒体和图书市场上,到处充斥着关于潜能提升、心理操控、色彩星座、催眠读心等伪装成心理学的主题,更有一些伪心理学家、所谓的心理治疗师打着心理学的旗号欺世盗名,从中渔利。
在浩如烟海、良莠不齐的心理学信息面前,如何拨除迷雾,去伪存真,成为一个明智的心理学信息的消费者呢?《这才是心理学》将教给你科学实用的批判性思维技能,将真正的心理学研究从伪心理学中区分出来,告诉你什么才是真正的心理学。
《这才是心理学》第1版出版于1983年,30多年来一直被奉为心理学入门经典,在全球顶尖大学中享有盛誉,现在呈现在读者面前的是第11版。How to ?ink Straight about Psychology 是本书的英文书名,直译为“如何清晰地思考心理学”。中译本首次在国内出版时,所采用的书名是《与“众”不同的心理学》。第8版中译本出版时,伪心理学在国内正有愈演愈烈之势,加之考虑到作者始终聚焦于将科学的心理学与伪科学、伪心理学以及通俗心理学区别开来,故书名曾一度改为《对“伪心理学”说不》。第9版采用了《这才是心理学》这一更加贴切的书名,已经赢得了广大读者的认可和良好的口碑,故第11版沿用了这个书名。
这本书并不同于一般的心理学导论类教材,很多内容是心理学课堂上不曾讲授的,也是许多心理学教师在教学中感到只可意会不可言传的。作者正是从此初衷出发,以幽默生动的语言,结合一些妙趣横生、贴近生活的实例,深入浅出地介绍了可证伪性、操作主义、实证主义、安慰剂效应、相关和因果、概率推理等心理学中的基本原则。与上一版相比,第11版更新了最新的研究资料和实例以及290篇新文献。
《这才是心理学》不仅适合心理学专业的学生,有助于建立心理学研究中必要的批判性思维技能与意识,其通俗易读性也非常适合所有对心理学感兴趣的读者。它将帮助你纠正对心理学的种种误解,学会独立地评估心理学信息,用科学的精神和方法理解自己与他人的行为。同时,本书也有助于培养日常生活中的批判性思维技能。
相关内容部分预览
作者简介
基思·斯坦诺维奇 Keith E. Stanovich
加拿大多伦多大学人类发展与应用心理学教授,曾担任加拿大应用认知科学首席科学家。他的研究领域是阅读和推理的心理学机制,迄今已发表200多篇论文,出版了7部著作。在一项对于论文引用率的调查中,斯坦诺维奇是引用率最高的50位发展心理学家之一。斯坦诺维奇教授于2010年获得格威尔美尔教育奖,并于2012年荣获美国心理学协会(APA)颁发的桑代克终身成就奖。
目录
序 言 xviii
第1章 心理学充满生机(在科学阵营里表现不俗) 1
第2章 可证伪性:如何打败头脑中的小精灵 23
第3章 操作主义和本质主义:“但是,博士,这到底是什么意思?” 42
第4章 见证和个案研究证据:安慰剂效应和了不起的兰迪 60
第5章 相关和因果:用“烤箱法”避孕 83
第6章 让一切置于控制之下:聪明汉斯的故事 96
第7章 “但这不是真实的生活!”:“人为性”批评与心理学 121
第8章 避免爱因斯坦综合征:聚合性证据的重要性 135
第9章 打破“神奇子弹”的神话:多重原因的问题 158
第10章 人类认知的阿喀琉斯之踵:概率推理 167
第11章 偶然性在心理学中扮演的角色 186
第12章 不招人待见的心理学 204
主题索引 231
这才是心理学书籍读后感
这本书我不觉得它在讲心理学。我更觉得它在讲科学,科学的思维方式,科学的研究方法,科学之所以成为科学的原因。目的也是科普科学,纠正普罗大众对科学及心理学的错误认知。心理学,不管它是怎样的交叉,怎样的容易被人误解,它是科学就是科学,不是常识。
那么,什么是科学?
一,它是系统的实证性的。系统,意味着结构化。实证,意味着观察。
结构化里,不得不提到相关。相关不等于因果,这要经过仔细计算和排查,才能得到真实的因果。
观察,就一定不是只基于个案的,更不是孤立的,一定会有控制。实验都要有控制组和实验组。这样两相对照,才能避免自然恢复以及安慰剂效应。也才能通过操纵变量而得到最靠谱最直接的结果。
二,它产生的是公共知识。即它是可重复的,并且能经得起同行检验的。
可重复的,就明确表明了操作定义的必要。操作定义,就是用操作过程来定义,不用玄而又玄的本质来定义。本质,是最不本质的东西。千人看有千种看法。还是直接可行的方法来定义最靠谱。
同行检验,即是大家一起来做实验。你不是说是这样的吗?那我就照着你的方法来再做一次,看是不是这样。这不是开玩笑。科学家们是最有嫉妒心的种族,每出一个理论,恨不得马上就证明你是错的。哪怕我自己也没什么对的理论,只要你是错的,我就高兴。这也促进了我们科学的蓬勃发展啊。
三是验证的是可解决的问题。
可解决,是指的在目前条件下,可以解决的。灵异的事件,将来能不能解决不知道,但现在条件下,解决不了,那它就不是科学。
这也就要求,科学是可证伪性的。它一定有明确的预测,告诉什么会发生的同时,也告诉什么不会发生。这样才能避免陷入不可以被证明不对的陷阱。科学不要两面都是人。这也就让我惊讶了,按这标准,佛洛依德真的不算科学。难怪那么多老师对他的理论推崇又顾虑了。
这才是心理:学看穿伪科学的批判性思维截图
目录
内容提要
心理学有什么与众不同之处
译者序
序言
第1章 心理学充满生机(在科学阵营里表现不俗)
弗洛伊德问题
现代心理学的多样性
多样性的影响
科学的统一性
那么,什么是科学
系统的实证主义
可公开验证的知识:可重复性和同行评审
可实证解决的问题:科学家对可检验理论的探求
心理学和世俗智慧:“常识”的问题
心理学是一门年轻的科学
小结
第2章 可证伪性:如何打败头脑中的小精灵
理论和可证伪性标准
敲门节奏理论
弗洛伊德与可证伪性
小精灵
并非所有的证实都等价
可证伪性与世俗智慧
承认错误的自由
想法不值钱
科学中的错误:逼近真理
小结
第3章 操作主义和本质主义:“但是,博士,这到底是什么意思?”
为什么科学家不是本质主义者
本质主义者喜欢咬文嚼字
操作主义者将概念和可观测事件联系在一起
信度和效度
直接和间接的操作性定义
科学概念的演进
心理学中的操作性定义作为人性化力量的操作主义
本质主义问题和对心理学的误解
小结
第4章 见证和个案研究证据:安慰剂效应和了不起的兰迪
个案研究的地位
为什么见证叙述毫无价值:安慰剂效应
“鲜活性”问题
单一个案的压倒性影响
鲜活的逸事和见证为何如此有说服力
了不起的兰迪:以彼之道,还施彼身
见证为伪科学打开方便之门
小结
第5章 相关和因果:用“烤箱法”避孕
第三变量问题
为什么戈德伯格的证据更好
方向性问题
选择偏差
小结
第6章 让一切置于控制之下:聪明汉斯的故事
斯诺与霍乱
比较、控制和操纵
随机分配与操纵共同定义了真实验研究
控制组的重要性
聪明汉斯——神马的故事
20世纪90年代和如今的聪明汉斯
分离变量:创设特殊条件
直觉物理学
直觉心理学
小结
第7章 “但这不是真实的生活!”:“人为性”批评与心理学
为什么自然性并非总是必要的
随机样本与随机分配的混淆
理论研究与应用研究的异同
心理学理论的应用
“大二学生”问题
客观看待真实生活和大二学生问题
小结第8章 避免爱因斯坦综合征:聚合性证据的重要性
关联性原则
消费者规则:警惕是否违反关联性原则
“跃进”模式与渐进整合模式的比较
聚合性证据:在缺陷中进步
聚合性证据的类型
科学共识
研究方法和聚合性原则
向更有效的研究方法迈进
不要对矛盾数据感到绝望
小结
第9章 打破“神奇子弹”的神话:多重原因的问题
交互作用的概念
单一原因解释的诱惑
小结
第10章 人类认知的阿喀琉斯之踵:概率推理
“某某人”统计学
概率推理以及对心理学的误解
有关概率推理的心理学研究
未充分使用概率信息
未能使用样本大小信息
赌徒谬误
再谈统计与概率
小结
第11章 偶然性在心理学中扮演的角色
试图解释偶然性事件的倾向
解释偶然性:相关错觉和控制错觉
偶然性与心理学
巧合
个人的巧合
接受错误以减少错误:临床预测与统计预测
小结
第12章 不招人待见的心理学
心理学的形象问题
心理学和超心理学
自助类读物
菜谱式知识心理学与其他学科
我们是自己最坏的敌人
我们是自己最坏的敌人之二:心理学已成为单一的意识形态文化
每个人不都是心理学家吗?行为的内隐理论
科学心理学受到抵制的根本原因
结束语
参考文献著录索引
参考文献内容提要
在今天的大众媒体和图书市场上,到处充斥着关于潜能提升、心
理操控、色彩星座、催眠读心等伪装成心理学的主题,更有一些伪心
理学家、所谓的心理治疗师打着心理学的旗号欺世盗名,从中渔利。
在浩如烟海、良莠不齐的心理学信息面前,如何拨除迷雾,去伪存
真,成为一个明智的心理学信息的消费者呢?这本书将教给你科学实
用的批判性思维技能,将真正的心理学研究从伪心理学中区分出来,告诉你什么才是真正的心理学。
本书第1版出版于1983年,30多年来一直被奉为心理学入门经典,在全球顶尖大学中享有盛誉,现在呈现在读者面前的是第11版。这本
书并不同于一般的心理学导论类教材,很多内容是心理学课堂上不曾
讲授的,也是许多心理学教师在教学中感到只可意会不可言传的。作
者正是从此初衷出发,以幽默生动的语言,结合一些妙趣横生、贴近
生活的实例,深入浅出地介绍了可证伪性、操作主义、实证主义、安
慰剂效应、相关和因果、概率推理等心理学中的基本原则。与上一版
相比,第11版更新了最新的研究资料和实例以及290篇新文献。
本书不仅适合心理学专业的学生,有助于建立心理学研究中必要
的批判性思维技能与意识,其通俗易读性也非常适合所有对心理学感
兴趣的读者。它将帮助你纠正对心理学的种种误解,学会独立地评估
心理学信息,用科学的精神和方法理解自己与他人的行为。同时,本
书也有助于培养日常生活中的批判性思维技能。
To Paula, who taught me how to think straight about life心理学有什么与众不同之处
心理学是一门很容易让人误解的学科。与其他学科不同,它研究
的是与人们生活紧密相关的问题,有些还正好是大家都熟悉且经常关
心的问题。比如:什么样的人容易讨人喜欢?什么样的事情令我们记
忆深刻?什么样的事情让人高兴(或痛苦)?为什么男人比女人更爱
聊政治时事?人为什么要自杀?意念能不能被植入梦中?……正因为
人们关心这些问题,他们就会有自己的分析、自己的证据,得出自己
相信的结论。很多时候,这些自觉的结论与心理学家的研究结论并不
完全一致。比如说,我们心理学家就发现,青梅竹马的婚姻很难成
立,婴儿并不是有奶便认娘,性格并不决定一个人的命运,等等。每
当矛盾、怀疑、迷惑甚至气愤产生的时候,我们到底是该相信自己的
直觉、经验和常识,还是该相信心理学的研究、证据和知识呢?
不幸的是,大多数的心理学教科书只满足于告诉大家心理学的研
究、发现和知识,但从不说明为什么这些研究、发现及知识是值得我
们关注和信任的。这些书的作者好像都在假设每一位读者思考起问题
来都像心理学家一样,相信和理解心理学的研究、发现与知识。幸运
的是,基思·斯坦诺维奇教授写了这本How to Think Straight about
Psychology,一本与众不同的心理学教科书。他总结了心理学家的职
业特质,让每一位读者都有机会去理解心理学家是如何思考、分析和
解读人类的行为与心理的。每一章都将一个常识的、朴素的、直觉的
有关人类心理的分析和思考与一个科学的、严谨的、心理学的分析和
思考相对比,以帮助读者理解心理学家的分析逻辑和研究思路。
我个人觉得,在斯坦诺维奇阐述的心理学特质中,有两点应该是
区分我们心理学家和其他人(包括其他领域的科学家)的地方。
其一是我们心理学家的批判性思维习惯,也就是说,心理学家不
相信个人的智慧,更相信科学的方法,而科学方法的本质是证伪,即
对我们的经验、常识和直觉,产生怀疑、挑战和批评。从原则上而
言,心理学家不怕犯错误,但害怕以假乱真。心理学家也不相信那些能回答所有问题的绝对真理,但相信对所有问题应该有一个相对正确
的答案。心理学家从不相信个案和例子,因为其随机性和主观性太过
明显,但我们愿意相信大样本基础上的科学研究发现。我们希望听到
动听的心理故事,但更愿意看到众多心理学观察的数据和总结。
其二是我们心理学的概率性思维习惯。我们和很多自然科学家思
考方式的不同之处就在于我们更容易相信,任何人类的行为都是概率
性的表现,也就是说,它有一定的不确定性,会受到其他随机事件的
影响。其实人类很多学科都是建立在概率基础之上的,比如核物理、天体物理、生物进化、病理学、所有的社会科学(经济学、社会学、政治学等)等等,它们都不可能准确预测每一个研究对象的具体活
动,但都对整体的事物活动规律有很好的描述和预测。只不过我们心
理学家更愿意承认并强调我们学科的不确定性而已。
总之,我很高兴看到这本书在中国再版。杨中芳老师的早期译本
是我很喜欢向心理学爱好者推荐的一本心理学教科书。而新版的译
本,尤其令我兴奋,因为它是由我欣赏的两位年轻同事东徽和肖岑,在清华大学的青年教师公寓里,下功夫、花时间,认真翻译完成的。
他们两位既是同行,也是夫妻,应该是我们心理学界不鲜见的学术伴
侣之一。这可能也是我们心理学界与众不同的地方吧。
彭凯平 清华大学社会科学学院院长、心理学系主任译者序
每个学心理学专业的人都会被人问到三个问题,第一个通常
是:“你知道我现在心里在想什么吗?”第二个问题可能是:“那你
一定会催眠和解梦咯?”排名第三的问题则一般会是:“什么,你们
心理学还做实验?”这类对于问话人来说再正常不过的问题,却总能
让那些学心理学的人哭笑不得。
但是,一个真正称职的心理学工作者是不应回避或敷衍这类问题
的,正确的做法是直面它们并认真分析其中的意义,给予人们正确的
解答。从最常被问到的这三个问题中,我们便能以管窥豹地看出公众
对于心理学的一些常见误解和迷思。
第一个问题所揭示的事实是,心理学在大众心目中被万能化了。
所谓万能化,是指心理学研究对象和功能的边界被无限地夸大了。首
先,许多人认为心理学无所不包,星座、属相、血型、玄学、人生哲
理及各种心灵鸡汤都被认为是心理学的范畴——实际上,心理学研究
虽然涉及人类广泛的客观行为和心理现象,但作为心理学的研究对象
必须满足“可检验”这一标准,超验的、超感官的问题不在科学心理
学的研究之列;另外,并不是说心理学不能研究血型、星座和超感
知,实际情况是,这类现象和理论在历史上都曾经是心理学的研究对
象,但已被各种科学的方法所证伪并从心理学的研究对象中剔除出去
了。还有一种观点认为,心理学是无所不能的,学了心理学就能读心
算命,甚至能在千里之外控制他人的大脑并操纵其行为,还兼具其他
种种神奇的功效。我们说心理学很神奇,是因为它能在一定程度上解
释心理现象和预测行为,并能提供一些行之有效的干预方法。但是,科学心理学所有的预测和解释都基于客观数据,所有的结论都具有概
率的性质,有一定的适用范围和条件,干预方案也必须符合客观的心
理和行为规律。因此,没有能完美地解释一切现象的心理学理论,也
没有超出人类经验以外的干预和应用。第二个关于催眠的问题则揭示了另外一种对心理学的常见误解:
心理学就是弗洛伊德的精神分析,就是心理咨询。弗洛伊德这位伟大
的心理学家确实让后世的心理学研究者“既爱又恨”。弗洛伊德的功
绩在于,他以其非凡的工作投入和严谨的思辨构筑了一套宏大、晦涩
而让人着迷的理论体系,开启了一片探索人类心灵世界的全新领域,对社会文化、艺术创作产生了不可估量的影响,并真正让世人开始了
解和重视心理学。迄今为止,他的理论仍然广泛应用于心理治疗和干
预的诸多领域。今天人们都能熟练运用“焦虑”“压抑”“潜意
识”这些词来描述或解释分析自己的心理状态,也是拜弗洛伊德和他
的精神分析学派所赐。说到心理学家,或许很多人不知道冯特和斯金
纳,但没有人会不知道弗洛伊德。然而,弗洛伊德的盛名也带来了一
系列问题,最主要的是两点:一是他的光芒掩盖了其他领域心理学研
究者的工作和成就,二是弗洛伊德所构建的这些精巧的理论很难用实
证的方法加以验证,这也为后来众多伪心理学和虚假治疗手段的滋生
和发展留下了一道后门。
最后一个问题也是最关键的——公众不了解主流的科学心理学已
经在实证主义的道路上行进了很远。心理学是一门科学,必然遵循科
学的标准,即研究的必须是实证可解决的问题;方法上要遵循系统的
实证主义;研究结论要能够被重复验证,并能经过同行评审获得认
可。这三条标准也是区分科学心理学和其他伪心理学的分水岭。心理
学的研究因此也与操作性定义、实验组和控制组、变量控制、数据统
计等词汇联系起来,而不是个人化的体验及感悟、头脑风暴或纯粹的
逻辑推导。
那么,是什么阻碍了公众了解和认识真正的科学心理学?原因应
该是多方面的。这其中既有大众的原因,也有学院派研究者自身的问
题,当然也包括学科自身特点的限制。
首先,对心理学的渴求使得大众对心理学产生了特殊的期待。心
理现象和心理问题与每个人休戚相关,人们试图通过心理学解释这些
问题和现象,并从中获得行之有效的帮助和建议。在这方面,针对个
体的精神分析和治疗技术有一定的优势,而其他大多数心理学研究针
对的则是群体的普遍行为规律,偏重于解释和预测,其研究结论都具
有概率性和领域特异性,因此无法有针对性地、面面俱到地解决个体
所有的心理问题。这有时难免会让一部分抱着“求医问药”的心态来
了解心理学的人感到失望。第二,术语体系产生的阻隔。心理学作为科学,为了让研究者之
间形成共识并利于重复验证,产生了一套严谨的术语体系,这一点与
其他科学学科并无二致。但不同的是,没有人会因为不懂量子力学的
各种晦涩的术语而鄙视物理学,但他们却会因不能忍受心理学术语所
造成的隔膜而对科学心理学产生拒斥,继而转向了那些通俗易懂但科
学性无法得到保证的理论或方法。究其原因,还是因为心理问题和现
象与每个人的关系太过紧密了,最近的需要总是要以最快捷的方式介
入和解决,这就构成了快速实用和科学研究之间的一对矛盾。
第三,心理学的许多基础研究确实与大众生活有一定的距离。首
先是因为这些研究往往是控制十分严密的实验室实验,探讨的是最基
本的生理、行为机制,有些唤起特定反应的刺激在日常生活中几乎不
可能出现(如人造的假字等);其次,并不是说基础研究的成果没有
任何实用价值,而是很多成果转化为实际的应用需要一段时间,有的
研究发现甚至要几十年之后才能体现出应用价值。这种滞后性有时会
让人产生一种科学心理学研究毫无意义的错觉。
第四,许多学院派心理学工作者的做法也难辞其咎。首先,虽然
说许多基础研究与大众生活有一定的距离,但心理学研究的最终目的
是要服务于人类。基础研究之外还有许多与现实生活紧密相关的理论
及应用研究。这方面好的研究应当是“现象为师”的,即从社会生活
现象出发去发现问题、做出假设、收集观测数据、进行验证,最终得
出的结论也应该能够在一定程度上解释或解决现实问题。但许多研究
者往往是从概念出发,空对空地进行一些干瘪乏味的研究,结论的实
用性和推广性十分有限;另外,学院派的心理学工作者一个普遍的问
题是,醉心于研究而不注重或不善于将成果进行普及和推广,这块阵
地最终被伪心理学家和各种江湖术士所攫取。
最后一个原因是,大众媒体在科学心理学的传播方面做得并不够
好。随着心理学的热度持续升温,许多电视台、电台、网站、纸媒和
出版商也不断推出与心理学相关的节目、专栏或书籍,但由于种种原
因(如专业限制、商业考虑等等),最终呈现在大众面前并得到广泛
传播的往往并不是科学的心理学,而是包装精美的伪心理学;有一些
所谓的“心理学家”甚至在媒体平台上用错误的理论误导大众。与之
相对应的是,真正的心理学家和专业书籍无人问津,而星座、血型、养生以及各种未经实证检验的古怪疗法却打着心理学的旗号招摇过
市,让心理学蒙受了许多质疑和指责。基于以上种种问题,如何让公众了解真正科学的心理学变得十分
必要。市场上有关心理学的书籍很多,但对象分化的情况也很突出:
针对心理学专业学生和心理学工作者的专业书籍能够提供很多有用的
信息和知识,但有专业门槛的隐形限制,而针对普通读者的非专业书
籍相对通俗但在信息质量方面良莠不齐。基思·斯坦诺维奇教授所写
的这本How to Think Straight about Psychology的定位则兼顾心理
学的初学者和对心理学感兴趣的更广大的读者群体,从质量来说应为
此类心理学入门读物之翘楚。在这本20万字左右的小册子里,作者以
生动而严谨的笔触告诉读者什么才是真正的心理学。书中重申了科学
心理学的诸多重要标准和核心理念,澄清了有关心理学的种种误解和
迷思,有破有立,言之凿凿;理论讲述与精彩的实验案例交相呼应,集科学性和趣味性于一体,十分耐读;有些犀利的论点足以对读者原
有的知识信念构成挑战,但这种不安很快就会被知识重构的提升感和
思辨的乐趣所取代。
这本书先前的版本曾经由杨中芳老师翻译,已使很多读者从中受
益。第11版则由北京新曲线出版咨询有限公司委托我与刘肖岑老师共
同翻译,接到任务我们深感责任重大。翻译的过程对我们来说也是一
个学习和审视自己的过程。书已近付梓,但因译者水平所限,难免有
不周或纰漏之处,还请广大读者给予指正。
本书的第11版在之前版本的基础上有所更新,主要体现在三个方
面:首先,删去了一些内容,主要包括比较陈旧的文献和被最新的研
究证明是有争议的结论;其次,补充了最新的研究结论和案例,反映
了所涉领域最新的进展;最后,对一些评述文字的说法和措辞进行了
调整,使之与所论述的主题更为贴近。全新升级之后,这一版不仅原
汁原味地保留了上一版的精髓,同时在内容上更为丰富和具有时效
性。
最后我们要感谢北京师范大学心理学部邹泓教授、华东师范大学
心理学系桑标教授以及美国加州大学伯克利分校教授、清华大学心理
学系主任彭凯平教授在本书翻译过程中给予的指点和帮助,以及一直
以来在学术和思想方面的引导和教诲。同时,这本书的顺利出版,与
新曲线公司刘力先生和陆瑜女士的信任,以及本书特约编审谢呈秋女
士和刘冰云、朱公明、李仙杰等几位编辑认真负责的工作是分不开
的,在此一并致谢。美国心理学协会前任主席、积极心理学创始人马丁·塞利格曼教
授曾用一个、两个和三个词形容心理学现在的状态,分别
是 : “good” ( 好 ) 、 “not good” ( 不 好 ) 和 “not good
enough”(还不够好)。确实,心理学是一门很好的科学,它有着辉
煌的过去、蓬勃的现在和光明的未来。虽然也有着不尽如人意的地
方,但我们坚信,现在所做的一切工作,都是在让心理学变得更好。
窦东徽 刘肖岑 2011年盛夏于清华大学青年公寓 2019年修改于中央财经大学中财大厦1014序言
有这样一门尚不为大多数人所知晓的知识,它涉及人类行为和意
识的不同形式,可以用来解释、预测和控制人类的行为。那些能够获
得这种知识的人利用它去了解他人。与那些没有这方面知识的人相
比,他们对决定他人行为和想法的因素有更完整和准确的认识。
你可能想不到,这门不被知晓的知识就是心理学。
当我说心理学仍不为人所知时意味着什么?你一定会想此话不能
从字面上来理解。如今,书店里充斥着大量所谓的心理学书籍,电视
和广播脱口秀定时播放以心理学话题为主题的节目,杂志文章和网站
也经常引述所谓的心理学家对各种问题所发表的意见,怎么能说心理
学无人知晓呢?但从某种严谨的意义上讲,心理学确实仍是一个不为
人知的知识领域。
经由大众媒体传播的那些“心理学”知识,在很大程度上只是一
种幻象。很多人不知道他们在许多书店里看到的大部分所谓的心理学
书籍,都是由一些在心理学界根本站不住脚的人撰写的。很多人也不
知道,大多数频频亮相的心理学“专家”,其实对心理学领域的知识
积累没有做出过丝毫的贡献。
媒体这种对于“心理学”话题的浅薄关注,不仅向人们传递了许
多错误信息,还让人们难以了解心理学领域中真正的、不断发展的知
识。公众不能肯定到底什么是心理学,什么又不是,也不知道该怎样
独立地评估有关人类行为的主张。雪上加霜的是,不少别有用心的人
利用大众或是缺乏判断能力、或是认为心理学主张无法评估的弱点,正在牟取私利。后一种观点有时被称为“怎么说都行”的态度,是本
书要讨论的谬误之一,这种态度对社会危害极大。公众不知道,关于
人类行为的主张是可以验证的,很多伪科学正是利用公众的这种无知
而成为价值数百万美元的产业。人们并不知道这些伪科学(例如占星
术、通灵外科手术、快速阅读、生物节律、接触治疗、潜意识自助录音带、辅助沟通术、深蓝孩童和通灵侦探等)所提出的许多主张,其
实早已被证明是虚假的。本书提到的这些伪科学产业,助长了媒体对
科学进行炒作式报道的趋势。这种趋势对心理学的危害远甚于其他学
科,理解个中缘由,是学会正确看待心理学的一个重要环节。
本书面向的不只是即将成为心理学研究者的人,而是一个更大的
读者群——心理学信息的消费者。本书的目标读者是心理学的初学
者,以及那些在大众媒体上接触过一些心理学话题,又想知道如何去
判断这些信息是否可靠的广大读者。
本书不是一本标准的心理学导论教材,它没有对心理学领域已取
得的研究成果进行总结。事实上,让每个人到大学里选修一门心理学
导论课程,可能并不是解决媒体对心理学不实描述问题的终极方案。
众多对心理学抱有很大兴趣的非专业人士,没有时间、没有钱或没有
机会进入大学进行正规的学习。更重要的原因是,作为一名大学心理
学课程的教师,我不得不承认,我和同事们也不是总能引导初学者对
心理学这门科学产生正确的认识。这是因为,初级水平的课程通常不
会讲授批判性分析的思维技巧,而这正是本书的焦点所在。作为教
师,我们常常只会关注课程“内容”以及“涵盖的材料”是否完备。
每当我们稍微偏离教学大纲,和学生讨论一些诸如媒体眼中的心理学
等话题时,都会感到些许内疚,并开始担心自己会不会因为跑题而不
能在学期结束前完成所有授课内容。
现在的很多心理学导论教材都有600~800页,并且引用了数百篇
已经发表的文献。当然,包含如此丰富的材料并没有什么错,它反映
了心理学知识在不断增长。但不幸的是,也有一些副作用。教师们常
常只忙于给学生灌输一大堆的理论、事实和实验,而无暇顾及那些学
生在学习心理学的过程中产生的基本问题和错误观念。这主要是因为
教师们(包括导论类教科书的作者)不是直接纠正这些错误观念,而
是通常寄希望于学生在接触了足够多的心理学研究之后,自然就能从
中推导出问题的答案。但是这个希望往往落空。到这门课的最后复习
阶段或学期结束时,教师们才震惊和沮丧地发现,学生提出的一些问
题及说法,应该在课程开始的第一天就提出来讨论,而不是在课程即
将结束之时。比如:“既然心理学实验不同于现实生活,那么它们能
告诉我们什么呢?”“心理学无法像化学那样成为一门真正的科学,是吗?”“可是,我在电视上听一位心理治疗师讲的跟我们教科书上
说的正好相反”“我认为这个理论相当愚蠢——我弟弟的行为和这个
理论所说的恰好相反”“心理学不过是些常识而已,不是吗?”“每个人都知道什么是焦虑——何苦还要去定义它呢?”对于很多学生来
说,仅靠思考心理学教科书中的内容是无法为这些问题找到答案的。
在本书中,我将对这类问题和说法做出明确回应,并对背后的误区进
行澄清。
不幸的是,研究发现,一般的心理学入门课程并不能有效地纠正
学生们对这个学科的诸多误解[1][I]。这个不幸的事实正是促使我写作
本书的根本原因。心理学的学生必须掌握批判性思维技能,这样才能
独立地评估各种心理学信息。
即使若干年后学生们不再记得心理学入门课程中的内容,他们仍
然可以运用本书所涵盖的基本原理去评判心理学的主张。即使他们把
埃里克森的人生发展阶段论忘得一干二净,也仍可以运用本书介绍的
思维工具去辨别媒体中新出现的心理学信息的真伪。一旦掌握,这些
技能就可以成为终身受用的思维工具,帮助我们去评判各种知识主
张。比如,这些技能为评估“专家”观点的可信度提供了一些标准。
因为在复杂的社会中,人们越来越需要依赖专家的观点,所以在获取
知识时,对专家观点可信度的判断就变得尤为重要了。
许多心理学家对努力让心理学不受曲解的尝试持悲观态度。虽然
这种悲观并非没有道理,但是这本类似“消费者指南”式的书源自一
个信念,那就是心理学家不能让这一问题成为一个自我实现的预言。
尽管我很高兴《这才是心理学》能有多次再版的机会,但令人遗
憾的是,我当初撰写本书第1版的原因对如今这版也是同样适用的。学
生在开始上心理学入门课程时,对心理学的误解还是与以往一样多。
他们认为单靠常识就能理解人类的行为,甚至更糟糕的是,他们转而
投向伪科学的怀抱。正因为如此,本书所有后续版本的目标始终如
初:对批判性思维技能进行简要介绍,帮助人们更好地理解心理学的
主题。
第11版更新的内容
第11版的《这才是心理学》在基本结构上没有大的改动,因为之
前的一个版本已经对章节做了重组。各章的基本内容和顺序也保持原
样。应评审者和读者的要求,这一版与上一版的篇幅相同。读者和使用者都不希望本书篇幅增大,事实上我也无意增加篇幅。我继续更新
和修订了书中的许多例子,用最新的研究和议题替换了那些过时的例
子,同时保留读者最喜欢的那些例子。我最主要的努力是引用和更新
了与本书所提及的各种概念和实验结果相关的最新研究资料。这一版
中有大量新的引文(确切地说是290条!),以便读者继续获得关于所
有例子和概念的最新参考文献。
本版加入了一些新的例子、讨论和小节。这些新增内容包括以下
问题和讨论:开车时使用手机;心理学在儿童监护权纠纷中的运用;
临床心理学中的伪科学;创伤事件后危机咨询的效果;人们做出错误
投资决策的原因;教育界的“阅读战争”;暴力电子游戏的影响;用
于孤独症患者的辅助沟通术;在互联网上进行实验;左脑右脑谬误;
饮酒对健康的影响;看电子仪表盘造成驾驶人分心;对心理学中重复
危机的报道;重点强调在“注水期刊”上发表论文的危害;心理学中
实验室研究结果和现场研究结果之间的关系(新增一节);关于亚马
逊劳务众包平台的讨论;关于生动鲜活的神经科学结果如何扭曲结论
的讨论;关于多任务处理这一错误观点的讨论;关于沃尔特·米歇尔
著名的棉花糖研究以及该研究如何成为心理学从基础理论到现实应用
典范的讨论;媒体滥用“新研究显示”一词所带来的危险;心理学中
使用元分析研究的更多例子(包括婚姻寿命、大脑训练、工作表现的
预测因素和自杀预防);探讨媒体在报道孤独症、阅读障碍和注意缺
陷多动障碍的研究时,如何暗示科学是非累积性的。
本书的出版宗旨一如既往:简要介绍批判性思维技能,帮助学生
更好地理解心理学的主题。在过去的15年间,大学里强调批判性思维
技能的呼声越来越高[2]。的确,一些州立大学系统已经开展了旨在加
强批判性思维技能教育的课程改革。与此同时,也有其他教育学者认
为,批判性思维技能不应该脱离具体的事实性内容。《这才是心理
学》正好融合了这两种观点,帮助教师在教授丰富的现代心理学知识
的同时传授批判性思维的技能。
欢迎读者将自己对本书的意见发送到下面的电子邮箱:
keith.stanovich@utoronto.ca。
致谢我在以前的版本中感谢过的许多人继续在为本书出谋划策。不
过,我必须对詹姆斯麦迪逊大学的Richard West教授单独致敬,他在
这本书的修订过程中持续做着最有价值的贡献。他是一位具有人文精
神的学者,一个真正的朋友,他在智力和情感上的支持令我感激万
分。
还有一些学者为这一版本和早先的版本提供了有价值的反馈。他
们 包 括 : Wayne Bartz, American River College; Christopher
Bauer, University of New Hampshire; Ludy Benjamin, Texas AM
University; Angela M. BirkheadFlight, University of
Cincinnati; Virginia Blankenship, University of Northern
Arizona; Edward C. Chang, Northern Kentucky University;
Michael Choban, West Virginia Wesleyan University; James
Clark, University of Winnipeg; Jim Coan, University of
Arizona; Ellen Cole, Alaska Pacific University; Ellen Cotter,Georgia Southwestern State University; Anne Cunningham,University of California, Berkeley; Ian Deary, University of
Edinburgh; Julie Deisinger, Saint Xavier University; David
DiBattista, Brock University; Wallace Dixon, Heidelberg
College; Mark Fineman, Southern Connecticut State University;
Herbert Fink, SUNY–Brockport; Heinz Fischer, Long Beach City
College; Ronald Gandelman, Rutgers University; Michael
Gasser, University of Northern Iowa; Traci A. Giuliano,Southwestern University; William Graziano, Purdue University;
Nancy J. Gussett, Baldwin-Wallace College; Gordon Hammerle,Adrian College; Randy Hansen, Oakland University; William L.
Hathaway, Regent University; George Heise, Indiana
University; Albert Heldt, Grand Rapids Junior College; Dori
Henderson, Metropolitan State University; George Howard,University of Notre Dame; Barry Kendall, Ontario, Canada;
Bernie Koenig, Fanshawe College; Victor Koop, Goshen College;
Andy Kwong, University of New South Wales; P. A. Lamal,University of North Carolina, Charlotte; Stephen Louisell,Kalamazoo Community College; Gwen Lupfer-Johnson, University
of Alaska, Anchorage; Margaret Matlin, State University of
New York-Geneseo; Douglas Mook, University of Virginia;
Timothy Moore, York University; Edward Morris, University of
Kansas; Joseph E. Morrow, California State University atSacramento; Michael O'Boyle, Iowa State University; Blaine
Peden, University of Wisconsin, Eau Claire; John F. Pfister,Dartmouth College; Sam Rakover, University of Haifa; Richard
Redding, Hahneman University; Michael Ross, University of
Waterloo; John Ruscio, Elizabethtown College; Walter Sa,Grand Valley State University; Allen Salo, University of
Maine at Presque Isle; Frank Schieber, University of South
Dakota; Mike Seiler, Oakland University; Jillene Grover
Seiver, Bellevue College; Marjorie Semonick, University of
Minnesota; David Share, University of Haifa; Jeffrey Sherman,Northwestern University; Linda Siegel, University of British
Columbia; Norman Silverman, University of Illinois, Chicago;
Frank Smoll, University of Washington; Paul Solomon, Williams
College; Mike Stadler, University of Missouri; Maggie Toplak,York University; Larry Vandervert, Spokane Falls Community
College; John Vokey, University of Lethbridge; Carol Wade,College of Marin; Marty Wall, University of Toronto; Barbara
Wanchisen, Baldwin-Wallace College; Toni G. Wegner,University of Virginia; Edward Wisniewski, Northwestern
University; Murray S. Work, California State University at
Sacramento;以及Edward Zuckerman, Guilford Press。
特别感谢萨基诺谷州立大学的Gerald L. Peterson提出的许多非
常有见地的评论。
我与奥克兰大学的Ted Landau,Larry Lilliston和Dean Purcell
就教学方法进行了多次讨论,他们的深刻见解和我由此获得的灵感都
纳入了书中。我要感谢以下为最近的几个版本提供了宝贵建议的评阅
者:Michael Choban, West Virginia Wesleyan University; David
DiBattista, Brock University; Steven Isonio, Golden West
College; John Ruscio, Elizabethtown College; Allen Salo,University of Maine at Presque Isle; Cindy Sifonis, Oakland
University; Michael Tagler, Nebraska Wesleyan University; 以
及Chris Ward,Stonehill College。
我在培生的编辑Priya Christopher为本书倾注了指导、热情和支
持。本书的顺利出版还得益于以下各位的支持:Erin Mitchell,Carly Czech, Anita Castro, Courtney Welsh, Allison Campbell,Anju Baskar, Joel Morgan Kearney。感谢Robyn Macpherson在本书
之前版本的图书资料和参考文献方面的大力协助。
最后,我还要感谢Paula J. Stanovich,不仅仅是出于所有致谢
词中都会提到的情感支持。她对全人类,特别是那些不幸者的关注,激励着所有认识她的人。我们都认同一个理念:所有的人都应该有机
会充分发挥自己的潜力。这本书证明我曾有过这样的机会。包括残障
人士在内的所有人都将享有这样的机会,而Paula的工作正在让这一天
能够早日到来。
[I]此阿拉伯数字为本章参考文献顺序号,可根据该顺序号到附录
的“参考文献著录索引”中找到相应的作者名和出版年,再据此到附
录的“参考文献”中查找文献题名。第1章
心理学充满生机(在科学阵营里表现
不俗)
·学习目标?
1.1 解释为什么弗洛伊德的方法不能代表现代心理学
1.2 描述心理学的多样性及其影响
1.3 将心理学与其他研究人类行为的学科区分开来
1.4 描述定义科学的三个特征
1.5 区分心理学与世俗智慧
1.6 解释对心理学这门学科产生敌意的原因弗洛伊德问题
在街上随便拦住100个人,让他们说出一个活着的或已故的心理学
家的名字,然后记下他们的答案。毫无疑问,菲尔博士(Dr. Phil)
以及其他一些“媒体心理学家”肯定会被提到。如果我们把这类媒体
和大众心理学家排除在外,只考虑那些对心理学学科做出过卓越贡献
的心理学家,那么这项非正式调查的结果就几乎没什么悬念了。西格
蒙德·弗洛伊德(Sigmund Freud)会名列榜首,斯金纳(B.F.
Skinner)可能会排名第二,但远落后于弗洛伊德[1]。除了这两位,人
们甚至想不起来其他的心理学家了。因此可以说,弗洛伊德,连同媒
体上的大众心理学,在很大程度上定义了公众心目中的心理学。
弗洛伊德的名声极大地影响了普通公众对心理学的看法,并造成
了诸多误解。例如,许多学习心理学导论课程的学生惊讶地发现,如
果统计一下美国心理学协会(American Psychological Association,APA)中所有关注弗洛伊德精神分析的会员人数,他们所占的比例将低
于5%[2]。在另一个主要的心理学组织——心理科学协会(Association
for Psychological Science, APS)中,这一比例会更低。一本广受
欢迎的心理学导论教科书[3]篇幅超过700页,但其中只有15页提到了弗
洛伊德或精神分析,而这15页也往往包含对其观点的批判(“大多数
弗洛伊德的概念都曾经且现在依旧被大多数实证取向的心理学家所排
斥”,p.19)。发展心理学家艾莉森·戈波尼克[4]称弗洛伊德理论是
一种僵尸理论,在它几乎从心理学中消失多年之后,竟还出没于大学
的英语系。
简言之,现代心理学既没有沉迷于西格蒙德·弗洛伊德的思想,也不主要由它来定义。在现代心理学家所关注的各种问题、数据和理
论中,弗洛伊德的工作只占极小的一部分。除此之外更为庞大的研究
和理论体系,囊括了5位诺贝尔奖得主[戴维·休伯尔(David
Hubel)、丹尼尔·卡尼曼(Daniel Kahneman)、赫伯特·西蒙
(Herbert Simon)、罗杰·斯佩里(Roger Sperry)、托尔斯滕·维
泽尔(Torsten Wiesel)]和17位美国国家科学奖章获得者所做的工
作[5],而他们几乎都不为公众所知。弗洛伊德对于现代心理学的重要性被极大地夸大了,这已经够糟
糕的了。更糟的是,弗洛伊德的研究方法完全不能代表现代心理学家
如何开展他们的研究。事实上,弗洛伊德的研究方法彻底误导了人们
对心理学研究的印象。例如,弗洛伊德并不采用控制实验,而我们将
在第6章讲到,控制实验是现代心理学家的方法库中最有力的武器。弗
洛伊德认为,个案研究可以证明理论的真实或谬误,在第4章中,我们
将谈谈这一理念为何是错误的。正如一位研究心理治疗史的学者所指
出的:“如果弗洛伊德本人是一位科学家,那么他宣扬的是一门奇怪
的科学……精神分析包含理论和假设,但是缺乏实证观察的方
法。”[6]
最后,弗洛伊德的工作中最大的问题是理论和行为数据之间的联
系。我们将在第2章看到,一个理论要被认为是科学的,其理论和行为
数据之间的联系必须满足一些最低限度的要求。弗洛伊德的理论不符
合这些标准[7]。简而言之,弗洛伊德根据他得到的数据(个案研究和
内省)建立了一套精细的理论,但这些数据并不足以支撑此理论。他
专注于构建复杂的理论构架,但并没有像许多现代心理学家那样,保
证这些理论建立在可靠的、可重复的行为关系数据的基础之上。总
之,只精通弗洛伊德的工作风格,势必成为理解现代心理学的一大障
碍。
在这一章中,我们将采用两种方法来解决“弗洛伊德问题”。首
先,当我们展示现代心理学的多样性时,就能清楚地看到弗洛伊德的
工作所占的比重其实很小。其次,我们将讨论在广泛的心理学领域
中,有哪些特征是心理学研究所共有的(而这些特征正是弗洛伊德的
工作所缺乏的)。我们将看到,现代心理学有一个统一的特征:用科
学的方法寻求对行为的理解。现代心理学的多样性
事实上,现代心理学包含的内容多种多样。一本心理学教科书曾
经把心理学比作“一个松散地联合在一起的学术王国,其边界从生物
科学领域一直延伸到社会科学领域”[8]。心理学有着令人惊叹的广泛
而多样的研究领域,知道这一点对于理解心理学的本质至关重要。只
要简单列举一些具体指标就能证明这一点:美国心理学协会(APA)有
54个分支,每个分支都代表了一个特定的研究或应用领域(见表
1.1)。从表格中,你可以看到心理学家所研究的主题范围、所涉及的
背景范围以及行为研究的不同方面。另一个大型心理学组织——心理
科学协会(APS),也同样分支众多。其实,表1.1并没有充分展现出
心理学领域的多样性,因为它给我们造成了一种印象,即每个分支都
是一个特定的专业领域。事实上,表中所列出的54个分支中的每一个
都有着非常宽泛的研究领域,包含各种各样的子分支!简言之,怎么
夸大心理学领域中主题的多样性都不为过。
表1.1 美国心理学协会(APA)的分支机构
·
1. 普通心理学(General Psychology)
2. 心理学教学(Teaching of Psychology)
3. 实验心理学(Experimental Psychology)
4. 评 估 、 测 量 和 统 计 ( Evaluation , Measurement, and
Statistics)
5. 行为神经科学和比较心理学(Behavioral Neuroscience and
Comparative Psychology)
6. 发展心理学(Developmental Psychology)
7. 人格和社会心理学(Personality and Social Psychology)
8. 社会问题的心理学研究(Psychological Study of Social
Issues)
9. 审美、创造力和艺术心理学(Psychology of Aesthetics,Creativity, and the Arts)
10. 临床心理学(Clinical Psychology)11. 组织咨询心理学(Consulting Psychology,也译作“咨询心理
学”)
12. 工 业 和 组 织 心 理 学 ( Industrial and Organizational
Psychology)
13. 教育心理学(Educational Psychology)
14. 学校心理学(School Psychology)
15. 咨询心理学(Counseling Psychology)
16. 公共服务中的心理学家(Psychologists in Public Service)
17. 军事心理学(Military Psychology)
18. 成人发展与老化(Adult Development and Aging)
19. 应 用 实 验 和 工 程 心 理 学 ( Applied Experimental and
Engineering Psychology)
20. 康复心理学(Rehabilitation Psychology)
21. 消费者心理学(Consumer Psychology)
22. 理 论 和 哲 学 心 理 学 ( Theoretical and Philosophical
Psychology)
23. 行为分析(Behavior Analysis)
24. 心理学史(History of Psychology)
25. 社区心理学(Community Psychology)
26. 精神药理学和药物滥用(Psychopharmacology and Substance
Abuse)
27. 心理治疗(Psychotherapy)
28. 心理催眠(Psychological Hypnosis)
29. 各 州 心 理 学 协 会 事 务 ( State Psychological Association
Affairs)
30. 人本主义心理学(Humanistic Psychology)
31. 智 力 和 发 展 障 碍 ( Intellectual and Developmental
Disabilities)
32. 人 口 与 环 境 心 理 学 ( Population and Environmental
Psychology)
33. 女性心理学(Psychology of Women)
34. 宗教心理学(Psychology of Religion)
35. 儿 童 和 家 庭 政 策 与 实 践 ( Child and Family Policy and
Practices)
36. 健康心理学(Health Psychology)
37. 精神分析(Psychoanalysis)
38. 临床神经心理学(Clinical Neuropsychology)39. 心理学和法律(Psychology and Law)
40. 独 立 从 业 的 心 理 学 者 ( Psychologists in Independent
Practice)
41. 家庭心理学(Family Psychology)
42. 男同性恋、女同性恋和双性恋问题的心理学研究(Psychological
Study of Lesbian,Gay,and Bisexual Issues)
43. 少数族裔问题的心理学研究(Psychological Study of Ethnic
Minority Issues)
44. 媒体心理学(Media Psychology)
45. 锻炼和运动心理学(Exercise and Sport Psychology)
46. 和平心理学(Peace Psychology)
47. 团体心理学和团体心理治疗(Group Psychology and Group
Psychotherapy)
48. 成瘾(Addictions)
49. 男性和男性化的心理学研究(Psychological Study of Men and
Masculinity)
50. 国际心理学(International Psychology)
51. 临 床 儿 童 心 理 学 和 青 少 年 心 理 学 ( Clinical Child and
Adolescent Psychology)
52. 儿科心理学(Pediatric Psychology)
53. 药物治疗(Pharmacotherapy)
54. 创伤心理学(Trauma Psychology)
注:没有分支4和11。
多样性的影响
许多人来学习心理学是希望学到一套能够将人类行为的方方面面
统一起来并对其加以解释的宏大的心理学理论。但这类愿望经常会落
空,因为构成心理学的不是一整套宏大的理论,而是许许多多不同的
理论,每个理论仅能够解释行为的有限方面。心理学的多样性使得理
论的统一变得极为困难。事实上,在许多心理学家看来,“统一”本
身就是“不可能的任务”。尽管如此,还是有一些心理学家正在寻求
领域内的理论统一[9]。例如,在过去的30年间,由于进化心理学家在理论方面的努力,心理学的学科一致性有所增强。这些研究者将人类
的心理过程视为服务于某些重要进化功能(诸如亲缘关系识别、伴侣
选择、合作、社会交换及后代抚养等)的机制[10],并试图以此来实现
概念的统一。同样,卡乔波[11]指出,社会认知神经科学等分支学科将
心理学中的许多专业领域——在本例中是认知心理学、社会心理学和
神经心理学——结合在了一起。
无论他们在心理学主题一致性问题上持何种立场,所有心理学家
都一致认为,理论的统一将是一项极为困难的任务。理论整合的缺失
招致了一些心理学的批评者对其已经取得的科学进步的诋毁。这类批
评通常源于一个错误的观念,即所有真正的科学都必须具备一个宏大
的、统一的理论。这是一个错误观念,因为许多其他的科学领域也同
样缺乏一个完备统一的概念体系。
一些学者认为,“心理学”一词隐含着主题的一致性,而这不是
这个学科的特点。因此,美国一些主要的大学院系已经更名为心理科
学 系 ( Department of Psychological Sciences ) [12] 。 “ 科
学”(Sciences)一词传达了本章的两个重要信息。这个词的英文是
复数形式,这表明了我们所讨论的学科内容的多样性。“科学”这一
术语也指明应从何处寻找这一学科的统一性——不是从它的内容,而
是从它的方法。正是于此,我们发现心理学家们的目标更为一致。科学的统一性
仅说心理学是关于人类行为的科学,并不能将它和其他学科区分
开来。许多其他专业团体和学科——包括经济学家、小说家、法律、社会学、历史、政治科学、人类学等——都或多或少与人类行为有
关,心理学在这方面并不是独一无二的。
在实际应用方面,心理学也不具有任何独特性。例如,许多大学
生选择主修心理学,是因为他们有一个想要“帮助他人”的崇高目
标。但是,数量众多的其他领域,如社会工作、教育、护理、作业治
疗、物理治疗、警察科学、人力资源以及言语治疗等等,其应用部分
也包括“帮助他人”。同样,培养应用性专业人才通过咨询来帮助他
人,并不需要单独开辟一门叫作“心理学”的学科。通过咨询来帮助
他人,也是众多其他领域的重要组成部分,这些领域包括教育、社会
工作、警务工作、护理、教牧工作、作业治疗等等。
我们很容易论证,只有以下两点能证明心理学是一门独立的学
科。其一,心理学研究采用科学方法来探究人类及动物的所有行为;
其二,从这些知识中发展而来的实际应用是以科学为基础的。如果不
是这样,心理学就失去了存在的理由。
心理学不同于其他行为学科的地方在于,它试图向公众保证两
点:第一,心理学中关于行为的结论来源于科学证据;第二,心理学
的应用都源于科学方法,并经过了科学方法的检验。心理学是否曾经
偏离过这两个目标呢?有过,而且经常如此[13]。本书讲的就是我们如
何能够更好地实现这两个目标。在第12章中,我将回到一些心理学家
因为不遵守适当的科学标准而损害自身合法性这一问题。但是,从原
则上讲,科学性正是保证心理学作为一门独立学科的标准。如果有朝
一日心理学认为这些目标不值得追求——即它不再愿意坚守科学标准
——它就应该关张大吉,将其关注的领域并入其他学科了事,因为它
将成为一个完全多余的知识探究领域。
因此,毫无疑问,任何人想要理解心理学,第一步也是至关重要
的一步,就是要认识到心理学的首要特征——它是基于数据的科学的
行为研究。在本书后面的所有章节,我们都将把注意力放在理解这一事实的全部内涵上,因为这是培养我们清醒地认识心理学的能力的主
要途径。相反,人们对心理学的理解之所以会出现各种偏差,正是因
为常常未能认识到它是一门科学。例如,我们经常听到这门学科之外
的人说它不是科学。为什么这种情况屡见不鲜呢?
那些企图让公众相信“心理学不能成为一门科学”的原因不一而
足。例如,我们的社会有很多围绕伪科学信念体系的产业,它们出于
既得利益的考虑,总是想让公众相信,无论什么都能纳入心理学的范
畴,而且心理学的主张不能以理性标准来衡量。“催眠减肥”“激发
潜在心灵能量”“睡觉时学法语”等概念,以及其他利润高达数十亿
美元的心理自助产业,都是在这种完美的氛围中炒作起来的。它们要
么不是建立在科学证据的基础上,要么很多时候与已有的证据相冲
突。
另一个抗拒科学心理学的原因是,一些人倾向于反对将科学扩展
到那些由不容置疑的权威或“常识”长期统治的领域。历史上有许多
最初公众抗拒使用科学,而接受用哲学思辨、神学谕告或世俗智慧来
解释自然界的例子。每一门科学都经历了一个抵制其发展的阶段。与
伽利略同时代的知识分子拒绝透过他的新望远镜观察天空,因为“木
星存在卫星”这一事实颠覆了他们的哲学和神学信仰。由于禁止解剖
人类尸体,解剖学在几百年中的发展可谓步履蹒跚。查尔斯·达尔文
因其生物进化论而不断受到抨击。在19世纪的法国,保罗·布洛卡
(Paul Broca)的人类学协会受到抵制,因为当时人们认为,关于人
类的知识会颠覆国家。
关于人类的知识向前迈进的每一步都引发了对抗。然而,当人们
意识到科学并没有损害我们生命的意义,反而使它更加丰富时,对抗
终将烟消云散。现在谁还认为星系图以及关于遥远星球构成的复杂理
论会破坏我们对于宇宙的好奇?谁会用人体解剖常规化之前的医疗手
段来替代他们社区中现有的医疗保健?对于星球和人体的实证态度并
没有磨灭人性。更近的例子是,达尔文的进化论体系为生物学的非凡
进步奠定了基础。然而,虽然我们越来越接近人类的本质及其起源,但反对派的残余依然存在。许多人仍然对进化论的启示感到不安[14]。
如果进化生物学以其悠久而令人印象深刻的科学成就记录,时至今日
仍然引起公众的反对,那么心理学,一门将人们长期持有的关于人类
的信念置于科学审视之下的新兴学科,时下招致人们否认其合法性,又有什么好奇怪的呢?那么,什么是科学
为了理解什么是心理学,我们必须理解什么是科学。或许我们可
以从“什么不是科学”入手。首先,科学并不是由研究的主题来定义
的。对宇宙万物任何方面的研究都可以发展成一门科学,当然也包括
人类行为的所有方面。我们不能将宇宙万物划分为“科学的”和“非
科学的”两类主题。尽管历史上始终有一股强大的力量,试图将人类
排除在科学研究的范围之外,但正如我们所见,它们均以失败告终。
拒绝将心理学作为一门科学来对待,可能代表了这一历史争论的余
音。
科学也不能按照是否使用仪器和实验设备来定义。试管、电脑、电子设备或研究者的白大褂都定义不了科学。这些都是科学的外在标
志,而不是其本质特征。确切地说,科学是一种思考和观察宇宙万物
以便深入理解其运行机制的方法。
在本章的剩余部分,我们将讨论定义科学的三个重要且相互关联
的特征:(1)系统实证主义的运用;(2)公共知识的产生;(3)对
可解决问题的细查。尽管我们将分别考察每个特征,但请记住,这三
个特征构成了相互联系的统一整体。[更多有关科学的普遍特征的详
细讨论,参见本书参考文献部分列出的布洛诺夫斯基(Bronowski)、梅达沃(Medawar)和波普尔(Popper)等人的著作。]
系统的实证主义
如果你在任何辞典中查找“实证主义”(empiricism)一词,你
都会发现它的意思是“依靠观察的做法”。科学家通过检验来认识世
界。这一点在你看来似乎显而易见,这正表明了科学态度在过去几个
世纪的传播。在过去,它并非总是那么显而易见。回想一下伽利略的
例子。用他原始的望远镜,伽利略宣称看见了环绕木星的卫星,而当
时有学问的人认为天上只有七个“天体”(五个行星、太阳、月
亮)。在那个时代,人们认为获得知识的最佳途径是纯粹的思辨或诉诸权威。一些同时代的学者拒绝透过伽利略的望远镜观察世界。另外
一些人说,设计这台望远镜就是为了骗人。还有人说,望远镜可以用
于观察地上之物,但不适用于天上之物[15]。另一位学者弗朗西丝科·
西奇(Francesco Sizi)试图驳倒伽利略,但不是用观察,而是用下
面的一番雄辩:
人的头上有七窍,两个鼻孔、两只耳朵、两只眼睛和一张
嘴;因此在天界有两颗吉星、两颗灾星、两颗发光星,以及尚未
决定但无关紧要的水星。从这点和其他无数相似的自然现象中,诸如七种金属等等(没必要一一列举出来),我们就可以得出行
星的数量必然是七个……另外,犹太人和其他古老民族以及现代
欧洲人,都将一周分为七天,并以七大行星来命名;如果现在我
们增加了行星的数量,整个系统都将崩溃……进一步来说,木星
的卫星用肉眼无法看到,因此对于地球没有影响,既然没有用,也就不存在了。[16]
关键问题不在于以上论述多么荒唐可笑,而在于当时它被视作一
种对实际观察的合理辩驳!今天我们嘲笑它,是因为我们可以做事后
诸葛亮。三个世纪以来,实证方法显示出了强大的力量,这使我们比
可怜的西奇更有优势。要是没有经历这些实证主义的岁月,我们中的
许多人可能都会点头同意并对他大加赞赏。事实上,实证方法并不一
定显而易见,这就是为何即使在一个科学占主导地位的社会中,我们
也不得不经常讲授实证方法的原因。
然而,纯粹、单一的实证主义还不够。请注意,本节的标题
是“系统的实证主义”。观察法很好,而且很有必要,但对自然世界
单纯的、非结构化的观察并不能产生科学知识。假使你记录下某一天
从起床到睡觉之间观察到的所有情况,当你完成的时候,你会拥有一
大堆事实,但并不会对这个世界有更深的理解。科学观察之所以被称
为“系统的”,是因为它的结构化使得观察的结果能够揭示自然世界
一些潜在的本质。科学观察通常是理论驱动的;它们检验对世界本质
的不同解释。它们是结构化的,因此,根据观察的结果,一些理论得
到支持,而另一些则被拒绝。
可公开验证的知识:可重复性和同行评审从某种特殊意义上说,科学知识具有公开性。当然,并不是说把
科学发现张贴在社区的公告板上就叫“公开”了。相反,我们指的是
这样一个事实,即科学知识并不仅仅存在于某一特定个体的头脑中。
从一种重要意义上说,科学知识在提交给科学共同体供他人批评和实
证检验之前根本不存在。那些被认为隶属于特定个体思维过程、不受
他人审查和批评的“特殊”知识,永远都无法获得科学知识的地位。
同样地,科学也拒绝只有某些特殊的群体才能获得某些特殊知识的说
法[17]。
科学通过重复程序来实现其公开验证的理念。一项发现如果想在
科学领域引起关注,就必须以这样一种方式提交给科学共同体,即能
够让其他科学家尝试相同实验并获得相同结果。当这一切都完成,我
们就可以说,这一发现是可重复的。科学家利用可重复性来定义公共
知识。可重复性保证了特定发现并不仅仅是由于某个研究者的错误或
偏差而产生的。简而言之,一项发现要想被科学共同体所接受,就必
须能够被最初的调查研究者以外的人所重复。当一项发现以这种方式
被提交时,它就具有公开性。它不再仅仅为最初研究者个人所有,而
是能够被其他人获取,并以自己的方式对其进一步发展、进行批评,或加以应用。
诗人约翰·唐尼(John Donne)告诉我们:“任何人都不是一座
孤岛。”在科学中,没有一个研究者是一座孤岛。每个研究者都与科
学共同体及其知识库相联系。正是这种相互联系使科学得以发展和累
积。研究者不断在原有知识的基础上进行新的探索,力求超越已知。
这一过程的前提便是,先前知识的陈述方式使任何研究者都能以之为
基础来进行探索。
因此,可公开验证的知识,是指那些以一种可被科学共同体中的
任何人重复、批评或扩展的方式提交的研究结果。这个标准不仅对于
科学家,同时对于外行人来说也是最重要的,因为他们作为消费者,必须对来自媒体的科学信息进行评估。江湖术士和伪科学的从业者,与真正科学家的一个重要区别是,前者常常避开科学出版的常规渠
道,而选择直接通过大众媒体公开他们的“发现”。当面对合法性不
确定的科学论断时,公众可使用的一个行之有效的铁的标准就是问这
样一个问题:这些发现是否在使用某种同行评审程序的公认科学期刊
上发表过?对这一问题的回答往往能够区分“李鬼”和“李逵”。同行评审(peer review, 也译作“同行评议”)是指每一篇投到
学术期刊的文章都要经过数位科学家的评审,评审者将批评意见提交
给编辑。担任编辑的人通常都是在此期刊所覆盖的专业领域中有资深
研究经历的科学家。编辑会权衡这些意见,然后确定这篇文章可以直
接发表,还是需要进一步的实验研究和统计分析之后再发表,或是因
为存在缺陷或价值太低而拒绝接受。正规期刊会在每期杂志和网站上
发布它们的编辑政策声明,所以你每次都应该检查一份期刊是否经过
同行评审。这一点现在变得尤为重要,因为网络催生了许多开放获取
的期刊,只要付费什么内容都能发表[18]。这些毫无价值的网络期刊,它们的目标对象是那些为了获得大学终身教职而拼命发表论文的年轻
学者。它们在网络上的存在,使得普通公众更难将经过同行评审的科
学研究,与网络上看似科学但未经同行评审的东西区分开来。
并非所有同行评审的科学期刊上的信息都一定是正确的[19],但至
少它已达到了同行批评和审查的标准。同行评审只是一个最低标准,而不是严格的标准,因为大多数学科领域中都会有几十种质量参差不
齐的期刊。大部分科学思想在满足一些基本标准的前提下,都能以正
规文献的形式发表。那种认为只有很小部分的数据和理论能够在科学
界获得出版的观点是错误的。这种观点经常被一些提供虚假疗法的江
湖术士所利用,他们试图让媒体和公众相信,他们被“正统科学”的
阴谋排除在科学出版渠道之外。但是,让我们看一看心理学领域中有
多少正规的渠道吧。美国心理学协会(APA)所建立的“心理学文摘索
引数据库”(PsycINFO),汇总了来自2000多种不同期刊的文章,其
中的大部分期刊都是经过同行评审的。几乎所有大致合理的理论和实
验都能在如此众多的出版物中找到自己的发表渠道。实际上,要说有
什么问题的话,那也是科学期刊的数量可能太多了。当然,也有太多
非同行评审期刊和根本未经评审的“注水期刊”[20]。
再次强调,我并不认为所有发表在同行评审的心理学期刊上的观
点都必然正确。相反,正如我先前所强调的,这只是一个最低的标
准。然而,问题的关键在于,当某种理念、理论、主张或疗法,不能
在经过同行评审的学科文献中获得适当的收录时,这个信号的含义就
很明显了。尤其是当某一主张缺乏证据却通过媒体进行大肆宣传时,此理念、理论或疗法显然是骗人的。
同行评审的机制因学科而异,但其基本原理是相同的。同行评审
是科学将客观性和公开批评的态度制度化的一种方法(另一种是可重复性)。观点和实验要经过一个磨砺的过程,在这个过程中它们被提
交给其他具有批判性的人来进行评估。通过了这一严格过程的观点才
开始符合“可公开验证”这一标准。同行评审过程绝非完美,但它真
的是我们仅有的消费者保护机制。忽视它,就等于让我们自己被巨大
的伪科学产业玩弄于股掌之间,而这一产业又极其善于操纵媒体来达
到自己的目的(见第12章)。在随后的章节中,我们将更详细地讨
论,如果忽视真正的心理科学实践所固有的制衡机制,我们会付出多
么高昂的代价。
可实证解决的问题:科学家对可检验理论
的探求
科学处理的是可解决的、可具体指明的问题。这意味着,就其类
型来说,科学家们所研究的问题,有可能通过现有的实证方法得到解
答。如果用当前所掌握的实证方法,某个问题无法解决或某个理论不
可检验,那么科学家们就不会对它展开研究。例如,“在日托期间接
受结构化语言刺激的3岁儿童,是否比那些没有接受这些额外刺激的儿
童更早地做好了接受阅读指导的准备?”代表的是一个科学问题,因
为现有的实证方法可以对此作出回答。“人性本善还是本恶?”就不
是一个实证问题,因此不属于科学领域。“生命的意义是什么?”同
样也不是一个实证问题,因此也不属于科学领域。
科学的进步是这样一个过程:提出理论去解释世界中的特定现
象,根据这些理论做出预测,实证地检验这些预测,基于检验的结果
对理论进行修正。这个顺序通常可以描述为:理论→预测→检验→理
论修正。因此,科学家所说的“可解决的问题”通常指的是“可检验
的理论”。什么样的理论才算是“可检验的”呢?这一理论必须与自
然界中可观察的事件有一定的关联;这就是“可实证检验”的含义。
可检验性标准通常被称为可证伪性标准,这也是本书第2章的主题。
我们说科学家致力于可实证解决的问题,并不是说不同类别的问
题本质上是可解决的或不可解决的,并且这种区分是永远固定不变
的。恰恰相反,有些当前不可解决的问题,在理论和实证方法或技术
更加先进的时候会成为可解决的。例如,几十年前,对于“托马斯·
杰斐逊是否与其奴隶萨丽·海明斯生下了一个孩子”这一争议话题,不会有历史学家认为它是一个可实证解决的问题。然而到了1998年,由于基因技术的进步,这个问题已成为可解决的,发表在《自然》
(Nature)杂志上的一篇文章[21]指出,杰斐逊极可能是埃斯顿·海明
斯·杰斐逊的父亲。
这就是科学得以发展以及新的科学得以产生的方式。然而,对
于“当前什么是可解决的”这一问题,总是存在很多分歧。当涉及某
一具体问题时,科学家们自己在这点上的意见都难以统一。因此,尽
管所有科学家都认同可解决性标准,但他们对其具体应用可能存在不
同的意见。诺贝尔奖得主彼得·梅达沃(Peter Medawar)曾把他的一
本书定名为《可解决性的艺术》(The Art of the Soluble),用以
说明科学的部分创造力就在于寻找处于人类知识最前沿并将可以用实
证方法来解决的问题。
心理学本身就提供了许多从不可解决到可解决的好例子。有许多
问题,诸如“一个孩子如何获得其父母的语言?”“为什么我们会忘
记我们曾经知道的事情?”“身处一个群体中会如何改变一个人的行
为和思想?”等等,在人们认识到可以用实证的方法来解答之前,几
个世纪中它们都只是哲学思辨的主题。随着这一认识的慢慢发展,心
理学逐渐集合了来自各个领域中关于行为的各种问题。心理学的问题
逐渐脱离哲学,一门独立的实证科学逐渐形成了。
认知心理学家史蒂芬·平克[22]提出“未知”可被划分为问题或玄
谜,并对此进行了探讨。如果是问题,我们知道可能会找到一个答
案,即使目前还没有找到,我们也知道它可能会是什么样子。如果是
玄谜,我们甚至不能想象答案可能会是什么样子。利用这些术语,我
们可以看到,科学就是将玄谜变为问题的过程。事实上,平克[23]指
出,他之所以要写《心智探奇》(How the Mind Works)这本书,正
是因为“几十个关于心智的玄谜,从心理表象到浪漫爱情,最近已经
升级为问题了”(p. ix)。心理学和世俗智慧:“常识”的问题
我们每个人都有一套解释行为的内隐模型,这些模型影响我们的
人际交往以及我们如何看待自己和他人。事实上,一些社会、人格和
认知心理学家正在探究这些内隐的心理理论的本质。然而,大多数人
从来不会清晰且有逻辑地思考自己的这套理论。相反,我们通常只有
在刻意关注它们或者发现它们受到某种挑战时,才会意识到它们的存
在。
其实,我们个人的行为模型并不像真正的理论那样具有内部一致
性。相反,当我们觉得需要对行为作出解释时,往往搬出一些关于人
类行为的普遍原理、说教和老话。这些常识和世俗智慧存在一个问
题,即它们之中有不少是自相矛盾的,因此也是不可证伪的(可证伪
性原则是下一章的主题)。
人们经常用一些民间谚语来解释行为事件,即使之前在解释同类
事件时曾用过与之完全矛盾的谚语。例如,大多数人都听过或说
过“三思而后行”。若不是我依稀记得之前有人告诫说“机不可失,时不再来”,我还会觉得这是个简单有用的行为建议呢。“小别胜新
婚”明确预测了一种对分离的情绪反应,但“眼不见,心不想”又如
何解释?如果“欲速则不达”,为什么又说“时不我待”?既然“三
个臭皮匠,顶个诸葛亮”,为什么又说“人多误事”?如果我认
为“行走江湖,安全第一”,为什么也相信“不入虎穴,焉得虎
子”?如果“相异相吸”,为什么又“物以类聚”?我劝许多学
生“今日事今日毕”,但我希望没跟我刚刚指导过的那个学生说过这
番话,因为我方才还跟他说“要顺其自然”。
这类谚语和老话对人们有极大的吸引力,因为它们合起来作为对
行为的内隐“解释”,是难以驳倒的。不管发生什么事,都可以搬出
其中的一条解释一番。难怪我们都认为自己是判断他人行为和人格的
高手。我们的世俗智慧对天底下发生的所有事都能给出解释。因此,从这种意义上说,世俗智慧是怯懦的,因为它不用冒着被驳倒的风
险。这种世俗智慧就是“事后诸葛亮”,在真正的预测意义上实际上
是无用的。这就是为什么社会学家邓肯·沃茨将他的一本书命名为
《一切都显而易见——一旦你知道答案》[24]。沃茨讨论了拉扎斯菲尔
德60多年前的一篇经典论文[25],这篇文章回应的是一个常见的批
评:“社会科学没有告诉我们任何我们不知道的事。”拉扎斯菲尔德
列举了对60万二战期间服役士兵进行的大规模调查所得出的一系列结
果,例如,来自农村的男性在服役期间精神面貌要好于来自城市的士
兵。人们往往认为所有的调查结果都是显而易见的。例如,在这个例
子中,人们倾向于认为农村背景的男性已经习惯于艰苦的环境,因此
能更好地适应部队生活,这是很显然的结论。其他的发现也是如此
——人们觉得这些结果都是明摆着的。随后拉扎斯菲尔德甩出了他的
包袱:这里列举的所有发现,都与原来的陈述刚好相反。例如,实际
的情况是,来自城市的男性在服役期间的精神面貌比来自农村的士兵
要好。这次学习任务的最后一部分是让人们意识到他们是多么容易就
解释了恰恰相反的发现。对于实际的结果,人们往往会解释说(若先
告知这一结果),这在他们的意料之中,因为城里人习惯于在拥挤的
环境和森严的等级制度下工作。然而,他们从来没有意识到,他们是
多么容易就可以为完全相反的结果编造一个解释!
所以,有时我们的世俗行为理论是无法反驳的。我们将在下一章
中看到为什么这种不可反驳性使得这些理论没有多大用处。然而,即
使我们的世俗信念有一定的明确性(也就是说,可以进行实证检
验),也还是会产生一个问题。这个问题就是:心理学研究表明,许
多常见的关于行为的文化信念在接受实证检验后,都被证明是错误
的。
世俗信念(或称“常识”)出现谬误的例子俯拾皆是。比如,有
一种说法是,学习好或爱读书的孩子都不擅长交际和体育。这个观点
虽然错得离谱,但在当今社会上极为流行。有证据表明,与所谓“常
识”的世俗信念相反,与不读书的人相比,爱读书的人和追求学业成
就的人,身体更强健,社交更活跃[26]。经常读书的人比不常读书的人
更有可能参加运动、慢跑、锻炼和课外活动。
许多关于行为的世俗信念一经产生便径自流传下去了。例如,在
过去的数年间,在我们的社会和学校里,一个世俗信念逐渐形成,即
低自尊导致攻击行为。但实证研究显示,攻击行为和低自尊并无关联 [27]。如果说有什么关联的话,情况似乎正好相反,攻击行为往往与高自尊相关。同样,过去几十年中有一个非常流行的假说认为,在学生
中,学习成绩不好是低自尊的结果。事实上,后来证明,自尊和学习
成绩之间的关系更有可能与教育者和家长的假设相反:优异的在校成
绩(以及生活中其他方面的成就)导致了高自尊,而不是反过来[28]。
另一个世俗智慧出错的例子是对学生的一个常见告诫:如果他们
对多项选择题的答案不确定,就不应该改变原来的选择。不仅大多数
学生认为在不确定答案时不应该换答案,就连《巴伦GRE备考指南》也
建议:“更改答案要非常谨慎。经验表明,许多学生会把正确的答案
改成错误的答案。”[29]这个建议是完全错误的,之所以说它错是因
为,“改变答案会降低一个人的分数”这种传言本身就大错特错。实
际研究表明,当学生对某一多选题的答案产生怀疑时,改变最初的答
案往往会更好[30]。
还有一个例子,从中我们能真切地了解到世俗智慧是何等的泛
滥。该民间传言说,我们只用了自己10%的脑力。这个传言尽管没有任
何认知神经科学的根据[31],但它已经流传几十年了,业已取得所
谓“心理事实”的地位。所谓“心理事实”是指这样一种关于心理学
的陈述:虽然不真,但是被重复了很多次,以至于一般人认为它就是
一个事实。下面这个流行的信念也是如此——有些人是“左脑型”,而另一些人是“右脑型”,或者人格的某些方面由左脑控制,而其他
方面则由右脑控制。尽管现代神经科学研究确实表明大脑中存在微妙
的特异化现象,但是言之凿凿地用“左”或“右”的概念来普及这一
观点肯定是毫无道理的,尤其是研究已发现,我们的大脑是以一种整
合的方式在工作[32]。
想想2007年对美国前白宫助理刘易斯·利比(绰号“滑板车”)
的审判。一位著名心理学家的专家证词被驳回,因为法官裁定,记忆
容易出错是众所周知的,陪审团可以放心地依靠他们的常识来确定记
忆是如何工作的。事实上,研究表明,近30%的人相信人类记忆“像录
音机一样工作”[33]。与法官的想法相反,他的陪审团中有30%的人迫
切需要听取专家的意见!
世俗信念并不总是不受证据的影响。有时,当矛盾的证据变得广
为人知时,民间心理学(“常识”)确实会改变。例如,多年前,关
于儿童的一个广为流传的俗语是“熟得早,烂得早”。这句老话反映
了这样一种信念,即儿童期早熟与成年后的异常有关,这种信念得到了许多类似“伤仲永”轶事的支持。在这个例子中,证明这个说法不
准确的心理学证据已经被大众文化所吸收,你几乎再也听不到这个世
俗“智慧”了。
然而,新的民间传言并未停止产生,当然也有一些会像病毒一样
传播开来。似乎我们用证据消灭的每个民间传言,都会有另一个取而
代之!比如说,过去十几年里,人们经常听到这样的说法:千禧一代
由于成长于充满科技产品的环境,因此具有同时处理多个任务的能
力,即他们可以把次要的任务添加到他们正在做的主要任务中,而不
会降低完成主要任务的效率。千禧一代自己有时也声称,他们可以一
边学习,一边给朋友发短信和看电视,而且也照样能学得好。这一世
俗信念是错误的。千禧一代并不比其他人更擅长同时处理多个任务,因为研究表明,几乎所有人在多任务处理时表现都不佳[34]。在做额外
的任务时,每个人(千禧一代和非千禧一代)在主要任务上的表现都
会受到影响。
这种一厢情愿的思维,助长了“多任务处理是可能的”这一观
点,也助长了其他民间传言的形成。例如,许多人相信“我们每个人
都有只属于自己的聪明才智”,而这一信念并没有得到关于智力本质
的实际研究的支持[35]。还有人认为快速阅读是可行的(即阅读速度是
正常速度的数倍,且理解几乎没有损失)。但事实并非如此[36]。
如果人们能认识到他们的世俗信念的易错性,民间心理学的这些
问题就不会那么具有危害性了。然而,调查显示[37],超过80%的公众
认为日常生活提供了足够的心理学训练!恰恰相反,我们需要心理学
这门学科,因为它可以检验常识的实证基础。有时,常识信念在检验
时站不住脚,正如我们在之前的很多例子中所看到的。从这些讨论过
的例子——还可以引用更多的例子——我们可以看到,心理学的这种
世俗智慧实证检验者的角色,常常使其与很多根深蒂固的文化信念发
生冲突。心理学往往是传递“坏消息”的信使,让原本为人们所接受
的世俗信念再无立足之地。这就不难理解,为什么许多人不仅无视这
些消息,还想消灭这些信使。心理学是一门年轻的科学
为了证明其问题是可实证解决的,心理学一直在战斗,直到最近
这一战役才取得胜利。不过随着科学的进步,心理学家将涉足越来越
多的主题,这些主题涉及关于人类的某些牢固的信念,其中许多都是
可以通过实证方法来检验的。心理学家现在研究的一些主题极富争
议,比如道德推理的发展、浪漫之爱、祷告的功效、犯罪的决定因
素、不同家庭结构的功效、导致离婚更普遍的因素,等等。例如,对
儿童性活动的研究,就引发了很多争议[38]。在心理学所研究的许多主
题上,人们都持有强烈的看法,比如利他主义、贪婪和说谎[39]。有些
人反对在这些领域进行实证研究,但每个领域都取得了科学进展。
最后,即便是简单地描述人类行为的某些事实,也经常会冒犯
人。例如,仅仅报道在单亲家庭中长大的孩子更有可能经历贫困和出
现行为问题这一简单事实,就足以冒犯一些人[40]。这种对关于人类行
为的简单经验事实的反对,正是心理学不得不经常面对的一个基本问
题。当争议很激烈的时候,这种反对会变得充满敌意,并且会直接针
对心理学家本人。记忆研究者伊丽莎白·洛夫特斯(Elizabeth
Loftus)的研究揭示,人们声称回忆起了被压抑的受虐待和骚扰的记
忆,但这种说法与真实情况不符。她为此遭遇了死亡威胁和诉讼[41]。
群体中有些亚群体不喜欢科学心理学的很多发现,比如:智力是部分
遗传的;我们有些性行为可以从进化上来解释;一些认知偏差使我们
相信伪科学和阴谋论[42]。
作为一门学科,心理学经常处于一种无法获胜的境地。一方面,一些人反对把心理学称为科学,否认心理学家可以通过实证方法来揭
示关于人类行为的事实。另一方面,有些人由于害怕心理学在某些人
类行为领域揭示的真相会威胁到他们的信念,因而反对心理学家在这
些领域开展研究。斯金纳学派的心理学家就经常面对这些相互矛盾的
指责。例如,有批评者认为,行为主义的强化律不适用于人类行为。
与此同时,另一些批评者则担心,有人会运用这些规律对人类进行严
格的、不人道的控制。因此,行为主义者腹背受敌,一些批评者否认
行为主义者所发现的行为定律有用,而另一些批评者则害怕这些定律
被滥用!上述现象之所以会出现,是因为相对较新的心理学才刚刚开始揭
示行为某些方面的事实,而这些以前并未被研究过。它的年轻多多少
少也解释了为什么许多人总是对这门学科感到困惑。但无论如何,在
过去的几十年里,心理学已经在我们称之为科学的这个相互关联的知
识体系中牢牢占据了一席之地。认识不到这一点,就必然会对心理学
产生各种各样的困惑和误解。小结
心理学是一门内容极其多样化的学科,它所涵盖的主题并不总能
被一些共同的概念联系在一起。相反,这门学科的统一性在于它使用
科学方法来理解行为。科学方法并不是指一套严格的规则,它是由一
些非常普遍的原则所界定的。最重要的三条是:(1)科学采用系统的
实证主义方法;(2)它以获取可公开验证的知识为目标;(3)它寻
求的是可实证解决的问题并进而发展出可检验的理论(下一章的主
题)。界定系统实证主义的结构化和有控制的观察将是本书后面几章
的主题。科学通过诸如同行评审等程序以及可重复性等机制来保证知
识的公开性。
心理学是一门年轻的科学,因而经常和所谓的世俗智慧相冲突。
这种冲突是任何新兴学科都不可避免的,但理解这种冲突有助于解释
一些针对心理学这门学科的敌意。同时,对常识智慧的质疑也使心理
学成为一个令人兴奋的领域。很多人被这门学科所吸引,正是因为它
提供了一个机会,让人们得以对那些被毫无疑问地接受了数百年
的“常识”进行实际的检验。第2章
可证伪性:如何打败头脑中的小精灵
·学习目标?
2.1 阐明可证伪性对科学理论的重要性
2.2 描述一门科学所犯错误的特异性如何随这门科学的进步而增加
1793年,一场严重的流行病——黄热病袭击了费城。当时,这座
城市里有一位名叫本杰明·拉什(Benjamin Rush)的顶尖医生,他是
《独立宣言》的签署人之一。在疫情爆发期间,拉什是少数几位能够
为数千例黄热病患者提供治疗的医生之一。拉什信奉一种医学理论,即伴有发烧的疾病应该采用大量放血的方法来治疗(用手术刀之类的
工具或水蛭吸血的方法使血液从身体排出)。他为许多病人实施了这
种疗法,当他自己感染这种疾病的时候,他也如法炮制。批评者指责
他的治疗方法比这种疾病本身更危险。然而,随着疫情的蔓延,拉什
对他的疗法的效果变得更加自信,尽管他的许多病人已经死亡。这是
为什么呢?
有人这么总结拉什的态度:“一方面坚信自己的医学理论是正确
的,另一方面又缺乏对治疗结果进行系统研究的方法。他将每个好转
的病例都归为治疗方法的疗效,而将每个死亡的病例都归为病情的严
重性。”[1]换句话说,如果病人情况好转,就被作为放血疗法有效的
证据;如果病人死亡,就被拉什解释为病人已经病入膏肓,任何治疗
都不会起作用。我们现在知道,拉什的批评者是正确的:他的治疗方
法和黄热病本身一样危险。在本章中,我们将讨论拉什错在哪里。他
的错误为阐明科学思维中最重要的原则之一提供了例证,而这一原则
在评估心理学观点时尤其有用。在本章中,我们将更详细地探讨第1章中已经讨论过的科学的第三
个基本特征:科学只研究可解决的问题。科学家们所说的“可解决的
问题”通常是指“可检验的理论”。科学家要确认某个理论是可检验
的,采取的方法就是确保该理论是可证伪的,也就是说,理论对自然
界中的真实事件有意义。接下来,我们就要看一看为何所谓的可证伪
性标准在心理学中如此重要。理论和可证伪性标准
本杰明·拉什在评估其疗法的结果时跌入了一个致命的陷阱。他
评估证据的方法根本就不可能让人得出其疗法无效的结论。如果说,病人的康复是对其疗法有效性的肯定(因此,也是对其医学理论的肯
定),那么病人的死亡就是对其治疗方法的否定,这才算是公平的。
但事实上,他却把这种否定合理化了。拉什解释证据的方式,违反了
科学中理论的建构和检验应遵循的最重要原则之一:他使自己的理论
不可能被证伪。
科学理论的表述必须总是遵循这样的原则:从中得出的预测有可
能被证明是错误的[2]。因此,对与某理论相关的新证据进行评价的方
法,必须始终具有使数据证伪该理论的可能性。这项原则通常被称
为“可证伪性标准”。科学哲学家卡尔·波普尔(Karl Popper)一直
致力于强调可证伪性标准在科学进程中的重要作用,他的著作和文章
仍被现在的科学工作者们广泛阅读[3]。
可证伪性标准申明,要使一个理论有用,它所做出的预测必须是
具体的。也可以说,理论必须担点风险,它在告诉我们哪些事情会发
生的同时,必须指出哪些事情不会发生。如果不会发生的事情确实发
生了,我们就得到了一个明确的信号,即这个理论有问题:它可能需
要被修正,或者我们需要去寻找一个全新的理论。不管哪种方式,我
们将最终得到一个更接近真理的理论。相反,如果一个理论不能把任
何可能的观察结果排除在外,那么它将永远不能被修正,同时我们将
被禁锢在当前的思维方式中,失去了取得进步的可能。因此,一个成
功的理论并不是那种可以解释所有可能结果的理论,因为这样的理论
本身就丧失了任何预测能力。正如生物学家斯图尔特·法尔斯坦[4]所
说,我们应该对科学有信心,不是因为它永远正确,而是因为我们有
可能证明它是错误的。
在本书的余下部分,我们会经常涉及理论的评估,因此我们必须
澄清一个关于“理论”一词的常见误解。这个误解体现在我们常说的
一句话中:“哦,这只不过是个理论罢了。”这句话代表了外行人使
用“理论”这个词时通常所指的意思:一项未经验证的假设,一个纯粹的猜想或直觉。这意味着一个理论与其他理论并无优劣之分。
但“理论”这个词在科学上绝对不是这么用的!科学家所说的理论,并不是指未经验证的猜想。
科学上的理论是一组相互联系的概念,它能对一组数据做出解
释,并对未来实验的结果做出预测。假设是从理论中得出的具体预测
(理论则更加普遍和广泛)。目前可行的理论是那些已经证实了很多
假设的理论。因此,这种理论的理论结构与大量的观察结果相一致。
然而,当观察数据开始与来源于理论的假设相矛盾的时候,科学家们
会尝试构建一个能更好地解释数据的新理论(或者,更常见的情况
是,仅对已有的理论进行修正)。因此,目前科学所讨论的理论都已
经在一定程度上被证实了,没有做出太多与现有数据相矛盾的预测。
它们并非纯粹的猜想和直觉。
外行人和科学家们在使用“理论”一词时的这种差异,经常会被
一些试图将神创论纳入公立学校教育的人所利用[5]。他们的论据通常
是“进化论毕竟只是个理论”。这种说法试图借用外行人对“理
论”这一术语的用法。在日常用语中,“理论”一词意味着“只是一
个猜想”。然而,基于自然选择的进化论不是外行人所理解的“理
论”(相反,在外行人看来,它应被称为“事实”[6])。它是科学意
义上的理论,是由大量的各种数据支持的概念结构[7]。它不只是猜
想,也不等同于其他任何猜想。相反,它与许多其他学科的知识紧密
相联,这些学科包括地质学、物理学、化学以及生物学的所有分支。
杰出的生物学家狄奥多西·杜布赞斯基[8]在一篇题为《如果不从进化
论的角度来看,生物学的一切都毫无意义》的著名文章中阐明了这一
观点。
敲门节奏理论
下面这个假想的例子将展示可证伪性标准是如何起作用的。一个
学生在敲我的门。我办公室的一位同事有一个理论,可以预测不同类
型的人的敲门节奏。在我开门之前,我的同事预测门外是一位女性。
我打开门,果真是个女学生。事后我告诉同事,他的表现让我吃惊,但也只是有点儿吃惊而已,因为即使没有他所谓的“敲门节奏理
论”,他也有50%的正确概率,实际上这一概率甚至要更高一些,因为
在大多数大学里女生都比男生多。他说他还可以做得更好。另一个人
来敲门,这个同事告诉我是个男生,而且不到22岁。我打开门,果然是个男生,而且我知道他刚从高中毕业。我承认我有点儿震惊了,因
为我们大学有很多22岁以上的学生。当然,我仍然坚持说年轻的男性
在大学里本来就很常见。见我如此难以取悦,我的同事提出做最后一
次测试。在下一个人敲门之后,我的同事预测:“女性,30岁,身高
157厘米,左手拿书和挎包,右手敲门。”我打开门,完全证实了他的
预测,对此我的反应截然不同了。假如我的同事没有耍花招,事先安
排这些人出现在我的门口,我不得不说,我现在的确非常震惊。
为什么我的反应如此不同呢?为什么我同事的三次预测会让我产
生从“那又怎么样?”到“哇哦!”的三种不同反应?答案与预测的
具体性和精确度有关。越具体的预测在被证实后,给我们的触动越
大。然而,要注意的是,具体性与可证伪性直接相关。预测越具体、越精确,有可能证伪它的观察现象就越多。例如,大学里有很多人都
不是30岁、身高157厘米的女性。请注意,我的不同反应隐含着这样的
意思:一个理论能预测出越多不应该发生的事件,就越会给我留下深
刻的印象。
好的理论做出的预测,会让理论有可能被证伪。坏的理论则不会
以这种方式把自己置于危险之中,它们做出的预测是如此笼统,以至
于它们几乎注定是正确的(例如,下一个来敲我的门的人会不到100
岁),或者这些预测会采用一种能完全免于被证伪的措辞方式(如本
杰明·拉什的例子)。事实上,当一种理论过度自我保护以免于被证
伪时,它就根本不再被认为是科学的了。哲学家卡尔·波普尔如此强
调可证伪性原则的重要性,正是为了界定区分科学和非科学的标准。
这一点与心理学以及第1章中我们有关弗洛伊德的讨论都有直接的联
系。
弗洛伊德与可证伪性
在20世纪初的几十年里,波普尔一直在寻找一个问题的根本原
因:为何有些科学理论似乎可以带来知识的进步,而其他理论则导致
知识的停滞不前[9]。例如,爱因斯坦的广义相对论引发了一系列惊人
的新发现(如,从一个遥远的恒星发出的光线经过太阳附近时会发生
弯曲),恰恰是因为该理论的预测结构是如此严密,以至于很多可能
发生的事件都可能与之矛盾,从而使该理论被证伪[10]。
波普尔推断,一些使知识停滞的理论却并非如此,并以弗洛伊德
的精神分析作为例子。弗洛伊德的理论用了一个复杂的概念结构,该结构在事后(即事件发生以后)解释人类行为,但不做事前的预测。
简而言之,弗洛伊德的理论可以解释一切。然而,如波普尔所说,也
正是这个属性使得它在科学上毫无用处。它不做具体的预测。精神分
析理论的拥护者耗费了大量的时间和努力让他们的理论来解释人类所
有已知的活动,从个人的怪癖行为到广泛的社会现象。他们成功地让
这个理论成为事后解释的丰富来源,但与此同时也剥夺了其所有的科
学实用性。如今,弗洛伊德的精神分析理论在激发文学想象方面的作
用,比它作为当代心理学中的一个理论发挥的作用还要大。它在心理
学中的地位日益下滑,部分原因就是未能满足可证伪性标准[11]。
但这种不可证伪理论的存在会造成实际的危害。例如,对孤独症
(部分由基因决定的障碍)病因的解释,就被精神分析的解释带进了
死胡同。受精神分析思想的影响,心理学家布鲁诺·贝特海姆(Bruno
Bettelheim)普及了“冰箱母亲”是病因这个如今已名誉扫地的说
法,他认为“造成婴儿孤独症的原因是父母不希望孩子存在”[12]。诸
如此类的观念不仅造成了危害,还阻碍了孤独症的研究。
作为另一个例子,回想一下抽动秽语综合征(Tourette
syndrome)的历史。这是一种以身体抽搐和可能涉及身体任何部位的
痉挛为特征的障碍,并伴有言语症状,如嘟囔、吠叫、模仿言语(不
自主地重复他人的话)和秽语(强迫性地重复淫秽词语)。抽动秽语
综合征是一种器质性的中枢神经系统障碍,如今通常可以用药物疗法
成功治疗[13]。重要的是,在1921至1955年之间,对这种病的解释及治
疗一直被精神分析学派的概念体系所把持,这在很大程度上阻碍了人
们对其病因及治疗的理解[14]。有关这种综合征的不可证伪的精神分析
解释层出不穷。这些似是而非的解释造成了概念上的混乱,掩盖了这
一综合征的实质,或许也阻碍了为准确理解该病症而进行的科学探
究。例如,有一位作者曾经这样写道:
(抽动秽语综合征是)精神分析导致脑疾病研究发生倒退的
典型例子。勒·图雷特(La Tourette)将疾病归因于大脑的退行
性变化过程。而在20世纪最初的几十年,弗洛伊德的理论开始流
行后,对这种病的关注就偏离了大脑……这一倒退的后果是病人
往往被转到精神科医生(通常是精神分析学派的医生)而非神经
科医生那里,因此没有接受身体上的检查。[15]夏皮罗等人[16]提到了一位精神分析师,后者认为他的病人“不愿
意放弃抽搐,因为这成了她性快感的源泉”。另一位精神分析师认为
抽搐是一种“肛门施虐阶段的转换症状”。第三位精神分析师则认
为,抽动秽语综合征患者具有“强迫人格和自恋倾向”,病人的抽
搐“代表了一种情感症状,一种对
想要表达情感的防御”。心理学家杰罗姆·卡根[17]告诉我们,弗
洛伊德的弟子桑德尔·费伦齐(Sandor Ferenczi),从来没有看过一
个抽动秽语综合征患者,却写道:“抽动秽语综合征患者频繁的面部
抽搐是压抑手淫冲动的结果”(p. 179)。
当研究者认识到精神分析的“解释”毫无用处的时候,对抽动秽
语综合征的理解和治疗才开始获得进展。那些毫无用处的解释是诱人
的,因为它们似乎能对事情进行解释。事实上,它们对所有事情做出
解释,只不过是在事后。然而,精神分析的解释不过是制造了理解的
幻觉。由于总试图在事后解释一切,它们也就堵死了前进的大门。只
有当一个理论并不试图预测一切,而是做出具体的预测,提前告诉我
们世界上会发生什么具体的事情时,该理论才会进步。当然,从这样
的理论推导出的预测可能是错误的,但这是优势,而非弱点。
小精灵
如果人们能够从研究的问题里跳出来,尤其是如果人们能以史为
鉴(如本杰明·拉什的例子)的话,就不难识别出那些不可证伪的概
念体系。如果例证明显是编造的,也很容易察觉其不可证伪性。举例
来说,大家还不知道,我已经发现了控制行为的深层脑机制,你将很
快在随处可见的八卦杂志上看到这个发现。我发现在大脑左半球的语
言区附近住着两个小精灵,它们能够控制发生在大脑许多区域的电化
学过程。而且,好吧,长话短说,它们基本上控制了一切。但是,有
一个问题,那就是小精灵能够觉察到任何对大脑的侵入(外科手术、X
光等),一旦感知到外界的侵入,它们就会消失。(我忘记说了,它
们会隐身术。)
我在这里用了一个更适合小学生的例子,无疑是侮辱了你的智
商。这个例子明显是我编造的,这样我对小精灵的假设永远无法被证
明是错误的。然而,考虑一下这一点。作为一名教授和心理学专题的
公众演讲者,我经常被问到,为什么不讲授过去几年里超感官知觉
(ESP)和超心理学方面的那些惊人的新发现。我不得不告诉这些提问者,他们所获知的关于这些主题的大部分信息,无疑都来自大众媒
体,而非有科学声誉的信息源。事实上,一些科学家曾关注过这类说
法,但没能重复这些发现。我要提醒各位读者,要将一个研究发现认
定为确凿的科学事实,它的可重复性是至关重要的,尤其是当研究结
果与以前的数据或现有的理论相矛盾的时候。
我进一步承认,许多科学家已经对超感官知觉研究失去了耐心。
原因当然与此领域充斥着欺诈、江湖骗术和媒体炒作有关,但令科学
界警醒的更重要的原因,可能是科学作家马丁·加德纳(Martin
Gardner)多年前所称的“超感官知觉研究的第22条军规”的存在。
其运作方式如下:一名“信奉者”(在开始调查前就相信超感官
知觉现象存在的人)声称已在实验室中证明了超感官知觉的存在。一
名“怀疑者”(质疑超感官知觉存在的人)被邀请来证实这种现象。
通常,在观察了实验情境之后,怀疑者会要求进行更多的控制(我们
会在第6章中讨论这类控制),虽然这些要求有时候会被拒绝,但善意
的信奉者们通常会同意他们的要求。当加入了实验控制之后,超感官
知觉就不再出现了[18]。怀疑者对这种失败做出正确的解释:早先的超
感官知觉演示结果是由于缺乏足够的实验控制,因此结论不能被接
受。但他们往往惊讶地发现,信奉者并不承认早先的演示是无效的。
相反,他们搬出超感官知觉的“第22条军规”:他们坚称,心理能量
是很敏感的、微妙的,容易受到干扰。怀疑者的“负面感应”很可能
是瓦解这一“心灵能量”的罪魁祸首。信奉者认为,怀疑者的“负面
气场”被移开后,这种心灵能量肯定会再回来。
这种对无法在实验中展示超感官知觉的解释方式,在逻辑上与我
编造的小精灵的故事相似。超感官知觉的运作方式就像小精灵一样,只要你不闯进去仔细观察它,它就在那儿;如果你闯进去观察它,它
就不见了。如果我们接受这种解释,那么向任何怀疑者证明这一现象
就变得不再可能。它只在信奉者面前出现。当然,这种说法在科学领
域是不能接受的。我们没有磁性物理学家和非磁性物理学家之分(即
那些相信磁性存在和不相信磁性存在的物理学家)。用这种方式解释
超感官知觉实验,使得超感官知觉的假设就像小精灵的假设一样不可
证伪。正是这种解释结果的方式,将超感官知觉排除在了科学领域之
外。
并非所有的证实都等价可证伪性原则对于我们如何看待一个理论的证实过程具有重要意
义。如果认为只有证实理论的证据数量才是评价理论的关键,那就太
简单了。可证伪性原则意味着一个理论被证实的次数并不是关键因
素。原因在于,正如“敲门节奏理论”所展示的那样,并非所有的证
实都是等价的。证实令人信服的程度,取决于预测本身所冒的被否定
的风险。对一个非常具体的、可能被证伪的预测(例如,一位女士,30岁,身高157厘米,左手拿书和挎包,用右手敲门)的证实,比对20
个实质上不可证伪的预测(例如,敲门的是一个不到100岁的人)的证
实具有更强的说服力。
因此,我们必须不仅关注证实性证据的数量,更要关注证实例证
的质量。将可证伪性标准作为一种评价证据的工具,可以帮助那些科
学研究的消费者抵制不科学的、全能(可以解释一切的)理论的诱
惑。这种全能理论不可避免地会妨碍我们进行更深入的探索。事实
上,这种理论上的死胡同通常是很吸引人的,因为它们永远不能被证
伪。它们是混乱的现代世界中的稳定之岛。
波普尔经常指出,“这些不可证伪理论巨大的心理吸引力的奥秘
在于它们解释一切的能力。预先知道无论发生什么,你都能理解它,不仅给你一种掌握知识的感觉,而且更重要的是,给你应对这个世界
所需的情绪上的安全感”[19]。但是,这种安全感的获得并不是科学的
目标,因为对这种安全感的追求是以知识发展的停滞为代价的。科学
是一套不断挑战原有信念的机制,在这种机制里,原有信念以一种能
够被证明是错误的方式接受实证检验。这一特点常常使科学——尤其
是心理学——与所谓的世俗智慧或常识相冲突(正如我们在第1章中所
讨论的)。
可证伪性与世俗智慧
心理学对世俗智慧所提供的安逸感是一种威胁,因为作为一门科
学,它不能安于无法反驳的解释。心理学的目标是对各种行为理论进
行实证检验,以排除其中一些理论。某些世俗智慧表述得很清晰,经
得起实证检验,这当然是心理学所欢迎的,而且其中许多已经被整合
到心理学理论中。然而,心理学并不追求那类事后能解释一切,但事
先无法做出任何预测的解释系统所带来的安逸感。心理学也不接受那
些永远不需改变、代代相传的世俗智慧体系。试图向学生和公众隐瞒
这一点无疑是自毁长城。遗憾的是,一些心理学教师和普及者觉察到
心理学对世俗智慧的威胁给一些人造成了困扰,于是他们有时通过传递一种错误信息来试图安抚这种情绪,这种信息隐含着这样的意
思:“你会学到一些有趣的东西,但别担心,心理学不会挑战那些你
深信不疑的观点。”这是错误的,它对“什么是科学”和“什么是心
理学”都会带来理解上的困惑。心理学致力于构建关于性行为、智
力、犯罪、经济行为、婚姻的作用、儿童养育以及其他很多人们感受
强烈的主题的事实。如果对上述主题的研究没有发现一些令某些人感
到不安的事实,那才奇怪呢!
科学寻求概念上的改变。科学家试图描绘世界的真实面貌,而非
我们原有信念所认为的世界该有的面貌。现代思潮中一个危险的趋势
是,应避免让普罗大众知道世界的本质:一种无知的面纱是必要的,以保护没有能力应对真相的公众。心理学与其他科学一样都反对这样
的观点,即人们需要规避那些让他们感到不适的发现。对于那些希望
自己的信念不受证据挑战的人来说,心理学不是一个“安全空
间”[20]。
承认错误的自由
科学家们发现,可证伪性原则最具解放意义和最有用的一个启示
是,在科学上犯错并不是罪过。哲学家丹尼尔·丹尼特[21]曾说过,科
学的本质就是“在公众面前犯错——在众目睽睽下犯错,希望他人能
够帮助修正这些错误”(p. 380)。当数据与理论不符时,通过对理
论不断进行修正,科学家们最终共同构建起能更好地反映世界本质的
理论。生物学家斯图尔特·法尔斯坦[22]写道,人们通常列出的科学的
支柱——如理性、事实、真相、实验、客观性——常常都缺少一个关
键的支柱。法尔斯坦认为,我们经常忘记的支柱是失败。法尔斯坦所
说的失败,是能让我们从中学到东西的错误。他指的是波普尔派意义
上的错误。确实,法尔斯坦称波普尔为“失败”的哲学家。
事实上,如果我们能在个人层面上使用可证伪性原则,我们日常
生活的质量可能会大为改善。这就是为什么我在本节的第一句话中使
用“解放”一词的原因。它对个人具有特定的含义,因为由这个原则
所引申出来的意义已经超越了科学。如果我们能够明白,当我们的信
念与世界中的证据相冲突时,我们最好是调整信念而不是否认证据和
坚持有问题的想法,那么我们的社会和个人问题就会少得多。想一想,过去有多少次,当你正与某人激烈争论的时候——也许
就是当你给出一次有力的反击来捍卫你的观点之时——你突然意识到
你搞错了某个关键事实或证据?你是怎么做的?你有没有收回前面的
话,向别人承认你的假设是错误的,同时承认别人的解释现在看起来
比你的更合理?或许没有。如果你和大多数人一样,你会不断地进行
合理化。你试图在拒不承认失败的情况下,使自己从争论中全身而
退。你最不可能做的就是承认自己错了。这样一来,你和争论中的另
一方都会更加疑惑,到底哪一种信念更接近真理?如果争论从来没有
公开过(不像科学中那样),如果正确和错误的信念得到同样激烈的
辩护,如果争论的效果不能得到正确的反馈(如本例),那就找不到
适当的机制使信念与现实相吻合了。这就是为什么那么多私人和公开
的对话令人困惑,以及为什么相比所谓的常识或民间智慧,心理科学
在解释人类行为的原因方面更加可靠。
在科学的进程中犯错是正常的,对于科学进步来说,真正的危险
是人类有一种固有的倾向,即避免让我们的信念暴露在可能被证明是
错误的情境之中。许多科学家已经证实了这一观点的重要性。科学家
必须避免这种倾向,诺贝尔奖得主彼得·梅达沃[23]提醒科学家要记
住“一个假设被确信为真的程度,与该假设是否为真无关”(p. 39;
原文为斜体),以此来避免这种倾向。
我们可以这样理解梅达沃的话。喜剧演员斯蒂芬·科尔伯特在
2005年10月17日的节目中,杜撰了“感实性”一词[24]。感实性是
指“内心感到某样东西是真实的,但是没有证据支持”[25]。梅达沃所
说的意思是,科学拒绝感实性。这常常使科学与现代社会格格不入,在现代社会中,感实性比以往任何时候都更为流行。
许多著名的心理学家都遵循了梅达沃的建议:“一个假设被确信
为真的程度,与该假设是否为真无关。”在一篇关于著名实验心理学
家罗伯特·克劳德(Robert Crowder)职业生涯的文章中,他的一位
同事马扎林·巴纳吉(Mahzarin Banaji)被引述说:“他是我认识的
最不维护自己理论的科学家。如果你发现一种方法证明他的理论有漏
洞,或者他的实验结果有局限或缺陷,他会非常高兴,并和你一起计
划如何推翻该理论”[26]。文章作者描述了克劳德如何提出一个叫
作“前分类声音存储器”的记忆成分理论,然后又仔细地设计实验研
究来证伪自己的模型[27]。但是,要让科学发挥作用,一定要让每个科学家都具备证伪的态
度。科学具有揭示世界真知的独特力量,并不是因为科学家具有独特
的美德(如,他们是完全客观的,他们在解释研究结果时从来不带偏
见,等等)。实际上,这种力量的产生是因为易犯错的科学家们沉浸
在一个相互制衡的过程中。在这个过程中,总会有其他科学家提出批
评并清除他们同行的错误。科学的力量并不是因为科学家特别有道
德,而是来自他们不断交叉检查彼此知识和结论的社会过程。
这种交叉检查的社会过程,确实是科学领域的一个与众不同的特
征。的确,在其他生活领域也有许多人强调客观性的价值。但是,没
有任何一个领域像科学一样将如此结构化的交叉检查内置化。相反,在生活的其他领域,自我中心偏见占据了主导地位。自我中心偏见是
一种行为倾向,该倾向使得人们以一种偏向于自身原有信念、观点和
态度的方式来评估证据、提出证据和检验假设[28]。滑稽报纸《洋葱
报》(The Onion)以这样的标题讽刺了自我中心偏见[29]:“儿童举
报,大多数父母虐待儿童!”
自我中心偏见在政治领域很常见。例如,自由派经常谴责保守
派,因为保守派不承认有强烈证据表明人类活动是全球变暖的罪魁祸
首。自由派这样做是有道理的,因为正如我们将在第8章中讨论的,这
一结论的证据是高度聚合的。不过,大多数自由派未能意识到自己已
经落入了自我中心偏见的陷阱,因为他们精心挑选了气候变化这一问
题。在自由派关注的这一问题上,自由派很容易认同科学结论,而保
守派很难同意科学结论。自由派在气候变化问题上对保守派穷追猛
打,但他们没有意识到,保守派也很容易从另一个方向上精心挑选对
自由派不利的话题,他们可以轻而易举地要求自由派接受科学的证据
并得出让自由派不适的结论,例如,智力至少是中度遗传的,或者事
实上女性做相同工作的收入并不比男性少20%(见第6章和第12章)。
自由派和保守派都犯了自我中心偏见的错误。这就是为什么我们需要
科学——因为它的过程,而非其中的个体。科学家并不比任何人更公
正,但他们置身于一个发现错误和交叉检查的过程,而这一点是相对
独特的。
想法不值钱
从前面关于检验世俗智慧的讨论中,我们得出了可证伪性原则的
另一个有趣推论:想法不值钱。更准确地说,我们的意思是,某些类型的想法不值钱。生物学家和科学作家史蒂芬·古尔德[30]对此是这样
阐述的:
15年的每月专栏写作生涯让我收到了非专业人士关于科学方
方面面的海量来信……我发现了常见误解中最为典型的一种。人
们会写信告诉我,他们提出了一种革命性的理论,该理论将拓展
科学的边界。这些理论通常以单倍行距打印在几张纸上,全都是
对最深刻的终极问题的推测——生命的本质是什么?宇宙的起
源?时间的起点?但是,这些想法不值钱。任何智力正常的人都
能在早饭前产生几个这样的想法。科学家们也能够就这些终极问
题提出想法。但我们不这样做(或者说,我们只让它们留在自己
的脑子里),因为我们想不出验证它们的方法,以决定它们是否
正确。从原则上来说,一个看似吸引人但无法被证实或证伪的想
法,对科学来说又有什么价值呢?
古尔德最后一个问题的答案是:“没有任何价值。”古尔德所说
的这些想法是廉价的,也是我们之前在对卡尔·波普尔观点的讨论中
所提到的宏大理论,这些理论是如此包罗万象、复杂而“模糊”,以
至于能够用来解释一切。这种理论的建构更多是为了提供情感支持,因为它们没打算被改变或被抛弃。古尔德告诉我们,这种理论对于科
学目的是无用的,无论它们多么让人感到安慰。科学是一个创造性的
过程,但是这种创造性需要让概念结构与实证数据相符。这并不容易
做到。那些如实解释世界的想法一点儿也不廉价。或许这就是为什么
好的科学理论如此难以获得,而不可证伪的伪科学信念体系无处不在
的原因,因为后者容易建构得多。
事实上,它们是如此容易构建,以至于有一个叫作“糟糕的特设
性假说大赛”(BAH-Fest)的活动,专门颁奖给通过特设性假说和事
先声明而变得不可证伪的最有创意的理论[31]。构建不可证伪理论之所
以很容易,是因为防止理论被证伪的一个万无一失的方法是,在理论
中塞满模糊和难以理解的术语[32]。许多不可证伪的阴谋论(例如,美
国政府蓄意传播艾滋病,或者美国政府事先知道“9·11”恐怖袭击)
都具有这种性质。这就是为什么阴谋论中的信念往往是相互关联的
——如果你相信一个,你就倾向于相信另一个[33]。人们似乎有一种普
遍的倾向,即容易对不可证伪的模糊性着迷。科学中的错误:逼近真理
在解释可证伪性原则的过程中,我们概述了一个简单的科学进步
模型。首先提出理论,从中推导出假设,然后使用各种技术(我们将
在本书余下的部分讨论这些技术)来对假设进行检验。如果假设被实
验证实,该理论就得到了某种程度的确证。如果假设被实验证伪,就
必须对理论做出某种改变,或者以一个新的理论来取代。
当然,这里说科学知识是尝试性的,由理论得出的假设可能是错
误的,并不是说什么都可以拿来检验一番。科学中有很多关系已经被
多次证实,以至于被称为公理,因为它们几乎不可能被未来的实验推
翻。我们不大可能在某一天发现,血液不在静脉和动脉中循环,或者
地球不绕太阳运行。这些众所周知的事实并不是我们一直在讨论的假
设。它们也不是科学家们的兴趣所在,因为它们已经是确定无疑的
了。科学家只对那些处于已知边缘的自然现象感兴趣。对于确定无疑
的事实,他们不感兴趣。
科学实践的这一面——科学家被处于已知边缘的问题所吸引,而
忽视那些已经被充分证实的问题(所谓的公理)——对大众来说很难
理解。科学家们似乎总是更强调未知的事物而非已知事物。的确是这
样,而且科学家有充分的理由这么做。为了推动知识的进步,科学家
们必须身处已知的前沿。当然,这正是事情不确定的地方。但科学正
是通过试图减少知识极限的不确定性而进步的。这常常使科学家在公
众面前显得“不确定”。这种印象是错误的,科学家只是对知识的边
缘不确定,即科学正在取得进步的地方。科学家不会对那些已经被可
重复研究证实的事实不确定。
还需要强调的是,当科学家谈到基于观察证伪了一个理论,或者
用一个新理论替代了被证伪的旧理论时,他们并不是指要将先前用以
建立旧理论的事实完全抛弃(我们会在第8章展开讨论这个话题)。相
反,新理论必须能够解释旧理论能解释的全部事实,再加上旧理论不
能解释的新事实。所以,一种理论被证伪并不意味着科学家们必须从
头开始。复杂的理论不必完全正确,但可以大体正确;信念也不必绝
对为真,但可以逼近真理。科学作家伊萨克·阿西莫夫[34]在一篇题为《错误的相对性》
(The Relativity of Wrong)的文章中很好地阐述了理论修正的过
程,他在文中谈到了我们对地球形状的理解是如何完善的。他首先提
醒我们,不要以为“地球是平的”这一古老信念是愚蠢的,因为在平
原上(第一个有文字的人类文明起源于平原),地球看上去相当平
坦。阿西莫夫敦促我们考虑对不同理论的定量比较可能揭示的信息。
首先,我们可以用地球表面每英里的假设曲率来表述不同的理
论。“地平理论”会说曲率为0度英里。现在我们都知道,这种理论
是错误的。但从某种意义上说,它又很接近真理。正如阿西莫夫[35]所
述:
大约在亚里士多德之后的一个世纪,古希腊哲学家埃拉托斯
特尼(Eratosthenes)注意到,太阳在不同纬度上投射的影子长
度不同(如果地球是平面的,所有的影子应该一样长)。根据影
子的长度差异,他计算出地球球体的大小,并计算出地球的周长
为2.5万英里(1英里= 1.609344千米——译者注)这样一个球体的曲率大
约是0.000126度英里;你可以看到,这个数值非常接近0……从0
到0.000126的这个细微差异,解释了为何我们用了如此长的时间
才放弃“地球是平的”这一观念,并转而相信地球是球体。提醒
你一下,即使是像0和0.000126之间这样细微的差异也是至关重要
的。失之毫厘,谬以千里。如果不考虑这种细微差异,如果不把
地球看作球体而视为平面,我们就不可能准确地绘制出地球上大
片区域的地图。(pp. 39-40)
当然,科学没有止步于“地球是球体”这一理论。正如我们之前
讨论过的,科学家们一直在尝试尽可能地完善他们的理论,并检验现
有知识的局限。例如,牛顿的引力理论预测地球不是完美的球体,这
个预测确实已被证实了。现在已经证明,地球在赤道附近略微凸起,而在两极附近略微扁平。它是一个扁球体。地球从北极到南极的直径
是7900英里,赤道直径则是7927英里。所以,地球的曲率并不是恒定
的(像一个完美的圆球体那样),而是有从每英里7.973英寸到每英里
8.027英寸(1英寸= 2.54厘米——译者注)的微小变化。正如阿西莫
夫[36]所言:“从球体到扁球体的修正比从平面到球体的修正要小得
多。因此,虽然‘地球是球体’这一观念并不正确,但严格地说,它
没有错到‘地球是平面的’那种程度。”阿西莫夫关于地球形状的例子为我们展示了科学家们使用“错
误”(mistake)、“偏差”(error)和“证伪”(falsifie)等术
语的背景。这样的术语并不意味着被检验的理论错得一无是处,而只
是意味着它是未完成的。所以,当科学家强调知识是尝试性的,并且
可能被未来的发现所修正的时候,他们指的就是这样的情形。当科学
家相信地球是球体时,他们也认识到在未来某一天,这个理论在细节
上可能需要修正。无论如何,从球体到扁球体的改变保留了“地球是
球体”这一“大体正确”的观念。我们绝不会在某天醒来突然发现地
球是一个立方体。
临床心理学家斯科特·利连菲尔德[37]将阿西莫夫的观点介绍给心
理学专业的学生:
当向学生解释科学知识本来就是尝试性的、可以被修正的时
候,有些学生可能会错误地认为真正的知识是不存在的。这种观
点在某些后现代主义圈子里非常流行,它忽略了将更确定的知识
主张与不太确定的知识主张区分开来。虽然绝对的肯定在科学中
很可能无法实现,但有一些科学论述,如达尔文的自然选择理
论,已经被极好地证实了。而另一些理论,如支持占星术的理
论,已经遭到了有力的驳斥。还有一些理论,如认知失调理论,仍处在科学争议当中。因此,对科学主张的信心是一个连续体;
有些几乎已经成为事实,而另一些则被完全地证伪了。方法论上
的怀疑主义不能对科学问题给出完全确定的答案(这些答案原则
上可以被新的证据推翻),这一事实并不意味着知识是不存在
的,而只是说这种知识是暂时性的。(p. 49)小结
科学家所说的可解决的问题,通常指的是可检验的理论。可检验
的理论在科学上的定义是非常明确的:它意味着该理论有可能被证
伪。如果一个理论不可证伪,那么它对自然界中的实际事件就没有任
何意义,因此是无用的。心理学一直被不可证伪的理论所困扰,这也
是这一学科发展缓慢的原因之一。
好的理论能够做出具体的预测,而且具有高度的可证伪性。相比
一个不明确的预测,一个明确具体的预测如果得到证实,更能支持该
预测所依据的理论。简言之,可证伪性原则的一个含义就是,并非所
有对理论的验证都具有同样的价值。可证伪性越强、预测越具体的理
论在得到证实之后,越受科学家的青睐。即使预测没有得到证实(比
如它们被证伪了),这种证伪对于理论的发展也是有用的。一个被证
伪的预测说明,原有理论要么应当被抛弃,要么需要加以修改以解释
不数据模式的差异。因此,正是由于被证伪的预测所引发的理论修
正,像心理学这样的科学才能逐步向真理逼近。第3章
操作主义和本质主义:“但是,博
士,这到底是什么意思?”
·学习目标?
3.1 解释为什么科学不回答本质主义问题
3.2 解释为什么心理学需要操作主义来评估理论主张
物理学家真的知道地心引力是什么吗?我的意思是真正。“地心
引力”这个术语的真实含义是什么?它的内在本质是什么?说到地心
引力时,到底指的是什么?如果刨根问底,它究竟是怎么一回事?
诸如此类的问题反映了对科学的一种看法,哲学家波普尔称其
为“本质主义”。本质主义认为,只有从内在本质或者本质属性的角
度对现象做出终极解释的理论,才算得上是好的科学理论。在本章,我们将讨论为什么科学不去回答这种本质主义问题,而是靠对概念进
行操作性定义得以进步的。为什么科学家不是本质主义者
事实上,科学家并不声称要获得本质主义者所追求的那种知识。
对本章开头提出的问题的恰当回答是:物理学家不知道在这个意义上
地心引力是什么。科学并不试图回答关于宇宙的“终极”问题。生物
学家彼得·梅达沃[1]曾写道:“那些科学不能回答,并且在科学发展
的可预见范围之内也不可能得到回答的问题,确实是存在的。这些问
题是孩子们会问的‘终极问题’……我能想到的这样的问题有:万物
是从何开始的?我们来到这个世界是为了什么?生活的意义是什
么?”(p. 66)。
科学家之所以质疑某个人、某个理论或者信念体系为终极问题提
供了绝对答案的说法,一个原因就是他们认为关于“终极”的问题是
无法回答的。科学家并不宣称他们可以提供完美的知识。科学的独特
优势不在于它是一个不会犯错的过程,而在于它提供了一种消除错误
的方法,这些错误是我们知识库的一部分。同时,那些完美或绝对知
识的说法往往会扼杀对知识的探索。因为自由而开放地探索知识是科
学活动的一个前提,科学家们总是对已经找到终极答案的说法持怀疑
态度。
本质主义者喜欢咬文嚼字
本质主义者态度的一个常见迹象是:在开始探求知识之前,过分
关注术语或概念的定义。本质主义者常用的一个口号是:“不过,我
们必须首先定义我们的术语。”“这个理论概念的真正含义是什
么?”这似乎意味着,在一个词被当作某个理论中的概念之前,我们
必须对这个词的使用所涉及的所有潜在语言问题有全面而清晰的理
解。事实上,这与科学家的工作方式正好相反。在研究物质世界之
前,物理学家不会就如何使用“能量”一词展开争论,或者当我们谈
到物质的基本组成时,“粒子”一词是否真正抓住了我们所要表达的
含义的本质。在科学领域中,确定某个概念的意义是在与该术语有关的现象得
到广泛的研究之后,而非研究之前。对概念性术语的修正来自科学过
程所固有的数据和理论之间的相互作用,而不是针对语言用法的争
论。本质主义会让我们陷入无休止的文字游戏之中,而科学家认为,这样的文字游戏使我们脱离了对实质问题的关注。例如,针对“生命
一词的真正含义是什么”这个问题,两个生物学家的回答令人惊
讶:“没有什么真正的含义,它只是一种用法,是为了很好地满足我
们生物学家的工作需要,这并不是争论或辩论的焦点”[2]。简而言
之,科学家的目的是解释现象,而非对措词进行分析。在所有的学科
中,进步的关键都在于放弃本质主义而接受操作主义。这正是本章探
讨的主题。
操作主义者将概念和可观测事件联系在一
起
那么,如果不是来自语言上的讨论,科学概念的含义又来自哪里
呢?恰当使用某一科学概念的标准是什么?为了回答这些问题,我们
必须讨论操作主义。它对于科学领域中的理论建构至关重要,尤其对
评估心理学中的理论主张有重要作用。
尽管操作主义有多种形式,但是对于科学信息的消费者来说,从
最广泛的角度去思考操作主义是最有效的。操作主义就是这样一种思
想:科学理论的概念必须以某种方式建立在可观察事件的基础之上,或与之相关联,而这些可观察事件是可以被测量的。将某个概念与一
个可观察事件相联系,会使这个概念公开化。操作性定义将这个概念
从特定个体的感觉和直觉中分离出来,并允许任何能够实施可测量操
作的人对其进行检验。
例如,把“饥饿”这个概念定义为“我胃里的啃咬感”就不是一
个操作性定义,因为它与“啃咬感”这种个人体验相联系,因此不能
被其他观察者感知到。相比之下,包含可测量的食物剥夺时间或一些
生理指标(如血糖水平)的定义是操作性的,因为它们包含了任何人
都可以进行的可观察的测量。同样,心理学家不能满足于将“焦
虑”定义为“我有时会产生的不适感和紧张感”,而是必须通过调查
问卷和生理指标测量等一系列操作来定义这个概念。前面那个定义仅限于个人对身体状况的解释,他人无法重复。后者将这一概念置于科
学的公共领域。
重要的是要认识到,科学中的概念是由一组操作定义的,而不是
由单个行为事件或任务定义的。相反,几个略有不同的任务和行为事
件被用来聚合于一个概念上(在第8章我们将会更多地讨论聚合性操
作)。例如,教育心理学家根据诸如“伍德库克阅读能力量表”[3]之
类的标准化工具所测得的成绩来定义“阅读能力”这个概念。该量表
包含一整套的任务,其阅读能力总分由几个分量表测得的能力指标组
成。这些分量表测查的技能稍有不同,例如阅读一篇文章、想出一个
合适的单词在文章中填空、写出一个词的同义词、独立拼读一个较难
的词,等等。在所有这些任务上的表现共同定义了“阅读能力”这个
概念。
操作性定义促使我们认真地、实证性地思考(根据对真实世界的
观察)我们希望如何定义一个概念。试想我们要给一个看起来相当简
单的概念“打字能力”下一个操作性定义,这么做是为了比较两种打
字教学方法的优劣。思考一下你必须要做的所有决定。当然,你想要
测量打字速度。但是要打多长的一段文章呢?只有100个词的文章可能
太短,而10000个词的文章又似乎太长。那么到底多长才算好呢?打字
速度要保持多久才能与我们对打字能力这一理论构念的最佳设想相匹
配呢?用什么类型的文章来测试呢?它是否应该包含数字、公式和不
常见的间距?我们如何处理错误?在测量打字能力时,时间和错误似
乎都应被考虑在内,但究竟应该用什么公式将这两个指标结合起来
呢?我们是赋予时间和错误相同的权重,还是一个比另一个更重要?
寻求一个好的操作性定义会迫使你认真考虑所有这些方面;它会让你
对如何将打字能力概念化进行非常透彻的思考。
我们要学会培养对操作性定义的细节进行深究的习惯。认知科学
家丹·莱维丁[4]给我们举了一个倡议团体的例子,该组织声称:在10
~18岁的学生中,70%的人是性活跃的。首先,10~18岁是一个很大的
成熟度范围。而且,从数学的角度看,这么高的百分比意味着年仅10
岁和11岁的青少年中肯定有相当比例的人是性活跃的。这让我们
对“性活动”这一概念是如何被操作化定义的又多了几分好奇。要知
道如何解释这一高比例,我们需要真正深入地探究宣传这一统计数据
的团体究竟是如何定义“性活动”这个概念的——但对此我们将略而
不谈,因为这不是一本限制级的书。畅销书作家迈克尔·刘易斯在他的《思维的发现》(The Undoing
Project)一书中描述了多年前,美国职业篮球联赛(NBA)的休斯敦
火箭队如何试图开发比以往更好的方法来评估一名球员的表现。例
如,他们不是仅仅计算一个球员拿到篮板球的数量,而是用篮板球数
除以篮板球机会的数量(也就是说,他们测量的是成功抢到篮板球的
比例)。他们从统计每场比赛的得分、抢断、篮板球等数据,转为以
每分钟为基础来计算[5]。火箭队想做的实质上是开发出比以前更好、更精细的球员影响力操作性定义。他们的努力表明,更好的操作性定
义通常更加具体。
最后,让我们考虑一下美国食品药品监督管理局(FDA)所面临的
任务,它必须决定对于各种食品来说,什么是“不可接受”水平的污
染,而非“不可避免的缺陷”[6]。像FDA这样的联邦机构不能主观地对
待这些事情。它需要对其检查的每种食物中的污染物作出判断,而这
些判断需要严格的操作性定义。因此,举例来说,它提出了如下的操
作性定义[7]:番茄汁中“不可接受”的污染水平是每100克有10个以上
的苍蝇卵;蘑菇中“不可接受”的污染水平是每100克有5个或更多2毫
米或更长的蛆虫。令人作呕,但值得称赞的是可操作!
信度和效度
在科学中,一个概念的操作化涉及测量,即通过某种规则,用一
个数字来表示某次观察结果。科学作家查尔斯·塞弗[8]指出,一旦我
们开始在测量中使用数字,我们就会突然开始关心它们。他的论点
是,当数字仅仅被用作抽象符号时,数学家之外的人很少关心数字的
性质。我们不关心5这个数字本身。但是,一旦数字5变成5“英镑”、5“美元”、5个“通货膨胀百分点”或5个“IQ得分”(智商),我们
就会突然开始关心起来。塞弗说:“没有单位的数字是虚无缥缈和抽
象的。有了单位,它便获得了意义,但与此同时,它也失去了纯粹
性”(p. 9)。塞弗所说的“失去纯粹性”,是指一旦我们涉及测量
——数字有了单位——我们就突然开始关心数字的“正确”属性了。
从科学的角度来看,什么是一个数字的“正确”属性呢?这个问题的
答案是,在科学中,一个数字应具有的“正确”属性就是信度和效
度。一个概念的操作性定义必须同时具备信度和效度才会有用。信度
是指测量工具的一致性——如果你对同一概念进行多次测评,是否能
够得到相同的测量结果。信度的科学概念很容易理解,因为它非常类
似于一般人对它的定义,也与它的字典定义之一非常相似:“任何总
能产生相同结果的系统所具有的一种属性。”
试想一下,一个外行人会如何评价一件事是否可信呢?想象一个
每天早上要赶公共汽车从新泽西去曼哈顿上班的人。公共汽车每天预
计在上午7:20到达这人等车的站点。在一个星期中,如果公共汽车到
达的时间分别是7:20、7:21、7:20、7:19和7:20,那么我们就会说在
那一周汽车的到达时间是相当可信的。如果下周汽车到达的时间分别
是7:35、7:10、7:45、7:55和7:05,那么我们就会说在那一周汽车的
到达时间是非常不可信的。
对科学中操作性定义的信度进行评估的方式与上述例子基本相
同。如果我们使用一个测量工具对同一概念进行多次测量时得到相似
的数字,那么我们就说该测量工具表现出了较高的信度。如果在同一
周的周一、周三和周五,我们用同一个IQ测验的不同形式测量同一个
人的智力,得到的分数分别是110、109、110,我们会说这个IQ测验是
非常可信的。相反,如果三次测验的分数分别是89、130和105,那么
我们就会说这个IQ测验似乎信度不高。评估不同类型的测量工具的信
度有专门的统计技术,这些内容在所有标准的方法论入门教材中都有
介绍。
但是请记住,信度只与一致性有关,而与其他方面无关。一个操
作性定义只有信度是不够的。信度是一个必要而非充分条件。一个概
念的好的操作性定义还必须是这个概念的有效衡量指标。“结构效
度”这个术语是指一个测量工具(操作性定义)是否测量了它本应测
量的内容。心理学家保罗·考兹比[9]在他所著的方法论教材中,为我
们讲述了一个只有信度而没有效度的幽默例子。假设你想测测自己的
智力,测试者让你伸出脚,放到一个像鞋码器的测量仪器里,然后测
试者给出一个读数。当然,你会认为这是一个笑话。但是请注意,这
个测量工具将表现出方法论教材所讨论的信度类型中的不止一种。这
个仪器在星期一、星期三和星期五会给出几乎相同的读数(称为“重
测信度”),并且无论谁操作它,它都会给出相同的读数(称为“评
分者间信度”)。用鞋码器来测量智力,问题不在于信度(它是有信度的),而在
于效度。它不是所要测量的概念(智力)的一个好的衡量指标。我们
认定它不是智力的有效指标的一种方法是,我们会发现它与许多其他
变量无关,而我们会期望一个智力的指标与这些变量是相关的。鞋码
器的测量结果与学业成就无关,与脑功能的神经生理学指标无关,与
职场成功无关,与认知心理学家提出的信息加工效率的测量指标无
关。相反,实际的智力测验与所有这一切都有关[10]。在心理学领域,真正的智力测量工具同时具有效度和信度,而用鞋码器来测量智力只
有信度而没有效度。
现在,你可能想知道信度和效度的另一种组合方式的情况,所以
让我来重申一下我们的立场。在操作性定义中,我们同时寻求信度和
效度,因此高信度和高效度是我们追求的目标。我们刚刚讨论了鞋码
IQ测验,以证明高信度和低效度对我们没有任何帮助。第三种情况是
低信度和低效度,这显然是无用的,不值得讨论。但是你可能想知道
第四种,也就是最后一种可能的组合方式:如果效度高而信度低呢?
答案是,与低效度和高信度的例子(鞋码器的例子)一样,这种组合
也毫无帮助。事实上,更准确地说,这种情况是不可能的。因为如果
你的测量不可信,你就不能声称测量有效。
当我们试图提出有效的操作性定义时,确切地知道我们要测量什
么概念非常重要。例如,美国职业橄榄球联盟使用一种被称为“传球
者评分”的概念结构来评估四分卫的表现[11]。重要的是要认识到,这
个概念结构被精确地命名为“传球者评分”,也就是说,它并不是四
分卫评分。这是因为“传球者评分”的操作性定义只考虑了传球,而
没有考虑四分卫所做的一切。具体而言,传球者评分是一个数学公
式,包括以下四项内容:传球完成百分比、每次传球尝试的码数、每
次传球尝试的达阵数和每次尝试的抄截数。传球者评分的统计数据不
包括:四分卫获得的冲球码数、呼叫战术能力、胜负记录、擒杀次
数、掉球次数以及其他各种可量化的四分卫变量。出于这个原因,另
一种具有不同操作性定义的概念结构被开发出来,它被称为“总四分
卫评分”。
归根结底,测量的目的是在有意义的背景下解释数字。如果没有
适当的背景,一个简单的数字没有任何意义,甚至具有误导性。数学
教授乔丹·艾伦伯格[12]告诉我们,有一位博主曾警告说,飞机机舱内
的加压空气中含有高浓度的氮气(“有时几乎高达50%”)。这位博主没说的是,地球大气中氮气的天然比例是78%!同样,许多人惊讶地发
现,30多年过去了,美国银行柜员的人数与1980年时一样多。他们很
惊讶自动化并没有让很多柜员丢掉工作。但是自动化已经取代了许多
这样的工作。这个说法(“与1980年时人数相同”)没有考虑到适当
的背景。我们应该考虑到人口自1980年以来增长了40%这一事实。柜员
职位的比例的确下降了,因为事实上,很多这样的职位已被技术所取
代。
脱离适当的背景去解释数字,会产生深远的实际影响。科学作家
吉娜·科拉塔在一篇文章中提到,现在更多的前列腺癌检测结果不明
确的男性会选择主动监测(从几十年前的10%上升到了40%),而不是
放疗或手术[13]。这是因为研究发现,Gleason评分为6分及以下的男
性,在未来10年内死于前列腺癌的概率不到1%。Gleason评分是病理学
家对前列腺细胞恶性程度的评估,分数介于2~10分之间。尽管6分看
起来是个很高的数字,但实际上是细胞能被称为癌细胞的最低分数。
在2~10分的背景下,6分看起来很高,它吓得很多男人去做了手术。
为此,世界卫生组织将Gleason评分中的6分重新命名为1~5级系统中
的第1级[14]。在这个背景下,原来的分数被重新表述得更为准确,它
提示癌症虽然存在,但仍处于早期阶段[15]。
直接和间接的操作性定义
概念与可观测的操作之间的联系,在直接或间接的程度上有很大
差异。很少有科学概念几乎完全是通过真实世界中可观测的操作来定
义的。大部分概念的定义采用更为间接的方式。例如,某些概念的使
用是由一组操作以及特定概念与其他理论构念之间的关系所决定的。
最后,还有一些概念不是通过可观测的操作来直接定义,而是通过它
们与其他概念间的关系来定义的。这种概念有时被称为“潜在构
念”,它们在心理学中很常见。
举例来说,许多研究关注所谓的A型行为模式,因为它与冠心病的
发病率有关[16]。在第8章中,我们将会更加详细地讨论A型行为模式。
但是,这里重点要说的是,A型行为模式实际上是通过一系列二级概念
来定义的,包括强烈的竞争欲望、潜在的敌意、时间紧迫感、完成目
标的强烈驱动力、愤怒等等。然而,每一个用于界定A型行为模式(强烈的竞争欲望、敌意等等)的概念,本身也都需要操作性定义。事实
上,研究者们已经付出了很多努力来对每个概念进行操作性定义。我
们当前讨论的要点是,A型行为模式是一个复杂的概念,它并不是由操
作来直接定义的。相反,它与其他一些各自具有操作性定义的概念联
系在一起。
A型行为模式提供了一个间接操作性定义的例子。临床心理学中一
个用类似方式定义的概念是痛苦耐受性[17]。这个整体概念是由几个更
简单的子构念来定义的,这些子构念与一些操作性的测量指标联系更
为紧密,包括对不确定性的耐受性、对模糊的耐受性、对挫折的耐受
性、对负面情绪的耐受性和对身体不适的耐受性。
简而言之,尽管理论概念与观测之间联系的紧密程度不同,但所
有概念都在一定程度上通过与这些观测之间的联系来获得意义。
科学概念的演进
科学概念的定义并不是固定不变的,而是随着相关观测结果的丰
富而不断变化,认识到这一点非常重要。如果一个概念最初的操作性
定义在理论上是无效的,那么它就会被抛弃,取而代之的是另一组定
义操作。因此,科学中的概念是不断发展的,并且随着相关知识的增
加,其抽象性也会增加。例如,人们曾经认为电子是一个围绕原子核
旋转的带负电的微小球体。现在它被视为在某些实验条件下具有似波
特性的概率密度函数。
在心理学领域,智力概念的发展提供了一个类似的例子。起初,智力仅有一个严格的操作性定义:智力是通过心智功能测验所测到的
东西。随着实证证据的不断积累,智力被证明与学业成就、学习、脑
损伤、神经生理学以及其他行为和生物学变量有关,这一概念也逐渐
得到丰富和完善[18]。现在看来,最好将智力概念化为由几个更具体的
信息加工操作定义的高阶构念。这些假设的加工过程又有更为直接的
操作性定义,用可测量的表现来表述。
人类记忆理论中的概念也有着同样的演进过程。现在,心理学家
很少使用像记忆或遗忘这样的宽泛概念;相反,他们会测量那些定义
更明确的记忆子过程的属性,如短时听觉记忆、图像存储、语义记忆和情景记忆。以前的记忆或遗忘的概念,已被细化为几个具体的操作
性概念。还可以回想一下我们之前关于休斯敦火箭队如何开发并逐渐
完善球员效率测量工具的讨论。
随着科学概念的演进,它们常常与几个不同的理论体系交织在一
起,并且获得不同的操作性定义。这种情况的出现并不意味着概念本
身出了问题。例如,你可能认为像失业率这样的测量指标应该是稳定
而简单的。但如果这样想,你就错了。你在收音机里听到或在报纸上
读到的标准数字,只是经济学家计算失业率的六种方法之一[19]。你经
常在电视上听到的统计数据被称为U3,它将那些没有工作、在过去四
周积极寻找工作、并且现在就可以工作的人归为失业者。在另一种被
称为U1的计算方法中,只有失业15周或更长时间的人才被称为失业
者。因为这个定义比U3更严格,用它计算出的失业率低于U3所表示的
失业率。U6与U1处于相反的极端。U6比U3多了以下几种类型:怯志工
作者(不积极寻找工作的人)、希望寻求全职工作的兼职工作者以及
处于边际状态的人。因此,U6代表的失业率总是高于U3,比U1更是高
得多。此外,还有三个与U1、U3和U6略有不同的计算方法,它们得出
的失业率也多少有些不同。它们都是失业率这一概念的可选操作性定
义。
尽管在其他学科中,概念也常常有多个不同的操作性定义,比如
像失业率这样的例子,但许多人仍然因为心理学中的许多重要理论构
念有不止一种操作化和概念化的方式而认为心理学不可信。这种情形
并非心理学所独有,也不是一件令人绝望或束手无策的事情。事实
上,这种情况在科学领域是普遍存在的。例如,“热”可以从热力学
和动力学两个理论角度来概念化。物理学并未因此遭到贬斥。类似
地,想想电子,它的许多属性可以用波的概念来解释。然而,如果将
其视为粒子,则另一些属性更好掌握。到目前为止,这些替代概念的
存在并没有诱使任何人提出放弃物理学。
2006年,人们在这一点上有了深刻的认识。当时媒体报道国际天
文联合会(International Astronomical Union)对“行星”一词重
新进行了操作化定义,这种定义方式将冥王星排除在行星之外[20]。
对“行星”这样看似基础的概念都会有不同的看法,确实让公众大吃
一惊,但事实上,这在科学领域是司空见惯的。在行星的定义上,一
组天文学家倾向于强调天体的地质构成,而另一组则强调行星的动力
属性,例如它们的轨道和引力效应。在前一组天文学家的操作性定义
中,冥王星是行星,而在后一组天文学家的操作性定义中,冥王星则被排除在外[21]。根据这个操作性定义,天体需要满足三个条件才能被
称为行星:天体必须绕太阳运转,必须近似球体,以及必须“清除邻
近区域”(这意味着通过推开较小的天体或者把它们变成卫星来控制
自身的轨道)。冥王星不符合最后一个条件(尽管它确实符合前两
个)。因此,它被降级为“矮行星”。这些有争议和分歧的操作性定
义,反映的不是天文学界的混乱,它们只是反映了该学科从不同角度
定义概念的方式。在心理学中也是如此,有时概念有多个可选择的操
作性定义。有些事物难以定义并不意味着没有真实的东西可以研究。心理学中的操作性定义
许多人在想到物理学或化学时,能够理解操作主义的必要性。他
们知道,如果科学家要讨论某一类型的化学反应、能量或者磁场,就
必须有相应的方法来测量这些东西。遗憾的是,当人们想到或谈到心
理学时,却经常无法认识到操作主义的必要性。心理学术语必须有直
接或间接的操作性定义,才能成为科学理论中有用的解释性构念。这
为什么不是显而易见的呢?
原因之一是心理学中所说的“预设偏见问题”。这个问题是这样
的:人们在研究地质学时,不会对岩石的性质带着具有感情色彩的信
念,而在心理学中,情况就大为不同了。纽约大学心理学教授伊丽莎
白·菲尔普斯[22]曾开玩笑说,她的母亲是一位海洋生物学家,从来没
有非科学界的朋友告诉过她,她对河口污染物的研究“没有意义”,但似乎每个人都对菲尔普斯关于记忆和决策偏差的研究有自己的看
法。
我们每个人都有关于人格和人类行为的直觉理论,因为我们在生
活中一直在向自己“解释”自己和他人的行为。我们所有的个人心理
学理论中都包含着理论概念(例如聪明、攻击和焦虑)。心理学中的
许多专业概念都是用日常语言中的词汇命名的,这是误解产生的最大
根源之一,也是在媒体上准确地呈现心理学发现的最大障碍之一。这
种日常用法为各种各样的误解敞开了大门。外行人很少意识到,当心
理学家把“智力”“焦虑”“攻击”“依恋”等词语用作理论构念
时,他们所指的含义不一定与大众使用这些词汇时的含义相同。
从之前关于操作主义的讨论中就能明显看出这种区别的本质。当
在心理学理论中使用诸如“智力”“焦虑”等术语时,它们直接或间
接的操作性定义决定着它们的正确用法。这些定义常常是高度技术性
的,通常相当具体,并且常常在许多方面与流行的用法不同。例如,当听到“对大量认知任务进行因素分析所得到的第一个主成分”这个
短语时,许多人都不会意识到它是“智力”这一术语的操作性定义的 ......
内容提要
心理学有什么与众不同之处
译者序
序言
第1章 心理学充满生机(在科学阵营里表现不俗)
弗洛伊德问题
现代心理学的多样性
多样性的影响
科学的统一性
那么,什么是科学
系统的实证主义
可公开验证的知识:可重复性和同行评审
可实证解决的问题:科学家对可检验理论的探求
心理学和世俗智慧:“常识”的问题
心理学是一门年轻的科学
小结
第2章 可证伪性:如何打败头脑中的小精灵
理论和可证伪性标准
敲门节奏理论
弗洛伊德与可证伪性
小精灵
并非所有的证实都等价
可证伪性与世俗智慧
承认错误的自由
想法不值钱
科学中的错误:逼近真理
小结
第3章 操作主义和本质主义:“但是,博士,这到底是什么意思?”
为什么科学家不是本质主义者
本质主义者喜欢咬文嚼字
操作主义者将概念和可观测事件联系在一起
信度和效度
直接和间接的操作性定义
科学概念的演进
心理学中的操作性定义作为人性化力量的操作主义
本质主义问题和对心理学的误解
小结
第4章 见证和个案研究证据:安慰剂效应和了不起的兰迪
个案研究的地位
为什么见证叙述毫无价值:安慰剂效应
“鲜活性”问题
单一个案的压倒性影响
鲜活的逸事和见证为何如此有说服力
了不起的兰迪:以彼之道,还施彼身
见证为伪科学打开方便之门
小结
第5章 相关和因果:用“烤箱法”避孕
第三变量问题
为什么戈德伯格的证据更好
方向性问题
选择偏差
小结
第6章 让一切置于控制之下:聪明汉斯的故事
斯诺与霍乱
比较、控制和操纵
随机分配与操纵共同定义了真实验研究
控制组的重要性
聪明汉斯——神马的故事
20世纪90年代和如今的聪明汉斯
分离变量:创设特殊条件
直觉物理学
直觉心理学
小结
第7章 “但这不是真实的生活!”:“人为性”批评与心理学
为什么自然性并非总是必要的
随机样本与随机分配的混淆
理论研究与应用研究的异同
心理学理论的应用
“大二学生”问题
客观看待真实生活和大二学生问题
小结第8章 避免爱因斯坦综合征:聚合性证据的重要性
关联性原则
消费者规则:警惕是否违反关联性原则
“跃进”模式与渐进整合模式的比较
聚合性证据:在缺陷中进步
聚合性证据的类型
科学共识
研究方法和聚合性原则
向更有效的研究方法迈进
不要对矛盾数据感到绝望
小结
第9章 打破“神奇子弹”的神话:多重原因的问题
交互作用的概念
单一原因解释的诱惑
小结
第10章 人类认知的阿喀琉斯之踵:概率推理
“某某人”统计学
概率推理以及对心理学的误解
有关概率推理的心理学研究
未充分使用概率信息
未能使用样本大小信息
赌徒谬误
再谈统计与概率
小结
第11章 偶然性在心理学中扮演的角色
试图解释偶然性事件的倾向
解释偶然性:相关错觉和控制错觉
偶然性与心理学
巧合
个人的巧合
接受错误以减少错误:临床预测与统计预测
小结
第12章 不招人待见的心理学
心理学的形象问题
心理学和超心理学
自助类读物
菜谱式知识心理学与其他学科
我们是自己最坏的敌人
我们是自己最坏的敌人之二:心理学已成为单一的意识形态文化
每个人不都是心理学家吗?行为的内隐理论
科学心理学受到抵制的根本原因
结束语
参考文献著录索引
参考文献内容提要
在今天的大众媒体和图书市场上,到处充斥着关于潜能提升、心
理操控、色彩星座、催眠读心等伪装成心理学的主题,更有一些伪心
理学家、所谓的心理治疗师打着心理学的旗号欺世盗名,从中渔利。
在浩如烟海、良莠不齐的心理学信息面前,如何拨除迷雾,去伪存
真,成为一个明智的心理学信息的消费者呢?这本书将教给你科学实
用的批判性思维技能,将真正的心理学研究从伪心理学中区分出来,告诉你什么才是真正的心理学。
本书第1版出版于1983年,30多年来一直被奉为心理学入门经典,在全球顶尖大学中享有盛誉,现在呈现在读者面前的是第11版。这本
书并不同于一般的心理学导论类教材,很多内容是心理学课堂上不曾
讲授的,也是许多心理学教师在教学中感到只可意会不可言传的。作
者正是从此初衷出发,以幽默生动的语言,结合一些妙趣横生、贴近
生活的实例,深入浅出地介绍了可证伪性、操作主义、实证主义、安
慰剂效应、相关和因果、概率推理等心理学中的基本原则。与上一版
相比,第11版更新了最新的研究资料和实例以及290篇新文献。
本书不仅适合心理学专业的学生,有助于建立心理学研究中必要
的批判性思维技能与意识,其通俗易读性也非常适合所有对心理学感
兴趣的读者。它将帮助你纠正对心理学的种种误解,学会独立地评估
心理学信息,用科学的精神和方法理解自己与他人的行为。同时,本
书也有助于培养日常生活中的批判性思维技能。
To Paula, who taught me how to think straight about life心理学有什么与众不同之处
心理学是一门很容易让人误解的学科。与其他学科不同,它研究
的是与人们生活紧密相关的问题,有些还正好是大家都熟悉且经常关
心的问题。比如:什么样的人容易讨人喜欢?什么样的事情令我们记
忆深刻?什么样的事情让人高兴(或痛苦)?为什么男人比女人更爱
聊政治时事?人为什么要自杀?意念能不能被植入梦中?……正因为
人们关心这些问题,他们就会有自己的分析、自己的证据,得出自己
相信的结论。很多时候,这些自觉的结论与心理学家的研究结论并不
完全一致。比如说,我们心理学家就发现,青梅竹马的婚姻很难成
立,婴儿并不是有奶便认娘,性格并不决定一个人的命运,等等。每
当矛盾、怀疑、迷惑甚至气愤产生的时候,我们到底是该相信自己的
直觉、经验和常识,还是该相信心理学的研究、证据和知识呢?
不幸的是,大多数的心理学教科书只满足于告诉大家心理学的研
究、发现和知识,但从不说明为什么这些研究、发现及知识是值得我
们关注和信任的。这些书的作者好像都在假设每一位读者思考起问题
来都像心理学家一样,相信和理解心理学的研究、发现与知识。幸运
的是,基思·斯坦诺维奇教授写了这本How to Think Straight about
Psychology,一本与众不同的心理学教科书。他总结了心理学家的职
业特质,让每一位读者都有机会去理解心理学家是如何思考、分析和
解读人类的行为与心理的。每一章都将一个常识的、朴素的、直觉的
有关人类心理的分析和思考与一个科学的、严谨的、心理学的分析和
思考相对比,以帮助读者理解心理学家的分析逻辑和研究思路。
我个人觉得,在斯坦诺维奇阐述的心理学特质中,有两点应该是
区分我们心理学家和其他人(包括其他领域的科学家)的地方。
其一是我们心理学家的批判性思维习惯,也就是说,心理学家不
相信个人的智慧,更相信科学的方法,而科学方法的本质是证伪,即
对我们的经验、常识和直觉,产生怀疑、挑战和批评。从原则上而
言,心理学家不怕犯错误,但害怕以假乱真。心理学家也不相信那些能回答所有问题的绝对真理,但相信对所有问题应该有一个相对正确
的答案。心理学家从不相信个案和例子,因为其随机性和主观性太过
明显,但我们愿意相信大样本基础上的科学研究发现。我们希望听到
动听的心理故事,但更愿意看到众多心理学观察的数据和总结。
其二是我们心理学的概率性思维习惯。我们和很多自然科学家思
考方式的不同之处就在于我们更容易相信,任何人类的行为都是概率
性的表现,也就是说,它有一定的不确定性,会受到其他随机事件的
影响。其实人类很多学科都是建立在概率基础之上的,比如核物理、天体物理、生物进化、病理学、所有的社会科学(经济学、社会学、政治学等)等等,它们都不可能准确预测每一个研究对象的具体活
动,但都对整体的事物活动规律有很好的描述和预测。只不过我们心
理学家更愿意承认并强调我们学科的不确定性而已。
总之,我很高兴看到这本书在中国再版。杨中芳老师的早期译本
是我很喜欢向心理学爱好者推荐的一本心理学教科书。而新版的译
本,尤其令我兴奋,因为它是由我欣赏的两位年轻同事东徽和肖岑,在清华大学的青年教师公寓里,下功夫、花时间,认真翻译完成的。
他们两位既是同行,也是夫妻,应该是我们心理学界不鲜见的学术伴
侣之一。这可能也是我们心理学界与众不同的地方吧。
彭凯平 清华大学社会科学学院院长、心理学系主任译者序
每个学心理学专业的人都会被人问到三个问题,第一个通常
是:“你知道我现在心里在想什么吗?”第二个问题可能是:“那你
一定会催眠和解梦咯?”排名第三的问题则一般会是:“什么,你们
心理学还做实验?”这类对于问话人来说再正常不过的问题,却总能
让那些学心理学的人哭笑不得。
但是,一个真正称职的心理学工作者是不应回避或敷衍这类问题
的,正确的做法是直面它们并认真分析其中的意义,给予人们正确的
解答。从最常被问到的这三个问题中,我们便能以管窥豹地看出公众
对于心理学的一些常见误解和迷思。
第一个问题所揭示的事实是,心理学在大众心目中被万能化了。
所谓万能化,是指心理学研究对象和功能的边界被无限地夸大了。首
先,许多人认为心理学无所不包,星座、属相、血型、玄学、人生哲
理及各种心灵鸡汤都被认为是心理学的范畴——实际上,心理学研究
虽然涉及人类广泛的客观行为和心理现象,但作为心理学的研究对象
必须满足“可检验”这一标准,超验的、超感官的问题不在科学心理
学的研究之列;另外,并不是说心理学不能研究血型、星座和超感
知,实际情况是,这类现象和理论在历史上都曾经是心理学的研究对
象,但已被各种科学的方法所证伪并从心理学的研究对象中剔除出去
了。还有一种观点认为,心理学是无所不能的,学了心理学就能读心
算命,甚至能在千里之外控制他人的大脑并操纵其行为,还兼具其他
种种神奇的功效。我们说心理学很神奇,是因为它能在一定程度上解
释心理现象和预测行为,并能提供一些行之有效的干预方法。但是,科学心理学所有的预测和解释都基于客观数据,所有的结论都具有概
率的性质,有一定的适用范围和条件,干预方案也必须符合客观的心
理和行为规律。因此,没有能完美地解释一切现象的心理学理论,也
没有超出人类经验以外的干预和应用。第二个关于催眠的问题则揭示了另外一种对心理学的常见误解:
心理学就是弗洛伊德的精神分析,就是心理咨询。弗洛伊德这位伟大
的心理学家确实让后世的心理学研究者“既爱又恨”。弗洛伊德的功
绩在于,他以其非凡的工作投入和严谨的思辨构筑了一套宏大、晦涩
而让人着迷的理论体系,开启了一片探索人类心灵世界的全新领域,对社会文化、艺术创作产生了不可估量的影响,并真正让世人开始了
解和重视心理学。迄今为止,他的理论仍然广泛应用于心理治疗和干
预的诸多领域。今天人们都能熟练运用“焦虑”“压抑”“潜意
识”这些词来描述或解释分析自己的心理状态,也是拜弗洛伊德和他
的精神分析学派所赐。说到心理学家,或许很多人不知道冯特和斯金
纳,但没有人会不知道弗洛伊德。然而,弗洛伊德的盛名也带来了一
系列问题,最主要的是两点:一是他的光芒掩盖了其他领域心理学研
究者的工作和成就,二是弗洛伊德所构建的这些精巧的理论很难用实
证的方法加以验证,这也为后来众多伪心理学和虚假治疗手段的滋生
和发展留下了一道后门。
最后一个问题也是最关键的——公众不了解主流的科学心理学已
经在实证主义的道路上行进了很远。心理学是一门科学,必然遵循科
学的标准,即研究的必须是实证可解决的问题;方法上要遵循系统的
实证主义;研究结论要能够被重复验证,并能经过同行评审获得认
可。这三条标准也是区分科学心理学和其他伪心理学的分水岭。心理
学的研究因此也与操作性定义、实验组和控制组、变量控制、数据统
计等词汇联系起来,而不是个人化的体验及感悟、头脑风暴或纯粹的
逻辑推导。
那么,是什么阻碍了公众了解和认识真正的科学心理学?原因应
该是多方面的。这其中既有大众的原因,也有学院派研究者自身的问
题,当然也包括学科自身特点的限制。
首先,对心理学的渴求使得大众对心理学产生了特殊的期待。心
理现象和心理问题与每个人休戚相关,人们试图通过心理学解释这些
问题和现象,并从中获得行之有效的帮助和建议。在这方面,针对个
体的精神分析和治疗技术有一定的优势,而其他大多数心理学研究针
对的则是群体的普遍行为规律,偏重于解释和预测,其研究结论都具
有概率性和领域特异性,因此无法有针对性地、面面俱到地解决个体
所有的心理问题。这有时难免会让一部分抱着“求医问药”的心态来
了解心理学的人感到失望。第二,术语体系产生的阻隔。心理学作为科学,为了让研究者之
间形成共识并利于重复验证,产生了一套严谨的术语体系,这一点与
其他科学学科并无二致。但不同的是,没有人会因为不懂量子力学的
各种晦涩的术语而鄙视物理学,但他们却会因不能忍受心理学术语所
造成的隔膜而对科学心理学产生拒斥,继而转向了那些通俗易懂但科
学性无法得到保证的理论或方法。究其原因,还是因为心理问题和现
象与每个人的关系太过紧密了,最近的需要总是要以最快捷的方式介
入和解决,这就构成了快速实用和科学研究之间的一对矛盾。
第三,心理学的许多基础研究确实与大众生活有一定的距离。首
先是因为这些研究往往是控制十分严密的实验室实验,探讨的是最基
本的生理、行为机制,有些唤起特定反应的刺激在日常生活中几乎不
可能出现(如人造的假字等);其次,并不是说基础研究的成果没有
任何实用价值,而是很多成果转化为实际的应用需要一段时间,有的
研究发现甚至要几十年之后才能体现出应用价值。这种滞后性有时会
让人产生一种科学心理学研究毫无意义的错觉。
第四,许多学院派心理学工作者的做法也难辞其咎。首先,虽然
说许多基础研究与大众生活有一定的距离,但心理学研究的最终目的
是要服务于人类。基础研究之外还有许多与现实生活紧密相关的理论
及应用研究。这方面好的研究应当是“现象为师”的,即从社会生活
现象出发去发现问题、做出假设、收集观测数据、进行验证,最终得
出的结论也应该能够在一定程度上解释或解决现实问题。但许多研究
者往往是从概念出发,空对空地进行一些干瘪乏味的研究,结论的实
用性和推广性十分有限;另外,学院派的心理学工作者一个普遍的问
题是,醉心于研究而不注重或不善于将成果进行普及和推广,这块阵
地最终被伪心理学家和各种江湖术士所攫取。
最后一个原因是,大众媒体在科学心理学的传播方面做得并不够
好。随着心理学的热度持续升温,许多电视台、电台、网站、纸媒和
出版商也不断推出与心理学相关的节目、专栏或书籍,但由于种种原
因(如专业限制、商业考虑等等),最终呈现在大众面前并得到广泛
传播的往往并不是科学的心理学,而是包装精美的伪心理学;有一些
所谓的“心理学家”甚至在媒体平台上用错误的理论误导大众。与之
相对应的是,真正的心理学家和专业书籍无人问津,而星座、血型、养生以及各种未经实证检验的古怪疗法却打着心理学的旗号招摇过
市,让心理学蒙受了许多质疑和指责。基于以上种种问题,如何让公众了解真正科学的心理学变得十分
必要。市场上有关心理学的书籍很多,但对象分化的情况也很突出:
针对心理学专业学生和心理学工作者的专业书籍能够提供很多有用的
信息和知识,但有专业门槛的隐形限制,而针对普通读者的非专业书
籍相对通俗但在信息质量方面良莠不齐。基思·斯坦诺维奇教授所写
的这本How to Think Straight about Psychology的定位则兼顾心理
学的初学者和对心理学感兴趣的更广大的读者群体,从质量来说应为
此类心理学入门读物之翘楚。在这本20万字左右的小册子里,作者以
生动而严谨的笔触告诉读者什么才是真正的心理学。书中重申了科学
心理学的诸多重要标准和核心理念,澄清了有关心理学的种种误解和
迷思,有破有立,言之凿凿;理论讲述与精彩的实验案例交相呼应,集科学性和趣味性于一体,十分耐读;有些犀利的论点足以对读者原
有的知识信念构成挑战,但这种不安很快就会被知识重构的提升感和
思辨的乐趣所取代。
这本书先前的版本曾经由杨中芳老师翻译,已使很多读者从中受
益。第11版则由北京新曲线出版咨询有限公司委托我与刘肖岑老师共
同翻译,接到任务我们深感责任重大。翻译的过程对我们来说也是一
个学习和审视自己的过程。书已近付梓,但因译者水平所限,难免有
不周或纰漏之处,还请广大读者给予指正。
本书的第11版在之前版本的基础上有所更新,主要体现在三个方
面:首先,删去了一些内容,主要包括比较陈旧的文献和被最新的研
究证明是有争议的结论;其次,补充了最新的研究结论和案例,反映
了所涉领域最新的进展;最后,对一些评述文字的说法和措辞进行了
调整,使之与所论述的主题更为贴近。全新升级之后,这一版不仅原
汁原味地保留了上一版的精髓,同时在内容上更为丰富和具有时效
性。
最后我们要感谢北京师范大学心理学部邹泓教授、华东师范大学
心理学系桑标教授以及美国加州大学伯克利分校教授、清华大学心理
学系主任彭凯平教授在本书翻译过程中给予的指点和帮助,以及一直
以来在学术和思想方面的引导和教诲。同时,这本书的顺利出版,与
新曲线公司刘力先生和陆瑜女士的信任,以及本书特约编审谢呈秋女
士和刘冰云、朱公明、李仙杰等几位编辑认真负责的工作是分不开
的,在此一并致谢。美国心理学协会前任主席、积极心理学创始人马丁·塞利格曼教
授曾用一个、两个和三个词形容心理学现在的状态,分别
是 : “good” ( 好 ) 、 “not good” ( 不 好 ) 和 “not good
enough”(还不够好)。确实,心理学是一门很好的科学,它有着辉
煌的过去、蓬勃的现在和光明的未来。虽然也有着不尽如人意的地
方,但我们坚信,现在所做的一切工作,都是在让心理学变得更好。
窦东徽 刘肖岑 2011年盛夏于清华大学青年公寓 2019年修改于中央财经大学中财大厦1014序言
有这样一门尚不为大多数人所知晓的知识,它涉及人类行为和意
识的不同形式,可以用来解释、预测和控制人类的行为。那些能够获
得这种知识的人利用它去了解他人。与那些没有这方面知识的人相
比,他们对决定他人行为和想法的因素有更完整和准确的认识。
你可能想不到,这门不被知晓的知识就是心理学。
当我说心理学仍不为人所知时意味着什么?你一定会想此话不能
从字面上来理解。如今,书店里充斥着大量所谓的心理学书籍,电视
和广播脱口秀定时播放以心理学话题为主题的节目,杂志文章和网站
也经常引述所谓的心理学家对各种问题所发表的意见,怎么能说心理
学无人知晓呢?但从某种严谨的意义上讲,心理学确实仍是一个不为
人知的知识领域。
经由大众媒体传播的那些“心理学”知识,在很大程度上只是一
种幻象。很多人不知道他们在许多书店里看到的大部分所谓的心理学
书籍,都是由一些在心理学界根本站不住脚的人撰写的。很多人也不
知道,大多数频频亮相的心理学“专家”,其实对心理学领域的知识
积累没有做出过丝毫的贡献。
媒体这种对于“心理学”话题的浅薄关注,不仅向人们传递了许
多错误信息,还让人们难以了解心理学领域中真正的、不断发展的知
识。公众不能肯定到底什么是心理学,什么又不是,也不知道该怎样
独立地评估有关人类行为的主张。雪上加霜的是,不少别有用心的人
利用大众或是缺乏判断能力、或是认为心理学主张无法评估的弱点,正在牟取私利。后一种观点有时被称为“怎么说都行”的态度,是本
书要讨论的谬误之一,这种态度对社会危害极大。公众不知道,关于
人类行为的主张是可以验证的,很多伪科学正是利用公众的这种无知
而成为价值数百万美元的产业。人们并不知道这些伪科学(例如占星
术、通灵外科手术、快速阅读、生物节律、接触治疗、潜意识自助录音带、辅助沟通术、深蓝孩童和通灵侦探等)所提出的许多主张,其
实早已被证明是虚假的。本书提到的这些伪科学产业,助长了媒体对
科学进行炒作式报道的趋势。这种趋势对心理学的危害远甚于其他学
科,理解个中缘由,是学会正确看待心理学的一个重要环节。
本书面向的不只是即将成为心理学研究者的人,而是一个更大的
读者群——心理学信息的消费者。本书的目标读者是心理学的初学
者,以及那些在大众媒体上接触过一些心理学话题,又想知道如何去
判断这些信息是否可靠的广大读者。
本书不是一本标准的心理学导论教材,它没有对心理学领域已取
得的研究成果进行总结。事实上,让每个人到大学里选修一门心理学
导论课程,可能并不是解决媒体对心理学不实描述问题的终极方案。
众多对心理学抱有很大兴趣的非专业人士,没有时间、没有钱或没有
机会进入大学进行正规的学习。更重要的原因是,作为一名大学心理
学课程的教师,我不得不承认,我和同事们也不是总能引导初学者对
心理学这门科学产生正确的认识。这是因为,初级水平的课程通常不
会讲授批判性分析的思维技巧,而这正是本书的焦点所在。作为教
师,我们常常只会关注课程“内容”以及“涵盖的材料”是否完备。
每当我们稍微偏离教学大纲,和学生讨论一些诸如媒体眼中的心理学
等话题时,都会感到些许内疚,并开始担心自己会不会因为跑题而不
能在学期结束前完成所有授课内容。
现在的很多心理学导论教材都有600~800页,并且引用了数百篇
已经发表的文献。当然,包含如此丰富的材料并没有什么错,它反映
了心理学知识在不断增长。但不幸的是,也有一些副作用。教师们常
常只忙于给学生灌输一大堆的理论、事实和实验,而无暇顾及那些学
生在学习心理学的过程中产生的基本问题和错误观念。这主要是因为
教师们(包括导论类教科书的作者)不是直接纠正这些错误观念,而
是通常寄希望于学生在接触了足够多的心理学研究之后,自然就能从
中推导出问题的答案。但是这个希望往往落空。到这门课的最后复习
阶段或学期结束时,教师们才震惊和沮丧地发现,学生提出的一些问
题及说法,应该在课程开始的第一天就提出来讨论,而不是在课程即
将结束之时。比如:“既然心理学实验不同于现实生活,那么它们能
告诉我们什么呢?”“心理学无法像化学那样成为一门真正的科学,是吗?”“可是,我在电视上听一位心理治疗师讲的跟我们教科书上
说的正好相反”“我认为这个理论相当愚蠢——我弟弟的行为和这个
理论所说的恰好相反”“心理学不过是些常识而已,不是吗?”“每个人都知道什么是焦虑——何苦还要去定义它呢?”对于很多学生来
说,仅靠思考心理学教科书中的内容是无法为这些问题找到答案的。
在本书中,我将对这类问题和说法做出明确回应,并对背后的误区进
行澄清。
不幸的是,研究发现,一般的心理学入门课程并不能有效地纠正
学生们对这个学科的诸多误解[1][I]。这个不幸的事实正是促使我写作
本书的根本原因。心理学的学生必须掌握批判性思维技能,这样才能
独立地评估各种心理学信息。
即使若干年后学生们不再记得心理学入门课程中的内容,他们仍
然可以运用本书所涵盖的基本原理去评判心理学的主张。即使他们把
埃里克森的人生发展阶段论忘得一干二净,也仍可以运用本书介绍的
思维工具去辨别媒体中新出现的心理学信息的真伪。一旦掌握,这些
技能就可以成为终身受用的思维工具,帮助我们去评判各种知识主
张。比如,这些技能为评估“专家”观点的可信度提供了一些标准。
因为在复杂的社会中,人们越来越需要依赖专家的观点,所以在获取
知识时,对专家观点可信度的判断就变得尤为重要了。
许多心理学家对努力让心理学不受曲解的尝试持悲观态度。虽然
这种悲观并非没有道理,但是这本类似“消费者指南”式的书源自一
个信念,那就是心理学家不能让这一问题成为一个自我实现的预言。
尽管我很高兴《这才是心理学》能有多次再版的机会,但令人遗
憾的是,我当初撰写本书第1版的原因对如今这版也是同样适用的。学
生在开始上心理学入门课程时,对心理学的误解还是与以往一样多。
他们认为单靠常识就能理解人类的行为,甚至更糟糕的是,他们转而
投向伪科学的怀抱。正因为如此,本书所有后续版本的目标始终如
初:对批判性思维技能进行简要介绍,帮助人们更好地理解心理学的
主题。
第11版更新的内容
第11版的《这才是心理学》在基本结构上没有大的改动,因为之
前的一个版本已经对章节做了重组。各章的基本内容和顺序也保持原
样。应评审者和读者的要求,这一版与上一版的篇幅相同。读者和使用者都不希望本书篇幅增大,事实上我也无意增加篇幅。我继续更新
和修订了书中的许多例子,用最新的研究和议题替换了那些过时的例
子,同时保留读者最喜欢的那些例子。我最主要的努力是引用和更新
了与本书所提及的各种概念和实验结果相关的最新研究资料。这一版
中有大量新的引文(确切地说是290条!),以便读者继续获得关于所
有例子和概念的最新参考文献。
本版加入了一些新的例子、讨论和小节。这些新增内容包括以下
问题和讨论:开车时使用手机;心理学在儿童监护权纠纷中的运用;
临床心理学中的伪科学;创伤事件后危机咨询的效果;人们做出错误
投资决策的原因;教育界的“阅读战争”;暴力电子游戏的影响;用
于孤独症患者的辅助沟通术;在互联网上进行实验;左脑右脑谬误;
饮酒对健康的影响;看电子仪表盘造成驾驶人分心;对心理学中重复
危机的报道;重点强调在“注水期刊”上发表论文的危害;心理学中
实验室研究结果和现场研究结果之间的关系(新增一节);关于亚马
逊劳务众包平台的讨论;关于生动鲜活的神经科学结果如何扭曲结论
的讨论;关于多任务处理这一错误观点的讨论;关于沃尔特·米歇尔
著名的棉花糖研究以及该研究如何成为心理学从基础理论到现实应用
典范的讨论;媒体滥用“新研究显示”一词所带来的危险;心理学中
使用元分析研究的更多例子(包括婚姻寿命、大脑训练、工作表现的
预测因素和自杀预防);探讨媒体在报道孤独症、阅读障碍和注意缺
陷多动障碍的研究时,如何暗示科学是非累积性的。
本书的出版宗旨一如既往:简要介绍批判性思维技能,帮助学生
更好地理解心理学的主题。在过去的15年间,大学里强调批判性思维
技能的呼声越来越高[2]。的确,一些州立大学系统已经开展了旨在加
强批判性思维技能教育的课程改革。与此同时,也有其他教育学者认
为,批判性思维技能不应该脱离具体的事实性内容。《这才是心理
学》正好融合了这两种观点,帮助教师在教授丰富的现代心理学知识
的同时传授批判性思维的技能。
欢迎读者将自己对本书的意见发送到下面的电子邮箱:
keith.stanovich@utoronto.ca。
致谢我在以前的版本中感谢过的许多人继续在为本书出谋划策。不
过,我必须对詹姆斯麦迪逊大学的Richard West教授单独致敬,他在
这本书的修订过程中持续做着最有价值的贡献。他是一位具有人文精
神的学者,一个真正的朋友,他在智力和情感上的支持令我感激万
分。
还有一些学者为这一版本和早先的版本提供了有价值的反馈。他
们 包 括 : Wayne Bartz, American River College; Christopher
Bauer, University of New Hampshire; Ludy Benjamin, Texas AM
University; Angela M. BirkheadFlight, University of
Cincinnati; Virginia Blankenship, University of Northern
Arizona; Edward C. Chang, Northern Kentucky University;
Michael Choban, West Virginia Wesleyan University; James
Clark, University of Winnipeg; Jim Coan, University of
Arizona; Ellen Cole, Alaska Pacific University; Ellen Cotter,Georgia Southwestern State University; Anne Cunningham,University of California, Berkeley; Ian Deary, University of
Edinburgh; Julie Deisinger, Saint Xavier University; David
DiBattista, Brock University; Wallace Dixon, Heidelberg
College; Mark Fineman, Southern Connecticut State University;
Herbert Fink, SUNY–Brockport; Heinz Fischer, Long Beach City
College; Ronald Gandelman, Rutgers University; Michael
Gasser, University of Northern Iowa; Traci A. Giuliano,Southwestern University; William Graziano, Purdue University;
Nancy J. Gussett, Baldwin-Wallace College; Gordon Hammerle,Adrian College; Randy Hansen, Oakland University; William L.
Hathaway, Regent University; George Heise, Indiana
University; Albert Heldt, Grand Rapids Junior College; Dori
Henderson, Metropolitan State University; George Howard,University of Notre Dame; Barry Kendall, Ontario, Canada;
Bernie Koenig, Fanshawe College; Victor Koop, Goshen College;
Andy Kwong, University of New South Wales; P. A. Lamal,University of North Carolina, Charlotte; Stephen Louisell,Kalamazoo Community College; Gwen Lupfer-Johnson, University
of Alaska, Anchorage; Margaret Matlin, State University of
New York-Geneseo; Douglas Mook, University of Virginia;
Timothy Moore, York University; Edward Morris, University of
Kansas; Joseph E. Morrow, California State University atSacramento; Michael O'Boyle, Iowa State University; Blaine
Peden, University of Wisconsin, Eau Claire; John F. Pfister,Dartmouth College; Sam Rakover, University of Haifa; Richard
Redding, Hahneman University; Michael Ross, University of
Waterloo; John Ruscio, Elizabethtown College; Walter Sa,Grand Valley State University; Allen Salo, University of
Maine at Presque Isle; Frank Schieber, University of South
Dakota; Mike Seiler, Oakland University; Jillene Grover
Seiver, Bellevue College; Marjorie Semonick, University of
Minnesota; David Share, University of Haifa; Jeffrey Sherman,Northwestern University; Linda Siegel, University of British
Columbia; Norman Silverman, University of Illinois, Chicago;
Frank Smoll, University of Washington; Paul Solomon, Williams
College; Mike Stadler, University of Missouri; Maggie Toplak,York University; Larry Vandervert, Spokane Falls Community
College; John Vokey, University of Lethbridge; Carol Wade,College of Marin; Marty Wall, University of Toronto; Barbara
Wanchisen, Baldwin-Wallace College; Toni G. Wegner,University of Virginia; Edward Wisniewski, Northwestern
University; Murray S. Work, California State University at
Sacramento;以及Edward Zuckerman, Guilford Press。
特别感谢萨基诺谷州立大学的Gerald L. Peterson提出的许多非
常有见地的评论。
我与奥克兰大学的Ted Landau,Larry Lilliston和Dean Purcell
就教学方法进行了多次讨论,他们的深刻见解和我由此获得的灵感都
纳入了书中。我要感谢以下为最近的几个版本提供了宝贵建议的评阅
者:Michael Choban, West Virginia Wesleyan University; David
DiBattista, Brock University; Steven Isonio, Golden West
College; John Ruscio, Elizabethtown College; Allen Salo,University of Maine at Presque Isle; Cindy Sifonis, Oakland
University; Michael Tagler, Nebraska Wesleyan University; 以
及Chris Ward,Stonehill College。
我在培生的编辑Priya Christopher为本书倾注了指导、热情和支
持。本书的顺利出版还得益于以下各位的支持:Erin Mitchell,Carly Czech, Anita Castro, Courtney Welsh, Allison Campbell,Anju Baskar, Joel Morgan Kearney。感谢Robyn Macpherson在本书
之前版本的图书资料和参考文献方面的大力协助。
最后,我还要感谢Paula J. Stanovich,不仅仅是出于所有致谢
词中都会提到的情感支持。她对全人类,特别是那些不幸者的关注,激励着所有认识她的人。我们都认同一个理念:所有的人都应该有机
会充分发挥自己的潜力。这本书证明我曾有过这样的机会。包括残障
人士在内的所有人都将享有这样的机会,而Paula的工作正在让这一天
能够早日到来。
[I]此阿拉伯数字为本章参考文献顺序号,可根据该顺序号到附录
的“参考文献著录索引”中找到相应的作者名和出版年,再据此到附
录的“参考文献”中查找文献题名。第1章
心理学充满生机(在科学阵营里表现
不俗)
·学习目标?
1.1 解释为什么弗洛伊德的方法不能代表现代心理学
1.2 描述心理学的多样性及其影响
1.3 将心理学与其他研究人类行为的学科区分开来
1.4 描述定义科学的三个特征
1.5 区分心理学与世俗智慧
1.6 解释对心理学这门学科产生敌意的原因弗洛伊德问题
在街上随便拦住100个人,让他们说出一个活着的或已故的心理学
家的名字,然后记下他们的答案。毫无疑问,菲尔博士(Dr. Phil)
以及其他一些“媒体心理学家”肯定会被提到。如果我们把这类媒体
和大众心理学家排除在外,只考虑那些对心理学学科做出过卓越贡献
的心理学家,那么这项非正式调查的结果就几乎没什么悬念了。西格
蒙德·弗洛伊德(Sigmund Freud)会名列榜首,斯金纳(B.F.
Skinner)可能会排名第二,但远落后于弗洛伊德[1]。除了这两位,人
们甚至想不起来其他的心理学家了。因此可以说,弗洛伊德,连同媒
体上的大众心理学,在很大程度上定义了公众心目中的心理学。
弗洛伊德的名声极大地影响了普通公众对心理学的看法,并造成
了诸多误解。例如,许多学习心理学导论课程的学生惊讶地发现,如
果统计一下美国心理学协会(American Psychological Association,APA)中所有关注弗洛伊德精神分析的会员人数,他们所占的比例将低
于5%[2]。在另一个主要的心理学组织——心理科学协会(Association
for Psychological Science, APS)中,这一比例会更低。一本广受
欢迎的心理学导论教科书[3]篇幅超过700页,但其中只有15页提到了弗
洛伊德或精神分析,而这15页也往往包含对其观点的批判(“大多数
弗洛伊德的概念都曾经且现在依旧被大多数实证取向的心理学家所排
斥”,p.19)。发展心理学家艾莉森·戈波尼克[4]称弗洛伊德理论是
一种僵尸理论,在它几乎从心理学中消失多年之后,竟还出没于大学
的英语系。
简言之,现代心理学既没有沉迷于西格蒙德·弗洛伊德的思想,也不主要由它来定义。在现代心理学家所关注的各种问题、数据和理
论中,弗洛伊德的工作只占极小的一部分。除此之外更为庞大的研究
和理论体系,囊括了5位诺贝尔奖得主[戴维·休伯尔(David
Hubel)、丹尼尔·卡尼曼(Daniel Kahneman)、赫伯特·西蒙
(Herbert Simon)、罗杰·斯佩里(Roger Sperry)、托尔斯滕·维
泽尔(Torsten Wiesel)]和17位美国国家科学奖章获得者所做的工
作[5],而他们几乎都不为公众所知。弗洛伊德对于现代心理学的重要性被极大地夸大了,这已经够糟
糕的了。更糟的是,弗洛伊德的研究方法完全不能代表现代心理学家
如何开展他们的研究。事实上,弗洛伊德的研究方法彻底误导了人们
对心理学研究的印象。例如,弗洛伊德并不采用控制实验,而我们将
在第6章讲到,控制实验是现代心理学家的方法库中最有力的武器。弗
洛伊德认为,个案研究可以证明理论的真实或谬误,在第4章中,我们
将谈谈这一理念为何是错误的。正如一位研究心理治疗史的学者所指
出的:“如果弗洛伊德本人是一位科学家,那么他宣扬的是一门奇怪
的科学……精神分析包含理论和假设,但是缺乏实证观察的方
法。”[6]
最后,弗洛伊德的工作中最大的问题是理论和行为数据之间的联
系。我们将在第2章看到,一个理论要被认为是科学的,其理论和行为
数据之间的联系必须满足一些最低限度的要求。弗洛伊德的理论不符
合这些标准[7]。简而言之,弗洛伊德根据他得到的数据(个案研究和
内省)建立了一套精细的理论,但这些数据并不足以支撑此理论。他
专注于构建复杂的理论构架,但并没有像许多现代心理学家那样,保
证这些理论建立在可靠的、可重复的行为关系数据的基础之上。总
之,只精通弗洛伊德的工作风格,势必成为理解现代心理学的一大障
碍。
在这一章中,我们将采用两种方法来解决“弗洛伊德问题”。首
先,当我们展示现代心理学的多样性时,就能清楚地看到弗洛伊德的
工作所占的比重其实很小。其次,我们将讨论在广泛的心理学领域
中,有哪些特征是心理学研究所共有的(而这些特征正是弗洛伊德的
工作所缺乏的)。我们将看到,现代心理学有一个统一的特征:用科
学的方法寻求对行为的理解。现代心理学的多样性
事实上,现代心理学包含的内容多种多样。一本心理学教科书曾
经把心理学比作“一个松散地联合在一起的学术王国,其边界从生物
科学领域一直延伸到社会科学领域”[8]。心理学有着令人惊叹的广泛
而多样的研究领域,知道这一点对于理解心理学的本质至关重要。只
要简单列举一些具体指标就能证明这一点:美国心理学协会(APA)有
54个分支,每个分支都代表了一个特定的研究或应用领域(见表
1.1)。从表格中,你可以看到心理学家所研究的主题范围、所涉及的
背景范围以及行为研究的不同方面。另一个大型心理学组织——心理
科学协会(APS),也同样分支众多。其实,表1.1并没有充分展现出
心理学领域的多样性,因为它给我们造成了一种印象,即每个分支都
是一个特定的专业领域。事实上,表中所列出的54个分支中的每一个
都有着非常宽泛的研究领域,包含各种各样的子分支!简言之,怎么
夸大心理学领域中主题的多样性都不为过。
表1.1 美国心理学协会(APA)的分支机构
·
1. 普通心理学(General Psychology)
2. 心理学教学(Teaching of Psychology)
3. 实验心理学(Experimental Psychology)
4. 评 估 、 测 量 和 统 计 ( Evaluation , Measurement, and
Statistics)
5. 行为神经科学和比较心理学(Behavioral Neuroscience and
Comparative Psychology)
6. 发展心理学(Developmental Psychology)
7. 人格和社会心理学(Personality and Social Psychology)
8. 社会问题的心理学研究(Psychological Study of Social
Issues)
9. 审美、创造力和艺术心理学(Psychology of Aesthetics,Creativity, and the Arts)
10. 临床心理学(Clinical Psychology)11. 组织咨询心理学(Consulting Psychology,也译作“咨询心理
学”)
12. 工 业 和 组 织 心 理 学 ( Industrial and Organizational
Psychology)
13. 教育心理学(Educational Psychology)
14. 学校心理学(School Psychology)
15. 咨询心理学(Counseling Psychology)
16. 公共服务中的心理学家(Psychologists in Public Service)
17. 军事心理学(Military Psychology)
18. 成人发展与老化(Adult Development and Aging)
19. 应 用 实 验 和 工 程 心 理 学 ( Applied Experimental and
Engineering Psychology)
20. 康复心理学(Rehabilitation Psychology)
21. 消费者心理学(Consumer Psychology)
22. 理 论 和 哲 学 心 理 学 ( Theoretical and Philosophical
Psychology)
23. 行为分析(Behavior Analysis)
24. 心理学史(History of Psychology)
25. 社区心理学(Community Psychology)
26. 精神药理学和药物滥用(Psychopharmacology and Substance
Abuse)
27. 心理治疗(Psychotherapy)
28. 心理催眠(Psychological Hypnosis)
29. 各 州 心 理 学 协 会 事 务 ( State Psychological Association
Affairs)
30. 人本主义心理学(Humanistic Psychology)
31. 智 力 和 发 展 障 碍 ( Intellectual and Developmental
Disabilities)
32. 人 口 与 环 境 心 理 学 ( Population and Environmental
Psychology)
33. 女性心理学(Psychology of Women)
34. 宗教心理学(Psychology of Religion)
35. 儿 童 和 家 庭 政 策 与 实 践 ( Child and Family Policy and
Practices)
36. 健康心理学(Health Psychology)
37. 精神分析(Psychoanalysis)
38. 临床神经心理学(Clinical Neuropsychology)39. 心理学和法律(Psychology and Law)
40. 独 立 从 业 的 心 理 学 者 ( Psychologists in Independent
Practice)
41. 家庭心理学(Family Psychology)
42. 男同性恋、女同性恋和双性恋问题的心理学研究(Psychological
Study of Lesbian,Gay,and Bisexual Issues)
43. 少数族裔问题的心理学研究(Psychological Study of Ethnic
Minority Issues)
44. 媒体心理学(Media Psychology)
45. 锻炼和运动心理学(Exercise and Sport Psychology)
46. 和平心理学(Peace Psychology)
47. 团体心理学和团体心理治疗(Group Psychology and Group
Psychotherapy)
48. 成瘾(Addictions)
49. 男性和男性化的心理学研究(Psychological Study of Men and
Masculinity)
50. 国际心理学(International Psychology)
51. 临 床 儿 童 心 理 学 和 青 少 年 心 理 学 ( Clinical Child and
Adolescent Psychology)
52. 儿科心理学(Pediatric Psychology)
53. 药物治疗(Pharmacotherapy)
54. 创伤心理学(Trauma Psychology)
注:没有分支4和11。
多样性的影响
许多人来学习心理学是希望学到一套能够将人类行为的方方面面
统一起来并对其加以解释的宏大的心理学理论。但这类愿望经常会落
空,因为构成心理学的不是一整套宏大的理论,而是许许多多不同的
理论,每个理论仅能够解释行为的有限方面。心理学的多样性使得理
论的统一变得极为困难。事实上,在许多心理学家看来,“统一”本
身就是“不可能的任务”。尽管如此,还是有一些心理学家正在寻求
领域内的理论统一[9]。例如,在过去的30年间,由于进化心理学家在理论方面的努力,心理学的学科一致性有所增强。这些研究者将人类
的心理过程视为服务于某些重要进化功能(诸如亲缘关系识别、伴侣
选择、合作、社会交换及后代抚养等)的机制[10],并试图以此来实现
概念的统一。同样,卡乔波[11]指出,社会认知神经科学等分支学科将
心理学中的许多专业领域——在本例中是认知心理学、社会心理学和
神经心理学——结合在了一起。
无论他们在心理学主题一致性问题上持何种立场,所有心理学家
都一致认为,理论的统一将是一项极为困难的任务。理论整合的缺失
招致了一些心理学的批评者对其已经取得的科学进步的诋毁。这类批
评通常源于一个错误的观念,即所有真正的科学都必须具备一个宏大
的、统一的理论。这是一个错误观念,因为许多其他的科学领域也同
样缺乏一个完备统一的概念体系。
一些学者认为,“心理学”一词隐含着主题的一致性,而这不是
这个学科的特点。因此,美国一些主要的大学院系已经更名为心理科
学 系 ( Department of Psychological Sciences ) [12] 。 “ 科
学”(Sciences)一词传达了本章的两个重要信息。这个词的英文是
复数形式,这表明了我们所讨论的学科内容的多样性。“科学”这一
术语也指明应从何处寻找这一学科的统一性——不是从它的内容,而
是从它的方法。正是于此,我们发现心理学家们的目标更为一致。科学的统一性
仅说心理学是关于人类行为的科学,并不能将它和其他学科区分
开来。许多其他专业团体和学科——包括经济学家、小说家、法律、社会学、历史、政治科学、人类学等——都或多或少与人类行为有
关,心理学在这方面并不是独一无二的。
在实际应用方面,心理学也不具有任何独特性。例如,许多大学
生选择主修心理学,是因为他们有一个想要“帮助他人”的崇高目
标。但是,数量众多的其他领域,如社会工作、教育、护理、作业治
疗、物理治疗、警察科学、人力资源以及言语治疗等等,其应用部分
也包括“帮助他人”。同样,培养应用性专业人才通过咨询来帮助他
人,并不需要单独开辟一门叫作“心理学”的学科。通过咨询来帮助
他人,也是众多其他领域的重要组成部分,这些领域包括教育、社会
工作、警务工作、护理、教牧工作、作业治疗等等。
我们很容易论证,只有以下两点能证明心理学是一门独立的学
科。其一,心理学研究采用科学方法来探究人类及动物的所有行为;
其二,从这些知识中发展而来的实际应用是以科学为基础的。如果不
是这样,心理学就失去了存在的理由。
心理学不同于其他行为学科的地方在于,它试图向公众保证两
点:第一,心理学中关于行为的结论来源于科学证据;第二,心理学
的应用都源于科学方法,并经过了科学方法的检验。心理学是否曾经
偏离过这两个目标呢?有过,而且经常如此[13]。本书讲的就是我们如
何能够更好地实现这两个目标。在第12章中,我将回到一些心理学家
因为不遵守适当的科学标准而损害自身合法性这一问题。但是,从原
则上讲,科学性正是保证心理学作为一门独立学科的标准。如果有朝
一日心理学认为这些目标不值得追求——即它不再愿意坚守科学标准
——它就应该关张大吉,将其关注的领域并入其他学科了事,因为它
将成为一个完全多余的知识探究领域。
因此,毫无疑问,任何人想要理解心理学,第一步也是至关重要
的一步,就是要认识到心理学的首要特征——它是基于数据的科学的
行为研究。在本书后面的所有章节,我们都将把注意力放在理解这一事实的全部内涵上,因为这是培养我们清醒地认识心理学的能力的主
要途径。相反,人们对心理学的理解之所以会出现各种偏差,正是因
为常常未能认识到它是一门科学。例如,我们经常听到这门学科之外
的人说它不是科学。为什么这种情况屡见不鲜呢?
那些企图让公众相信“心理学不能成为一门科学”的原因不一而
足。例如,我们的社会有很多围绕伪科学信念体系的产业,它们出于
既得利益的考虑,总是想让公众相信,无论什么都能纳入心理学的范
畴,而且心理学的主张不能以理性标准来衡量。“催眠减肥”“激发
潜在心灵能量”“睡觉时学法语”等概念,以及其他利润高达数十亿
美元的心理自助产业,都是在这种完美的氛围中炒作起来的。它们要
么不是建立在科学证据的基础上,要么很多时候与已有的证据相冲
突。
另一个抗拒科学心理学的原因是,一些人倾向于反对将科学扩展
到那些由不容置疑的权威或“常识”长期统治的领域。历史上有许多
最初公众抗拒使用科学,而接受用哲学思辨、神学谕告或世俗智慧来
解释自然界的例子。每一门科学都经历了一个抵制其发展的阶段。与
伽利略同时代的知识分子拒绝透过他的新望远镜观察天空,因为“木
星存在卫星”这一事实颠覆了他们的哲学和神学信仰。由于禁止解剖
人类尸体,解剖学在几百年中的发展可谓步履蹒跚。查尔斯·达尔文
因其生物进化论而不断受到抨击。在19世纪的法国,保罗·布洛卡
(Paul Broca)的人类学协会受到抵制,因为当时人们认为,关于人
类的知识会颠覆国家。
关于人类的知识向前迈进的每一步都引发了对抗。然而,当人们
意识到科学并没有损害我们生命的意义,反而使它更加丰富时,对抗
终将烟消云散。现在谁还认为星系图以及关于遥远星球构成的复杂理
论会破坏我们对于宇宙的好奇?谁会用人体解剖常规化之前的医疗手
段来替代他们社区中现有的医疗保健?对于星球和人体的实证态度并
没有磨灭人性。更近的例子是,达尔文的进化论体系为生物学的非凡
进步奠定了基础。然而,虽然我们越来越接近人类的本质及其起源,但反对派的残余依然存在。许多人仍然对进化论的启示感到不安[14]。
如果进化生物学以其悠久而令人印象深刻的科学成就记录,时至今日
仍然引起公众的反对,那么心理学,一门将人们长期持有的关于人类
的信念置于科学审视之下的新兴学科,时下招致人们否认其合法性,又有什么好奇怪的呢?那么,什么是科学
为了理解什么是心理学,我们必须理解什么是科学。或许我们可
以从“什么不是科学”入手。首先,科学并不是由研究的主题来定义
的。对宇宙万物任何方面的研究都可以发展成一门科学,当然也包括
人类行为的所有方面。我们不能将宇宙万物划分为“科学的”和“非
科学的”两类主题。尽管历史上始终有一股强大的力量,试图将人类
排除在科学研究的范围之外,但正如我们所见,它们均以失败告终。
拒绝将心理学作为一门科学来对待,可能代表了这一历史争论的余
音。
科学也不能按照是否使用仪器和实验设备来定义。试管、电脑、电子设备或研究者的白大褂都定义不了科学。这些都是科学的外在标
志,而不是其本质特征。确切地说,科学是一种思考和观察宇宙万物
以便深入理解其运行机制的方法。
在本章的剩余部分,我们将讨论定义科学的三个重要且相互关联
的特征:(1)系统实证主义的运用;(2)公共知识的产生;(3)对
可解决问题的细查。尽管我们将分别考察每个特征,但请记住,这三
个特征构成了相互联系的统一整体。[更多有关科学的普遍特征的详
细讨论,参见本书参考文献部分列出的布洛诺夫斯基(Bronowski)、梅达沃(Medawar)和波普尔(Popper)等人的著作。]
系统的实证主义
如果你在任何辞典中查找“实证主义”(empiricism)一词,你
都会发现它的意思是“依靠观察的做法”。科学家通过检验来认识世
界。这一点在你看来似乎显而易见,这正表明了科学态度在过去几个
世纪的传播。在过去,它并非总是那么显而易见。回想一下伽利略的
例子。用他原始的望远镜,伽利略宣称看见了环绕木星的卫星,而当
时有学问的人认为天上只有七个“天体”(五个行星、太阳、月
亮)。在那个时代,人们认为获得知识的最佳途径是纯粹的思辨或诉诸权威。一些同时代的学者拒绝透过伽利略的望远镜观察世界。另外
一些人说,设计这台望远镜就是为了骗人。还有人说,望远镜可以用
于观察地上之物,但不适用于天上之物[15]。另一位学者弗朗西丝科·
西奇(Francesco Sizi)试图驳倒伽利略,但不是用观察,而是用下
面的一番雄辩:
人的头上有七窍,两个鼻孔、两只耳朵、两只眼睛和一张
嘴;因此在天界有两颗吉星、两颗灾星、两颗发光星,以及尚未
决定但无关紧要的水星。从这点和其他无数相似的自然现象中,诸如七种金属等等(没必要一一列举出来),我们就可以得出行
星的数量必然是七个……另外,犹太人和其他古老民族以及现代
欧洲人,都将一周分为七天,并以七大行星来命名;如果现在我
们增加了行星的数量,整个系统都将崩溃……进一步来说,木星
的卫星用肉眼无法看到,因此对于地球没有影响,既然没有用,也就不存在了。[16]
关键问题不在于以上论述多么荒唐可笑,而在于当时它被视作一
种对实际观察的合理辩驳!今天我们嘲笑它,是因为我们可以做事后
诸葛亮。三个世纪以来,实证方法显示出了强大的力量,这使我们比
可怜的西奇更有优势。要是没有经历这些实证主义的岁月,我们中的
许多人可能都会点头同意并对他大加赞赏。事实上,实证方法并不一
定显而易见,这就是为何即使在一个科学占主导地位的社会中,我们
也不得不经常讲授实证方法的原因。
然而,纯粹、单一的实证主义还不够。请注意,本节的标题
是“系统的实证主义”。观察法很好,而且很有必要,但对自然世界
单纯的、非结构化的观察并不能产生科学知识。假使你记录下某一天
从起床到睡觉之间观察到的所有情况,当你完成的时候,你会拥有一
大堆事实,但并不会对这个世界有更深的理解。科学观察之所以被称
为“系统的”,是因为它的结构化使得观察的结果能够揭示自然世界
一些潜在的本质。科学观察通常是理论驱动的;它们检验对世界本质
的不同解释。它们是结构化的,因此,根据观察的结果,一些理论得
到支持,而另一些则被拒绝。
可公开验证的知识:可重复性和同行评审从某种特殊意义上说,科学知识具有公开性。当然,并不是说把
科学发现张贴在社区的公告板上就叫“公开”了。相反,我们指的是
这样一个事实,即科学知识并不仅仅存在于某一特定个体的头脑中。
从一种重要意义上说,科学知识在提交给科学共同体供他人批评和实
证检验之前根本不存在。那些被认为隶属于特定个体思维过程、不受
他人审查和批评的“特殊”知识,永远都无法获得科学知识的地位。
同样地,科学也拒绝只有某些特殊的群体才能获得某些特殊知识的说
法[17]。
科学通过重复程序来实现其公开验证的理念。一项发现如果想在
科学领域引起关注,就必须以这样一种方式提交给科学共同体,即能
够让其他科学家尝试相同实验并获得相同结果。当这一切都完成,我
们就可以说,这一发现是可重复的。科学家利用可重复性来定义公共
知识。可重复性保证了特定发现并不仅仅是由于某个研究者的错误或
偏差而产生的。简而言之,一项发现要想被科学共同体所接受,就必
须能够被最初的调查研究者以外的人所重复。当一项发现以这种方式
被提交时,它就具有公开性。它不再仅仅为最初研究者个人所有,而
是能够被其他人获取,并以自己的方式对其进一步发展、进行批评,或加以应用。
诗人约翰·唐尼(John Donne)告诉我们:“任何人都不是一座
孤岛。”在科学中,没有一个研究者是一座孤岛。每个研究者都与科
学共同体及其知识库相联系。正是这种相互联系使科学得以发展和累
积。研究者不断在原有知识的基础上进行新的探索,力求超越已知。
这一过程的前提便是,先前知识的陈述方式使任何研究者都能以之为
基础来进行探索。
因此,可公开验证的知识,是指那些以一种可被科学共同体中的
任何人重复、批评或扩展的方式提交的研究结果。这个标准不仅对于
科学家,同时对于外行人来说也是最重要的,因为他们作为消费者,必须对来自媒体的科学信息进行评估。江湖术士和伪科学的从业者,与真正科学家的一个重要区别是,前者常常避开科学出版的常规渠
道,而选择直接通过大众媒体公开他们的“发现”。当面对合法性不
确定的科学论断时,公众可使用的一个行之有效的铁的标准就是问这
样一个问题:这些发现是否在使用某种同行评审程序的公认科学期刊
上发表过?对这一问题的回答往往能够区分“李鬼”和“李逵”。同行评审(peer review, 也译作“同行评议”)是指每一篇投到
学术期刊的文章都要经过数位科学家的评审,评审者将批评意见提交
给编辑。担任编辑的人通常都是在此期刊所覆盖的专业领域中有资深
研究经历的科学家。编辑会权衡这些意见,然后确定这篇文章可以直
接发表,还是需要进一步的实验研究和统计分析之后再发表,或是因
为存在缺陷或价值太低而拒绝接受。正规期刊会在每期杂志和网站上
发布它们的编辑政策声明,所以你每次都应该检查一份期刊是否经过
同行评审。这一点现在变得尤为重要,因为网络催生了许多开放获取
的期刊,只要付费什么内容都能发表[18]。这些毫无价值的网络期刊,它们的目标对象是那些为了获得大学终身教职而拼命发表论文的年轻
学者。它们在网络上的存在,使得普通公众更难将经过同行评审的科
学研究,与网络上看似科学但未经同行评审的东西区分开来。
并非所有同行评审的科学期刊上的信息都一定是正确的[19],但至
少它已达到了同行批评和审查的标准。同行评审只是一个最低标准,而不是严格的标准,因为大多数学科领域中都会有几十种质量参差不
齐的期刊。大部分科学思想在满足一些基本标准的前提下,都能以正
规文献的形式发表。那种认为只有很小部分的数据和理论能够在科学
界获得出版的观点是错误的。这种观点经常被一些提供虚假疗法的江
湖术士所利用,他们试图让媒体和公众相信,他们被“正统科学”的
阴谋排除在科学出版渠道之外。但是,让我们看一看心理学领域中有
多少正规的渠道吧。美国心理学协会(APA)所建立的“心理学文摘索
引数据库”(PsycINFO),汇总了来自2000多种不同期刊的文章,其
中的大部分期刊都是经过同行评审的。几乎所有大致合理的理论和实
验都能在如此众多的出版物中找到自己的发表渠道。实际上,要说有
什么问题的话,那也是科学期刊的数量可能太多了。当然,也有太多
非同行评审期刊和根本未经评审的“注水期刊”[20]。
再次强调,我并不认为所有发表在同行评审的心理学期刊上的观
点都必然正确。相反,正如我先前所强调的,这只是一个最低的标
准。然而,问题的关键在于,当某种理念、理论、主张或疗法,不能
在经过同行评审的学科文献中获得适当的收录时,这个信号的含义就
很明显了。尤其是当某一主张缺乏证据却通过媒体进行大肆宣传时,此理念、理论或疗法显然是骗人的。
同行评审的机制因学科而异,但其基本原理是相同的。同行评审
是科学将客观性和公开批评的态度制度化的一种方法(另一种是可重复性)。观点和实验要经过一个磨砺的过程,在这个过程中它们被提
交给其他具有批判性的人来进行评估。通过了这一严格过程的观点才
开始符合“可公开验证”这一标准。同行评审过程绝非完美,但它真
的是我们仅有的消费者保护机制。忽视它,就等于让我们自己被巨大
的伪科学产业玩弄于股掌之间,而这一产业又极其善于操纵媒体来达
到自己的目的(见第12章)。在随后的章节中,我们将更详细地讨
论,如果忽视真正的心理科学实践所固有的制衡机制,我们会付出多
么高昂的代价。
可实证解决的问题:科学家对可检验理论
的探求
科学处理的是可解决的、可具体指明的问题。这意味着,就其类
型来说,科学家们所研究的问题,有可能通过现有的实证方法得到解
答。如果用当前所掌握的实证方法,某个问题无法解决或某个理论不
可检验,那么科学家们就不会对它展开研究。例如,“在日托期间接
受结构化语言刺激的3岁儿童,是否比那些没有接受这些额外刺激的儿
童更早地做好了接受阅读指导的准备?”代表的是一个科学问题,因
为现有的实证方法可以对此作出回答。“人性本善还是本恶?”就不
是一个实证问题,因此不属于科学领域。“生命的意义是什么?”同
样也不是一个实证问题,因此也不属于科学领域。
科学的进步是这样一个过程:提出理论去解释世界中的特定现
象,根据这些理论做出预测,实证地检验这些预测,基于检验的结果
对理论进行修正。这个顺序通常可以描述为:理论→预测→检验→理
论修正。因此,科学家所说的“可解决的问题”通常指的是“可检验
的理论”。什么样的理论才算是“可检验的”呢?这一理论必须与自
然界中可观察的事件有一定的关联;这就是“可实证检验”的含义。
可检验性标准通常被称为可证伪性标准,这也是本书第2章的主题。
我们说科学家致力于可实证解决的问题,并不是说不同类别的问
题本质上是可解决的或不可解决的,并且这种区分是永远固定不变
的。恰恰相反,有些当前不可解决的问题,在理论和实证方法或技术
更加先进的时候会成为可解决的。例如,几十年前,对于“托马斯·
杰斐逊是否与其奴隶萨丽·海明斯生下了一个孩子”这一争议话题,不会有历史学家认为它是一个可实证解决的问题。然而到了1998年,由于基因技术的进步,这个问题已成为可解决的,发表在《自然》
(Nature)杂志上的一篇文章[21]指出,杰斐逊极可能是埃斯顿·海明
斯·杰斐逊的父亲。
这就是科学得以发展以及新的科学得以产生的方式。然而,对
于“当前什么是可解决的”这一问题,总是存在很多分歧。当涉及某
一具体问题时,科学家们自己在这点上的意见都难以统一。因此,尽
管所有科学家都认同可解决性标准,但他们对其具体应用可能存在不
同的意见。诺贝尔奖得主彼得·梅达沃(Peter Medawar)曾把他的一
本书定名为《可解决性的艺术》(The Art of the Soluble),用以
说明科学的部分创造力就在于寻找处于人类知识最前沿并将可以用实
证方法来解决的问题。
心理学本身就提供了许多从不可解决到可解决的好例子。有许多
问题,诸如“一个孩子如何获得其父母的语言?”“为什么我们会忘
记我们曾经知道的事情?”“身处一个群体中会如何改变一个人的行
为和思想?”等等,在人们认识到可以用实证的方法来解答之前,几
个世纪中它们都只是哲学思辨的主题。随着这一认识的慢慢发展,心
理学逐渐集合了来自各个领域中关于行为的各种问题。心理学的问题
逐渐脱离哲学,一门独立的实证科学逐渐形成了。
认知心理学家史蒂芬·平克[22]提出“未知”可被划分为问题或玄
谜,并对此进行了探讨。如果是问题,我们知道可能会找到一个答
案,即使目前还没有找到,我们也知道它可能会是什么样子。如果是
玄谜,我们甚至不能想象答案可能会是什么样子。利用这些术语,我
们可以看到,科学就是将玄谜变为问题的过程。事实上,平克[23]指
出,他之所以要写《心智探奇》(How the Mind Works)这本书,正
是因为“几十个关于心智的玄谜,从心理表象到浪漫爱情,最近已经
升级为问题了”(p. ix)。心理学和世俗智慧:“常识”的问题
我们每个人都有一套解释行为的内隐模型,这些模型影响我们的
人际交往以及我们如何看待自己和他人。事实上,一些社会、人格和
认知心理学家正在探究这些内隐的心理理论的本质。然而,大多数人
从来不会清晰且有逻辑地思考自己的这套理论。相反,我们通常只有
在刻意关注它们或者发现它们受到某种挑战时,才会意识到它们的存
在。
其实,我们个人的行为模型并不像真正的理论那样具有内部一致
性。相反,当我们觉得需要对行为作出解释时,往往搬出一些关于人
类行为的普遍原理、说教和老话。这些常识和世俗智慧存在一个问
题,即它们之中有不少是自相矛盾的,因此也是不可证伪的(可证伪
性原则是下一章的主题)。
人们经常用一些民间谚语来解释行为事件,即使之前在解释同类
事件时曾用过与之完全矛盾的谚语。例如,大多数人都听过或说
过“三思而后行”。若不是我依稀记得之前有人告诫说“机不可失,时不再来”,我还会觉得这是个简单有用的行为建议呢。“小别胜新
婚”明确预测了一种对分离的情绪反应,但“眼不见,心不想”又如
何解释?如果“欲速则不达”,为什么又说“时不我待”?既然“三
个臭皮匠,顶个诸葛亮”,为什么又说“人多误事”?如果我认
为“行走江湖,安全第一”,为什么也相信“不入虎穴,焉得虎
子”?如果“相异相吸”,为什么又“物以类聚”?我劝许多学
生“今日事今日毕”,但我希望没跟我刚刚指导过的那个学生说过这
番话,因为我方才还跟他说“要顺其自然”。
这类谚语和老话对人们有极大的吸引力,因为它们合起来作为对
行为的内隐“解释”,是难以驳倒的。不管发生什么事,都可以搬出
其中的一条解释一番。难怪我们都认为自己是判断他人行为和人格的
高手。我们的世俗智慧对天底下发生的所有事都能给出解释。因此,从这种意义上说,世俗智慧是怯懦的,因为它不用冒着被驳倒的风
险。这种世俗智慧就是“事后诸葛亮”,在真正的预测意义上实际上
是无用的。这就是为什么社会学家邓肯·沃茨将他的一本书命名为
《一切都显而易见——一旦你知道答案》[24]。沃茨讨论了拉扎斯菲尔
德60多年前的一篇经典论文[25],这篇文章回应的是一个常见的批
评:“社会科学没有告诉我们任何我们不知道的事。”拉扎斯菲尔德
列举了对60万二战期间服役士兵进行的大规模调查所得出的一系列结
果,例如,来自农村的男性在服役期间精神面貌要好于来自城市的士
兵。人们往往认为所有的调查结果都是显而易见的。例如,在这个例
子中,人们倾向于认为农村背景的男性已经习惯于艰苦的环境,因此
能更好地适应部队生活,这是很显然的结论。其他的发现也是如此
——人们觉得这些结果都是明摆着的。随后拉扎斯菲尔德甩出了他的
包袱:这里列举的所有发现,都与原来的陈述刚好相反。例如,实际
的情况是,来自城市的男性在服役期间的精神面貌比来自农村的士兵
要好。这次学习任务的最后一部分是让人们意识到他们是多么容易就
解释了恰恰相反的发现。对于实际的结果,人们往往会解释说(若先
告知这一结果),这在他们的意料之中,因为城里人习惯于在拥挤的
环境和森严的等级制度下工作。然而,他们从来没有意识到,他们是
多么容易就可以为完全相反的结果编造一个解释!
所以,有时我们的世俗行为理论是无法反驳的。我们将在下一章
中看到为什么这种不可反驳性使得这些理论没有多大用处。然而,即
使我们的世俗信念有一定的明确性(也就是说,可以进行实证检
验),也还是会产生一个问题。这个问题就是:心理学研究表明,许
多常见的关于行为的文化信念在接受实证检验后,都被证明是错误
的。
世俗信念(或称“常识”)出现谬误的例子俯拾皆是。比如,有
一种说法是,学习好或爱读书的孩子都不擅长交际和体育。这个观点
虽然错得离谱,但在当今社会上极为流行。有证据表明,与所谓“常
识”的世俗信念相反,与不读书的人相比,爱读书的人和追求学业成
就的人,身体更强健,社交更活跃[26]。经常读书的人比不常读书的人
更有可能参加运动、慢跑、锻炼和课外活动。
许多关于行为的世俗信念一经产生便径自流传下去了。例如,在
过去的数年间,在我们的社会和学校里,一个世俗信念逐渐形成,即
低自尊导致攻击行为。但实证研究显示,攻击行为和低自尊并无关联 [27]。如果说有什么关联的话,情况似乎正好相反,攻击行为往往与高自尊相关。同样,过去几十年中有一个非常流行的假说认为,在学生
中,学习成绩不好是低自尊的结果。事实上,后来证明,自尊和学习
成绩之间的关系更有可能与教育者和家长的假设相反:优异的在校成
绩(以及生活中其他方面的成就)导致了高自尊,而不是反过来[28]。
另一个世俗智慧出错的例子是对学生的一个常见告诫:如果他们
对多项选择题的答案不确定,就不应该改变原来的选择。不仅大多数
学生认为在不确定答案时不应该换答案,就连《巴伦GRE备考指南》也
建议:“更改答案要非常谨慎。经验表明,许多学生会把正确的答案
改成错误的答案。”[29]这个建议是完全错误的,之所以说它错是因
为,“改变答案会降低一个人的分数”这种传言本身就大错特错。实
际研究表明,当学生对某一多选题的答案产生怀疑时,改变最初的答
案往往会更好[30]。
还有一个例子,从中我们能真切地了解到世俗智慧是何等的泛
滥。该民间传言说,我们只用了自己10%的脑力。这个传言尽管没有任
何认知神经科学的根据[31],但它已经流传几十年了,业已取得所
谓“心理事实”的地位。所谓“心理事实”是指这样一种关于心理学
的陈述:虽然不真,但是被重复了很多次,以至于一般人认为它就是
一个事实。下面这个流行的信念也是如此——有些人是“左脑型”,而另一些人是“右脑型”,或者人格的某些方面由左脑控制,而其他
方面则由右脑控制。尽管现代神经科学研究确实表明大脑中存在微妙
的特异化现象,但是言之凿凿地用“左”或“右”的概念来普及这一
观点肯定是毫无道理的,尤其是研究已发现,我们的大脑是以一种整
合的方式在工作[32]。
想想2007年对美国前白宫助理刘易斯·利比(绰号“滑板车”)
的审判。一位著名心理学家的专家证词被驳回,因为法官裁定,记忆
容易出错是众所周知的,陪审团可以放心地依靠他们的常识来确定记
忆是如何工作的。事实上,研究表明,近30%的人相信人类记忆“像录
音机一样工作”[33]。与法官的想法相反,他的陪审团中有30%的人迫
切需要听取专家的意见!
世俗信念并不总是不受证据的影响。有时,当矛盾的证据变得广
为人知时,民间心理学(“常识”)确实会改变。例如,多年前,关
于儿童的一个广为流传的俗语是“熟得早,烂得早”。这句老话反映
了这样一种信念,即儿童期早熟与成年后的异常有关,这种信念得到了许多类似“伤仲永”轶事的支持。在这个例子中,证明这个说法不
准确的心理学证据已经被大众文化所吸收,你几乎再也听不到这个世
俗“智慧”了。
然而,新的民间传言并未停止产生,当然也有一些会像病毒一样
传播开来。似乎我们用证据消灭的每个民间传言,都会有另一个取而
代之!比如说,过去十几年里,人们经常听到这样的说法:千禧一代
由于成长于充满科技产品的环境,因此具有同时处理多个任务的能
力,即他们可以把次要的任务添加到他们正在做的主要任务中,而不
会降低完成主要任务的效率。千禧一代自己有时也声称,他们可以一
边学习,一边给朋友发短信和看电视,而且也照样能学得好。这一世
俗信念是错误的。千禧一代并不比其他人更擅长同时处理多个任务,因为研究表明,几乎所有人在多任务处理时表现都不佳[34]。在做额外
的任务时,每个人(千禧一代和非千禧一代)在主要任务上的表现都
会受到影响。
这种一厢情愿的思维,助长了“多任务处理是可能的”这一观
点,也助长了其他民间传言的形成。例如,许多人相信“我们每个人
都有只属于自己的聪明才智”,而这一信念并没有得到关于智力本质
的实际研究的支持[35]。还有人认为快速阅读是可行的(即阅读速度是
正常速度的数倍,且理解几乎没有损失)。但事实并非如此[36]。
如果人们能认识到他们的世俗信念的易错性,民间心理学的这些
问题就不会那么具有危害性了。然而,调查显示[37],超过80%的公众
认为日常生活提供了足够的心理学训练!恰恰相反,我们需要心理学
这门学科,因为它可以检验常识的实证基础。有时,常识信念在检验
时站不住脚,正如我们在之前的很多例子中所看到的。从这些讨论过
的例子——还可以引用更多的例子——我们可以看到,心理学的这种
世俗智慧实证检验者的角色,常常使其与很多根深蒂固的文化信念发
生冲突。心理学往往是传递“坏消息”的信使,让原本为人们所接受
的世俗信念再无立足之地。这就不难理解,为什么许多人不仅无视这
些消息,还想消灭这些信使。心理学是一门年轻的科学
为了证明其问题是可实证解决的,心理学一直在战斗,直到最近
这一战役才取得胜利。不过随着科学的进步,心理学家将涉足越来越
多的主题,这些主题涉及关于人类的某些牢固的信念,其中许多都是
可以通过实证方法来检验的。心理学家现在研究的一些主题极富争
议,比如道德推理的发展、浪漫之爱、祷告的功效、犯罪的决定因
素、不同家庭结构的功效、导致离婚更普遍的因素,等等。例如,对
儿童性活动的研究,就引发了很多争议[38]。在心理学所研究的许多主
题上,人们都持有强烈的看法,比如利他主义、贪婪和说谎[39]。有些
人反对在这些领域进行实证研究,但每个领域都取得了科学进展。
最后,即便是简单地描述人类行为的某些事实,也经常会冒犯
人。例如,仅仅报道在单亲家庭中长大的孩子更有可能经历贫困和出
现行为问题这一简单事实,就足以冒犯一些人[40]。这种对关于人类行
为的简单经验事实的反对,正是心理学不得不经常面对的一个基本问
题。当争议很激烈的时候,这种反对会变得充满敌意,并且会直接针
对心理学家本人。记忆研究者伊丽莎白·洛夫特斯(Elizabeth
Loftus)的研究揭示,人们声称回忆起了被压抑的受虐待和骚扰的记
忆,但这种说法与真实情况不符。她为此遭遇了死亡威胁和诉讼[41]。
群体中有些亚群体不喜欢科学心理学的很多发现,比如:智力是部分
遗传的;我们有些性行为可以从进化上来解释;一些认知偏差使我们
相信伪科学和阴谋论[42]。
作为一门学科,心理学经常处于一种无法获胜的境地。一方面,一些人反对把心理学称为科学,否认心理学家可以通过实证方法来揭
示关于人类行为的事实。另一方面,有些人由于害怕心理学在某些人
类行为领域揭示的真相会威胁到他们的信念,因而反对心理学家在这
些领域开展研究。斯金纳学派的心理学家就经常面对这些相互矛盾的
指责。例如,有批评者认为,行为主义的强化律不适用于人类行为。
与此同时,另一些批评者则担心,有人会运用这些规律对人类进行严
格的、不人道的控制。因此,行为主义者腹背受敌,一些批评者否认
行为主义者所发现的行为定律有用,而另一些批评者则害怕这些定律
被滥用!上述现象之所以会出现,是因为相对较新的心理学才刚刚开始揭
示行为某些方面的事实,而这些以前并未被研究过。它的年轻多多少
少也解释了为什么许多人总是对这门学科感到困惑。但无论如何,在
过去的几十年里,心理学已经在我们称之为科学的这个相互关联的知
识体系中牢牢占据了一席之地。认识不到这一点,就必然会对心理学
产生各种各样的困惑和误解。小结
心理学是一门内容极其多样化的学科,它所涵盖的主题并不总能
被一些共同的概念联系在一起。相反,这门学科的统一性在于它使用
科学方法来理解行为。科学方法并不是指一套严格的规则,它是由一
些非常普遍的原则所界定的。最重要的三条是:(1)科学采用系统的
实证主义方法;(2)它以获取可公开验证的知识为目标;(3)它寻
求的是可实证解决的问题并进而发展出可检验的理论(下一章的主
题)。界定系统实证主义的结构化和有控制的观察将是本书后面几章
的主题。科学通过诸如同行评审等程序以及可重复性等机制来保证知
识的公开性。
心理学是一门年轻的科学,因而经常和所谓的世俗智慧相冲突。
这种冲突是任何新兴学科都不可避免的,但理解这种冲突有助于解释
一些针对心理学这门学科的敌意。同时,对常识智慧的质疑也使心理
学成为一个令人兴奋的领域。很多人被这门学科所吸引,正是因为它
提供了一个机会,让人们得以对那些被毫无疑问地接受了数百年
的“常识”进行实际的检验。第2章
可证伪性:如何打败头脑中的小精灵
·学习目标?
2.1 阐明可证伪性对科学理论的重要性
2.2 描述一门科学所犯错误的特异性如何随这门科学的进步而增加
1793年,一场严重的流行病——黄热病袭击了费城。当时,这座
城市里有一位名叫本杰明·拉什(Benjamin Rush)的顶尖医生,他是
《独立宣言》的签署人之一。在疫情爆发期间,拉什是少数几位能够
为数千例黄热病患者提供治疗的医生之一。拉什信奉一种医学理论,即伴有发烧的疾病应该采用大量放血的方法来治疗(用手术刀之类的
工具或水蛭吸血的方法使血液从身体排出)。他为许多病人实施了这
种疗法,当他自己感染这种疾病的时候,他也如法炮制。批评者指责
他的治疗方法比这种疾病本身更危险。然而,随着疫情的蔓延,拉什
对他的疗法的效果变得更加自信,尽管他的许多病人已经死亡。这是
为什么呢?
有人这么总结拉什的态度:“一方面坚信自己的医学理论是正确
的,另一方面又缺乏对治疗结果进行系统研究的方法。他将每个好转
的病例都归为治疗方法的疗效,而将每个死亡的病例都归为病情的严
重性。”[1]换句话说,如果病人情况好转,就被作为放血疗法有效的
证据;如果病人死亡,就被拉什解释为病人已经病入膏肓,任何治疗
都不会起作用。我们现在知道,拉什的批评者是正确的:他的治疗方
法和黄热病本身一样危险。在本章中,我们将讨论拉什错在哪里。他
的错误为阐明科学思维中最重要的原则之一提供了例证,而这一原则
在评估心理学观点时尤其有用。在本章中,我们将更详细地探讨第1章中已经讨论过的科学的第三
个基本特征:科学只研究可解决的问题。科学家们所说的“可解决的
问题”通常是指“可检验的理论”。科学家要确认某个理论是可检验
的,采取的方法就是确保该理论是可证伪的,也就是说,理论对自然
界中的真实事件有意义。接下来,我们就要看一看为何所谓的可证伪
性标准在心理学中如此重要。理论和可证伪性标准
本杰明·拉什在评估其疗法的结果时跌入了一个致命的陷阱。他
评估证据的方法根本就不可能让人得出其疗法无效的结论。如果说,病人的康复是对其疗法有效性的肯定(因此,也是对其医学理论的肯
定),那么病人的死亡就是对其治疗方法的否定,这才算是公平的。
但事实上,他却把这种否定合理化了。拉什解释证据的方式,违反了
科学中理论的建构和检验应遵循的最重要原则之一:他使自己的理论
不可能被证伪。
科学理论的表述必须总是遵循这样的原则:从中得出的预测有可
能被证明是错误的[2]。因此,对与某理论相关的新证据进行评价的方
法,必须始终具有使数据证伪该理论的可能性。这项原则通常被称
为“可证伪性标准”。科学哲学家卡尔·波普尔(Karl Popper)一直
致力于强调可证伪性标准在科学进程中的重要作用,他的著作和文章
仍被现在的科学工作者们广泛阅读[3]。
可证伪性标准申明,要使一个理论有用,它所做出的预测必须是
具体的。也可以说,理论必须担点风险,它在告诉我们哪些事情会发
生的同时,必须指出哪些事情不会发生。如果不会发生的事情确实发
生了,我们就得到了一个明确的信号,即这个理论有问题:它可能需
要被修正,或者我们需要去寻找一个全新的理论。不管哪种方式,我
们将最终得到一个更接近真理的理论。相反,如果一个理论不能把任
何可能的观察结果排除在外,那么它将永远不能被修正,同时我们将
被禁锢在当前的思维方式中,失去了取得进步的可能。因此,一个成
功的理论并不是那种可以解释所有可能结果的理论,因为这样的理论
本身就丧失了任何预测能力。正如生物学家斯图尔特·法尔斯坦[4]所
说,我们应该对科学有信心,不是因为它永远正确,而是因为我们有
可能证明它是错误的。
在本书的余下部分,我们会经常涉及理论的评估,因此我们必须
澄清一个关于“理论”一词的常见误解。这个误解体现在我们常说的
一句话中:“哦,这只不过是个理论罢了。”这句话代表了外行人使
用“理论”这个词时通常所指的意思:一项未经验证的假设,一个纯粹的猜想或直觉。这意味着一个理论与其他理论并无优劣之分。
但“理论”这个词在科学上绝对不是这么用的!科学家所说的理论,并不是指未经验证的猜想。
科学上的理论是一组相互联系的概念,它能对一组数据做出解
释,并对未来实验的结果做出预测。假设是从理论中得出的具体预测
(理论则更加普遍和广泛)。目前可行的理论是那些已经证实了很多
假设的理论。因此,这种理论的理论结构与大量的观察结果相一致。
然而,当观察数据开始与来源于理论的假设相矛盾的时候,科学家们
会尝试构建一个能更好地解释数据的新理论(或者,更常见的情况
是,仅对已有的理论进行修正)。因此,目前科学所讨论的理论都已
经在一定程度上被证实了,没有做出太多与现有数据相矛盾的预测。
它们并非纯粹的猜想和直觉。
外行人和科学家们在使用“理论”一词时的这种差异,经常会被
一些试图将神创论纳入公立学校教育的人所利用[5]。他们的论据通常
是“进化论毕竟只是个理论”。这种说法试图借用外行人对“理
论”这一术语的用法。在日常用语中,“理论”一词意味着“只是一
个猜想”。然而,基于自然选择的进化论不是外行人所理解的“理
论”(相反,在外行人看来,它应被称为“事实”[6])。它是科学意
义上的理论,是由大量的各种数据支持的概念结构[7]。它不只是猜
想,也不等同于其他任何猜想。相反,它与许多其他学科的知识紧密
相联,这些学科包括地质学、物理学、化学以及生物学的所有分支。
杰出的生物学家狄奥多西·杜布赞斯基[8]在一篇题为《如果不从进化
论的角度来看,生物学的一切都毫无意义》的著名文章中阐明了这一
观点。
敲门节奏理论
下面这个假想的例子将展示可证伪性标准是如何起作用的。一个
学生在敲我的门。我办公室的一位同事有一个理论,可以预测不同类
型的人的敲门节奏。在我开门之前,我的同事预测门外是一位女性。
我打开门,果真是个女学生。事后我告诉同事,他的表现让我吃惊,但也只是有点儿吃惊而已,因为即使没有他所谓的“敲门节奏理
论”,他也有50%的正确概率,实际上这一概率甚至要更高一些,因为
在大多数大学里女生都比男生多。他说他还可以做得更好。另一个人
来敲门,这个同事告诉我是个男生,而且不到22岁。我打开门,果然是个男生,而且我知道他刚从高中毕业。我承认我有点儿震惊了,因
为我们大学有很多22岁以上的学生。当然,我仍然坚持说年轻的男性
在大学里本来就很常见。见我如此难以取悦,我的同事提出做最后一
次测试。在下一个人敲门之后,我的同事预测:“女性,30岁,身高
157厘米,左手拿书和挎包,右手敲门。”我打开门,完全证实了他的
预测,对此我的反应截然不同了。假如我的同事没有耍花招,事先安
排这些人出现在我的门口,我不得不说,我现在的确非常震惊。
为什么我的反应如此不同呢?为什么我同事的三次预测会让我产
生从“那又怎么样?”到“哇哦!”的三种不同反应?答案与预测的
具体性和精确度有关。越具体的预测在被证实后,给我们的触动越
大。然而,要注意的是,具体性与可证伪性直接相关。预测越具体、越精确,有可能证伪它的观察现象就越多。例如,大学里有很多人都
不是30岁、身高157厘米的女性。请注意,我的不同反应隐含着这样的
意思:一个理论能预测出越多不应该发生的事件,就越会给我留下深
刻的印象。
好的理论做出的预测,会让理论有可能被证伪。坏的理论则不会
以这种方式把自己置于危险之中,它们做出的预测是如此笼统,以至
于它们几乎注定是正确的(例如,下一个来敲我的门的人会不到100
岁),或者这些预测会采用一种能完全免于被证伪的措辞方式(如本
杰明·拉什的例子)。事实上,当一种理论过度自我保护以免于被证
伪时,它就根本不再被认为是科学的了。哲学家卡尔·波普尔如此强
调可证伪性原则的重要性,正是为了界定区分科学和非科学的标准。
这一点与心理学以及第1章中我们有关弗洛伊德的讨论都有直接的联
系。
弗洛伊德与可证伪性
在20世纪初的几十年里,波普尔一直在寻找一个问题的根本原
因:为何有些科学理论似乎可以带来知识的进步,而其他理论则导致
知识的停滞不前[9]。例如,爱因斯坦的广义相对论引发了一系列惊人
的新发现(如,从一个遥远的恒星发出的光线经过太阳附近时会发生
弯曲),恰恰是因为该理论的预测结构是如此严密,以至于很多可能
发生的事件都可能与之矛盾,从而使该理论被证伪[10]。
波普尔推断,一些使知识停滞的理论却并非如此,并以弗洛伊德
的精神分析作为例子。弗洛伊德的理论用了一个复杂的概念结构,该结构在事后(即事件发生以后)解释人类行为,但不做事前的预测。
简而言之,弗洛伊德的理论可以解释一切。然而,如波普尔所说,也
正是这个属性使得它在科学上毫无用处。它不做具体的预测。精神分
析理论的拥护者耗费了大量的时间和努力让他们的理论来解释人类所
有已知的活动,从个人的怪癖行为到广泛的社会现象。他们成功地让
这个理论成为事后解释的丰富来源,但与此同时也剥夺了其所有的科
学实用性。如今,弗洛伊德的精神分析理论在激发文学想象方面的作
用,比它作为当代心理学中的一个理论发挥的作用还要大。它在心理
学中的地位日益下滑,部分原因就是未能满足可证伪性标准[11]。
但这种不可证伪理论的存在会造成实际的危害。例如,对孤独症
(部分由基因决定的障碍)病因的解释,就被精神分析的解释带进了
死胡同。受精神分析思想的影响,心理学家布鲁诺·贝特海姆(Bruno
Bettelheim)普及了“冰箱母亲”是病因这个如今已名誉扫地的说
法,他认为“造成婴儿孤独症的原因是父母不希望孩子存在”[12]。诸
如此类的观念不仅造成了危害,还阻碍了孤独症的研究。
作为另一个例子,回想一下抽动秽语综合征(Tourette
syndrome)的历史。这是一种以身体抽搐和可能涉及身体任何部位的
痉挛为特征的障碍,并伴有言语症状,如嘟囔、吠叫、模仿言语(不
自主地重复他人的话)和秽语(强迫性地重复淫秽词语)。抽动秽语
综合征是一种器质性的中枢神经系统障碍,如今通常可以用药物疗法
成功治疗[13]。重要的是,在1921至1955年之间,对这种病的解释及治
疗一直被精神分析学派的概念体系所把持,这在很大程度上阻碍了人
们对其病因及治疗的理解[14]。有关这种综合征的不可证伪的精神分析
解释层出不穷。这些似是而非的解释造成了概念上的混乱,掩盖了这
一综合征的实质,或许也阻碍了为准确理解该病症而进行的科学探
究。例如,有一位作者曾经这样写道:
(抽动秽语综合征是)精神分析导致脑疾病研究发生倒退的
典型例子。勒·图雷特(La Tourette)将疾病归因于大脑的退行
性变化过程。而在20世纪最初的几十年,弗洛伊德的理论开始流
行后,对这种病的关注就偏离了大脑……这一倒退的后果是病人
往往被转到精神科医生(通常是精神分析学派的医生)而非神经
科医生那里,因此没有接受身体上的检查。[15]夏皮罗等人[16]提到了一位精神分析师,后者认为他的病人“不愿
意放弃抽搐,因为这成了她性快感的源泉”。另一位精神分析师认为
抽搐是一种“肛门施虐阶段的转换症状”。第三位精神分析师则认
为,抽动秽语综合征患者具有“强迫人格和自恋倾向”,病人的抽
搐“代表了一种情感症状,一种对
想要表达情感的防御”。心理学家杰罗姆·卡根[17]告诉我们,弗
洛伊德的弟子桑德尔·费伦齐(Sandor Ferenczi),从来没有看过一
个抽动秽语综合征患者,却写道:“抽动秽语综合征患者频繁的面部
抽搐是压抑手淫冲动的结果”(p. 179)。
当研究者认识到精神分析的“解释”毫无用处的时候,对抽动秽
语综合征的理解和治疗才开始获得进展。那些毫无用处的解释是诱人
的,因为它们似乎能对事情进行解释。事实上,它们对所有事情做出
解释,只不过是在事后。然而,精神分析的解释不过是制造了理解的
幻觉。由于总试图在事后解释一切,它们也就堵死了前进的大门。只
有当一个理论并不试图预测一切,而是做出具体的预测,提前告诉我
们世界上会发生什么具体的事情时,该理论才会进步。当然,从这样
的理论推导出的预测可能是错误的,但这是优势,而非弱点。
小精灵
如果人们能够从研究的问题里跳出来,尤其是如果人们能以史为
鉴(如本杰明·拉什的例子)的话,就不难识别出那些不可证伪的概
念体系。如果例证明显是编造的,也很容易察觉其不可证伪性。举例
来说,大家还不知道,我已经发现了控制行为的深层脑机制,你将很
快在随处可见的八卦杂志上看到这个发现。我发现在大脑左半球的语
言区附近住着两个小精灵,它们能够控制发生在大脑许多区域的电化
学过程。而且,好吧,长话短说,它们基本上控制了一切。但是,有
一个问题,那就是小精灵能够觉察到任何对大脑的侵入(外科手术、X
光等),一旦感知到外界的侵入,它们就会消失。(我忘记说了,它
们会隐身术。)
我在这里用了一个更适合小学生的例子,无疑是侮辱了你的智
商。这个例子明显是我编造的,这样我对小精灵的假设永远无法被证
明是错误的。然而,考虑一下这一点。作为一名教授和心理学专题的
公众演讲者,我经常被问到,为什么不讲授过去几年里超感官知觉
(ESP)和超心理学方面的那些惊人的新发现。我不得不告诉这些提问者,他们所获知的关于这些主题的大部分信息,无疑都来自大众媒
体,而非有科学声誉的信息源。事实上,一些科学家曾关注过这类说
法,但没能重复这些发现。我要提醒各位读者,要将一个研究发现认
定为确凿的科学事实,它的可重复性是至关重要的,尤其是当研究结
果与以前的数据或现有的理论相矛盾的时候。
我进一步承认,许多科学家已经对超感官知觉研究失去了耐心。
原因当然与此领域充斥着欺诈、江湖骗术和媒体炒作有关,但令科学
界警醒的更重要的原因,可能是科学作家马丁·加德纳(Martin
Gardner)多年前所称的“超感官知觉研究的第22条军规”的存在。
其运作方式如下:一名“信奉者”(在开始调查前就相信超感官
知觉现象存在的人)声称已在实验室中证明了超感官知觉的存在。一
名“怀疑者”(质疑超感官知觉存在的人)被邀请来证实这种现象。
通常,在观察了实验情境之后,怀疑者会要求进行更多的控制(我们
会在第6章中讨论这类控制),虽然这些要求有时候会被拒绝,但善意
的信奉者们通常会同意他们的要求。当加入了实验控制之后,超感官
知觉就不再出现了[18]。怀疑者对这种失败做出正确的解释:早先的超
感官知觉演示结果是由于缺乏足够的实验控制,因此结论不能被接
受。但他们往往惊讶地发现,信奉者并不承认早先的演示是无效的。
相反,他们搬出超感官知觉的“第22条军规”:他们坚称,心理能量
是很敏感的、微妙的,容易受到干扰。怀疑者的“负面感应”很可能
是瓦解这一“心灵能量”的罪魁祸首。信奉者认为,怀疑者的“负面
气场”被移开后,这种心灵能量肯定会再回来。
这种对无法在实验中展示超感官知觉的解释方式,在逻辑上与我
编造的小精灵的故事相似。超感官知觉的运作方式就像小精灵一样,只要你不闯进去仔细观察它,它就在那儿;如果你闯进去观察它,它
就不见了。如果我们接受这种解释,那么向任何怀疑者证明这一现象
就变得不再可能。它只在信奉者面前出现。当然,这种说法在科学领
域是不能接受的。我们没有磁性物理学家和非磁性物理学家之分(即
那些相信磁性存在和不相信磁性存在的物理学家)。用这种方式解释
超感官知觉实验,使得超感官知觉的假设就像小精灵的假设一样不可
证伪。正是这种解释结果的方式,将超感官知觉排除在了科学领域之
外。
并非所有的证实都等价可证伪性原则对于我们如何看待一个理论的证实过程具有重要意
义。如果认为只有证实理论的证据数量才是评价理论的关键,那就太
简单了。可证伪性原则意味着一个理论被证实的次数并不是关键因
素。原因在于,正如“敲门节奏理论”所展示的那样,并非所有的证
实都是等价的。证实令人信服的程度,取决于预测本身所冒的被否定
的风险。对一个非常具体的、可能被证伪的预测(例如,一位女士,30岁,身高157厘米,左手拿书和挎包,用右手敲门)的证实,比对20
个实质上不可证伪的预测(例如,敲门的是一个不到100岁的人)的证
实具有更强的说服力。
因此,我们必须不仅关注证实性证据的数量,更要关注证实例证
的质量。将可证伪性标准作为一种评价证据的工具,可以帮助那些科
学研究的消费者抵制不科学的、全能(可以解释一切的)理论的诱
惑。这种全能理论不可避免地会妨碍我们进行更深入的探索。事实
上,这种理论上的死胡同通常是很吸引人的,因为它们永远不能被证
伪。它们是混乱的现代世界中的稳定之岛。
波普尔经常指出,“这些不可证伪理论巨大的心理吸引力的奥秘
在于它们解释一切的能力。预先知道无论发生什么,你都能理解它,不仅给你一种掌握知识的感觉,而且更重要的是,给你应对这个世界
所需的情绪上的安全感”[19]。但是,这种安全感的获得并不是科学的
目标,因为对这种安全感的追求是以知识发展的停滞为代价的。科学
是一套不断挑战原有信念的机制,在这种机制里,原有信念以一种能
够被证明是错误的方式接受实证检验。这一特点常常使科学——尤其
是心理学——与所谓的世俗智慧或常识相冲突(正如我们在第1章中所
讨论的)。
可证伪性与世俗智慧
心理学对世俗智慧所提供的安逸感是一种威胁,因为作为一门科
学,它不能安于无法反驳的解释。心理学的目标是对各种行为理论进
行实证检验,以排除其中一些理论。某些世俗智慧表述得很清晰,经
得起实证检验,这当然是心理学所欢迎的,而且其中许多已经被整合
到心理学理论中。然而,心理学并不追求那类事后能解释一切,但事
先无法做出任何预测的解释系统所带来的安逸感。心理学也不接受那
些永远不需改变、代代相传的世俗智慧体系。试图向学生和公众隐瞒
这一点无疑是自毁长城。遗憾的是,一些心理学教师和普及者觉察到
心理学对世俗智慧的威胁给一些人造成了困扰,于是他们有时通过传递一种错误信息来试图安抚这种情绪,这种信息隐含着这样的意
思:“你会学到一些有趣的东西,但别担心,心理学不会挑战那些你
深信不疑的观点。”这是错误的,它对“什么是科学”和“什么是心
理学”都会带来理解上的困惑。心理学致力于构建关于性行为、智
力、犯罪、经济行为、婚姻的作用、儿童养育以及其他很多人们感受
强烈的主题的事实。如果对上述主题的研究没有发现一些令某些人感
到不安的事实,那才奇怪呢!
科学寻求概念上的改变。科学家试图描绘世界的真实面貌,而非
我们原有信念所认为的世界该有的面貌。现代思潮中一个危险的趋势
是,应避免让普罗大众知道世界的本质:一种无知的面纱是必要的,以保护没有能力应对真相的公众。心理学与其他科学一样都反对这样
的观点,即人们需要规避那些让他们感到不适的发现。对于那些希望
自己的信念不受证据挑战的人来说,心理学不是一个“安全空
间”[20]。
承认错误的自由
科学家们发现,可证伪性原则最具解放意义和最有用的一个启示
是,在科学上犯错并不是罪过。哲学家丹尼尔·丹尼特[21]曾说过,科
学的本质就是“在公众面前犯错——在众目睽睽下犯错,希望他人能
够帮助修正这些错误”(p. 380)。当数据与理论不符时,通过对理
论不断进行修正,科学家们最终共同构建起能更好地反映世界本质的
理论。生物学家斯图尔特·法尔斯坦[22]写道,人们通常列出的科学的
支柱——如理性、事实、真相、实验、客观性——常常都缺少一个关
键的支柱。法尔斯坦认为,我们经常忘记的支柱是失败。法尔斯坦所
说的失败,是能让我们从中学到东西的错误。他指的是波普尔派意义
上的错误。确实,法尔斯坦称波普尔为“失败”的哲学家。
事实上,如果我们能在个人层面上使用可证伪性原则,我们日常
生活的质量可能会大为改善。这就是为什么我在本节的第一句话中使
用“解放”一词的原因。它对个人具有特定的含义,因为由这个原则
所引申出来的意义已经超越了科学。如果我们能够明白,当我们的信
念与世界中的证据相冲突时,我们最好是调整信念而不是否认证据和
坚持有问题的想法,那么我们的社会和个人问题就会少得多。想一想,过去有多少次,当你正与某人激烈争论的时候——也许
就是当你给出一次有力的反击来捍卫你的观点之时——你突然意识到
你搞错了某个关键事实或证据?你是怎么做的?你有没有收回前面的
话,向别人承认你的假设是错误的,同时承认别人的解释现在看起来
比你的更合理?或许没有。如果你和大多数人一样,你会不断地进行
合理化。你试图在拒不承认失败的情况下,使自己从争论中全身而
退。你最不可能做的就是承认自己错了。这样一来,你和争论中的另
一方都会更加疑惑,到底哪一种信念更接近真理?如果争论从来没有
公开过(不像科学中那样),如果正确和错误的信念得到同样激烈的
辩护,如果争论的效果不能得到正确的反馈(如本例),那就找不到
适当的机制使信念与现实相吻合了。这就是为什么那么多私人和公开
的对话令人困惑,以及为什么相比所谓的常识或民间智慧,心理科学
在解释人类行为的原因方面更加可靠。
在科学的进程中犯错是正常的,对于科学进步来说,真正的危险
是人类有一种固有的倾向,即避免让我们的信念暴露在可能被证明是
错误的情境之中。许多科学家已经证实了这一观点的重要性。科学家
必须避免这种倾向,诺贝尔奖得主彼得·梅达沃[23]提醒科学家要记
住“一个假设被确信为真的程度,与该假设是否为真无关”(p. 39;
原文为斜体),以此来避免这种倾向。
我们可以这样理解梅达沃的话。喜剧演员斯蒂芬·科尔伯特在
2005年10月17日的节目中,杜撰了“感实性”一词[24]。感实性是
指“内心感到某样东西是真实的,但是没有证据支持”[25]。梅达沃所
说的意思是,科学拒绝感实性。这常常使科学与现代社会格格不入,在现代社会中,感实性比以往任何时候都更为流行。
许多著名的心理学家都遵循了梅达沃的建议:“一个假设被确信
为真的程度,与该假设是否为真无关。”在一篇关于著名实验心理学
家罗伯特·克劳德(Robert Crowder)职业生涯的文章中,他的一位
同事马扎林·巴纳吉(Mahzarin Banaji)被引述说:“他是我认识的
最不维护自己理论的科学家。如果你发现一种方法证明他的理论有漏
洞,或者他的实验结果有局限或缺陷,他会非常高兴,并和你一起计
划如何推翻该理论”[26]。文章作者描述了克劳德如何提出一个叫
作“前分类声音存储器”的记忆成分理论,然后又仔细地设计实验研
究来证伪自己的模型[27]。但是,要让科学发挥作用,一定要让每个科学家都具备证伪的态
度。科学具有揭示世界真知的独特力量,并不是因为科学家具有独特
的美德(如,他们是完全客观的,他们在解释研究结果时从来不带偏
见,等等)。实际上,这种力量的产生是因为易犯错的科学家们沉浸
在一个相互制衡的过程中。在这个过程中,总会有其他科学家提出批
评并清除他们同行的错误。科学的力量并不是因为科学家特别有道
德,而是来自他们不断交叉检查彼此知识和结论的社会过程。
这种交叉检查的社会过程,确实是科学领域的一个与众不同的特
征。的确,在其他生活领域也有许多人强调客观性的价值。但是,没
有任何一个领域像科学一样将如此结构化的交叉检查内置化。相反,在生活的其他领域,自我中心偏见占据了主导地位。自我中心偏见是
一种行为倾向,该倾向使得人们以一种偏向于自身原有信念、观点和
态度的方式来评估证据、提出证据和检验假设[28]。滑稽报纸《洋葱
报》(The Onion)以这样的标题讽刺了自我中心偏见[29]:“儿童举
报,大多数父母虐待儿童!”
自我中心偏见在政治领域很常见。例如,自由派经常谴责保守
派,因为保守派不承认有强烈证据表明人类活动是全球变暖的罪魁祸
首。自由派这样做是有道理的,因为正如我们将在第8章中讨论的,这
一结论的证据是高度聚合的。不过,大多数自由派未能意识到自己已
经落入了自我中心偏见的陷阱,因为他们精心挑选了气候变化这一问
题。在自由派关注的这一问题上,自由派很容易认同科学结论,而保
守派很难同意科学结论。自由派在气候变化问题上对保守派穷追猛
打,但他们没有意识到,保守派也很容易从另一个方向上精心挑选对
自由派不利的话题,他们可以轻而易举地要求自由派接受科学的证据
并得出让自由派不适的结论,例如,智力至少是中度遗传的,或者事
实上女性做相同工作的收入并不比男性少20%(见第6章和第12章)。
自由派和保守派都犯了自我中心偏见的错误。这就是为什么我们需要
科学——因为它的过程,而非其中的个体。科学家并不比任何人更公
正,但他们置身于一个发现错误和交叉检查的过程,而这一点是相对
独特的。
想法不值钱
从前面关于检验世俗智慧的讨论中,我们得出了可证伪性原则的
另一个有趣推论:想法不值钱。更准确地说,我们的意思是,某些类型的想法不值钱。生物学家和科学作家史蒂芬·古尔德[30]对此是这样
阐述的:
15年的每月专栏写作生涯让我收到了非专业人士关于科学方
方面面的海量来信……我发现了常见误解中最为典型的一种。人
们会写信告诉我,他们提出了一种革命性的理论,该理论将拓展
科学的边界。这些理论通常以单倍行距打印在几张纸上,全都是
对最深刻的终极问题的推测——生命的本质是什么?宇宙的起
源?时间的起点?但是,这些想法不值钱。任何智力正常的人都
能在早饭前产生几个这样的想法。科学家们也能够就这些终极问
题提出想法。但我们不这样做(或者说,我们只让它们留在自己
的脑子里),因为我们想不出验证它们的方法,以决定它们是否
正确。从原则上来说,一个看似吸引人但无法被证实或证伪的想
法,对科学来说又有什么价值呢?
古尔德最后一个问题的答案是:“没有任何价值。”古尔德所说
的这些想法是廉价的,也是我们之前在对卡尔·波普尔观点的讨论中
所提到的宏大理论,这些理论是如此包罗万象、复杂而“模糊”,以
至于能够用来解释一切。这种理论的建构更多是为了提供情感支持,因为它们没打算被改变或被抛弃。古尔德告诉我们,这种理论对于科
学目的是无用的,无论它们多么让人感到安慰。科学是一个创造性的
过程,但是这种创造性需要让概念结构与实证数据相符。这并不容易
做到。那些如实解释世界的想法一点儿也不廉价。或许这就是为什么
好的科学理论如此难以获得,而不可证伪的伪科学信念体系无处不在
的原因,因为后者容易建构得多。
事实上,它们是如此容易构建,以至于有一个叫作“糟糕的特设
性假说大赛”(BAH-Fest)的活动,专门颁奖给通过特设性假说和事
先声明而变得不可证伪的最有创意的理论[31]。构建不可证伪理论之所
以很容易,是因为防止理论被证伪的一个万无一失的方法是,在理论
中塞满模糊和难以理解的术语[32]。许多不可证伪的阴谋论(例如,美
国政府蓄意传播艾滋病,或者美国政府事先知道“9·11”恐怖袭击)
都具有这种性质。这就是为什么阴谋论中的信念往往是相互关联的
——如果你相信一个,你就倾向于相信另一个[33]。人们似乎有一种普
遍的倾向,即容易对不可证伪的模糊性着迷。科学中的错误:逼近真理
在解释可证伪性原则的过程中,我们概述了一个简单的科学进步
模型。首先提出理论,从中推导出假设,然后使用各种技术(我们将
在本书余下的部分讨论这些技术)来对假设进行检验。如果假设被实
验证实,该理论就得到了某种程度的确证。如果假设被实验证伪,就
必须对理论做出某种改变,或者以一个新的理论来取代。
当然,这里说科学知识是尝试性的,由理论得出的假设可能是错
误的,并不是说什么都可以拿来检验一番。科学中有很多关系已经被
多次证实,以至于被称为公理,因为它们几乎不可能被未来的实验推
翻。我们不大可能在某一天发现,血液不在静脉和动脉中循环,或者
地球不绕太阳运行。这些众所周知的事实并不是我们一直在讨论的假
设。它们也不是科学家们的兴趣所在,因为它们已经是确定无疑的
了。科学家只对那些处于已知边缘的自然现象感兴趣。对于确定无疑
的事实,他们不感兴趣。
科学实践的这一面——科学家被处于已知边缘的问题所吸引,而
忽视那些已经被充分证实的问题(所谓的公理)——对大众来说很难
理解。科学家们似乎总是更强调未知的事物而非已知事物。的确是这
样,而且科学家有充分的理由这么做。为了推动知识的进步,科学家
们必须身处已知的前沿。当然,这正是事情不确定的地方。但科学正
是通过试图减少知识极限的不确定性而进步的。这常常使科学家在公
众面前显得“不确定”。这种印象是错误的,科学家只是对知识的边
缘不确定,即科学正在取得进步的地方。科学家不会对那些已经被可
重复研究证实的事实不确定。
还需要强调的是,当科学家谈到基于观察证伪了一个理论,或者
用一个新理论替代了被证伪的旧理论时,他们并不是指要将先前用以
建立旧理论的事实完全抛弃(我们会在第8章展开讨论这个话题)。相
反,新理论必须能够解释旧理论能解释的全部事实,再加上旧理论不
能解释的新事实。所以,一种理论被证伪并不意味着科学家们必须从
头开始。复杂的理论不必完全正确,但可以大体正确;信念也不必绝
对为真,但可以逼近真理。科学作家伊萨克·阿西莫夫[34]在一篇题为《错误的相对性》
(The Relativity of Wrong)的文章中很好地阐述了理论修正的过
程,他在文中谈到了我们对地球形状的理解是如何完善的。他首先提
醒我们,不要以为“地球是平的”这一古老信念是愚蠢的,因为在平
原上(第一个有文字的人类文明起源于平原),地球看上去相当平
坦。阿西莫夫敦促我们考虑对不同理论的定量比较可能揭示的信息。
首先,我们可以用地球表面每英里的假设曲率来表述不同的理
论。“地平理论”会说曲率为0度英里。现在我们都知道,这种理论
是错误的。但从某种意义上说,它又很接近真理。正如阿西莫夫[35]所
述:
大约在亚里士多德之后的一个世纪,古希腊哲学家埃拉托斯
特尼(Eratosthenes)注意到,太阳在不同纬度上投射的影子长
度不同(如果地球是平面的,所有的影子应该一样长)。根据影
子的长度差异,他计算出地球球体的大小,并计算出地球的周长
为2.5万英里(1英里= 1.609344千米——译者注)这样一个球体的曲率大
约是0.000126度英里;你可以看到,这个数值非常接近0……从0
到0.000126的这个细微差异,解释了为何我们用了如此长的时间
才放弃“地球是平的”这一观念,并转而相信地球是球体。提醒
你一下,即使是像0和0.000126之间这样细微的差异也是至关重要
的。失之毫厘,谬以千里。如果不考虑这种细微差异,如果不把
地球看作球体而视为平面,我们就不可能准确地绘制出地球上大
片区域的地图。(pp. 39-40)
当然,科学没有止步于“地球是球体”这一理论。正如我们之前
讨论过的,科学家们一直在尝试尽可能地完善他们的理论,并检验现
有知识的局限。例如,牛顿的引力理论预测地球不是完美的球体,这
个预测确实已被证实了。现在已经证明,地球在赤道附近略微凸起,而在两极附近略微扁平。它是一个扁球体。地球从北极到南极的直径
是7900英里,赤道直径则是7927英里。所以,地球的曲率并不是恒定
的(像一个完美的圆球体那样),而是有从每英里7.973英寸到每英里
8.027英寸(1英寸= 2.54厘米——译者注)的微小变化。正如阿西莫
夫[36]所言:“从球体到扁球体的修正比从平面到球体的修正要小得
多。因此,虽然‘地球是球体’这一观念并不正确,但严格地说,它
没有错到‘地球是平面的’那种程度。”阿西莫夫关于地球形状的例子为我们展示了科学家们使用“错
误”(mistake)、“偏差”(error)和“证伪”(falsifie)等术
语的背景。这样的术语并不意味着被检验的理论错得一无是处,而只
是意味着它是未完成的。所以,当科学家强调知识是尝试性的,并且
可能被未来的发现所修正的时候,他们指的就是这样的情形。当科学
家相信地球是球体时,他们也认识到在未来某一天,这个理论在细节
上可能需要修正。无论如何,从球体到扁球体的改变保留了“地球是
球体”这一“大体正确”的观念。我们绝不会在某天醒来突然发现地
球是一个立方体。
临床心理学家斯科特·利连菲尔德[37]将阿西莫夫的观点介绍给心
理学专业的学生:
当向学生解释科学知识本来就是尝试性的、可以被修正的时
候,有些学生可能会错误地认为真正的知识是不存在的。这种观
点在某些后现代主义圈子里非常流行,它忽略了将更确定的知识
主张与不太确定的知识主张区分开来。虽然绝对的肯定在科学中
很可能无法实现,但有一些科学论述,如达尔文的自然选择理
论,已经被极好地证实了。而另一些理论,如支持占星术的理
论,已经遭到了有力的驳斥。还有一些理论,如认知失调理论,仍处在科学争议当中。因此,对科学主张的信心是一个连续体;
有些几乎已经成为事实,而另一些则被完全地证伪了。方法论上
的怀疑主义不能对科学问题给出完全确定的答案(这些答案原则
上可以被新的证据推翻),这一事实并不意味着知识是不存在
的,而只是说这种知识是暂时性的。(p. 49)小结
科学家所说的可解决的问题,通常指的是可检验的理论。可检验
的理论在科学上的定义是非常明确的:它意味着该理论有可能被证
伪。如果一个理论不可证伪,那么它对自然界中的实际事件就没有任
何意义,因此是无用的。心理学一直被不可证伪的理论所困扰,这也
是这一学科发展缓慢的原因之一。
好的理论能够做出具体的预测,而且具有高度的可证伪性。相比
一个不明确的预测,一个明确具体的预测如果得到证实,更能支持该
预测所依据的理论。简言之,可证伪性原则的一个含义就是,并非所
有对理论的验证都具有同样的价值。可证伪性越强、预测越具体的理
论在得到证实之后,越受科学家的青睐。即使预测没有得到证实(比
如它们被证伪了),这种证伪对于理论的发展也是有用的。一个被证
伪的预测说明,原有理论要么应当被抛弃,要么需要加以修改以解释
不数据模式的差异。因此,正是由于被证伪的预测所引发的理论修
正,像心理学这样的科学才能逐步向真理逼近。第3章
操作主义和本质主义:“但是,博
士,这到底是什么意思?”
·学习目标?
3.1 解释为什么科学不回答本质主义问题
3.2 解释为什么心理学需要操作主义来评估理论主张
物理学家真的知道地心引力是什么吗?我的意思是真正。“地心
引力”这个术语的真实含义是什么?它的内在本质是什么?说到地心
引力时,到底指的是什么?如果刨根问底,它究竟是怎么一回事?
诸如此类的问题反映了对科学的一种看法,哲学家波普尔称其
为“本质主义”。本质主义认为,只有从内在本质或者本质属性的角
度对现象做出终极解释的理论,才算得上是好的科学理论。在本章,我们将讨论为什么科学不去回答这种本质主义问题,而是靠对概念进
行操作性定义得以进步的。为什么科学家不是本质主义者
事实上,科学家并不声称要获得本质主义者所追求的那种知识。
对本章开头提出的问题的恰当回答是:物理学家不知道在这个意义上
地心引力是什么。科学并不试图回答关于宇宙的“终极”问题。生物
学家彼得·梅达沃[1]曾写道:“那些科学不能回答,并且在科学发展
的可预见范围之内也不可能得到回答的问题,确实是存在的。这些问
题是孩子们会问的‘终极问题’……我能想到的这样的问题有:万物
是从何开始的?我们来到这个世界是为了什么?生活的意义是什
么?”(p. 66)。
科学家之所以质疑某个人、某个理论或者信念体系为终极问题提
供了绝对答案的说法,一个原因就是他们认为关于“终极”的问题是
无法回答的。科学家并不宣称他们可以提供完美的知识。科学的独特
优势不在于它是一个不会犯错的过程,而在于它提供了一种消除错误
的方法,这些错误是我们知识库的一部分。同时,那些完美或绝对知
识的说法往往会扼杀对知识的探索。因为自由而开放地探索知识是科
学活动的一个前提,科学家们总是对已经找到终极答案的说法持怀疑
态度。
本质主义者喜欢咬文嚼字
本质主义者态度的一个常见迹象是:在开始探求知识之前,过分
关注术语或概念的定义。本质主义者常用的一个口号是:“不过,我
们必须首先定义我们的术语。”“这个理论概念的真正含义是什
么?”这似乎意味着,在一个词被当作某个理论中的概念之前,我们
必须对这个词的使用所涉及的所有潜在语言问题有全面而清晰的理
解。事实上,这与科学家的工作方式正好相反。在研究物质世界之
前,物理学家不会就如何使用“能量”一词展开争论,或者当我们谈
到物质的基本组成时,“粒子”一词是否真正抓住了我们所要表达的
含义的本质。在科学领域中,确定某个概念的意义是在与该术语有关的现象得
到广泛的研究之后,而非研究之前。对概念性术语的修正来自科学过
程所固有的数据和理论之间的相互作用,而不是针对语言用法的争
论。本质主义会让我们陷入无休止的文字游戏之中,而科学家认为,这样的文字游戏使我们脱离了对实质问题的关注。例如,针对“生命
一词的真正含义是什么”这个问题,两个生物学家的回答令人惊
讶:“没有什么真正的含义,它只是一种用法,是为了很好地满足我
们生物学家的工作需要,这并不是争论或辩论的焦点”[2]。简而言
之,科学家的目的是解释现象,而非对措词进行分析。在所有的学科
中,进步的关键都在于放弃本质主义而接受操作主义。这正是本章探
讨的主题。
操作主义者将概念和可观测事件联系在一
起
那么,如果不是来自语言上的讨论,科学概念的含义又来自哪里
呢?恰当使用某一科学概念的标准是什么?为了回答这些问题,我们
必须讨论操作主义。它对于科学领域中的理论建构至关重要,尤其对
评估心理学中的理论主张有重要作用。
尽管操作主义有多种形式,但是对于科学信息的消费者来说,从
最广泛的角度去思考操作主义是最有效的。操作主义就是这样一种思
想:科学理论的概念必须以某种方式建立在可观察事件的基础之上,或与之相关联,而这些可观察事件是可以被测量的。将某个概念与一
个可观察事件相联系,会使这个概念公开化。操作性定义将这个概念
从特定个体的感觉和直觉中分离出来,并允许任何能够实施可测量操
作的人对其进行检验。
例如,把“饥饿”这个概念定义为“我胃里的啃咬感”就不是一
个操作性定义,因为它与“啃咬感”这种个人体验相联系,因此不能
被其他观察者感知到。相比之下,包含可测量的食物剥夺时间或一些
生理指标(如血糖水平)的定义是操作性的,因为它们包含了任何人
都可以进行的可观察的测量。同样,心理学家不能满足于将“焦
虑”定义为“我有时会产生的不适感和紧张感”,而是必须通过调查
问卷和生理指标测量等一系列操作来定义这个概念。前面那个定义仅限于个人对身体状况的解释,他人无法重复。后者将这一概念置于科
学的公共领域。
重要的是要认识到,科学中的概念是由一组操作定义的,而不是
由单个行为事件或任务定义的。相反,几个略有不同的任务和行为事
件被用来聚合于一个概念上(在第8章我们将会更多地讨论聚合性操
作)。例如,教育心理学家根据诸如“伍德库克阅读能力量表”[3]之
类的标准化工具所测得的成绩来定义“阅读能力”这个概念。该量表
包含一整套的任务,其阅读能力总分由几个分量表测得的能力指标组
成。这些分量表测查的技能稍有不同,例如阅读一篇文章、想出一个
合适的单词在文章中填空、写出一个词的同义词、独立拼读一个较难
的词,等等。在所有这些任务上的表现共同定义了“阅读能力”这个
概念。
操作性定义促使我们认真地、实证性地思考(根据对真实世界的
观察)我们希望如何定义一个概念。试想我们要给一个看起来相当简
单的概念“打字能力”下一个操作性定义,这么做是为了比较两种打
字教学方法的优劣。思考一下你必须要做的所有决定。当然,你想要
测量打字速度。但是要打多长的一段文章呢?只有100个词的文章可能
太短,而10000个词的文章又似乎太长。那么到底多长才算好呢?打字
速度要保持多久才能与我们对打字能力这一理论构念的最佳设想相匹
配呢?用什么类型的文章来测试呢?它是否应该包含数字、公式和不
常见的间距?我们如何处理错误?在测量打字能力时,时间和错误似
乎都应被考虑在内,但究竟应该用什么公式将这两个指标结合起来
呢?我们是赋予时间和错误相同的权重,还是一个比另一个更重要?
寻求一个好的操作性定义会迫使你认真考虑所有这些方面;它会让你
对如何将打字能力概念化进行非常透彻的思考。
我们要学会培养对操作性定义的细节进行深究的习惯。认知科学
家丹·莱维丁[4]给我们举了一个倡议团体的例子,该组织声称:在10
~18岁的学生中,70%的人是性活跃的。首先,10~18岁是一个很大的
成熟度范围。而且,从数学的角度看,这么高的百分比意味着年仅10
岁和11岁的青少年中肯定有相当比例的人是性活跃的。这让我们
对“性活动”这一概念是如何被操作化定义的又多了几分好奇。要知
道如何解释这一高比例,我们需要真正深入地探究宣传这一统计数据
的团体究竟是如何定义“性活动”这个概念的——但对此我们将略而
不谈,因为这不是一本限制级的书。畅销书作家迈克尔·刘易斯在他的《思维的发现》(The Undoing
Project)一书中描述了多年前,美国职业篮球联赛(NBA)的休斯敦
火箭队如何试图开发比以往更好的方法来评估一名球员的表现。例
如,他们不是仅仅计算一个球员拿到篮板球的数量,而是用篮板球数
除以篮板球机会的数量(也就是说,他们测量的是成功抢到篮板球的
比例)。他们从统计每场比赛的得分、抢断、篮板球等数据,转为以
每分钟为基础来计算[5]。火箭队想做的实质上是开发出比以前更好、更精细的球员影响力操作性定义。他们的努力表明,更好的操作性定
义通常更加具体。
最后,让我们考虑一下美国食品药品监督管理局(FDA)所面临的
任务,它必须决定对于各种食品来说,什么是“不可接受”水平的污
染,而非“不可避免的缺陷”[6]。像FDA这样的联邦机构不能主观地对
待这些事情。它需要对其检查的每种食物中的污染物作出判断,而这
些判断需要严格的操作性定义。因此,举例来说,它提出了如下的操
作性定义[7]:番茄汁中“不可接受”的污染水平是每100克有10个以上
的苍蝇卵;蘑菇中“不可接受”的污染水平是每100克有5个或更多2毫
米或更长的蛆虫。令人作呕,但值得称赞的是可操作!
信度和效度
在科学中,一个概念的操作化涉及测量,即通过某种规则,用一
个数字来表示某次观察结果。科学作家查尔斯·塞弗[8]指出,一旦我
们开始在测量中使用数字,我们就会突然开始关心它们。他的论点
是,当数字仅仅被用作抽象符号时,数学家之外的人很少关心数字的
性质。我们不关心5这个数字本身。但是,一旦数字5变成5“英镑”、5“美元”、5个“通货膨胀百分点”或5个“IQ得分”(智商),我们
就会突然开始关心起来。塞弗说:“没有单位的数字是虚无缥缈和抽
象的。有了单位,它便获得了意义,但与此同时,它也失去了纯粹
性”(p. 9)。塞弗所说的“失去纯粹性”,是指一旦我们涉及测量
——数字有了单位——我们就突然开始关心数字的“正确”属性了。
从科学的角度来看,什么是一个数字的“正确”属性呢?这个问题的
答案是,在科学中,一个数字应具有的“正确”属性就是信度和效
度。一个概念的操作性定义必须同时具备信度和效度才会有用。信度
是指测量工具的一致性——如果你对同一概念进行多次测评,是否能
够得到相同的测量结果。信度的科学概念很容易理解,因为它非常类
似于一般人对它的定义,也与它的字典定义之一非常相似:“任何总
能产生相同结果的系统所具有的一种属性。”
试想一下,一个外行人会如何评价一件事是否可信呢?想象一个
每天早上要赶公共汽车从新泽西去曼哈顿上班的人。公共汽车每天预
计在上午7:20到达这人等车的站点。在一个星期中,如果公共汽车到
达的时间分别是7:20、7:21、7:20、7:19和7:20,那么我们就会说在
那一周汽车的到达时间是相当可信的。如果下周汽车到达的时间分别
是7:35、7:10、7:45、7:55和7:05,那么我们就会说在那一周汽车的
到达时间是非常不可信的。
对科学中操作性定义的信度进行评估的方式与上述例子基本相
同。如果我们使用一个测量工具对同一概念进行多次测量时得到相似
的数字,那么我们就说该测量工具表现出了较高的信度。如果在同一
周的周一、周三和周五,我们用同一个IQ测验的不同形式测量同一个
人的智力,得到的分数分别是110、109、110,我们会说这个IQ测验是
非常可信的。相反,如果三次测验的分数分别是89、130和105,那么
我们就会说这个IQ测验似乎信度不高。评估不同类型的测量工具的信
度有专门的统计技术,这些内容在所有标准的方法论入门教材中都有
介绍。
但是请记住,信度只与一致性有关,而与其他方面无关。一个操
作性定义只有信度是不够的。信度是一个必要而非充分条件。一个概
念的好的操作性定义还必须是这个概念的有效衡量指标。“结构效
度”这个术语是指一个测量工具(操作性定义)是否测量了它本应测
量的内容。心理学家保罗·考兹比[9]在他所著的方法论教材中,为我
们讲述了一个只有信度而没有效度的幽默例子。假设你想测测自己的
智力,测试者让你伸出脚,放到一个像鞋码器的测量仪器里,然后测
试者给出一个读数。当然,你会认为这是一个笑话。但是请注意,这
个测量工具将表现出方法论教材所讨论的信度类型中的不止一种。这
个仪器在星期一、星期三和星期五会给出几乎相同的读数(称为“重
测信度”),并且无论谁操作它,它都会给出相同的读数(称为“评
分者间信度”)。用鞋码器来测量智力,问题不在于信度(它是有信度的),而在
于效度。它不是所要测量的概念(智力)的一个好的衡量指标。我们
认定它不是智力的有效指标的一种方法是,我们会发现它与许多其他
变量无关,而我们会期望一个智力的指标与这些变量是相关的。鞋码
器的测量结果与学业成就无关,与脑功能的神经生理学指标无关,与
职场成功无关,与认知心理学家提出的信息加工效率的测量指标无
关。相反,实际的智力测验与所有这一切都有关[10]。在心理学领域,真正的智力测量工具同时具有效度和信度,而用鞋码器来测量智力只
有信度而没有效度。
现在,你可能想知道信度和效度的另一种组合方式的情况,所以
让我来重申一下我们的立场。在操作性定义中,我们同时寻求信度和
效度,因此高信度和高效度是我们追求的目标。我们刚刚讨论了鞋码
IQ测验,以证明高信度和低效度对我们没有任何帮助。第三种情况是
低信度和低效度,这显然是无用的,不值得讨论。但是你可能想知道
第四种,也就是最后一种可能的组合方式:如果效度高而信度低呢?
答案是,与低效度和高信度的例子(鞋码器的例子)一样,这种组合
也毫无帮助。事实上,更准确地说,这种情况是不可能的。因为如果
你的测量不可信,你就不能声称测量有效。
当我们试图提出有效的操作性定义时,确切地知道我们要测量什
么概念非常重要。例如,美国职业橄榄球联盟使用一种被称为“传球
者评分”的概念结构来评估四分卫的表现[11]。重要的是要认识到,这
个概念结构被精确地命名为“传球者评分”,也就是说,它并不是四
分卫评分。这是因为“传球者评分”的操作性定义只考虑了传球,而
没有考虑四分卫所做的一切。具体而言,传球者评分是一个数学公
式,包括以下四项内容:传球完成百分比、每次传球尝试的码数、每
次传球尝试的达阵数和每次尝试的抄截数。传球者评分的统计数据不
包括:四分卫获得的冲球码数、呼叫战术能力、胜负记录、擒杀次
数、掉球次数以及其他各种可量化的四分卫变量。出于这个原因,另
一种具有不同操作性定义的概念结构被开发出来,它被称为“总四分
卫评分”。
归根结底,测量的目的是在有意义的背景下解释数字。如果没有
适当的背景,一个简单的数字没有任何意义,甚至具有误导性。数学
教授乔丹·艾伦伯格[12]告诉我们,有一位博主曾警告说,飞机机舱内
的加压空气中含有高浓度的氮气(“有时几乎高达50%”)。这位博主没说的是,地球大气中氮气的天然比例是78%!同样,许多人惊讶地发
现,30多年过去了,美国银行柜员的人数与1980年时一样多。他们很
惊讶自动化并没有让很多柜员丢掉工作。但是自动化已经取代了许多
这样的工作。这个说法(“与1980年时人数相同”)没有考虑到适当
的背景。我们应该考虑到人口自1980年以来增长了40%这一事实。柜员
职位的比例的确下降了,因为事实上,很多这样的职位已被技术所取
代。
脱离适当的背景去解释数字,会产生深远的实际影响。科学作家
吉娜·科拉塔在一篇文章中提到,现在更多的前列腺癌检测结果不明
确的男性会选择主动监测(从几十年前的10%上升到了40%),而不是
放疗或手术[13]。这是因为研究发现,Gleason评分为6分及以下的男
性,在未来10年内死于前列腺癌的概率不到1%。Gleason评分是病理学
家对前列腺细胞恶性程度的评估,分数介于2~10分之间。尽管6分看
起来是个很高的数字,但实际上是细胞能被称为癌细胞的最低分数。
在2~10分的背景下,6分看起来很高,它吓得很多男人去做了手术。
为此,世界卫生组织将Gleason评分中的6分重新命名为1~5级系统中
的第1级[14]。在这个背景下,原来的分数被重新表述得更为准确,它
提示癌症虽然存在,但仍处于早期阶段[15]。
直接和间接的操作性定义
概念与可观测的操作之间的联系,在直接或间接的程度上有很大
差异。很少有科学概念几乎完全是通过真实世界中可观测的操作来定
义的。大部分概念的定义采用更为间接的方式。例如,某些概念的使
用是由一组操作以及特定概念与其他理论构念之间的关系所决定的。
最后,还有一些概念不是通过可观测的操作来直接定义,而是通过它
们与其他概念间的关系来定义的。这种概念有时被称为“潜在构
念”,它们在心理学中很常见。
举例来说,许多研究关注所谓的A型行为模式,因为它与冠心病的
发病率有关[16]。在第8章中,我们将会更加详细地讨论A型行为模式。
但是,这里重点要说的是,A型行为模式实际上是通过一系列二级概念
来定义的,包括强烈的竞争欲望、潜在的敌意、时间紧迫感、完成目
标的强烈驱动力、愤怒等等。然而,每一个用于界定A型行为模式(强烈的竞争欲望、敌意等等)的概念,本身也都需要操作性定义。事实
上,研究者们已经付出了很多努力来对每个概念进行操作性定义。我
们当前讨论的要点是,A型行为模式是一个复杂的概念,它并不是由操
作来直接定义的。相反,它与其他一些各自具有操作性定义的概念联
系在一起。
A型行为模式提供了一个间接操作性定义的例子。临床心理学中一
个用类似方式定义的概念是痛苦耐受性[17]。这个整体概念是由几个更
简单的子构念来定义的,这些子构念与一些操作性的测量指标联系更
为紧密,包括对不确定性的耐受性、对模糊的耐受性、对挫折的耐受
性、对负面情绪的耐受性和对身体不适的耐受性。
简而言之,尽管理论概念与观测之间联系的紧密程度不同,但所
有概念都在一定程度上通过与这些观测之间的联系来获得意义。
科学概念的演进
科学概念的定义并不是固定不变的,而是随着相关观测结果的丰
富而不断变化,认识到这一点非常重要。如果一个概念最初的操作性
定义在理论上是无效的,那么它就会被抛弃,取而代之的是另一组定
义操作。因此,科学中的概念是不断发展的,并且随着相关知识的增
加,其抽象性也会增加。例如,人们曾经认为电子是一个围绕原子核
旋转的带负电的微小球体。现在它被视为在某些实验条件下具有似波
特性的概率密度函数。
在心理学领域,智力概念的发展提供了一个类似的例子。起初,智力仅有一个严格的操作性定义:智力是通过心智功能测验所测到的
东西。随着实证证据的不断积累,智力被证明与学业成就、学习、脑
损伤、神经生理学以及其他行为和生物学变量有关,这一概念也逐渐
得到丰富和完善[18]。现在看来,最好将智力概念化为由几个更具体的
信息加工操作定义的高阶构念。这些假设的加工过程又有更为直接的
操作性定义,用可测量的表现来表述。
人类记忆理论中的概念也有着同样的演进过程。现在,心理学家
很少使用像记忆或遗忘这样的宽泛概念;相反,他们会测量那些定义
更明确的记忆子过程的属性,如短时听觉记忆、图像存储、语义记忆和情景记忆。以前的记忆或遗忘的概念,已被细化为几个具体的操作
性概念。还可以回想一下我们之前关于休斯敦火箭队如何开发并逐渐
完善球员效率测量工具的讨论。
随着科学概念的演进,它们常常与几个不同的理论体系交织在一
起,并且获得不同的操作性定义。这种情况的出现并不意味着概念本
身出了问题。例如,你可能认为像失业率这样的测量指标应该是稳定
而简单的。但如果这样想,你就错了。你在收音机里听到或在报纸上
读到的标准数字,只是经济学家计算失业率的六种方法之一[19]。你经
常在电视上听到的统计数据被称为U3,它将那些没有工作、在过去四
周积极寻找工作、并且现在就可以工作的人归为失业者。在另一种被
称为U1的计算方法中,只有失业15周或更长时间的人才被称为失业
者。因为这个定义比U3更严格,用它计算出的失业率低于U3所表示的
失业率。U6与U1处于相反的极端。U6比U3多了以下几种类型:怯志工
作者(不积极寻找工作的人)、希望寻求全职工作的兼职工作者以及
处于边际状态的人。因此,U6代表的失业率总是高于U3,比U1更是高
得多。此外,还有三个与U1、U3和U6略有不同的计算方法,它们得出
的失业率也多少有些不同。它们都是失业率这一概念的可选操作性定
义。
尽管在其他学科中,概念也常常有多个不同的操作性定义,比如
像失业率这样的例子,但许多人仍然因为心理学中的许多重要理论构
念有不止一种操作化和概念化的方式而认为心理学不可信。这种情形
并非心理学所独有,也不是一件令人绝望或束手无策的事情。事实
上,这种情况在科学领域是普遍存在的。例如,“热”可以从热力学
和动力学两个理论角度来概念化。物理学并未因此遭到贬斥。类似
地,想想电子,它的许多属性可以用波的概念来解释。然而,如果将
其视为粒子,则另一些属性更好掌握。到目前为止,这些替代概念的
存在并没有诱使任何人提出放弃物理学。
2006年,人们在这一点上有了深刻的认识。当时媒体报道国际天
文联合会(International Astronomical Union)对“行星”一词重
新进行了操作化定义,这种定义方式将冥王星排除在行星之外[20]。
对“行星”这样看似基础的概念都会有不同的看法,确实让公众大吃
一惊,但事实上,这在科学领域是司空见惯的。在行星的定义上,一
组天文学家倾向于强调天体的地质构成,而另一组则强调行星的动力
属性,例如它们的轨道和引力效应。在前一组天文学家的操作性定义
中,冥王星是行星,而在后一组天文学家的操作性定义中,冥王星则被排除在外[21]。根据这个操作性定义,天体需要满足三个条件才能被
称为行星:天体必须绕太阳运转,必须近似球体,以及必须“清除邻
近区域”(这意味着通过推开较小的天体或者把它们变成卫星来控制
自身的轨道)。冥王星不符合最后一个条件(尽管它确实符合前两
个)。因此,它被降级为“矮行星”。这些有争议和分歧的操作性定
义,反映的不是天文学界的混乱,它们只是反映了该学科从不同角度
定义概念的方式。在心理学中也是如此,有时概念有多个可选择的操
作性定义。有些事物难以定义并不意味着没有真实的东西可以研究。心理学中的操作性定义
许多人在想到物理学或化学时,能够理解操作主义的必要性。他
们知道,如果科学家要讨论某一类型的化学反应、能量或者磁场,就
必须有相应的方法来测量这些东西。遗憾的是,当人们想到或谈到心
理学时,却经常无法认识到操作主义的必要性。心理学术语必须有直
接或间接的操作性定义,才能成为科学理论中有用的解释性构念。这
为什么不是显而易见的呢?
原因之一是心理学中所说的“预设偏见问题”。这个问题是这样
的:人们在研究地质学时,不会对岩石的性质带着具有感情色彩的信
念,而在心理学中,情况就大为不同了。纽约大学心理学教授伊丽莎
白·菲尔普斯[22]曾开玩笑说,她的母亲是一位海洋生物学家,从来没
有非科学界的朋友告诉过她,她对河口污染物的研究“没有意义”,但似乎每个人都对菲尔普斯关于记忆和决策偏差的研究有自己的看
法。
我们每个人都有关于人格和人类行为的直觉理论,因为我们在生
活中一直在向自己“解释”自己和他人的行为。我们所有的个人心理
学理论中都包含着理论概念(例如聪明、攻击和焦虑)。心理学中的
许多专业概念都是用日常语言中的词汇命名的,这是误解产生的最大
根源之一,也是在媒体上准确地呈现心理学发现的最大障碍之一。这
种日常用法为各种各样的误解敞开了大门。外行人很少意识到,当心
理学家把“智力”“焦虑”“攻击”“依恋”等词语用作理论构念
时,他们所指的含义不一定与大众使用这些词汇时的含义相同。
从之前关于操作主义的讨论中就能明显看出这种区别的本质。当
在心理学理论中使用诸如“智力”“焦虑”等术语时,它们直接或间
接的操作性定义决定着它们的正确用法。这些定义常常是高度技术性
的,通常相当具体,并且常常在许多方面与流行的用法不同。例如,当听到“对大量认知任务进行因素分析所得到的第一个主成分”这个
短语时,许多人都不会意识到它是“智力”这一术语的操作性定义的 ......
您现在查看是摘要介绍页, 详见PDF附件(3319KB,342页)。