魔鬼数学在线.pdf
http://www.100md.com
2021年2月24日
![]() |
| 第1页 |
![]() |
| 第7页 |
![]() |
| 第12页 |
![]() |
| 第24页 |
![]() |
| 第36页 |
![]() |
| 第269页 |
参见附件(6178KB,494页)。
如果你是一个有“数学焦虑症”的人,你可能不会相信有一天你会爱上数学。

内容简介
原因在于,我们在学校所学的数学知识看上去不过是一堆沉闷的规则、定律和公理,都是前人传下来的,而且是不容置疑的。在《魔鬼数学》中,世界知名数学家乔丹?艾伦伯格告诉我们这样的认识是错误的。数学与我们所做的每一件事都息息相关,可以帮助我们洞见在混沌和嘈杂的表象之下日常生活的隐性结构和秩序。数学是一门告诉我们“如何做才不会犯错”的科学,是经年累月的努力、争论所锤炼出来的。
你应该提前多长时间到达机场?民意调查的结果真的能代表人们的意愿吗?为什么父母都是高个子,孩子的身高却比较矮?用什么策略买彩票才能中大奖?《魔鬼数学》运用数学方法分析和解决了很多的日常生活问题,帮助数学门外汉习得用数学思维思考问题的技能。
作者用数学这条主线穿起了时空,从每时每刻到宇宙空间,中间还穿插了很多人和事物,比如棒球、里根经济学、伏尔泰、意大利文艺复兴时期的绘画、人造语言等。
《魔鬼数学》带领我们踏上了一段精彩绝伦的数学思维之旅,旅行过后,相信你可以成为一个更棒的思考者。作者从历史及最近的理论发展中汲取精华,向我们展示了数学知识的魅力和力量。数学可以让我们更好地思考:它可以磨练我们的直觉,让我们的判断更敏锐,它还可以驯服不确定性,让我们更深入地了解世界的结构和逻辑。
拥有了数学工具,我们就可以把那些我们想当然的事情看得更透彻,从而做出正确的决策。
作者简介
乔丹·艾伦伯格(Jordan Ellenberg) 美国威斯康星大学数学系教授。他在世界范围内发表他的关于数论研究的演讲,并于2013年在世界最大的数学会议——数学联合会议上做主题演讲。他的文章主要发表在《连线》《纽约时报》《华盛顿邮报》《华尔街日报》《波士顿环球报》等 媒体上,他还为《石板》杂志写作“Do the Math”专栏文章,十分受欢迎。
魔鬼数学预览






目录
引 言 数学知识什么时候能派上用场呢?//IX
第一部分 线性
第1章 要不要学习瑞典模式?//003
“巫术”经济学与拉弗曲线//006
第2章 不是所有的线都是直线//013
穷竭法与圆的面积//013
微积分与牛顿//020
永远无法到达的冰激凌商店//022
第3章 到2048 年,人人都是胖子?//031
学生应该从数学课上学些什么?//036
关于肥胖问题的荒谬研究//039
第4章 触目惊心的数字游戏//043
抛硬币与法国警察的帽子//048
评判暴行的数学方法//054
第5章 比盘子还大的饼状图//057
第二部分 推理
第6章 圣经密码与股市预测//069
选股必涨的巴尔的摩股票经纪人//075
那些古老预言的真相//079
第7章 大西洋鲑鱼不会读心术//083
代数为什么那么难学?//085
推翻零假设//090
并不显著的显著性//096
篮球比赛中真的存在“手热效应”吗? //100
第8章 美丽又神秘的随机性//109
精彩原文在线
第2章 不是所有的线都是直线 即使数学专业人士不告诉我们,我们可能也不会认为所有的线都 是直线。但是线性推理却无处不在,只要你认为“某个东西有价值, 因此多多益善”,就是一种线性推理。这也是叫嚣的政客们惯用的伎 俩:“你们支持对伊朗采取军事行动吧?我想,任何国家胆敢在我们 面前放肆的话,你们都会希望对他们发起地面进攻!”还有的政客则 处于另一个极端:“要与伊朗开战吗?你们可能认为阿道夫·希特勒 也被误解了。” 只要稍加思考,我们立刻就能发现这种推理是错误的,但是,为 什么有那么多人会犯这种错误呢?毫无疑问,并不是所有的线都是直 线,但是为什么有人会持相反的错误观点呢?即使他们很快醒悟并改 正过来,这样的错误也是难以想象的。 原因之一就在于,从某种意义上看,所有的线的确都是直线。让 我们从阿基米德(Archimedes)谈起。在现代,这是一个非常普通的问题,在SAT(学术能力评估测试) 中出现这样的题目也无可厚非。圆的面积是πr2,在本例中,半径r为 1,因此,圆的面积就是π。但是,在2000年前,人们苦苦思索却不得 其解,这个问题引起了阿基米德的注意。 这个问题的难点在哪儿呢?一方面,我们认为π是一个数字,而 古希腊人却认为只有1、2、3、4……这些用来计数的整数才是数字。 不过,古希腊几何学的第一个伟大成就——勾股定理[1],却突破了他 们的这个数字系统勾股定理告诉我们,直角三角形斜边(上图中倾斜的边,与直角 没有接触)的平方是其余两边(直角边)的平方和。在本图中,根据 勾股定理,斜边的平方为 ,而且斜边比1长、比2短(这 个无须任何定理,目测就可以确定)。至于斜边的长度不是整数,这 对古希腊人来说不是问题。也许,我们使用的测量单位是不正确的 吧。如果我们设定直角边的长度是5个单位,我们就可以用直尺量出斜 边的长度约为7个单位。因为斜边的平方是:公元前5世纪,毕达哥拉斯的一位门徒发现了一个令人震惊的现 象:等腰三角形的三条边长不可能都是整数。现代人都知道“2的平方 根是无理数”,也就是说这个数不是任何两个整数的比,但是,当时 的那些学者并不知道。他们能有什么办法呢?他们的数量概念是建立 在整数的基础上的。因此,在他们看来,直角三角形斜边的长度根本 不是一个数字。 这个发现引起了轩然大波。要知道,毕达哥拉斯的这些门徒非常 怪异,他们的人生哲学一片混沌,在我们现代人看来,就是数学、宗 教与精神病构成的大杂烩。在他们眼中,奇数是吉利的,而偶数则是 邪恶的。他们认为在太阳的另外一边还有一个与地球一模一样的星 球,即“反地球”(Antichthon)。某些记载表明,他们认为吃蚕豆 是不道德的,因为人死之后,灵魂会寄存在蚕豆中。据说,毕达哥拉 斯本身可以与牲畜交谈(他告诉牲畜不要吃蚕豆),也是为数不多的 穿裤子的古希腊人之一。
魔鬼数学在线截图






魔鬼数学
——大数据时代,数学思维的力量
[美] 乔丹·艾伦伯格 著
胡小锐 译
中信出版社献给坦妮娅(Tanya)学习数学的精髓时不能只抱着应付差事的心理,而应该把这些知识融入日常思维,并通过各种激励手
段使它们反复出现在你的脑海里。
——伯特兰·罗素(Bertrand Russell),《数学研究》(The Study of Mathematics)目录
引言 数学知识什么时候能派上用场呢?
第一部分 线性
第1章 要不要学习瑞典模式?
第2章 不是所有的线都是直线
第3章 到2048年,人人都是胖子?
第4章 触目惊心的数字游戏
第5章 比盘子还大的饼状图
第二部分 推理
第6章 圣经密码与股市预测
第7章 大西洋鲑鱼不会读心术
第8章 美丽又神秘的随机性
第9章 肠卜术与科学研究
第10章 大数据与精准预测
第三部分 期望值
第11章 中彩票大奖与期望值理论
第12章 效用理论、风险与不确定性
第13章 祝你下一张彩票中大奖!
第四部分 回归
第14章 我们为什么无法拒绝平庸?第15章 父母高,孩子不一定也高
第16章 因为患了肺癌你才吸烟的吗?
第五部分 存在
第17章 所谓民意,纯属子虚乌有
第18章 一个凭空创造出来的新奇世界
结语 如何做出正确的决策?
致谢
版权页引言
数学知识什么时候能派上用场呢?
在地球上某个地方的一间教室里,一位数学老师布置了30道定积分
练习题作为学生的周末作业。要做完这些题,肯定需要花费大量时间,因此,一名学生大声地表达了自己的疑惑。
这名学生的兴趣非常广泛,但是她对做数学题几乎没有任何兴趣。
她自己也清楚这一点,因为上个周末,她就花了好多时间完成另外30道
(其实没有多大区别的)定积分练习题。她看不出做这些题有什么意
义,于是与老师进行了交流。交流过程中,这名学生准备提问老师最不
愿意回答的问题:“这些知识我什么时候能用上呢?”
这位老师很可能会这样回答:“我知道这些题目非常枯燥,可是你
别忘了,你还不知道自己将来会选择什么样的职业。现在,你看不到这
些知识与你有什么关系,但是你将来从事的职业有可能非常需要这些知
识,所以你应该快速准确地完成这些定积分练习题。”
师生两人都知道这其实是一个谎言,而且学生通常不会对这样的回
答感到满意,毕竟,即使有的成年人可能会用到积分、(1–3x+4x2)–
2dx、余弦公式或者多项式除法等知识,人数也屈指可数。
这个回答就连老师也不会满意。我对于这一点很有发言权,因为在
我多年担任数学老师的时光里,我就为成百上千的大学生布置过很多定
积分练习题。
值得庆幸的是,对于这个问题,我们能找到一个更好的答案:“尽管一些数学课程会要求你完成一道又一道计算题,让你觉得这
些机械的计算过程不榨干你的所有耐心与精力就不会罢休,但事实并非
如此。学习数学必须计算这些定积分题,就像足球运动员需要接受举重
与韧性训练。如果你希望踢好足球(我是指抱着一种认真的态度,达到
竞技水平),就必须接受大量枯燥、重复、看似毫无意义的训练。职业
足球运动员在比赛时会用到这些训练内容吗?不会的,我们从未在赛场
上看到有足球运动员举杠铃或者在交通锥之间穿梭前行。但是,我们肯
定会看到他们应用力量、速度、观察力与柔韧性,而要提高这些能力,他们必须常年接受枯燥乏味的训练。可以说,这些训练内容是足球运动
的一个组成部分。
“如果你选择足球作为谋生手段或者希望加入校队,你就别无选
择,只能利用周末时间,在训练场上接受大量枯燥乏味的训练。当然,如果你觉得自己无法接受这样的训练,你仍然可以踢足球,只不过是和
朋友们一起踢,纯粹以娱乐为目的。我们也有可能穿过防守队员的防线
完成华丽的传球,或者像职业运动员那样起脚远射得分,并为此激动不
已。此外,踢足球还能强健体魄,愉悦心情。与坐在家里观看职业比赛
的电视转播相比,效果要好得多。
“数学与足球非常相似。你的就业目标可能与数学没有相关性,这
很正常,大多数人的情况都是这样。但是,你仍然可以运用数学知识,甚至你手头正在做的事情有可能就用到了数学知识,只不过你自己不知
道。数学与逻辑推理紧密地交织在一起,可以增强我们处理事务的能
力。掌握了数学知识,就像戴了一副X射线眼镜一样,我们可以透过现实
世界错综复杂的表面现象,看清其本质。多少个世纪以来,由于人们辛
勤钻研、反复辩论,数学的各种公式与定理已经得到了千锤百炼,可以
帮助我们在处理事务时避免犯错。利用数学这个工具,我们可以更深
入、更准确地理解我们这个世界,而且可以取得更有意义的成果。我们
需要做的就是找到一位良师或者一本好书,引导我们学习数学中的一些
规则和基本方法。现在,我愿意担任这样的指导老师,告诉你如何实现
这个目的。”其实,由于时间关系,我在上课时基本不会这样长篇累牍地解释这
个问题。但是在写书时,我可以稍微展开一些。我要告诉你,我们每天
考虑的那些问题,包括政治、医药、商业、宗教等方面的问题,都与数
学有着不可分割的联系。我希望这个事实有助于你接受我上文中介绍的
那个重要观点。同时,了解这个观点还可以帮助你培养更敏锐的洞察
力。
不过,如果那名学生非常精明,即使我真的在课堂上苦口婆心地劝
导,她仍然会心存疑惑。
“老师,你的话听起来很有道理。”她会说,“但是,太抽象了。
你刚才说掌握了数学知识之后,本来有可能做错的事,现在不会出错
了。但是,哪些事情会是这样的呢?能不能举一个真实的例子?”
这时候,我会给她讲亚伯拉罕·瓦尔德(Abraham Wald)与失踪的
弹孔这个故事。
亚伯拉罕·瓦尔德与失踪的弹孔
同很多的“二战”故事一样,这个故事讲述的也是纳粹将一名犹太
人赶出欧洲,最后又为这一行为追悔莫及。1902年,亚伯拉罕·瓦尔德
出生于当时的克劳森堡,隶属奥匈帝国。瓦尔德十几岁时,正赶上第一
次世界大战爆发,随后,他的家乡更名为克鲁日,隶属罗马尼亚。瓦尔
德的祖父是一位拉比,父亲是一位面包师,信奉犹太教。瓦尔德是一位
天生的数学家,凭借出众的数学天赋,他被维也纳大学录取。上大学期
间,他对集合论与度量空间产生了深厚的兴趣。即使在理论数学中,集
合论与度量空间也算得上是极为抽象、晦涩难懂的两门课程。
但是,在瓦尔德于20世纪30年代中叶完成学业时,奥地利的经济正
处于一个非常困难的时期,因此外国人根本没有机会在维也纳的大学中
任教。不过,奥斯卡·摩根斯特恩(Oskar Morgenstern)给了瓦尔德一份工作,帮他摆脱了困境。摩根斯特恩后来移民美国,并与人合作创立
了博弈论。1933年时,摩根斯特恩还是奥地利经济研究院的院长。他聘
请瓦尔德做与数学相关的一些零活儿,所付的薪水比较微薄。然而,这
份工作却为瓦尔德带来了转机,他进入了考尔斯经济委员会(该经济研
究院当时位于科罗拉多州的斯普林斯市)。尽管政治气候越发糟糕,但
是瓦尔德并不愿意彻底放弃理论数学的研究。纳粹攻克奥地利,让瓦尔
德更加坚定了这一决心。在科罗拉多就职几个月之后,他得到了在哥伦
比亚大学担任统计学教授的机会。于是,他再一次收拾行装,搬到了纽
约。
从此以后,他被卷入了战争。
在第二次世界大战的大部分时间里,瓦尔德都在哥伦比亚大学的统
计研究小组(SRG)中工作。统计研究小组是一个秘密计划的产物,它的
任务是组织美国的统计学家为“二战”服务。这个秘密计划与曼哈顿计
划(Manhattan Project)[1]有点儿相似,不过所研发的武器不是炸
药,而是各种方程式。事实上,统计研究小组的工作地点就在曼哈顿晨
边高地西118街401号,距离哥伦比亚大学仅一个街区。如今,这栋建筑
是哥伦比亚大学的教工公寓,另外还有一些医生在大楼中办公,但是在
1943年,它是“二战”时期高速运行的数学中枢神经。在哥伦比亚大学
应用数学小组的办公室里,很多年轻的女士正低着头,利用“马前特”
桌面计算器计算最有利于战斗机瞄准具锁定敌机的飞行曲线公式。在另
一间办公室里,来自普林斯顿大学的几名研究人员正在研究战略轰炸规
程,与其一墙之隔的就是哥伦比亚大学统计研究小组的办公室。
但是,在所有小组中,统计研究小组的权限最大,影响力也最大。
他们一方面像一个学术部门一样,从事高强度的开放式智力活动,另一
方面他们都清楚自己从事的工作具有极高的风险性。统计研究小组组长
艾伦·沃利斯(W. Allen Wallis)回忆说:“我们提出建议后,其他部
门通常就会采取某些行动。战斗机飞行员会根据杰克·沃尔福威茨
(Jack Wolfowitz)的建议为机枪混装弹药,然后投入战斗。他们有可能胜利返回,也有可能再也回不来。海军按照亚伯·基尔希克(Abe
Girshick)的抽样检验计划,为飞机携带的火箭填装燃料。这些火箭爆
炸后有可能会摧毁我们的飞机,把我们的飞行员杀死,也有可能命中敌
机,干掉敌人。”
数学人才的调用取决于任务的重要程度。用沃利斯的话说,“在组
建统计研究小组时,不仅考虑了人数,还考虑了成员的水平,所选调的
统计人员都是最杰出的。”在这些成员中,有弗雷德里克·莫斯特勒
(Frederick Mosteller),他后来为哈佛大学组建了统计系;还有伦纳
德·萨维奇(Leonard Jimmie Savage)[2],他是决策理论的先驱和贝
叶斯定理的杰出倡导者。麻省理工学院的数学家、控制论的创始人诺伯
特·维纳(Norbert Wiener)也经常参加小组活动。在这个小组中,米
尔顿·弗里德曼(Milton Friedman)这位后来的诺贝尔经济学奖得主只
能算第四聪明的人。
小组中天赋最高的当属亚伯拉罕·瓦尔德。瓦尔德是艾伦·沃利斯
在哥伦比亚大学就读时的老师,在小组中是数学权威。但是在当时,瓦
尔德还是一名“敌国侨民”,因此他被禁止阅读他自己完成的机密报
告。统计研究小组流传着一个笑话:瓦尔德在用便笺簿写报告时,每写
一页,秘书就会把那页纸从他手上拿走。从某些方面看,瓦尔德并不适
合待在这个小组里,他的研究兴趣一直偏重于抽象理论,与实际应用相
去甚远。但是,他干劲儿十足,渴望在坐标轴上表现自己的聪明才智。
在你有了一个模糊不清的概念,想要把它变成明确无误的数学语言时,你肯定希望可以得到瓦尔德的帮助。
于是,问题来了。我们不希望自己的飞机被敌人的战斗机击落,因
此我们要为飞机披上装甲。但是,装甲会增加飞机的重量,这样,飞机
的机动性就会减弱,还会消耗更多的燃油。防御过度并不可取,但是防
御不足又会带来问题。在这两个极端之间,有一个最优方案。军方把一
群数学家聚拢在纽约市的一个公寓中,就是想找出这个最优方案。军方为统计研究小组提供了一些可能用得上的数据。美军飞机在欧
洲上空与敌机交火后返回基地时,飞机上会留有弹孔。但是,这些弹孔
分布得并不均匀,机身上的弹孔比引擎上的多。
军官们认为,如果把装甲集中装在飞机最需要防护、受攻击概率最
高的部位,那么即使减少装甲总量,对飞机的防护作用也不会减弱。因
此,他们认为这样的做法可以提高防御效率。但是,这些部位到底需要
增加多少装甲呢?他们找到瓦尔德,希望得到这个问题的答案。但是,瓦尔德给出的回答并不是他们预期的答案。
瓦尔德说,需要加装装甲的地方不应该是留有弹孔的部位,而应该
是没有弹孔的地方,也就是飞机的引擎。
瓦尔德的独到见解可以概括为一个问题:飞机各部位受到损坏的概
率应该是均等的,但是引擎罩上的弹孔却比其余部位少,那些失踪的弹
孔在哪儿呢?瓦尔德深信,这些弹孔应该都在那些未能返航的飞机上。
胜利返航的飞机引擎上的弹孔比较少,其原因是引擎被击中的飞机未能
返航。大量飞机在机身被打得千疮百孔的情况下仍能返回基地,这个事
实充分说明机身可以经受住打击(因此无须加装装甲)。如果去医院的
病房看看,就会发现腿部受创的病人比胸部中弹的病人多,其原因不在
于胸部中弹的人少,而是胸部中弹后难以存活。
数学上经常假设某些变量的值为0,这个方法可以清楚地解释我们讨
论的这个问题。在这个问题中,相关的变量就是飞机在引擎被击中后不
会坠落的概率。假设这个概率为零,表明只要引擎被击中一次,飞机就会坠落。那么,我们会得到什么样的数据呢?我们会发现,在胜利返航
的飞机中,机翼、机身与机头都留有弹孔,但是引擎上却一个弹孔也找
不到。对于这个现象,军方有可能得出两种分析结果:要么德军的子弹
打中了飞机的各个部位,却没有打到引擎;要么引擎就是飞机的死穴。
这两种分析都可以解释这些数据,而第二种更有道理。因此,需要加装
装甲的是没有弹孔的那些部位。
美军将瓦尔德的建议迅速付诸实施,我无法准确地说出这条建议到
底挽救了多少架美军战机,但是数据统计小组在军方的继任者们精于数
据统计,一定很清楚这方面的情况。美国国防部一直认为,打赢战争不
能仅靠更勇敢、更自由和受到上帝更多的青睐。如果被击落的飞机比对
方少5%,消耗的油料低5%,步兵的给养多5%,而所付出的成本仅为对方
的95%,往往就会成为胜利方。这个理念不是战争题材的电影要表现的主
题,而是战争的真实写照,其中的每一个环节都要用到数学知识。
瓦尔德拥有的空战知识、对空战的理解都远不及美军军官,但他却
能看到军官们无法看到的问题,这是为什么呢?根本原因是瓦尔德在数
学研究过程中养成的思维习惯。从事数学研究的人经常会询问:“你的
假设是什么?这些假设合理吗?”这样的问题令人厌烦,但有时却富有
成效。在这个例子中,军官们在不经意间做出了一个假设:返航飞机是
所有飞机的随机样本。如果这个假设真的成立,我们仅依据幸存飞机上
的弹孔分布情况就可以得出结论。但是,一旦认识到自己做出了这样的
假设,我们立刻就会知道这个假设根本不成立,因为我们没有理由认
为,无论飞机的哪个部位被击中,幸存的可能性是一样的。用数学语言
来说,飞机幸存的概率与弹孔的位置具有相关性,相关性这个术语我们
将在第15章讨论。
瓦尔德的另一个长处在于他对抽象问题研究的钟爱。曾经在哥伦比
亚大学师从瓦尔德的沃尔福威茨说,瓦尔德最喜欢钻研的“都是那些极
为抽象的问题”,“对于数学他总是津津乐道,但却对数学的推广及特
殊应用不感兴趣”。的确,瓦尔德的性格决定了他不大可能关注应用方面的问题。在他
的眼中,飞机与枪炮的具体细节都是花里胡哨的表象,不值得过分关
注。他所关心的是,透过这些表象看清搭建这些实体的一个个数学原理
与概念。这种方法有时会导致我们对问题的重要特征视而不见,却有助
于我们透过纷繁复杂的表象,看到所有问题共有的基本框架。因此,即
使在你几乎一无所知的领域,它也会给你带来极有价值的体验。
对于数学家而言,导致弹孔问题的是一种叫作“幸存者偏差”
(survivorship bias)的现象。这种现象几乎在所有的环境条件下都存
在,一旦我们像瓦尔德那样熟悉它,在我们的眼中它就无所遁形。
以共同基金为例。在判断基金的收益率时,我们都会小心谨慎,唯
恐有一丝一毫的错误。年均增长率发生1%的变化,甚至就可以决定该基
金到底是有价值的金融资产还是疲软产品。晨星公司大盘混合型基金的
投资对象是可以大致决定标准普尔500指数走势的大公司,似乎都是有价
值的金融资产。这类基金1995~2004年增长了178.4%,年均增长率为
10.8%,这是一个令人满意的增长速度[4]。如果手头有钱,投资这类基
金的前景似乎不错,不是吗?
事实并非如此。博学资本管理公司于2006年完成的一项研究,对上
述数字进行了更加冷静、客观的分析。我们回过头来,看看晨星公司是
如何得到这些数字的。2004年,他们把所有的基金都归为大盘混合型,然后分析过去10年间这些基金的增长情况。
但是,当时还不存在的基金并没有被统计进去。共同基金不会一直
存在,有的会蓬勃发展,有的则走向消亡。总体来说,消亡的都是不赚
钱的基金。因此,根据10年后仍然存在的共同基金判断10年间共同基金
的价值,这样的做法就如同通过计算成功返航飞机上的弹孔数来判断飞
行员躲避攻击操作的有效性,都是不合理的。如果我们在每架飞机上找
到的弹孔数都不超过一个,这意味着什么呢?这并不表明美军飞行员都
是躲避敌军攻击的高手,而说明飞机中弹两次就会着火坠落。博学资本的研究表明,如果在计算收益率时把那些已经消亡的基金
包含在内,总收益率就会降到134.5%,年均收益率就是非常一般的
8.9%。《金融评论》(Review of Finance)于2011年针对近5 000只基
金进行的一项综合性研究表明,与将已经消亡的基金包括在内的所有基
金相比,仍然存在的2 641只基金的收益率要高出20%。幸存者效应的影
响力可能令投资者大为吃惊,但是亚伯拉罕·瓦尔德对此已经习以为常
了。
数学是常识的衍生物
年轻的读者朋友看到这里,可能会问我:哪里能用得上数学知识
啊?的确,瓦尔德是一位数学家,他在解决弹孔问题时也表现得很睿
智,但是这跟数学有关系吗?他们产生这样的疑问是有道理的。在瓦尔
德的回答里,我们没有看到三角恒等式和积分,也看不到任何不等式和
公式。
其实,瓦尔德真的用到了某些公式。但是,我在讲述这个故事时把
这些公式略去了,因为我现在写的这个部分仅仅是本书的引言部分。在
为一名幼童介绍人类繁衍问题的书中,引言部分显然不能详细地告诉他
们婴儿是如何进入妈妈的肚子的。我们很可能会这样说:“自然界中的
所有东西都会变化。到了秋天,树会落叶,等到了春天,它们又会变得
郁郁葱葱。蛹里的幼虫在破茧而出后会变成五彩斑斓的蝴蝶,你也是自
然界的一部分,因此……”
因此,我在引言部分采用了同样的方法。
然而,我们毕竟都是成年人了,所以,我稍稍偏离主题,从瓦尔德
的真实报告中抽取一页让大家看看。……可以得出 的下限。在这里,我们假设由 减少至
时,上下两端的极限值是确定的。因此,我们可以得出 的上限和
下限。
上述表达式难以求出具体的解,但是在i
列步骤得出 的上限和下限的近似值。所采用的假定数据集为
条件A满足,因为通过替换希望大家看完之后不会头晕眼花。
瓦尔德的独到见解其实根本不需要以上述形式表达。我们没有用到
任何数学概念,也可以把这个问题解释得一清二楚。因此,学生们提出
的问题确实有道理。数学到底是什么?仅仅是一些常识性的东西吗?
是的,数学就是一些常识。从某个基础层面看,这是毫无疑问的。
你有5件物品,再加上7件,跟你有7件物品再加上5件,结果毫无区别,你能解释这是为什么吗?你无法解释,因为在思考把不同的物品合并到
一起的问题时,我们就是这样做的。数学家们经常会就常识已经了解的
现象给出不同的名称。我们不会说“把这些物品加上那些物品,与把那
些物品加上这些物品,结果是相同的”,而会说“加法具有交换性”。
由于我们青睐各种数学符号,因此我们有时会这样写:
对于任意的a与b,有a+b=b+a。
尽管这样的公式看上去过于正式,但实际上我们所讨论的内容是每
个孩子都清楚的事实。
乘法的情况稍有不同,但下面这个公式看上去与上面的公式非常相
似:
对于任意的a与b,有a×b=b×a。
这个句子所表达的意思不像加法交换律那样,让人一看立刻就会
说:“是啊。”
两个6件套的物品与6个两件套的物品总数相等,这是一种“常识”
吗?也许算不上常识,却可以变成一种常识。在我刚学数学时发生的一
件事,让我至今记忆犹新。我那时大约6岁,我躺在父母房间的地板上,脸贴着长绒地毯,眼睛盯着房间里的立体声音响,音响播放的可能是甲
壳虫乐队的蓝版专辑(Blue Album)第二面的歌曲。在20世纪70年代,立体声音响都有刨花板做的面板,在侧面凿有气孔。这些气孔排列成矩
形,每行有8个,每列有6个。我平躺在那儿,看着这些气孔——6行8
列。我一边上下左右打量着这些气孔,一边翻来覆去地琢磨:6行,每行
8个孔;8列,每列6个孔。
突然,我明白了:每列6个、共8列,与每行8个、共6行的总数一样
多。没有人告诉我这个规律,但我知道结果就是这样。因为无论你怎么
数,气孔的数量都不变。
我父母的立体声音响,1977年
我们在教授数学时,往往会告诉学生们很多法则。学生们按部就班
地学习这些法则,而且必须按照老师的指示来学习,否则就会得C–。其实,他们所学的并不能被称为数学,数学研究的应该是事物的某些必然
规律。
坦率地说,并不是所有的数学知识都像加法、乘法那样,凭直觉就
能轻而易举地掌握。比如,我们不能借助常识来学习微积分。但是,即
使是微积分,也是由常识演变而来的。艾萨克·牛顿(Isaac Newton)
将我们对直线运动物体的物理直觉加以整理,把它变成一种形式主义的
产物,对运动进行了普适性的数学描述。只要我们掌握了牛顿的这套理
论,就可以解决那些可能令我们束手无策的难题。同样,我们的大脑有
一种先天能力,可以评判某种结果发生的可能性。但是,这种能力非常
弱,在评判发生可能性极低的事件时更加不可靠。在这种情况下,我们
需要适度地用一些可靠的原理与技术手段去辅助我们的直觉,于是概率
这种数学理论应运而生。
数学界使用的交流语言非常特殊,功能十分强大,可以准确、方便
地传递复杂的内容。但是,由于其他人对这套语言并不熟悉,因此他们
以为数学家的思维方式与普通人大相径庭。事实上,这样的想法大错特
错。
掌握了数学知识,就像给常识装上了核能驱动的假肢,可以让我们
走得更远、更快。尽管数学的功能十分强大,数学的符号体系与抽象性
有时让人难以理解,但是数学思维与我们思考实际问题的方法并无多大
区别。大家可以想象钢铁侠用拳头在砖墙上砸出一个洞的场景,这个方
法有助于我们理解数学思维的特点。一方面,托尼·史塔克(Tony
Stark)砸穿砖墙的力量并非来自他的肌肉,而是来自一套精准的同步伺
服系统,这套伺服系统的动力由一个小型贝塔粒子发电机提供。另一方
面,对于托尼·史塔克而言,他所做的就是砸墙这个动作,跟没有装备
时的砸墙动作并无区别,只不过有了装备之后,难度变小了。
克劳塞维茨(Clausewitz)说过:“数学就是常识的衍生物。”如果没有数学帮助我们弄清条理,常识有可能会把我们引入歧途。
前面说的美国军官就是受到常识的误导,准备给飞机上防护能力已经很
强的部位加装装甲。但是,尽管数学具有很强的条理性,如果仅凭抽象
推理,而不经常性地辅以我们在数量、时间、空间、运动、行为及不确
定性等方面的直觉感知,也就是说脱离了常识的帮助,那么,数学领域
的任何活动都将变成循规蹈矩地生搬书本知识,不会产生任何有益的结
果。换言之,这样的数学就像学生们在学习微积分时所发的牢骚一样,毫无意义可言。
这是非常危险的。1947年,约翰·冯·诺依曼(John von
Neumann)在他的论文《数学家》(The Mathematician)中发出警告:
如果数学这门学科逐步偏离现实生活的经验,并且渐行渐远,以
至于第二代和第三代数学人无法在“现实生活”中萌生某些想法并直
接受到启迪,那么我们将面临非常严重的威胁。它会在唯美的道路上
越走越远,演变成“为了艺术而艺术”。如果周围的相关学科仍然与
经验有着密切的联系,或者某位鉴赏能力超强的人可以对数学产生影
响,那么发生这种情况未必是件坏事。但是,数学的这种发展势头几
乎没有遇到任何阻力,而且在偏离经验的过程中分解成多个不起眼的
分支,最终局面有可能变得支离破碎、杂乱无序,这相当危险。换句
话说,在远离经验的哺乳,或者说“抽象研究”大量“近亲繁殖”之
后,数学将面临堕落的危险。[5]
本书将讨论哪些数学知识?
如果你对数学的了解完全来自学校教育,那么你所掌握的数学知识
就十分有限,在某些重要方面甚至是错误的。学校里教授的数学知识大
多是一系列确凿的事实,以及权威给出的、不容置疑的法则。在学校
里,数学就是一些已经定型的知识。事实上,数学并没有完全定型。即使是数字与几何图形这些最基本
的学习内容,我们所掌握的知识远比我们尚未掌握的少。而且,我们已
经学会的那些知识,也是无数人付出努力、经过反复争论、解决一个个
疑团之后才得到的。在编写教材时,所有这些努力与喧嚣都被小心翼翼
地摒弃了。
毫无疑问,数学中存在某些事实。对于“1+2=3是否正确”这个问
题,人们从来没有提出过多少争议。至于“是否能证明1+2=3以及如何证
明”,这个问题在数学与哲学之间摇摆不定,则是另外一回事了。在本
书结语部分,我们将讨论这个问题。其计算毫无疑问是正确的,人们的
疑惑存在于其他方面。在后文中,我们将不止一次地讨论这个问题。
数学中的事实可能非常简单,也可能非常复杂,可能十分浅显,也
可能十分深奥。这样的特点将数学一分为四:
像1+2=3这样比较基础的算术题结构简单,内容也不那么深奥。
sin2x=2sinxcosx及二次方程式等基础内容也大致差不多,虽然与1+2=3相比,理解这些内容可能需要多花点儿时间和精力,但是它们在概念上
并没有多大的理解难度。
在复杂–浅显这个部分,我们有两位数的乘法、复杂定积分的计
算。在研究生院学习一两年之后,还会接触更复杂的概念。可以想见,我们出于这样或那样的原因,有可能需要解决这类问题。不可否认的
是,如果不借助机器,这样的工作有时根本无法完成,至少会让人头疼
一番。至于复杂的难题,如果我们上学时没有努力学习,可能连问题都
无法看懂。但是,即便解决了所有这些问题,我们也并不会因此更加了
解我们所在的这个世界。
至于复杂–深奥这个部分,则是像我这样的专业从事数学研究的人
需要投入大量时间的地方。这里有众多大名鼎鼎的定理与猜想:黎曼假
设,费马最后定理[6],庞加莱猜想,P vs NP(多项式对非确定多项
式),哥德尔定理等。这些定理内涵丰富,具有重要的意义,表现出令
人窒息的美感。这些定理残酷无情又无懈可击,人们围绕它们写就了一
本本专著。
本书介绍的内容并不是这些定理,而是图的左上部分,即简单–深
奥的数学知识。无论我们在数学方面受到的教育与训练止于代数之前,还是远远超过这个范围,本书讨论的数学思想都将与我们的生活产生直
接联系,为我们带来益处。这些内容不是像简单代数那样的“纯粹事
实”,而是一些原理,其应用将远远突破我们对数学的既有理解。它们
是常备工具,只要应用得当,就可以避免我们犯错。
理论数学是一方净土,远离尘世间的各种纷扰与矛盾,我就是在理
论数学的浸淫下长大的。与我一起学数学的其他小伙伴们一个个受到了
物理学、基因组学或者对冲基金管理的黑色艺术的诱惑,而我对这类
“青春期萌动”则敬而远之。[7]在读研究生期间,我全身心地投入数论
研究。卡尔·弗里德里希·高斯(Carl Friedrich Gauss)把数论称作
“数学皇后”,认为它是理论程度最高的学科之一,也是位于理论数学这方净土核心位置的一个不为人所知的乐园。它曾经让希腊人头疼不
已,并在随后的2 500年里不断地折磨着一代代数学人。
起初,我研究的是既经典又有特色的数论,试图证明整数四次幂求
和方面的一些事实。当家人在感恩节晚宴上不断追问它的情况时,我虽
然可以向他们解释一二,但我无法让他们明白我的证明过程。不久之
后,我又迷上了更加抽象的研究领域,其中的一些基本概念乏人问津,讨论的场所只限于牛津大学、普林斯顿大学、京都大学、巴黎大学和威
斯康星大学麦迪逊分校(我目前在此任教)的学术报告厅与教师休息
室。如果我告诉你这些内容内涵丰富、极富美感,令我热血沸腾,而且
我永远会乐此不疲地研究它们,那么你只能相信我的话。因为这些研究
极为深奥,哪怕只是触及皮毛,也需要投入大量的学习时间。
但是,随着研究的深入,我发现了一个有趣的现象。在我的研究越
发抽象并且与现实生活渐行渐远的过程中,我开始注意到数学高墙之外
的尘世间也有大量的数学活动。我指的不是复杂–深奥的数学概念,而
是一些更为简单、更加古老但是同样深奥的内容。我开始在报纸、杂志
上撰文,介绍数学目镜下的现实世界。令我惊奇的是,即使宣称自己讨
厌数学的人,也愿意拨冗阅读这些文章。这是另一种数学教学活动,与
教室里的教学活动大不相同。
与教室里的教学活动相同的是,读者也需要做一些工作。我们继续
讨论冯·诺依曼的《数学家》:
乘坐飞机,让飞机把我们带到高空并运送到另一个地方,还有操
控飞机的航向,这些都不是很难。但是,要了解飞机的飞行原理,以
及飞机抬升力与推进力的相关理论,则要难得多。对于某个过程,如
果我们事先没有经过大量运行或使用,达到得心应手的程度,也没有
通过直觉和经验去融会贯通,想要彻底掌控这个过程就会非常困难。换言之,如果不从事某些数学活动,就很难理解数学的真谛。欧几
里得(Euclid)告诉托勒密(Ptolemy),几何的学习没有捷径可言;门
内马斯(Menaechmus)也曾经告诉亚历山大大帝要亲力亲为。(古代科
学家的一些名言有可能是人们杜撰的,但是同样有启迪作用。我们还是
坦然面对吧。)
在本书中,我不会在数学领域的重大事件上摆出夸大其词又含糊不
清的姿态,诱导大家对它们循规蹈矩地顶礼膜拜。阅读本书时,我们必
须亲自尝试完成一些计算工作,同时,我还希望读者朋友们理解书中的
一些公式与方程式。我不是要大家掌握超出算术范围的数学知识,但是
我在书中解释的很多数学知识将远远超出算术的范畴。我会粗略地绘制
一些图表。我会讲到一些学校教过的数学知识,但是它们将出现在不同
的情境中。我会告诉大家如何用三角函数表示两个变量的相关程度,微
积分所揭示的线性现象与非线性现象之间的关系,以及二次公式在科学
探索中充当认知模型的作用。书中还会涉及在大学及后续教育中才会学
习的某些内容,比如:我们会讨论集合论所遭遇的危机,用来隐喻最高
法院的判决与棒球场上的裁判;我们会讨论解析数论近期取得的进展,用来说明结构与随机性之间的相互作用;我们还会讨论信息论与组合设
计,用来分析麻省理工学院的大学生是如何破解马萨诸塞州彩票的秘
密,并赢取数百万美元奖金的。
在本书中,我会提到著名的数学家,也会有一些哲学思考,甚至还
会给出一两个证明题。但是,我不会布置家庭作业,也不会安排考试。
[1] 曼哈顿计划是第二次世界大战期间由美国牵头,英国、加拿大共同参与的一项核武器研
发计划。——译者注
[2] 关于萨维奇,这里有必要告诉大家他的一些逸事。萨维奇的视力极差,只能用一只眼睛
的余光看东西。他曾经耗费了6个月的时间来证明北极探险中的一个问题,其间仅以肉糜饼为
食。
[3] 1平方英尺≈0.093平方米。——编者注
[4] 公平地说,标准普尔500指数同期增长了212.5%,增长速度更快。[5] 冯·诺依曼对数学本质的认识十分有道理,但是公平地讲,他认为数学的唯美目标是一
种“堕落”,这个观点令人多少有些不安。冯·诺依曼是在希特勒统治下的德国举办“堕落艺术
展”10周年之际写下这番话的。这次艺术展指出,“为了艺术而艺术”是犹太人与共产党追求的
目标,目的是暗中破坏强大的德国所需的健康的“现实主义”艺术。在当时的情况下,人们对没
有明显研究目标的数学心怀戒心。在这个问题上,政治信仰与我本人不同的人在写作时可能会提
到冯·诺依曼曾积极投身于核武器研发研究这个事实。
[6] 在数学界,费马最后定理现在被称作怀尔斯定理,因为安德鲁·怀尔斯(Andrew
Wiles)在理查德·泰勒(Richard Taylor)的大力帮助下证明了这个定理,而皮埃尔·德·费
马(Pierre de Fermat)本人则没有给出证明。不过,传统的名称可能会一直沿用。
[7] 坦率地讲,我在20岁出头时,也一度想要成为严肃文学作家,甚至还出版了一本严肃
小说《蚱蜢王》(The Grasshopper King)。但是,在我致力于严肃文学创作期间,我发现自
己有一半的时间不务正业,沉迷于数学问题的研究。第一部分 线性
精彩内容:
●拉弗曲线
●微积分
●“逝去量的鬼魂”
●“到2048年所有美国人都会超重”
●南达科他州脑癌发病率为什么高于北达科他州?
●大数定律
●对恐怖主义的各种类比
●下定义的习惯第1章 要不要学习瑞典模式?
几年前,在关于“患者保护与平价医疗法案”的激烈讨论中,鼓
吹公民充分自由权的卡托研究所里有个名叫丹尼尔·米切尔(Daniel
Mitchell)的人,为自己的博文拟了一个很有煽动性的标题:“瑞典
正在谋求变化,而巴拉克·奥巴马(Barack Obama)却在倡导美国学
习瑞典模式,为什么?”
这个问题问得非常好!这样的表达,让其中有悖常理的地方变得
一目了然。是啊,全世界的福利国家都在削减高额的救济金与高税
收,连瑞典这样的富裕小国也不例外,而美国却与这股潮流背道而
驰。总统先生,这是为什么呢?米切尔的博文指出:“瑞典从自己的
错误中汲取了教训,正在缩减政府的规模与职能范围,为什么美国的
政客们却义无反顾地重复这些错误呢?”
要回答这个问题,我们需要参考一幅极具科学性的曲线图。在卡
托研究所看来,整个世界就是下图所示的情形。图中的横轴表示瑞典模式化程度[1],纵轴表示繁荣程度。至于如
何量化的问题,大家不用担心,关键是要知道:一个国家的瑞典模式
化程度越高,情况就越糟糕。瑞典人不是傻瓜,他们已经意识到了这
个问题,正在努力地向左上角的自由国度的繁荣攀爬。然而,奥巴马
政府却正在朝错误的方向前进。
下面,我用与奥巴马总统观点比较接近的经济视角取代卡托研究
所的视角,重新绘制这幅图。关于美国应该实现的瑞典模式化程度,这幅图给出的建议大不相
同。繁荣程度最高的点在哪儿呢?应该比美国的瑞典模式化程度高,但是比瑞典低。如果这幅图是正确的,那么在瑞典削减其福利时,奥
巴马却在进一步增加美国的福利,这种做法是完全有道理的。
这两幅图的差异其实就是线性与非线性之间的差异,这是数学领
域最重要的差异之一。卡托研究所画的是一条直线,而第二幅图中的
线则不是直线,而是在中间的地方有一个隆起。直线是一种线,但线有很多种。直线的各种特性是大多数线所不具备的,比如,线段的最
高点(在本例中即繁荣程度的最高点)只能是两个端点之一,这是直
线的特点。如果降低税率有助于提升繁荣程度,那么税率越低越好。
因此,如果瑞典正在削减社会福利,那么美国也应该实行同样的政
策。当然,与卡托研究所持相反观点的美国政府智囊团可能会认为,这条直线应该朝相反的方向倾斜,即由左下角向右上角延伸。如果情
况真的如此,公共支出将没有上限,最有利的政策就是让瑞典模式化
程度达到极致。
通常,如果有人宣称自己的思维方式是“非线性的”,那么他的
真实意图是要向你道歉,因为他把你借给他的某个东西弄没了。但
是,非线性思维其实非常重要。在本书讨论的这个例子中,非线性思
维就能发挥显著的作用,因为所有的线并不都是直线。稍加思考你就
会发现,真正的经济学曲线是第二幅图,第一幅图并不正确。米切尔
的推理是一种“假线性”(false linearity),他错误地假设,经济
繁荣的程度可以用第一幅图来表示,也就是说,瑞典削减其社会福利
的做法,意味着美国也应该亦步亦趋。
但是,社会福利既有可能太过,也有可能不足,意识到这一点,就会知道那幅线性图是不对的。“管理程度越高越不好,越低越好”
是一个过于简单的原则,真正有效的原则比它复杂。向亚伯拉罕·瓦
尔德咨询的那些将军面临着同样的情况:装甲不足意味着飞机会被击
落,装甲过度又会让飞机无法起飞。问题的关键不在于加装装甲是否
正确,而在于加装装甲可能是柄双刃剑,取决于飞机已有的装甲。如
果这个问题有最优解决方案,就应该是在中间的某个位置上,向任一
方向偏离都不好。
非线性思维表明,正确的前进方向取决于你当前所在的位置。
这个深刻的观点其实早已有之。罗马时期,贺拉斯(Horace)有
一个著名的论断:事物有中道,过犹不及。在此前更早的时候,亚里士多德在他的《尼各马可伦理学》(Nicomachean Ethics)一书中指
出,多食与少食都会伤害身体。最适宜的度应在两者之间,因为饮食
与健康之间并不是线性关系,而是曲线关系,两端都是不好的结果。
“巫术”经济学与拉弗曲线
令人啼笑皆非的是,像卡托研究所里的那帮家伙一样持保守观点
的经济学家们,早就知道其中的奥秘了,他们的理解甚至比任何人都
深刻、透彻。至于我绘制的第二幅图,也就是中间隆起、极具科学性
的那幅图,绝对不是我的首创。这幅图被称作“拉弗曲线”(Laffer
curve),在近40年时间里,拉弗曲线在共和党的经济政策中起到了极
为重要的作用。在罗纳德·里根(Ronald Reagan)的任期过半之前,拉弗曲线已经是经济学论文中一个老生常谈的话题了。在电影《春天
不是读书天》(Ferris Bueller’s Day Off)中,本·斯坦(Ben
Stein)在发表那篇令人震撼的著名演说时即兴说了下面这番话:
有谁知道这是什么吗?各位同学,有人知道吗?……谁知道,谁以前见过?这是拉弗曲线。有谁知道拉弗曲线表示的意思吗?从
拉弗曲线可以看出,在收益曲线的这个点得到的收入,跟这个点是
一样的。很多人认为这个结论有争议。有谁知道,1980年副总统布
什把这个叫作什么吗?谁知道?布什称之为“某某术经济学”,对,“巫术经济学”。
拉弗曲线的由来堪称传奇,其过程大致如下:1974年的一天,时
任芝加哥大学经济学教授的阿瑟·拉弗(Arthur Laffer)与迪克·切
尼(Dick Cheney)、唐纳德·拉姆斯菲尔德(Donald Rumsfeld)和
《华尔街日报》(Wall Street Journal)的编辑裘德·瓦内斯基
(Jude Wanniski)一起,在华盛顿的一家高档酒店共进晚餐。席间,他们在讨论福特总统的税务计划时发生了争执,而且争执越来越激烈。于是,拉弗采用了知识分子惯用的手法,拿起一张餐巾纸[2],在
上面绘制了一幅图,如下图所示。
图中的横轴表示税率,纵轴表示政府的税收。在横轴的最左端税
率为0,根据定义,这种情况表示政府没有税收。在最右端,税率为
100%,这个数字表明,你的所有收入,不管经营企业所得或工资薪
水,全都进了“山姆大叔”的钱袋。在后面这种情况下,政府的钱袋最终也将空空如也。因为,如果
你参与教学、销售五金器具、企业管理等活动,辛辛苦苦赚的钱却被
政府一扫而空,你为什么还要费神做这些工作呢?因此,人们不会去
工作。即使去工作,他们也会避开收税员,参与一些零零碎碎的经济
活动。于是,政府的税收归零。
在中间区域,政府不会把我们所有的收入全部收走,也不会一分
钱不收,换句话说,在现实世界中,政府会拿走我们收入的一部分。
这意味着,表现税率与政府收入之间关系的线不可能是直线。否
则,收入最高点要么在图的最左端,要么在最右端,但事实上这两个
点的值都是零。如果你当前的所得税真的接近于零,就说明你位于图
的左侧。我们凭直觉就可以判断出,在这种情况下,如果政府提高税
率,用于支付服务与政府项目的资金数额就会增加。但是,如果税率
接近100%,此时提高税率实际上会导致政府税收减少。如果位于拉弗
曲线最高点的右侧,同时希望在不削减开支的情况下增加税收,那么
政府可以采取一个简单易行且政治效果极佳的方法:降低税率,从而
增加税收。朝哪个方向努力,取决于我们所处的位置。
我们现在到底位于什么位置上呢?这是问题的难点所在。1974
年,所得税的最高税率是70%,人们据此判断,美国在拉弗曲线上位于
右侧向下的“斜坡”上。当时按此税率缴税的人并不多,因为这个税
率只适用于20万美元[3]以上的收入,而这些人认为美国更应该降低税
率。同时,拉弗曲线还拥有瓦内斯基这位有影响力的拥趸,他在1978
年出版了一本书,并相当自信地把这本书命名为“世界运行的方式”
(The Way the World Works),把他的那套理论介绍给大众。瓦内斯
基充分相信拉弗曲线,而且他既有热情,又有政治手腕,就连主张减
税的人觉得偏激的观点,他也能成功兜售。有人认为他是个疯子,他
却不以为然。“‘疯子’这个称谓说明什么问题啊?”他在接受采访
时说,“托马斯·爱迪生(Thomas Edison)是个疯子,莱布尼茨(Leibniz)是个疯子,伽利略(Galileo)也是个疯子,这样的疯子
太多了。只要你提出一个有悖传统的新观点,提出一个与主流截然不
同的观点,人们就会说你是个疯子。”
[题外话:在这里,我有必要说明一下,很多持有非主流观点的人
把自己比作爱迪生与伽利略,但是这些人的观点没有一个是对的。我
每月至少会收到一封这样的来信,寄信人宣称自己能“证明”某个数
学命题,而几百年来人们都认为这个命题是错误的。我敢保证阿尔伯
特·爱因斯坦(Albert Einstein)没有到处宣扬:“我知道你们觉得
我的广义相对论非常荒谬,人们当年还说伽利略的成果非常荒谬
呢!”]
拉弗曲线简洁明了,又以一种令人愉悦的方式颠覆了我们的直
觉,因此,那些本来就迫不及待要减税的政客们自然对它青睐有加。
经济学家哈尔·范里安(Hal Varian)指出:“你为一位国会议员介
绍只需要6分钟就能讲清楚的情况,随后,他能讲6个月。”裘德·瓦
内斯基先是担任杰克·康普(Jack Kemp)的顾问,后来又担任罗纳德
·里根的顾问。20世纪40年代,里根是一名电影明星,他的演艺生涯
为他积累了大笔财富,也为他40年后的经济观奠定了基础。里根执政
期间负责制定政府预算的官员戴维·斯托克曼(David Stockman)回
忆说:
(里根)经常说:“‘二战’期间,我通过拍电影赚了大
钱。”当时,战时收入附加税高达90%。里根说:“拍了4部电影之
后,我的所得税率就到了最高等级。于是,我在完成了4部电影的
拍摄之后就不再工作,跑到乡下度假去了。”高税收导致人们怠
工,而税率低则会刺激人们积极工作。他的这段经历证明了这个道
理。当前,几乎没有哪位令人尊敬的经济学家会认为美国正位于拉弗
曲线的下行区域。这样的现象也许不足为奇,因为高收入的现行税率
仅为35%,跟20世纪的大多数时间相比,这样的税率低得惊人。即使在
里根时代,美国也位于拉弗曲线的左侧。哈佛大学经济学家、在小布
什(George W. Bush)总统任内担任经济顾问委员会主席的共和党人
格里高利·曼昆(Gregory Mankiw),在他的《微观经济学》
(Principles of Microeconomics)中指出:
后来的历史并没有佐证拉弗的“低税率将增加税收”这个
猜想。里根当选总统后实行了减税政策,结果税收不但没有增
加,反而减少了。1980~1984年,个人所得税(消除通胀因素后
的人均税收)降低了9%,尽管这个时期的平均收入(消除通胀
因素后的人均收入)提高了4%。而且,这项政策出台之后,想
要废止并非易事。
现在,对供应学派表示些许支持是合理的,他们认为税收政策
的目标未必是实现政府收入最大化。我与米尔顿·弗里德曼最后一
次见面是在“二战”期间,当时我们一起供职于统计研究小组,为
军方开展秘密工作。他后来获得诺贝尔经济学奖,并先后为几位总
统担任顾问。在主张低税率与自由哲学方面,他是一位有影响力的
倡导者。弗里德曼关于税收有一句名言:“我主张在任何情况下,只要有可能都应该减税,而且无须任何托词和理由。”他认为,我
们不应该以拉弗曲线的最高点为目标,也就是说,政府不应该追求
尽可能高的税收。在弗里德曼看来,政府的收入最终会用作政府的
开支,但是,这些钱的使用方式并不是很恰当。
其他像曼昆一样的温和供应学派的经济学家认为,减税虽然会带
来政府收入减少、赤字增加的即时效应,但是可以激励人们辛勤工
作、创办企业,并最终增强国家的经济实力。而支持建立福利型国家
的经济学家则可能认为,减税会两头不讨好。政府的开支能力减弱,基础设施的建设就会减少,制约诈骗行为的力度也会下降,并且在促
进自由市场方面通常会不作为。
曼昆同时指出,在里根实行减税政策之后,那些将超额收入的70%
交给政府的最富裕公民,的确贡献了更多的税收[4]。但是,以这种方
式追求政府收入的最大化,可能会导致令人恼火的结果。一方面,中
产阶级的税收压力加大之后,他们别无选择,只能拼命工作;另一方
面,针对富人们的税率有所下降,这些富人积累了大量财富,一旦他
们认为政府征收的赋税过高,他们完全有可能减少经济活动,甚至将
企业搬到国外。如果这种情况真的发生了,大量自由主义者将与米尔
顿·弗里德曼一起面临尴尬的境地:不得不承认税收最大化这个目标
也许并不是那么美好。
曼昆的最终评价并不偏激:“拉弗的观点也不是毫无价值。”但
是,我要给拉弗一个更高的评价,即他的曲线图揭示了一个不容置疑
的数学基本观点:税收与收入之间的关系一定是非线性的。当然,这
种关系不一定就是拉弗所画的那种平滑的单峰山丘状,还有可能像一
个四边形,比如:
或者像阿拉伯骆驼的驼峰,比如:又或者是不受任何限制的随意振荡曲线[5],比如:
但是,只要曲线在某个地方向下倾斜,就必然会在其他地方向上
延伸。瑞典模式化程度过高的现象肯定存在,所有的经济学家都承认
这一事实。拉弗指出,在他之前已经有很多社会学家意识到了这个问
题,但是对大多数人而言,这个事实并不是显而易见的,至少在看到
餐巾纸上的那幅图之前如此。拉弗非常清楚,他的这幅曲线图并不能
告诉大家,所有的经济在任一特定时间是否存在征税过度或不足的问题,这正是他在图上没有给出任何数字的原因。在向国会提供证言
时,有人就最优税率的具体额度提出了疑问,拉弗回应道:“坦率地
说,我无法估量其具体额度,但是我知道最佳税率具有哪些特征。是
的,先生,我知道。”所有的拉弗曲线都表明,在某些情况下低税率
可以增加税收,但是具体在哪些情况下会产生这种效果,则需要展开
一些深入的、难度颇大的具体工作,这是无法在一张餐巾纸上完成
的。
拉弗曲线本身并没有错,不过人们将其付诸应用的方式有可能出
错了。瓦内斯基与受他的指挥棒指挥的那些政客们一起,成为有史以
来最古老的“假演绎推理”的猎物:
·降低税率有可能增加政府收入;
·我希望降低税率可以增加政府收入;
·因此,降低税率肯定会增加政府收入。
[1] 在这里,“瑞典模式化程度”表示“社会服务与福利的特点”,而不是指瑞典的其他
特点。
[2] 拉弗对餐巾纸一说表示异议。他回忆说,那家饭店使用的是高档布餐巾,他绝不会在
上面随意地画经济学图表。
[3] 如果换算成现在的收入,应该是50万~100万美元。
[4] 供应学派预测,所得税税率降低之后,富人们的工作劲头将会更足,政府税收也会随
之增加。但税收增加的原因是不是这个,很难确定。
[5] 它们甚至有可能是多条曲线。马丁·加德纳(Martin Gardner)曾经对“拉弗曲
线”进行了刻薄的评论。他画了一堆缠绕不清的曲线,然后把它们叫作“新拉弗曲线”。第2章 不是所有的线都是直线
即使数学专业人士不告诉我们,我们可能也不会认为所有的线都
是直线。但是线性推理却无处不在,只要你认为“某个东西有价值,因此多多益善”,就是一种线性推理。这也是叫嚣的政客们惯用的伎
俩:“你们支持对伊朗采取军事行动吧?我想,任何国家胆敢在我们
面前放肆的话,你们都会希望对他们发起地面进攻!”还有的政客则
处于另一个极端:“要与伊朗开战吗?你们可能认为阿道夫·希特勒
也被误解了。”
只要稍加思考,我们立刻就能发现这种推理是错误的,但是,为
什么有那么多人会犯这种错误呢?毫无疑问,并不是所有的线都是直
线,但是为什么有人会持相反的错误观点呢?即使他们很快醒悟并改
正过来,这样的错误也是难以想象的。
原因之一就在于,从某种意义上看,所有的线的确都是直线。让
我们从阿基米德(Archimedes)谈起。
穷竭法与圆的面积
下面这个圆的面积是多少?在现代,这是一个非常普通的问题,在SAT(学术能力评估测试)
中出现这样的题目也无可厚非。圆的面积是πr2,在本例中,半径r为
1,因此,圆的面积就是π。但是,在2000年前,人们苦苦思索却不得
其解,这个问题引起了阿基米德的注意。
这个问题的难点在哪儿呢?一方面,我们认为π是一个数字,而
古希腊人却认为只有1、2、3、4……这些用来计数的整数才是数字。
不过,古希腊几何学的第一个伟大成就——勾股定理[1],却突破了他
们的这个数字系统。
试看下图:勾股定理告诉我们,直角三角形斜边(上图中倾斜的边,与直角
没有接触)的平方是其余两边(直角边)的平方和。在本图中,根据
勾股定理,斜边的平方为 ,而且斜边比1长、比2短(这
个无须任何定理,目测就可以确定)。至于斜边的长度不是整数,这
对古希腊人来说不是问题。也许,我们使用的测量单位是不正确的
吧。如果我们设定直角边的长度是5个单位,我们就可以用直尺量出斜
边的长度约为7个单位。因为斜边的平方是:
如果斜边的长度是7个单位,它的平方就是7×7=49。
如果直角边的长度为12个单位,斜边的长度就十分接近于17个单
位。不过,令人心痒不已的是,这次又短了一点儿,因为,而172是289,就少那么一点点。
公元前5世纪,毕达哥拉斯的一位门徒发现了一个令人震惊的现
象:等腰三角形的三条边长不可能都是整数。现代人都知道“2的平方
根是无理数”,也就是说这个数不是任何两个整数的比,但是,当时
的那些学者并不知道。他们能有什么办法呢?他们的数量概念是建立
在整数的基础上的。因此,在他们看来,直角三角形斜边的长度根本
不是一个数字。
这个发现引起了轩然大波。要知道,毕达哥拉斯的这些门徒非常
怪异,他们的人生哲学一片混沌,在我们现代人看来,就是数学、宗
教与精神病构成的大杂烩。在他们眼中,奇数是吉利的,而偶数则是
邪恶的。他们认为在太阳的另外一边还有一个与地球一模一样的星
球,即“反地球”(Antichthon)。某些记载表明,他们认为吃蚕豆
是不道德的,因为人死之后,灵魂会寄存在蚕豆中。据说,毕达哥拉
斯本身可以与牲畜交谈(他告诉牲畜不要吃蚕豆),也是为数不多的
穿裤子的古希腊人之一。毕达哥拉斯门徒的数学研究与他们的思想有不可分割的联系。发
现2的平方根不是有理数的那个家伙名叫希帕索斯(Hippasus),传说
(不一定是真实事件,但是从中可以窥见毕达哥拉斯门徒的处世风
格)他在证明了这个令人厌恶的定理之后,得到的“奖励”是被同窗
扔进大海淹死了。
希帕索斯可以被淹死,但是定理却无法回避。毕达哥拉斯之后的
学者(包括欧几里得和阿基米德)知道,虽然2的平方根这样的数字将
迫使他们从整数这个世外桃源中走出来,但他们还是得挽起衣袖,完
成测算工作。人们都不知道,圆的面积是否可以仅靠整数表示出来。
[2]但是,为了制造车轮、修建筒仓[3],他们必须学会计算圆的面
积。
第一个提出解决方法的是欧多克斯(Eudoxus of Cnidus),欧几
里得把这个方法作为第12个基本原理收入《几何原本》(Euclid’s
Elements),但在这个方面取得大进展的是阿基米德。如今,我们把
这个方法叫作穷竭法(method of exhaustion),其基本原理如下:图中的正方形叫作内接正方形,正方形的4个角与圆接触,但是没
有超出圆的范围。这样做的理由是什么呢?这是因为圆神秘莫测,令
人望而生畏,而正方形的面积则易于计算。如果一个正方形的边长为
x,其面积就是x乘以x。因此,我们把数字与自身相乘的运算叫作平
方。这个方法蕴含了一个基本的数学思想:如果老天要我们解决一个
非常难的问题,那么我们应该想方设法找到一个简单的问题,而且这
个简单的问题与难的问题非常接近,这样,老天也不会有反对意见。
内接正方形可以分成4个三角形,这4个三角形都与我们前面画的
等腰直角三角形一模一样。[4]因此,正方形的面积就是三角形面积的
4倍。沿对角线将一个像金枪鱼三明治那样的1×1正方形切成两半,如
下图所示,就可以得到一个上图中的等腰直角三角形:金枪鱼三明治的面积是1×1=1,因此,形状为等腰直角三角形的
半个三明治的面积是12,内接正方形的面积就是12的4倍,即2。
假设你原来不知道勾股定理,那么现在你已经知道了,至少你知
道勾股定理是关于这个特殊的直角三角形的。因为位于下方的那半个
金枪鱼三明治是一个直角三角形,与内接正方形左上方的图形形状相
同,而且这个三角形的斜边就是内接正方形的边。因此,这条斜边的
平方,就是内接正方形的面积,即2。用简练的术语表示的话,斜边的
长度就是2的平方根。
内接正方形被圆全部包围在内,如果正方形的面积是2,那么圆的
面积肯定不小于2。接下来,我们再画一个正方形:
这个正方形叫作外切正方形,它也与圆有4个接点,但是将圆全部
包围在内。正方形的边长是2,面积为4,因此,圆的面积不超过4。
也许,证明圆周率在2与4之间并不是一件了不起的事,但是阿基
米德的研究还没有结束。取内接正方形的4个顶点,标出相邻两个顶点
之间圆弧的中点。这样,我们在圆上就得到了4个均匀分布的点,把这
8个点连起来,就得到一个内接八边形:计算内接八边形的面积稍有难度,我就不用三角学来为难大家
了。重要的是,构成这个图形的是直线与角,而不包含曲线,因此,阿基米德有办法计算它的面积。这个八边形的面积是2的平方根的2
倍,约为2.83。
接下来,我们再引入外切八边形:这个外切八边形的面积是 ,比3.31略大。
因此,圆的面积被限制在2.83~3.31的范围内。
没有理由就此停手吧?我们可以在八边形(包括内接八边形与外
切八边形)的顶点之间再加入一些点,构成十六边形。通过计算,我
们可以发现圆的面积在3.06~3.18的范围内。以此类推,最终得到这样
的图形:啊,这不就是圆吗?当然不是,它是一个有65 536条边的正多边
形。不是吗?
欧几里得与阿基米德敏锐地发现,无论它是圆还是边长极短、边
的数目极大的多边形,这些都不重要,关键在于这两个图形的面积非
常接近,两者之间的差别不会产生任何影响。通过不断重复上述操
作,圆与多边形之间的面积之差越来越小,最后趋于“穷竭”。圆的
确是曲线构成的,但是,如果我们取其中很短的一段,它会非常接近
于直线,就像在地球表面取一小片土地,其非常接近于平面一样。
记住:局部是直线,整体是曲线。
我们还可以这样考虑,即从一个非常高的高度快速接近圆。起
初,我们可以看到整个圆:然后,我们只能看到一段弧线:接下来,我们看到的是一段更短的弧线:随着我们离圆越来越近,视野变得越来越小,到最后我们看到的
弧线与直线已经非常接近,几乎没有区别了。如果一只蚂蚁在圆上爬
行,它只能看到身边很小的范围,它会以为自己是在一条直线上爬
行。在地球表面上生活的人也一样,认为自己位于一个平面之上(除
非他非常聪明,知道观察由远而近、逐渐从地平线上露出来的物
体)。
微积分与牛顿
接下来,我要教大家关于微积分的知识。准备好了吗?首先,我
们要感谢艾萨克·牛顿。他告诉我们,圆的研究并没有特别大的难
度。所有的平滑曲线,只要我们无限接近地观察,都跟直线非常相
似。只要没有尖角,无论这条曲线如何弯曲盘旋,都无伤大雅。发射导弹时,导弹会以下图所示的轨迹运动:
导弹的运动轨迹是一条抛物线,先上升,然后下降。在万有引力
的作用下,所有的运动轨迹都会呈曲线形并接近地面,这是物理学的
一个基本事实。但是,如果我们取非常短的一段并靠近观察,这条曲
线就会变成下图所示的形状:再靠近一些,就会变成这样:上图中的导弹运动轨迹在肉眼看来就像一条直线,以一定的倾斜
角度向上运动。越靠近观察,曲线就越接近直线。
接下来是观念上的一个飞跃。牛顿说,好吧,让我们继续——把
视野缩小到无限小,小到无法计量的程度,但不是零。这时候,我们
研究的就不是一段很短的时间内导弹的运动轨迹了,而是某一个时点
的情况。本来接近于直线的运动轨迹直接变成直线了,牛顿把这条直
线 的 倾 斜 度 叫 作 流 数 ( fluxion ) , 我 们 现 在 称 之 为 导 数
(derivative)。
阿基米德不愿意完成这种飞跃。他知道,多边形的边越短,就越
接近于圆,但是,他绝对不会认为圆其实就是一个有无穷多条边而边
长极短的多边形。与牛顿同时代的人中,也有人不愿意凑这个热闹,反对者中名气
最大的是乔治·贝克莱(George Berkeley)。贝克莱用充满嘲讽的语
气贬低牛顿提出的无限小这个概念:“这些流数是什么呢?其实就是
迅速消逝的增量的速度。那么这些迅速消逝的增量又是什么呢?它们
既不是有限量,也不是无限小的量,什么都不是。难道我们不能称它
们是‘逝去量的鬼魂’吗?”遗憾的是,这一段逸事在现代数学文献
中却没有记载。
然而,微积分的确有效。如果围绕头部摆动一块石头,在突然放
手后,石头就会以一个恒定的速度飞出去,运动轨迹呈直线形[5],方
向则正好是根据微积分基本公式计算的放手时石头的运动方向。这是
牛顿的另一个惊人发现:运动物体会做直线运动,除非该物体受到其
他力的作用,才会偏离原来的方向。这也是我们习惯于线性思维的原
因之一:我们对时间与运动的理解,是在生活中观察到的各种现象的
基础上形成的。甚至在牛顿提出他的那些定律之前,我们就已经知道
物体会沿直线运动,除非有外力改变这种状况。
永远无法到达的冰激凌商店
对牛顿的批评是有道理的。从现代数学的严密性来看,他提出的
微积分公式谈不上完美。问题就出在无限小这个概念上,这是几千年
来数学家们面对的一个令人多少有些尴尬的问题。公元前5世纪,希腊
爱利亚学派有一位名叫芝诺(Zeno)的哲学家,尤为擅长就物理世界
提出一些看似无知的问题,但是这些问题总会酿成哲学上的大混乱。
这一次,又是他率先发难。
芝诺提出的一个悖论非常有名,大意就像我下面举的这个例子。
我决定步行去商店买冰激凌,当然,在我走完一半的路程之前,我不
可能到达商店。在我走完一半路程之后,如果我不接着走完剩下路程的一半,我还是无法到达商店。每次我都要先走完剩下路程的一半,才有可能到达商店,如此循环下去。我可能与冰激凌商店越来越接
近,但是,无论我走完多少个半程,我永远也无法到达冰激凌商店。
我与我的巧克力冰激凌之间总会有一段极小但不等于零的距离,因
此,芝诺断言步行去商店买冰激凌是无法实现的。芝诺的这个悖论适
用于所有的目的地:步行穿过大街,迈出一步,等等。也就是说,所
有的运动都是不可能实现的。
据说犬儒学派的第欧根尼(Diogenes the Cynic)驳斥了芝诺悖
论,他站起来走到了房间的对面。这个举动完美地证明芝诺眼中那些
不可能完成的运动事实上是能够完成的,那么,芝诺的证明肯定出了
问题。但是,问题出在哪儿呢?
我们可以利用数字把商店之行分成若干部分。我们得先走一半路
程,然后走剩下路程的一半,也就是全程的14,此时,还剩下全程的
14。再之后剩下的是18、116、132……。所以,走向商店的过程
就是:
12+14 +18 +116+132 +……
把这个数列的前10项相加,得数约等于0.999。加总前20项,得数
就与0.999 999更为接近。换言之,我们与商店的距离非常非常近。但
是,无论我们加多少项,都无法得到1。
芝诺悖论与另一个难题非常相似:循环小数0.999 99……是否等
于1?
我见过有人因为这个问题都快要挥拳相向了,在《魔兽世界》粉
丝主页、艾茵·兰德论坛等网站,人们也就这个问题争论不休。关于
芝诺悖论,我们的自然反应是“我们当然能买到冰激凌”。但是,在
我们讨论的这个问题上,直觉却给出了不同的答案。如果我们一定要问出答案,大多数人会说“0.999 9……不等于1”。毫无疑问,这个
循环小数看上去不等于1,要小一点儿,但两者的差不是很大。就像例
子中那位买不到冰激凌的家伙一样,这个循环小数与1越来越接近,但
可能永远也无法等于1。
不过,无论哪里的数学老师,包括我本人,都会告诉他们:“你
错了,这个循环小数就是等于1。”
那么,我怎么才能说服他们呢?下面这个方法效果不错。大家都
知道
0.333 33……=13
两边同时乘以3
0.333 33……×3=13×3
我们会发现
0.999 99……=1
如果这样还不能说服你,那么我们把0.999 99……乘以10,也就
是把小数点向右移一位
10×0.999 99……=9.999 99……
再把讨厌的小数从两边减去10×0.999 99……–1×0.999 99……=9.999 99……–0.999
99……
等式的左边就是9×0.999 99……,因为一个数的10倍减去该数就
是这个数的9倍。而等式的右边,我们成功地消除了讨厌的循环小数,只剩下9。因此,我们得到
9×0.999 99……=9
如果一个数的9倍是9,那么这个数只能是1,不是吗?
通常,这个证明过程可以说服别人。但是,坦率地讲,这个证明
并不完美。它不能让人们彻底消除疑虑去相信0.999 99……等于1,而
是迫使人们接受一个代数关系:“你们知道13就是0.333 3……吧?
难道不是吗?”
更糟糕的是,你们之所以接受我的证明过程,可能是因为我先进
行了乘以10这个运算。但是,这个运算没有问题吗?我们看看下面这
个算式的结果是多少。
1+2+4+8+16 +……
在这个算式中,符号“……”表示“求和永远不会终止,且每次
的加数是前一个加数的2倍”。毫无疑问,该算式的和是一个无穷大的
数。上面那个包含0.999 99……的证明过程看似正确,但有一个与之
十分相似的证明过程却会得出不同的结果。对上面这个求和算式乘以
2,我们得到
2×(1+2+4+8+16 +……)= 2+4+8+16+……这个结果与原来的求和算式十分相似,实际上,它是原来的求和
算 式 1+2+4+8+16 +…… 减 去 了 第 一 个 加 数 1 , 也 就 是 说 ,2×1+2+4+8+16 +……比1+2+4+8+16 +……少1。换言之
2×(1+2+4+8+16 +……)–1×(1+2+4+8+16 +……) = –1
但是,这个算式的左边化简后就会得到原来的求和算式,于是我
们得到
1+2+4+8+16 +……= –1
你相信这个结果是正确的吗?加数越来越大的无限循环加法运算
的结果竟然是负数,你能相信吗?
还有更让人无法接受的呢,下面这个算式的得数是多少?
1–1+1–1+1–1 +……
我们很有可能认为这个得数是
(1–1)+(1–1)+(1–1)+……=0+0+0+……
我们还有可能认为,即使有无数个0相加,结果也会等于0。但
是,由于负负得正,因此1–1+1等于1–(1–1)。不断地进行这个转
换,上面的算式就可以写成
1–(1–1)–(1–1)–(1–1)……=1–0–0–0……这样计算的结果就等于1,道理跟上面的计算一样。那么,结果到
底是0还是1呢?还是一半情况下等于0,另一半情况下等于1呢?结果
到底等于多少取决于最后一个加数,但是无穷求和算式没有最后一个
加数。
现在的情况比以前更糟糕了,别急着做出判断。假设T是这个神秘
的求和算式的得数:
T=1–1+1–1+1–1+……
把等式两边都变成各自的相反数,于是我们得到
–T=–1+1–1+1……
但是,如果将设为T的部分中的第一个加数1去掉,也就是说T–
1,就正好是上述算式的右边部分,即
–T= –1+1–1+1……=T–1
于是–T=T–1,如果等式成立,T就等于12。无穷多个整数相
加,得数竟然神奇地变成了分数,这可能吗?如果觉得不可能,那么
我们自然有理由怀疑这样一个看似毫无破绽的证明过程出了问题。但
是,请注意,真的有人觉得这个结果是有可能的,比如意大利的数学
家、神父圭多·格兰迪(Guido Grandi),格兰迪级数1–1+1–1+1–
1 +……就是以他的名字命名的。1703年,格兰迪在一篇论文中证明该
级数的和是12,而且指出这个神奇的结果表明宇宙是从虚无中产生
的。(不用担心,我和大家一样,不会相信他的结论。)当时的杰出
数学家,包括莱布尼茨与欧拉,虽然没有接受格兰迪的结论,却认可
了他奇怪的计算方法。实际上,要解出0.999……这个谜(以及芝诺悖论、格兰迪级
数),还需要进行更深入的研究。大家也无须屈从于我的代数知识,违心地接受我的观点。比如说,大家可以坚持认为0.999……不等于
1,而是等于1减去一个无限小的数。在这个问题上,大家还可以更进
一步,坚持认为0.333……不等于13,而是比13小,两者的差也是一
个无限小的量。完善这样的观点需要一些毅力,但并不是一件不可能
的事。我在教授微积分时,有一个名叫布莱恩的学生,因为不满课堂
上教的各种定义,自己提出了一大堆理论,并且把他提出的无限小量
命名为“布莱恩数”。
事实上,这样的情况并不是第一次发生。数学中有一个叫作“非
标准分析”(nonstandard analysis)的领域,就在专门深入研究这
类数字。20世纪中叶,亚伯拉罕·罗宾逊(Abraham Robinson)开拓
的这个研究领域,终于为贝克莱觉得荒谬的“迅速消逝的增量”下了
明确的定义。我们必须付出的代价(从另一个视角看,未尝不是一种
收获)是接受各种各样的新数字,不仅包括无穷小的数字,还包括无
穷大的数字,它们奇形怪状、大小不一。[6]
布莱恩的运气不错。我在普林斯顿大学的同事爱德华·尼尔森
(Edward Nelson)是非标准分析方面的专家。为了让布莱恩进一步了
解非标准分析,我安排他们俩见了一面。后来,爱德华告诉我,那次
见面并不顺利。在爱德华告诉布莱恩那些无限小量不可以叫作“布莱
恩数”之后,布莱恩立刻丧失了兴趣。
(这给我们上了一堂思想品德课:如果人们学习数学只是为了名
声与荣誉,那么他们在数学研究的道路上是走不远的。)
到目前为止,我们上文讨论的那个争议性问题还没取得任何进展
呢。0.999……到底是多少?等于1,还是比1小?两者的差是一个无穷
小的数,而这个无穷小的数在100年前还不为人所知?正确的做法是谢绝回答这个问题。0.999……到底是多少?这个数
字似乎就是下列数字的和:
0.9+0.09+0.009+0.000 9+……
但是,这个和到底是什么呢?后面的那个令人讨厌的省略号是个
大麻烦。两个数、三个数甚至100个数相加,结果都不可能引起任何争
议,这是用数学的方式表示一个我们非常了解的物理过程:取100堆材
料,捣碎后混合到一起,看最后得到多少。但是,如果这些材料有无
穷多堆,情况就迥然不同了。在现实世界,我们不可能会有无穷多堆
材料。无穷级数的和是多少呢?根本没有,除非我们为它赋予一个
值。19世纪20年代,奥古斯汀–路易·柯西(Augustin-Louis
Cauchy)完成了一个伟大的创新,将极限的定义引入了微积分。[7]
1949年,英国数论学家哈代(Hardy)在他的专著《发散级数》
(Divergent Series)中,把这个问题解释得非常清楚:
现代数学家从未想到,一堆数学符号竟然需要通过定义为其赋
值,才会具有某种“含义”,因此,即使对于18世纪最杰出的数学
家而言,这个发现也不能等闲视之。他们非常不习惯这样的定义,每次都要指出“在这里,X的意思是指Y”,这让他们觉得十分别
扭。柯西之前的数学家几乎不会提出“我们应该怎么定义1–1+1–
1 +……”这样的问题,而会问“1–1+1–1 +……是多少”。这样
的思维习惯让他们陷入了毫无意义的困惑与争议(常常会演变成辱
骂)中。
我们不可以把这个问题看作数学领域的相对主义而掉以轻心。我
们可以为一组数学符号赋予任何含义,但这并不意味着我们就应该这
么做。与现实生活一样,我们关于数学问题的选择,有的是明智的,有的则非常愚蠢。在数学领域,明智的选择可以消除毫无意义的困
惑,同时不会引发新问题。
在计算0.9+0.09+0.009 +……时,加项越多,和就越接近于1,但
永远不会等于1。无论我们在离1多近的位置上设置警戒线,在经过有
限次数的加法运算之后,和最终都会越过这条警戒线,而且永远不会
停下前进的步伐。柯西指出,在这样的情况下,我们应该直接将这个
无穷级数的值定义为1。随后,他绞尽脑汁,希望证明在他的这个定义
被接受之后,不会在其他方面造成相互矛盾的糟糕局面。在这个过程
中,柯西构建了一个框架体系,完美地提升了牛顿微积分学的严谨程
度。当我们指出某条曲线的局部接近于直线时,大致的意思是说:我
们越靠近观察,这条曲线就越接近于直线。在柯西的框架中,我们无
须提及任何无穷小的数字或者其他概念,以免心存疑虑的人因此担心
害怕。
当然,这样的做法是要付出代价的。0.999……这个谜之所以应该
被破解,是因为它会导致我们的直觉陷入自相矛盾的状态之中。我们
希望可以像上文那样,方便地对无穷级数的和进行各种代数运算,因
此,我们需要它等于1。但另一方面,我们又希望每个数只能用一个独
一无二的十进制数字来表示,因此,我们不应该随心所欲,一会儿说
这个数是1,一会儿又说它是0.999……。我们不可能同时满足这两个
要求,而只能放弃其中一个。柯西提出的这个方法经过两百年时间的
验证,其价值得到了充分的证明,不过,这个方法放弃了十进制展开
的唯一性。在英语中,我们有时会用两个不同的字母串(单词)表示
现实世界中的同一个事物,但我们并没有因此陷入任何麻烦。同样,使用两个不同的数字串表示同一个数,也不是不可以接受的。
至于格兰迪级数1–1+1–1+……,则是柯西定理无法处理的级数
之一,这类发散级数是哈代的著作讨论的内容。1828年,柯西定理的
早期崇拜者之一、挪威数学家尼尔斯·亨利克·阿贝尔(Niels
Henrik Abel)认为:“发散级数是捏造出来的概念,非常邪恶,以此为基础的任何证明都是可耻的。”[8]而哈代的观点,也就是我们现在
所持的观点,则十分宽容,认为对于发散级数而言,有的我们应该赋
值,有的则不应该赋值,还有的需要根据其所在的具体环境决定是否
应该为之赋值。现代数学界认为,如果需要为格兰迪级数赋值,这个
值应该是12,因为研究发现,对于所有值得关注的无穷级数,理论要
么为之赋值12,要么(如柯西定理)干脆拒绝为之赋值。[9]
柯西所给出的定义非常复杂,精确地写出来需要费不少工夫,即
使对柯西本人来说也不是件易事,他没能用语言明晰地表述自己的思
想。[10](在数学中,对新观点、新概念最清楚明了的描述,基本上
都不是直接来自创建者本人。)柯西是一名坚定的保守主义者和君主
主义者,但他引以为豪的是,他在数学研究中极具批判精神,勇于挑
战学术权威。他在成功地摒弃容易招致质疑的无穷小量之后,单方面
修改了他在巴黎综合理工大学的教学大纲,力求传播自己的新思想。
他的这一做法激怒了他身边的所有人:他的学生深感困惑,因为他们
报名学习的是针对大学一年级学生的微积分学,而不是介绍纯数学前
沿动态的学术成果;他的同事们认为,学校里学习工程技术的学生没
有必要吃这个苦头,去钻研柯西讲授的那些高深内容;学校管理部门
则严令他按纲施教,不得自由发挥。校方强行制定了新的课程内容,强调在微积分教学中采用包含无限小量概念的传统方法。同时,为了
防止柯西置若罔闻,校方还安排人进入他上课的教室做听课记录。但
是,柯西并没有就范,柯西对工程师需要学习什么内容不感兴趣,他
感兴趣的是探索真理。
从学校的立场来看,我们很难为柯西的这一做法进行辩解,但我
仍然支持他。数学研究的最大乐趣之一,就是我们清楚地感受到自己
对某个问题的理解是正确、完全、彻底的,我在其他领域从未有过类
似的感受。而且,一旦你知道了正确的做法之后,就很难说服自己去
介绍错误的做法,性格执拗的人更加不可能这样做。[1] 说明一下,我们不知道第一个证明勾股定理的人是谁,不过学术界几乎可以肯定不是
毕达哥拉斯(Pythagoras)本人。从与他同时代的人所遗留的资料中可以发现,公元前6世
纪,一位名叫毕达哥拉斯的人学识渊博,声名显赫,但是,除此以外,我们对他几乎一无所
知。对他生平与研究工作的记载要追溯至他死后800年左右的时间,在此之前的毕达哥拉斯完
全是个谜,除了一群哲学门徒自称“毕达哥拉斯”。
[2] 这肯定是不可能的,但是直到18世纪人们才完成了相关证明。
[3] 事实上,早先的筒仓不是圆柱体。直到20世纪,威斯康星大学的金(F·H·King)
教授发明了现在普遍采用的圆柱体结构,筒仓才变成了圆柱体。金的这项发明是为了解决筒仓
角落里的谷物容易腐烂变质的问题。
[4] 当然,我们可以通过在平面上平移、旋转前面的那个等腰直角三角形,得到能组成一
个正方形的4个三角形。我们默认这些操作不会改变图形的面积。
[5] 不考虑万有引力、空气阻力等影响,在较短的时间内,其运动轨迹非常接近直线。
[6] 约翰·康威(John Conway)提出的“超实数”(surreal numbers)就是一个典型
的例子。从这个名字就可以看出来,这些数字非常迷人,却又非常怪异。超实数是数字与战略
博弈构成的一个奇怪混合体,人们至今还没有完全探索出其中的精义。我们可以从伯莱坎普
(Berlekamp)、康威与盖伊(Guy)合著的《稳操胜券》(Winning Ways)一书中了解这些
奇怪的数字,还可以学到大量博弈论方面的数学知识。
[7] 数学上的所有突破都是在前人研究成果的基础之上实现的,柯西的极限存在准则也不
例外。柯西给出的定义在很大程度上秉承了让·勒朗·达朗贝尔(Jean le Rond
d’Alembert)判别法的核心思想。不过,毫无疑问,柯西定理是一个转折点,从此以后,数
学进入了现代分析的时代。
[8] 格兰迪最初在神学研究中应用了发散级数,考虑到这个事实,阿贝尔的这个观点极具
讽刺意味。
[9] 琳赛·洛翰(Lindsay Lohan)有一句名言:“极限是不存在的。”
[10] 我们在数学课程里学到的e和?,就来自柯西积分公式。第3章 到2048年,人人都是胖子?
喜剧演员尤金·米尔曼(Eugene Mirman)讲过一个统计学方面的
笑话。他说自己经常告诉人们:“通过阅读,我发现美国人百分之百
都是亚裔人。”
人们感到很奇怪,就问他:“但是,你不是亚裔人啊。”
这时候,尤金就会抖出包袱,非常自信地说:“通过阅读,我发
现自己是亚裔人!”
《肥胖》(Obesity)杂志上的一篇文章,让我不由自主地想起了
米尔曼的这个笑话。那篇文章在标题中提出了一个令人尴尬的问题:
“所有美国人是否都会超重甚至肥胖?”也许觉得问句的力量还不够
震撼,文章又给出了一个肯定的答案:“会的,到2048年就会这
样。”
到2048年,我的年纪将是77岁,我不希望自己超重,但是这篇文
章告诉我:我会的!
不用想都知道,《肥胖》杂志上的这篇文章引起了媒体的关注。
美国广播公司(ABC)发出了“肥胖启示”的警告,《长滩电讯日报》
(Long Beach PressTelegram)给出了一个直截了当的标题:“我们
越来越胖了”。对这个现象稍加研究,我们就会想到最近美国人在思
考国民道德现状时,面对各种不同现象所表现出来的焦躁多虑。在我
出生之前,男孩子们都留长发,于是人们担心年青一代会不务正业。
在我小的时候,我们喜欢玩街机游戏,于是人们觉得我们注定竞争不
过勤劳的日本人。现在,我们经常吃快餐,于是人们又怀疑我们将身
体虚弱、行动不便,像一摊泥一样,瘫在早已无法摆脱的沙发上死去,周围还堆满了空空的炸鸡桶。显而易见,这篇文章把这种焦虑当
作经过科学验证的事实了。
我要告诉大家一个好消息:到2048年,不会人人都超重。为什么
呢?因为不是所有的线都是直线。
但是,我们在前面讨论过,牛顿发现所有的线都与直线非常接
近,由此催生了“线性回归”(linear regression)这个概念。社会
学经常要用到线性回归分析这种统计学技术,就像居家维修要使用螺
丝刀一样。我们在报纸上看到的那些内容,诸如:有很多亲戚的人会
更幸福;“汉堡王”连锁店开得越多的国家,越容易面临道德沦丧的
问题;烟酸摄入量减半的话,患足癣的危险就会加倍;收入每增加1万
美元,美国人把选票投给共和党的可能性就会增加3%,等等。所有这
些,都是线性回归分析的结果。
下面,我告诉大家线性回归分析的使用方法。假设你要分析两个
事物之间的关系,比如大学学费与新生SAT平均分。你可能认为,SAT
分数高的学校,很有可能收费也高,但是我们稍做数据分析,就会发
现并非如此。毗邻北卡罗来纳州伯灵顿市的伊隆大学,新生数学与语
言测试的平均分是1 217分,年均学费是20 441美元。与伊隆大学距离
不远、位于格林波若的吉尔佛大学,学费稍高,为23 420美元,但是
新生的SAT平均分仅为1 131分。
如果进一步研究多所学校的情况,比如2007年把学费与SAT分数情
况报告给北卡罗来纳职业资源网的31所私立高校,就能清楚地看到某
种趋势。
下图中每个点分别代表其中一所高校。靠近右上角的位置有两个
点,SAT分数与学费都非常高,代表的是维克森林大学和戴维森学院。
靠近底部的位置有一个孤零零的点,代表的是卡巴拉斯健康科学学
院,是这些私立高校中唯一一所学费低于1万美元的大学。上图表明,总的来说,分数高的学校收费也高。但是,高多少
呢?这就需要在图中引入线性回归这个工具了。在上图中,所有的点
很明显都不在同一条直线上。但是,这些点并不十分分散,我们可以
徒手画出一条直线,从这些点比较集中的位置穿过。借助线性回归,无须猜测,就可以画出最接近于[1]所有点的直线。对于北卡罗来纳的
高校,这方面的大致情况可用下图表示。图中直线的倾斜角度约为28度,这意味着:如果学费真的完全取
决于SAT分数,而且决定关系可由我在图中绘制的直线来表示,那么
SAT分数每提高1分,与之相对应,学费就会增加28美元。如果新生的
SAT平均分提高50分,就可以把新生的人均学费提高1 400美元。(从
学生家长的角度看,孩子的分数提高100分,就意味着家长每年要多支
付2 800美元的学费。由此可见,考试辅导班比我们预想的要贵得
多!)
线性回归是一个非常实用的工具,用途广泛、操作简便,只需要
在数据表上完全不同。南达科他州很不幸地位列榜首,每10万
人中每年死于脑癌的人数为5.7人,远远超出每年3.4人的全美脑癌死
亡率。排在南达科他州之后的是内布拉斯加州、阿拉斯加州、特拉华
州和缅因州。如果我们不希望患上脑癌,可能就要避开这些地方。那
么,我们该搬到什么地方去呢?在这个名单的末尾,我们会发现怀俄
明州、佛蒙特州、北达科他州、夏威夷以及哥伦比亚特区。
这个结果有点儿奇怪。南达科他州脑癌频发,为什么北达科他州
却几乎没有人患上这种癌症呢?为什么住到佛蒙特州就安全,而住在
缅因州就有危险呢?
原因不是南达科他州一定会让居民患上脑癌,而北达科他州的居
民则对癌症免疫。排在榜首的这5个州有共同的特点,而排在榜尾的那
5个州也有相似之处,即这些地方人口稀少。在排在前面和末尾的这9
个州(及一个特区)中,人口最多的是内布拉斯加州。在人口排名的
竞争中,该州与西弗吉尼亚州是难兄难弟,双方为第37名的位置争得
热火朝天。这个分析结果似乎表明,居住在人口较少的州,患脑癌的
概率有可能高得多,也有可能低得多。很显然,这个结论没有任何道理,因此,我们最好换一种解释方
法。
为了更好地理解这种情况,我们先做一个虚拟游戏,游戏的名字
叫作“谁最善于抛硬币”。玩法很简单,将一把硬币抛出去,正面朝
上的硬币数量最多的一方获胜。我们给这个游戏增加一点儿趣味性,让大家手里握的硬币数量不同。有些人(“小数”组)只有10枚硬
币,有些人(“大数”组)则有100枚硬币。
如果以正面朝上硬币的绝对数量来计分,我们几乎可以肯定获胜
方是“大数”组的成员。“大数”组成员大多都有约50枚硬币正面朝
上,这个数字是“小数”组成员无法企及的。即使“小数”组有100名
成员,他们当中的最高得分也只能是8或9枚。
显然,这样的玩法并不公平,因为“大数”组拥有难以逾越的先
天优势。因此,我们可以改进这个游戏:在评分时,不以绝对数量为
依据,而是根据比例来计分。这样的计分方法,对两个组来说应该是
公平的。
但是,这个计分方法仍然不公平。我前面说过,如果“小数”组
有100名成员,至少有一个人可能抛出8枚正面朝上的硬币,因此他的
得分为80%。那么“大数”组的成员呢?他们都不会有80%的硬币是正
面朝上的。当然,可能性是存在的,但却不会发生。事实上,从概率
的角度看,“大数”组必须包含20亿名成员,出现过高或过低的结果
才是合理的。这个结论符合我们对于概率的直觉认识,抛的硬币越
多,越有可能出现一半正面朝上一半正面朝下的结果。
读者朋友们可以自己尝试一番,我就动手做过这个实验。为了模
拟“小数”组成员,我一次抛10枚硬币,连续抛很多次,硬币正面朝
上的数量构成下面这个序列:4,4,5,6,5,4,3,3,4,5,5,9,3,5,7,4,5,7,7,9……
然后,我模拟“大数”组成员,一次抛出100枚硬币,多次抛投的
结果为:
46,54,48,45,45,52,49,47,58,40,57,46,46,51,52,51,50,60,43,45……
每次抛1 000枚硬币的结果是:
486,501,489,472,537,474,508,510,478,508,493,511,489,510,530,490,503,462,500,494……
算了,还是跟大家坦白吧。我并没有真的抛1 000枚硬币,而是用
计算机模拟得出的结果,谁有那么多的时间抛1 000枚硬币呢?
不过,还真的有人这样做了。1939年,南非数学家克里奇(J. E.
Kerrich)因为冒失地跑到了欧洲,结果很快在丹麦被逮捕并被关进了
集中营。如果一个普通人被关在集中营,不知道猴年马月才能重见天
日,那么他可能会在牢房的墙壁上刻画记号记录天数,以此来帮助自
己度过这段难熬的时光。不过,克里奇这位热衷于统计学研究的囚犯
则不同,他总共将一枚硬币抛了1万次,还记录了正面朝上的数量,统
计结果如下图所示。从中我们可以看出,随着硬币的数量越来越多,正面朝上的概率
明显地向50%靠近,就好像被一把看不见的老虎钳钳住了一样。计算机
模拟也会产生同样的结果。抛10枚硬币,正面朝上的比例范围为
30%~90%;抛100枚,比例范围缩小,变为40%~60%;抛1 000枚,比例
范围仅为46.2%~53.7%。在某个规则的作用下,这个比例越来越接近
50%。这只不讲情面、无法抗拒的“手”就是“大数定律”(Law of
Large Numbers)。这里,我就不赘述这条定理了(尽管这条定理极具
美感),但是我们可以这样理解:抛的硬币越多,正面朝上的比例为
80%的概率就越小。事实上,如果抛的硬币足够多,结果为有51%的硬
币正面朝上的概率也是微乎其微的!在抛10枚硬币的情况下,如果得
到高度失衡的结果,并不值得我们关注。但是,如果抛100枚硬币,结
果仍然失衡,那就让人吃惊了,我们甚至会怀疑:是不是有人在硬币
上动了手脚?
随着实验不断重复,实验结果往往会趋于稳定,并接近一个固定
的平均值。事实上,自从运用数学方法研究概率以来,我们经常会得出这样的结论。16世纪的吉罗拉莫·卡尔达诺(Girolamo Cardano)
就用不是十分正式的方式提出了这个原则,但是,直到19世纪初,西
莫恩·德尼·泊松(Simeon-Denis Poisson)才赋予它一个简明扼要
的名字:大数定律。
抛硬币与法国警察的帽子
18世纪初,雅各布·伯努利(Jakob Bernoulli)完成了对大数定
律的精确表述与数学证明。如今,人们不再把他的研究结果视为观察
结果,而是一个定律。
根据这个定律,这种大数–小数的游戏并不公平。由于有大数定
律,“大数”组成员的得分有向50%靠拢的趋势,而“小数”组的得分
变化程度则较大。我们不能就此得出结论,认为“小数”组成员“更
善于”抛硬币,即使他们每次都能获胜。如果我们把所有“小数”组
成员(而不仅仅是得分高的成员)正面朝上的比例进行平均,结果就
会与“大数”组相仿,也接近50%。如果我们统计的不是硬币正面朝上
数量最多的,而是最少的,那么“小数”组成员的成绩就会一下子变
得非常糟糕,很有可能某位选手抛的正面朝下的硬币比例仅为20%,而
所有“大数”组成员的得分都不会这么低。统计正面朝上的绝对次数
会让“大数”组拥有无与伦比的优势,但是统计比例的方法同样会使
游戏不公平,只不过这次是“小数”组占便宜罢了。硬币的枚数(我
们在统计学中称之为“样本大小”)越少,正面朝上的硬币所占比例
的变异性就会越显著。
因此,在进行政治民意测验时,如果投票人数很少,调查结果就
不那么可靠。脑癌的调查也是如此。在人口较少的州,其样本数量比
较小,因此,统计结果就会像羸弱的小草一样,一旦概率这股狂风吹
过来,它们就会东倒西歪,而那些人口大州就像参天大树,在狂风中傲然挺立。如果统计脑癌致死的绝对人数,人口大州的结果就会偏
高,但是,如果计算脑癌致死人数的最高比例(计算最低比例的结果
也一样),又会把人口少的州推到靠前的位置。南达科他州是脑癌死
亡人数比例最高的州之一,而北达科他州却位于最低的行列,原因就
在这里。不是因为拉什莫尔山或者华尔药局会散布某种对大脑有害的
毒素,而是因为小数比例天性多变。
我们都非常熟悉这个数学事实,只是有时我们视而不见罢了。大
家知道谁是NBA(美国职业篮球联赛)中的神投手吗?在2011~2012赛
季中的某一个月里,有5名球员投篮命中率相同,并列全联盟榜首。这
5名球员是阿蒙·约翰逊(Armon Johnson)、德安德鲁·利金斯
(DeAndre Liggins)、莱恩·瑞德(Ryan Reid)、哈西姆·塔比特
(Hasheem Thabeet)和罗尼·图里亚夫(Ronny Turiaf)。
那么,到底谁投篮最准呢?
这个问题可不好回答。他们都不是NBA最优秀的投手,连上场机会
都很少。比如,阿蒙·约翰逊只代表波特兰开拓者队打了一场比赛,他有一次投篮,而且投进了。名单上的这5个家伙一共投篮13次,全部
命中。小样本更多变,因此NBA的最优秀投手总是多次投篮而且运气不
错的球员。尼克斯队的泰森·钱德勒(Tyson Chandler)一个赛季投
篮202次,有141次命中得分,在打满所有场次比赛的球员中名列榜
首。显然,我们不会说阿蒙·约翰逊的投篮比钱德勒更精准。(如果
有人对此表示怀疑,可以去看看约翰逊在2010~2011赛季的表现。在那
个赛季,他的投篮命中率一直保持在45.5%,这样的命中率十分普
通。)因此,阿蒙·约翰逊这样的球员根本不会出现在NBA的球星排行
榜上。NBA的各种排名都对上场时间设定了最低要求,否则,由于小样
本的特点,上场时间很短的不知名球员就会上榜。
但并不是所有人都了解这些数量关系,因此在设计排名系统时可
能没考虑到大数定律。如今,许多地方都在实施教育责任制,例如,北卡罗来纳州制订了一个奖励计划,对标准化考试成绩出众的学校实
施奖励。该计划根据每名学生的考试成绩在一年时间内(从春季开
始)取得进步的平均幅度,来评定各校的教学情况,在全州范围内排
名前25位的学校,可以在体育馆悬挂横幅,还可以在周边城镇炫耀一
番。
哪所学校获胜了呢?1999年,获得最高分的是北威尔克斯博纳的
莱特小学,该校的“教学质量得分”为91.5分。北卡罗来纳所有小学
的平均在校人数接近500人,而莱特小学属于学生较少的学校,只有
418人就读。排在莱特小学之后的是金斯伍德小学,得分为90.9分。里
弗赛德小学名列第三,得分为90.4分。金斯伍德只有315名学生,而位
于阿帕拉契山脚下的里弗赛德小学规模更小,只有161名学生。
事实上,在北卡罗来纳州的这次评比中,规模较小的学校大多取
得了不错的成绩。托马斯·基恩(Thomas Kane)与道格拉斯·施泰格
(Douglas Staiger)的一项研究发现,在历时7年的研究中,该州规
模最小的学校中有28%的学校曾经排在前25位,而在所有学校中,只有
7%的学校曾经悬挂过横幅。
这次评估似乎说明,在规模较小的学校里,老师们了解学生及其
家庭的情况,有时间进行单独辅导,因此更有可能提高学生的考试成
绩。
不过,我要告诉大家一个事实:基恩与施泰格合作完成的论文标
题为“学校教育评估手段失当的可能与常见问题”。平均而言,在规
模较小的学校中,学生的考试成绩并没有表现出显著高于其他学校的
情况。此外,该州被派驻“帮扶工作组”的学校(我的理解是因考试
成绩低下而被该州官员训斥的学校)大多规模较小。
在我看来,上述情况表明,里弗赛德小学算不上北卡罗来纳州最
优秀的学校,其道理就与阿蒙·约翰逊不是联盟最优秀的投手一样。前25名之所以大多是规模小的学校,并不是因为这些学校更加优秀,而是因为它们的考试分数更加多变。只要有几名天才学生或者三流的
差生,它们的平均成绩就会发生很大的起伏。而在规模较大的学校,即使出现几个过高或过低的分数,在庞大的学生总数面前,其影响作
用也几乎可以忽略不计。
既然求平均数这个简单方法无法奏效,那么我们如何了解哪所学
校最优秀,或者哪个州的癌症发病率最高呢?如果我们管理着多支团
队,那些小型团队很有可能占据评定系统的两端,我们又如何评估各
团队的绩效呢?
这个问题并不容易解决。如果在南达科他这样人口很少的州接连
出现脑癌病例,我们可以推测脑癌病例数量激增很有可能是因为运气
欠佳,我们还可以估计,该州将来的脑癌发病率很有可能会有所下降
并接近全美整体水平。为了分析这种情况,我们可以用全美脑癌发病
率对南达科他州脑癌发病率进行某种加权处理。但是,如何加权呢?
这是一种艺术,同时还需要完成大量的技术性工作。这里,我就不一
一赘述了。
第一个观察相关事实的是亚伯拉罕·棣莫弗(Abraham de
Moivre)。棣莫弗为现代概率论的初期研究做出了贡献,他在1756年
出版的著作《机会论》(The Doctrine of Chances)是这一领域的重
要文献。早在棣莫弗的时代,人们就已经开始不遗余力地从事数学新
进展的推广工作,埃德蒙·霍伊尔(Edmond Hoyle)是其中的典型代
表。他在牌类游戏方面是绝对权威,时至今日,人们还在说“根据霍
伊尔规则”……霍伊尔写过《机会论快速入门》,目的是帮助赌徒们
掌握这套新理论。
大数定律认为,从长远看,不断地抛硬币,正面朝上的比例会越
来越接近50%。但是,棣莫弗觉得这样的表述不够完美,他希望精确地
了解接近的程度。为了更好地解释棣莫弗的发现,我们再次研究抛硬币时使用的计数方法。不过,我们这一次不再只是简单地列出正面朝
上的硬币数量,而是记录实际得到的正面朝上的数量与期望值(硬币
总数的50%)之间的偏差。换句话说,我们计算实际情况与理想情况之
间的偏差。
用10枚硬币做实验,多次抛投后得到的偏差为:
1,1,0,1,0,1,2,2,1,0,0,4,2,0,2,1,0,2,2,4……
每次抛100枚硬币后得到的偏差为:
4,4,2,5,2,1,3,8,10,7,4,4,1,2,1,0,10,7,5……
每次抛1 000枚硬币后得到的偏差为:
14,1,11,28,37,26,8,10,22,8,7,11,11,10,30,10,3,38,0,6……
从中可以看出,随着抛硬币次数的增加,虽然偏差与硬币总数的
比值在逐步缩小,但是绝对偏差在不断变大(这是由大数定律决定
的)。棣莫弗敏锐地发现,硬币数量的平方根直接影响典型偏差的大
小。如果硬币的数量是上一次的100倍,那么典型偏差的增长系数就是
10,至少绝对偏差的增长系数为10。如果以在硬币总数中所占的比例
来计算,偏差就会随着硬币数量的增加而减小,因为硬币数量平方根
的增加速度比硬币数量的增加速度慢得多。抛1 000枚硬币,与理想情
况的偏差可能多达38,但是如果计算占硬币总数的比例,则与50%的偏
差仅为3.8%。棣莫弗的观察结果,与政治民意测验中计算标准误差(standard
error)[1]的基本原理一致。如果希望将误差条线(error bar)减小
一半,就需要将调查对象增加三倍。如果希望体验连续抛出正面朝上
的结果有多么令人惬意,先要想一想这个概率与50%之间有几个平方根
的差距。100的平方根是10,因此,如果抛100枚硬币,有60枚正面朝
上,那么与50%之间的差距正好是一个平方根。1 000的平方根约为
31,因此,如果1 000枚硬币中有538枚正面朝上,尽管这一次正面朝
上的比例为53.8%,而上次为60%,但这一次的结果会更让我意想不
到。
棣莫弗的研究还没有结束。他发现,随着硬币数量的增加,正面
朝上的比例与50%之间的偏差逐渐形成了完美的钟形曲线,也就是商业
中所谓的正态分布。统计学先驱弗朗西斯·伊西德罗·埃奇沃思
(Francis Ysidro Edgeworth)建议把这条曲线叫作“法国警察的帽
子”,但遗憾的是,他的这个提议没有得到广泛的认可。
钟形曲线的中间部分高高隆起,而边缘部分则非常平坦,也就是
说,硬币的数量与零的距离越远,发生偏差的可能性就越小,而且可
以精确地量化。抛N枚硬币,与有50%的硬币正面朝上这个理想结果之
间的偏差,不超过N的平方根的概率约为95.45%。1 000的平方根约为
31,在上面讨论的抛1 000枚硬币、重复20次的实验中,正面朝上的硬
币数量与500的差在31以内的有18次(90%)。如果继续进行这个实
验,正面朝上的硬币数量为469~531枚的概率就会越来越接近95.45%。
[2]这种情况似乎是某种力量在刻意为之。棣莫弗也有这种感觉,他
多次提到这个问题,认为抛硬币(或者其他研究概率的所有相关实
验)都出现这样的规律,是上帝之手在起作用。上帝把抛硬币、掷骰
子和人类生活的短时不规则行为,转化为可以预测的长期行为,其中
的规律无法更改,但是公式可以破译。这样的想法其实十分危险。如果我们认为有一只超自然的手(上
帝的手也好,幸运女神或者印度教吉祥天女的手也罢)在操纵这些硬
币,使半数硬币正面朝上,我们就会掉进所谓的“平均定律”(law
of averages)的陷阱:认为在出现数次正面朝上之后,下一枚硬币几
乎肯定是反面朝上;或者认为在生了三个男孩之后,下一个肯定会生
女儿。棣莫弗不是说过极端结果是极不可能发生的吗?例如连生4个儿
子,他确实说过这样的话。但是,在生了三个儿子之后,第四个仍然
是男孩的情况并不是不可能。事实上,这一次与第一次生男孩的概率
相同。
乍一看,这似乎与大数定律互相矛盾。根据大数定律,我们生男
孩和生女孩的概率应该是相等的。[3]其实,这种矛盾是一种假象。看
看抛硬币的情况,更容易理解这个问题。如果我们抛硬币连续10次得
到正面朝上的结果,我们可能会觉得这枚硬币很奇怪。后文会接着讨
论这个问题,但是目前我们假设这枚硬币没有问题,随着抛硬币的次
数增多,正面朝上的比例肯定会接近50%。
根据常识,在连续10次得到正面朝上的结果后,下一次反面朝上
的概率肯定要略高一点儿,只有这样才能修正目前的不平衡状况。
但是,常识也非常明确地告诉我们,硬币肯定无法记得前10次是
什么样的结果!
我还是开诚布公地为大家答疑解惑吧:我们根据常识完成的第二
次分析是正确的。“平均定律”这个说法不妥当,因为“定律”应该
是正确的,而所谓的“平均定律”却是错误的。硬币没有记忆,因
此,再次抛出硬币时,正面朝上的概率仍然是50%。总的比例会趋近于
50%,但这并不意味着在出现若干次正面朝上的结果后,幸运女神就会
青睐反面。实际的情况是,随着抛硬币的次数越来越多,前10次结果
的影响力就会越来越小。如果我们再抛1 000次,那么这1 010次正面
朝上的比例仍然接近50%。大数定律不会对已经发生的情况进行平衡,而是利用新的数据来削弱它的影响力,直至前面的结果从比例上看影
响力非常小,可以忽略不计。这就是大数定律发生作用的原理。
评判暴行的数学方法
前文对抛硬币与考试分数的分析,同样适用于大屠杀与种族灭绝
行为。如果我们根据死亡人数在全国人口中所占比例来评判这些事
件,那么在分析人口总数非常小的国家所发生的暴行时往往会犯非常
严重的错误。马修·怀特(Matthew White)在他的《暴行备忘录》
(Great Big Book of Horrible Things)一书中,心平气和地研究了
各种恐怖事件,并使用上述方法来评判20世纪发生的暴行。他认为,排在前三位的分别是德国殖民者对纳米比亚赫雷罗人的大屠杀、波尔
布特对柬埔寨人的屠杀和利奥波德国王在刚果发起的殖民战争,而希
特勒的暴行却榜上无名。
这种分析方法对人口较少的国家有失公允,因此有可能导致某些
问题。我们在阅读以色列、巴勒斯坦、尼加拉瓜或者西班牙人惨遭屠
杀的报道时,心情会十分沉痛。在衡量这种悲痛程度时,我们能找到
经过数学方法验证的评判方法吗?
我可以告诉大家一个我自认为行之有效的经验法则:如果屠杀的
规模非常之大,导致“幸存者”为数不多时,用比例的方式来表示死
亡人数是可行的。我们在提到卢旺达种族大屠杀的幸存者时,指的很
可能是生活在卢旺达的图西人,因此,我们可以说种族暴力行为屠杀
了75%的图西人。我们也可以说,导致75%的瑞士人罹难的灾害,其悲
惨程度等同于图西人遭遇的种族灭绝惨剧。
但是,如果我们把一名西雅图居民称作“9·11”恐怖袭击事件的
“幸存者”,就有点儿荒谬了。因此,用其在美国人口中所占比例来
评价“9·11”恐怖袭击的恶劣程度,可能并不是很妥当,在“9·11”恐怖袭击事件中死亡的人占美国人口的比例仅为0.001%。这
个数字非常接近于零,凭直觉我们很难正确理解这样一个比例到底意
味着什么。
我们既不能使用绝对数,又不可以使用比例,那么我们到底如何
评判这些暴行呢?有时候,利用比较的方式会取得不错的效果。比
如,卢旺达种族大屠杀比“9·11”恐怖袭击事件恶劣,“9·11”恐怖
袭击事件比哥伦拜恩校园枪击事件恶劣,哥伦拜恩校园枪击事件又比
造成1人死亡的醉驾事故恶劣。但是,由于时空关系,还有的事件难以
比较。“三十年战争”真的比第一次世界大战更惨烈吗?卢旺达种族
大屠杀的发生速度之快令人瞠目结舌,而两伊战争则旷日持久,这两
者又如何比较?
大多数数学家认为,历史上的这些惨剧和暴行形成了所谓的“半
序集”(partially ordered set)。也就是说,在这些灾难中,有的
可以两两比较,其他的则无法比较。这个观点看似高明,其实不然,因为我们并没有统计出精确的死亡人数,在评判导致人员死亡的炸弹
袭击与战争引发的饥荒这两类事件时,对于哪一类事件更为恶劣的问
题也没有形成明确的结论;因为比较战争残忍程度的问题和比较数量
大小的问题,在本质上是完全不同的。比较数量大小时,我们总是能
得出答案,而比较战争的残忍程度时,有时候我们却无法判断哪一场
战争更加残忍。如果我们希望了解26人在恐怖袭击中丧生的悲剧会给
我们带来什么样的感受,我们可以想象这次恐怖袭击就发生在我们所
在的这座城市,而不是远在地球的另一端,同时还造成26人罹难。这
个方法无论在数学还是道德层面都是无可指摘的,也不需要进行复杂
的计算。
[1] 统计学专业知识丰富的读者应该可以注意到,我一直小心翼翼地避免使用“标准偏
差”(standard deviation)这个术语。其他读者如果希望进一步了解它,需要查询相关资
料。[2] 准确地讲,这个概率比95.45%略小,更接近95.37%,因为1 000的平方根不是31,而是略大于31。
[3] 其实,生男孩的概率是51.5%,生女孩的概率是48.5%,但是,这又有什么关系呢?第5章 比盘子还大的饼状图
即使在分析一些相对简单、看似争议不大的问题时,计算比例的
方法也可能会误导我们。
经济学家迈克尔·斯宾塞(Michael Spence)与桑戴尔·赫施瓦
约(Sandile Hlatshwayo)在一篇论文中描绘了美国就业增长态势的
美好图景。一直以来,人们自信地认为美国是一个工业化大国,工厂
在夜以继日地生产全世界急需的各种产品。但是,目前的现实却大不
一样。1990~2008年,美国经济实际创造了2 730万个就业岗位,其
中,有2 670万个(占98%)来自非贸易部门,即政府、医疗、零售与
饮食服务等领域,这些领域的工作不可外包,产品也不可销往海外。
98%这个数字很好地反映了美国近代工业的发展史,因此,《经济
学人》(Economist)杂志、比尔·克林顿(Bill Clinton)的新书等
各类出版物纷纷加以引用。但是,我们必须搞清楚这个数字的确切含
义。98%与100%非常接近,那么,这项研究是不是说明美国经济体中的
就业增长几乎全部集中在非贸易部门呢?似乎的确如此。实际上,这
个结论并不完全正确。1990~2008年,贸易部门新增的就业岗位仅为62
万个,而且,就实际情况而言,这还不是最糟糕的结果,因为在这段
时间内,贸易部门的就业岗位甚至一度面临不增反降的危险。
2000~2008年,贸易部门的就业岗位有所减少,缩水了大约300万个,而非贸易部门则新增700万个就业岗位。在400万个新增岗位中,非贸
易部门贡献了700万个,占总数的175%。
因此,我们必须牢记下面这条箴言:
在数字有可能是负值时,不要讨论它们的百分比。也许有人会认为我小心过头了。负数也是数字,与其他数字一
样,可以进行乘法与除法的运算。实际上,这个问题并不像我们一开
始想的那样无足轻重。数学领域的前辈们甚至不清楚负数到底是不是
数字,因为负数表示的数量意义与正数不完全相同。卡尔达诺、韦达
(Francois Viete)等16世纪伟大的代数学家们,就负数与负数的乘
积是否为正数的问题争论不休,他们都认为从一致性角度来看负数与
负数的乘积必须是正数,但这到底是已经证明的事实还是仅仅针对这
套符号系统的权宜之计,他们在这个问题上的观点大相径庭。卡尔达
诺在解方程时,如果得到的根中有一个负数,他就习惯性地把这个讨
厌的根称作“假根”(fi cta)。
针对这个问题,文艺复兴时期的意大利数学家们给出了各种各样
的证明过程,在我们看来,有的证明与他们的宗教理论一样深奥难
懂,而且相关性不强。但是,他们的有些观点却不无道理:如果把负
数与百分比等代数运算相结合,就会让人类的直觉无所适从。如果你
们违背我送给你们的这条箴言,各种稀奇古怪的不一致现象就会纷至
沓来。
我举个例子来说明这个问题。假设我开了一家咖啡店,但是咖啡
卖得并不好。上个月,我在咖啡销售方面亏损了500元。不过,我有先
见之明,我的咖啡店还销售点心和CD(光盘),这两种业务则分别为
我赚了750元。
总的算来,我这个月赚了1 000元,其中75%的盈利来自点心销
售。因此,点心销售似乎是目前的主要赢利项目,而且几乎所有的利
润都是销售羊角面包赚来的。但是,我也可以认为,利润的75%来自CD
销售。假如我在咖啡销售方面的亏损增加了1 000元,我的总利润就是
零,点心销售在盈利中所占的比例就是无穷大。[1]“75%”似乎意味着
“几乎全部”,但是如果考虑的是可能为正值也可能为负值的数字,例如利润,那么这个百分比所代表的含义可能会发生翻天覆地的变
化。
我们在学习只能取正值的数字(例如开支、收入或人口)时,不
会出现上述问题。如果75%的美国人都认为保罗·麦卡特尼(Paul
McCartney)是甲壳虫乐队中最可爱的成员,就不可能会有75%的美国
人会选择林戈·斯塔尔(Ringo Starr)。林戈、乔治(George)[2]
与约翰(John)只能分享剩余的25%的支持率。
我们从就业数据中也能发现此类现象。如果斯宾塞与赫施瓦约
说:金融与保险业创造了60万个就业机会,在整个贸易部门创造的所
有就业机会中所占的比例约为100%,可不可以呢?可以,但是他们并
没有这样说,这是因为他们不希望大家错误地以为,在那段时间里,美国经济的其他领域没有取得增长。大家可能仍然记得,自1990年至
今,美国经济中至少还有一个领域增加了大量就业机会——那个被命
名为“计算机系统设计与相关服务”的领域,凭一己之力,新增了100
多万个就业岗位,就业人数是最初的三倍之多。金融与计算机领域新
增的就业机会,远多于整个贸易部门创造的62万个新岗位,但是超出
的部分与制造业显著减少的岗位数相互抵消了。在将正数与负数放到
一起处理时,稍不留意,就会形成错误的认识,以为贸易部门的新增
岗位全都是金融业做出的贡献。
对于斯宾塞与赫施瓦约在论文中提出的观点,我们并没有充分的
理由表示反对。的确,数百个行业的总就业增长率有可能是负数,但
是在一个相当长的时期里,在经济环境正常的情况下,则极有可能是
一个正数。毕竟,人口一直在增长,只要不发生大灾难,就业机会就
会随之增加。
然而,有些人在分析中使用百分比时却不那么小心。2011年6月,威斯康星州的共和党人发布了一则新闻,大肆吹捧州长斯科特·沃克
尔(Scott Walker)创造了就业增长的新纪录。当时,美国经济从整体看延续了上个月的糟糕局面,全国仅增加了1.8万个就业岗位,而威
斯康星州的就业增长却表现出好得多的势头,净增9 500个就业机会。
这则新闻宣称:“我们发现,全美6月的就业增长,有超过50%要归功
于我们威斯康星州。”共和党的政客们对这个观点津津乐道并四处宣
传,议员吉姆·森森布莱纳(Jim Sensenbrenner)就曾在密尔沃基的
一个郊区说:“上周发布的人力资源报告指出,全美新增1.8万个就业
机会,其中的一半来自威斯康星州。这说明我们在这里的努力已经取
得了效果。”
这个例子充分说明,如果以百分比的方式报道净增就业机会等既
可能是正值也可能是负值的数字,就会陷入尴尬的境地。威斯康星州
增加了9 500个就业机会,这当然是好事,但是,与此同时,邻近的明
尼苏达州在民主党人、州长马克·代顿(Mark Dayton)的领导下,创
造了超过1.3万个新增岗位,得克萨斯州、加利福尼亚州、密歇根州和
马萨诸塞州的增长幅度也超过威斯康星州。的确,威斯康星州这个月
取得了不错的就业成绩,但是它所做出的贡献,并不像共和党在新闻
中暗示的那样,等于其余各州新增就业机会的总和。原来,其中的奥
秘在于,其他各州减少的就业机会几乎正好抵消了威斯康星州、马萨
诸塞州、得克萨斯州等地的新增就业岗位。也正因为如此,威斯康星
州州长才有可能宣称该州为全美的就业增长做出了一半的贡献。如果
明尼苏达州州长愿意,他也可以宣布全美新增就业机会中的70%要归功
于他们州。两位州长的说法从技术上讲正确无误,但是从根本上讲却
极易误导人。
接下来,我再以史蒂文·拉特勒(Steven Rattner)在《纽约时
报》(New York Times)上发表的专栏文章为例。该文引用了经济学
家托马斯·皮凯蒂(Thomas Piketty)和伊曼纽尔·赛斯(Emmanuel
Saez)的研究成果,认为美国人从当前的经济复苏中获取的好处并不
均衡。新的统计数据表明,富人与其他人在财富上的差距越发地令人
吃惊,我们急需解决这个问题。即使在一个对于收入不均衡已经习
以为常的国家,这样的发现也让人震惊。
2010年,美国经济仍然处于恢复阶段。在2009年的2 880亿美
元国民收入基础上的新增收入中,有高达93%(比例之高令人瞠
目)的部分被前1%的纳税人收入囊中,而这些人当中收入最低的也
有35.2万美元入账……2010年,在排除通胀因素之后,收入排名为
后99%的美国人的人均新增收入,只有微薄的80美元。而收入排名
前1%的人的平均收入是1 019 089美元,增加了11.6%。
这篇文章还给出了一个构思巧妙的信息图,将收入增加部分的构
成做了进一步细分:37%的新增收入为前0.01%的超级富豪所有,56%属
于前1%中的其他富人,而剩余99%的人则只能分享少得可怜的7%。我们
可以利用这些数据制作一个简单的饼状图:接下来,我们把这幅饼状图再细分一次,考虑前10%中去掉前1%后
剩余人口的收入增长情况。这个部分包含家庭医生、非精英律师、工
程师与中高级管理人员,他们占多大比例呢?皮凯蒂与赛斯非常热
心,在网上分享了他们收集的数据,我们可以从中找到这个问题的答
案。我们发现,这个答案有点儿奇怪。2009年,这部分美国人的平均
收入约为15.9万美元;2010年,他们的人均收入有所增加,略高于
16.1万美元。尽管这个增幅与前1%的富人的新增收入相比显得有些寒
酸,却为2010~2011年全美收入增长总额做出了17%的贡献。饼状图中,在前1%的人口所占93%的份额的基础上再加上17%,你
会发现,饼状图无法表示了,因为饼比盘子还大。
93%与17%相加的和超过100%,怎么可能呢?其实很好理解,因为
在2011年收入排名后90%的人口中,有的人经济状况有所好转,有的则
没有起色,他们的总体平均收入实际上比2010年还要低。当混合到一
起时,由于负数的存在,使用百分比的方法就会出错。
在皮凯蒂–赛斯数据中,我们会一次又一次地发现同样的问题。
1992年,收入排名前1%的人的新增收入占全美收入增长总额的131%!
这个数字当然会给人留下深刻的印象,但是同时这个数字也表明,百
分比的含义与我们惯常的理解并不完全一致——我们无法让131%在饼
状图中表示出来。1982~1983年,美国再一次从经济衰退中恢复过来,国民新增收入总额中的91%应归功于收入排名前10%但不包括前1%的那
部分人。这个数字是不是意味着比较富裕的职业人士抓住了经济恢复
的良机,而中产阶层与非常富裕的人群则被他们甩在身后了?并非如
此,前1%的超富阶层也取得了令人满意的进展,贡献了国民新增收入
总额的63%。对于收入排名前10%的人而言,经济形势一片光明,但是
排名后90%的人口却节节败退,收入没有增加。
这些研究都没有否认经济复苏的曙光照射到美国富人身上的时间
要稍早于中产阶层,但是,对美国经济形势的分析却有失偏颇。研究
似乎表明,经济复苏仅使1%的人受益,而其余美国人都饱受折磨,但
真实情况并非如此。排名前10%但没进入前1%的美国人(坦率地讲,很
多《纽约时报》专栏评论的读者也包含在内),收入也很高,收入增
加的幅度是饼状图所示的7%的两倍还多。前景一片黯淡、看不到一点
儿希望的是剩余90%的人口。
即使所涉及的数字碰巧都是正数,人们仍然有可能曲解百分比。
2012年4月,民意测验结果显示,米特·罗姆尼(Mitt Romney)在女
性选民中的支持率很低,于是他的竞选团队发表了一项声明:“奥巴马政府导致美国女性陷入了非常艰辛的境地。在奥巴马总统的领导
下,苦苦挣扎、四处找工作的女性人数是有史以来最多的,失业人口
中有92.3%的人是女性。”
从演讲的角度来看,这则声明毫无破绽。据美国劳工统计局的相
关数据,2009年1月美国的总就业人口为13 356.1万,而2012年3月仅
为13 282.1万,减少了74万。在女性人口中,这两年的就业人数分别
是6 612.2万和6 543.9万,因此与奥巴马入主白宫的2009年1月相比,2012年3月的女性就业人数减少了68.3万。拿这个数字与第一个数字相
除,就会得到92%这个数字。看起来,奥巴马总统似乎一直在四处奔
走,劝说所有的企业解雇所有的女性员工。
这样的算法并不正确。这些数字都是岗位损失净值,而且我们也
不知道在这三年时间里,增加与减少的工作岗位分别有多少,我们只
知道这两者的差是74万。岗位损失净值有时是正值,有时则是负值,因此单纯地计算百分比有可能会出问题。假设罗姆尼竞选团队从2009
年2月[3]才开始统计美国失业人口,结果会怎么样呢?2009年2月,美
国经济没有任何好转,总就业人口跌至13 283.7万。到2012年3月,美
国的岗位损失净值为1.6万,女性减少的工作机会为48.4万(不过,这
个数字的绝大部分被男性岗位的增加数抵消了)。由此可见,罗姆尼
团队错失了一个良机。如果他们在奥巴马就任总统满一个月后,即从
2009年2月开始计算美国女性的就业情况,他们就可以理直气壮地指
出,在奥巴马任期内,女性损失的工作岗位数在岗位减少总数中占3
000%!
但是,稍有头脑的选民都能看出来,这样的百分比应该是不正确
的。
那么,从奥巴马宣誓就职到2012年3月这段时间里,男性与女性就
业人口到底发生了哪些变化呢?这需要分成两个时间段来看。2009年1月~2010年2月,由于受到经济衰退及其余波的影响,男性与女性的就
业形势急转直下。
2009年1月~2010年2月:
男性岗位损失净值:297.1万
女性岗位损失净值:154.6万
第二阶段是后衰退期,就业情况开始逐渐好转。
2010年2月~2012年3月:
男性岗位增加净值:271.4万
女性岗位增加净值:86.3万
在就业情况急剧恶化时期,男性面临的就业形势十分严峻,损失
的工作岗位数几乎是女性的两倍。而在经济恢复期,男性得到的新工
作机会占新增岗位总数的75%。综合考虑这两个时期,男性的就业人数
几乎持平。但是,如果认为当前面临糟糕经济形势的只有女性,那么
这样的观点非常不明智。
《华盛顿邮报》对罗姆尼团队提出的92.3%这个数字给出的评价是
“真实但是不正确”。罗姆尼的支持者们对这个评价大加嘲讽,而我
认为这个评价不仅没有问题,还告诉我们使用统计数字时应当注意的
一些深层次问题。毫无疑问,这个数字是正确的,用女性岗位损失净
值除以岗位损失总净值,就会得到92.3%。
但是,这样的“真实性”没有多大意义。如果奥巴马团队发表声
明:“有人指控,多年来罗姆尼操控着一个在哥伦比亚与盐湖城之间贩卖可卡因的贩毒团伙,而罗姆尼本人也从来没有否认这项指控。”
其效果就与这个数字的影响力相仿。
这则声明也是100%真实的,但它的目的是给人们留下一个不正确
的印象。因此,“真实但是不正确”这个评价完全公平合理。这是一
个错误问题的正确答案,从某种意义上讲,它的影响比单纯的计算错
误更为恶劣。我们往往以为所谓谨慎的定量分析,就是我们用计算器
完成某个计算,但是,我们必须先弄清楚计算的对象,然后才能使用
计算器进行计算。
我认为这样的错误应归咎于数学应用题,人们之所以对数学与现
实之间关系的认识严重失真,数学应用题难辞其咎。“鲍比有300颗弹
子,他把30%的弹子给了詹尼,他给吉米的弹子是给詹尼的一半,他还
剩多少颗弹子?”这个问题看上去是现实世界中发生的问题,但其实
就是一个代数问题,只不过有了一层并不高明的伪装而已。这道应用
题与子弹没有一点儿关系,我们也可以这样说:在计算器里输入“300
–0.30×300–0.30×300÷2=”,然后抄写答案!
但是,现实世界中的问题与数学应用题完全不同。现实问题应该
是:“经济衰退及其余波是否对职场女性的影响尤为显著?如果是,它在多大程度上是由奥巴马政府的各项政策造成的?”而计算器上根
本找不到这样的按键。为了给出合乎情理的答案,我们不仅需要知道
一些数字,还需要回答多个问题。在某个经济衰退期内,表示男性、女性工作岗位减少情况的曲线是什么形状?从工作岗位减少的情况
看,本次经济衰退是否显著不同?与男性相比,女性从事的哪些工作
比例失衡?奥巴马的哪些决定对这个经济领域产生了影响?我们必须
先把这些问题转变成算式,然后才可以用计算器计算。等到使用计算
器时,真正需要思考的问题应该已经解决了。用一个数除以另一个数
只是单纯的计算,考虑清楚用什么除以什么才是真正的数学问题。
[1] 除非得到世界公认的数学家的指导,否则绝对不要把零用作除数。[2] 实际上,甲壳虫乐队中最可爱的是乔治。
[3] 格伦·柯斯勒(Glenn Kessler)撰文分析了罗姆尼在2012年4月10日《华盛顿邮
报》(Washington Post)上刊登的竞选广告,本书借鉴了柯斯勒的分析结果。第二部分 推理
精彩内容:
●《托拉》中隐含的信息
●古老的预言与回旋余地
●零假设与显著性检验
●斯金纳与莎士比亚
●“霹雳旋风式扣篮”
●紧密相连的素数对
●被“屈打成招”的数据
●公立学校讲授“神创论”的正确方法第6章 圣经密码与股市预测
人们在处理小到日常琐事(“我还要等多长时间,下一趟车才会
来”),大到宇宙探索(“在创世大爆炸发生百亿分之一秒之后,宇
宙是什么样”)等各类问题时,都会用到数学知识。
但是,有大量的问题却超出了宇宙探索的范畴,它们关注的是万
物的意义与起源。对于这类问题,我们可能会认为数学知识无能为
力。
绝不可以小看数学扩张领土的雄心。希望了解上帝吗?没问题,我们有数学家正在从事相关研究。
很早以前,有人认为尘世间的凡人可以通过理性观察了解高高在
上的神。20世纪犹太学者迈蒙尼德(Maimonides)宣称,早在一神论
诞生之际,就存在这样的观点。迈蒙尼德的重要著作《第二托拉》
(Mishneh Torah)对亚伯拉罕的启示有如下描述:
虽然亚伯拉罕刚断奶时年纪尚幼,但是他已经开始思考了。他
日夜不停地考虑这些问题:“这个(天)球一直引导着我们的世
界,但却没有人引导它,也没有人让它转动,这怎么可能呢?它不
可能自动旋转啊?”他苦思冥想,终于找到了真理之路。他知道冥
冥之中有一个上帝,是上帝引导这个球,创造了万物。在所有的存
在之中,上帝是唯一的神……于是,他不遗余力地向全世界传播他
的发现,引导人们相信整个宇宙只有一位创世者,那就是上帝,我
们应该对其顶礼膜拜……人们纷纷找上门来,对他的断言提出了各
种质疑,他尽其所能为每个人答疑解惑,直到他们也走上真理之
路。于是,成千上万的人加入了他的行列。关于宗教信仰的想象特别对数学思维的胃口。我们相信上帝,不
是因为有天使与我们接触,不是因为某一天我们敞开了心扉、让上帝
的圣光照射进来,当然也不是因为父母亲的谆谆教诲,而是因为上帝
是一种必然存在,就像8×6一定等于6×8一样。
如今,亚伯拉罕式的辩论(只要看看周围万物就会知道,如果没
有经过精心设计,它们怎么可能如此美妙绝伦)已经被认定为说服力
不足,至少在科学界大多数人是这样认为的。我们现在拥有显微镜、望远镜和计算机,我们无须再把自己关在屋子里,茫然无措地盯着月
亮发呆,我们还收集了海量数据,也拥有各种工具去处理这些数据。
犹太拉比学者最青睐的 ......
——大数据时代,数学思维的力量
[美] 乔丹·艾伦伯格 著
胡小锐 译
中信出版社献给坦妮娅(Tanya)学习数学的精髓时不能只抱着应付差事的心理,而应该把这些知识融入日常思维,并通过各种激励手
段使它们反复出现在你的脑海里。
——伯特兰·罗素(Bertrand Russell),《数学研究》(The Study of Mathematics)目录
引言 数学知识什么时候能派上用场呢?
第一部分 线性
第1章 要不要学习瑞典模式?
第2章 不是所有的线都是直线
第3章 到2048年,人人都是胖子?
第4章 触目惊心的数字游戏
第5章 比盘子还大的饼状图
第二部分 推理
第6章 圣经密码与股市预测
第7章 大西洋鲑鱼不会读心术
第8章 美丽又神秘的随机性
第9章 肠卜术与科学研究
第10章 大数据与精准预测
第三部分 期望值
第11章 中彩票大奖与期望值理论
第12章 效用理论、风险与不确定性
第13章 祝你下一张彩票中大奖!
第四部分 回归
第14章 我们为什么无法拒绝平庸?第15章 父母高,孩子不一定也高
第16章 因为患了肺癌你才吸烟的吗?
第五部分 存在
第17章 所谓民意,纯属子虚乌有
第18章 一个凭空创造出来的新奇世界
结语 如何做出正确的决策?
致谢
版权页引言
数学知识什么时候能派上用场呢?
在地球上某个地方的一间教室里,一位数学老师布置了30道定积分
练习题作为学生的周末作业。要做完这些题,肯定需要花费大量时间,因此,一名学生大声地表达了自己的疑惑。
这名学生的兴趣非常广泛,但是她对做数学题几乎没有任何兴趣。
她自己也清楚这一点,因为上个周末,她就花了好多时间完成另外30道
(其实没有多大区别的)定积分练习题。她看不出做这些题有什么意
义,于是与老师进行了交流。交流过程中,这名学生准备提问老师最不
愿意回答的问题:“这些知识我什么时候能用上呢?”
这位老师很可能会这样回答:“我知道这些题目非常枯燥,可是你
别忘了,你还不知道自己将来会选择什么样的职业。现在,你看不到这
些知识与你有什么关系,但是你将来从事的职业有可能非常需要这些知
识,所以你应该快速准确地完成这些定积分练习题。”
师生两人都知道这其实是一个谎言,而且学生通常不会对这样的回
答感到满意,毕竟,即使有的成年人可能会用到积分、(1–3x+4x2)–
2dx、余弦公式或者多项式除法等知识,人数也屈指可数。
这个回答就连老师也不会满意。我对于这一点很有发言权,因为在
我多年担任数学老师的时光里,我就为成百上千的大学生布置过很多定
积分练习题。
值得庆幸的是,对于这个问题,我们能找到一个更好的答案:“尽管一些数学课程会要求你完成一道又一道计算题,让你觉得这
些机械的计算过程不榨干你的所有耐心与精力就不会罢休,但事实并非
如此。学习数学必须计算这些定积分题,就像足球运动员需要接受举重
与韧性训练。如果你希望踢好足球(我是指抱着一种认真的态度,达到
竞技水平),就必须接受大量枯燥、重复、看似毫无意义的训练。职业
足球运动员在比赛时会用到这些训练内容吗?不会的,我们从未在赛场
上看到有足球运动员举杠铃或者在交通锥之间穿梭前行。但是,我们肯
定会看到他们应用力量、速度、观察力与柔韧性,而要提高这些能力,他们必须常年接受枯燥乏味的训练。可以说,这些训练内容是足球运动
的一个组成部分。
“如果你选择足球作为谋生手段或者希望加入校队,你就别无选
择,只能利用周末时间,在训练场上接受大量枯燥乏味的训练。当然,如果你觉得自己无法接受这样的训练,你仍然可以踢足球,只不过是和
朋友们一起踢,纯粹以娱乐为目的。我们也有可能穿过防守队员的防线
完成华丽的传球,或者像职业运动员那样起脚远射得分,并为此激动不
已。此外,踢足球还能强健体魄,愉悦心情。与坐在家里观看职业比赛
的电视转播相比,效果要好得多。
“数学与足球非常相似。你的就业目标可能与数学没有相关性,这
很正常,大多数人的情况都是这样。但是,你仍然可以运用数学知识,甚至你手头正在做的事情有可能就用到了数学知识,只不过你自己不知
道。数学与逻辑推理紧密地交织在一起,可以增强我们处理事务的能
力。掌握了数学知识,就像戴了一副X射线眼镜一样,我们可以透过现实
世界错综复杂的表面现象,看清其本质。多少个世纪以来,由于人们辛
勤钻研、反复辩论,数学的各种公式与定理已经得到了千锤百炼,可以
帮助我们在处理事务时避免犯错。利用数学这个工具,我们可以更深
入、更准确地理解我们这个世界,而且可以取得更有意义的成果。我们
需要做的就是找到一位良师或者一本好书,引导我们学习数学中的一些
规则和基本方法。现在,我愿意担任这样的指导老师,告诉你如何实现
这个目的。”其实,由于时间关系,我在上课时基本不会这样长篇累牍地解释这
个问题。但是在写书时,我可以稍微展开一些。我要告诉你,我们每天
考虑的那些问题,包括政治、医药、商业、宗教等方面的问题,都与数
学有着不可分割的联系。我希望这个事实有助于你接受我上文中介绍的
那个重要观点。同时,了解这个观点还可以帮助你培养更敏锐的洞察
力。
不过,如果那名学生非常精明,即使我真的在课堂上苦口婆心地劝
导,她仍然会心存疑惑。
“老师,你的话听起来很有道理。”她会说,“但是,太抽象了。
你刚才说掌握了数学知识之后,本来有可能做错的事,现在不会出错
了。但是,哪些事情会是这样的呢?能不能举一个真实的例子?”
这时候,我会给她讲亚伯拉罕·瓦尔德(Abraham Wald)与失踪的
弹孔这个故事。
亚伯拉罕·瓦尔德与失踪的弹孔
同很多的“二战”故事一样,这个故事讲述的也是纳粹将一名犹太
人赶出欧洲,最后又为这一行为追悔莫及。1902年,亚伯拉罕·瓦尔德
出生于当时的克劳森堡,隶属奥匈帝国。瓦尔德十几岁时,正赶上第一
次世界大战爆发,随后,他的家乡更名为克鲁日,隶属罗马尼亚。瓦尔
德的祖父是一位拉比,父亲是一位面包师,信奉犹太教。瓦尔德是一位
天生的数学家,凭借出众的数学天赋,他被维也纳大学录取。上大学期
间,他对集合论与度量空间产生了深厚的兴趣。即使在理论数学中,集
合论与度量空间也算得上是极为抽象、晦涩难懂的两门课程。
但是,在瓦尔德于20世纪30年代中叶完成学业时,奥地利的经济正
处于一个非常困难的时期,因此外国人根本没有机会在维也纳的大学中
任教。不过,奥斯卡·摩根斯特恩(Oskar Morgenstern)给了瓦尔德一份工作,帮他摆脱了困境。摩根斯特恩后来移民美国,并与人合作创立
了博弈论。1933年时,摩根斯特恩还是奥地利经济研究院的院长。他聘
请瓦尔德做与数学相关的一些零活儿,所付的薪水比较微薄。然而,这
份工作却为瓦尔德带来了转机,他进入了考尔斯经济委员会(该经济研
究院当时位于科罗拉多州的斯普林斯市)。尽管政治气候越发糟糕,但
是瓦尔德并不愿意彻底放弃理论数学的研究。纳粹攻克奥地利,让瓦尔
德更加坚定了这一决心。在科罗拉多就职几个月之后,他得到了在哥伦
比亚大学担任统计学教授的机会。于是,他再一次收拾行装,搬到了纽
约。
从此以后,他被卷入了战争。
在第二次世界大战的大部分时间里,瓦尔德都在哥伦比亚大学的统
计研究小组(SRG)中工作。统计研究小组是一个秘密计划的产物,它的
任务是组织美国的统计学家为“二战”服务。这个秘密计划与曼哈顿计
划(Manhattan Project)[1]有点儿相似,不过所研发的武器不是炸
药,而是各种方程式。事实上,统计研究小组的工作地点就在曼哈顿晨
边高地西118街401号,距离哥伦比亚大学仅一个街区。如今,这栋建筑
是哥伦比亚大学的教工公寓,另外还有一些医生在大楼中办公,但是在
1943年,它是“二战”时期高速运行的数学中枢神经。在哥伦比亚大学
应用数学小组的办公室里,很多年轻的女士正低着头,利用“马前特”
桌面计算器计算最有利于战斗机瞄准具锁定敌机的飞行曲线公式。在另
一间办公室里,来自普林斯顿大学的几名研究人员正在研究战略轰炸规
程,与其一墙之隔的就是哥伦比亚大学统计研究小组的办公室。
但是,在所有小组中,统计研究小组的权限最大,影响力也最大。
他们一方面像一个学术部门一样,从事高强度的开放式智力活动,另一
方面他们都清楚自己从事的工作具有极高的风险性。统计研究小组组长
艾伦·沃利斯(W. Allen Wallis)回忆说:“我们提出建议后,其他部
门通常就会采取某些行动。战斗机飞行员会根据杰克·沃尔福威茨
(Jack Wolfowitz)的建议为机枪混装弹药,然后投入战斗。他们有可能胜利返回,也有可能再也回不来。海军按照亚伯·基尔希克(Abe
Girshick)的抽样检验计划,为飞机携带的火箭填装燃料。这些火箭爆
炸后有可能会摧毁我们的飞机,把我们的飞行员杀死,也有可能命中敌
机,干掉敌人。”
数学人才的调用取决于任务的重要程度。用沃利斯的话说,“在组
建统计研究小组时,不仅考虑了人数,还考虑了成员的水平,所选调的
统计人员都是最杰出的。”在这些成员中,有弗雷德里克·莫斯特勒
(Frederick Mosteller),他后来为哈佛大学组建了统计系;还有伦纳
德·萨维奇(Leonard Jimmie Savage)[2],他是决策理论的先驱和贝
叶斯定理的杰出倡导者。麻省理工学院的数学家、控制论的创始人诺伯
特·维纳(Norbert Wiener)也经常参加小组活动。在这个小组中,米
尔顿·弗里德曼(Milton Friedman)这位后来的诺贝尔经济学奖得主只
能算第四聪明的人。
小组中天赋最高的当属亚伯拉罕·瓦尔德。瓦尔德是艾伦·沃利斯
在哥伦比亚大学就读时的老师,在小组中是数学权威。但是在当时,瓦
尔德还是一名“敌国侨民”,因此他被禁止阅读他自己完成的机密报
告。统计研究小组流传着一个笑话:瓦尔德在用便笺簿写报告时,每写
一页,秘书就会把那页纸从他手上拿走。从某些方面看,瓦尔德并不适
合待在这个小组里,他的研究兴趣一直偏重于抽象理论,与实际应用相
去甚远。但是,他干劲儿十足,渴望在坐标轴上表现自己的聪明才智。
在你有了一个模糊不清的概念,想要把它变成明确无误的数学语言时,你肯定希望可以得到瓦尔德的帮助。
于是,问题来了。我们不希望自己的飞机被敌人的战斗机击落,因
此我们要为飞机披上装甲。但是,装甲会增加飞机的重量,这样,飞机
的机动性就会减弱,还会消耗更多的燃油。防御过度并不可取,但是防
御不足又会带来问题。在这两个极端之间,有一个最优方案。军方把一
群数学家聚拢在纽约市的一个公寓中,就是想找出这个最优方案。军方为统计研究小组提供了一些可能用得上的数据。美军飞机在欧
洲上空与敌机交火后返回基地时,飞机上会留有弹孔。但是,这些弹孔
分布得并不均匀,机身上的弹孔比引擎上的多。
军官们认为,如果把装甲集中装在飞机最需要防护、受攻击概率最
高的部位,那么即使减少装甲总量,对飞机的防护作用也不会减弱。因
此,他们认为这样的做法可以提高防御效率。但是,这些部位到底需要
增加多少装甲呢?他们找到瓦尔德,希望得到这个问题的答案。但是,瓦尔德给出的回答并不是他们预期的答案。
瓦尔德说,需要加装装甲的地方不应该是留有弹孔的部位,而应该
是没有弹孔的地方,也就是飞机的引擎。
瓦尔德的独到见解可以概括为一个问题:飞机各部位受到损坏的概
率应该是均等的,但是引擎罩上的弹孔却比其余部位少,那些失踪的弹
孔在哪儿呢?瓦尔德深信,这些弹孔应该都在那些未能返航的飞机上。
胜利返航的飞机引擎上的弹孔比较少,其原因是引擎被击中的飞机未能
返航。大量飞机在机身被打得千疮百孔的情况下仍能返回基地,这个事
实充分说明机身可以经受住打击(因此无须加装装甲)。如果去医院的
病房看看,就会发现腿部受创的病人比胸部中弹的病人多,其原因不在
于胸部中弹的人少,而是胸部中弹后难以存活。
数学上经常假设某些变量的值为0,这个方法可以清楚地解释我们讨
论的这个问题。在这个问题中,相关的变量就是飞机在引擎被击中后不
会坠落的概率。假设这个概率为零,表明只要引擎被击中一次,飞机就会坠落。那么,我们会得到什么样的数据呢?我们会发现,在胜利返航
的飞机中,机翼、机身与机头都留有弹孔,但是引擎上却一个弹孔也找
不到。对于这个现象,军方有可能得出两种分析结果:要么德军的子弹
打中了飞机的各个部位,却没有打到引擎;要么引擎就是飞机的死穴。
这两种分析都可以解释这些数据,而第二种更有道理。因此,需要加装
装甲的是没有弹孔的那些部位。
美军将瓦尔德的建议迅速付诸实施,我无法准确地说出这条建议到
底挽救了多少架美军战机,但是数据统计小组在军方的继任者们精于数
据统计,一定很清楚这方面的情况。美国国防部一直认为,打赢战争不
能仅靠更勇敢、更自由和受到上帝更多的青睐。如果被击落的飞机比对
方少5%,消耗的油料低5%,步兵的给养多5%,而所付出的成本仅为对方
的95%,往往就会成为胜利方。这个理念不是战争题材的电影要表现的主
题,而是战争的真实写照,其中的每一个环节都要用到数学知识。
瓦尔德拥有的空战知识、对空战的理解都远不及美军军官,但他却
能看到军官们无法看到的问题,这是为什么呢?根本原因是瓦尔德在数
学研究过程中养成的思维习惯。从事数学研究的人经常会询问:“你的
假设是什么?这些假设合理吗?”这样的问题令人厌烦,但有时却富有
成效。在这个例子中,军官们在不经意间做出了一个假设:返航飞机是
所有飞机的随机样本。如果这个假设真的成立,我们仅依据幸存飞机上
的弹孔分布情况就可以得出结论。但是,一旦认识到自己做出了这样的
假设,我们立刻就会知道这个假设根本不成立,因为我们没有理由认
为,无论飞机的哪个部位被击中,幸存的可能性是一样的。用数学语言
来说,飞机幸存的概率与弹孔的位置具有相关性,相关性这个术语我们
将在第15章讨论。
瓦尔德的另一个长处在于他对抽象问题研究的钟爱。曾经在哥伦比
亚大学师从瓦尔德的沃尔福威茨说,瓦尔德最喜欢钻研的“都是那些极
为抽象的问题”,“对于数学他总是津津乐道,但却对数学的推广及特
殊应用不感兴趣”。的确,瓦尔德的性格决定了他不大可能关注应用方面的问题。在他
的眼中,飞机与枪炮的具体细节都是花里胡哨的表象,不值得过分关
注。他所关心的是,透过这些表象看清搭建这些实体的一个个数学原理
与概念。这种方法有时会导致我们对问题的重要特征视而不见,却有助
于我们透过纷繁复杂的表象,看到所有问题共有的基本框架。因此,即
使在你几乎一无所知的领域,它也会给你带来极有价值的体验。
对于数学家而言,导致弹孔问题的是一种叫作“幸存者偏差”
(survivorship bias)的现象。这种现象几乎在所有的环境条件下都存
在,一旦我们像瓦尔德那样熟悉它,在我们的眼中它就无所遁形。
以共同基金为例。在判断基金的收益率时,我们都会小心谨慎,唯
恐有一丝一毫的错误。年均增长率发生1%的变化,甚至就可以决定该基
金到底是有价值的金融资产还是疲软产品。晨星公司大盘混合型基金的
投资对象是可以大致决定标准普尔500指数走势的大公司,似乎都是有价
值的金融资产。这类基金1995~2004年增长了178.4%,年均增长率为
10.8%,这是一个令人满意的增长速度[4]。如果手头有钱,投资这类基
金的前景似乎不错,不是吗?
事实并非如此。博学资本管理公司于2006年完成的一项研究,对上
述数字进行了更加冷静、客观的分析。我们回过头来,看看晨星公司是
如何得到这些数字的。2004年,他们把所有的基金都归为大盘混合型,然后分析过去10年间这些基金的增长情况。
但是,当时还不存在的基金并没有被统计进去。共同基金不会一直
存在,有的会蓬勃发展,有的则走向消亡。总体来说,消亡的都是不赚
钱的基金。因此,根据10年后仍然存在的共同基金判断10年间共同基金
的价值,这样的做法就如同通过计算成功返航飞机上的弹孔数来判断飞
行员躲避攻击操作的有效性,都是不合理的。如果我们在每架飞机上找
到的弹孔数都不超过一个,这意味着什么呢?这并不表明美军飞行员都
是躲避敌军攻击的高手,而说明飞机中弹两次就会着火坠落。博学资本的研究表明,如果在计算收益率时把那些已经消亡的基金
包含在内,总收益率就会降到134.5%,年均收益率就是非常一般的
8.9%。《金融评论》(Review of Finance)于2011年针对近5 000只基
金进行的一项综合性研究表明,与将已经消亡的基金包括在内的所有基
金相比,仍然存在的2 641只基金的收益率要高出20%。幸存者效应的影
响力可能令投资者大为吃惊,但是亚伯拉罕·瓦尔德对此已经习以为常
了。
数学是常识的衍生物
年轻的读者朋友看到这里,可能会问我:哪里能用得上数学知识
啊?的确,瓦尔德是一位数学家,他在解决弹孔问题时也表现得很睿
智,但是这跟数学有关系吗?他们产生这样的疑问是有道理的。在瓦尔
德的回答里,我们没有看到三角恒等式和积分,也看不到任何不等式和
公式。
其实,瓦尔德真的用到了某些公式。但是,我在讲述这个故事时把
这些公式略去了,因为我现在写的这个部分仅仅是本书的引言部分。在
为一名幼童介绍人类繁衍问题的书中,引言部分显然不能详细地告诉他
们婴儿是如何进入妈妈的肚子的。我们很可能会这样说:“自然界中的
所有东西都会变化。到了秋天,树会落叶,等到了春天,它们又会变得
郁郁葱葱。蛹里的幼虫在破茧而出后会变成五彩斑斓的蝴蝶,你也是自
然界的一部分,因此……”
因此,我在引言部分采用了同样的方法。
然而,我们毕竟都是成年人了,所以,我稍稍偏离主题,从瓦尔德
的真实报告中抽取一页让大家看看。……可以得出 的下限。在这里,我们假设由 减少至
时,上下两端的极限值是确定的。因此,我们可以得出 的上限和
下限。
上述表达式难以求出具体的解,但是在i
列步骤得出 的上限和下限的近似值。所采用的假定数据集为
条件A满足,因为通过替换希望大家看完之后不会头晕眼花。
瓦尔德的独到见解其实根本不需要以上述形式表达。我们没有用到
任何数学概念,也可以把这个问题解释得一清二楚。因此,学生们提出
的问题确实有道理。数学到底是什么?仅仅是一些常识性的东西吗?
是的,数学就是一些常识。从某个基础层面看,这是毫无疑问的。
你有5件物品,再加上7件,跟你有7件物品再加上5件,结果毫无区别,你能解释这是为什么吗?你无法解释,因为在思考把不同的物品合并到
一起的问题时,我们就是这样做的。数学家们经常会就常识已经了解的
现象给出不同的名称。我们不会说“把这些物品加上那些物品,与把那
些物品加上这些物品,结果是相同的”,而会说“加法具有交换性”。
由于我们青睐各种数学符号,因此我们有时会这样写:
对于任意的a与b,有a+b=b+a。
尽管这样的公式看上去过于正式,但实际上我们所讨论的内容是每
个孩子都清楚的事实。
乘法的情况稍有不同,但下面这个公式看上去与上面的公式非常相
似:
对于任意的a与b,有a×b=b×a。
这个句子所表达的意思不像加法交换律那样,让人一看立刻就会
说:“是啊。”
两个6件套的物品与6个两件套的物品总数相等,这是一种“常识”
吗?也许算不上常识,却可以变成一种常识。在我刚学数学时发生的一
件事,让我至今记忆犹新。我那时大约6岁,我躺在父母房间的地板上,脸贴着长绒地毯,眼睛盯着房间里的立体声音响,音响播放的可能是甲
壳虫乐队的蓝版专辑(Blue Album)第二面的歌曲。在20世纪70年代,立体声音响都有刨花板做的面板,在侧面凿有气孔。这些气孔排列成矩
形,每行有8个,每列有6个。我平躺在那儿,看着这些气孔——6行8
列。我一边上下左右打量着这些气孔,一边翻来覆去地琢磨:6行,每行
8个孔;8列,每列6个孔。
突然,我明白了:每列6个、共8列,与每行8个、共6行的总数一样
多。没有人告诉我这个规律,但我知道结果就是这样。因为无论你怎么
数,气孔的数量都不变。
我父母的立体声音响,1977年
我们在教授数学时,往往会告诉学生们很多法则。学生们按部就班
地学习这些法则,而且必须按照老师的指示来学习,否则就会得C–。其实,他们所学的并不能被称为数学,数学研究的应该是事物的某些必然
规律。
坦率地说,并不是所有的数学知识都像加法、乘法那样,凭直觉就
能轻而易举地掌握。比如,我们不能借助常识来学习微积分。但是,即
使是微积分,也是由常识演变而来的。艾萨克·牛顿(Isaac Newton)
将我们对直线运动物体的物理直觉加以整理,把它变成一种形式主义的
产物,对运动进行了普适性的数学描述。只要我们掌握了牛顿的这套理
论,就可以解决那些可能令我们束手无策的难题。同样,我们的大脑有
一种先天能力,可以评判某种结果发生的可能性。但是,这种能力非常
弱,在评判发生可能性极低的事件时更加不可靠。在这种情况下,我们
需要适度地用一些可靠的原理与技术手段去辅助我们的直觉,于是概率
这种数学理论应运而生。
数学界使用的交流语言非常特殊,功能十分强大,可以准确、方便
地传递复杂的内容。但是,由于其他人对这套语言并不熟悉,因此他们
以为数学家的思维方式与普通人大相径庭。事实上,这样的想法大错特
错。
掌握了数学知识,就像给常识装上了核能驱动的假肢,可以让我们
走得更远、更快。尽管数学的功能十分强大,数学的符号体系与抽象性
有时让人难以理解,但是数学思维与我们思考实际问题的方法并无多大
区别。大家可以想象钢铁侠用拳头在砖墙上砸出一个洞的场景,这个方
法有助于我们理解数学思维的特点。一方面,托尼·史塔克(Tony
Stark)砸穿砖墙的力量并非来自他的肌肉,而是来自一套精准的同步伺
服系统,这套伺服系统的动力由一个小型贝塔粒子发电机提供。另一方
面,对于托尼·史塔克而言,他所做的就是砸墙这个动作,跟没有装备
时的砸墙动作并无区别,只不过有了装备之后,难度变小了。
克劳塞维茨(Clausewitz)说过:“数学就是常识的衍生物。”如果没有数学帮助我们弄清条理,常识有可能会把我们引入歧途。
前面说的美国军官就是受到常识的误导,准备给飞机上防护能力已经很
强的部位加装装甲。但是,尽管数学具有很强的条理性,如果仅凭抽象
推理,而不经常性地辅以我们在数量、时间、空间、运动、行为及不确
定性等方面的直觉感知,也就是说脱离了常识的帮助,那么,数学领域
的任何活动都将变成循规蹈矩地生搬书本知识,不会产生任何有益的结
果。换言之,这样的数学就像学生们在学习微积分时所发的牢骚一样,毫无意义可言。
这是非常危险的。1947年,约翰·冯·诺依曼(John von
Neumann)在他的论文《数学家》(The Mathematician)中发出警告:
如果数学这门学科逐步偏离现实生活的经验,并且渐行渐远,以
至于第二代和第三代数学人无法在“现实生活”中萌生某些想法并直
接受到启迪,那么我们将面临非常严重的威胁。它会在唯美的道路上
越走越远,演变成“为了艺术而艺术”。如果周围的相关学科仍然与
经验有着密切的联系,或者某位鉴赏能力超强的人可以对数学产生影
响,那么发生这种情况未必是件坏事。但是,数学的这种发展势头几
乎没有遇到任何阻力,而且在偏离经验的过程中分解成多个不起眼的
分支,最终局面有可能变得支离破碎、杂乱无序,这相当危险。换句
话说,在远离经验的哺乳,或者说“抽象研究”大量“近亲繁殖”之
后,数学将面临堕落的危险。[5]
本书将讨论哪些数学知识?
如果你对数学的了解完全来自学校教育,那么你所掌握的数学知识
就十分有限,在某些重要方面甚至是错误的。学校里教授的数学知识大
多是一系列确凿的事实,以及权威给出的、不容置疑的法则。在学校
里,数学就是一些已经定型的知识。事实上,数学并没有完全定型。即使是数字与几何图形这些最基本
的学习内容,我们所掌握的知识远比我们尚未掌握的少。而且,我们已
经学会的那些知识,也是无数人付出努力、经过反复争论、解决一个个
疑团之后才得到的。在编写教材时,所有这些努力与喧嚣都被小心翼翼
地摒弃了。
毫无疑问,数学中存在某些事实。对于“1+2=3是否正确”这个问
题,人们从来没有提出过多少争议。至于“是否能证明1+2=3以及如何证
明”,这个问题在数学与哲学之间摇摆不定,则是另外一回事了。在本
书结语部分,我们将讨论这个问题。其计算毫无疑问是正确的,人们的
疑惑存在于其他方面。在后文中,我们将不止一次地讨论这个问题。
数学中的事实可能非常简单,也可能非常复杂,可能十分浅显,也
可能十分深奥。这样的特点将数学一分为四:
像1+2=3这样比较基础的算术题结构简单,内容也不那么深奥。
sin2x=2sinxcosx及二次方程式等基础内容也大致差不多,虽然与1+2=3相比,理解这些内容可能需要多花点儿时间和精力,但是它们在概念上
并没有多大的理解难度。
在复杂–浅显这个部分,我们有两位数的乘法、复杂定积分的计
算。在研究生院学习一两年之后,还会接触更复杂的概念。可以想见,我们出于这样或那样的原因,有可能需要解决这类问题。不可否认的
是,如果不借助机器,这样的工作有时根本无法完成,至少会让人头疼
一番。至于复杂的难题,如果我们上学时没有努力学习,可能连问题都
无法看懂。但是,即便解决了所有这些问题,我们也并不会因此更加了
解我们所在的这个世界。
至于复杂–深奥这个部分,则是像我这样的专业从事数学研究的人
需要投入大量时间的地方。这里有众多大名鼎鼎的定理与猜想:黎曼假
设,费马最后定理[6],庞加莱猜想,P vs NP(多项式对非确定多项
式),哥德尔定理等。这些定理内涵丰富,具有重要的意义,表现出令
人窒息的美感。这些定理残酷无情又无懈可击,人们围绕它们写就了一
本本专著。
本书介绍的内容并不是这些定理,而是图的左上部分,即简单–深
奥的数学知识。无论我们在数学方面受到的教育与训练止于代数之前,还是远远超过这个范围,本书讨论的数学思想都将与我们的生活产生直
接联系,为我们带来益处。这些内容不是像简单代数那样的“纯粹事
实”,而是一些原理,其应用将远远突破我们对数学的既有理解。它们
是常备工具,只要应用得当,就可以避免我们犯错。
理论数学是一方净土,远离尘世间的各种纷扰与矛盾,我就是在理
论数学的浸淫下长大的。与我一起学数学的其他小伙伴们一个个受到了
物理学、基因组学或者对冲基金管理的黑色艺术的诱惑,而我对这类
“青春期萌动”则敬而远之。[7]在读研究生期间,我全身心地投入数论
研究。卡尔·弗里德里希·高斯(Carl Friedrich Gauss)把数论称作
“数学皇后”,认为它是理论程度最高的学科之一,也是位于理论数学这方净土核心位置的一个不为人所知的乐园。它曾经让希腊人头疼不
已,并在随后的2 500年里不断地折磨着一代代数学人。
起初,我研究的是既经典又有特色的数论,试图证明整数四次幂求
和方面的一些事实。当家人在感恩节晚宴上不断追问它的情况时,我虽
然可以向他们解释一二,但我无法让他们明白我的证明过程。不久之
后,我又迷上了更加抽象的研究领域,其中的一些基本概念乏人问津,讨论的场所只限于牛津大学、普林斯顿大学、京都大学、巴黎大学和威
斯康星大学麦迪逊分校(我目前在此任教)的学术报告厅与教师休息
室。如果我告诉你这些内容内涵丰富、极富美感,令我热血沸腾,而且
我永远会乐此不疲地研究它们,那么你只能相信我的话。因为这些研究
极为深奥,哪怕只是触及皮毛,也需要投入大量的学习时间。
但是,随着研究的深入,我发现了一个有趣的现象。在我的研究越
发抽象并且与现实生活渐行渐远的过程中,我开始注意到数学高墙之外
的尘世间也有大量的数学活动。我指的不是复杂–深奥的数学概念,而
是一些更为简单、更加古老但是同样深奥的内容。我开始在报纸、杂志
上撰文,介绍数学目镜下的现实世界。令我惊奇的是,即使宣称自己讨
厌数学的人,也愿意拨冗阅读这些文章。这是另一种数学教学活动,与
教室里的教学活动大不相同。
与教室里的教学活动相同的是,读者也需要做一些工作。我们继续
讨论冯·诺依曼的《数学家》:
乘坐飞机,让飞机把我们带到高空并运送到另一个地方,还有操
控飞机的航向,这些都不是很难。但是,要了解飞机的飞行原理,以
及飞机抬升力与推进力的相关理论,则要难得多。对于某个过程,如
果我们事先没有经过大量运行或使用,达到得心应手的程度,也没有
通过直觉和经验去融会贯通,想要彻底掌控这个过程就会非常困难。换言之,如果不从事某些数学活动,就很难理解数学的真谛。欧几
里得(Euclid)告诉托勒密(Ptolemy),几何的学习没有捷径可言;门
内马斯(Menaechmus)也曾经告诉亚历山大大帝要亲力亲为。(古代科
学家的一些名言有可能是人们杜撰的,但是同样有启迪作用。我们还是
坦然面对吧。)
在本书中,我不会在数学领域的重大事件上摆出夸大其词又含糊不
清的姿态,诱导大家对它们循规蹈矩地顶礼膜拜。阅读本书时,我们必
须亲自尝试完成一些计算工作,同时,我还希望读者朋友们理解书中的
一些公式与方程式。我不是要大家掌握超出算术范围的数学知识,但是
我在书中解释的很多数学知识将远远超出算术的范畴。我会粗略地绘制
一些图表。我会讲到一些学校教过的数学知识,但是它们将出现在不同
的情境中。我会告诉大家如何用三角函数表示两个变量的相关程度,微
积分所揭示的线性现象与非线性现象之间的关系,以及二次公式在科学
探索中充当认知模型的作用。书中还会涉及在大学及后续教育中才会学
习的某些内容,比如:我们会讨论集合论所遭遇的危机,用来隐喻最高
法院的判决与棒球场上的裁判;我们会讨论解析数论近期取得的进展,用来说明结构与随机性之间的相互作用;我们还会讨论信息论与组合设
计,用来分析麻省理工学院的大学生是如何破解马萨诸塞州彩票的秘
密,并赢取数百万美元奖金的。
在本书中,我会提到著名的数学家,也会有一些哲学思考,甚至还
会给出一两个证明题。但是,我不会布置家庭作业,也不会安排考试。
[1] 曼哈顿计划是第二次世界大战期间由美国牵头,英国、加拿大共同参与的一项核武器研
发计划。——译者注
[2] 关于萨维奇,这里有必要告诉大家他的一些逸事。萨维奇的视力极差,只能用一只眼睛
的余光看东西。他曾经耗费了6个月的时间来证明北极探险中的一个问题,其间仅以肉糜饼为
食。
[3] 1平方英尺≈0.093平方米。——编者注
[4] 公平地说,标准普尔500指数同期增长了212.5%,增长速度更快。[5] 冯·诺依曼对数学本质的认识十分有道理,但是公平地讲,他认为数学的唯美目标是一
种“堕落”,这个观点令人多少有些不安。冯·诺依曼是在希特勒统治下的德国举办“堕落艺术
展”10周年之际写下这番话的。这次艺术展指出,“为了艺术而艺术”是犹太人与共产党追求的
目标,目的是暗中破坏强大的德国所需的健康的“现实主义”艺术。在当时的情况下,人们对没
有明显研究目标的数学心怀戒心。在这个问题上,政治信仰与我本人不同的人在写作时可能会提
到冯·诺依曼曾积极投身于核武器研发研究这个事实。
[6] 在数学界,费马最后定理现在被称作怀尔斯定理,因为安德鲁·怀尔斯(Andrew
Wiles)在理查德·泰勒(Richard Taylor)的大力帮助下证明了这个定理,而皮埃尔·德·费
马(Pierre de Fermat)本人则没有给出证明。不过,传统的名称可能会一直沿用。
[7] 坦率地讲,我在20岁出头时,也一度想要成为严肃文学作家,甚至还出版了一本严肃
小说《蚱蜢王》(The Grasshopper King)。但是,在我致力于严肃文学创作期间,我发现自
己有一半的时间不务正业,沉迷于数学问题的研究。第一部分 线性
精彩内容:
●拉弗曲线
●微积分
●“逝去量的鬼魂”
●“到2048年所有美国人都会超重”
●南达科他州脑癌发病率为什么高于北达科他州?
●大数定律
●对恐怖主义的各种类比
●下定义的习惯第1章 要不要学习瑞典模式?
几年前,在关于“患者保护与平价医疗法案”的激烈讨论中,鼓
吹公民充分自由权的卡托研究所里有个名叫丹尼尔·米切尔(Daniel
Mitchell)的人,为自己的博文拟了一个很有煽动性的标题:“瑞典
正在谋求变化,而巴拉克·奥巴马(Barack Obama)却在倡导美国学
习瑞典模式,为什么?”
这个问题问得非常好!这样的表达,让其中有悖常理的地方变得
一目了然。是啊,全世界的福利国家都在削减高额的救济金与高税
收,连瑞典这样的富裕小国也不例外,而美国却与这股潮流背道而
驰。总统先生,这是为什么呢?米切尔的博文指出:“瑞典从自己的
错误中汲取了教训,正在缩减政府的规模与职能范围,为什么美国的
政客们却义无反顾地重复这些错误呢?”
要回答这个问题,我们需要参考一幅极具科学性的曲线图。在卡
托研究所看来,整个世界就是下图所示的情形。图中的横轴表示瑞典模式化程度[1],纵轴表示繁荣程度。至于如
何量化的问题,大家不用担心,关键是要知道:一个国家的瑞典模式
化程度越高,情况就越糟糕。瑞典人不是傻瓜,他们已经意识到了这
个问题,正在努力地向左上角的自由国度的繁荣攀爬。然而,奥巴马
政府却正在朝错误的方向前进。
下面,我用与奥巴马总统观点比较接近的经济视角取代卡托研究
所的视角,重新绘制这幅图。关于美国应该实现的瑞典模式化程度,这幅图给出的建议大不相
同。繁荣程度最高的点在哪儿呢?应该比美国的瑞典模式化程度高,但是比瑞典低。如果这幅图是正确的,那么在瑞典削减其福利时,奥
巴马却在进一步增加美国的福利,这种做法是完全有道理的。
这两幅图的差异其实就是线性与非线性之间的差异,这是数学领
域最重要的差异之一。卡托研究所画的是一条直线,而第二幅图中的
线则不是直线,而是在中间的地方有一个隆起。直线是一种线,但线有很多种。直线的各种特性是大多数线所不具备的,比如,线段的最
高点(在本例中即繁荣程度的最高点)只能是两个端点之一,这是直
线的特点。如果降低税率有助于提升繁荣程度,那么税率越低越好。
因此,如果瑞典正在削减社会福利,那么美国也应该实行同样的政
策。当然,与卡托研究所持相反观点的美国政府智囊团可能会认为,这条直线应该朝相反的方向倾斜,即由左下角向右上角延伸。如果情
况真的如此,公共支出将没有上限,最有利的政策就是让瑞典模式化
程度达到极致。
通常,如果有人宣称自己的思维方式是“非线性的”,那么他的
真实意图是要向你道歉,因为他把你借给他的某个东西弄没了。但
是,非线性思维其实非常重要。在本书讨论的这个例子中,非线性思
维就能发挥显著的作用,因为所有的线并不都是直线。稍加思考你就
会发现,真正的经济学曲线是第二幅图,第一幅图并不正确。米切尔
的推理是一种“假线性”(false linearity),他错误地假设,经济
繁荣的程度可以用第一幅图来表示,也就是说,瑞典削减其社会福利
的做法,意味着美国也应该亦步亦趋。
但是,社会福利既有可能太过,也有可能不足,意识到这一点,就会知道那幅线性图是不对的。“管理程度越高越不好,越低越好”
是一个过于简单的原则,真正有效的原则比它复杂。向亚伯拉罕·瓦
尔德咨询的那些将军面临着同样的情况:装甲不足意味着飞机会被击
落,装甲过度又会让飞机无法起飞。问题的关键不在于加装装甲是否
正确,而在于加装装甲可能是柄双刃剑,取决于飞机已有的装甲。如
果这个问题有最优解决方案,就应该是在中间的某个位置上,向任一
方向偏离都不好。
非线性思维表明,正确的前进方向取决于你当前所在的位置。
这个深刻的观点其实早已有之。罗马时期,贺拉斯(Horace)有
一个著名的论断:事物有中道,过犹不及。在此前更早的时候,亚里士多德在他的《尼各马可伦理学》(Nicomachean Ethics)一书中指
出,多食与少食都会伤害身体。最适宜的度应在两者之间,因为饮食
与健康之间并不是线性关系,而是曲线关系,两端都是不好的结果。
“巫术”经济学与拉弗曲线
令人啼笑皆非的是,像卡托研究所里的那帮家伙一样持保守观点
的经济学家们,早就知道其中的奥秘了,他们的理解甚至比任何人都
深刻、透彻。至于我绘制的第二幅图,也就是中间隆起、极具科学性
的那幅图,绝对不是我的首创。这幅图被称作“拉弗曲线”(Laffer
curve),在近40年时间里,拉弗曲线在共和党的经济政策中起到了极
为重要的作用。在罗纳德·里根(Ronald Reagan)的任期过半之前,拉弗曲线已经是经济学论文中一个老生常谈的话题了。在电影《春天
不是读书天》(Ferris Bueller’s Day Off)中,本·斯坦(Ben
Stein)在发表那篇令人震撼的著名演说时即兴说了下面这番话:
有谁知道这是什么吗?各位同学,有人知道吗?……谁知道,谁以前见过?这是拉弗曲线。有谁知道拉弗曲线表示的意思吗?从
拉弗曲线可以看出,在收益曲线的这个点得到的收入,跟这个点是
一样的。很多人认为这个结论有争议。有谁知道,1980年副总统布
什把这个叫作什么吗?谁知道?布什称之为“某某术经济学”,对,“巫术经济学”。
拉弗曲线的由来堪称传奇,其过程大致如下:1974年的一天,时
任芝加哥大学经济学教授的阿瑟·拉弗(Arthur Laffer)与迪克·切
尼(Dick Cheney)、唐纳德·拉姆斯菲尔德(Donald Rumsfeld)和
《华尔街日报》(Wall Street Journal)的编辑裘德·瓦内斯基
(Jude Wanniski)一起,在华盛顿的一家高档酒店共进晚餐。席间,他们在讨论福特总统的税务计划时发生了争执,而且争执越来越激烈。于是,拉弗采用了知识分子惯用的手法,拿起一张餐巾纸[2],在
上面绘制了一幅图,如下图所示。
图中的横轴表示税率,纵轴表示政府的税收。在横轴的最左端税
率为0,根据定义,这种情况表示政府没有税收。在最右端,税率为
100%,这个数字表明,你的所有收入,不管经营企业所得或工资薪
水,全都进了“山姆大叔”的钱袋。在后面这种情况下,政府的钱袋最终也将空空如也。因为,如果
你参与教学、销售五金器具、企业管理等活动,辛辛苦苦赚的钱却被
政府一扫而空,你为什么还要费神做这些工作呢?因此,人们不会去
工作。即使去工作,他们也会避开收税员,参与一些零零碎碎的经济
活动。于是,政府的税收归零。
在中间区域,政府不会把我们所有的收入全部收走,也不会一分
钱不收,换句话说,在现实世界中,政府会拿走我们收入的一部分。
这意味着,表现税率与政府收入之间关系的线不可能是直线。否
则,收入最高点要么在图的最左端,要么在最右端,但事实上这两个
点的值都是零。如果你当前的所得税真的接近于零,就说明你位于图
的左侧。我们凭直觉就可以判断出,在这种情况下,如果政府提高税
率,用于支付服务与政府项目的资金数额就会增加。但是,如果税率
接近100%,此时提高税率实际上会导致政府税收减少。如果位于拉弗
曲线最高点的右侧,同时希望在不削减开支的情况下增加税收,那么
政府可以采取一个简单易行且政治效果极佳的方法:降低税率,从而
增加税收。朝哪个方向努力,取决于我们所处的位置。
我们现在到底位于什么位置上呢?这是问题的难点所在。1974
年,所得税的最高税率是70%,人们据此判断,美国在拉弗曲线上位于
右侧向下的“斜坡”上。当时按此税率缴税的人并不多,因为这个税
率只适用于20万美元[3]以上的收入,而这些人认为美国更应该降低税
率。同时,拉弗曲线还拥有瓦内斯基这位有影响力的拥趸,他在1978
年出版了一本书,并相当自信地把这本书命名为“世界运行的方式”
(The Way the World Works),把他的那套理论介绍给大众。瓦内斯
基充分相信拉弗曲线,而且他既有热情,又有政治手腕,就连主张减
税的人觉得偏激的观点,他也能成功兜售。有人认为他是个疯子,他
却不以为然。“‘疯子’这个称谓说明什么问题啊?”他在接受采访
时说,“托马斯·爱迪生(Thomas Edison)是个疯子,莱布尼茨(Leibniz)是个疯子,伽利略(Galileo)也是个疯子,这样的疯子
太多了。只要你提出一个有悖传统的新观点,提出一个与主流截然不
同的观点,人们就会说你是个疯子。”
[题外话:在这里,我有必要说明一下,很多持有非主流观点的人
把自己比作爱迪生与伽利略,但是这些人的观点没有一个是对的。我
每月至少会收到一封这样的来信,寄信人宣称自己能“证明”某个数
学命题,而几百年来人们都认为这个命题是错误的。我敢保证阿尔伯
特·爱因斯坦(Albert Einstein)没有到处宣扬:“我知道你们觉得
我的广义相对论非常荒谬,人们当年还说伽利略的成果非常荒谬
呢!”]
拉弗曲线简洁明了,又以一种令人愉悦的方式颠覆了我们的直
觉,因此,那些本来就迫不及待要减税的政客们自然对它青睐有加。
经济学家哈尔·范里安(Hal Varian)指出:“你为一位国会议员介
绍只需要6分钟就能讲清楚的情况,随后,他能讲6个月。”裘德·瓦
内斯基先是担任杰克·康普(Jack Kemp)的顾问,后来又担任罗纳德
·里根的顾问。20世纪40年代,里根是一名电影明星,他的演艺生涯
为他积累了大笔财富,也为他40年后的经济观奠定了基础。里根执政
期间负责制定政府预算的官员戴维·斯托克曼(David Stockman)回
忆说:
(里根)经常说:“‘二战’期间,我通过拍电影赚了大
钱。”当时,战时收入附加税高达90%。里根说:“拍了4部电影之
后,我的所得税率就到了最高等级。于是,我在完成了4部电影的
拍摄之后就不再工作,跑到乡下度假去了。”高税收导致人们怠
工,而税率低则会刺激人们积极工作。他的这段经历证明了这个道
理。当前,几乎没有哪位令人尊敬的经济学家会认为美国正位于拉弗
曲线的下行区域。这样的现象也许不足为奇,因为高收入的现行税率
仅为35%,跟20世纪的大多数时间相比,这样的税率低得惊人。即使在
里根时代,美国也位于拉弗曲线的左侧。哈佛大学经济学家、在小布
什(George W. Bush)总统任内担任经济顾问委员会主席的共和党人
格里高利·曼昆(Gregory Mankiw),在他的《微观经济学》
(Principles of Microeconomics)中指出:
后来的历史并没有佐证拉弗的“低税率将增加税收”这个
猜想。里根当选总统后实行了减税政策,结果税收不但没有增
加,反而减少了。1980~1984年,个人所得税(消除通胀因素后
的人均税收)降低了9%,尽管这个时期的平均收入(消除通胀
因素后的人均收入)提高了4%。而且,这项政策出台之后,想
要废止并非易事。
现在,对供应学派表示些许支持是合理的,他们认为税收政策
的目标未必是实现政府收入最大化。我与米尔顿·弗里德曼最后一
次见面是在“二战”期间,当时我们一起供职于统计研究小组,为
军方开展秘密工作。他后来获得诺贝尔经济学奖,并先后为几位总
统担任顾问。在主张低税率与自由哲学方面,他是一位有影响力的
倡导者。弗里德曼关于税收有一句名言:“我主张在任何情况下,只要有可能都应该减税,而且无须任何托词和理由。”他认为,我
们不应该以拉弗曲线的最高点为目标,也就是说,政府不应该追求
尽可能高的税收。在弗里德曼看来,政府的收入最终会用作政府的
开支,但是,这些钱的使用方式并不是很恰当。
其他像曼昆一样的温和供应学派的经济学家认为,减税虽然会带
来政府收入减少、赤字增加的即时效应,但是可以激励人们辛勤工
作、创办企业,并最终增强国家的经济实力。而支持建立福利型国家
的经济学家则可能认为,减税会两头不讨好。政府的开支能力减弱,基础设施的建设就会减少,制约诈骗行为的力度也会下降,并且在促
进自由市场方面通常会不作为。
曼昆同时指出,在里根实行减税政策之后,那些将超额收入的70%
交给政府的最富裕公民,的确贡献了更多的税收[4]。但是,以这种方
式追求政府收入的最大化,可能会导致令人恼火的结果。一方面,中
产阶级的税收压力加大之后,他们别无选择,只能拼命工作;另一方
面,针对富人们的税率有所下降,这些富人积累了大量财富,一旦他
们认为政府征收的赋税过高,他们完全有可能减少经济活动,甚至将
企业搬到国外。如果这种情况真的发生了,大量自由主义者将与米尔
顿·弗里德曼一起面临尴尬的境地:不得不承认税收最大化这个目标
也许并不是那么美好。
曼昆的最终评价并不偏激:“拉弗的观点也不是毫无价值。”但
是,我要给拉弗一个更高的评价,即他的曲线图揭示了一个不容置疑
的数学基本观点:税收与收入之间的关系一定是非线性的。当然,这
种关系不一定就是拉弗所画的那种平滑的单峰山丘状,还有可能像一
个四边形,比如:
或者像阿拉伯骆驼的驼峰,比如:又或者是不受任何限制的随意振荡曲线[5],比如:
但是,只要曲线在某个地方向下倾斜,就必然会在其他地方向上
延伸。瑞典模式化程度过高的现象肯定存在,所有的经济学家都承认
这一事实。拉弗指出,在他之前已经有很多社会学家意识到了这个问
题,但是对大多数人而言,这个事实并不是显而易见的,至少在看到
餐巾纸上的那幅图之前如此。拉弗非常清楚,他的这幅曲线图并不能
告诉大家,所有的经济在任一特定时间是否存在征税过度或不足的问题,这正是他在图上没有给出任何数字的原因。在向国会提供证言
时,有人就最优税率的具体额度提出了疑问,拉弗回应道:“坦率地
说,我无法估量其具体额度,但是我知道最佳税率具有哪些特征。是
的,先生,我知道。”所有的拉弗曲线都表明,在某些情况下低税率
可以增加税收,但是具体在哪些情况下会产生这种效果,则需要展开
一些深入的、难度颇大的具体工作,这是无法在一张餐巾纸上完成
的。
拉弗曲线本身并没有错,不过人们将其付诸应用的方式有可能出
错了。瓦内斯基与受他的指挥棒指挥的那些政客们一起,成为有史以
来最古老的“假演绎推理”的猎物:
·降低税率有可能增加政府收入;
·我希望降低税率可以增加政府收入;
·因此,降低税率肯定会增加政府收入。
[1] 在这里,“瑞典模式化程度”表示“社会服务与福利的特点”,而不是指瑞典的其他
特点。
[2] 拉弗对餐巾纸一说表示异议。他回忆说,那家饭店使用的是高档布餐巾,他绝不会在
上面随意地画经济学图表。
[3] 如果换算成现在的收入,应该是50万~100万美元。
[4] 供应学派预测,所得税税率降低之后,富人们的工作劲头将会更足,政府税收也会随
之增加。但税收增加的原因是不是这个,很难确定。
[5] 它们甚至有可能是多条曲线。马丁·加德纳(Martin Gardner)曾经对“拉弗曲
线”进行了刻薄的评论。他画了一堆缠绕不清的曲线,然后把它们叫作“新拉弗曲线”。第2章 不是所有的线都是直线
即使数学专业人士不告诉我们,我们可能也不会认为所有的线都
是直线。但是线性推理却无处不在,只要你认为“某个东西有价值,因此多多益善”,就是一种线性推理。这也是叫嚣的政客们惯用的伎
俩:“你们支持对伊朗采取军事行动吧?我想,任何国家胆敢在我们
面前放肆的话,你们都会希望对他们发起地面进攻!”还有的政客则
处于另一个极端:“要与伊朗开战吗?你们可能认为阿道夫·希特勒
也被误解了。”
只要稍加思考,我们立刻就能发现这种推理是错误的,但是,为
什么有那么多人会犯这种错误呢?毫无疑问,并不是所有的线都是直
线,但是为什么有人会持相反的错误观点呢?即使他们很快醒悟并改
正过来,这样的错误也是难以想象的。
原因之一就在于,从某种意义上看,所有的线的确都是直线。让
我们从阿基米德(Archimedes)谈起。
穷竭法与圆的面积
下面这个圆的面积是多少?在现代,这是一个非常普通的问题,在SAT(学术能力评估测试)
中出现这样的题目也无可厚非。圆的面积是πr2,在本例中,半径r为
1,因此,圆的面积就是π。但是,在2000年前,人们苦苦思索却不得
其解,这个问题引起了阿基米德的注意。
这个问题的难点在哪儿呢?一方面,我们认为π是一个数字,而
古希腊人却认为只有1、2、3、4……这些用来计数的整数才是数字。
不过,古希腊几何学的第一个伟大成就——勾股定理[1],却突破了他
们的这个数字系统。
试看下图:勾股定理告诉我们,直角三角形斜边(上图中倾斜的边,与直角
没有接触)的平方是其余两边(直角边)的平方和。在本图中,根据
勾股定理,斜边的平方为 ,而且斜边比1长、比2短(这
个无须任何定理,目测就可以确定)。至于斜边的长度不是整数,这
对古希腊人来说不是问题。也许,我们使用的测量单位是不正确的
吧。如果我们设定直角边的长度是5个单位,我们就可以用直尺量出斜
边的长度约为7个单位。因为斜边的平方是:
如果斜边的长度是7个单位,它的平方就是7×7=49。
如果直角边的长度为12个单位,斜边的长度就十分接近于17个单
位。不过,令人心痒不已的是,这次又短了一点儿,因为,而172是289,就少那么一点点。
公元前5世纪,毕达哥拉斯的一位门徒发现了一个令人震惊的现
象:等腰三角形的三条边长不可能都是整数。现代人都知道“2的平方
根是无理数”,也就是说这个数不是任何两个整数的比,但是,当时
的那些学者并不知道。他们能有什么办法呢?他们的数量概念是建立
在整数的基础上的。因此,在他们看来,直角三角形斜边的长度根本
不是一个数字。
这个发现引起了轩然大波。要知道,毕达哥拉斯的这些门徒非常
怪异,他们的人生哲学一片混沌,在我们现代人看来,就是数学、宗
教与精神病构成的大杂烩。在他们眼中,奇数是吉利的,而偶数则是
邪恶的。他们认为在太阳的另外一边还有一个与地球一模一样的星
球,即“反地球”(Antichthon)。某些记载表明,他们认为吃蚕豆
是不道德的,因为人死之后,灵魂会寄存在蚕豆中。据说,毕达哥拉
斯本身可以与牲畜交谈(他告诉牲畜不要吃蚕豆),也是为数不多的
穿裤子的古希腊人之一。毕达哥拉斯门徒的数学研究与他们的思想有不可分割的联系。发
现2的平方根不是有理数的那个家伙名叫希帕索斯(Hippasus),传说
(不一定是真实事件,但是从中可以窥见毕达哥拉斯门徒的处世风
格)他在证明了这个令人厌恶的定理之后,得到的“奖励”是被同窗
扔进大海淹死了。
希帕索斯可以被淹死,但是定理却无法回避。毕达哥拉斯之后的
学者(包括欧几里得和阿基米德)知道,虽然2的平方根这样的数字将
迫使他们从整数这个世外桃源中走出来,但他们还是得挽起衣袖,完
成测算工作。人们都不知道,圆的面积是否可以仅靠整数表示出来。
[2]但是,为了制造车轮、修建筒仓[3],他们必须学会计算圆的面
积。
第一个提出解决方法的是欧多克斯(Eudoxus of Cnidus),欧几
里得把这个方法作为第12个基本原理收入《几何原本》(Euclid’s
Elements),但在这个方面取得大进展的是阿基米德。如今,我们把
这个方法叫作穷竭法(method of exhaustion),其基本原理如下:图中的正方形叫作内接正方形,正方形的4个角与圆接触,但是没
有超出圆的范围。这样做的理由是什么呢?这是因为圆神秘莫测,令
人望而生畏,而正方形的面积则易于计算。如果一个正方形的边长为
x,其面积就是x乘以x。因此,我们把数字与自身相乘的运算叫作平
方。这个方法蕴含了一个基本的数学思想:如果老天要我们解决一个
非常难的问题,那么我们应该想方设法找到一个简单的问题,而且这
个简单的问题与难的问题非常接近,这样,老天也不会有反对意见。
内接正方形可以分成4个三角形,这4个三角形都与我们前面画的
等腰直角三角形一模一样。[4]因此,正方形的面积就是三角形面积的
4倍。沿对角线将一个像金枪鱼三明治那样的1×1正方形切成两半,如
下图所示,就可以得到一个上图中的等腰直角三角形:金枪鱼三明治的面积是1×1=1,因此,形状为等腰直角三角形的
半个三明治的面积是12,内接正方形的面积就是12的4倍,即2。
假设你原来不知道勾股定理,那么现在你已经知道了,至少你知
道勾股定理是关于这个特殊的直角三角形的。因为位于下方的那半个
金枪鱼三明治是一个直角三角形,与内接正方形左上方的图形形状相
同,而且这个三角形的斜边就是内接正方形的边。因此,这条斜边的
平方,就是内接正方形的面积,即2。用简练的术语表示的话,斜边的
长度就是2的平方根。
内接正方形被圆全部包围在内,如果正方形的面积是2,那么圆的
面积肯定不小于2。接下来,我们再画一个正方形:
这个正方形叫作外切正方形,它也与圆有4个接点,但是将圆全部
包围在内。正方形的边长是2,面积为4,因此,圆的面积不超过4。
也许,证明圆周率在2与4之间并不是一件了不起的事,但是阿基
米德的研究还没有结束。取内接正方形的4个顶点,标出相邻两个顶点
之间圆弧的中点。这样,我们在圆上就得到了4个均匀分布的点,把这
8个点连起来,就得到一个内接八边形:计算内接八边形的面积稍有难度,我就不用三角学来为难大家
了。重要的是,构成这个图形的是直线与角,而不包含曲线,因此,阿基米德有办法计算它的面积。这个八边形的面积是2的平方根的2
倍,约为2.83。
接下来,我们再引入外切八边形:这个外切八边形的面积是 ,比3.31略大。
因此,圆的面积被限制在2.83~3.31的范围内。
没有理由就此停手吧?我们可以在八边形(包括内接八边形与外
切八边形)的顶点之间再加入一些点,构成十六边形。通过计算,我
们可以发现圆的面积在3.06~3.18的范围内。以此类推,最终得到这样
的图形:啊,这不就是圆吗?当然不是,它是一个有65 536条边的正多边
形。不是吗?
欧几里得与阿基米德敏锐地发现,无论它是圆还是边长极短、边
的数目极大的多边形,这些都不重要,关键在于这两个图形的面积非
常接近,两者之间的差别不会产生任何影响。通过不断重复上述操
作,圆与多边形之间的面积之差越来越小,最后趋于“穷竭”。圆的
确是曲线构成的,但是,如果我们取其中很短的一段,它会非常接近
于直线,就像在地球表面取一小片土地,其非常接近于平面一样。
记住:局部是直线,整体是曲线。
我们还可以这样考虑,即从一个非常高的高度快速接近圆。起
初,我们可以看到整个圆:然后,我们只能看到一段弧线:接下来,我们看到的是一段更短的弧线:随着我们离圆越来越近,视野变得越来越小,到最后我们看到的
弧线与直线已经非常接近,几乎没有区别了。如果一只蚂蚁在圆上爬
行,它只能看到身边很小的范围,它会以为自己是在一条直线上爬
行。在地球表面上生活的人也一样,认为自己位于一个平面之上(除
非他非常聪明,知道观察由远而近、逐渐从地平线上露出来的物
体)。
微积分与牛顿
接下来,我要教大家关于微积分的知识。准备好了吗?首先,我
们要感谢艾萨克·牛顿。他告诉我们,圆的研究并没有特别大的难
度。所有的平滑曲线,只要我们无限接近地观察,都跟直线非常相
似。只要没有尖角,无论这条曲线如何弯曲盘旋,都无伤大雅。发射导弹时,导弹会以下图所示的轨迹运动:
导弹的运动轨迹是一条抛物线,先上升,然后下降。在万有引力
的作用下,所有的运动轨迹都会呈曲线形并接近地面,这是物理学的
一个基本事实。但是,如果我们取非常短的一段并靠近观察,这条曲
线就会变成下图所示的形状:再靠近一些,就会变成这样:上图中的导弹运动轨迹在肉眼看来就像一条直线,以一定的倾斜
角度向上运动。越靠近观察,曲线就越接近直线。
接下来是观念上的一个飞跃。牛顿说,好吧,让我们继续——把
视野缩小到无限小,小到无法计量的程度,但不是零。这时候,我们
研究的就不是一段很短的时间内导弹的运动轨迹了,而是某一个时点
的情况。本来接近于直线的运动轨迹直接变成直线了,牛顿把这条直
线 的 倾 斜 度 叫 作 流 数 ( fluxion ) , 我 们 现 在 称 之 为 导 数
(derivative)。
阿基米德不愿意完成这种飞跃。他知道,多边形的边越短,就越
接近于圆,但是,他绝对不会认为圆其实就是一个有无穷多条边而边
长极短的多边形。与牛顿同时代的人中,也有人不愿意凑这个热闹,反对者中名气
最大的是乔治·贝克莱(George Berkeley)。贝克莱用充满嘲讽的语
气贬低牛顿提出的无限小这个概念:“这些流数是什么呢?其实就是
迅速消逝的增量的速度。那么这些迅速消逝的增量又是什么呢?它们
既不是有限量,也不是无限小的量,什么都不是。难道我们不能称它
们是‘逝去量的鬼魂’吗?”遗憾的是,这一段逸事在现代数学文献
中却没有记载。
然而,微积分的确有效。如果围绕头部摆动一块石头,在突然放
手后,石头就会以一个恒定的速度飞出去,运动轨迹呈直线形[5],方
向则正好是根据微积分基本公式计算的放手时石头的运动方向。这是
牛顿的另一个惊人发现:运动物体会做直线运动,除非该物体受到其
他力的作用,才会偏离原来的方向。这也是我们习惯于线性思维的原
因之一:我们对时间与运动的理解,是在生活中观察到的各种现象的
基础上形成的。甚至在牛顿提出他的那些定律之前,我们就已经知道
物体会沿直线运动,除非有外力改变这种状况。
永远无法到达的冰激凌商店
对牛顿的批评是有道理的。从现代数学的严密性来看,他提出的
微积分公式谈不上完美。问题就出在无限小这个概念上,这是几千年
来数学家们面对的一个令人多少有些尴尬的问题。公元前5世纪,希腊
爱利亚学派有一位名叫芝诺(Zeno)的哲学家,尤为擅长就物理世界
提出一些看似无知的问题,但是这些问题总会酿成哲学上的大混乱。
这一次,又是他率先发难。
芝诺提出的一个悖论非常有名,大意就像我下面举的这个例子。
我决定步行去商店买冰激凌,当然,在我走完一半的路程之前,我不
可能到达商店。在我走完一半路程之后,如果我不接着走完剩下路程的一半,我还是无法到达商店。每次我都要先走完剩下路程的一半,才有可能到达商店,如此循环下去。我可能与冰激凌商店越来越接
近,但是,无论我走完多少个半程,我永远也无法到达冰激凌商店。
我与我的巧克力冰激凌之间总会有一段极小但不等于零的距离,因
此,芝诺断言步行去商店买冰激凌是无法实现的。芝诺的这个悖论适
用于所有的目的地:步行穿过大街,迈出一步,等等。也就是说,所
有的运动都是不可能实现的。
据说犬儒学派的第欧根尼(Diogenes the Cynic)驳斥了芝诺悖
论,他站起来走到了房间的对面。这个举动完美地证明芝诺眼中那些
不可能完成的运动事实上是能够完成的,那么,芝诺的证明肯定出了
问题。但是,问题出在哪儿呢?
我们可以利用数字把商店之行分成若干部分。我们得先走一半路
程,然后走剩下路程的一半,也就是全程的14,此时,还剩下全程的
14。再之后剩下的是18、116、132……。所以,走向商店的过程
就是:
12+14 +18 +116+132 +……
把这个数列的前10项相加,得数约等于0.999。加总前20项,得数
就与0.999 999更为接近。换言之,我们与商店的距离非常非常近。但
是,无论我们加多少项,都无法得到1。
芝诺悖论与另一个难题非常相似:循环小数0.999 99……是否等
于1?
我见过有人因为这个问题都快要挥拳相向了,在《魔兽世界》粉
丝主页、艾茵·兰德论坛等网站,人们也就这个问题争论不休。关于
芝诺悖论,我们的自然反应是“我们当然能买到冰激凌”。但是,在
我们讨论的这个问题上,直觉却给出了不同的答案。如果我们一定要问出答案,大多数人会说“0.999 9……不等于1”。毫无疑问,这个
循环小数看上去不等于1,要小一点儿,但两者的差不是很大。就像例
子中那位买不到冰激凌的家伙一样,这个循环小数与1越来越接近,但
可能永远也无法等于1。
不过,无论哪里的数学老师,包括我本人,都会告诉他们:“你
错了,这个循环小数就是等于1。”
那么,我怎么才能说服他们呢?下面这个方法效果不错。大家都
知道
0.333 33……=13
两边同时乘以3
0.333 33……×3=13×3
我们会发现
0.999 99……=1
如果这样还不能说服你,那么我们把0.999 99……乘以10,也就
是把小数点向右移一位
10×0.999 99……=9.999 99……
再把讨厌的小数从两边减去10×0.999 99……–1×0.999 99……=9.999 99……–0.999
99……
等式的左边就是9×0.999 99……,因为一个数的10倍减去该数就
是这个数的9倍。而等式的右边,我们成功地消除了讨厌的循环小数,只剩下9。因此,我们得到
9×0.999 99……=9
如果一个数的9倍是9,那么这个数只能是1,不是吗?
通常,这个证明过程可以说服别人。但是,坦率地讲,这个证明
并不完美。它不能让人们彻底消除疑虑去相信0.999 99……等于1,而
是迫使人们接受一个代数关系:“你们知道13就是0.333 3……吧?
难道不是吗?”
更糟糕的是,你们之所以接受我的证明过程,可能是因为我先进
行了乘以10这个运算。但是,这个运算没有问题吗?我们看看下面这
个算式的结果是多少。
1+2+4+8+16 +……
在这个算式中,符号“……”表示“求和永远不会终止,且每次
的加数是前一个加数的2倍”。毫无疑问,该算式的和是一个无穷大的
数。上面那个包含0.999 99……的证明过程看似正确,但有一个与之
十分相似的证明过程却会得出不同的结果。对上面这个求和算式乘以
2,我们得到
2×(1+2+4+8+16 +……)= 2+4+8+16+……这个结果与原来的求和算式十分相似,实际上,它是原来的求和
算 式 1+2+4+8+16 +…… 减 去 了 第 一 个 加 数 1 , 也 就 是 说 ,2×1+2+4+8+16 +……比1+2+4+8+16 +……少1。换言之
2×(1+2+4+8+16 +……)–1×(1+2+4+8+16 +……) = –1
但是,这个算式的左边化简后就会得到原来的求和算式,于是我
们得到
1+2+4+8+16 +……= –1
你相信这个结果是正确的吗?加数越来越大的无限循环加法运算
的结果竟然是负数,你能相信吗?
还有更让人无法接受的呢,下面这个算式的得数是多少?
1–1+1–1+1–1 +……
我们很有可能认为这个得数是
(1–1)+(1–1)+(1–1)+……=0+0+0+……
我们还有可能认为,即使有无数个0相加,结果也会等于0。但
是,由于负负得正,因此1–1+1等于1–(1–1)。不断地进行这个转
换,上面的算式就可以写成
1–(1–1)–(1–1)–(1–1)……=1–0–0–0……这样计算的结果就等于1,道理跟上面的计算一样。那么,结果到
底是0还是1呢?还是一半情况下等于0,另一半情况下等于1呢?结果
到底等于多少取决于最后一个加数,但是无穷求和算式没有最后一个
加数。
现在的情况比以前更糟糕了,别急着做出判断。假设T是这个神秘
的求和算式的得数:
T=1–1+1–1+1–1+……
把等式两边都变成各自的相反数,于是我们得到
–T=–1+1–1+1……
但是,如果将设为T的部分中的第一个加数1去掉,也就是说T–
1,就正好是上述算式的右边部分,即
–T= –1+1–1+1……=T–1
于是–T=T–1,如果等式成立,T就等于12。无穷多个整数相
加,得数竟然神奇地变成了分数,这可能吗?如果觉得不可能,那么
我们自然有理由怀疑这样一个看似毫无破绽的证明过程出了问题。但
是,请注意,真的有人觉得这个结果是有可能的,比如意大利的数学
家、神父圭多·格兰迪(Guido Grandi),格兰迪级数1–1+1–1+1–
1 +……就是以他的名字命名的。1703年,格兰迪在一篇论文中证明该
级数的和是12,而且指出这个神奇的结果表明宇宙是从虚无中产生
的。(不用担心,我和大家一样,不会相信他的结论。)当时的杰出
数学家,包括莱布尼茨与欧拉,虽然没有接受格兰迪的结论,却认可
了他奇怪的计算方法。实际上,要解出0.999……这个谜(以及芝诺悖论、格兰迪级
数),还需要进行更深入的研究。大家也无须屈从于我的代数知识,违心地接受我的观点。比如说,大家可以坚持认为0.999……不等于
1,而是等于1减去一个无限小的数。在这个问题上,大家还可以更进
一步,坚持认为0.333……不等于13,而是比13小,两者的差也是一
个无限小的量。完善这样的观点需要一些毅力,但并不是一件不可能
的事。我在教授微积分时,有一个名叫布莱恩的学生,因为不满课堂
上教的各种定义,自己提出了一大堆理论,并且把他提出的无限小量
命名为“布莱恩数”。
事实上,这样的情况并不是第一次发生。数学中有一个叫作“非
标准分析”(nonstandard analysis)的领域,就在专门深入研究这
类数字。20世纪中叶,亚伯拉罕·罗宾逊(Abraham Robinson)开拓
的这个研究领域,终于为贝克莱觉得荒谬的“迅速消逝的增量”下了
明确的定义。我们必须付出的代价(从另一个视角看,未尝不是一种
收获)是接受各种各样的新数字,不仅包括无穷小的数字,还包括无
穷大的数字,它们奇形怪状、大小不一。[6]
布莱恩的运气不错。我在普林斯顿大学的同事爱德华·尼尔森
(Edward Nelson)是非标准分析方面的专家。为了让布莱恩进一步了
解非标准分析,我安排他们俩见了一面。后来,爱德华告诉我,那次
见面并不顺利。在爱德华告诉布莱恩那些无限小量不可以叫作“布莱
恩数”之后,布莱恩立刻丧失了兴趣。
(这给我们上了一堂思想品德课:如果人们学习数学只是为了名
声与荣誉,那么他们在数学研究的道路上是走不远的。)
到目前为止,我们上文讨论的那个争议性问题还没取得任何进展
呢。0.999……到底是多少?等于1,还是比1小?两者的差是一个无穷
小的数,而这个无穷小的数在100年前还不为人所知?正确的做法是谢绝回答这个问题。0.999……到底是多少?这个数
字似乎就是下列数字的和:
0.9+0.09+0.009+0.000 9+……
但是,这个和到底是什么呢?后面的那个令人讨厌的省略号是个
大麻烦。两个数、三个数甚至100个数相加,结果都不可能引起任何争
议,这是用数学的方式表示一个我们非常了解的物理过程:取100堆材
料,捣碎后混合到一起,看最后得到多少。但是,如果这些材料有无
穷多堆,情况就迥然不同了。在现实世界,我们不可能会有无穷多堆
材料。无穷级数的和是多少呢?根本没有,除非我们为它赋予一个
值。19世纪20年代,奥古斯汀–路易·柯西(Augustin-Louis
Cauchy)完成了一个伟大的创新,将极限的定义引入了微积分。[7]
1949年,英国数论学家哈代(Hardy)在他的专著《发散级数》
(Divergent Series)中,把这个问题解释得非常清楚:
现代数学家从未想到,一堆数学符号竟然需要通过定义为其赋
值,才会具有某种“含义”,因此,即使对于18世纪最杰出的数学
家而言,这个发现也不能等闲视之。他们非常不习惯这样的定义,每次都要指出“在这里,X的意思是指Y”,这让他们觉得十分别
扭。柯西之前的数学家几乎不会提出“我们应该怎么定义1–1+1–
1 +……”这样的问题,而会问“1–1+1–1 +……是多少”。这样
的思维习惯让他们陷入了毫无意义的困惑与争议(常常会演变成辱
骂)中。
我们不可以把这个问题看作数学领域的相对主义而掉以轻心。我
们可以为一组数学符号赋予任何含义,但这并不意味着我们就应该这
么做。与现实生活一样,我们关于数学问题的选择,有的是明智的,有的则非常愚蠢。在数学领域,明智的选择可以消除毫无意义的困
惑,同时不会引发新问题。
在计算0.9+0.09+0.009 +……时,加项越多,和就越接近于1,但
永远不会等于1。无论我们在离1多近的位置上设置警戒线,在经过有
限次数的加法运算之后,和最终都会越过这条警戒线,而且永远不会
停下前进的步伐。柯西指出,在这样的情况下,我们应该直接将这个
无穷级数的值定义为1。随后,他绞尽脑汁,希望证明在他的这个定义
被接受之后,不会在其他方面造成相互矛盾的糟糕局面。在这个过程
中,柯西构建了一个框架体系,完美地提升了牛顿微积分学的严谨程
度。当我们指出某条曲线的局部接近于直线时,大致的意思是说:我
们越靠近观察,这条曲线就越接近于直线。在柯西的框架中,我们无
须提及任何无穷小的数字或者其他概念,以免心存疑虑的人因此担心
害怕。
当然,这样的做法是要付出代价的。0.999……这个谜之所以应该
被破解,是因为它会导致我们的直觉陷入自相矛盾的状态之中。我们
希望可以像上文那样,方便地对无穷级数的和进行各种代数运算,因
此,我们需要它等于1。但另一方面,我们又希望每个数只能用一个独
一无二的十进制数字来表示,因此,我们不应该随心所欲,一会儿说
这个数是1,一会儿又说它是0.999……。我们不可能同时满足这两个
要求,而只能放弃其中一个。柯西提出的这个方法经过两百年时间的
验证,其价值得到了充分的证明,不过,这个方法放弃了十进制展开
的唯一性。在英语中,我们有时会用两个不同的字母串(单词)表示
现实世界中的同一个事物,但我们并没有因此陷入任何麻烦。同样,使用两个不同的数字串表示同一个数,也不是不可以接受的。
至于格兰迪级数1–1+1–1+……,则是柯西定理无法处理的级数
之一,这类发散级数是哈代的著作讨论的内容。1828年,柯西定理的
早期崇拜者之一、挪威数学家尼尔斯·亨利克·阿贝尔(Niels
Henrik Abel)认为:“发散级数是捏造出来的概念,非常邪恶,以此为基础的任何证明都是可耻的。”[8]而哈代的观点,也就是我们现在
所持的观点,则十分宽容,认为对于发散级数而言,有的我们应该赋
值,有的则不应该赋值,还有的需要根据其所在的具体环境决定是否
应该为之赋值。现代数学界认为,如果需要为格兰迪级数赋值,这个
值应该是12,因为研究发现,对于所有值得关注的无穷级数,理论要
么为之赋值12,要么(如柯西定理)干脆拒绝为之赋值。[9]
柯西所给出的定义非常复杂,精确地写出来需要费不少工夫,即
使对柯西本人来说也不是件易事,他没能用语言明晰地表述自己的思
想。[10](在数学中,对新观点、新概念最清楚明了的描述,基本上
都不是直接来自创建者本人。)柯西是一名坚定的保守主义者和君主
主义者,但他引以为豪的是,他在数学研究中极具批判精神,勇于挑
战学术权威。他在成功地摒弃容易招致质疑的无穷小量之后,单方面
修改了他在巴黎综合理工大学的教学大纲,力求传播自己的新思想。
他的这一做法激怒了他身边的所有人:他的学生深感困惑,因为他们
报名学习的是针对大学一年级学生的微积分学,而不是介绍纯数学前
沿动态的学术成果;他的同事们认为,学校里学习工程技术的学生没
有必要吃这个苦头,去钻研柯西讲授的那些高深内容;学校管理部门
则严令他按纲施教,不得自由发挥。校方强行制定了新的课程内容,强调在微积分教学中采用包含无限小量概念的传统方法。同时,为了
防止柯西置若罔闻,校方还安排人进入他上课的教室做听课记录。但
是,柯西并没有就范,柯西对工程师需要学习什么内容不感兴趣,他
感兴趣的是探索真理。
从学校的立场来看,我们很难为柯西的这一做法进行辩解,但我
仍然支持他。数学研究的最大乐趣之一,就是我们清楚地感受到自己
对某个问题的理解是正确、完全、彻底的,我在其他领域从未有过类
似的感受。而且,一旦你知道了正确的做法之后,就很难说服自己去
介绍错误的做法,性格执拗的人更加不可能这样做。[1] 说明一下,我们不知道第一个证明勾股定理的人是谁,不过学术界几乎可以肯定不是
毕达哥拉斯(Pythagoras)本人。从与他同时代的人所遗留的资料中可以发现,公元前6世
纪,一位名叫毕达哥拉斯的人学识渊博,声名显赫,但是,除此以外,我们对他几乎一无所
知。对他生平与研究工作的记载要追溯至他死后800年左右的时间,在此之前的毕达哥拉斯完
全是个谜,除了一群哲学门徒自称“毕达哥拉斯”。
[2] 这肯定是不可能的,但是直到18世纪人们才完成了相关证明。
[3] 事实上,早先的筒仓不是圆柱体。直到20世纪,威斯康星大学的金(F·H·King)
教授发明了现在普遍采用的圆柱体结构,筒仓才变成了圆柱体。金的这项发明是为了解决筒仓
角落里的谷物容易腐烂变质的问题。
[4] 当然,我们可以通过在平面上平移、旋转前面的那个等腰直角三角形,得到能组成一
个正方形的4个三角形。我们默认这些操作不会改变图形的面积。
[5] 不考虑万有引力、空气阻力等影响,在较短的时间内,其运动轨迹非常接近直线。
[6] 约翰·康威(John Conway)提出的“超实数”(surreal numbers)就是一个典型
的例子。从这个名字就可以看出来,这些数字非常迷人,却又非常怪异。超实数是数字与战略
博弈构成的一个奇怪混合体,人们至今还没有完全探索出其中的精义。我们可以从伯莱坎普
(Berlekamp)、康威与盖伊(Guy)合著的《稳操胜券》(Winning Ways)一书中了解这些
奇怪的数字,还可以学到大量博弈论方面的数学知识。
[7] 数学上的所有突破都是在前人研究成果的基础之上实现的,柯西的极限存在准则也不
例外。柯西给出的定义在很大程度上秉承了让·勒朗·达朗贝尔(Jean le Rond
d’Alembert)判别法的核心思想。不过,毫无疑问,柯西定理是一个转折点,从此以后,数
学进入了现代分析的时代。
[8] 格兰迪最初在神学研究中应用了发散级数,考虑到这个事实,阿贝尔的这个观点极具
讽刺意味。
[9] 琳赛·洛翰(Lindsay Lohan)有一句名言:“极限是不存在的。”
[10] 我们在数学课程里学到的e和?,就来自柯西积分公式。第3章 到2048年,人人都是胖子?
喜剧演员尤金·米尔曼(Eugene Mirman)讲过一个统计学方面的
笑话。他说自己经常告诉人们:“通过阅读,我发现美国人百分之百
都是亚裔人。”
人们感到很奇怪,就问他:“但是,你不是亚裔人啊。”
这时候,尤金就会抖出包袱,非常自信地说:“通过阅读,我发
现自己是亚裔人!”
《肥胖》(Obesity)杂志上的一篇文章,让我不由自主地想起了
米尔曼的这个笑话。那篇文章在标题中提出了一个令人尴尬的问题:
“所有美国人是否都会超重甚至肥胖?”也许觉得问句的力量还不够
震撼,文章又给出了一个肯定的答案:“会的,到2048年就会这
样。”
到2048年,我的年纪将是77岁,我不希望自己超重,但是这篇文
章告诉我:我会的!
不用想都知道,《肥胖》杂志上的这篇文章引起了媒体的关注。
美国广播公司(ABC)发出了“肥胖启示”的警告,《长滩电讯日报》
(Long Beach PressTelegram)给出了一个直截了当的标题:“我们
越来越胖了”。对这个现象稍加研究,我们就会想到最近美国人在思
考国民道德现状时,面对各种不同现象所表现出来的焦躁多虑。在我
出生之前,男孩子们都留长发,于是人们担心年青一代会不务正业。
在我小的时候,我们喜欢玩街机游戏,于是人们觉得我们注定竞争不
过勤劳的日本人。现在,我们经常吃快餐,于是人们又怀疑我们将身
体虚弱、行动不便,像一摊泥一样,瘫在早已无法摆脱的沙发上死去,周围还堆满了空空的炸鸡桶。显而易见,这篇文章把这种焦虑当
作经过科学验证的事实了。
我要告诉大家一个好消息:到2048年,不会人人都超重。为什么
呢?因为不是所有的线都是直线。
但是,我们在前面讨论过,牛顿发现所有的线都与直线非常接
近,由此催生了“线性回归”(linear regression)这个概念。社会
学经常要用到线性回归分析这种统计学技术,就像居家维修要使用螺
丝刀一样。我们在报纸上看到的那些内容,诸如:有很多亲戚的人会
更幸福;“汉堡王”连锁店开得越多的国家,越容易面临道德沦丧的
问题;烟酸摄入量减半的话,患足癣的危险就会加倍;收入每增加1万
美元,美国人把选票投给共和党的可能性就会增加3%,等等。所有这
些,都是线性回归分析的结果。
下面,我告诉大家线性回归分析的使用方法。假设你要分析两个
事物之间的关系,比如大学学费与新生SAT平均分。你可能认为,SAT
分数高的学校,很有可能收费也高,但是我们稍做数据分析,就会发
现并非如此。毗邻北卡罗来纳州伯灵顿市的伊隆大学,新生数学与语
言测试的平均分是1 217分,年均学费是20 441美元。与伊隆大学距离
不远、位于格林波若的吉尔佛大学,学费稍高,为23 420美元,但是
新生的SAT平均分仅为1 131分。
如果进一步研究多所学校的情况,比如2007年把学费与SAT分数情
况报告给北卡罗来纳职业资源网的31所私立高校,就能清楚地看到某
种趋势。
下图中每个点分别代表其中一所高校。靠近右上角的位置有两个
点,SAT分数与学费都非常高,代表的是维克森林大学和戴维森学院。
靠近底部的位置有一个孤零零的点,代表的是卡巴拉斯健康科学学
院,是这些私立高校中唯一一所学费低于1万美元的大学。上图表明,总的来说,分数高的学校收费也高。但是,高多少
呢?这就需要在图中引入线性回归这个工具了。在上图中,所有的点
很明显都不在同一条直线上。但是,这些点并不十分分散,我们可以
徒手画出一条直线,从这些点比较集中的位置穿过。借助线性回归,无须猜测,就可以画出最接近于[1]所有点的直线。对于北卡罗来纳的
高校,这方面的大致情况可用下图表示。图中直线的倾斜角度约为28度,这意味着:如果学费真的完全取
决于SAT分数,而且决定关系可由我在图中绘制的直线来表示,那么
SAT分数每提高1分,与之相对应,学费就会增加28美元。如果新生的
SAT平均分提高50分,就可以把新生的人均学费提高1 400美元。(从
学生家长的角度看,孩子的分数提高100分,就意味着家长每年要多支
付2 800美元的学费。由此可见,考试辅导班比我们预想的要贵得
多!)
线性回归是一个非常实用的工具,用途广泛、操作简便,只需要
在数据表上完全不同。南达科他州很不幸地位列榜首,每10万
人中每年死于脑癌的人数为5.7人,远远超出每年3.4人的全美脑癌死
亡率。排在南达科他州之后的是内布拉斯加州、阿拉斯加州、特拉华
州和缅因州。如果我们不希望患上脑癌,可能就要避开这些地方。那
么,我们该搬到什么地方去呢?在这个名单的末尾,我们会发现怀俄
明州、佛蒙特州、北达科他州、夏威夷以及哥伦比亚特区。
这个结果有点儿奇怪。南达科他州脑癌频发,为什么北达科他州
却几乎没有人患上这种癌症呢?为什么住到佛蒙特州就安全,而住在
缅因州就有危险呢?
原因不是南达科他州一定会让居民患上脑癌,而北达科他州的居
民则对癌症免疫。排在榜首的这5个州有共同的特点,而排在榜尾的那
5个州也有相似之处,即这些地方人口稀少。在排在前面和末尾的这9
个州(及一个特区)中,人口最多的是内布拉斯加州。在人口排名的
竞争中,该州与西弗吉尼亚州是难兄难弟,双方为第37名的位置争得
热火朝天。这个分析结果似乎表明,居住在人口较少的州,患脑癌的
概率有可能高得多,也有可能低得多。很显然,这个结论没有任何道理,因此,我们最好换一种解释方
法。
为了更好地理解这种情况,我们先做一个虚拟游戏,游戏的名字
叫作“谁最善于抛硬币”。玩法很简单,将一把硬币抛出去,正面朝
上的硬币数量最多的一方获胜。我们给这个游戏增加一点儿趣味性,让大家手里握的硬币数量不同。有些人(“小数”组)只有10枚硬
币,有些人(“大数”组)则有100枚硬币。
如果以正面朝上硬币的绝对数量来计分,我们几乎可以肯定获胜
方是“大数”组的成员。“大数”组成员大多都有约50枚硬币正面朝
上,这个数字是“小数”组成员无法企及的。即使“小数”组有100名
成员,他们当中的最高得分也只能是8或9枚。
显然,这样的玩法并不公平,因为“大数”组拥有难以逾越的先
天优势。因此,我们可以改进这个游戏:在评分时,不以绝对数量为
依据,而是根据比例来计分。这样的计分方法,对两个组来说应该是
公平的。
但是,这个计分方法仍然不公平。我前面说过,如果“小数”组
有100名成员,至少有一个人可能抛出8枚正面朝上的硬币,因此他的
得分为80%。那么“大数”组的成员呢?他们都不会有80%的硬币是正
面朝上的。当然,可能性是存在的,但却不会发生。事实上,从概率
的角度看,“大数”组必须包含20亿名成员,出现过高或过低的结果
才是合理的。这个结论符合我们对于概率的直觉认识,抛的硬币越
多,越有可能出现一半正面朝上一半正面朝下的结果。
读者朋友们可以自己尝试一番,我就动手做过这个实验。为了模
拟“小数”组成员,我一次抛10枚硬币,连续抛很多次,硬币正面朝
上的数量构成下面这个序列:4,4,5,6,5,4,3,3,4,5,5,9,3,5,7,4,5,7,7,9……
然后,我模拟“大数”组成员,一次抛出100枚硬币,多次抛投的
结果为:
46,54,48,45,45,52,49,47,58,40,57,46,46,51,52,51,50,60,43,45……
每次抛1 000枚硬币的结果是:
486,501,489,472,537,474,508,510,478,508,493,511,489,510,530,490,503,462,500,494……
算了,还是跟大家坦白吧。我并没有真的抛1 000枚硬币,而是用
计算机模拟得出的结果,谁有那么多的时间抛1 000枚硬币呢?
不过,还真的有人这样做了。1939年,南非数学家克里奇(J. E.
Kerrich)因为冒失地跑到了欧洲,结果很快在丹麦被逮捕并被关进了
集中营。如果一个普通人被关在集中营,不知道猴年马月才能重见天
日,那么他可能会在牢房的墙壁上刻画记号记录天数,以此来帮助自
己度过这段难熬的时光。不过,克里奇这位热衷于统计学研究的囚犯
则不同,他总共将一枚硬币抛了1万次,还记录了正面朝上的数量,统
计结果如下图所示。从中我们可以看出,随着硬币的数量越来越多,正面朝上的概率
明显地向50%靠近,就好像被一把看不见的老虎钳钳住了一样。计算机
模拟也会产生同样的结果。抛10枚硬币,正面朝上的比例范围为
30%~90%;抛100枚,比例范围缩小,变为40%~60%;抛1 000枚,比例
范围仅为46.2%~53.7%。在某个规则的作用下,这个比例越来越接近
50%。这只不讲情面、无法抗拒的“手”就是“大数定律”(Law of
Large Numbers)。这里,我就不赘述这条定理了(尽管这条定理极具
美感),但是我们可以这样理解:抛的硬币越多,正面朝上的比例为
80%的概率就越小。事实上,如果抛的硬币足够多,结果为有51%的硬
币正面朝上的概率也是微乎其微的!在抛10枚硬币的情况下,如果得
到高度失衡的结果,并不值得我们关注。但是,如果抛100枚硬币,结
果仍然失衡,那就让人吃惊了,我们甚至会怀疑:是不是有人在硬币
上动了手脚?
随着实验不断重复,实验结果往往会趋于稳定,并接近一个固定
的平均值。事实上,自从运用数学方法研究概率以来,我们经常会得出这样的结论。16世纪的吉罗拉莫·卡尔达诺(Girolamo Cardano)
就用不是十分正式的方式提出了这个原则,但是,直到19世纪初,西
莫恩·德尼·泊松(Simeon-Denis Poisson)才赋予它一个简明扼要
的名字:大数定律。
抛硬币与法国警察的帽子
18世纪初,雅各布·伯努利(Jakob Bernoulli)完成了对大数定
律的精确表述与数学证明。如今,人们不再把他的研究结果视为观察
结果,而是一个定律。
根据这个定律,这种大数–小数的游戏并不公平。由于有大数定
律,“大数”组成员的得分有向50%靠拢的趋势,而“小数”组的得分
变化程度则较大。我们不能就此得出结论,认为“小数”组成员“更
善于”抛硬币,即使他们每次都能获胜。如果我们把所有“小数”组
成员(而不仅仅是得分高的成员)正面朝上的比例进行平均,结果就
会与“大数”组相仿,也接近50%。如果我们统计的不是硬币正面朝上
数量最多的,而是最少的,那么“小数”组成员的成绩就会一下子变
得非常糟糕,很有可能某位选手抛的正面朝下的硬币比例仅为20%,而
所有“大数”组成员的得分都不会这么低。统计正面朝上的绝对次数
会让“大数”组拥有无与伦比的优势,但是统计比例的方法同样会使
游戏不公平,只不过这次是“小数”组占便宜罢了。硬币的枚数(我
们在统计学中称之为“样本大小”)越少,正面朝上的硬币所占比例
的变异性就会越显著。
因此,在进行政治民意测验时,如果投票人数很少,调查结果就
不那么可靠。脑癌的调查也是如此。在人口较少的州,其样本数量比
较小,因此,统计结果就会像羸弱的小草一样,一旦概率这股狂风吹
过来,它们就会东倒西歪,而那些人口大州就像参天大树,在狂风中傲然挺立。如果统计脑癌致死的绝对人数,人口大州的结果就会偏
高,但是,如果计算脑癌致死人数的最高比例(计算最低比例的结果
也一样),又会把人口少的州推到靠前的位置。南达科他州是脑癌死
亡人数比例最高的州之一,而北达科他州却位于最低的行列,原因就
在这里。不是因为拉什莫尔山或者华尔药局会散布某种对大脑有害的
毒素,而是因为小数比例天性多变。
我们都非常熟悉这个数学事实,只是有时我们视而不见罢了。大
家知道谁是NBA(美国职业篮球联赛)中的神投手吗?在2011~2012赛
季中的某一个月里,有5名球员投篮命中率相同,并列全联盟榜首。这
5名球员是阿蒙·约翰逊(Armon Johnson)、德安德鲁·利金斯
(DeAndre Liggins)、莱恩·瑞德(Ryan Reid)、哈西姆·塔比特
(Hasheem Thabeet)和罗尼·图里亚夫(Ronny Turiaf)。
那么,到底谁投篮最准呢?
这个问题可不好回答。他们都不是NBA最优秀的投手,连上场机会
都很少。比如,阿蒙·约翰逊只代表波特兰开拓者队打了一场比赛,他有一次投篮,而且投进了。名单上的这5个家伙一共投篮13次,全部
命中。小样本更多变,因此NBA的最优秀投手总是多次投篮而且运气不
错的球员。尼克斯队的泰森·钱德勒(Tyson Chandler)一个赛季投
篮202次,有141次命中得分,在打满所有场次比赛的球员中名列榜
首。显然,我们不会说阿蒙·约翰逊的投篮比钱德勒更精准。(如果
有人对此表示怀疑,可以去看看约翰逊在2010~2011赛季的表现。在那
个赛季,他的投篮命中率一直保持在45.5%,这样的命中率十分普
通。)因此,阿蒙·约翰逊这样的球员根本不会出现在NBA的球星排行
榜上。NBA的各种排名都对上场时间设定了最低要求,否则,由于小样
本的特点,上场时间很短的不知名球员就会上榜。
但并不是所有人都了解这些数量关系,因此在设计排名系统时可
能没考虑到大数定律。如今,许多地方都在实施教育责任制,例如,北卡罗来纳州制订了一个奖励计划,对标准化考试成绩出众的学校实
施奖励。该计划根据每名学生的考试成绩在一年时间内(从春季开
始)取得进步的平均幅度,来评定各校的教学情况,在全州范围内排
名前25位的学校,可以在体育馆悬挂横幅,还可以在周边城镇炫耀一
番。
哪所学校获胜了呢?1999年,获得最高分的是北威尔克斯博纳的
莱特小学,该校的“教学质量得分”为91.5分。北卡罗来纳所有小学
的平均在校人数接近500人,而莱特小学属于学生较少的学校,只有
418人就读。排在莱特小学之后的是金斯伍德小学,得分为90.9分。里
弗赛德小学名列第三,得分为90.4分。金斯伍德只有315名学生,而位
于阿帕拉契山脚下的里弗赛德小学规模更小,只有161名学生。
事实上,在北卡罗来纳州的这次评比中,规模较小的学校大多取
得了不错的成绩。托马斯·基恩(Thomas Kane)与道格拉斯·施泰格
(Douglas Staiger)的一项研究发现,在历时7年的研究中,该州规
模最小的学校中有28%的学校曾经排在前25位,而在所有学校中,只有
7%的学校曾经悬挂过横幅。
这次评估似乎说明,在规模较小的学校里,老师们了解学生及其
家庭的情况,有时间进行单独辅导,因此更有可能提高学生的考试成
绩。
不过,我要告诉大家一个事实:基恩与施泰格合作完成的论文标
题为“学校教育评估手段失当的可能与常见问题”。平均而言,在规
模较小的学校中,学生的考试成绩并没有表现出显著高于其他学校的
情况。此外,该州被派驻“帮扶工作组”的学校(我的理解是因考试
成绩低下而被该州官员训斥的学校)大多规模较小。
在我看来,上述情况表明,里弗赛德小学算不上北卡罗来纳州最
优秀的学校,其道理就与阿蒙·约翰逊不是联盟最优秀的投手一样。前25名之所以大多是规模小的学校,并不是因为这些学校更加优秀,而是因为它们的考试分数更加多变。只要有几名天才学生或者三流的
差生,它们的平均成绩就会发生很大的起伏。而在规模较大的学校,即使出现几个过高或过低的分数,在庞大的学生总数面前,其影响作
用也几乎可以忽略不计。
既然求平均数这个简单方法无法奏效,那么我们如何了解哪所学
校最优秀,或者哪个州的癌症发病率最高呢?如果我们管理着多支团
队,那些小型团队很有可能占据评定系统的两端,我们又如何评估各
团队的绩效呢?
这个问题并不容易解决。如果在南达科他这样人口很少的州接连
出现脑癌病例,我们可以推测脑癌病例数量激增很有可能是因为运气
欠佳,我们还可以估计,该州将来的脑癌发病率很有可能会有所下降
并接近全美整体水平。为了分析这种情况,我们可以用全美脑癌发病
率对南达科他州脑癌发病率进行某种加权处理。但是,如何加权呢?
这是一种艺术,同时还需要完成大量的技术性工作。这里,我就不一
一赘述了。
第一个观察相关事实的是亚伯拉罕·棣莫弗(Abraham de
Moivre)。棣莫弗为现代概率论的初期研究做出了贡献,他在1756年
出版的著作《机会论》(The Doctrine of Chances)是这一领域的重
要文献。早在棣莫弗的时代,人们就已经开始不遗余力地从事数学新
进展的推广工作,埃德蒙·霍伊尔(Edmond Hoyle)是其中的典型代
表。他在牌类游戏方面是绝对权威,时至今日,人们还在说“根据霍
伊尔规则”……霍伊尔写过《机会论快速入门》,目的是帮助赌徒们
掌握这套新理论。
大数定律认为,从长远看,不断地抛硬币,正面朝上的比例会越
来越接近50%。但是,棣莫弗觉得这样的表述不够完美,他希望精确地
了解接近的程度。为了更好地解释棣莫弗的发现,我们再次研究抛硬币时使用的计数方法。不过,我们这一次不再只是简单地列出正面朝
上的硬币数量,而是记录实际得到的正面朝上的数量与期望值(硬币
总数的50%)之间的偏差。换句话说,我们计算实际情况与理想情况之
间的偏差。
用10枚硬币做实验,多次抛投后得到的偏差为:
1,1,0,1,0,1,2,2,1,0,0,4,2,0,2,1,0,2,2,4……
每次抛100枚硬币后得到的偏差为:
4,4,2,5,2,1,3,8,10,7,4,4,1,2,1,0,10,7,5……
每次抛1 000枚硬币后得到的偏差为:
14,1,11,28,37,26,8,10,22,8,7,11,11,10,30,10,3,38,0,6……
从中可以看出,随着抛硬币次数的增加,虽然偏差与硬币总数的
比值在逐步缩小,但是绝对偏差在不断变大(这是由大数定律决定
的)。棣莫弗敏锐地发现,硬币数量的平方根直接影响典型偏差的大
小。如果硬币的数量是上一次的100倍,那么典型偏差的增长系数就是
10,至少绝对偏差的增长系数为10。如果以在硬币总数中所占的比例
来计算,偏差就会随着硬币数量的增加而减小,因为硬币数量平方根
的增加速度比硬币数量的增加速度慢得多。抛1 000枚硬币,与理想情
况的偏差可能多达38,但是如果计算占硬币总数的比例,则与50%的偏
差仅为3.8%。棣莫弗的观察结果,与政治民意测验中计算标准误差(standard
error)[1]的基本原理一致。如果希望将误差条线(error bar)减小
一半,就需要将调查对象增加三倍。如果希望体验连续抛出正面朝上
的结果有多么令人惬意,先要想一想这个概率与50%之间有几个平方根
的差距。100的平方根是10,因此,如果抛100枚硬币,有60枚正面朝
上,那么与50%之间的差距正好是一个平方根。1 000的平方根约为
31,因此,如果1 000枚硬币中有538枚正面朝上,尽管这一次正面朝
上的比例为53.8%,而上次为60%,但这一次的结果会更让我意想不
到。
棣莫弗的研究还没有结束。他发现,随着硬币数量的增加,正面
朝上的比例与50%之间的偏差逐渐形成了完美的钟形曲线,也就是商业
中所谓的正态分布。统计学先驱弗朗西斯·伊西德罗·埃奇沃思
(Francis Ysidro Edgeworth)建议把这条曲线叫作“法国警察的帽
子”,但遗憾的是,他的这个提议没有得到广泛的认可。
钟形曲线的中间部分高高隆起,而边缘部分则非常平坦,也就是
说,硬币的数量与零的距离越远,发生偏差的可能性就越小,而且可
以精确地量化。抛N枚硬币,与有50%的硬币正面朝上这个理想结果之
间的偏差,不超过N的平方根的概率约为95.45%。1 000的平方根约为
31,在上面讨论的抛1 000枚硬币、重复20次的实验中,正面朝上的硬
币数量与500的差在31以内的有18次(90%)。如果继续进行这个实
验,正面朝上的硬币数量为469~531枚的概率就会越来越接近95.45%。
[2]这种情况似乎是某种力量在刻意为之。棣莫弗也有这种感觉,他
多次提到这个问题,认为抛硬币(或者其他研究概率的所有相关实
验)都出现这样的规律,是上帝之手在起作用。上帝把抛硬币、掷骰
子和人类生活的短时不规则行为,转化为可以预测的长期行为,其中
的规律无法更改,但是公式可以破译。这样的想法其实十分危险。如果我们认为有一只超自然的手(上
帝的手也好,幸运女神或者印度教吉祥天女的手也罢)在操纵这些硬
币,使半数硬币正面朝上,我们就会掉进所谓的“平均定律”(law
of averages)的陷阱:认为在出现数次正面朝上之后,下一枚硬币几
乎肯定是反面朝上;或者认为在生了三个男孩之后,下一个肯定会生
女儿。棣莫弗不是说过极端结果是极不可能发生的吗?例如连生4个儿
子,他确实说过这样的话。但是,在生了三个儿子之后,第四个仍然
是男孩的情况并不是不可能。事实上,这一次与第一次生男孩的概率
相同。
乍一看,这似乎与大数定律互相矛盾。根据大数定律,我们生男
孩和生女孩的概率应该是相等的。[3]其实,这种矛盾是一种假象。看
看抛硬币的情况,更容易理解这个问题。如果我们抛硬币连续10次得
到正面朝上的结果,我们可能会觉得这枚硬币很奇怪。后文会接着讨
论这个问题,但是目前我们假设这枚硬币没有问题,随着抛硬币的次
数增多,正面朝上的比例肯定会接近50%。
根据常识,在连续10次得到正面朝上的结果后,下一次反面朝上
的概率肯定要略高一点儿,只有这样才能修正目前的不平衡状况。
但是,常识也非常明确地告诉我们,硬币肯定无法记得前10次是
什么样的结果!
我还是开诚布公地为大家答疑解惑吧:我们根据常识完成的第二
次分析是正确的。“平均定律”这个说法不妥当,因为“定律”应该
是正确的,而所谓的“平均定律”却是错误的。硬币没有记忆,因
此,再次抛出硬币时,正面朝上的概率仍然是50%。总的比例会趋近于
50%,但这并不意味着在出现若干次正面朝上的结果后,幸运女神就会
青睐反面。实际的情况是,随着抛硬币的次数越来越多,前10次结果
的影响力就会越来越小。如果我们再抛1 000次,那么这1 010次正面
朝上的比例仍然接近50%。大数定律不会对已经发生的情况进行平衡,而是利用新的数据来削弱它的影响力,直至前面的结果从比例上看影
响力非常小,可以忽略不计。这就是大数定律发生作用的原理。
评判暴行的数学方法
前文对抛硬币与考试分数的分析,同样适用于大屠杀与种族灭绝
行为。如果我们根据死亡人数在全国人口中所占比例来评判这些事
件,那么在分析人口总数非常小的国家所发生的暴行时往往会犯非常
严重的错误。马修·怀特(Matthew White)在他的《暴行备忘录》
(Great Big Book of Horrible Things)一书中,心平气和地研究了
各种恐怖事件,并使用上述方法来评判20世纪发生的暴行。他认为,排在前三位的分别是德国殖民者对纳米比亚赫雷罗人的大屠杀、波尔
布特对柬埔寨人的屠杀和利奥波德国王在刚果发起的殖民战争,而希
特勒的暴行却榜上无名。
这种分析方法对人口较少的国家有失公允,因此有可能导致某些
问题。我们在阅读以色列、巴勒斯坦、尼加拉瓜或者西班牙人惨遭屠
杀的报道时,心情会十分沉痛。在衡量这种悲痛程度时,我们能找到
经过数学方法验证的评判方法吗?
我可以告诉大家一个我自认为行之有效的经验法则:如果屠杀的
规模非常之大,导致“幸存者”为数不多时,用比例的方式来表示死
亡人数是可行的。我们在提到卢旺达种族大屠杀的幸存者时,指的很
可能是生活在卢旺达的图西人,因此,我们可以说种族暴力行为屠杀
了75%的图西人。我们也可以说,导致75%的瑞士人罹难的灾害,其悲
惨程度等同于图西人遭遇的种族灭绝惨剧。
但是,如果我们把一名西雅图居民称作“9·11”恐怖袭击事件的
“幸存者”,就有点儿荒谬了。因此,用其在美国人口中所占比例来
评价“9·11”恐怖袭击的恶劣程度,可能并不是很妥当,在“9·11”恐怖袭击事件中死亡的人占美国人口的比例仅为0.001%。这
个数字非常接近于零,凭直觉我们很难正确理解这样一个比例到底意
味着什么。
我们既不能使用绝对数,又不可以使用比例,那么我们到底如何
评判这些暴行呢?有时候,利用比较的方式会取得不错的效果。比
如,卢旺达种族大屠杀比“9·11”恐怖袭击事件恶劣,“9·11”恐怖
袭击事件比哥伦拜恩校园枪击事件恶劣,哥伦拜恩校园枪击事件又比
造成1人死亡的醉驾事故恶劣。但是,由于时空关系,还有的事件难以
比较。“三十年战争”真的比第一次世界大战更惨烈吗?卢旺达种族
大屠杀的发生速度之快令人瞠目结舌,而两伊战争则旷日持久,这两
者又如何比较?
大多数数学家认为,历史上的这些惨剧和暴行形成了所谓的“半
序集”(partially ordered set)。也就是说,在这些灾难中,有的
可以两两比较,其他的则无法比较。这个观点看似高明,其实不然,因为我们并没有统计出精确的死亡人数,在评判导致人员死亡的炸弹
袭击与战争引发的饥荒这两类事件时,对于哪一类事件更为恶劣的问
题也没有形成明确的结论;因为比较战争残忍程度的问题和比较数量
大小的问题,在本质上是完全不同的。比较数量大小时,我们总是能
得出答案,而比较战争的残忍程度时,有时候我们却无法判断哪一场
战争更加残忍。如果我们希望了解26人在恐怖袭击中丧生的悲剧会给
我们带来什么样的感受,我们可以想象这次恐怖袭击就发生在我们所
在的这座城市,而不是远在地球的另一端,同时还造成26人罹难。这
个方法无论在数学还是道德层面都是无可指摘的,也不需要进行复杂
的计算。
[1] 统计学专业知识丰富的读者应该可以注意到,我一直小心翼翼地避免使用“标准偏
差”(standard deviation)这个术语。其他读者如果希望进一步了解它,需要查询相关资
料。[2] 准确地讲,这个概率比95.45%略小,更接近95.37%,因为1 000的平方根不是31,而是略大于31。
[3] 其实,生男孩的概率是51.5%,生女孩的概率是48.5%,但是,这又有什么关系呢?第5章 比盘子还大的饼状图
即使在分析一些相对简单、看似争议不大的问题时,计算比例的
方法也可能会误导我们。
经济学家迈克尔·斯宾塞(Michael Spence)与桑戴尔·赫施瓦
约(Sandile Hlatshwayo)在一篇论文中描绘了美国就业增长态势的
美好图景。一直以来,人们自信地认为美国是一个工业化大国,工厂
在夜以继日地生产全世界急需的各种产品。但是,目前的现实却大不
一样。1990~2008年,美国经济实际创造了2 730万个就业岗位,其
中,有2 670万个(占98%)来自非贸易部门,即政府、医疗、零售与
饮食服务等领域,这些领域的工作不可外包,产品也不可销往海外。
98%这个数字很好地反映了美国近代工业的发展史,因此,《经济
学人》(Economist)杂志、比尔·克林顿(Bill Clinton)的新书等
各类出版物纷纷加以引用。但是,我们必须搞清楚这个数字的确切含
义。98%与100%非常接近,那么,这项研究是不是说明美国经济体中的
就业增长几乎全部集中在非贸易部门呢?似乎的确如此。实际上,这
个结论并不完全正确。1990~2008年,贸易部门新增的就业岗位仅为62
万个,而且,就实际情况而言,这还不是最糟糕的结果,因为在这段
时间内,贸易部门的就业岗位甚至一度面临不增反降的危险。
2000~2008年,贸易部门的就业岗位有所减少,缩水了大约300万个,而非贸易部门则新增700万个就业岗位。在400万个新增岗位中,非贸
易部门贡献了700万个,占总数的175%。
因此,我们必须牢记下面这条箴言:
在数字有可能是负值时,不要讨论它们的百分比。也许有人会认为我小心过头了。负数也是数字,与其他数字一
样,可以进行乘法与除法的运算。实际上,这个问题并不像我们一开
始想的那样无足轻重。数学领域的前辈们甚至不清楚负数到底是不是
数字,因为负数表示的数量意义与正数不完全相同。卡尔达诺、韦达
(Francois Viete)等16世纪伟大的代数学家们,就负数与负数的乘
积是否为正数的问题争论不休,他们都认为从一致性角度来看负数与
负数的乘积必须是正数,但这到底是已经证明的事实还是仅仅针对这
套符号系统的权宜之计,他们在这个问题上的观点大相径庭。卡尔达
诺在解方程时,如果得到的根中有一个负数,他就习惯性地把这个讨
厌的根称作“假根”(fi cta)。
针对这个问题,文艺复兴时期的意大利数学家们给出了各种各样
的证明过程,在我们看来,有的证明与他们的宗教理论一样深奥难
懂,而且相关性不强。但是,他们的有些观点却不无道理:如果把负
数与百分比等代数运算相结合,就会让人类的直觉无所适从。如果你
们违背我送给你们的这条箴言,各种稀奇古怪的不一致现象就会纷至
沓来。
我举个例子来说明这个问题。假设我开了一家咖啡店,但是咖啡
卖得并不好。上个月,我在咖啡销售方面亏损了500元。不过,我有先
见之明,我的咖啡店还销售点心和CD(光盘),这两种业务则分别为
我赚了750元。
总的算来,我这个月赚了1 000元,其中75%的盈利来自点心销
售。因此,点心销售似乎是目前的主要赢利项目,而且几乎所有的利
润都是销售羊角面包赚来的。但是,我也可以认为,利润的75%来自CD
销售。假如我在咖啡销售方面的亏损增加了1 000元,我的总利润就是
零,点心销售在盈利中所占的比例就是无穷大。[1]“75%”似乎意味着
“几乎全部”,但是如果考虑的是可能为正值也可能为负值的数字,例如利润,那么这个百分比所代表的含义可能会发生翻天覆地的变
化。
我们在学习只能取正值的数字(例如开支、收入或人口)时,不
会出现上述问题。如果75%的美国人都认为保罗·麦卡特尼(Paul
McCartney)是甲壳虫乐队中最可爱的成员,就不可能会有75%的美国
人会选择林戈·斯塔尔(Ringo Starr)。林戈、乔治(George)[2]
与约翰(John)只能分享剩余的25%的支持率。
我们从就业数据中也能发现此类现象。如果斯宾塞与赫施瓦约
说:金融与保险业创造了60万个就业机会,在整个贸易部门创造的所
有就业机会中所占的比例约为100%,可不可以呢?可以,但是他们并
没有这样说,这是因为他们不希望大家错误地以为,在那段时间里,美国经济的其他领域没有取得增长。大家可能仍然记得,自1990年至
今,美国经济中至少还有一个领域增加了大量就业机会——那个被命
名为“计算机系统设计与相关服务”的领域,凭一己之力,新增了100
多万个就业岗位,就业人数是最初的三倍之多。金融与计算机领域新
增的就业机会,远多于整个贸易部门创造的62万个新岗位,但是超出
的部分与制造业显著减少的岗位数相互抵消了。在将正数与负数放到
一起处理时,稍不留意,就会形成错误的认识,以为贸易部门的新增
岗位全都是金融业做出的贡献。
对于斯宾塞与赫施瓦约在论文中提出的观点,我们并没有充分的
理由表示反对。的确,数百个行业的总就业增长率有可能是负数,但
是在一个相当长的时期里,在经济环境正常的情况下,则极有可能是
一个正数。毕竟,人口一直在增长,只要不发生大灾难,就业机会就
会随之增加。
然而,有些人在分析中使用百分比时却不那么小心。2011年6月,威斯康星州的共和党人发布了一则新闻,大肆吹捧州长斯科特·沃克
尔(Scott Walker)创造了就业增长的新纪录。当时,美国经济从整体看延续了上个月的糟糕局面,全国仅增加了1.8万个就业岗位,而威
斯康星州的就业增长却表现出好得多的势头,净增9 500个就业机会。
这则新闻宣称:“我们发现,全美6月的就业增长,有超过50%要归功
于我们威斯康星州。”共和党的政客们对这个观点津津乐道并四处宣
传,议员吉姆·森森布莱纳(Jim Sensenbrenner)就曾在密尔沃基的
一个郊区说:“上周发布的人力资源报告指出,全美新增1.8万个就业
机会,其中的一半来自威斯康星州。这说明我们在这里的努力已经取
得了效果。”
这个例子充分说明,如果以百分比的方式报道净增就业机会等既
可能是正值也可能是负值的数字,就会陷入尴尬的境地。威斯康星州
增加了9 500个就业机会,这当然是好事,但是,与此同时,邻近的明
尼苏达州在民主党人、州长马克·代顿(Mark Dayton)的领导下,创
造了超过1.3万个新增岗位,得克萨斯州、加利福尼亚州、密歇根州和
马萨诸塞州的增长幅度也超过威斯康星州。的确,威斯康星州这个月
取得了不错的就业成绩,但是它所做出的贡献,并不像共和党在新闻
中暗示的那样,等于其余各州新增就业机会的总和。原来,其中的奥
秘在于,其他各州减少的就业机会几乎正好抵消了威斯康星州、马萨
诸塞州、得克萨斯州等地的新增就业岗位。也正因为如此,威斯康星
州州长才有可能宣称该州为全美的就业增长做出了一半的贡献。如果
明尼苏达州州长愿意,他也可以宣布全美新增就业机会中的70%要归功
于他们州。两位州长的说法从技术上讲正确无误,但是从根本上讲却
极易误导人。
接下来,我再以史蒂文·拉特勒(Steven Rattner)在《纽约时
报》(New York Times)上发表的专栏文章为例。该文引用了经济学
家托马斯·皮凯蒂(Thomas Piketty)和伊曼纽尔·赛斯(Emmanuel
Saez)的研究成果,认为美国人从当前的经济复苏中获取的好处并不
均衡。新的统计数据表明,富人与其他人在财富上的差距越发地令人
吃惊,我们急需解决这个问题。即使在一个对于收入不均衡已经习
以为常的国家,这样的发现也让人震惊。
2010年,美国经济仍然处于恢复阶段。在2009年的2 880亿美
元国民收入基础上的新增收入中,有高达93%(比例之高令人瞠
目)的部分被前1%的纳税人收入囊中,而这些人当中收入最低的也
有35.2万美元入账……2010年,在排除通胀因素之后,收入排名为
后99%的美国人的人均新增收入,只有微薄的80美元。而收入排名
前1%的人的平均收入是1 019 089美元,增加了11.6%。
这篇文章还给出了一个构思巧妙的信息图,将收入增加部分的构
成做了进一步细分:37%的新增收入为前0.01%的超级富豪所有,56%属
于前1%中的其他富人,而剩余99%的人则只能分享少得可怜的7%。我们
可以利用这些数据制作一个简单的饼状图:接下来,我们把这幅饼状图再细分一次,考虑前10%中去掉前1%后
剩余人口的收入增长情况。这个部分包含家庭医生、非精英律师、工
程师与中高级管理人员,他们占多大比例呢?皮凯蒂与赛斯非常热
心,在网上分享了他们收集的数据,我们可以从中找到这个问题的答
案。我们发现,这个答案有点儿奇怪。2009年,这部分美国人的平均
收入约为15.9万美元;2010年,他们的人均收入有所增加,略高于
16.1万美元。尽管这个增幅与前1%的富人的新增收入相比显得有些寒
酸,却为2010~2011年全美收入增长总额做出了17%的贡献。饼状图中,在前1%的人口所占93%的份额的基础上再加上17%,你
会发现,饼状图无法表示了,因为饼比盘子还大。
93%与17%相加的和超过100%,怎么可能呢?其实很好理解,因为
在2011年收入排名后90%的人口中,有的人经济状况有所好转,有的则
没有起色,他们的总体平均收入实际上比2010年还要低。当混合到一
起时,由于负数的存在,使用百分比的方法就会出错。
在皮凯蒂–赛斯数据中,我们会一次又一次地发现同样的问题。
1992年,收入排名前1%的人的新增收入占全美收入增长总额的131%!
这个数字当然会给人留下深刻的印象,但是同时这个数字也表明,百
分比的含义与我们惯常的理解并不完全一致——我们无法让131%在饼
状图中表示出来。1982~1983年,美国再一次从经济衰退中恢复过来,国民新增收入总额中的91%应归功于收入排名前10%但不包括前1%的那
部分人。这个数字是不是意味着比较富裕的职业人士抓住了经济恢复
的良机,而中产阶层与非常富裕的人群则被他们甩在身后了?并非如
此,前1%的超富阶层也取得了令人满意的进展,贡献了国民新增收入
总额的63%。对于收入排名前10%的人而言,经济形势一片光明,但是
排名后90%的人口却节节败退,收入没有增加。
这些研究都没有否认经济复苏的曙光照射到美国富人身上的时间
要稍早于中产阶层,但是,对美国经济形势的分析却有失偏颇。研究
似乎表明,经济复苏仅使1%的人受益,而其余美国人都饱受折磨,但
真实情况并非如此。排名前10%但没进入前1%的美国人(坦率地讲,很
多《纽约时报》专栏评论的读者也包含在内),收入也很高,收入增
加的幅度是饼状图所示的7%的两倍还多。前景一片黯淡、看不到一点
儿希望的是剩余90%的人口。
即使所涉及的数字碰巧都是正数,人们仍然有可能曲解百分比。
2012年4月,民意测验结果显示,米特·罗姆尼(Mitt Romney)在女
性选民中的支持率很低,于是他的竞选团队发表了一项声明:“奥巴马政府导致美国女性陷入了非常艰辛的境地。在奥巴马总统的领导
下,苦苦挣扎、四处找工作的女性人数是有史以来最多的,失业人口
中有92.3%的人是女性。”
从演讲的角度来看,这则声明毫无破绽。据美国劳工统计局的相
关数据,2009年1月美国的总就业人口为13 356.1万,而2012年3月仅
为13 282.1万,减少了74万。在女性人口中,这两年的就业人数分别
是6 612.2万和6 543.9万,因此与奥巴马入主白宫的2009年1月相比,2012年3月的女性就业人数减少了68.3万。拿这个数字与第一个数字相
除,就会得到92%这个数字。看起来,奥巴马总统似乎一直在四处奔
走,劝说所有的企业解雇所有的女性员工。
这样的算法并不正确。这些数字都是岗位损失净值,而且我们也
不知道在这三年时间里,增加与减少的工作岗位分别有多少,我们只
知道这两者的差是74万。岗位损失净值有时是正值,有时则是负值,因此单纯地计算百分比有可能会出问题。假设罗姆尼竞选团队从2009
年2月[3]才开始统计美国失业人口,结果会怎么样呢?2009年2月,美
国经济没有任何好转,总就业人口跌至13 283.7万。到2012年3月,美
国的岗位损失净值为1.6万,女性减少的工作机会为48.4万(不过,这
个数字的绝大部分被男性岗位的增加数抵消了)。由此可见,罗姆尼
团队错失了一个良机。如果他们在奥巴马就任总统满一个月后,即从
2009年2月开始计算美国女性的就业情况,他们就可以理直气壮地指
出,在奥巴马任期内,女性损失的工作岗位数在岗位减少总数中占3
000%!
但是,稍有头脑的选民都能看出来,这样的百分比应该是不正确
的。
那么,从奥巴马宣誓就职到2012年3月这段时间里,男性与女性就
业人口到底发生了哪些变化呢?这需要分成两个时间段来看。2009年1月~2010年2月,由于受到经济衰退及其余波的影响,男性与女性的就
业形势急转直下。
2009年1月~2010年2月:
男性岗位损失净值:297.1万
女性岗位损失净值:154.6万
第二阶段是后衰退期,就业情况开始逐渐好转。
2010年2月~2012年3月:
男性岗位增加净值:271.4万
女性岗位增加净值:86.3万
在就业情况急剧恶化时期,男性面临的就业形势十分严峻,损失
的工作岗位数几乎是女性的两倍。而在经济恢复期,男性得到的新工
作机会占新增岗位总数的75%。综合考虑这两个时期,男性的就业人数
几乎持平。但是,如果认为当前面临糟糕经济形势的只有女性,那么
这样的观点非常不明智。
《华盛顿邮报》对罗姆尼团队提出的92.3%这个数字给出的评价是
“真实但是不正确”。罗姆尼的支持者们对这个评价大加嘲讽,而我
认为这个评价不仅没有问题,还告诉我们使用统计数字时应当注意的
一些深层次问题。毫无疑问,这个数字是正确的,用女性岗位损失净
值除以岗位损失总净值,就会得到92.3%。
但是,这样的“真实性”没有多大意义。如果奥巴马团队发表声
明:“有人指控,多年来罗姆尼操控着一个在哥伦比亚与盐湖城之间贩卖可卡因的贩毒团伙,而罗姆尼本人也从来没有否认这项指控。”
其效果就与这个数字的影响力相仿。
这则声明也是100%真实的,但它的目的是给人们留下一个不正确
的印象。因此,“真实但是不正确”这个评价完全公平合理。这是一
个错误问题的正确答案,从某种意义上讲,它的影响比单纯的计算错
误更为恶劣。我们往往以为所谓谨慎的定量分析,就是我们用计算器
完成某个计算,但是,我们必须先弄清楚计算的对象,然后才能使用
计算器进行计算。
我认为这样的错误应归咎于数学应用题,人们之所以对数学与现
实之间关系的认识严重失真,数学应用题难辞其咎。“鲍比有300颗弹
子,他把30%的弹子给了詹尼,他给吉米的弹子是给詹尼的一半,他还
剩多少颗弹子?”这个问题看上去是现实世界中发生的问题,但其实
就是一个代数问题,只不过有了一层并不高明的伪装而已。这道应用
题与子弹没有一点儿关系,我们也可以这样说:在计算器里输入“300
–0.30×300–0.30×300÷2=”,然后抄写答案!
但是,现实世界中的问题与数学应用题完全不同。现实问题应该
是:“经济衰退及其余波是否对职场女性的影响尤为显著?如果是,它在多大程度上是由奥巴马政府的各项政策造成的?”而计算器上根
本找不到这样的按键。为了给出合乎情理的答案,我们不仅需要知道
一些数字,还需要回答多个问题。在某个经济衰退期内,表示男性、女性工作岗位减少情况的曲线是什么形状?从工作岗位减少的情况
看,本次经济衰退是否显著不同?与男性相比,女性从事的哪些工作
比例失衡?奥巴马的哪些决定对这个经济领域产生了影响?我们必须
先把这些问题转变成算式,然后才可以用计算器计算。等到使用计算
器时,真正需要思考的问题应该已经解决了。用一个数除以另一个数
只是单纯的计算,考虑清楚用什么除以什么才是真正的数学问题。
[1] 除非得到世界公认的数学家的指导,否则绝对不要把零用作除数。[2] 实际上,甲壳虫乐队中最可爱的是乔治。
[3] 格伦·柯斯勒(Glenn Kessler)撰文分析了罗姆尼在2012年4月10日《华盛顿邮
报》(Washington Post)上刊登的竞选广告,本书借鉴了柯斯勒的分析结果。第二部分 推理
精彩内容:
●《托拉》中隐含的信息
●古老的预言与回旋余地
●零假设与显著性检验
●斯金纳与莎士比亚
●“霹雳旋风式扣篮”
●紧密相连的素数对
●被“屈打成招”的数据
●公立学校讲授“神创论”的正确方法第6章 圣经密码与股市预测
人们在处理小到日常琐事(“我还要等多长时间,下一趟车才会
来”),大到宇宙探索(“在创世大爆炸发生百亿分之一秒之后,宇
宙是什么样”)等各类问题时,都会用到数学知识。
但是,有大量的问题却超出了宇宙探索的范畴,它们关注的是万
物的意义与起源。对于这类问题,我们可能会认为数学知识无能为
力。
绝不可以小看数学扩张领土的雄心。希望了解上帝吗?没问题,我们有数学家正在从事相关研究。
很早以前,有人认为尘世间的凡人可以通过理性观察了解高高在
上的神。20世纪犹太学者迈蒙尼德(Maimonides)宣称,早在一神论
诞生之际,就存在这样的观点。迈蒙尼德的重要著作《第二托拉》
(Mishneh Torah)对亚伯拉罕的启示有如下描述:
虽然亚伯拉罕刚断奶时年纪尚幼,但是他已经开始思考了。他
日夜不停地考虑这些问题:“这个(天)球一直引导着我们的世
界,但却没有人引导它,也没有人让它转动,这怎么可能呢?它不
可能自动旋转啊?”他苦思冥想,终于找到了真理之路。他知道冥
冥之中有一个上帝,是上帝引导这个球,创造了万物。在所有的存
在之中,上帝是唯一的神……于是,他不遗余力地向全世界传播他
的发现,引导人们相信整个宇宙只有一位创世者,那就是上帝,我
们应该对其顶礼膜拜……人们纷纷找上门来,对他的断言提出了各
种质疑,他尽其所能为每个人答疑解惑,直到他们也走上真理之
路。于是,成千上万的人加入了他的行列。关于宗教信仰的想象特别对数学思维的胃口。我们相信上帝,不
是因为有天使与我们接触,不是因为某一天我们敞开了心扉、让上帝
的圣光照射进来,当然也不是因为父母亲的谆谆教诲,而是因为上帝
是一种必然存在,就像8×6一定等于6×8一样。
如今,亚伯拉罕式的辩论(只要看看周围万物就会知道,如果没
有经过精心设计,它们怎么可能如此美妙绝伦)已经被认定为说服力
不足,至少在科学界大多数人是这样认为的。我们现在拥有显微镜、望远镜和计算机,我们无须再把自己关在屋子里,茫然无措地盯着月
亮发呆,我们还收集了海量数据,也拥有各种工具去处理这些数据。
犹太拉比学者最青睐的 ......
您现在查看是摘要介绍页, 详见PDF附件(6178KB,494页)。





