无知的博弈.pdf
http://www.100md.com
2020年4月16日
![]() |
| 第1页 |
![]() |
| 第9页 |
![]() |
| 第20页 |
![]() |
| 第25页 |
![]() |
| 第47页 |
![]() |
| 第324页 |
参见附件(2743KB,333页)。
无知的博弈:有限信息下的生存智慧,这是一本覆盖生活工作等方面的一本信息书籍,在书中作者教你如何甄选出有效的信息,如何关注到对自己有益的信息,内容非常精彩。

无知的博弈介绍
全书用通俗易懂的语言,结合来自经济、政治、历史和日常生活中的大量例子,生动地展示了在不完全信息局势下个人如何做出最优的决策。包括如何在不确定环境中决策(与上帝博弈),如何在博弈中操纵信息(信号传递、信号干扰、信息隐藏),如何设计机制去探测对手的类型(信息甄别)。《无知的博弈:有限信息下的生存智慧》充分展现了有限信息下的博弈策略和智慧较量,并让我们更为深刻地洞察到社会生活某些表象背后的真相。
作者简介
董志强,管理学博士、经济学教授,现任教于华南师范大学经济与管理学院。从事博弈论及其应用、契约与组织、公司治理、劳动经济学等领域的研究。学术论文见于《世界经济》、《管理世界》、《经济学动态》、《中国管理科学》等期刊;出版了《人员管理的经济方法》等4本专业著作:主持和参与翻译了《经济决策的概率模型》、《策略博弈》、《博弈演化》等知名教材(均出版中)。他还在《读书》、《经济学家茶座》、《21世纪经济报道》等大众媒体发表了大量评论和文章.并出版博弈论通俗畅销力作《身边的博弈》(机械工业出版社.2007),深受读者欢迎,版权输出到韩国和中国台湾地区。
主目录预览
引言 理解有限信息
与上帝博弈:概率决策
非对称信息博弈
信号传递
信息甄别
结束语 有限信息的代价
无知的博弈截图


无知的博弈:有限信息下的生存智慧
董志强 著
ISBN:978-7-111-25320-4
本书纸版由机械工业出版社于2009年出版。电子版由华章分社(北京华
章图文信息有限公司)全球范围内制作与发行。
版权所有,侵权必究
客服热线:+ 86-10-68995265
客服信箱:service@bbbvip.com
官方网址:www.bbbvip.com
新浪微博 @言商书局
腾讯微博 @bbb-vip目录
献给女儿多多
前言
引子
引言 理解有限信息
不完全信息
非对称信息
共同知识
有限信息下的策略行为:本书的内容
读者与我之间的博弈
关于阅读本书
与上帝博弈:概率决策
概率与信息推断
与上帝博弈
面对不确定性的制胜策略
应对风险的策略
友好提示
非对称信息博弈
逆向选择和道德风险:基本思想
逆向选择的例子道德风险的例子
察觉蛛丝马迹
友好提示
信号传递
基本思想
商业中的信号
生活中的信号
历史和政治中的信号
生物界的信号
其他的信号策略
友好提示
信息甄别
基本思想
商业和经济中的信息甄别
历史、政治、传说故事中的信息甄别
生活中的信息甄别
友好提示
结束语 有限信息的代价
附录A 有限信息博弈:略带技术性的简说
概率常识
贝叶斯博弈(不完全信息静态博弈)不完美信息扩展式博弈
参考文献献给女儿多多
她几乎是伴随本书而来。因为她,本书的完成时间被一再推后。毕
竟她才是我最骄傲的作品,对我更加重要……
我也希望她将来可以懂一点博弈论,以便更好地理解世界,而不是
盲目地批判世界;更理性地融入社会,而不是局限于关注自己;希望她
学会在一个互动的社会里如何尊重他人,如何影响他人,如何遵守游戏
规则,如何做一个理性的现代公民。先安排出版。
薄的一本,考虑到书的厚度以及读者的等待时间,我决定将这部分内容
弈》。现在当我写完不确定选择、信号传递和信息甄别之后,又已是不
是仅仅写毕完全信息博弈就已是厚厚一本,于是就先出版了《身边的博
富、体系庞大。就像我当初本来只想写一本博弈论通俗读物一样,结果
与不完全信息博弈有关的内容都包括进来。结果是越写越觉得内容丰
本书中把不确定选择、信号传递、信息甄别、道德风险、拍卖和竞赛等
应该说,我并没有彻底完成对读者的承诺。我曾经以为,我可以在
言。更多电子书关注
友的亏歉心情才平抑了一些。许多的感想也使我将写下一篇长长的前
转眼一载半的光阴就过去了。直到今天,开始坐下来写前言,对读者朋
为种种原因(主要是孩子的出生和工作的繁忙),写作计划一拖再拖,《无知的博弈:有限信息下的生存智慧》)何时出版,这让我愧疚。因
问,我曾经答应的第二本书《有限信息下的生存智慧》(即现在这本 勉励,或是指出书中的印刷错误,这很让我感动。也有一部分读者在追
曾经有很多读者朋友,在读过《身边的博弈》后来信问候、讨论、弈论的通俗读物。
本书是《身边的博弈》的续篇,是一本面向大众普及不完全信息博
前言本书的主题就是有限信息下个人的策略行为,以及基于有限信息下
的策略行为来理解社会现象。在我们的日常生活中,时时刻刻都需要做
出一些重要的或不重要的决策,而且绝大多数决策所面临的信息是相当
有限的。这种有限信息约束既有自然的原因,也有人为的原因。自然的
原因在于这个世界是不确定的,我们无法确切控制一个行为的所有后
果;人为的原因在于竞争的个体会有许多谋略行为,他们会尽量披露或
探测对自己有利的信息、隐藏或阻止对自己不利的信息,甚至故意制造
不确定性进行信息干扰。所以有限信息下的策略考量将更为复杂,当然
也更有趣。而本书或许有助于让读者明白:我们应如何与上帝游戏,而
不是被上帝游戏?如何在有限信息条件下与他人展开竞争与合作?如何
理性地融入到一个互动的社会之中?
当然,即使一个人不曾阅读本书,甚或对博弈论毫无所知,我相信
他也可以从个人的本能和生活经验中获得上述问题答案。一个从来没听
说博弈论的人,并不会妨碍他成为一个策略高手。就像鸟儿不懂空气动
力学,却仍然可以展翅高飞一样。既然如此,本书对于读者的意义又在
哪里呢?一个实用性的意义也许在于,发展出更好的策略将有助于个人
更有效率地追求成功。一个不那么实用的意义也许在于,我们对于世界
充满好奇,希望知道许多现象的原因,满足求知的欲望。估计大多数关
注本书乃至关注博弈论的朋友都是为着这两种目的。不过,我也想提醒
读者朋友们,了解博弈论还有另外一个重要意义,那就是博弈论经济学
家梅尔森(2007年诺贝尔经济学奖得主之一)曾说过的:对于矛盾冲突的理解,有助于建设一个更加和平美好的社会。本书通过大量的例子要
说明的,正是透过博弈论的视角如何观察世界、思考生活。是的,博弈
论可以帮助我们从个人行为更好地理解社会的秩序,理解人与人之间的
矛盾和冲突,有助于人们更理性地融入社会。我也想告诉读者,博弈论
不是阴谋诡计,不是厚黑学。所以,我希望购买本书的读者,是为着追
求阅读的享受、追求生活的愉快、追求头脑的智慧而来的;如果有人是
为了参悟权谋局道而购买本书,我只好对这些读者表示抱歉:对不起,本书可能令你失望了。
本书──《无知的博弈:有限信息下的生存智慧》标题中的“无
知”,本意固然是指缺乏信息或面临有限信息约束的无知状态,但也未
尝不想表达如下意思:在“博弈”一词被大量滥用的当代,许多大谈博弈
的人并没有真正理解博弈论;他们或许精通博弈之“术”,却对博弈
之“道”知之甚少。本书的核心内容可以概括在“机遇、信号、真相”这三
个词中。其中“真相”一词,大概也有另外一层意义:许多看似简单的现
象,其背后可能都另有真相。特别是,我们从历史和现实中见到的许多
看似不合理的现象,一旦考虑有限信息和策略行为,它们可能恰恰是非
常合理的。所以“真相”在本书也代表着对世事的洞察。
在本书之后,我还有写作计划吗?肯定的,至少我还得把涉及隐蔽
行动的有限信息博弈那一部分写完,才算对读者有一个比较完整的交
代。另外,博弈论在最近20年发展和应用也很迅速,演化博弈、行为博弈,这些都很值得向普通的读者介绍;用博弈论解读历史和社会,未尝
不是一个好的写作议题。但是,对于后续的书,读者可能需要耐心等
待。其中的原因主要有两个:其一,经过这两本书的经验,我发现不能
事先承诺写什么内容,更不能承诺完成的时间,因为一下笔,不知不觉
就是厚厚一本,那些议题不知道要写到何时才完。那么,就让我在以后
的岁月中,慢慢地来奉献给大家吧。既然写书对我来说是一件很快乐的
事,请读者允许我把这个快乐能够保持得更长一些。其二,作为一个跻
身学术界的年轻人,我的确需在提高自身学术素养方面配置更多的时间
和精力。也就是说,我只能把创作通俗读物当做一种业余爱好。所以,后续的普及性读物只能一点一点地抽取余暇时间来完成。
任何一本书的背后,都可以列出一串长长的需要致谢的名单。一个
人一生中也会有很多人值得感谢。我首先要感谢小汤,没有她我就不会
有念头写一本博弈论的通俗读物,也就不会有蒙读者厚爱的《身边的博
弈》。女儿多多的来临,使本书的完成时间往后推移了不少,因为对我
来说,她最为重要。
我感谢蒲勇健教授,他在我攻读硕士和博士的五载岁月中给我很多
精神关怀和物质支持;师恩重于泰山!感谢韦森教授,他对《身边的博
弈》的评论让我感觉到创作科普读物的社会价值。按照博弈论大师鲁宾
斯坦(A.Rubinstein)的看法,如果说经济学有作用的话,那可能就在
于经济学理论与寓言故事一样,都是在影响文化。写作通俗的普及读物,显然是经济学者影响文化的另一种方式。感谢聂辉华博士,他是一
位志向远大、心忧天下的青年才俊,他在评论《身边的博弈》时有一段
话值得读者谨记:“学习博弈论的目的是什么?如果是学会如何运用博
弈论进行个人决策,那么我认为这只是博弈论的‘术’而非‘道’。博弈之
道,在于让人们学会在一个互动的社会里如何尊重他人,如何影响他
人,如何遵守游戏规则,如何做一个理性的现代公民。”
我也要感谢机械工业出版社辛勤而负责的编辑,因为他们的努力而
使本书增色不少。感谢我的学生罗子俊,他在赴美留学前夕的紧张日子
里通读了本书的手稿,仔细校订了错漏和笔误。不过,任何一本经过精
心校对的书,倘若读者仔细阅读,一定都还能找出几处错误来。本书也
不例外。所以我把继续找出隐藏至深的错误这一艰巨任务就留给读者
了,若你们发现错误,欢迎写信到我的邮箱(d_zq@163.com)告诉
我。
最后,我也衷心感谢这一路走来给我关心和支持的师长、同行、朋
友和各位读者朋友。需要感谢的人太多,难以尽列,但我在心底衷心地
祝福他们幸福安康。而我在前行的道路上,对他们永怀感恩之心。
董志强
2008年9月24日引子
你是否知道下面这些问题的答案?
·为什么在某些竞争场合最好不要第一个登台?
·为什么二手市场难以红火?
·为什么沉默也可成为有力的声音?
·为什么人们要在玫瑰花最贵的情人节购买玫瑰花?
·为什么困难企业要裁员而不是减薪?
·为什么有些很闲的人也总是说“我很忙……”?
·为什么越高贵的礼仪越烦琐?
·为什么官员有时会把自己置于过度危险的境地?
·为什么上级有时会更信任一个明知有腐败行为的下属?
·为什么健壮的雄孔雀反而会有更为笨重的尾巴?
·为什么企业常常以低价发行新股?
·为什么欧美国家的大学对教师实行“非升即走”的雇用政策?·为什么应该让穷人住破房子?
·为什么女孩约会常常迟到?
·为什么有效率的上级也常常拖延给下级的拨款?
·为什么现代社会中我们从来不缺朋友却又常常有孤独和疏离感?……
“求知是人类的本性。”这是亚里士多德《形而上学》开篇的第一句
话。我猜想,读者朋友大概也想知道这些问题的答案,洞察世事的真
相。
那么,就从这里开始吧。本书提供的答案不一定是绝对正确的;但
你也许会同意,它确实提供了一种有价值的思考视角。引言 理解有限信息
理性乃人生之指南与明灯。
──查尔斯·狄更斯(Charles Dickens)
当一个出色的策略家总比当一个蹩脚的策略家要好些。
──迪克西特(A.K.Dixit)
决策需要信息,但几乎所有需要决策的场合,我们都只掌握着有限
的信息。比如,在游戏中,我们不能确切地知道手中的牌能否通行;在
购物中,我们不能确切地知道产品质量是否良好;在恋爱中,我们不能
确切地知道恋人爱自己有多深;在政治中,我们不能确切地知道对手支
持势力的多寡;在军事中,我们不能确切地知道敌人的实力和进攻路线
的选择……总之,自然的和人为的不确定性,使我们几乎所有的决策都
面临着有限信息的约束。
在有限信息约束下,我们如何与上帝(老天爷)作斗争?我们如何
与他人(对手)展开竞争或合作?博弈理论为什么可以帮助我们改善某
些决策?本书试图为此提供一些答案。不完全信息
这个世界上,有太多的事件及其结果超越了人类知识和能力所能控
制的范围,使我们不能完全确定我们行为的后果。是的,世界不确定;
上帝是一个赌徒,他在不断地掷骰子!
在这样的不确定环境中,我们如何做出自己的决策?
一种简单的应对办法,也许是胡乱地选择一个行动方案──反正结
果不确定,那么我们何必要认真选择?!我不知道读者朋友是否会认同
这种不负责任的选择行为,但的确有人是这样做的。比如日常生活中,在面临多种选择而不知所措的时候,经常有人通过抛硬币来确定他们的
选择。
应当承认,在某些时候,抛硬币未尝不是一个好办法。至少它使得
那些犹豫不决的人们为自己的选择找到了一个理由,从而可以获得内心
的安宁。但绝大多数时候,从理性的角度来看,抛硬币的确不是一个好
办法。比如,当你接到面试通知并允许你选择第几个上场的时候[1]
,或
者在比赛中有权选择比赛顺序的时候[2]。
虽然我们对自己的一个特定行为所产生的具体后果很难确定,但是
我们常常可以对各种结果发生的可能性加以估计。是的,尽管世界是不确定的,但许多事件重复发生的频率,或者我
们的经验,或者我们所见到的他人经验,常常可以帮助我们建立起关于
某个随机事件各种结果出现机会的信念。这个信念就是通常所说的可能
性(possibility)或概率(probability)。虽然我们对自己的一个特定行
为所产生的具体后果很难确定,但是我们常常可以对各种结果发生的可
能性加以估计。基于这样的信念,我们应可以做出对自己更为有利的选
择。
面临不确定环境的选择,本身只是一个单人决策的问题。如何将这
个单人决策的问题转化成博弈问题呢?我们的做法是引入一个虚拟的参
与人“上帝”(有些著作里称这个虚拟的参与人为“自然”,或者“机
遇”)。上帝无所不能,所以他一定能控制他掷出的骰子。当他掷出骰
子的时候,我们不知道骰子会出现什么数字,但是万能的上帝一定知道
会出现什么数字;他一定也知道如何掷骰子才能获得想要的数字。每一
次,上帝在掷出骰子之前就已经确定了一个数字,但是我们却只有在他
的骰子停下来的时候才知道上帝事先已确定的数字是几。问题是,我们
的决策是需要在他的骰子停下来之前做出,所以我们得费心地猜测上帝
在掷出骰子之前究竟选了哪个数字。不确定环境下的决策,就转变成决
策者个人与上帝之间的博弈。上帝对决策者的信息无所不知,而决策者
却不知道上帝内心的选择。所以,经验以及对各种结果可能性的估计,对于决策者来说非常重要。我们不必认为博弈局势中的上帝是在各种可能的结果之间随机选
择;其实在博弈局势展开之前,上帝就率先选定了某个事件的结果,只
不过我们并没有观察到上帝的选择而已。
显然,博弈论为不确定性决策问题提供了另外一种分析视角。我们
不必认为博弈局势中的上帝是在各种可能的结果之间随机选择;其实在
博弈局势展开之前,上帝就率先选定了某个事件的结果,只不过我们并
没有观察到上帝的选择而已。于是,我们就只能根据自身的知识和经
验,来估计上帝有多大可能选择了哪一种结果。
这样的一个视角转换,在博弈论中被称为海萨尼转换。在20世纪60
年代末期以前,博弈论对于不确定环境或信息不完全的局势分析是无能
为力的,后来海萨尼[3]
提出了海萨尼转换──即增加一个虚拟的参与人
(就是我们这里的上帝),将不确定结果转化为上帝做出了确定的选
择,但人们没有观察到上帝的选择──这才克服了分析技术上的困难。
所以现代博弈论将不完全信息等价于参与人没有观察到上帝的选择。
[1]可参阅第2章“怎样最大可能获得最好的女孩”一节末尾。
[2]可参阅第2章“应该先与谁赛”一节。
[3]约翰·海萨尼(John Harsanyi,1920──2000)是一个优秀的博弈论
专家。他生于匈牙利布达佩斯,从小按照父母的意愿成为了一个药剂
师。1944年,他被纳粹遣送到集中营,后来逃脱,在一个信仰耶稣的修
道院隐藏了一年,并开始学习哲学。1950年,他与未婚妻冒着危险非法穿越边境的沼泽地,逃离匈牙利,辗转到澳大利亚,后来再到美国。
1959年他获得斯坦福大学博士学位,1964年在加州伯克利任教。海萨尼
对博弈论兴趣浓厚,对不完全信息条件下的理性推理做出了巨大贡献。
1994年,他因为对博弈论经济学的贡献获得了诺贝尔经济学奖。非对称信息
一个人若不能观察到上帝的选择,那么他面临的信息就是不完全
的。在一个博弈中,有可能全体参与人都未曾观察到上帝的选择,那么
该博弈中的信息虽不完全,但却是对称的──因为全体参与人之间,谁
也不比谁掌握着更多或更少的信息;或者说,任何人都没有信息上的优
势。
但大多数时候,参与人之间的信息是非对称的;一些人观察到了上
帝的选择,而另一些人却没有观察到。那些观察到上帝之选择的人,就
成为信息优势方;而未能观察到上帝之选择的人,就成为信息劣势方。
利用博弈论分析人们行为的时候,我们常常需要确定:
·谁是相关的人?即哪些人参与到了博弈之中。
·他们可以做出什么样的选择?即每个参与人的行动空间包含了哪
些行动。
·他们的目标是什么?即每个人有其关心的赢利(payoff)。
·他们知道什么?即每个人掌握着什么样的信息。
不完全信息尤其是非对称信息对于策略行为及其结果影响至深。这里,参与人的信息结构深刻地影响着各方最佳策略的选择。不完
全信息尤其是非对称信息对于策略行为及其结果影响至深。举个简单的
例子来说,在一个狭窄而只能单人通行的过道里,一个老师和一个学生
遭遇了。若双方拥有完全信息,知悉彼此的身份,我们就很容易推测这
个过道博弈的均衡结果将是学生让老师先行(因为社会中有尊师的礼仪
规范)。倘若信息不完全,比如学生对老师的身份并不清楚(可以考虑
为上帝给老师选择了老师的身份,老师观察到了上帝的选择而知道自己
的身份,但是上帝的选择却没有被学生观察到),这时学生需要评估对
方属于老师的概率,如果他认为对方属于老师的概率很小,那么他可能
就不会礼让老师先行;而如果老师知道学生对其教师身份的信念概率很
低,那么老师也就不会试图享受先行通过。结果学生先行通过而老师后
通过的结果也将是均衡结果之一。
需要说明的是,信息非对称并不必定要求信息不完全。譬如,员工
的努力水平是员工自己选择的,员工自己知道,但是老板并不能观察到
员工的努力选择。此时,有关努力水平的信息在员工和老板之间也是非
对称的,但这种信息非对称并不属于信息不完全的情况。因为信息不完
全一定是跟上帝的选择不可观察联系在一起的。在没有上帝参与的博弈
中,一切是确定的,如果存在不能观察的参与人行为,那么博弈就被称
做是不完美信息的,而不是不完全信息的[1]。
[1]对于有意深入钻研博弈论的读者,注意到不完全信息和不完美信息之间的区别是有好处的。在信息完全但不完美的博弈中,策略组合的结果
是确定的。倘若这样的博弈出现在委托人和代理人之间,并不会产生道
德风险,因为委托人最终可通过结果对代理人行为进行完全的推断来设
计报酬合同。道德风险虽然与行动不可观察有关,但也一定要有某些随
机的影响因素(即仍需要上帝采取行动)时,才会出现。其中的道理很
简单,如果没有上帝行动,代理人将不能为自己的道德风险行为找
到“替罪羊”,他也就不能有道德风险。如果上帝也在行动(信息不完
全),代理人行为不可观察,那么代理人就可以把自己道德风险行为导
致的不良后果归罪于上帝,而委托人也将无法从博弈结果来准确推断代
理人的行为,因为博弈的结果没有提供推断博弈行为选择所需要的充分
信息。共同知识
师生过道博弈的分析中,其实还暗含了一个假定:学生认为对方属
于老师的概率很小,而老师知道学生认为其属于老师的概率很小,而学
生知道对方知道自己认为对方属于老师的概率很小……如此反复以至于
无穷。换句话说,学生认为对方属于老师的“概率”很小,这里的“概
率”本身是学生和老师之间的共同知识。
所谓共同知识,就是各博弈方在无穷递归意义上均知悉的事实。
所谓共同知识,就是各博弈方在无穷递归意义上均知悉的事实。即
每个人知道事件E,每个人知道每个人知道事件E,每个人知道每个人
知道每个人知道事件E……一直到无穷层次。这是博弈论中一个限制性
极强的假定。现代博弈论的一些新成果表明这个假定可以被放宽而不至
影响分析的结果。但是在本书的许多地方,仍然坚持这个假设,以便在
表述上可以更为简单。有限信息下的策略行为:本书的内容
一旦信息不完全,或者人们只获得有限信息,博弈就将变得更具吸
引力,也更有趣。因为有限信息对人们的理性推理提出了更高的要求;
人们也总会不断地通过操纵信息来谋取更大的好处;而就在人们操纵信
息的行为中,又往往蕴涵着某些信息,使得他们的对手可以根据这些新
增的信息更新其信念;对手信念更新导致的策略变化反过来又会影响人
们的信息操纵行为……最终,人们行为在均衡状态不仅需要满足策略的
均衡,也需要满足信念的均衡。这里需要用到的理性推理比完全信息博
弈要深入得多。完全信息博弈,只需浅层次的策略互动;不完全信息博
弈,则涉及策略和信念双重互动的深层谋略。
完全信息博弈,只需浅层次的策略互动;不完全信息博弈,则涉及
策略和信念双重互动的深层谋略。
总的说来,有限信息下复杂的理性推理大致可归纳为如下几种情
况:
·与上帝博弈。即个人面临不确定环境时的决策。这本属于决策理
论的内容,但由于不确定环境可以看做上帝确定地选择某个结果而个人
没有观察到上帝之选择,从而决策问题可转化为上帝先行的不完美信息
动态博弈加以分析,纳入博弈分析之中。·信号传递和信息阻止。在信息非对称的情形,某些时候信息优势
方会发现披露其私有信息对自身更有利,于是他就会尝试通过发送某些
信号来披露其私有信息。如果获悉优势方私有信息本身对信息弱势方有
利,那么信息弱势方就会欣然接受信号;但如果获悉优势方私有信息反
而会使弱势方处于被动状态,那么弱势方就会尽力阻碍对方的信号传
递。
·信息甄别和信号干扰。在某些非对称信息情形中,信息弱势方有
动力设法提取信息优势方的私有信息,这就是信息甄别。但是,如果私
有信息被对方获悉对优势方本身不利的话,那么优势方就极有可能进行
信号干扰和隐藏信息,使得对方难以提取出有效的信息。
·道德风险和激励。在某些信息非对称情形,比如委托-代理关系
中,代理人(agent)的努力不可观察,同时产量又受到随机影响的时
候,代理人就有可能采取出工不出力的机会主义行为。此时,委托人
(principal)往往会采取相应的合同去刺激代理人的努力。
·拍卖和竞赛。这是不完全信息博弈理论一个重要的应用领域。拍
卖和竞赛理论刻画了这样的现实,许多时候,人们为共同的目标在展开
竞争,那么他们最佳的出价策略是什么?拍卖或竞赛的组织者又如何可
以通过设计恰当的拍卖或竞赛机制来获得最大的好处?
上述五种情况之中,前三种属于隐蔽信息(hidden information),博弈的问题主要产生于难以了解对手的类型。这里的类型,是指对方所
掌握的私有信息。后两种属于隐蔽行动(hidden action),博弈的问题
主要产生于不能观察到对手的行动。考虑本书的篇幅以及我个人的写作
速度(也就是读者需要等待的时间),本书专注于隐蔽信息问题,即前
三种情况。具体地:第2章介绍如何与上帝博弈,即如何在不确定环境
中做出优化决策;第3章总体介绍不完全信息博弈,通过例子刻画不完
全信息博弈的两大问题──逆向选择和道德风险;第4章讨论信号传递策
略,即博弈参与人怎样向对手披露对自己有利的信息,本章也附带讨论
信号阻止、信号干扰、信息隐藏等其他操纵信息的策略;第5章讨论信
息甄别,即博弈参与人如何设计一些甄别机制来获取对手的私有信息
(类型),探测对手的真相。
至于那些隐蔽行动的有限信息博弈,值得另外写一本厚厚的书来专
门介绍。我已把它列入未来的写作计划之中。读者与我之间的博弈
本书实际上是拙著《身边的博弈》(董志强,机械工业出版社,2007)的续篇;我很感谢读者朋友对于那本书的喜欢和抬爱。某种程度
上,那本书是我这本书的一个质量“信号”。在购买和阅读一本书(包括
这本《无知的博弈:有限信息下的生存智慧》)之前,你对该书质量信
息的掌握是相当有限的,所以你完全有可能面临逆向选择问题──付了
钱,得到的却是糟糕的结果。
所以,在决定是否购买本书的时候,你就已经遭遇了本书所要讨论
的有限信息博弈问题。既然你我之间就本书达成买卖的合作对我是件大
有好处的事情,所以我会尽量寻求一些“信号”来证明本书的质量。而
你,当然也会寻求一些筛选指标来甄别本书的质量,以避免做出对自己
不利的选择。
比如,我绝不会随便选择一家普通的出版社,而是要选择最有声望
的出版社,因为我知道你很清楚这样一个事实:越有声望的出版社,越
不可能出版一本糟糕的著作来破坏自己在漫长岁月中树立起来的招牌。
我也不会允许出版社以随便的态度出版这本书,我会提出很多苛刻的要
求,给他们的工作增添很多麻烦,这些要求和麻烦最终会在本书的封面
设计、内容排版、印装质量等细节方面体现出来,因为我知道你也会从
这些细节来判断作者对本书的自我评价以及出版社愿意为这本书下多少“赌注”。当然,我也不会忘记告诉你,《身边的博弈》就是我写的;
因为我知道人们总是喜欢用一个商家的某种产品质量去推断该商家其他
产品的质量[1]
,《身边的博弈》既然得到了读者们的认可,那么它就不
失为本书质量的一个好广告,我当然不能错过每一次提到它的机会。
在事情的另一面,我赖以传递信号的一些手段,恰恰也是你进行信
息甄别的一些手段。你在买书的时候会考虑出版社的声誉,会考虑书的
设计和印刷质量,会考虑是谁写的书,因为这些信息都有助于你对书籍
质量进行判断。
明白上述这样一些道理,并不需要专门学习有限信息博弈理论。你
不读本书也会知道这些道理,这是因为生活的经验给予了我们一些本能
的博弈技巧,我们有意无意地都在运用这些技巧。不过,如果你愿意翻
开本书,你就会发现,我们不单可以把这些本能的博弈技巧模式化,而
且基于博弈理论我们还可以解释某些令人困惑的现象──它们本质上与
我们本能的博弈技巧一样,但是却不如本能的博弈技巧那样容易被直观
地感受。之所以人们对理论孜孜以求,也正是因为它的确有助于我们洞
察种种奇怪表象背后的真相。这也许就是博弈论的“实用性”用处之一
吧。
我们不单可以把这些本能的博弈技巧模式化,而且基于博弈理论我
们还可以解释某些令人困惑的现象。[1]为什么人们做这样的推断通常是合理的?重视质量毕竟是有额外代价
的,这种额外代价常常需要长期声誉的收益来平衡。而只注重某一个产
品质量的商家,是难以获得长期声誉的。所以,观察到商家对某种产品
质量的重视,我们就可推测它很可能对其他产品质量也很重视;如果它
对某种产品质量不重视,我们就可推测它很可能对其他产品质量也不那
么重视。譬如,出版本书的机械工业出版社,在基础教材的出版方面声
誉卓著,我们就有理由相信它在通俗读物方面也会认真对待。否则的
话,它在通俗读物市场上就白白浪费了它通过基础教材树立起来的卓著
声誉。关于阅读本书
本书的内容与《身边的博弈》是互补的。《身边的博弈》专注于完
全信息博弈;本书则专注于有限信息博弈,尤其是有限信息博弈中的隐
蔽信息博弈。
阅读本书,并不需要事先阅读《身边的博弈》。但是,如果你曾经
阅读过《身边的博弈》,那么也许你更能理解本书某些故事的妙处。博
弈论就是这样的,当你自己的博弈论知识到了不同的境界,看同样的一
个故事,也会有不同的感受。文字还是那些文字,故事还是那些故事,但字里行间又分明透露着新的感悟。曾经有一位上海交通大学的研究生
写信给我,说把《身边的博弈》读了好几遍,每读一遍收获不同。我很
高兴。自己的书得到读者认可固然是高兴的原因之一,但这高兴也因为
他的体验引起了我的共鸣──我当年学习博弈论一遍一遍地研习奥斯本
(Osborne)和鲁宾斯坦那本书时,何尝不是这样痛快淋漓的感觉!
很多人喜欢博弈论,但是畏惧数学。如果你也是这样的人,那么正
好,本书正文部分几乎把数学门槛完全去掉了,除了少数几行计算公式
和两三张图表之外,其余都是文字的解说,不需要数学基础。有两三处
为了给那些数学基础不错的读者补充一点额外的营养,我加了稍微数学
化一点的脚注;但这样的脚注仅有两三处,并且是额外的补充,对于理
解正文并不是必需的,讨厌数学的读者可以跳过不读。最后的附录,写得相对技术化一点──当然这只是针对于从来不看
数学公式的读者来说,如果与既有的博弈论教材通篇符号相比,读者会
发现我写得其实已简单明了很多。这个附录,普通读者可以不用阅读,因为它是专门为那些有意深入了解不完全信息博弈的读者而写的。很多
人一接触不完全信息博弈就开始晕头转向,我认为这主要是因为他们没
有真正理解一些关键概念(比如类型依存策略),所以我用最为直观的
方式讲解了最关键的概念和思想,我相信它对于有意进阶学习博弈论和
数学基础差的读者是极有用处的。当然,这个部分也可视为我故意设置
的一个“信号”:这是一个专家写的书,而不是一个外行写的书。在“博
弈”一词已被滥用得无以复加的今天,博弈论普及读物良莠不齐,我敬
重的博弈论学者王则柯教授对此多有批评;我因为几乎不看那些外行写
的博弈论,不了解他们的错误,也就难以提出批评意见[1]
,但我仍觉得
有必要通过一个“信号”把专家理解的博弈论和外行理解的博弈论区别开
来,本书的附录在某种程度上也许可以有这个作用吧。
再声明一遍,阅读本书不需要数学基础;极少数有数学公式的地
方,可以跳过不读;书中的各个故事,读者可以选择自己感兴趣的内容
和感兴趣的顺序来读,怎么做都不会影响对全书的理解。但是,对于标
记“”号的章节内容,读者最好还是不要跳过,因为那是仅有的一点关
于理论的解说。理论,是我们理解现象背后逻辑结构的固定模式。如果
跳过这些部分,那么本书与一本故事书无异,读者或可从故事中得到暂
时的快乐,但对于博弈论的理解及运用其分析现象的能力可能就难以得到提高。
[1]当然,我并不认为本书的内容就是完全正确的。它完全可能有一些印
刷错误,或者由于我个人的学识所限而导致的对博弈理论本身的理解错
误。专家在其专业领域也会犯错误,只不过犯错误的概率更低一些,而
且相对而言不大容易犯一些非常低级的错误。如果读者发现本书有错误
之处,欢迎指正!与上帝博弈:概率决策
善于识别与把握时机是极为重要的。在一切大事业上,人在开始做
事前要像千眼神那样识别时机,而在进行时要像千手神那样抓住时机。
──弗朗西斯·培根(Francis Bacon)
机会对于不能利用它的人又有什么用呢?正如风只对于能利用它的
人才是动力。
──克洛德·西蒙(Claude Simon)
设想你和朋友抛硬币进行赌博,若出现硬币正面,你将从朋友处赢
得1元钱;若出现背面,你将输给朋友1元钱。这样的游戏(game)当然
也是博弈(game)。但这个博弈中你究竟会赢还是会输?结果将是不确
定的。这样的博弈中,胜负似乎并不太依赖谁的策略技巧更高,而取决
于谁的“运气”更好。与其说你跟朋友在博弈,不如说你跟上帝在博弈。
在现实的许多博弈中,不确定性都扮演着重要的角色。然而,在这
样的博弈中,取胜仅仅是依靠运气吗?也许不是。即便在不确定的世
界,如果可以发展出更好的策略,虽不能保证万无一失,但是取胜的可
能性的确会增加;或者通过某些对付风险的策略,你也可以将不确定性
带来的风险[1]
降低。在本章你会见到大量的此类例子。这些例子基本上不需涉及复杂的策略互动,但估计不确定环境的概率非常重要。因此本
章命名为概率决策,而更为复杂的策略互动情形是以后各章的主题。
即便在不确定的世界,如果可以发展出更好的策略,虽不能保证万
无一失,但是取胜的可能性的确会增加;或者通过某些对付风险的策
略,你也可以将不确定性带来的风险降低。概率与信息推断
什么是概率
一个试验可能存在多个潜在的结果,但究竟哪种结果会出现,则是
不确定的。这些不确定的试验结果被称做随机事件。譬如,抛硬币包含
两个随机事件:正面或反面;要么出现正面,要么出现反面,但究竟哪
一面出现是不确定的。掷骰子包含了六个随机事件,分别为1、2、3、4、5、6点;但每掷一次骰子究竟会出现哪个点数,是不确定的。
概率可以被看做独立随机试验中,事件出现的频率。比如,抛1万
次硬币,正面向上的次数约5000次,则抛硬币试验中正面向上的概率就
是0.5。掷骰子12万次,出现每一个点数的频率大致是2万次,则掷骰子
试验中每个点数出现的概率为16。
任何一个随机事件,都可能发生或不发生。一定要发生的事件被称
为必然事件,一定不会发生的事件被称为不可能事件。必然事件和不可
能事件,都不是随机事件。随机事件最终的结果,也只能是发生或不发
生两者之一,不允许出现既发生又不发生的情况。而且,我们也不允许
因为随机事件后来并没有发生,而否认它在先前所具有的发生的可能
性。譬如,天气预报说明天有0.3的概率会下雨,真实的情况是到了明
天没有下雨,但我们不能因为明天没有下雨而否认了其原本具有的下雨的可能性。随机事件的不确定,存在于结果被确定的过程之中;一旦结
果实现了,随机事件的随机性就消失了,但这并不能否认在结果实现之
前的随机性。
随机事件的不确定,存在于结果被确定的过程之中;一旦结果实现
了,随机事件的随机性就消失了,但这并不能否认在结果实现之前的随
机性。
为了想通这个道理,不妨考虑在一个毒杀暗器飞来飞去的小屋里关
进一只猫。当这只猫在屋子里时,我问你它的生死状态如何?你会回答
不知道,因为这只猫可能还活着,也可能死去了。它的状态就是在生死
之间徘徊、可能生可能死的状态。但是,若打开屋子发现猫还活着,这
只猫会告诉你它一直是活着的,从没经历死的状态。但是,它仍活着这
个事实,并不能否认它曾经面临死亡的可能性。
我们遭遇的许多概率事件是客观的。投掷硬币,若硬币是均匀材质
的话,那么当试验次数趋于无穷的时候,出现正面或反面的概率一定都
是0.5。这是客观的概率。但是,生活中有很多时候,我们难以对一个
随机事件进行大量的重复试验。甚至有些不确定的事件,我们一生只遭
遇一次,此时我们怎么评估事件实现的概率?通常我们会对其实现的可
能性进行一个主观评估。这就是主观概率。我们很难说明主观概率是否
合理,或者一个人的主观概率判断是否正确,但是在决策的时候我们自
觉不自觉地都使用到了主观概率。而且,确实存在这样的事实:有经验的人比没有经验的人更能准确地判断形势。或者说,经验有助于提高主
观概率的合理性或准确性。经验更丰富的人所做出的决定在事后被验证
为恰当的频率要比缺乏经验的人高得多。这可能是经验在决策中占据重
要地位的原因。
有经验的人比没有经验的人更能准确地判断形势。
也许有读者还会问,为什么有经验的人比缺乏经验的人能做出更恰
当的决定?对此的一个解释是,错误的决定对个人的成功多多少少会有
所妨碍,恰当的决定对个人的成功多多少少会有所促进;从而,在优胜
劣汰的竞争过程中,经常做出错误决定的人可能会被进化的筛子过滤
掉,而那些仍能留存在筛子上的人,他们往往是能够“经常”做出恰当决
定的人──他们就是经验丰富者,他们对于形势的判断本身就更可能是
恰当的。这里也顺便提醒读者,博弈论是理论的科学,与他人博弈则还
需要现实的经验。所以,读者不应寄希望于几本讲述策略行为的著作就
能使你成为博弈高手。理论可以帮我们洞察某些局势,但是它永远都不
能取代经验。
博弈论是理论的科学,与他人博弈则还需要现实的经验。
逆概率推断
与上帝博弈时,人们会形成对上帝之选择的主观信念(上帝选择各
状态的概率分布),但是某些时候一些相关的事件发生了,导致人们需要修正对于上帝之选择的信念。或者说,人们有时会面临这样的问题:
需要从观察到的结果去推断潜在信息的可能性──估计潜在状态的概
率。
需要从观察到的结果去推断潜在信息的可能性。
理解上述问题的最佳方式是举例。比如,上帝可以选择一个人是否
患上某种遗传缺陷,并且一个人患上遗传缺陷的概率是1%。某项健康
检查技术有99%的精确性可以发现这种遗传缺陷,即如果一个人真有遗
传缺陷,那么他只有1%的机会未发现该缺陷;如果他没有遗传缺陷,但该项检查也有1%的机会误报其有遗传缺陷。我们感兴趣的是,当检
查报告一个人有遗传缺陷的时候,他真的有遗传缺陷的概率是多少?也
就是说,给定我们的观察,我们在多大程度上能确定潜在条件是现实存
在的?
不妨用简单的数字运算来回答这个问题。设人口总数为10000人,其中100人(1%)有缺陷,而9900人没有。全部人口都做了该项检查,结果是100个有缺陷的人中被报告为确实有缺陷的人数为99人;而9900
个无缺陷的人中也有99人被(错误地)报告为有缺陷。即检查报告为有
缺陷的人数是198人,而这当中实际上只有一半(99)的人是真的有缺
陷,另外一半实际上是没有缺陷的。所以,有缺陷报告只意味着被报告
人有50%的概率存在遗传缺陷。上述推理过程,是根据结果来推断概率,因此也被称为逆概率推断
[2]。逆概率推断主要用到贝叶斯公式(见页下注或本书附录)。贝叶斯
公式和逆概率推断思想在有限信息博弈分析中占有非常重要的地位。因
为非对称信息博弈中,人们常常会通过观察对手的言行来判断对手的类
型,或者说对手的言行往往传递着对手类型的信息,每当观察到对手的
言行之后,博弈参与人就可以并且应当就这些观察到的言行对对手的类
型进行重新推断以更新其信念,这种信念更新的逻辑过程正是按照贝叶
斯公式来的。在第3章“察觉蛛丝马迹”一节,大家可以看到从对手言行
推断对手类型信息在博弈中的重要性。
[1]自弗兰克·奈特(Frank Knight,1921)以来,有些经济学家也主张不
确定性与风险是有区别的,他们认为不确定性无法知晓各状态实现的概
率,而风险则可以估计出各状态实现的概率。不过,在本书中,不确定
性与风险是当做同义词可轮换使用的。
[2]此类推断过程可以用贝叶斯定理进行一般化。譬如,可将两种潜在条
件标记为A(代表有缺陷)和B(代表无缺陷),将两个可观察结果
(事件)记为Y(检验结果有缺陷)和N(检验结果无缺陷)。在缺乏
有关人口总体的信息下,假设A存在的概率为p,则B存在的概率为(1-
p)。当A存在,观察到Y出现的概率为a,则观察到N出现的概率为(1-
a)。同样,当B存在,观察到Y出现的概率为b,则观察到N出现的概率
为(1-b)。于是我们得到四种组合情况,并可计算每种情况的概率:
①A存在,且观察到Y,概率为pa;②A存在,且观察到N,概率为p(1-a);③B存在,且观察到Y,概率为(1-p)b;④B存在,且观察到N,概率为(1-p)(1-b)。
我们关心的问题是,观察到Y,而A存在的概率是多少?故注意力可只
放在情况①和情况③,因为只有这两种情况观察到Y,两种情况概率加
总为pa+(1-p)b,这正是Y被观察到的概率,即Prob(Y)=pa+(1-p)
b。同样,pa是A存在且观察到Y的概率,即Prob(AY)=pa。令
Prob(A|Y)表示观察到Y时A存在的概率,则应有:Prob(AY)
=Prob(Y)×Prob(A|Y)。这个公式重新安排一下,有:
上面这个公式被称为贝叶斯公式,它给出了观察到缺陷报告Y后对存在
A(有遗传缺陷)的概率评估。读者可以把前面的数字例子,Prob(A)=0.01,Prob(Y|A)=a=0.99,Prob(A|Y)=b=0.01,代进
去计算一下,不难得到Prob(A|Y)=0.5,与数字例子得到的结果是一
样的。与上帝博弈
单人决策问题,一般不认为是博弈问题。但是,博弈论对于考察单
人面临的不确定决策问题也是适用的。我们可引入一个虚拟的参与人
──上帝,他的策略空间就是随机试验的各种状态;然后假设参与人是
跟上帝进行博弈。上帝对任何结果的偏好都是一样的,所以他事先随便
选择了他的策略,但你并没有观察到上帝的选择。而你,则需要考虑如
何才能更好地对付上帝,使自己的(预期)赢利达到最大。正所谓与天
斗,其乐无穷。现在我们来看几个与上帝博弈的例子。
该不该改变最初的选择
下面要讲到的例子与美国20世纪70年代的一个电视节目有关,其中
的概率计算曾困扰着成千上万的大众。在节目中,节目参与者将在三扇
门之间选择其中一扇。这三扇门中有且仅有一扇门的后面放着奖品,另
外两扇门则放着讽刺性礼品比如鸡崽(chicken)或者笨驴
(donkey)[1]。当节目参与者选定一扇门之后,主持人就会打开另外两
扇门中没有奖品的一扇。然后在剩下的两扇关闭的门中,主持人会问参
与者要不要改变最初的选择。
这里的问题就是:参与人希望获得奖品,而不是获得讽刺性礼品,那么现在仍关闭的两扇门中,他应当坚持最初的选择呢?还是改变主意选择另外一扇门?
大多数人凭直觉认为,剩下的两扇门中,每扇门后有奖品或没有奖
品的概率各占50%。因此,改变主意选择另外一扇门和坚持最初的选择
不改变,预期的赢利是一样的。的确,这种思路看来是没有什么错。因
为在做最初的选择时,选择“碰巧是”正确的概率为13;而一旦选择之
后,剩下两扇门,参与者从主持人的行为中所能得到的信息就只是将信
念修正为自己选择正确的概率为12,选择失误的概率也是12。此外没
有任何其他的信息改善。因此,他坚持原来的选择似乎可以说得过去。
但是,上述看法并不符合真实的情况。真实的情况是,若参与者改
变自己最初的选择,那么获得奖品的概率是23,若不改变最初的选
择,则获得奖品的概率仅为13。他应该改变自己最初的选择。
奇怪的是,将这个结果告诉参与者后,他们还常常难以理解为什么
会这样。一种比较浅显的解释是这样的:在最初的选择中,选择了错误
门的概率是23。如果参与人一开始的确选择了错误的门,那么主持人
随后必然打开空门,而没有被打开的那一扇就必然有奖品,此时参与人
显然应该改变主意转换到自己没选择也没有被打开的那扇门。如果最初
的选择中参与人的确选正确了(概率为13),那么他显然应该坚持,并因此获得奖品。也就是说,如果参与人一开始就选错了,则参与人应
该换门并一定获得奖金,如果参与人一开始就选对了,则应该坚持并一
定获得奖金──于是,转换门获得奖金的概率与不转换门获得奖金的概率实际上就是最初选择是正确和错误的概率。而一开始,选择错误的概
率是23,正确的概率是13。因此,在不知自己选择是正是误的情况
下,在第二阶段改变主意转换到另一扇门,的确增加了获得奖品的概
率。
对于有些喜欢做实验的读者,如果你不明白上述道理,那么我建议
你做这样一个游戏:准备三张扑克和一枚硬币,让你的朋友来当节目主
持人将三张牌铺在桌面上(并将那枚硬币放在其中一张之下);然后你
来选择一张牌;你的朋友从你没选取的牌中拿走没有硬币的一张,再问
你是否改变你当初选的牌。为了证明转换选择比不转换选择更有可能获
得奖品,你可以尝试以“转换选择”为策略进行数十次(比如50次)实
验,再以“不转换选择”为策略进行同样多次数(比如50次)的实验。结
果你会发现什么?你将发现“转换选择”的策略中得到硬币的次数基本上
是“不转换选择”策略中得到硬币的次数的两倍,而这两种策略中硬币出
现的频率也基本上分别接近23和13。
当然,在一次性节目中,并不允许这样的重复实验。而且大多数人
的确也不明智地选择了“不转换选择”。我曾在学生中做过这个实验,结
果32人中有20人坚持“不转换选择”。这说明大多数人不清楚这样复杂的
概率思考。更有意思的是,我跟我太太玩这个游戏时,她也是坚持“不
转换选择”。当我告诉她如果转换可以成倍提高获奖概率时,她却说:
如果我开始选对了,转换后结果错了就会后悔,所以心理素质好的就不应该转换。当然,她说的已经不是纯粹的概率计算,但也不是没有道理
的。人们的行为的确不仅受制于各种精心的算计,也往往受制于某些心
理因素(比如后悔)。不过,我对她的答案疑问在于:“如果开始选择
对了,那么后来转换了选择会令人后悔。但是,如果后来你知道开始的
选择错了,而你又没有转换选择,你就不后悔没有转换吗?”太太的回
答更经典:“一开始选择错了,我只认为是运气不好,没什么可后悔
的;如果开始对了,后来转换错了,才是后悔的。”这让我立即想到人
们日常生活中常提到的道理:从没得到的东西,也就不会有失去它的痛
苦,而已经得到的失去了,就会深感创伤[2]。从太太的回答中,我突然
明白了为什么行为博弈理论(behavioral game theory)现在大行其道。
从没得到的东西,也就不会有失去它的痛苦,而已经得到的失去
了,就会深感创伤。
乘车的最佳策略
一名游客要去某风景区游玩。每天开往风景区的只有三辆交通车,两趟车前后的间隔时间为5分钟。三辆车票价相同,但舒适程度则有
高、中、低之分。这个游客不知道哪辆车最舒适,也不知道汽车开过来
的顺序。不过对于他来说,多等5分钟或10分钟时间并无所谓,关键是
要坐上最舒适的那辆车。
那么这名游客采取什么样的候车策略,才最可能搭上最舒服的那辆车呢?
这个问题,当然是一个单人决策问题,是不确定环境下的决策问
题。这里的不确定性,源于游客对于不同舒适程度的三辆车开过来的顺
序并不清楚。但列举起来,行车顺序无非有如下六种状态:上中下、上
下中、中上下、中下上、下中上、下上中。那么我们可以虚拟一个参与
人,即上帝,他选择的策略空间就是这六种状态。而且上帝这个参与人
比较奇怪的一点就是,选择任何状态对他的赢利都是一样的,所以他在
这六个策略之间以相同的频率随机地选择。
游客的目的是希望尽可能搭乘最舒适的车。他可以考虑的最简单的
候车策略是:任意选择一辆车搭乘。他这样“随便”的选择,使他搭乘到
最舒适的车的概率为13,这个结果一般的读者都能明白。
当然,游客也可以设计复杂一点的策略:第一辆车不上,如果第二
辆比第一辆好就上第二辆,如果第二辆比第一辆差就上第三辆。这样的
策略会使其搭上最舒适的车的可能性是多少?不妨把上帝可以选择的六
种状态全列举出来,然后看看在哪些状态下,游客的这个策略刚好使他
能够搭上最舒适的车(见图2-1):
图 2-1 行车顺序的各种状态与游客策略成功性统计一下,读者会发现,采用这个相对不那么“随便”的策略,游客
乘上最舒适汽车的概率是12。比之“随便”策略下的概率13,游客现在
搭上最舒适汽车的可能性增加了12-13=16.7%。
这个编造出来的简单例子,说明了生活中一个很朴实的道理:存在
多个候选对象的时候,没有必要仓促做决定,等一等,看一看,比较比
较,可以提高获得最佳对象的概率。这里的候选对象,可以是商业计划
方案,也可以是待购的物品,当然也可以是待雇用的求职者,或者是你
中意的女孩──比如下面这个更复杂一点的例子。
存在多个候选对象的时候,没有必要仓促做决定,等一等,看一
看,比较比较,可以提高获得最佳对象的概率。
怎样最大可能得到最好的女孩
人们常常希望能够获得一个最可爱的人作为自己的伴侣。但是,由
于上帝在你的生命中安排的异性并不是同时出现任你挑选,因此无论你
在何时选择结婚都是有机会成本的。也许你很早就结婚了,但是结婚之
后却又不断发现还有不少更好、更合适的潜在婚姻对象,这就是结婚太
早的机会成本。那么,是不是晚一点结婚就可以避免这个问题呢?不是
的!当结婚太晚,你错过最合适的异性的可能性也就更大,这就是结婚
太晚的机会成本。
那么,一个人究竟应采取什么样的策略才能最大可能遇到最适合的异性,从而使结为伴侣的机会成本最低呢?我们不妨建立一个类似前面
候车问题的模型来考察,只不过我们把候选对象扩展到更多。
假设你是一个男孩[3]
,而上帝在你20~30岁之间安排了20位适合你
的女孩。这些女孩都愿意作为你的伴侣,但你只能选择其中的一位。对
于你来说,这20位女孩的质量是可以排序的,也就是说事后你可以对她
们的质量排名,排名第一的对你来说就是最好的,排名第二十的对你来
说就是最差的。可惜的是,由于20位女孩不是同时出现在你的生命中,而是按时间先后出现,每出现一个你都要决定是留下或拒绝她。如果留
下她,她就会成为你的伴侣,你将再没有权利选择后面的女孩;如果拒
绝她,你还可以选择后面的女孩,但对前面已经拒绝的女孩将没有机会
从头再来。
20位女孩的排名虽然可以在事后确定,但是在观察完20位女孩之
前,你并不知道全部女孩的排名,你只知道已经观察过的女孩中谁比谁
更好。而且,上帝是完全随机地安排每个时间段出现的女孩,即出现时
间的先后与女孩的质量完全没有关系。那么,你应该在什么时候决定接
受一位女孩,并且使得被接受的那位女孩属于最好女孩的概率最大呢?
当然,你可以采取与候车模型中“随便”策略类似的做法,抓阄来任
意选定一位女孩。如果你这样做,那么你有5%的可能性获得最好的女
孩。概率比较小,很难发生。另一种看来复杂一点的策略是:把全部女孩分成前后两段,最先出
现的10位均不接受,但了解了这10位女孩的质量,然后在后来出现的10
位女孩当中,第一次碰到比以前都可爱的女孩,就立刻接受。这就
是“等一等、看一看”的策略。在这样的策略中,你得到最好女孩的概率
似乎是(1020)×(1019)=0.263。这个概率已经不算太小。补充说明
一下此策略中概率的算法:在这样的规则下,确保得到最好的女孩必然
要求最好的女孩在后10名女孩中出现──否则你怎么也得不到最好的了
──其概率是1020,同时,还要求第二好的女孩出现在前10名,其概率
为1019──为什么是1019?因为除了最好的,剩下人数为19个,第二好
的女孩出现在前10名的概率就是1019──这样就确保了你会得到最好的
女孩。
但是,这个策略得到最好女孩的概率真的是0.263吗?可能不是,因为这只是第二好的女孩刚好出现在前10位的情况;实际上,即使第二
好的女孩没有出现在先前的10位,但只要在最好的女孩出现之前的所有
女孩中质量最高的出现在前10位,那么该策略也可确保得到最好的女孩
(这一点要想通,否则就难以明白接下来的内容)。也就是说,该策略
获得最好女孩的概率实际上是超过0.263的(我们很快会发现这个概率
应是0.359 4。哇!这的确已经是一个不小的概率了)。
但是,还有更好的方法吗?或者我们可以问,放弃先出现的10位女
孩是否是最优的?如果不是,那么应该放弃几位先出现的女孩呢?幸运的是,我们的确有更好的策略(你应该先把前面的内容看懂,如果前面没看懂,下面可能就更看不懂了)。既然20位质量不同的女孩
其质量在你生命里是随机出现的,没有任何规律,那么,第k个女孩刚
好是最好女孩的概率是120,而刚好把这个最好的女孩选择到的概率是
多少?对此的考虑应该是:既然给定了第k个女孩质量最好,而我们决
定放弃前面n-1位女孩,从第n位开始执行前述策略的规则(第一次碰到
比以前都可爱的女孩,就立刻接受),那么必须要求在k之前的女孩中
质量排名最高的那个必须出现前n-1位女孩中,这样才能确保k被选中,其概率就是(n-1)(k-1)。从而第k个女孩刚好是最好的女孩而且又
一定被选中的概率就是(120)×(n-1)(k-1)。这里,k的取值范围
显然应该是[n,20]中的整数。所以,放弃n-1位女孩而一定会得到最可
爱的那位女孩的概率实际上就是
这个概率可以用Mathematica软件来计算,或者用Excel来计算也可
以[4]
,读者会发现,当n=8时,该概率有最大值0.3842。也就是说,如
果我们放弃前7位女孩,先看一看,心里有个谱,然后只要看到比前7位
女孩中最好的还要好的女孩,那么我们就立即选择接受。而这位被接受
的女孩刚好属于最好女孩的概率是0.3842。这比我们放弃10位女孩
(n=11)的策略要好,该策略根据上述公式计算得出获得最好女孩的
概率为0.3594。我们用Mathematica软件绘出获得最好女孩的概率图形(纵轴是概
率,横轴表示从第几位开始认真考虑接受。最大概率出现在n=8,即放
弃前7位,从第8位开始认真考虑接受,见图2-2)。
根据上述结果,我们可以得出这样的结论:若一个人在20~30岁之
间选择结婚对象,而这20位女孩以每年两位的平均分布出现,那么你应
当在24岁才开始认真考虑终身大事。
这个例子也可任意改动数据后用同样的方法求解。比如,如果是30
位女孩,那么你应该从第11位女孩开始认真考虑终身大事[5]。
图2-2 转向认真考虑婚姻选择的决策点这个例子也可以改成其他的版本,比如:在20层楼中,每层楼都放
着一颗宝石,每颗宝石的大小不一。现在你从第一层开始上楼,每到一
层楼你都可以决定要不要该层楼中的宝石。如果不要,不能回头。如果
要,以后就不能再取。或者,有20位求职者,你希望尽可能雇用到最好
的那位,但你对他们的面试机会只有一次。你应该如何才可以有最大的
机会获得最大的那颗宝石(最好的那位求职者)?这个问题,据说是微
软公司的面试题。但它的道理,与最大可能获得女孩的道理是一样的。
由此还可引发出另外一重考虑:为什么在求职或演讲比赛之类的竞
争场合,人们通常不愿作为第一个或前几个登台呢?而且越是好的越不
愿意第一个登台呢?因为人们可能存在等一等、看一看的决策习惯,前
几名往往只作为参照标准被评审人有意无意地放弃了[6]。
不要被概率愚弄
概率计算,是一项颇具挑战性的工作。事实上,大多数人都是概率
方面的白痴。即使是一些数学专家犯错误也是常事。[7]
专家尚且如此,普通大众被概率愚弄也就很正常了。下面是常见概率决策失误的例子。
一种常见错误是,人们往往有夸大小样本代表性的倾向。阿克洛夫
(G.Akerlof,2001年诺贝尔经济学奖得主)1991年的一篇文章中提到了
这种现象:
人们往往有夸大小样本代表性的倾向。让我们假定,你想买一辆新车,并从价格经济和使用寿命角度考虑
决定买沃尔沃或萨帕。作为精明的买家,你阅读了《消费者调查》获取
相关信息,发现大多数专家认为沃尔沃的机械性能更好,大多数读者认
为沃尔沃有良好的维修记录。在这些信息的武装下,你准备下周就去和
沃尔沃销售商谈判。然而,在这个周末你参加了一次聚会,和一个熟人
谈起你的打算,他的反应是质疑和警告:“买沃尔沃!不会是开玩笑
吧?我姐夫有一辆沃尔沃,先是计油器出问题,然后是后备箱出问题,再后来是变速器和离合器。最后,不到三年就把那辆车当废品卖掉
了。”
在这种情况下,你还会买沃尔沃吗?估计你会立即转向购买萨帕
了。但是,仔细想想,你的朋友提供的信息,不过是在有关沃尔沃的大
量样本信息中再加入一个样本信息而已,并不足以改变样本的平均值
──也就是说,仅凭你朋友的一席话,并不足以改变原先支持你选择沃
尔沃的理由。但是,现实中有多少人还能这样理性地思考呢?
人们也常常犯下以总体特征来推断小样本特征的错误。
类似地,人们也常常犯下以总体特征来推断小样本特征的错误。譬
如许多人认为,一家医院中一年出生的小孩大致应该是男孩和女孩各占
50%左右。事实上,很多小医院的出生性别比完全不是这样。一个城市
的出生性别比可能是1:1,但这不等于在更小的单位也是如此。如果你
不能理解小医院为什么通常不是1:1的性别比,那么你想想更小的单位,比如家庭,有多少家庭出生的小孩会是男孩女孩各占一半呢?读者
有必要记住,小样本的特征不一定服从总体的特征,所以不能把总体的
特征作为小样本特征的描述。当然,反过来也一样,小样本难以反映总
体的情况,所以也不能把小样本特征当做总体特征。比如,不能看到几
个没文化的人比几个有文化的人赚了更多的钱,就得出结论说文化程度
高对提高经济收入并没有帮助。又比如,你不能因为看到一个无臂人用
脚画画很好,就得出结论说要学好画画就要砍掉双手一样。可是现实中
却有持这种逻辑的人。
另一种常见的错误是人们常常忽略了随机事件的独立性,错误地把
它们关联起来。比如掷硬币,每一次投掷出现正面或反面的概率都是
0.5。也就是说,以前曾经出现过什么样的历史,对于下一次投掷的结
果是没有影响的。考虑你现在参加投掷硬币的赌博游戏,每投掷一次赌
注1元。已经投了9次结果都很“偶然”地出现了正面,现在面临第10次投
掷,你应该选择押注正面还是反面?有不少人是这样想的,既然已经出
现了9次正面,均匀的硬币要连续出现10次正面的概率太小了(这个概
率为0.510=0.097 7%),因此下一次出现反面的概率应该很大。这样的
决策,忽略了下一次投掷概率与历史无关的事实。只要硬币是均匀的,不管前9次结果如何,下一次正面和反面出现的概率均为0.5,所以你押
注哪一面,胜负概率都一样。当然,这里还有另一种可能,那就是硬币
不是均匀的,所以前面9次出现正面并不那么“偶然”,如此第10次还很
有可能出现正面──你现在应该选择的就是正面,而不是像先前所思考的那样选择反面。
人们常常忽略了随机事件的独立性,错误地把它们关联起来。
这个赌硬币的例子和股票市场很类似。股票市场也充满了随机性。
基本上有两种投资理念,一种认为股票价格完全随机,与业绩无关,这
种情况下股票与均匀硬币本质上是一样的,股票价格的历史表现不足以
作为决策的依据,因为未来价格与历史价格无关;另一种观点认为,股
票的长期业绩较好,很可能表明股票存在内在价值支撑,这就与非均匀
材质的硬币一样,按照这样的理念,那么过去业绩表现较好的,在未来
也更有可能表现出较好的业绩。这两类观点究竟哪一类更符合股票市场
的现实?现在似乎还没有研究可以将它们检验出来。但是通过一些仿真
实验可以明白的是,存在大量均匀和非均匀的硬币不断投掷,比如经过
30轮投掷,能够保持30次都在正面的硬币仍然存在[8]
,而这些硬币也并
不完全是非均匀的硬币,这表明可能部分股票的业绩确实有内在支撑,但也有些股票业绩良好可能仅仅是偶然因素。
很多人不善于从结果去推断信息,以至于过度夸大了某些后果的严
重性。
还有一种经常犯错误的情况是很多人不善于从结果去推断信息,以
至于过度夸大了某些后果的严重性。我太太的一个朋友怀了小孩,因高
龄怀孕担心胎儿的健康做了唐氏筛查。唐氏综合征俗称先天性痴呆,是最常见的一种染色体疾病。怀孕年龄越大,胎儿患此病的概率越高,按
照年龄段来看这位朋友胎儿患此病的概率为0.13%。如果胎儿确实患有
此病,则唐氏筛查有80%的可能性会查出来(也就是有20%的可能性查
不出,但胎儿实际上是患病的);如果胎儿未患此病,则不会查出异
常。这位朋友不放心去做了筛查,结果没什么问题,但她反而更担心
了。我太太说,没检查出问题不是很好吗,可以放心了;她却说,还是
有20%的可能性患病啊,只是没有查出来啊。我太太的数学很差,听她
这样说也懵了,但又觉得不对劲,回来问我,为什么检查无恙之后,患
病的概率反而提高了?我一听就觉得好笑:她们是先验地假定胎儿已经
患上唐氏综合征,所以才会认为未检查出病状有20%的患病概率;事实
上,胎儿患病的概率仅为0.13%,检查后未发现异常而胎儿患病的概率
应是(0.13%×20%)(0.13%×20%+99.87%×100%)=0.026%,比未检
查时的0.13%概率降低了约80%。
也许聪明的读者会觉得这些失误太明显了,自己不会犯这样的错
误。那么请你看看下面这则报道是否存在问题。有一份关于中国吸烟与
健康的研究报告写道:“吸烟与肺癌发生的关系已为众多的实验研究以
及多个设计严格的大宗人群研究所证实。约80%以上的肺癌与吸烟(包
括被动吸烟)有关。”读完这话,你是不是觉得吸烟很可能导致患肺癌
(即认为吸烟是一个严重损害健康的问题)?吸烟几乎就是肺癌的罪
魁?如果你认为是,不妨继续往下看。我国约有36%的烟民;肺癌发病率(缺乏中国数据,以世界数据
0.333%代替);肺癌患者80%是烟民或被动吸烟者,即是说肺癌患者中
还有20%是非吸烟者;为了让不太熟悉概率的读者能够理解,我不妨假
设肺癌患者共100名,其中80名是为烟民或被动吸烟者,20名是非吸烟
者。那么我们据此可推算社会总体人口为100(0.333%)=30 030人,其
中烟民为30 030(36%)=10811人,被动吸烟者的频率不知,姑且假设
为X人,那么吸烟者(包括烟民和被动吸烟者)致癌的概率为80(10
811+X)。非吸烟者的致癌概率为20(30 030-10 811-X)。稍加计算就
可以知道,除非被动吸烟者数量X<13 213,或被动吸烟者比例小于
44%,吸烟者患癌症的概率才会超过非吸烟者患癌症的概率。在缺乏被
动吸烟者比例的情况下,我们无法推断出吸烟对癌症究竟有多大影响。
不过,这份报告披露了我国男性吸烟率为66%,女性吸烟率为
3.1%;而男性肺癌发病率为0.355%,女性为0.312%。而一个社会男女
性别比基本上为1:1,则按照我们前面的假设,100个肺癌患者中,大
约有100[0.355(0.355+0.312)]=53人为男性,有100-53=47人为女性。
社会中男女基本上相等意味着这个社会分别有30 030(0.5)=15 015个
男性和女性。两个人口总量相等、烟民结构完全不同(一个有过半烟
民,一个只有少数烟民)的群体,肺癌发病率和发病人数竟然如此接
近,这能说明吸烟是肺癌的发病罪魁吗?
我应当承认,在上述两段推理中,在某些地方我用世界数据来代替中国数据(因为找不到中国数据),可能存在偏差。不过我的本意不在
为吸烟致癌翻案,所以问题不算严重。我只是想借此说明,在对公众发
布信息的时候,应尽量提供背景信息,以免误导公众;更不能有意隐瞒
关键信息,利用公众缺乏概率推断能力而有意误导公众。同时也说明,如果读者能多掌握一点概率推断的知识,就会更少地受到媒体的欺骗。
[1]在美国俚语中,鸡崽(chicken)被用于表示胆怯者、懦夫,而笨驴
(donkey)则表示蠢人。
[2]事实上,来自心理学和行为经济学的研究已表明,对于同等价值的物
品,人们失去它而损失掉的效用会超过拥有它而获得的效用,前者基本
上是后者的两倍。即失去的比得到的更觉珍贵,失去100元带来的痛苦
将是得到100元带来的快乐的两倍。
[3]当然,读者是女孩也可以。我没有任何歧视女孩的意思,模型中的男
女性别假设完全可以互换。
[4]本例的Mathematica文件或Excel计算表可在作者主页www.cnobel.com下
载,文件名分别为Table2.2.nb和Table2.2.xls。
[5]当然还可以对例子进一步一般化,假设有X>1个女孩。那么,从第n
个女孩开始认真考虑,则获得最好女孩的概率为:
上式有一个近似计算方法:当X比较大的时候, ,此函数为凹,求n的一阶条件得到最优解n
=1+Xe,代入Prob(n),有
Prob(n
这个解表明,不管女孩数量是多少,只要数量足够多,获得最
好女孩的最大概率都近似为0.368。与我们精确计算略有差异。
[6]但是参加比赛毕竟与选择女朋友不同。评委的心理往往导致两类偏差
会影响公正评价。一类是记忆偏差,另一类是直接比较偏差。这两种偏
差导致首先登场的选手比第二、第三登场的选手会得到更高的评价,但
是出场顺序更后的选手,也有很大的优势获得更高的评价。Lionel Page
和Katie Page的论文Biases in sequential performance evaluation, a field
study on the idol series利用8个国家的大众偶像评选活动(如“美国偶
像”之类的活动)的数据,表明了这样的结果。当你准备面晤或接到工
作面试通知,并且询问你愿意安排在什么时间时,你应该选择安排在什
么位置呢?两位Page的研究表明:你应尽量安排在最后。
[7]可参阅Paul Hoffman, The Man Loved Only Numbers(New York:
Hyperion,1998)第233~240页,本书讲到了几个概率论专家,包括才
华横溢、著作等身的数学家保罗·厄多斯(Paul Erd?s),他们算错了
一个很简单的概率题,跟他们解释后竟然还不知道自己的错误。
[8]以概率而论,任何1枚硬币要连续30次正面向上的概率(0.530)接近
0,但是如果有100万枚硬币参加投掷,则30轮后至少有1枚硬币连续30
次正面向上的概率约为9.3%(再考虑有2枚、3枚……等情况,则概率超
过9.3%);如果是1 000万枚硬币,则约为92.7%(几乎是肯定的了)。面对不确定性的制胜策略
有些游戏,虽然参加者不止一个人,存在好几个利益冲突的博弈
方。但是,博弈的结果很大程度上将依赖于“运气”而不是互动策略的考
量,此时的博弈问题,实际上仍可看做不确定性环境的单人概率决策问
题。参与人的出招关键是找出最有可能制胜的策略。
俄罗斯轮盘:谁都没有优势
俄罗斯轮盘(Russian roulette)是一个非常残酷的赌博游戏。经典
的俄罗斯轮盘赌游戏如同电影《猎鹿者》(The Deer Hunter,1978)中
所描述的虐待战俘的方法:在一支可装六发子弹的左轮手枪里,只放一
颗子弹,随机地一转后,要求两名战俘轮流用手枪对准自己的头部发
射,直到一名战俘中枪,另一名战俘才逃过一劫。
这种残酷游戏据说最早可以追溯到克里米亚半岛,不过真正流行还
是在第一次世界大战期间。当时,白天打了败仗的沙俄军官和士兵到了
夜里便借酒浇愁,于是“俄罗斯轮盘赌”便成了最好的“助兴”节目。虽然
屡屡有人惨死在枪下,但是这种惊险刺激的游戏却在俄罗斯越来越流
行,甚至赢得了“俄罗斯轮盘赌”的“美名”。
不过,我在这里要问的问题是:这样的游戏对于先发者或者后发者
是否会更有利或更不利呢?我曾把这个问题贴在人大经济论坛(www.pinggu.orgbbs),既有网友认为先发者更有利,也有网友认为
后发者更有利。
而实际上,这是一个纯粹凭运气的博弈。子弹装上再一转之后,子
弹的位置就已经固定下来,因而究竟是先发者死亡还是后发者死亡也就
确定下来。如果子弹正好在1、3、5的位置,则先发者将死亡;如果子
弹在2、4、6的位置,则后发者死亡。而子弹进入1、3、5以及进入2、4、6的概率各为12。因此,先发者和后发者的死亡概率均为12,并不
存在先发优势或后发优势。[1]
当然,可能确有始终被运气眷顾的人,比如英国作家格雷厄姆·格
林。他曾对俄罗斯轮盘赌乐此不疲,认为这是一剂解乏的“良药”。年轻
时他曾对未婚妻这样写道:“以这样的方式自杀实在太刺激了。”后来他
承认当自己在大学念书的时候,夜深人静时常在宿舍里玩这种游戏。令
人惊奇的是,他自己如履薄冰地幸运活了下来,而他的同伴中却屡屡有
人死于非命。
回头再讨论一下人们对俄罗斯轮盘中的概率的看法。不少网友竟然
认为这当中存在先发优势或后发优势──这让我想到生活中的抓阄。比
如,有一份不可分割的物品,需要分配给5个人,为保证公平采用抓阄
的方式确定谁将得到这份物品。五个信封中只有一个信封内的纸片上写
着获得该物品。不少人以为先抓阄和后抓阄可能面临不同的机会。但
是,真的是这样吗?一个博弈论专家的教训
俄罗斯轮盘赌中的胜负纯粹依靠运气。但是在另一场轮盘赌中,一
个博弈论专家本可稳操胜券,却因为未曾细想其策略而满盘皆输。
巴里·奈尔伯夫(Barry Nalbuff)是一个博弈论经济学家。他与迪克
西特合作的《策略思维》是一本非常著名的博弈论科普之作。在那本书
中记录了巴里的一次深刻教训。话说当年巴里为了庆祝大学毕业,参加
了剑桥大学的五月舞会。庆祝活动的一部分包括在一个赌场下注。每人
都得到相当于20美元的筹码,截至舞会结束时候,收获最多的一位将免
费获得下一年度舞会的入场券。到了最后一轮轮盘赌的时候,纯粹是出
于一个令人愉快的巧合,巴里手中已经拥有了相当于700美元的筹码,独占鳌头。第二名是一位拥有300美元筹码的英国女子。其他参与者实
际上已经被淘汰出局。该女子提出与巴里分享下一年的入场券,但是巴
里拒绝了。是的,自己占有绝对的优势,怎么可能满足于得到一般的奖
赏呢?
为了理解接下来的策略,有必要交代一下轮盘赌的规则。典型的轮
盘赌是轮盘上刻有37个数字,标记为0~36。轮盘赌的输赢取决于轮盘
停止转动时小球落在哪一格。假如小球落在0处,就算庄家赢。轮盘赌
最可靠的玩法就是赌小球落在偶数还是奇数。这种玩法的赔率是一赔
一,比如1美元赌注变成2美元,不过取胜的机会只有1837(37个格中
除了0外只有18个偶数,或18个奇数)。采取这样一种玩法,即使该女子押上全部300美元筹码也不能稳操胜券。因此她被迫选择一种风险更
大的玩法,她把全部的筹码押在小球落在3的倍数上。这种玩法的赔率
是二赔一(若她赢了,则她的300美元将变成900美元),但取胜的机会
只有1237(37格中除0外有12个数字是3的倍数)。
现在,那名女子已经将她的筹码摆上桌面,表示已经下注,不能反
悔。那么巴里应该怎么办呢?
读者也可以先想一想巴里应该怎么办。真实的结果是,巴里将200
美元押在偶数上,并且嘀咕他输掉冠军宝座的唯一可能性就是他输并且
她赢,而这种可能性发生的几率为1:5,因此形势对他非常有利。然
而,几率为1:5的事件也时有发生。在这里,结果是那名女子赢了。
事后,巴里承认做出这种错误的押注方式是因为当时已经凌晨三
点,他喝了太多香槟,没有办法保持头脑清醒了。他真正应该采取的策
略是模仿那名女子的做法,同样把300美元押在小球落在3的倍数上。为
什么呢?因为尽管小球是否落在3的倍数上是不确定的,但若巴里采取
与女子同样的押注方式,那么出现的结果只会是要赢一起赢,要输一起
输,但无论输赢巴里都会比那名女子多出400美元而获得冠军宝座。相
反,如果巴里采取与女子不同的押注方式,则女子赢得赌注而巴里输掉
赌注的可能性就是存在的──这正是真实的故事。
这件事情给了巴里一个深刻的教训。保持清醒的头脑来选择最恰当的策略对于在博弈中取胜是至关重要的。不过,在毕业晚会上这样兴
奋、疲倦的时刻,保持清醒头脑可能也很不容易。不仅巴里如此,其实
那个女子也是在不清醒的状态下偶然取胜的。怎么可以判断出来?很简
单,巴里只要采取与那名女子一样的策略,那名女子就必败,只有两人
采取不一样的策略时,那名女子才有获胜的可能;既然如此,该女子就
不应率先下注,因为率先下注,巴里就可以跟随其下同样的注;她应该
等巴里先下注,然后再下与巴里不同的注,这样才更有反败为胜的可
能。
保持清醒的头脑来选择最恰当的策略对于在博弈中取胜是至关重要
的。
巴里的这个故事所蕴涵的道理是深刻的。在现实中,我们常常会发
现类似的领先者模仿落后者的例子。比如帆船竞赛,领先者总是试图与
落后者保持同一航道,而落后者总是希望走上与领先者不同的航道。因
为帆船会受到风速、风向的随机影响,对于不同航道的船,这种随机影
响可能有差异,但同一航道则影响往往是一致的。领先者维持与落后者
同一航道,就可避免因随机因素影响而失败;而落后者选择与领先者不
同的航道,虽不能保证胜利,但可以通过随机因素获得反败为胜的机
会。在一个市场中的企业其实又何尝不是如此?先进企业常常会采取大
多数企业所采取的比较保守的常规战略,而后进企业中有不少则提
出“超常规发展”。遵循常规的后进企业没有机会超越先进企业,而“超常规发展”战略虽然面临更大的风险,却的确也成就了少数恰好碰对了
运气的企业。同样的情形也出现在股市分析员和经济预测员身上。业绩
领先的预测员总是想方设法随大流,尽量做出与其他人差不多的预测。
这样一来,大家就不容易改变对这些预测员能力的看法。另一方面,初
出茅庐的预测员则常常会采取冒险策略:他们喜欢预言市场出现繁荣或
者崩溃。通常他们都会说错,以后再没人相信他们。不过,偶尔也有人
做出了正确的预测而一夜成名,从此扬名立万。
领先者维持与落后者同一航道,就可避免因随机因素影响而失败;
而落后者选择与领先者不同的航道,虽不能保证胜利,但可以通过随机
因素获得反败为胜的机会。
我还想到了另一个例子。前不久的北京奥运会,相信大家对中国乒
乓球的辉煌赛绩仍历历在目。在好些场中外选手对抗中,外国运动员都
采取了所谓的“搏杀”。搏杀行为是一种高风险策略,它可能使自己失误
更多,当然对对手也有较大威胁。那些外国运动员为什么要采取搏杀?
因为他们处于弱势。他们的搏杀行为与后进企业、初出茅庐的预报员等
采取更冒险的行为本质上有相同的效果。
应该先与谁赛
读者大概都听说过“田忌赛马”的故事。话说齐王有上、中、下三
马,田忌也有上、中、下三马,但田忌每一个等级的马都不及齐王同等级的马,因此田忌每每以“上中下”对齐王“上中下”都惨遭失败。后来孙
膑为其出谋划策,以下马对齐王上马,以上马对齐王中马,以中马对齐
王下马,取得一负二胜的成绩。
今天,我们将赛马的故事再改编一下,来看看概率计算对于不确定
性下的策略选择的重要性。
话说齐王知道了孙膑为田忌出谋划策而使田忌赢得比赛后,心中暗
叹此人聪明,又有些不服气。于是叫来田忌、孙膑要再赛一场马,并且
他要和田忌组成联队对抗孙膑,即每个人一匹马,但是齐王和田忌组成
联队与孙膑比赛,规则如下:齐王和田忌轮流与孙膑比赛,若三局中孙
膑连胜两局就算孙膑胜,否则就算孙膑输;不过孙膑有权挑选先跟谁比
赛。
现在,已知的情况是齐王的马比孙膑的马好,孙膑的马比田忌的
好。孙膑与齐王比赛则每局有0.4的可能性取胜,跟田忌比赛则有0.7的
可能性取胜。那么,孙膑最好选择先与谁进行比赛呢?
乍一看,孙膑先与田忌比赛,则与齐王只需要赛一局,似乎比较有
利。而另一方面由于要连胜两局,第二局非胜不可,则似乎又应选择与
田忌赛第二局,因此先与齐王比赛好像更有利。究竟应该怎么选择呢?
不妨推导看看。
假设孙膑胜齐王的概率为a,胜田忌的概率为b,且a
故先与齐王赛则获胜的概率为:aba+ab(1-a)+(1-a)ba=ab(2-a)。
若先与田忌赛,则获胜的概率为bab+ba(1-b)+(1-b)ab=ab(2-b)。
因为a
a=0.4,b=0.7代入前面的计算,则可发现,如果先与齐王比赛,则孙膑
获胜的概率为0.448,如果先与田忌比赛,则孙膑获胜的概率为0.364。
有时候确定一下与对手竞争的顺序,对自己是有好处的。
这个故事说明,有时候确定一下与对手竞争的顺序,对自己是有好
处的。小到体育比赛日程的安排,大到国家法案立法讨论的顺序,往往
都可以影响成败的概率。这也是在竞争中,人们在赛前纷纷展开影响竞
争顺序安排的游说活动的原因。
三方对决:弱者的生存之道
下面要讲的例子在我的《身边的博弈》一书中曾提到其简单版本,现在考虑得相对复杂一点,概率计算上也更为困难一点。建议有概率论
基础的读者阅读;无概率论基础的读者可跳过分析过程。
A、B、C三人决斗,每人每次发射一枪。A枪法最差,命中概率为
PA;B一般,命中概率为PB;C是神枪手,命中概率为1。显然PA
1。三位按照ABC的顺序依次发射,直到只剩一人存活。每个射手,在
轮到其发射时,他可以选择任一对手开枪射击,也可以对空射击(不会射杀任何人)。假设任一射手一旦中枪即毙命,死亡的射手不允许再射
击。
现在的问题是:A的最佳策略是什么?
A的最佳策略,应当是使A有最大生存机会的策略。为了寻找最佳
策略,可以这样分析:如果只剩下一个对手,那么最佳的选择就是向那
个对手开枪;如果两个对手都存在,而轮到A射击时,那么情况就与博
弈开始时由A射击的情况一样。所以,只需要重点考虑A刚开始博弈时
会怎么选择。
A刚开始博弈时面临的选择不外乎三种:对空发射、对C发射、对B
发射。对此三种情况逐一分析。如果A射B,若射杀B,就等于签了死亡
协议(因为接下来就是C射A);若没能射杀B,则与对空放枪没两样,接下来B会先攻击C(因为C比A对B更危险),A就赚得一轮机会。结论
是:对B发射的策略,严格劣于对空发射的策略。再看A射C的情况,若
射杀C,则接下来该B射A,因此A存活概率不会超过1-PB;若未能射杀
C,则接下来B射C,无论B是否得手,A存活的概率都不低于PA(请读
者想想为什么)──而未射杀C与对空发射并无两样。显然,只要PA≥1-
PB,则射杀B也严格劣于对空发射。最终的结论是,若PA≥1-PB,则A的
最佳射击策略是:B、C都存在时就始终对空发射,若B、C仅剩一人则
对幸存者发射。当然,不能排除有这样的情况,PA<1-PB,此时A选择
射C还是对空发射,就需要更细致的分析才可以讨论。[2]容易发现,当B稍强时,A最好先放手,让B对付C,然后再与B和C
的幸存者拼命;若B也较弱,那么A应当先协助B对付C,以谋求更大的
生存机会。
这个例子也刻画了现实生活中弱者的生存之道。在一强两弱的三方
对决中,如果次强者相对较强,那么弱者最好是退一步,让次强者与强
者争锋,然后再与其中的胜者拚命;如果次强者能力与弱者也相差无
几,那么弱者应与次强者联合对付强者,然后再与次强者拚命。历史上
的三国,就是这样一种情形。[3]
其对于现实生活的启示,还可参见《身
边的博弈》的第1章。
在一强两弱的三方对决中,如果次强者相对较强,那么弱者最好是
退一步,让次强者与强者争锋,然后再与其中的胜者拚命;如果次强者
能力与弱者也相差无几,那么弱者应与次强者联合对付强者,然后再与
次强者拚命。
[1]对俄罗斯轮盘赌问题还有不少推广,可参见D.Sandell, Fair Russian
Roulette,The Mathematical Scientist 22,1997,52-57。
[2]分别考虑A的如下三种策略:
(1)对空发射。若A对空发射,则A获胜的可能的后续情况如下:①B
射中C,A射中B;②B射中C,“A未射中B,B未射中A”循环n次
(n≥1),然后A射中B;③B未射中C,C射中B,A射中C。令 表示采
取对空发射的策略,那么A获胜(存活)的概率为(2)A射向C。此时,若A未射中C,则事态将如同策略(1)的发展;
若A射中C,则事态发展为:B未射中A,“A未射中B,B未射中A”循环
n次(n≥0),然后A射中B。令表示采取策略射向C,则A获胜的概率为
(3)A射向B。此策略有两种可能性,其一是A射中B,则A随即将被C
射杀;其二为A未射中B,则此时状态发展同策略(1)是一样的。从而
A获胜的概率为 。
显然,因为1-PA<1,因此始终有 ,说明策略(3)始终劣与策略
(1),因此A始终不会选先射杀B的策略。策略(2)和策略(1)相比
较,谁的存活概率大则A就选谁:
故 ,当且仅当 。
因为1-PA<1,经过解PB>(1-PB)2可得到无论PB为何值,当
时,A采取策略(2)比较好。而据假设有1-PA>1-
PB,经过解PB<(1-PB)2可得到PB<0.318时,A选择策略(2)比较好。
[3]三方对决问题还可做不同的假设,可参考M.J.Gardner,Strategy for
life:a guide to decision making,Mathematical Spectrum 5,197273,54-
58。应对风险的策略
前面这些例子说明,如何可以通过选择不同的策略来提高竞争中获
胜的概率。这些策略选择并不会影响不确定性本身所导致的风险──不
能降低风险,也没有考虑如何规避风险。在现实生活中,我们其实还有
很多措施可以降低风险、规避风险或者操纵风险获利。下面就是这样的
例子。
风险混合:鸡蛋不要放在一个篮子里
应对风险的第一种重要方法是对风险进行混合。即达到降低风险的
目的,将不同的收入风险结合起来。
即达到降低风险的目的,将不同的收入风险结合起来。
举个例子来说。你居住在一个小岛上,以种植为生,这是一个完全
靠天吃饭的职业。这个小岛很奇怪,岛的东部和西部的天气刚好相反,东部是好(或坏)天气,则西部就会是坏(或好)天气。用专业术语来
说,那就是岛的东西部天气是完全负相关的。
现在你要做出决定,将1千克小麦种子播种在东部还是西部。1千克
种子若遭遇好天气,可产出100千克小麦;若遭遇坏天气,则颗粒无
收。考虑不对风险进行混合,即你只把种子播在东部或西部。结果很明
显,无论你播种在东部还是西部,你的预期收成皆为100×0.5+0×0.5=50
千克。但这50千克的预期收成具有很大的风险,因为你并不是得到确定
的50千克,而是要么得到100千克,要么得到0千克(倘真如此你就捱不
过日子了,风险确实大!)。或者说,你面临的结果具有很大的离散程
度(离散程度越大,风险越高)。
现在考虑对风险进行混合。你的决定是将1千克小麦分为两份,分
别播种在东部和西部,比如0.5千克小麦种在东部,另外0.5千克种在西
部。你的预期收成将是多少呢?可以这样想:如果东部天气坏,则东部
收成为0,但此时西部天气必然好,则西部收成50;如果东部天气好,则东部收成50,但此时西部天气必然坏,则西部收成0。也就是说,你
这种对风险进行混合的策略,使得你总可以得到确定的50千克小麦,这
50千克小麦收成没有任何风险(结果的离散程度为0)。因此,通过这
样的风险混合,你的确在维持预期收成相同的情况下降低了风险。
当然,读者也可能会说,风险之所以降低也许是因为你假定了东部
和西部的天气变化刚好是相反的(完全负相关),如果它们不完全相
反,这个结论还可靠吗?为了回答这个问题,不妨放宽先前的假设,重
新假设东部和西部的天气变化相互之间完全独立,即东部天气和西部天
气没有任何联系。那么,先前的风险混合策略所得到的预期收成是多少
呢?可以发现,你将面临的结果无非是以下四种:·东部好天气,西部坏天气:总收成50,概率0.25(=0.5×0.5)。
·东部好天气,西部好天气:总收成100,概率0.25。
·东部坏天气,西部坏天气:总收成0,概率0.25。
·东部坏天气,西部好天气:总收成50,概率0.25。
你的预期收成仍是50千克
(=50×0.25+100×0.25+0×0.25+50×0.25)。但是与没有混合风险的策略
相比较,你现在至少有0.5的概率会收成50千克;同时,获得100千克或
0千克两种极端结果的概率,也从各自的0.5下降到了0.25。换句话说,现在你减少了极端结果发生的概率,而增加了中间结果发生的概率──
这减小了结果的离散程度,风险因而也降低了。事实上,只要东部和西
部的天气不完全正相关,则通过分散播种来降低收成风险就总是可行
的。
风险混合,这一降低风险的原理,是许多现实的风险规避机制被人
们采用的理论基础。可以类推,你现在要投入的不是小麦种子,而是股
票投资,那么投资于几种价格走势不完全正相关的股票,就比投资于单
一股票的风险要小。这一分散投资原则正是诺贝尔奖得主经济学家詹姆
斯·托宾曾经说过的一句名言:“不要把鸡蛋放在一个篮子里。”中国古
代谚语“狡兔三窟”,也是同样的道理,将希望寄托在多个途径,比吊死
在一棵树上的风险要低。同样,家庭、企业、国家有着多种经济来源和经济成分,比单一经济来源和经济成分面临的收入风险要低。城市之所
以比农村有更强的抗风险能力,不仅因为城市具有更雄厚的经济实力,也与城市经济的多元化有关;农村经济常常局限于农业,因此抗风险能
力不如城市。
风险交易:买进保险,卖出风险
风险交易,也可以降低风险,并提升交易双方的福利。
一种最简单的风险交易方式,是订立合同来转移或承担风险。譬如
对于前面的例子,我们可以稍加修改:你住在岛的东部,你的邻居住在
岛的西部。你们每个人,天气好则收成为100千克,天气坏则颗粒无
收。仍假设东部和西部的天气好坏刚好是相反的。那么,如果你们之间
没有任何合同,则结果无非两种:
·东部好天气,西部坏天气:你收成100,你的邻居收成0;概率
0.5。
·东部坏天气,西部好天气:你收成0,你的邻居收成100;概率
0.5。
对于你们每个人,这样的结果风险都很大,每个人都有50%的概率
收成为0而饿肚子。
如果你们订立这样一个合同:无论谁丰收(此时另一方必歉收),都将自己收成的一半即50千克赠送给对方。这样的一个合同实际上是双
方混合了彼此的风险,效果与前面的风险混合是一样的。无论出现什么
天气,总会有一方收成100,而另一方收成0,而在这样的合同下,丰收
方会赠送歉收方50。也就是说,无论天气好坏,这样的合同确保了每个
人得到确定的50千克。这样的合同降低了彼此的风险。或者说,每个人
以丰收时的50千克小麦有条件地买下了一份保险,这个保险使得任何时
候一定可以得到50千克小麦。
不过,上述合同也有其局限性。一个局限性是,等到结果出现后,丰收方可能会违约拒绝赠送小麦给歉收方。当然这个局限并不算严重,因为只要有一个强有力的法律体制,确保合同得到实施就不算太困难。
更严重的局限在于:如果西部的天气永远(或者大多时候)是好天气,那么你的邻居就不会与你订立这样一个混合风险的合同──是的,他本
来毫无风险(或风险很低),凭什么要与你共同承担风险呢?
此时,是否还有解决问题的办法呢?可以想像,由于你(东部农
民)面临巨大风险,因此如果有人帮助你承担一定的风险,但要求你对
帮助承担风险者给予一定的补偿,若这补偿支付额度尚可承受,那么你
大概是愿意付出这一补偿以激励对方帮助你分担风险的。而对于你的邻
居(西部农民),假设他现在完全没有风险,可以确定地得到收成
100,此时如果你支付的补偿足以刺激他帮你分担风险,那么他可能也
是愿意的。这样,你们就可以订立一个合同,以某种价格(风险补偿)来交易一定数量的风险。
为了说明这个道理,我们需要引入风险规避的概念。风险规避是一
种厌恶风险而希望尽可能避开风险的心理态度。只有风险规避者,才愿
意为了降低风险而支付交易价格。经济学中对风险规避态度的刻画是通
过凹的效用函数来进行的。这里我们不需过多地纠缠于概念和术语,而
是直接给出一个满足凹性的效用函数,比如 。这里,x是财富数
量,u是对应的效用值。假设你和西部农民的效用函数都是如此,并且
你们都追求更高的效用。从而我们可以计算,在没有风险交易合同时,你从小麦收成中获得的预期效用为: ,即是
说,如果你的收成为100,则获得效用为 ,此种情况的概率为
0.5;如果你的收成为0,则获得效用为 ,其概率也是0.5。而综合起
来,你的预期效用是5。同样,也可计算你的邻居在没有风险交易合同
下的效用,因为他可得到确定的100,因此他的效用将是确定的:。
我们现在要考虑的是,是否存在一个可以成交的风险交易价格(风
险补偿)区间。不妨先假设这个补偿区间是存在的,姑且假设该补偿也
以小麦来衡量,而你们的风险交易合同签订如下条款:如果你丰收,则
你补偿给你的邻居x千克小麦;如果你歉收,则你的邻居补偿给你y千克
小麦。显然,若要让双方都同意这一条款,必须是双方都认为同意这一条款比不同意要好,也就是如下两个条件应该得到满足:
条件(C1)是说,你接受该条款的预期效用不低于不接受该条款的
预期效用;条件(C2)是说,你的邻居接受该条款的预期效用不低于不
接受该条款的预期效用。当两个条件都得到满足的时候,合同是可以达
成的。关键是,存在x和y值满足两个条件吗?求解两个不等式,的确可
以发现,只要x和y满足如下条件,则(C1)、(C2)两个条件将同时
成立:
上述条件看起来很复杂,其实很简单。它无非刻画的是条件(C1)
(C2)所形成的交集,即合约空间。如果绘制出其图形(见图2-3),则意味着(x,y)只能在阴影区域取值,这个阴影区域就是合同可以达
成的区间。如果合同(x,y)所确定的点越往右下,即你的邻居要求的
风险补偿x越高,而你要求的风险分担越少,则对你的邻居越有利;反
之,(x,y)所确定的点越往左上,则对你越有利。不过我们在这里只
想说明,的确存在使双方获益的风险交易合同达成的区间(阴影部
分),至于在该区间哪个点上达成,那只是一个利益分割问题,要看谁
更善于谈判了。如果是很多人在从事风险交易,那么将会由市场来决定一个风险交易价格,即确定一个利益分割点。这些交易的共同之处是,借由合理的价格,使风险少者减少风险多者的负担,以达到互利的效
果。
借由合理的价格,使风险少者减少风险多者的负担,以达到互利的
效果。
作为一个特例,我们考虑达成合同的点(x,y)=(64,32),即
合同规定:如果你丰收,则支付64千克小麦给你的邻居,如果你歉收,则你的邻居支付32千克小麦给你。可以计算,此时你的预期收益是
0.5(100-64)+0.5(32)=34千克,虽然比不订合同时的预期收成50千
克减少了,但由于转嫁了风险,你的预期效用变为
,比不订合同的预期效用增加了5.83-
5=0.83。同样,你的邻居接受合同后的预期收益是
0.5(100+64)+0.5(100-32)=116,比合约前的预期收益增加了,不过
由于他承担了风险,实际上其效用将有所折扣;尽管如此,由于补偿足
够大,使得其预期效用为 ,比不订
合同下的效用高出10.53-10=0.53。这说明,双方订立风险交易合同后,的确改进了双方的福利。图 2-3 风险交易的合约区间
如果你明白了上述道理,就可以明白现实中大量的风险交易或保险
购买行为。因为每个人对于风险的承受能力不一样,更能承受风险的人
乐于向不能承受风险的人出售保险服务;而不能承受风险的人也乐于向
更能承受风险的人购买保险服务。西部农民因为产量有保障,所以他更
能承受风险,他就像保险公司一样,为你(东部农民)提供保险服务。
现实中,保险公司比个人更能承受风险,所以它们向不能承受风险的个
人出售保险,而个人也因为能够通过买入保险来转嫁个人难以承受的风
险,而提高了自身的福利。
更能承受风险的人乐于向不能承受风险的人出售保险服务;而不能
承受风险的人也乐于向更能承受风险的人购买保险服务。事实上,风险价格及风险市场的概念,正是现代经济中几乎所有的
金融安排之基础。股票、债券以及其他诸如衍生品之类的复杂金融工
具,都具有这样的功能:把风险分散给那些最愿意为风险收益承受代价
的人们。许多人认为金融市场纯粹是冒险的一种形式,从某方面来看的
确是,但风险越小的人越冒险,也许因为他们把风险分散了,所以他们
可以尝试更冒险的企业计划,而金融市场也因风险交易而促进了企业的
发展。当然,这些市场也受到道德风险、逆向选择甚至直接欺骗的限
制,所以不能完全做到风险分散。例如,公司的经理通常必须承担其决
策的部分风险,通过持有公司股票或其他机制,让他们有努力为公司赚
钱的动机。
利用风险
风险不一定是坏的。在某些场合,利用风险可以为个人带来好处。
一个利用风险的现实例子就是股票期权。它实际上是一种选择权,在一定期限内,持有股票期权的人有权利按照行权价格买入或卖出股
票。很多公司激励高层管理者的一种手段就是给予他们一定数量的股票
期权,而且现实中的股票期权基本上是买入期权,很少有卖出期权。
在某些场合,利用风险可以为个人带来好处。
考虑高层管理者被授予股票期权,而将来行权日的行权价格为50
元。现在有两种投资方案。一种方案比较稳健,它使得企业未来的股票价格在行权日各有50%的概率为80元或者40元。如果实施此方案,那么
当股票价格为80元,高层管理者就可以行权从而每份股票获利80-50=30
元;如果股票价格为40元,高层管理者就会放弃行权从而获利0元。所
以,此方案下每份期权给高层管理者带来的预期价值就是
0.5×30+0.5×0=15元。
另一种方案是高风险方案,它使得未来的行权日股票价格各有50%
的概率为90元或10元。该方案下每份期权给高层管理者带来的预期价值
就是0.5×40+0.5×0=20元。
显然,高层管理者会选择高风险方案,因为这样可以为他们带来更
大的预期收益。或者说,高层管理者采取冒险行为(利用风险)来提升
自己的利益。当然,高风险方案可能对企业本身是有害的。比如在我们
的例子中,稳健方案不仅风险更小,而且相应的企业股票预期价值为
0.5×80+0.5×30=55元,高于高风险方案相应的企业股票预期价值为
0.5×90+0.5×10=50元。这就是管理层行为与股东利益冲突的地方。
利用风险的另一个例子是管理激励,比如业绩工资。一般来说,员
工的业绩不仅受员工努力的影响,也会受到一些随机因素的影响。这
样,即使观察到员工的业绩,也不能准确判断员工是否努力。当观察到
低业绩的时候,员工可以辩解是“运气”不好,是随机因素影响的结果,声称自己已经努力。如果企业承担全部风险,给予员工固定工资,那么
员工就不会努力。如果按照业绩支付工资,实际上就是将部分风险转嫁到员工身上。然而,正是因为承担了风险,员工为了获得更高的预期报
酬,就必须付出努力。
风险操纵:选择有利于自己的环境
在很多情形下,人们也可以通过影响自己和他人所面临的风险来获
得好处;这就是风险操纵,是针对风险的另一种形式的利用。
在很多情形下,人们也可以通过影响自己和他人所面临的风险来获
得好处;这就是风险操纵。
一般来说,在竞争中,我们总会见到强者宁愿选择稳健的策略,而
弱者宁愿选择冒险的策略。这就是源于风险操纵:因为强者更愿意把竞
争结果建立在能力的基础上,所以他们选择更依靠能力的策略,尽量减
少环境中的不确定干扰;而弱者更愿意把竞争结果建立在“运气”的基础
上,他们深知凭借能力是难以获胜的,还不如选择高风险方案多得一点
运气。“死马当做活马医”也是这个道理,反正已经濒临绝境,不如采取
高风险方案,反而有可能绝处逢生。比如,网球技术很烂的你要挑战网
球高手,选个风大的日子是不是对你更有利呢?
上述道理说明,越是能力弱的人,越应该选择一个有利于自己“运
气”的环境。我想起2003年诺贝尔经济学奖得主格兰杰(Clive
W.J.Granger)教授在获奖之后对记者的一番话。当时记者问他:“怎么
样有助于获得诺贝尔经济学奖?”格兰杰回答:“首先你要选择一所好的但不是顶尖的(good but not top)大学。”这个观点是很有道理的。如果
学校不好,就缺乏做出优秀成果的平台;如果进入顶尖的学校,虽有平
台,但是获得平台的机会就少得多(因为顶尖大学的高手太多了)。格
兰杰从1974年就一直在加州大学圣迭戈分校(UCSD),这所学校在当
时其实就是“好的但不是顶尖的”大学(现在它可以算是一流大学了,2007年UCSD在全美大学综合排名为第33名)。
所以个人在选择工作和职业的时候,应当考虑在成功机会和资源能
力之间进行恰当的平衡。因为个人要谋求成功,固然与能力有关,也与
机遇有关;选择更有利于匹配自己能力以获得更大胜算的环境,是追求
个人成功的事业中需要重点考虑的一环。
此外,在竞争中,一个人不仅可以在策略中操纵风险,更可以操纵
与对手风险的相关性来获得好处。领先的选手会尽量选择更高的正相
关:这样一来,无论他的运气好坏,对手的运气也会跟他一样,这样他
就可以继续保持领先。相反,落后的选手会选择负相关。就像两人帆船
竞赛的例子一样,落后者应选择与领先者不同的航道,而领先者应该顺
着落后者的航道。[1]
本章前面的“一个博弈论专家的教训”也是一个非常
好的例子,巴里本来可以操纵赌博的风险,他只需要保持与那名女子完
全相同的押注方式,使得自己与女子的风险完全相关,他就可以稳操胜
券。可惜他选择了另外的押注方式,使得自己的风险与女子的风险相互
独立,最终酿成了败局。制造风险:哑弹战略
有时候,我们还可以创造出不确定性,来谋取好处。博弈论中的混
合策略,就是典型的例子。譬如下面的经理和员工之间的监督博弈(图
2-4):
这个博弈基于这样的假设:如果经理监督而员工努力,则双方都没
有额外收益,标记各自赢利为0;经理监督而员工偷懒,则经理从员工
处罚款1元,经理赢利记为1,员工赢利记为-1;如果经理不监督而员工
努力,则经理节约监督成本1元记为其赢利,员工无额外收益其赢利记
为0;经理不监督而员工偷懒,则相当于员工从经理处盗窃到1元,记经
理赢利为-1,员工赢利为1。
图 2-4 监督博弈
在这个博弈中,没有纯策略均衡。经理监督则员工最好选择努力,而员工努力则经理最好就不要监督,但经理不监督则员工最好就偷懒,员工偷懒则经理最好还是监督──这是一个策略不断循环的情形,没有
纯策略均衡。但是,它存在一个混合策略均衡,即经理以0.5的概率选监察、环境保护监察等领域,完全监察的成本太高,但监管当局又试图
上述道理在很多监管领域都有运用。比如公司财务审计、劳动行政
案──努力工作。经理通过人为制造出的风险激励了员工。
定性,当这种不确定性足够大(x>0.5)时,员工宁愿选择一种保险方
督但员工仍然努力,其原因在于经理的随机监督给员工造成了一种不确
可以满足企业的要求,又可以提升自己的福利。而给定经理并未完全监
了。所以,经理不必全力监督,只需要以x>0.5的概率监督员工,就既
x(0)+(1-x)(1)=1-x>0,即经理的赢利状况比之全力监督时改善
选择是始终努力。在这样的监督策略下,经理的预期赢利为
为0,而偷懒的预期赢利为x(-1)+(1-x)(1)=1-2x<0,员工的最佳
>0.5的概率监督,就足以使员工努力──因为此时员工努力的预期赢利
力这种状况下,经理始终只得到赢利0。聪明的经理会发现,他只要以x 令员工努力,但是经理会发现这样做不值得,因为在自己监督而员工努
懒,但是不是意味着经理就一定要全力监督呢?经理全力监督固然可以
工偷懒就会解雇经理。为了防止被解雇,经理就会试图让员工不能偷
不偷懒。为了保证经理愿意执行企业的要求,不妨假设企业一旦发现员
现在,我们假设企业对经理做出要求,即要求经理必须确保其员工
弈》。)更多电子书关注
概率选择偷懒。(不熟悉纳什均衡的读者,请参阅拙著《身边的博
择监督,以0.5的概率选择不监督;员工以23的概率选择努力,以13的阻止被监管对象的不法或违规行为,那么监管当局就可以通过随机检查
的策略,配以高额的处罚,这样就有助于遏止不轨行为,而监察成本又
在可接受范围之内。
通过随机性向对手制造风险的思想,在军事领域还有一个很好的例
子,即“哑弹战略”。在战争当中,防空体系必须确保摧毁几乎100%的
入侵导弹。对于进攻方而言,击败防空体系的一个办法就是用假导弹掩
护真导弹。一枚假导弹的成本远远低于一枚真导弹。除非防守方的确可
以100%地识别真导弹和假导弹,否则遭受导弹的重大损失将迫使其对
真假导弹一视同仁地加以防卫。进攻方就能以更低的代价让对方的防空
体系背上重负。
发射哑弹的做法最初起源于第二次世界大战,当时人们其实并非有
意发射哑弹,而是由于导弹质量控制本身有问题。但是,人们很快发
现,如果可以生产一些哑弹随机发射出去,也有好处。正如麦克唐纳在
《扑克、商业与战争的策略》(Strategy in Poker, Business and War)
一书中写道:“销毁生产中的次品炮弹成本很高。有人就想到一个主
意,说把生产出的哑弹随机发射过去。对方军官担负不起任凭一枚起爆
弹落在自己阵地的风险,而且他也辨别不了哪些是不会爆炸的哑弹,面
对真真假假的炮弹,他不敢大意,只好竭尽全力摧毁发射过来的每一枚
炮弹。”
哑弹战略在军事以外的领域也有很多例子。譬如前面提到的监管问题,那些希望击败监管当局的人,也可以利用哑弹策略来提高监管当局
的代价,使监管当局降低监督力度。
最后还有一个关键问题是:什么叫制造风险?随机性是可以制造出
来的吗?如果是制造,那还叫随机的吗?3271918712,这是一串随机数
字吗?178761115,是一串随机数字吗?这确实是通过随机数发生器给
出的一串0~9的随机数字。如果我们来玩猜数的游戏,你在手中写下0
~9之间的任意一个数字,我猜是几;你当然明白不能让你的数字有规
律,因为我会识别规律然后战胜你。所以,你持有上述一串随机数字并
按照这些数字出招应该是明智的。但这真的是随机的吗?如果你认为
是,那么我想问的是,我获悉了你手中这串数字会产生什么后果,我会
不会确定地赢你?所以,一串随机数字其实可能写不下来,一旦写下
来,它就是确定的,不再是随机的了。随机性只体现在过程之中,一旦
结果实现,则随机性也就丧失了。所谓的制造风险,或者制造随机性,其实只是说让对手不能识别你的规则。在密码传递中,为了防止敌人破
译密码,一种好的方式就是随时换代码。一种常见的策略也许是,以一
本书作为代码的底本,以页码、行、列标记为其对应字的代码,只要对
手不知道是以哪本书作为底本,他就没法破译。但这仍不具有随机性。
对手毕竟有可能获悉你用哪本书做底本。如果你连自己都不知道是哪本
书做底本(比如每次都临时从一批书中随便抽取一本),那么对手
要“猜”中就困难多了。所以,真正的随机选择,应该是连自己都不知道
的选择。就像骗人一样,老说谎骗不了人,有规律地说谎也难以骗人;只有自己都不知道是不是在骗人,那才最具有欺骗性。
所谓的制造风险,或者制造随机性,其实只是说让对手不能识别你
的规则。
[1]若希望了解更多的一般理论分析,请参考Luis Cabral,Football,Sailing, Tennis, and R&D:Dynamic Competition with Strategic Choice of
Variance and Covariance,Journal of Economics and Management Strategy,Vol.12,no.1(Spring 2003),pp.139-150。友好提示
·有些博弈中的胜负主要依靠“运气”,运用概率决策对此是有帮助
的。
·存在多个依次出现的被选物品或方案时,“等一等、看一看”常常
是一个好的策略。
·参加比赛,请避免作为前几个出场。
·不要把个案或小样本的特征当做总体的特征。
·对媒体公布的数据,请多加思考,它们有可能隐蔽了关键的背景
信息。
·对于抓阄这样的博弈,先抓或后抓对谁都不可能有优势,它是机
会公平的。
·在有些场合,竞争对手上场的顺序也会影响你成功的机会,所以
要在赛前尽可能使对手的出场顺序对你有利。
·在力量悬殊的三方角逐中,若你是弱者,则最佳的斗争策略是:
当次强者和强者能力相差不大,就挑起次强者与强者的斗争,自己坐收
渔利;当次强者远不及强者,则先帮助次强者共同对付强者,打倒强者后再与次强者拚命。
·对付风险的一个有效方法是:鸡蛋不要放在一个篮子里。
·对付风险的第二个有效方法是:出售风险,为风险买一份保险。
·风险可以为我所用,策略性地利用风险也可获得好处。
·成功取决于能力和运气,在能力不足的时候,就更要注重增加“运
气”──选择一个有利于增加个人“运气”的环境很重要。
·你还可以通过操纵自己的风险与对手的风险之相关性,来增加胜
算。
·有些场合,你可以制造出不确定性,让对手面临风险,增加你的
竞争优势。非对称信息博弈
我拒绝加入任何收我为会员的俱乐部。
──格劳乔·马可斯(Groucho Marx)
与腐败有关的问题是它有变成腐败问题的趋势,即使在道德问题相
对小而实际问题却很大的时候,道德问题通常也会掩盖实际的问题。
──詹姆斯·威尔逊(James Q.Wilson)
在现实中,信息不但经常是不完全的,而且也经常是不对称的,即
博弈的一方比另一方掌握着更多的私有信息。譬如,员工比经理更清楚
自己是否付出努力;经理比股东更清楚企业的经营状况;投保人比保险
公司更清楚自己的健康风险;卖家比买家更清楚其产品的质量……
非对称信息博弈经常面临的潜在后果是逆向选择和道德风险。前者
是指发起交易的一方因为不了解对手的类型信息而做出了不利于自己的
选择;后者是指发起交易的一方因为不能观察到对手的行动信息而导致
对手采取了不利于交易发起方的行动。本章我们将接触到大量逆向选择
和道德风险的例子。另外,当信息非对称时,参与人的言行往往也能传
递其拥有的私有信息,因此在这类博弈中务必要学会观察蛛丝马迹,以
确定自己的最优反应行动。逆向选择和道德风险:基本思想
逆向选择
逆向选择(adverse selection)本来是保险行业的术语。考虑一大群
投保人,他们的健康风险各不一样,有些人患疾病的风险比较低,有些
人则比较高。如本书第2章曾讲到,通过购买保险将全部或部分风险转
嫁出去,是对付风险的良方之一。所以每个人都愿意为自己的健康买一
份保险,但是每个人意愿支付的保险费(即购买保险的价格)是不一样
的。健康风险越高的人,越愿意支付更高的保险价格;相反,风险越低
的人愿意支付的保险价格也越低。保险公司面临的问题在于,它难以知
道谁是风险更高和风险最低的人。如果,保险公司确实不清楚一个人的
健康风险水平,那么它就难以根据个人的健康风险水平实施差别价格,于是它可能只好根据平均赔付水平来确定保险费。这样的定价会产生什
么后果?风险高的人将乐于购买保险,因为他们可以以比其意愿支付价
格更低的保险费买到保险;而风险低的人将拒绝购买保险,因为保险费
水平超出了其意愿支付的价格。结果,保险公司的保险合同全部卖给了
高风险的人,保险公司最终的赔付水平可能就会超过制定保险费时所依
据的平均赔付水平。就是说,由于不了解投保人的健康类型,保险公司
吸引到的最终是其最不愿意吸引的高风险人群;保险公司做出了不利于
自己的选择,这就是逆向选择。当然,现实中的保险公司,常常也会有一些用以甄别投保人健康类
型的手段。比如它会要求投保人先在指定的医院进行健康检查,这在一
定程度上可以识别出投保人的健康风险。但无论如何,确实存在许多由
于逆向选择问题而使得保险公司难以成功提供的险种。比如历史上有保
险公司提供过个人怀孕保险、婚姻保险,但现在这样的保险已经不存
在,原因在于怀孕计划、婚姻生活等具有只有被保险人才知道而别人难
以观察到的特征,这种特征对保险成本具有巨大影响,保险公司很容易
遭受严重逆向选择的影响,所以只好退出了这样的保险领域。另一个类
似的领域是战争风险。一般来说,人们对战争是否发生的推测比其他自
然随机事件的推测要准确得多,如果保险公司提供战争风险的保险,那
么结果将是面临高度战争风险的人才会购买这个保险,保险公司就会面
临逆向选择。所以,在很多保险种类及其条款中,都把战争的后果排斥
在理赔责任之外。[1]
保险公司也可以通过其他一些手段来避免逆向选择。一种常见的手
段是,向某些大型的集团推销保险,因为大集团的成员中风险程度常常
是分散的,这样就避免了逆向选择。比如说,一个地区的汽车全部强制
保险,这就避免了只有技术最差劲的司机才购买保险的情况;向大企
业、学校或小企业联盟出售集体医疗保险和人寿保险,就避免了只有存
在较大健康隐患的人才购买保险的情况。
今天,逆向选择这个概念早已走出了保险领域。在经济和社会生活中,诸多因信息不对称而导致行为主体做出不利于自己选择的现象,都
被归结为逆向选择。逆向选择业已成为现代经济学中的一个基本概念。
经济学家早就认识到逆向选择问题会干扰市场的有效运行。但是对其进
行正式的理论研究则始于阿克洛夫(G.Akerlof,2001年经济学诺奖得
主)在1970年的论文《次品市场:质量、不确定性与市场机制》(又名
《柠檬市场》)。[2]
在经济和社会生活中,诸多因信息不对称而导致行为主体做出不利
于自己选择的现象,都被归结为逆向选择。
阿克洛夫考察了这样一个市场。这个市场交易的物品是二手车,存
在大量的买家和卖家。卖家知道其待售汽车的质量,但买家则不知道。
阿克洛夫假设汽车的质量在0~1之间均匀分布,最差质量水平为0,最
高质量水平为1。任何一辆车的质量为q,必有0≤q≤1。对于质量为q的汽
车,他假定对于卖家来说,其保留价格正好是q(即一辆车质量为q,那
么卖家就要求价格不低于q才肯卖掉它);而对买家来说,对质量为q的
车的保留价格为1.5q(即价格不超过1.5q,则买家愿意购买)。
显然,在这样的市场上,如果买卖双方都知道汽车的质量,则交易
是很有效率的。对于任何一辆质量为q的汽车,其成交价格将位于q~
1.5q之间,至于究竟是多少,就取决于买卖双方的谈判能力。为了简化
分析,阿克洛夫假设买家人数超过卖家人数,因此市场成交价格将在买
家保留价格上,即1.5q。但问题是,买家并不知道汽车的质量。如果他真的支付1.5q的价
格,买回的完全有可能是一辆质量低于q的汽车。怎么样让自己不会过
于吃亏呢?读者可能想到了,按照平均质量出价。既然汽车质量是在0
~1之间平均分布,平均质量为0.5,因此买家按照1.5(0.5)=0.75的价
格购买,则看起来会购买到平均质量为0.5的车,不算吃亏。但问题也
就在这里,由于买家只愿意出0.75的价格,所以那些拥有质量q>0.75的
车的卖家就不愿卖出。所以,出价0.75的买家能够买回的车,质量将平
均分布于0~0.75之间,平均质量仅为0.375。既然如此,买家就不能出
价0.75,而只能出价1.5(0.375)=0.562 5。但是,这个出价又使得q>
0.562 5的卖家退出市场,结果市场上的汽车平均质量变为0.562
52=0.281 25;买家的出价因而最好调整为1.5(0.281 25)=0.421 875,质量q>0.421 875的卖家将退出市场,平均质量进一步下降,买家支付
价格也进一步下降……一轮一轮,平均质量和买家支付价格交互持续下
降,最终导致市场上任何质量高于0的汽车卖家都退出了市场,买家支
付的价格也成为0,即整个市场瘫痪了,或者不存在了。
阿克洛夫的例子代表了逆向选择问题最极端的结果。现实中确有这
种极端结果,比如前面提到的怀孕保险、婚姻保险这类市场最终不存在
了,就是极端结果。但就一般情况来说,并不是所有的交易都会消失,市场可能维持在一个只有低劣产品横行的状态,这样的状态就是劣货驱
逐良货──伪劣品横行,而真品却没有出路。这样的状态也是缺乏效率
的,因为有不少想买质量高一点的车的买家,将买不到高质量车;而希望出售高质量车的卖家,无法在其意愿最低价格上出售。
现实中还有另一种可能的情况则是,市场并没有跌落到完全由低劣
产品主宰的状态。因为有一些策略行动或制度安排可以传递汽车质量的
信息。比如,高质量车的卖家将有动力提供某些信号来表明自己的汽车
是高质量的,比如提供免费保修服务等,这样的信号传递是本书第4章
的主题;反过来,聪明的买家也可以通过一些机制来甄别汽车的质量,比如要求查看卖家以前的质量记录,或者要求卖家出示质量监督机构的
认证证书等,这就是信息甄别,是本书第5章的主题。
道德风险
道德风险(moral hazard)的概念最初也来自保险领域,它指的是
这样一种情况:投保人通过购买保险将风险转嫁给保险公司,自己就不
需要像未投保前那样努力控制风险。这看起来就像投保人的道德有问
题,所以叫做道德风险。比如,一个人的财产在投保之前,因为担心火
灾毁坏其财产,常常会很留意家庭的火灾隐患,因此其财产遭受火灾损
失的概率可能并不大;投保之后,虽然他可能仍会留意火灾隐患,但这
种时时留意毕竟需要付出精力、时间等代价,既然现在发生火灾有保险
公司赔偿而损失很小,他就不会如以前那样尽心留意,结果火灾隐患和
财产损失的概率增加了。投保人这种行为的变化对保险公司是很不利
的,但是保险公司却无法监督投保人的行为。甚至还有极端的道德风险
──的确是道德本身有问题──投保人投保某种风险,然后制造出该风险来骗取保险金。比如几年前《南方周末》曾报道一起骗保案件:一个男
青年为其女友投保巨额的人身意外险,然后将女友推入湖中溺死制造出
意外溺水身亡的现场,试图骗取巨额的保险赔付。
投保人通过购买保险将风险转嫁给保险公司,自己就不需要像未投
保前那样努力控制风险。这叫做道德风险。
与保险相关的道德风险在生活中频繁发生,因此道德风险这一术语
也如逆向选择一样,早已超越保险领域,成为现代经济学中的一个基本
词汇。比如,当你租赁一辆汽车,如果该车受损你要承担全部责任,与
你购买了碰撞损害弃权书(在碰撞事故后可得到保险)的情况相比,可
能你开车会专心得多。当你拿到旱涝保收的固定工资,与你要根据业绩
来获得工作相比(前者相当于接受了保险),你可能更不愿意付出努
力。有必要提醒读者,经济学使用道德风险这个术语,并不是在道德本
身的意义上使用的,道德风险问题本质上是一个信息问题。在一些知识
专业化程度很高的领域,我们常常难以判断人们的努力水平,这样的情
况下道德风险也是很大的潜在威胁。比如教师的授课,他对授课是否尽
心尽力了?医生看病,声称你的病很严重需要他付出很大努力,你怎么
判断他确实努力了?同样的还有律师对于案件的办理努力等,都是道德
风险的典型例子。
在经济生活的现实中,人们常常会设计一些合同或机制来克服道德
风险问题。比如激励报酬,即根据代理人的业绩来支付报酬,就是为了解决生产中的道德风险;不完全保险,即保险公司不提供完全赔偿损失
额度,要求投保人自己也必须承担一部分损失,是为了解决投保人的道
德风险。当存在道德风险时,如何设计激励机制,是一个有趣且充满智
慧的问题,但本书不打算讨论此类问题,因为我计划专门为此另外写一
本书。
在经济生活的现实中,人们常常会设计一些合同或机制来克服道德
风险问题。
[1]当然,现实中也存在某些包含战争风险的保险种类,比如旅行责任
险。但是保险公司能提供这种保险合同的前提,一定是客户在战争风险
方面是分散的,使得保险公司不面临逆向选择才可以实施。所以,大多
数的合同都排斥对战争风险的保险。
[2]Akerlof, G A.1970.The Market for'Lemons':Quality, Uncertainty,and the Market Mechanism,Quarterly Journal of Economics 87:488-500.逆向选择的例子
二手市场为何难火
好几年前看到一篇报道《旧车市场为何难火》,说的是专家曾预测
国内旧车市场将日渐红火,文章引用数据说发达国家的新旧车销售比例
已达1:1,而我国人均收入逐年上升,更多的人欲过把车瘾,必将把目
光投向旧车市场云云。该文认为,我国旧车市场并不红火,原因有四,即收入尚欠火候,二手车定价不准,售后服务无保证,以及中介人员乱
出手等。
当大家了解到阿克洛夫的柠檬市场理论后,相信对这个问题会有更
深刻的认识,并认识到该文章提出原因的合理或不合理成分。从本质上
而言,旧车市场难火的原因在于信息问题。买家对于质量不放心,因此
只愿支付更低的价格,而更低的价格又进一步将良质车排挤出市场;良
质车更少,则买家意愿支付价格就更低;这种恶性循环导致二手车市场
将不断萎缩。除非有某些方式来解决信息问题,使得买家可以避免逆向
选择问题,旧车市场才能真正地火起来。
同样的道理还可扩展到旧车市场之外。几乎所有的二手市场都面临
着信息问题。任何买家都会质疑,如果产品质量的确很好的话,对方是
出于什么目的要急于出售二手货呢?比如你今天购买一台新电脑,明天准备转手出售,可能价格必须便宜一半,因为买家难以相信你的电脑不
存在某种严重问题使你在购买的第二天就急于出售。事实上,当买家支
付的价格很低,如果你的电脑确实等同新电脑的价值,你也就不会出
售。所以,二手电脑市场,或者其他二手市场,都存在逆向选择问题而
使得市场难火。
读者可能会问,为什么发达国家的二手车市场似乎比我国的二手车
市场要繁荣一些。答案正在于发达国家有较为成熟的市场制度安排来克
服信息不对称所导致的逆向选择问题。比如,发达国家往往有更好的治
理交易的法律及其实施保证,形成了更高的信任和注重商誉的社会环
境,等等。无论如何,发达国家中市场机制的运行被证明比发展中国家
有效得多,因此其交易中面临的信息问题常常能够得到更有效的克服,市场也就更繁荣。
价格离散
有时,同一种商品会以不同的价格出售。这是生活中常见的一个现
象,经济学称之为价格离散。解释价格离散的最佳模型是搜索模型。经
济学家夏洛普(Salop)和斯蒂格利茨(Stigliz,2001年诺贝尔经济学奖
得主之一)就曾经假定买方具有不同的搜索成本,导致购买同样产品的
价格不同。
不过,逆向选择可以为价格离散提供另外一个解释。考虑不同品牌的立体音箱以不同价格出售的情况。顾客愿意支付高价格,是因为他们
知道高价格品牌同时包括高质量的和低质量的音箱,而低价格品牌则必
然为低质量的音箱。结果,低质量的音箱实际上可以在两个价格上出
售:与高质量音箱竞争的高价格,以及在不同商店以不同牌子出售给对
质量不大关注的顾客的低价格。
这个解释也可以刻画伪劣品和真品可以共存的现象。但是,它要依
赖于音箱的卖家具有较高固定成本或运营成本的假设。否则,低质量的
音箱一定会充斥市场,太多的低质量产品最终通过降低平均质量(而不
是价格竞争)扰乱市场,使高质量产品不得不退出市场。
财务困难企业应降低工资吗
当企业面临困难的时候,是否应该考虑削减员工的工资以改善企业
的经营利润呢?可能不少企业是这样做的。但是这会带来很大的逆向选
择问题。因为企业降低工资,那么高质量的员工就会离开企业。什么样
的工资水平吸引什么质量层次的员工,低工资只能吸引低质量的员工。
低质量的员工导致生产率更低下,反而可能会令企业的生产和经营状况
更糟糕。百年老店沃尔沃斯(Woolworth)的倒闭就是这样的例子。
沃尔沃斯是美国零售业的巨头,在美国经营了118年,是名正言顺
的百年老店。后来由于各种各样的原因导致它在1996年宣布破产倒闭。
专家认为它倒闭的原因主要有四个,一是未能顺应消费者消费习惯变化的潮流,二是零售百货业竞争加剧,三是不能满足消费者对专业化服务
的需求及个性化的审美要求,第四个原因则与我们提到的逆向选择问题
有关──在20世纪90年代,其经营面临困难的情况下,为削减开支而大
幅削减员工工资,结果导致员工队伍质量越来越差,恶化了经营的困难
形势,最终加速了公司的倒闭。哈佛商学院关于沃尔沃斯的案例中写
道:“为了减少开支,沃尔沃斯雇用了大量的临时工、季节工,这些人
大都是新移民,不具备专业服务水准,公司也很少对他们进行岗位培
训,甚至有些人还不具备英语会话能力。这些人不要说提供周到的服
务,有时连商店货物陈列的具体位置都搞不清楚,工作经常出错。当顾
客问及何种商品摆放在何处时,总是不能得到满意的回答。而且收银员
的计算能力极差,收钱经常出错,使顾客买东西时总有不放心的感
觉……”这就是财务困难降低工资的逆向选择后果。
当然,如果读者认为,财务困难的企业为了改善经营状况,就应该
大力雇用更高质量的员工,那么读者也误解了我的意思。如果超过企业
对人才质量的实际需求,雇用更高质量的人才,这种“人才高消费”政策
也是一种逆向选择,因为雇用更高能力的员工不一定对企业最合适,但
它却会耗费更高的人工成本。我要表达的意思是,企业雇用劳动力质量
的选择,将根据雇用劳动力本身的投入产出比来决定,这个决定应独立
于企业的财务状况。正如经济学家拉齐尔(E.Lazear)写道:“劳动力质
量的选择不取决于企业的财务状况……企业的财务状况只会对企业是否
愿意继续经营下去产生影响,一旦企业决定继续进行生产,那么财务状况对于企业确定成本效益最优的劳动力决策不应有任何影响。”[1]
企业雇用劳动力质量的选择,将根据雇用劳动力本身的投入产出比
来决定,这个决定应独立于企业的财务状况。
上述结论,在一定程度上也可以解释为什么公司面临经营不景气的
时候,其雇用调整政策通常是选择裁员而不是选择减薪。因为裁员可以
强令低质量的员工离开;而减薪则导致高质量员工主动离开,因为高质
量员工很容易在别处找到薪水不错的工作,而低质量员工则因为难以再
找到工作反而接受减薪留在企业中。所以,企业的工资刚性,可以说有
部分原因是为了避免逆向选择问题。
雇用中的逆向选择
在企业的雇用中,逆向选择是经常面临的潜在问题。譬如,当企业
打出广告许诺固定年薪10万元招募一个经理,那么就会导致太多年薪不
到10万元的人前来应聘。越是表现出对这份工作很有兴趣的人,就越有
可能是在其他地方拿不到10万元年薪的低质量经理。如果他是高质量的
经理,那么他就不会表现得非常看重这个招聘。甚至,更有能力,其年
薪可以在其他地方拿到超过10万元的经理,根本就不会来企业应聘。所
以,如果企业在固定薪水下招募到一个越是想来企业工作的人,其实越
有可能招募到的是一个能力比较低的人(当然,读者阅读第5章“激励报
酬的筛选作用”一节之后会发现,业绩工资不会导致这样的逆向选择),所以企业对那些越想得到工作的人,反而没有多大兴趣。
对于求职者,上述道理也有一定的行为启示:如果企业开出的是固
定薪水,那么为了让企业对你有兴趣,你反而不能表现得太急于得到这
份工作。
如果企业开出的是固定薪水,那么为了让企业对你有兴趣,你反而
不能表现得太急于得到这份工作。
当然,雇用中的逆向选择不仅表现为在员工招募中录用了不适合企
业的员工,它还有另外一种表现形式──在劝退员工时将差的员工保留
了而将好的员工劝退了。前面提到的减薪导致优秀人才流失的逆向选
择,就是后一种。拉齐尔在《人事管理经济学》一书中还提到了另外一
个例子:[2]
美国在1979年修订了就业法中年龄歧视部分的条款。这一修正所导
致的后果是,终身教授强制退休年龄从65岁提高到70岁,并且从1993年
起,最终取消强制退休的规定。大多数大学都在考虑,这样一来,占据
大学课堂的大多将是昏昏欲睡的老先生们,而不是学生所喜欢的那种博
学多才而又精力充沛的年轻教授。为了诱使这些高龄教授们自动退出讲
台,许多大学都实施了买断计划,即如果55岁以上的教授马上退休,学
校将提供优厚的养老金。有些教授接受了这种条件。然而不幸的是,大
多数情况下,这些自动退职的教授往往是大学希望挽留的,而那些拒绝自动退职的教授又常常是学校希望他们离开的那些人。
这个问题也是逆向选择问题。最好的教授离开了,是因为他们可以
轻松地在另一所大学谋到职位。比如,一个原来在斯坦福大学工作的诺
贝尔奖获得者可以接受买断计划从斯坦福大学退休,然后很快再到加州
大学伯克利分校获得另一个教授职位。但是另外一位若干年前就已失去
创造力的教授,则没有这样的选择机会;他拒绝接受买断计划,因为他
无法在其他任何大学以现在的报酬水平再找到一份工作。
逆向选择与信贷配给
企业降低工资,就可能将高质量员工排挤出企业。与此类似,如果
银行提高利率,就可能将低风险的企业排挤出潜在客户群,反而让银行
面临不利选择。这是经济学家斯蒂格利茨和韦斯(A.Weiss)曾经在一
篇论文中仔细研究过的问题。我们可以用简单的例子来说明其思想。
假设有两类借款人A和B,每类借款人都需要初始投资100万元,但
他们自己都没有投资资金,因此只好向银行贷款。A类借款人的投资几
乎没有风险,他们的投资可以确切地收回110万元,即投资回报率为
10%。B类借款人存在投资风险,其投资各有一半的机会获得90万元或
130万元。
如果银行利率为5%,两类借款人都会申请银行贷款。由于借款人
没有额外的抵押,银行面临的最坏结果是,B类投资人获得90万元时,银行也只能收回这90万元;否则,银行就可收回本息。面临这两类随机
的借款人,银行不会面临逆向选择问题。
现在假设经济中货币吃紧(即可以放贷的金额少于借款人申请的贷
款金额),银行的资金成本增加,从而银行在向随机的借款人发放贷款
时,可能会提高利率。但是,我们可以断言,其利率提高必须小于
10%。原因在于:利率一旦达到10%(或以上),则A类投资者申请贷
款实际上已无利可图,他们将放弃贷款;银行所贷出的资金将全部到B
类贷款人手中。这时候银行就遭遇了逆向选择问题。因为B类贷款人若
投资成功,则归还银行110万元本息,但如果投资失败,则仅以投资回
收的90万元承担有限责任;所以银行将承担相当的预期损失。其原因在
于,利率提高导致借款者群体的“质量”下降了。
为了避免出现这样的逆向选择问题,银行于是把利率定在相对低的
水平上。尽管根据货币供给和需求可以把利率定在10%的水平以上,结
果银行还是把利率定在10%以下。而这样相对较低的利率将使得银行避
免逆向选择问题,但是却产生了可贷款金额不足以满足借款申请人需求
金额的情况,于是银行对每个企业的贷款不都全额满足,信贷配给就出
现了。
当出现信贷配给的时候,依据什么原则来配给信贷呢?也许银行愿
意按照这样一个奇怪的原则来配给:凡是公司名称笔画为单数的企业就
可以获得贷款,为双数就不给予贷款。这样做不是有什么特别的歧视意图,而是为了回避将贷款过多地配给了高风险企业。只要公司名称笔画
数与公司项目风险之间的关系是独立的(不相干的),那么银行的这种
做法就有一定的道理,因为这避免了逆向选择。
穷人借款为何难
许多人指责银行“嫌贫爱富”。是的,穷人获得贷款要比富人难得
多。在许多发展中国家,贫困农村的金融信贷体系非常脆弱,许多穷人
得不到贷款,即使他们拥有很好的商业创意或项目,但却得到不贷款来
进行投资,当然也就难以改变贫穷的命运。这几乎是一个恶性循环:
穷,贷不到款,于是更穷,更贷不到款……
银行为什么会嫌贫爱富呢?难道就没有一家银行有一点爱心或社会
责任吗?经济学家对此有另外一个解释,问题不是出在银行有没有爱心
或社会责任,而是在于信息非对称。其道理很简单:面对素不相识且没
有借贷记录的陌生顾客,银行难以判断他的诚信程度和偿债能力;如果
银行不加区别地将贷款发放出去,那么就会造成大量的呆账坏账。所
以,银行必须借助某些手段来甄别顾客的诚信程度和偿债能力,或者想
要贷款的人必须向银行表明自己的偿债能力。而揭示一个人偿债能力的
最好指标,莫过于这个人的财产。所以,如果一个人愿意将财产抵押给
银行,银行也就乐于为他提供贷款。这样,银行就避免了将贷款大量发
放给无偿债能力借款人的逆向选择。但问题是,穷人通常没有财产可以抵押,所以穷人就更难得到贷
款。穷人当然可以承诺自己的项目一定会赚钱,而且赚钱后将付给银行
一定的利息回报。但是,银行既无法判断项目的投资收益性是否良好,也无法在没有抵押品的情况下相信穷人的还款承诺。当然,考虑到贷款
给穷人的风险很大,那么银行可以提高对他们的贷款利率,但这只会使
得那些更具风险性(因而违约率也更高)的项目才会申请贷款。银行将
面临着对自己不利的选择。
所以,很多时候,为了让贫困农民获得金融支持,往往是政府来为
他们提供担保获取贷款。即便如此,政府也将面临于己不利的逆向选
择,因为农民还不了钱或者拒绝还钱,那么政府就要背负农民的那些债
务。所以,政府担保,常常只是小额贷款,而且要求农民必须将贷款用
于农业生产,政府才肯提供担保。
同样的道理可用来解释中小企业贷款难的现象。因为中小企业也
是“穷人”,可抵押的资产太少,若银行把贷款门槛放得太低,就会面临
逆向选择问题。
银行贷款中的逆向选择很早就受到经济学家的重视。比如经济学家
伯南克就曾经用这个思想来解释美国的大萧条。[3]
解释大萧条的困难不
在于最初的股票市场崩溃,而在于随之发生的失业的持续性。伯南克认
为股票市场的崩溃弄垮了地方银行,并使信贷人员的专业知识随之损
失。在损失了专业知识之后,由于逆向选择的存在,余下的银行更不愿意出借,这就使得经济的恢复更加困难。
金融市场上的逆向选择
金融市场上也存在逆向选择问题。投资于证券的读者朋友大概都有
感受,投资者很希望了解所要投资的企业的财务状况。但是企业的财务
状况常常只有企业自己最清楚,单个投资者要获得那些信息常常代价高
昂,难以承受。由于难以区分经营有方和经营不善的企业,投资者就不
愿意购买那些不熟悉的企业股票或债券,除非有大量关于企业的公众信
息。金融市场上提供这种公众信息的常常是一些券商和投资公司等中介
机构。也就是说,只有那些经过中介机构的分析师跟踪过的企业,才可
能被投资者关注。但问题是,分析师感兴趣的企业或者分析得最多的企
业,恰恰也是投资者最关注的企业。结果是,一些影响巨大的公司随处
可以找到它们的公众信息,而且分析师也仅仅跟踪它们;一些难以找到
公众信息的企业,投资者不大关注,而分析师也不会紧紧跟踪,它们的
公众信息仍然很少,而得不到投资者关注。所以,我们会发现有些公司
可以发行股票和债券来筹资,但是有些企业却做不到这一点。
许多国家的证券监管部门,都出台了相关的监管规定以减轻信息不
对称和逆向选择问题,比如要求企业向潜在投资者提供含有企业财务信
息的招股书,这确实增加了投资者可获得的信息量,因而也促进了更多
的企业可以通过发行股票和债券来筹资。但是,金融市场的信息问题仍
然很严重。在20世纪90年代,全球股市繁荣,投资者变得掉以轻心,更乐于投资所知甚少的企业;随着投资者对股价的关注,企业的压力也增
加了,它们不得不报告说自己赚取了与投资分析师预测的一样高的利
润。公司报告的利润一旦低于投资分析师的预测水平,其股价就会出现
大跌。结果,一些公司管理层“不得不”造假,夸大自己的利润。并最终
在新世纪之初,形成蔓延全球的系列公司丑闻。
送上门的没好货
逆向选择问题不仅存在于商业活动,日常生活中也经常会遇到。比
如,当你周末在家休息,突然有推销员来敲你的房门,推销其公司的新
产品。你会购买他的产品吗?如果这位推销员非常热切地想把产品推销
给你,你难免要想一想他为什么这么热切地想推销给你。他可能会说,这是公司试销阶段,只需要支付少许成本费。但是,如果你真的聪明,就不应该相信他的话。原因很简单,如果仅凭他这样的几句描述就可以
证明他帮你谋得了好处,那么劣质产品的推销员也可以同样方式来欺骗
你。当你考虑到可能遭受劣质产品推销员欺骗的时候,你对推销员的信
任就会下降,那么真正高质量产品的推销员就不会尝试以同样的方式来
拜访你。所以,你只能购买到劣质的产品,或者花掉冤枉钱。这就是逆
向选择。
送上门的没好货,这一思想可以扩展到生活中很多的领域。当你到
商场去购买一件物品,如果在某个价格下店员非常热心地劝你购买,那
就意味着你的出价很可能太高了。相反,如果你出的价格让她觉得比较犹豫,说明你的价格基本到位了。店员越是纠缠你要求加一点价,那么
你加价就越应慎重,因为只有你的出价让她觉得有利可图,她才会愿意
花时间与你费口舌。如果你的价格让她都没有兴趣跟你继续谈,那么你
应该考虑加价,否则就会陷入逆向选择。当然,有的读者朋友会质疑,既然如此,那店员完全可以在你给出一个高价时仍表现出一副毫无兴趣
的样子来引诱你继续加价。这种情况是有的,但是就大多数情况来说,除非你表现出迫切希望得到这个物品,否则店员也不会冒卖不掉商品的
风险来诱导加价。
所以,越是对你热情的人,越需要保持谨慎。当然朋友之间的热情
可能是例外。当你某一天接到一个投资专家的电话,希望为你提供代理
理财。他可能会吹嘘他有多么成功的业绩,但是你应想到一点:如此成
功的理财代理,会有时间突然给你越是对你热情的人,越需要保持谨
慎。
这样根本没多少钱的人打电话?或者,他居然很在乎得到你这么一
点为数不多的投资?如果一个打电话给你的理财代理说得天花乱坠,几
乎就要让你相信他,那么我的建议是,还是不要相信他。因为他的口才
太好了,也许他本身只是一个很有鼓动性的推销员,而不是一个优秀的
理财代理。
为什么不允许选择不知道读者朋友有没有逛蔬菜瓜果市场的经历?我虽很少去逛,但
偶尔有空的时候也会陪太太去买菜。在市场里,可以很容易发现某些水
果或其他物品是事先装袋并明码标价的;或者虽然事先没有装袋,但是
卖家不允许买家进行挑选,如果要挑选则要提高单位售价。这是什么原
因呢?
一种非常直观的解释可以是:有些水果不适宜太多翻动,比如樱
桃,如果挑选行为太多可能会导致樱桃被弄伤,不好看也不好卖。这固
然可以成为原因之一,但还不能解释全部的原因。有些干果(如花生)
和水果(如苹果),翻动次数基本上不会影响其外观和内在质量,但是
也不允许挑拣;而有些干果(如核桃)和水果(如西瓜)则允许挑拣。
这是为什么?
更好的一种解释是卖家为了避免逆向选择问题。花生、苹果之类,虽然挑拣行为不影响其外观和内在质量,但是每一粒花生、每一个苹果
的内在质量是可以直接观察到的,而卖家的定价是按照其平均内在质量
给出的,因此不允许挑拣,卖家就可以平均质量的价格卖出平均质量的
物品,不会吃亏。如果允许挑拣,那么人们挑拣购买的物品质量将超过
待售物品的平均质量,若他们还支付平均质量的价格,卖家就会亏损。
所以,卖家不会允许买家挑选,如果买家非要挑选就必须支付高于平均
质量价格的价格。
相反,核桃、西瓜之类,其内在质量不可直接观察,买家难以使得挑选出的物品之平均质量超过待售物品的平均质量,卖家便不会亏损。
或者,不排除有些非常有经验的精明买家,他们的确可以使得自己挑选
的核桃或西瓜比待售的核桃或西瓜平均质量要高,而他们也只付出了待
售物品的平均质量价格,所以他们赚了;但是只要不是所有的买家都有
此识别能力,那么卖家也不会亏损,因为被挑选之后的核桃和西瓜平均
内在质量难以观察,那些没有经验的买家无法得到额外的信息来修正待
售物品内在质量的信念,所以他们还是支付平均质量价格(这会使他们
成为亏家)。实际上,存在有经验的买家和大量无经验买家的时候,允
许对核桃、西瓜之类难以观察质量的物品进行挑选,卖家也并不亏损,有经验买家的额外赚得只不过是无经验买家的额外损失而已。
有经验买家的额外赚得只不过是无经验买家的额外损失而已。
恋爱兵法
甚至在男女婚恋关系中,也面临着一些逆向选择问题。社会长期演
化出的习俗是男孩追女孩。在这样的习俗中,如果女孩反过来追求男
孩,其实男孩应该小心一点,你尤其需要分析女孩为什么要违背习俗来
追你。是真的为了爱情,怕你被其他女孩捷足先登,还是看中了你的其
他某一方面?
一个一无所有的男孩,常常无须为这些问题发愁,原因在于他一无
所有,追他的女孩除了看中他本人之外还能看中什么呢,所以他不大会面临逆向选择问题。
但是一个拥有显赫家世或殷实财富的男孩,就不得不考虑女孩究竟
是爱他本人还是爱他的家世和财富。既然那么多女孩都向往嫁入豪门,富家子弟当然也很明白越是主动出击的女孩往往也是嫁入豪门动机最强
烈的女孩,他如果足够聪明,显然就不会相信她们。一个需要他千辛万
苦追来的女孩,显然比一个直接投怀送抱的女孩更不可能是因为家世和
财富而嫁给他。原因很简单,即使一个看重其家世或财富的女孩故意让
他追得辛苦,但这实际上也使女孩面临失去对方家世和财富的风险,一
个敢于冒这个风险的女孩和直接投怀送抱不敢冒这个风险的女孩,我相
信前者看重男孩家世和财富的程度更低。
也许,一个女孩喜欢上一个富家子弟,但为了表明自己喜欢的是富
家子弟本人而不是其家世背景,需要刻意冒失去富家子弟的风险,这也
是一种不得已而为之的策略。这与前面提到的找工作有点类似,你若希
望企业对你有兴趣,就不应表现得太急于获得这份工作;同样,一个女
孩希望富家子弟对她有兴趣,就不要太急于投怀送抱。所以影视电影中
我们经常看到王子和灰姑娘的爱情总是要经历很多波折,而且很多波折
的原因是灰姑娘的逃避所致,看来这些影视作品是有生活和理性基础
的。
写到这里,我想起不久前看的贺岁电影《鸿运高照》。最后有个情
节与这里的道理一样。女主人公苏倩倩最终爱上了男主人公侯翔。侯翔也喜欢苏倩倩,但是侯的家人和朋友告诫他,苏倩倩是不会真心喜欢侯
翔的(因为侯翔说话口吃,在婚姻市场上是滞留品,曾经相亲多次都没
成功,他的家人和朋友怎么能相信聪明漂亮的苏倩倩会爱上他呢),她
只是为了获得侯的欢心后将与其一起中奖得到的房子归入她的名下。所
以,这里侯翔不能判断苏倩倩是爱上他本人还是盯着那套房子,他就很
犹豫,不能做决定。聪明的苏倩倩最后用了我们这里所提的险招──她
把房子钥匙还给了侯翔,并且将房子的所有权也过户给侯翔,然后让侯
翔选择留住她或者放弃她。这样做的风险在于,如果侯翔真的放弃了,那么苏倩倩就会人房两空,如果不是真的爱侯翔,她不这样冒险至少可
以保留一半的房屋产权。所以,这个举动可以表明她是爱侯翔本人的。
而侯翔也正是从苏倩倩的险招中,明白了倩倩的心意,两人终成眷
属。[4]
当然,富家子弟避免逆向选择也有其他的方法,这个社会演化出门
当户对的婚嫁习俗,可能也与避免逆向选择有关系。如果女孩本身的财
富越多,她就越不可能为了财富而嫁。不过,反过来,有家世的女孩也
面临着逆向选择问题,因为她无法识别男孩是因为爱其本人还是其财富
而追求她?她避免逆向选择的手段,与富家公子一样,要么就依靠门当
户对,对方财富越多就越不可能因财富而娶自己;要么就是主动出击,她因自己的财富可以令男孩明白她不是因财富而追他,但是一个为了表
明自己并非是为了爱其财富的男孩,现在也有必要冒险让她追得辛苦,就像灰姑娘让王子追得辛苦一样。社会演化出门当户对的婚嫁习俗,可能也与避免逆向选择有关系。
看来,婚姻的门当户对本身是有助于解决信息问题的。一旦富家公
子或富家小姐要追求一门不满足门当户对的爱情,他她获得真爱的过
程就会因为信息问题而更辛苦;如果这个过程一点都不辛苦,那么他
她的爱情在真爱的程度上可能就会打折扣。当然,从小就青梅竹马的除
外,因为在漫长的成长过程中,已然获得对方是否真爱自己的丰富信
息。不过,若非门当户对,恐怕也难青梅竹马。
政治选举的悲哀
在政治领域,也有很多潜在的逆向选择问题。
人们通常认为,现代社会的民主选举政治比君主政治体制要好。是
的。但是,民主选举政治也有其悲哀之处,那就是它可能导致逆向选择
──人们本来希望选举出真心为公、不贪恋权力的政治家,但结果选举
出的常常是最热 ......
董志强 著
ISBN:978-7-111-25320-4
本书纸版由机械工业出版社于2009年出版。电子版由华章分社(北京华
章图文信息有限公司)全球范围内制作与发行。
版权所有,侵权必究
客服热线:+ 86-10-68995265
客服信箱:service@bbbvip.com
官方网址:www.bbbvip.com
新浪微博 @言商书局
腾讯微博 @bbb-vip目录
献给女儿多多
前言
引子
引言 理解有限信息
不完全信息
非对称信息
共同知识
有限信息下的策略行为:本书的内容
读者与我之间的博弈
关于阅读本书
与上帝博弈:概率决策
概率与信息推断
与上帝博弈
面对不确定性的制胜策略
应对风险的策略
友好提示
非对称信息博弈
逆向选择和道德风险:基本思想
逆向选择的例子道德风险的例子
察觉蛛丝马迹
友好提示
信号传递
基本思想
商业中的信号
生活中的信号
历史和政治中的信号
生物界的信号
其他的信号策略
友好提示
信息甄别
基本思想
商业和经济中的信息甄别
历史、政治、传说故事中的信息甄别
生活中的信息甄别
友好提示
结束语 有限信息的代价
附录A 有限信息博弈:略带技术性的简说
概率常识
贝叶斯博弈(不完全信息静态博弈)不完美信息扩展式博弈
参考文献献给女儿多多
她几乎是伴随本书而来。因为她,本书的完成时间被一再推后。毕
竟她才是我最骄傲的作品,对我更加重要……
我也希望她将来可以懂一点博弈论,以便更好地理解世界,而不是
盲目地批判世界;更理性地融入社会,而不是局限于关注自己;希望她
学会在一个互动的社会里如何尊重他人,如何影响他人,如何遵守游戏
规则,如何做一个理性的现代公民。先安排出版。
薄的一本,考虑到书的厚度以及读者的等待时间,我决定将这部分内容
弈》。现在当我写完不确定选择、信号传递和信息甄别之后,又已是不
是仅仅写毕完全信息博弈就已是厚厚一本,于是就先出版了《身边的博
富、体系庞大。就像我当初本来只想写一本博弈论通俗读物一样,结果
与不完全信息博弈有关的内容都包括进来。结果是越写越觉得内容丰
本书中把不确定选择、信号传递、信息甄别、道德风险、拍卖和竞赛等
应该说,我并没有彻底完成对读者的承诺。我曾经以为,我可以在
言。更多电子书关注
友的亏歉心情才平抑了一些。许多的感想也使我将写下一篇长长的前
转眼一载半的光阴就过去了。直到今天,开始坐下来写前言,对读者朋
为种种原因(主要是孩子的出生和工作的繁忙),写作计划一拖再拖,《无知的博弈:有限信息下的生存智慧》)何时出版,这让我愧疚。因
问,我曾经答应的第二本书《有限信息下的生存智慧》(即现在这本 勉励,或是指出书中的印刷错误,这很让我感动。也有一部分读者在追
曾经有很多读者朋友,在读过《身边的博弈》后来信问候、讨论、弈论的通俗读物。
本书是《身边的博弈》的续篇,是一本面向大众普及不完全信息博
前言本书的主题就是有限信息下个人的策略行为,以及基于有限信息下
的策略行为来理解社会现象。在我们的日常生活中,时时刻刻都需要做
出一些重要的或不重要的决策,而且绝大多数决策所面临的信息是相当
有限的。这种有限信息约束既有自然的原因,也有人为的原因。自然的
原因在于这个世界是不确定的,我们无法确切控制一个行为的所有后
果;人为的原因在于竞争的个体会有许多谋略行为,他们会尽量披露或
探测对自己有利的信息、隐藏或阻止对自己不利的信息,甚至故意制造
不确定性进行信息干扰。所以有限信息下的策略考量将更为复杂,当然
也更有趣。而本书或许有助于让读者明白:我们应如何与上帝游戏,而
不是被上帝游戏?如何在有限信息条件下与他人展开竞争与合作?如何
理性地融入到一个互动的社会之中?
当然,即使一个人不曾阅读本书,甚或对博弈论毫无所知,我相信
他也可以从个人的本能和生活经验中获得上述问题答案。一个从来没听
说博弈论的人,并不会妨碍他成为一个策略高手。就像鸟儿不懂空气动
力学,却仍然可以展翅高飞一样。既然如此,本书对于读者的意义又在
哪里呢?一个实用性的意义也许在于,发展出更好的策略将有助于个人
更有效率地追求成功。一个不那么实用的意义也许在于,我们对于世界
充满好奇,希望知道许多现象的原因,满足求知的欲望。估计大多数关
注本书乃至关注博弈论的朋友都是为着这两种目的。不过,我也想提醒
读者朋友们,了解博弈论还有另外一个重要意义,那就是博弈论经济学
家梅尔森(2007年诺贝尔经济学奖得主之一)曾说过的:对于矛盾冲突的理解,有助于建设一个更加和平美好的社会。本书通过大量的例子要
说明的,正是透过博弈论的视角如何观察世界、思考生活。是的,博弈
论可以帮助我们从个人行为更好地理解社会的秩序,理解人与人之间的
矛盾和冲突,有助于人们更理性地融入社会。我也想告诉读者,博弈论
不是阴谋诡计,不是厚黑学。所以,我希望购买本书的读者,是为着追
求阅读的享受、追求生活的愉快、追求头脑的智慧而来的;如果有人是
为了参悟权谋局道而购买本书,我只好对这些读者表示抱歉:对不起,本书可能令你失望了。
本书──《无知的博弈:有限信息下的生存智慧》标题中的“无
知”,本意固然是指缺乏信息或面临有限信息约束的无知状态,但也未
尝不想表达如下意思:在“博弈”一词被大量滥用的当代,许多大谈博弈
的人并没有真正理解博弈论;他们或许精通博弈之“术”,却对博弈
之“道”知之甚少。本书的核心内容可以概括在“机遇、信号、真相”这三
个词中。其中“真相”一词,大概也有另外一层意义:许多看似简单的现
象,其背后可能都另有真相。特别是,我们从历史和现实中见到的许多
看似不合理的现象,一旦考虑有限信息和策略行为,它们可能恰恰是非
常合理的。所以“真相”在本书也代表着对世事的洞察。
在本书之后,我还有写作计划吗?肯定的,至少我还得把涉及隐蔽
行动的有限信息博弈那一部分写完,才算对读者有一个比较完整的交
代。另外,博弈论在最近20年发展和应用也很迅速,演化博弈、行为博弈,这些都很值得向普通的读者介绍;用博弈论解读历史和社会,未尝
不是一个好的写作议题。但是,对于后续的书,读者可能需要耐心等
待。其中的原因主要有两个:其一,经过这两本书的经验,我发现不能
事先承诺写什么内容,更不能承诺完成的时间,因为一下笔,不知不觉
就是厚厚一本,那些议题不知道要写到何时才完。那么,就让我在以后
的岁月中,慢慢地来奉献给大家吧。既然写书对我来说是一件很快乐的
事,请读者允许我把这个快乐能够保持得更长一些。其二,作为一个跻
身学术界的年轻人,我的确需在提高自身学术素养方面配置更多的时间
和精力。也就是说,我只能把创作通俗读物当做一种业余爱好。所以,后续的普及性读物只能一点一点地抽取余暇时间来完成。
任何一本书的背后,都可以列出一串长长的需要致谢的名单。一个
人一生中也会有很多人值得感谢。我首先要感谢小汤,没有她我就不会
有念头写一本博弈论的通俗读物,也就不会有蒙读者厚爱的《身边的博
弈》。女儿多多的来临,使本书的完成时间往后推移了不少,因为对我
来说,她最为重要。
我感谢蒲勇健教授,他在我攻读硕士和博士的五载岁月中给我很多
精神关怀和物质支持;师恩重于泰山!感谢韦森教授,他对《身边的博
弈》的评论让我感觉到创作科普读物的社会价值。按照博弈论大师鲁宾
斯坦(A.Rubinstein)的看法,如果说经济学有作用的话,那可能就在
于经济学理论与寓言故事一样,都是在影响文化。写作通俗的普及读物,显然是经济学者影响文化的另一种方式。感谢聂辉华博士,他是一
位志向远大、心忧天下的青年才俊,他在评论《身边的博弈》时有一段
话值得读者谨记:“学习博弈论的目的是什么?如果是学会如何运用博
弈论进行个人决策,那么我认为这只是博弈论的‘术’而非‘道’。博弈之
道,在于让人们学会在一个互动的社会里如何尊重他人,如何影响他
人,如何遵守游戏规则,如何做一个理性的现代公民。”
我也要感谢机械工业出版社辛勤而负责的编辑,因为他们的努力而
使本书增色不少。感谢我的学生罗子俊,他在赴美留学前夕的紧张日子
里通读了本书的手稿,仔细校订了错漏和笔误。不过,任何一本经过精
心校对的书,倘若读者仔细阅读,一定都还能找出几处错误来。本书也
不例外。所以我把继续找出隐藏至深的错误这一艰巨任务就留给读者
了,若你们发现错误,欢迎写信到我的邮箱(d_zq@163.com)告诉
我。
最后,我也衷心感谢这一路走来给我关心和支持的师长、同行、朋
友和各位读者朋友。需要感谢的人太多,难以尽列,但我在心底衷心地
祝福他们幸福安康。而我在前行的道路上,对他们永怀感恩之心。
董志强
2008年9月24日引子
你是否知道下面这些问题的答案?
·为什么在某些竞争场合最好不要第一个登台?
·为什么二手市场难以红火?
·为什么沉默也可成为有力的声音?
·为什么人们要在玫瑰花最贵的情人节购买玫瑰花?
·为什么困难企业要裁员而不是减薪?
·为什么有些很闲的人也总是说“我很忙……”?
·为什么越高贵的礼仪越烦琐?
·为什么官员有时会把自己置于过度危险的境地?
·为什么上级有时会更信任一个明知有腐败行为的下属?
·为什么健壮的雄孔雀反而会有更为笨重的尾巴?
·为什么企业常常以低价发行新股?
·为什么欧美国家的大学对教师实行“非升即走”的雇用政策?·为什么应该让穷人住破房子?
·为什么女孩约会常常迟到?
·为什么有效率的上级也常常拖延给下级的拨款?
·为什么现代社会中我们从来不缺朋友却又常常有孤独和疏离感?……
“求知是人类的本性。”这是亚里士多德《形而上学》开篇的第一句
话。我猜想,读者朋友大概也想知道这些问题的答案,洞察世事的真
相。
那么,就从这里开始吧。本书提供的答案不一定是绝对正确的;但
你也许会同意,它确实提供了一种有价值的思考视角。引言 理解有限信息
理性乃人生之指南与明灯。
──查尔斯·狄更斯(Charles Dickens)
当一个出色的策略家总比当一个蹩脚的策略家要好些。
──迪克西特(A.K.Dixit)
决策需要信息,但几乎所有需要决策的场合,我们都只掌握着有限
的信息。比如,在游戏中,我们不能确切地知道手中的牌能否通行;在
购物中,我们不能确切地知道产品质量是否良好;在恋爱中,我们不能
确切地知道恋人爱自己有多深;在政治中,我们不能确切地知道对手支
持势力的多寡;在军事中,我们不能确切地知道敌人的实力和进攻路线
的选择……总之,自然的和人为的不确定性,使我们几乎所有的决策都
面临着有限信息的约束。
在有限信息约束下,我们如何与上帝(老天爷)作斗争?我们如何
与他人(对手)展开竞争或合作?博弈理论为什么可以帮助我们改善某
些决策?本书试图为此提供一些答案。不完全信息
这个世界上,有太多的事件及其结果超越了人类知识和能力所能控
制的范围,使我们不能完全确定我们行为的后果。是的,世界不确定;
上帝是一个赌徒,他在不断地掷骰子!
在这样的不确定环境中,我们如何做出自己的决策?
一种简单的应对办法,也许是胡乱地选择一个行动方案──反正结
果不确定,那么我们何必要认真选择?!我不知道读者朋友是否会认同
这种不负责任的选择行为,但的确有人是这样做的。比如日常生活中,在面临多种选择而不知所措的时候,经常有人通过抛硬币来确定他们的
选择。
应当承认,在某些时候,抛硬币未尝不是一个好办法。至少它使得
那些犹豫不决的人们为自己的选择找到了一个理由,从而可以获得内心
的安宁。但绝大多数时候,从理性的角度来看,抛硬币的确不是一个好
办法。比如,当你接到面试通知并允许你选择第几个上场的时候[1]
,或
者在比赛中有权选择比赛顺序的时候[2]。
虽然我们对自己的一个特定行为所产生的具体后果很难确定,但是
我们常常可以对各种结果发生的可能性加以估计。是的,尽管世界是不确定的,但许多事件重复发生的频率,或者我
们的经验,或者我们所见到的他人经验,常常可以帮助我们建立起关于
某个随机事件各种结果出现机会的信念。这个信念就是通常所说的可能
性(possibility)或概率(probability)。虽然我们对自己的一个特定行
为所产生的具体后果很难确定,但是我们常常可以对各种结果发生的可
能性加以估计。基于这样的信念,我们应可以做出对自己更为有利的选
择。
面临不确定环境的选择,本身只是一个单人决策的问题。如何将这
个单人决策的问题转化成博弈问题呢?我们的做法是引入一个虚拟的参
与人“上帝”(有些著作里称这个虚拟的参与人为“自然”,或者“机
遇”)。上帝无所不能,所以他一定能控制他掷出的骰子。当他掷出骰
子的时候,我们不知道骰子会出现什么数字,但是万能的上帝一定知道
会出现什么数字;他一定也知道如何掷骰子才能获得想要的数字。每一
次,上帝在掷出骰子之前就已经确定了一个数字,但是我们却只有在他
的骰子停下来的时候才知道上帝事先已确定的数字是几。问题是,我们
的决策是需要在他的骰子停下来之前做出,所以我们得费心地猜测上帝
在掷出骰子之前究竟选了哪个数字。不确定环境下的决策,就转变成决
策者个人与上帝之间的博弈。上帝对决策者的信息无所不知,而决策者
却不知道上帝内心的选择。所以,经验以及对各种结果可能性的估计,对于决策者来说非常重要。我们不必认为博弈局势中的上帝是在各种可能的结果之间随机选
择;其实在博弈局势展开之前,上帝就率先选定了某个事件的结果,只
不过我们并没有观察到上帝的选择而已。
显然,博弈论为不确定性决策问题提供了另外一种分析视角。我们
不必认为博弈局势中的上帝是在各种可能的结果之间随机选择;其实在
博弈局势展开之前,上帝就率先选定了某个事件的结果,只不过我们并
没有观察到上帝的选择而已。于是,我们就只能根据自身的知识和经
验,来估计上帝有多大可能选择了哪一种结果。
这样的一个视角转换,在博弈论中被称为海萨尼转换。在20世纪60
年代末期以前,博弈论对于不确定环境或信息不完全的局势分析是无能
为力的,后来海萨尼[3]
提出了海萨尼转换──即增加一个虚拟的参与人
(就是我们这里的上帝),将不确定结果转化为上帝做出了确定的选
择,但人们没有观察到上帝的选择──这才克服了分析技术上的困难。
所以现代博弈论将不完全信息等价于参与人没有观察到上帝的选择。
[1]可参阅第2章“怎样最大可能获得最好的女孩”一节末尾。
[2]可参阅第2章“应该先与谁赛”一节。
[3]约翰·海萨尼(John Harsanyi,1920──2000)是一个优秀的博弈论
专家。他生于匈牙利布达佩斯,从小按照父母的意愿成为了一个药剂
师。1944年,他被纳粹遣送到集中营,后来逃脱,在一个信仰耶稣的修
道院隐藏了一年,并开始学习哲学。1950年,他与未婚妻冒着危险非法穿越边境的沼泽地,逃离匈牙利,辗转到澳大利亚,后来再到美国。
1959年他获得斯坦福大学博士学位,1964年在加州伯克利任教。海萨尼
对博弈论兴趣浓厚,对不完全信息条件下的理性推理做出了巨大贡献。
1994年,他因为对博弈论经济学的贡献获得了诺贝尔经济学奖。非对称信息
一个人若不能观察到上帝的选择,那么他面临的信息就是不完全
的。在一个博弈中,有可能全体参与人都未曾观察到上帝的选择,那么
该博弈中的信息虽不完全,但却是对称的──因为全体参与人之间,谁
也不比谁掌握着更多或更少的信息;或者说,任何人都没有信息上的优
势。
但大多数时候,参与人之间的信息是非对称的;一些人观察到了上
帝的选择,而另一些人却没有观察到。那些观察到上帝之选择的人,就
成为信息优势方;而未能观察到上帝之选择的人,就成为信息劣势方。
利用博弈论分析人们行为的时候,我们常常需要确定:
·谁是相关的人?即哪些人参与到了博弈之中。
·他们可以做出什么样的选择?即每个参与人的行动空间包含了哪
些行动。
·他们的目标是什么?即每个人有其关心的赢利(payoff)。
·他们知道什么?即每个人掌握着什么样的信息。
不完全信息尤其是非对称信息对于策略行为及其结果影响至深。这里,参与人的信息结构深刻地影响着各方最佳策略的选择。不完
全信息尤其是非对称信息对于策略行为及其结果影响至深。举个简单的
例子来说,在一个狭窄而只能单人通行的过道里,一个老师和一个学生
遭遇了。若双方拥有完全信息,知悉彼此的身份,我们就很容易推测这
个过道博弈的均衡结果将是学生让老师先行(因为社会中有尊师的礼仪
规范)。倘若信息不完全,比如学生对老师的身份并不清楚(可以考虑
为上帝给老师选择了老师的身份,老师观察到了上帝的选择而知道自己
的身份,但是上帝的选择却没有被学生观察到),这时学生需要评估对
方属于老师的概率,如果他认为对方属于老师的概率很小,那么他可能
就不会礼让老师先行;而如果老师知道学生对其教师身份的信念概率很
低,那么老师也就不会试图享受先行通过。结果学生先行通过而老师后
通过的结果也将是均衡结果之一。
需要说明的是,信息非对称并不必定要求信息不完全。譬如,员工
的努力水平是员工自己选择的,员工自己知道,但是老板并不能观察到
员工的努力选择。此时,有关努力水平的信息在员工和老板之间也是非
对称的,但这种信息非对称并不属于信息不完全的情况。因为信息不完
全一定是跟上帝的选择不可观察联系在一起的。在没有上帝参与的博弈
中,一切是确定的,如果存在不能观察的参与人行为,那么博弈就被称
做是不完美信息的,而不是不完全信息的[1]。
[1]对于有意深入钻研博弈论的读者,注意到不完全信息和不完美信息之间的区别是有好处的。在信息完全但不完美的博弈中,策略组合的结果
是确定的。倘若这样的博弈出现在委托人和代理人之间,并不会产生道
德风险,因为委托人最终可通过结果对代理人行为进行完全的推断来设
计报酬合同。道德风险虽然与行动不可观察有关,但也一定要有某些随
机的影响因素(即仍需要上帝采取行动)时,才会出现。其中的道理很
简单,如果没有上帝行动,代理人将不能为自己的道德风险行为找
到“替罪羊”,他也就不能有道德风险。如果上帝也在行动(信息不完
全),代理人行为不可观察,那么代理人就可以把自己道德风险行为导
致的不良后果归罪于上帝,而委托人也将无法从博弈结果来准确推断代
理人的行为,因为博弈的结果没有提供推断博弈行为选择所需要的充分
信息。共同知识
师生过道博弈的分析中,其实还暗含了一个假定:学生认为对方属
于老师的概率很小,而老师知道学生认为其属于老师的概率很小,而学
生知道对方知道自己认为对方属于老师的概率很小……如此反复以至于
无穷。换句话说,学生认为对方属于老师的“概率”很小,这里的“概
率”本身是学生和老师之间的共同知识。
所谓共同知识,就是各博弈方在无穷递归意义上均知悉的事实。
所谓共同知识,就是各博弈方在无穷递归意义上均知悉的事实。即
每个人知道事件E,每个人知道每个人知道事件E,每个人知道每个人
知道每个人知道事件E……一直到无穷层次。这是博弈论中一个限制性
极强的假定。现代博弈论的一些新成果表明这个假定可以被放宽而不至
影响分析的结果。但是在本书的许多地方,仍然坚持这个假设,以便在
表述上可以更为简单。有限信息下的策略行为:本书的内容
一旦信息不完全,或者人们只获得有限信息,博弈就将变得更具吸
引力,也更有趣。因为有限信息对人们的理性推理提出了更高的要求;
人们也总会不断地通过操纵信息来谋取更大的好处;而就在人们操纵信
息的行为中,又往往蕴涵着某些信息,使得他们的对手可以根据这些新
增的信息更新其信念;对手信念更新导致的策略变化反过来又会影响人
们的信息操纵行为……最终,人们行为在均衡状态不仅需要满足策略的
均衡,也需要满足信念的均衡。这里需要用到的理性推理比完全信息博
弈要深入得多。完全信息博弈,只需浅层次的策略互动;不完全信息博
弈,则涉及策略和信念双重互动的深层谋略。
完全信息博弈,只需浅层次的策略互动;不完全信息博弈,则涉及
策略和信念双重互动的深层谋略。
总的说来,有限信息下复杂的理性推理大致可归纳为如下几种情
况:
·与上帝博弈。即个人面临不确定环境时的决策。这本属于决策理
论的内容,但由于不确定环境可以看做上帝确定地选择某个结果而个人
没有观察到上帝之选择,从而决策问题可转化为上帝先行的不完美信息
动态博弈加以分析,纳入博弈分析之中。·信号传递和信息阻止。在信息非对称的情形,某些时候信息优势
方会发现披露其私有信息对自身更有利,于是他就会尝试通过发送某些
信号来披露其私有信息。如果获悉优势方私有信息本身对信息弱势方有
利,那么信息弱势方就会欣然接受信号;但如果获悉优势方私有信息反
而会使弱势方处于被动状态,那么弱势方就会尽力阻碍对方的信号传
递。
·信息甄别和信号干扰。在某些非对称信息情形中,信息弱势方有
动力设法提取信息优势方的私有信息,这就是信息甄别。但是,如果私
有信息被对方获悉对优势方本身不利的话,那么优势方就极有可能进行
信号干扰和隐藏信息,使得对方难以提取出有效的信息。
·道德风险和激励。在某些信息非对称情形,比如委托-代理关系
中,代理人(agent)的努力不可观察,同时产量又受到随机影响的时
候,代理人就有可能采取出工不出力的机会主义行为。此时,委托人
(principal)往往会采取相应的合同去刺激代理人的努力。
·拍卖和竞赛。这是不完全信息博弈理论一个重要的应用领域。拍
卖和竞赛理论刻画了这样的现实,许多时候,人们为共同的目标在展开
竞争,那么他们最佳的出价策略是什么?拍卖或竞赛的组织者又如何可
以通过设计恰当的拍卖或竞赛机制来获得最大的好处?
上述五种情况之中,前三种属于隐蔽信息(hidden information),博弈的问题主要产生于难以了解对手的类型。这里的类型,是指对方所
掌握的私有信息。后两种属于隐蔽行动(hidden action),博弈的问题
主要产生于不能观察到对手的行动。考虑本书的篇幅以及我个人的写作
速度(也就是读者需要等待的时间),本书专注于隐蔽信息问题,即前
三种情况。具体地:第2章介绍如何与上帝博弈,即如何在不确定环境
中做出优化决策;第3章总体介绍不完全信息博弈,通过例子刻画不完
全信息博弈的两大问题──逆向选择和道德风险;第4章讨论信号传递策
略,即博弈参与人怎样向对手披露对自己有利的信息,本章也附带讨论
信号阻止、信号干扰、信息隐藏等其他操纵信息的策略;第5章讨论信
息甄别,即博弈参与人如何设计一些甄别机制来获取对手的私有信息
(类型),探测对手的真相。
至于那些隐蔽行动的有限信息博弈,值得另外写一本厚厚的书来专
门介绍。我已把它列入未来的写作计划之中。读者与我之间的博弈
本书实际上是拙著《身边的博弈》(董志强,机械工业出版社,2007)的续篇;我很感谢读者朋友对于那本书的喜欢和抬爱。某种程度
上,那本书是我这本书的一个质量“信号”。在购买和阅读一本书(包括
这本《无知的博弈:有限信息下的生存智慧》)之前,你对该书质量信
息的掌握是相当有限的,所以你完全有可能面临逆向选择问题──付了
钱,得到的却是糟糕的结果。
所以,在决定是否购买本书的时候,你就已经遭遇了本书所要讨论
的有限信息博弈问题。既然你我之间就本书达成买卖的合作对我是件大
有好处的事情,所以我会尽量寻求一些“信号”来证明本书的质量。而
你,当然也会寻求一些筛选指标来甄别本书的质量,以避免做出对自己
不利的选择。
比如,我绝不会随便选择一家普通的出版社,而是要选择最有声望
的出版社,因为我知道你很清楚这样一个事实:越有声望的出版社,越
不可能出版一本糟糕的著作来破坏自己在漫长岁月中树立起来的招牌。
我也不会允许出版社以随便的态度出版这本书,我会提出很多苛刻的要
求,给他们的工作增添很多麻烦,这些要求和麻烦最终会在本书的封面
设计、内容排版、印装质量等细节方面体现出来,因为我知道你也会从
这些细节来判断作者对本书的自我评价以及出版社愿意为这本书下多少“赌注”。当然,我也不会忘记告诉你,《身边的博弈》就是我写的;
因为我知道人们总是喜欢用一个商家的某种产品质量去推断该商家其他
产品的质量[1]
,《身边的博弈》既然得到了读者们的认可,那么它就不
失为本书质量的一个好广告,我当然不能错过每一次提到它的机会。
在事情的另一面,我赖以传递信号的一些手段,恰恰也是你进行信
息甄别的一些手段。你在买书的时候会考虑出版社的声誉,会考虑书的
设计和印刷质量,会考虑是谁写的书,因为这些信息都有助于你对书籍
质量进行判断。
明白上述这样一些道理,并不需要专门学习有限信息博弈理论。你
不读本书也会知道这些道理,这是因为生活的经验给予了我们一些本能
的博弈技巧,我们有意无意地都在运用这些技巧。不过,如果你愿意翻
开本书,你就会发现,我们不单可以把这些本能的博弈技巧模式化,而
且基于博弈理论我们还可以解释某些令人困惑的现象──它们本质上与
我们本能的博弈技巧一样,但是却不如本能的博弈技巧那样容易被直观
地感受。之所以人们对理论孜孜以求,也正是因为它的确有助于我们洞
察种种奇怪表象背后的真相。这也许就是博弈论的“实用性”用处之一
吧。
我们不单可以把这些本能的博弈技巧模式化,而且基于博弈理论我
们还可以解释某些令人困惑的现象。[1]为什么人们做这样的推断通常是合理的?重视质量毕竟是有额外代价
的,这种额外代价常常需要长期声誉的收益来平衡。而只注重某一个产
品质量的商家,是难以获得长期声誉的。所以,观察到商家对某种产品
质量的重视,我们就可推测它很可能对其他产品质量也很重视;如果它
对某种产品质量不重视,我们就可推测它很可能对其他产品质量也不那
么重视。譬如,出版本书的机械工业出版社,在基础教材的出版方面声
誉卓著,我们就有理由相信它在通俗读物方面也会认真对待。否则的
话,它在通俗读物市场上就白白浪费了它通过基础教材树立起来的卓著
声誉。关于阅读本书
本书的内容与《身边的博弈》是互补的。《身边的博弈》专注于完
全信息博弈;本书则专注于有限信息博弈,尤其是有限信息博弈中的隐
蔽信息博弈。
阅读本书,并不需要事先阅读《身边的博弈》。但是,如果你曾经
阅读过《身边的博弈》,那么也许你更能理解本书某些故事的妙处。博
弈论就是这样的,当你自己的博弈论知识到了不同的境界,看同样的一
个故事,也会有不同的感受。文字还是那些文字,故事还是那些故事,但字里行间又分明透露着新的感悟。曾经有一位上海交通大学的研究生
写信给我,说把《身边的博弈》读了好几遍,每读一遍收获不同。我很
高兴。自己的书得到读者认可固然是高兴的原因之一,但这高兴也因为
他的体验引起了我的共鸣──我当年学习博弈论一遍一遍地研习奥斯本
(Osborne)和鲁宾斯坦那本书时,何尝不是这样痛快淋漓的感觉!
很多人喜欢博弈论,但是畏惧数学。如果你也是这样的人,那么正
好,本书正文部分几乎把数学门槛完全去掉了,除了少数几行计算公式
和两三张图表之外,其余都是文字的解说,不需要数学基础。有两三处
为了给那些数学基础不错的读者补充一点额外的营养,我加了稍微数学
化一点的脚注;但这样的脚注仅有两三处,并且是额外的补充,对于理
解正文并不是必需的,讨厌数学的读者可以跳过不读。最后的附录,写得相对技术化一点──当然这只是针对于从来不看
数学公式的读者来说,如果与既有的博弈论教材通篇符号相比,读者会
发现我写得其实已简单明了很多。这个附录,普通读者可以不用阅读,因为它是专门为那些有意深入了解不完全信息博弈的读者而写的。很多
人一接触不完全信息博弈就开始晕头转向,我认为这主要是因为他们没
有真正理解一些关键概念(比如类型依存策略),所以我用最为直观的
方式讲解了最关键的概念和思想,我相信它对于有意进阶学习博弈论和
数学基础差的读者是极有用处的。当然,这个部分也可视为我故意设置
的一个“信号”:这是一个专家写的书,而不是一个外行写的书。在“博
弈”一词已被滥用得无以复加的今天,博弈论普及读物良莠不齐,我敬
重的博弈论学者王则柯教授对此多有批评;我因为几乎不看那些外行写
的博弈论,不了解他们的错误,也就难以提出批评意见[1]
,但我仍觉得
有必要通过一个“信号”把专家理解的博弈论和外行理解的博弈论区别开
来,本书的附录在某种程度上也许可以有这个作用吧。
再声明一遍,阅读本书不需要数学基础;极少数有数学公式的地
方,可以跳过不读;书中的各个故事,读者可以选择自己感兴趣的内容
和感兴趣的顺序来读,怎么做都不会影响对全书的理解。但是,对于标
记“”号的章节内容,读者最好还是不要跳过,因为那是仅有的一点关
于理论的解说。理论,是我们理解现象背后逻辑结构的固定模式。如果
跳过这些部分,那么本书与一本故事书无异,读者或可从故事中得到暂
时的快乐,但对于博弈论的理解及运用其分析现象的能力可能就难以得到提高。
[1]当然,我并不认为本书的内容就是完全正确的。它完全可能有一些印
刷错误,或者由于我个人的学识所限而导致的对博弈理论本身的理解错
误。专家在其专业领域也会犯错误,只不过犯错误的概率更低一些,而
且相对而言不大容易犯一些非常低级的错误。如果读者发现本书有错误
之处,欢迎指正!与上帝博弈:概率决策
善于识别与把握时机是极为重要的。在一切大事业上,人在开始做
事前要像千眼神那样识别时机,而在进行时要像千手神那样抓住时机。
──弗朗西斯·培根(Francis Bacon)
机会对于不能利用它的人又有什么用呢?正如风只对于能利用它的
人才是动力。
──克洛德·西蒙(Claude Simon)
设想你和朋友抛硬币进行赌博,若出现硬币正面,你将从朋友处赢
得1元钱;若出现背面,你将输给朋友1元钱。这样的游戏(game)当然
也是博弈(game)。但这个博弈中你究竟会赢还是会输?结果将是不确
定的。这样的博弈中,胜负似乎并不太依赖谁的策略技巧更高,而取决
于谁的“运气”更好。与其说你跟朋友在博弈,不如说你跟上帝在博弈。
在现实的许多博弈中,不确定性都扮演着重要的角色。然而,在这
样的博弈中,取胜仅仅是依靠运气吗?也许不是。即便在不确定的世
界,如果可以发展出更好的策略,虽不能保证万无一失,但是取胜的可
能性的确会增加;或者通过某些对付风险的策略,你也可以将不确定性
带来的风险[1]
降低。在本章你会见到大量的此类例子。这些例子基本上不需涉及复杂的策略互动,但估计不确定环境的概率非常重要。因此本
章命名为概率决策,而更为复杂的策略互动情形是以后各章的主题。
即便在不确定的世界,如果可以发展出更好的策略,虽不能保证万
无一失,但是取胜的可能性的确会增加;或者通过某些对付风险的策
略,你也可以将不确定性带来的风险降低。概率与信息推断
什么是概率
一个试验可能存在多个潜在的结果,但究竟哪种结果会出现,则是
不确定的。这些不确定的试验结果被称做随机事件。譬如,抛硬币包含
两个随机事件:正面或反面;要么出现正面,要么出现反面,但究竟哪
一面出现是不确定的。掷骰子包含了六个随机事件,分别为1、2、3、4、5、6点;但每掷一次骰子究竟会出现哪个点数,是不确定的。
概率可以被看做独立随机试验中,事件出现的频率。比如,抛1万
次硬币,正面向上的次数约5000次,则抛硬币试验中正面向上的概率就
是0.5。掷骰子12万次,出现每一个点数的频率大致是2万次,则掷骰子
试验中每个点数出现的概率为16。
任何一个随机事件,都可能发生或不发生。一定要发生的事件被称
为必然事件,一定不会发生的事件被称为不可能事件。必然事件和不可
能事件,都不是随机事件。随机事件最终的结果,也只能是发生或不发
生两者之一,不允许出现既发生又不发生的情况。而且,我们也不允许
因为随机事件后来并没有发生,而否认它在先前所具有的发生的可能
性。譬如,天气预报说明天有0.3的概率会下雨,真实的情况是到了明
天没有下雨,但我们不能因为明天没有下雨而否认了其原本具有的下雨的可能性。随机事件的不确定,存在于结果被确定的过程之中;一旦结
果实现了,随机事件的随机性就消失了,但这并不能否认在结果实现之
前的随机性。
随机事件的不确定,存在于结果被确定的过程之中;一旦结果实现
了,随机事件的随机性就消失了,但这并不能否认在结果实现之前的随
机性。
为了想通这个道理,不妨考虑在一个毒杀暗器飞来飞去的小屋里关
进一只猫。当这只猫在屋子里时,我问你它的生死状态如何?你会回答
不知道,因为这只猫可能还活着,也可能死去了。它的状态就是在生死
之间徘徊、可能生可能死的状态。但是,若打开屋子发现猫还活着,这
只猫会告诉你它一直是活着的,从没经历死的状态。但是,它仍活着这
个事实,并不能否认它曾经面临死亡的可能性。
我们遭遇的许多概率事件是客观的。投掷硬币,若硬币是均匀材质
的话,那么当试验次数趋于无穷的时候,出现正面或反面的概率一定都
是0.5。这是客观的概率。但是,生活中有很多时候,我们难以对一个
随机事件进行大量的重复试验。甚至有些不确定的事件,我们一生只遭
遇一次,此时我们怎么评估事件实现的概率?通常我们会对其实现的可
能性进行一个主观评估。这就是主观概率。我们很难说明主观概率是否
合理,或者一个人的主观概率判断是否正确,但是在决策的时候我们自
觉不自觉地都使用到了主观概率。而且,确实存在这样的事实:有经验的人比没有经验的人更能准确地判断形势。或者说,经验有助于提高主
观概率的合理性或准确性。经验更丰富的人所做出的决定在事后被验证
为恰当的频率要比缺乏经验的人高得多。这可能是经验在决策中占据重
要地位的原因。
有经验的人比没有经验的人更能准确地判断形势。
也许有读者还会问,为什么有经验的人比缺乏经验的人能做出更恰
当的决定?对此的一个解释是,错误的决定对个人的成功多多少少会有
所妨碍,恰当的决定对个人的成功多多少少会有所促进;从而,在优胜
劣汰的竞争过程中,经常做出错误决定的人可能会被进化的筛子过滤
掉,而那些仍能留存在筛子上的人,他们往往是能够“经常”做出恰当决
定的人──他们就是经验丰富者,他们对于形势的判断本身就更可能是
恰当的。这里也顺便提醒读者,博弈论是理论的科学,与他人博弈则还
需要现实的经验。所以,读者不应寄希望于几本讲述策略行为的著作就
能使你成为博弈高手。理论可以帮我们洞察某些局势,但是它永远都不
能取代经验。
博弈论是理论的科学,与他人博弈则还需要现实的经验。
逆概率推断
与上帝博弈时,人们会形成对上帝之选择的主观信念(上帝选择各
状态的概率分布),但是某些时候一些相关的事件发生了,导致人们需要修正对于上帝之选择的信念。或者说,人们有时会面临这样的问题:
需要从观察到的结果去推断潜在信息的可能性──估计潜在状态的概
率。
需要从观察到的结果去推断潜在信息的可能性。
理解上述问题的最佳方式是举例。比如,上帝可以选择一个人是否
患上某种遗传缺陷,并且一个人患上遗传缺陷的概率是1%。某项健康
检查技术有99%的精确性可以发现这种遗传缺陷,即如果一个人真有遗
传缺陷,那么他只有1%的机会未发现该缺陷;如果他没有遗传缺陷,但该项检查也有1%的机会误报其有遗传缺陷。我们感兴趣的是,当检
查报告一个人有遗传缺陷的时候,他真的有遗传缺陷的概率是多少?也
就是说,给定我们的观察,我们在多大程度上能确定潜在条件是现实存
在的?
不妨用简单的数字运算来回答这个问题。设人口总数为10000人,其中100人(1%)有缺陷,而9900人没有。全部人口都做了该项检查,结果是100个有缺陷的人中被报告为确实有缺陷的人数为99人;而9900
个无缺陷的人中也有99人被(错误地)报告为有缺陷。即检查报告为有
缺陷的人数是198人,而这当中实际上只有一半(99)的人是真的有缺
陷,另外一半实际上是没有缺陷的。所以,有缺陷报告只意味着被报告
人有50%的概率存在遗传缺陷。上述推理过程,是根据结果来推断概率,因此也被称为逆概率推断
[2]。逆概率推断主要用到贝叶斯公式(见页下注或本书附录)。贝叶斯
公式和逆概率推断思想在有限信息博弈分析中占有非常重要的地位。因
为非对称信息博弈中,人们常常会通过观察对手的言行来判断对手的类
型,或者说对手的言行往往传递着对手类型的信息,每当观察到对手的
言行之后,博弈参与人就可以并且应当就这些观察到的言行对对手的类
型进行重新推断以更新其信念,这种信念更新的逻辑过程正是按照贝叶
斯公式来的。在第3章“察觉蛛丝马迹”一节,大家可以看到从对手言行
推断对手类型信息在博弈中的重要性。
[1]自弗兰克·奈特(Frank Knight,1921)以来,有些经济学家也主张不
确定性与风险是有区别的,他们认为不确定性无法知晓各状态实现的概
率,而风险则可以估计出各状态实现的概率。不过,在本书中,不确定
性与风险是当做同义词可轮换使用的。
[2]此类推断过程可以用贝叶斯定理进行一般化。譬如,可将两种潜在条
件标记为A(代表有缺陷)和B(代表无缺陷),将两个可观察结果
(事件)记为Y(检验结果有缺陷)和N(检验结果无缺陷)。在缺乏
有关人口总体的信息下,假设A存在的概率为p,则B存在的概率为(1-
p)。当A存在,观察到Y出现的概率为a,则观察到N出现的概率为(1-
a)。同样,当B存在,观察到Y出现的概率为b,则观察到N出现的概率
为(1-b)。于是我们得到四种组合情况,并可计算每种情况的概率:
①A存在,且观察到Y,概率为pa;②A存在,且观察到N,概率为p(1-a);③B存在,且观察到Y,概率为(1-p)b;④B存在,且观察到N,概率为(1-p)(1-b)。
我们关心的问题是,观察到Y,而A存在的概率是多少?故注意力可只
放在情况①和情况③,因为只有这两种情况观察到Y,两种情况概率加
总为pa+(1-p)b,这正是Y被观察到的概率,即Prob(Y)=pa+(1-p)
b。同样,pa是A存在且观察到Y的概率,即Prob(AY)=pa。令
Prob(A|Y)表示观察到Y时A存在的概率,则应有:Prob(AY)
=Prob(Y)×Prob(A|Y)。这个公式重新安排一下,有:
上面这个公式被称为贝叶斯公式,它给出了观察到缺陷报告Y后对存在
A(有遗传缺陷)的概率评估。读者可以把前面的数字例子,Prob(A)=0.01,Prob(Y|A)=a=0.99,Prob(A|Y)=b=0.01,代进
去计算一下,不难得到Prob(A|Y)=0.5,与数字例子得到的结果是一
样的。与上帝博弈
单人决策问题,一般不认为是博弈问题。但是,博弈论对于考察单
人面临的不确定决策问题也是适用的。我们可引入一个虚拟的参与人
──上帝,他的策略空间就是随机试验的各种状态;然后假设参与人是
跟上帝进行博弈。上帝对任何结果的偏好都是一样的,所以他事先随便
选择了他的策略,但你并没有观察到上帝的选择。而你,则需要考虑如
何才能更好地对付上帝,使自己的(预期)赢利达到最大。正所谓与天
斗,其乐无穷。现在我们来看几个与上帝博弈的例子。
该不该改变最初的选择
下面要讲到的例子与美国20世纪70年代的一个电视节目有关,其中
的概率计算曾困扰着成千上万的大众。在节目中,节目参与者将在三扇
门之间选择其中一扇。这三扇门中有且仅有一扇门的后面放着奖品,另
外两扇门则放着讽刺性礼品比如鸡崽(chicken)或者笨驴
(donkey)[1]。当节目参与者选定一扇门之后,主持人就会打开另外两
扇门中没有奖品的一扇。然后在剩下的两扇关闭的门中,主持人会问参
与者要不要改变最初的选择。
这里的问题就是:参与人希望获得奖品,而不是获得讽刺性礼品,那么现在仍关闭的两扇门中,他应当坚持最初的选择呢?还是改变主意选择另外一扇门?
大多数人凭直觉认为,剩下的两扇门中,每扇门后有奖品或没有奖
品的概率各占50%。因此,改变主意选择另外一扇门和坚持最初的选择
不改变,预期的赢利是一样的。的确,这种思路看来是没有什么错。因
为在做最初的选择时,选择“碰巧是”正确的概率为13;而一旦选择之
后,剩下两扇门,参与者从主持人的行为中所能得到的信息就只是将信
念修正为自己选择正确的概率为12,选择失误的概率也是12。此外没
有任何其他的信息改善。因此,他坚持原来的选择似乎可以说得过去。
但是,上述看法并不符合真实的情况。真实的情况是,若参与者改
变自己最初的选择,那么获得奖品的概率是23,若不改变最初的选
择,则获得奖品的概率仅为13。他应该改变自己最初的选择。
奇怪的是,将这个结果告诉参与者后,他们还常常难以理解为什么
会这样。一种比较浅显的解释是这样的:在最初的选择中,选择了错误
门的概率是23。如果参与人一开始的确选择了错误的门,那么主持人
随后必然打开空门,而没有被打开的那一扇就必然有奖品,此时参与人
显然应该改变主意转换到自己没选择也没有被打开的那扇门。如果最初
的选择中参与人的确选正确了(概率为13),那么他显然应该坚持,并因此获得奖品。也就是说,如果参与人一开始就选错了,则参与人应
该换门并一定获得奖金,如果参与人一开始就选对了,则应该坚持并一
定获得奖金──于是,转换门获得奖金的概率与不转换门获得奖金的概率实际上就是最初选择是正确和错误的概率。而一开始,选择错误的概
率是23,正确的概率是13。因此,在不知自己选择是正是误的情况
下,在第二阶段改变主意转换到另一扇门,的确增加了获得奖品的概
率。
对于有些喜欢做实验的读者,如果你不明白上述道理,那么我建议
你做这样一个游戏:准备三张扑克和一枚硬币,让你的朋友来当节目主
持人将三张牌铺在桌面上(并将那枚硬币放在其中一张之下);然后你
来选择一张牌;你的朋友从你没选取的牌中拿走没有硬币的一张,再问
你是否改变你当初选的牌。为了证明转换选择比不转换选择更有可能获
得奖品,你可以尝试以“转换选择”为策略进行数十次(比如50次)实
验,再以“不转换选择”为策略进行同样多次数(比如50次)的实验。结
果你会发现什么?你将发现“转换选择”的策略中得到硬币的次数基本上
是“不转换选择”策略中得到硬币的次数的两倍,而这两种策略中硬币出
现的频率也基本上分别接近23和13。
当然,在一次性节目中,并不允许这样的重复实验。而且大多数人
的确也不明智地选择了“不转换选择”。我曾在学生中做过这个实验,结
果32人中有20人坚持“不转换选择”。这说明大多数人不清楚这样复杂的
概率思考。更有意思的是,我跟我太太玩这个游戏时,她也是坚持“不
转换选择”。当我告诉她如果转换可以成倍提高获奖概率时,她却说:
如果我开始选对了,转换后结果错了就会后悔,所以心理素质好的就不应该转换。当然,她说的已经不是纯粹的概率计算,但也不是没有道理
的。人们的行为的确不仅受制于各种精心的算计,也往往受制于某些心
理因素(比如后悔)。不过,我对她的答案疑问在于:“如果开始选择
对了,那么后来转换了选择会令人后悔。但是,如果后来你知道开始的
选择错了,而你又没有转换选择,你就不后悔没有转换吗?”太太的回
答更经典:“一开始选择错了,我只认为是运气不好,没什么可后悔
的;如果开始对了,后来转换错了,才是后悔的。”这让我立即想到人
们日常生活中常提到的道理:从没得到的东西,也就不会有失去它的痛
苦,而已经得到的失去了,就会深感创伤[2]。从太太的回答中,我突然
明白了为什么行为博弈理论(behavioral game theory)现在大行其道。
从没得到的东西,也就不会有失去它的痛苦,而已经得到的失去
了,就会深感创伤。
乘车的最佳策略
一名游客要去某风景区游玩。每天开往风景区的只有三辆交通车,两趟车前后的间隔时间为5分钟。三辆车票价相同,但舒适程度则有
高、中、低之分。这个游客不知道哪辆车最舒适,也不知道汽车开过来
的顺序。不过对于他来说,多等5分钟或10分钟时间并无所谓,关键是
要坐上最舒适的那辆车。
那么这名游客采取什么样的候车策略,才最可能搭上最舒服的那辆车呢?
这个问题,当然是一个单人决策问题,是不确定环境下的决策问
题。这里的不确定性,源于游客对于不同舒适程度的三辆车开过来的顺
序并不清楚。但列举起来,行车顺序无非有如下六种状态:上中下、上
下中、中上下、中下上、下中上、下上中。那么我们可以虚拟一个参与
人,即上帝,他选择的策略空间就是这六种状态。而且上帝这个参与人
比较奇怪的一点就是,选择任何状态对他的赢利都是一样的,所以他在
这六个策略之间以相同的频率随机地选择。
游客的目的是希望尽可能搭乘最舒适的车。他可以考虑的最简单的
候车策略是:任意选择一辆车搭乘。他这样“随便”的选择,使他搭乘到
最舒适的车的概率为13,这个结果一般的读者都能明白。
当然,游客也可以设计复杂一点的策略:第一辆车不上,如果第二
辆比第一辆好就上第二辆,如果第二辆比第一辆差就上第三辆。这样的
策略会使其搭上最舒适的车的可能性是多少?不妨把上帝可以选择的六
种状态全列举出来,然后看看在哪些状态下,游客的这个策略刚好使他
能够搭上最舒适的车(见图2-1):
图 2-1 行车顺序的各种状态与游客策略成功性统计一下,读者会发现,采用这个相对不那么“随便”的策略,游客
乘上最舒适汽车的概率是12。比之“随便”策略下的概率13,游客现在
搭上最舒适汽车的可能性增加了12-13=16.7%。
这个编造出来的简单例子,说明了生活中一个很朴实的道理:存在
多个候选对象的时候,没有必要仓促做决定,等一等,看一看,比较比
较,可以提高获得最佳对象的概率。这里的候选对象,可以是商业计划
方案,也可以是待购的物品,当然也可以是待雇用的求职者,或者是你
中意的女孩──比如下面这个更复杂一点的例子。
存在多个候选对象的时候,没有必要仓促做决定,等一等,看一
看,比较比较,可以提高获得最佳对象的概率。
怎样最大可能得到最好的女孩
人们常常希望能够获得一个最可爱的人作为自己的伴侣。但是,由
于上帝在你的生命中安排的异性并不是同时出现任你挑选,因此无论你
在何时选择结婚都是有机会成本的。也许你很早就结婚了,但是结婚之
后却又不断发现还有不少更好、更合适的潜在婚姻对象,这就是结婚太
早的机会成本。那么,是不是晚一点结婚就可以避免这个问题呢?不是
的!当结婚太晚,你错过最合适的异性的可能性也就更大,这就是结婚
太晚的机会成本。
那么,一个人究竟应采取什么样的策略才能最大可能遇到最适合的异性,从而使结为伴侣的机会成本最低呢?我们不妨建立一个类似前面
候车问题的模型来考察,只不过我们把候选对象扩展到更多。
假设你是一个男孩[3]
,而上帝在你20~30岁之间安排了20位适合你
的女孩。这些女孩都愿意作为你的伴侣,但你只能选择其中的一位。对
于你来说,这20位女孩的质量是可以排序的,也就是说事后你可以对她
们的质量排名,排名第一的对你来说就是最好的,排名第二十的对你来
说就是最差的。可惜的是,由于20位女孩不是同时出现在你的生命中,而是按时间先后出现,每出现一个你都要决定是留下或拒绝她。如果留
下她,她就会成为你的伴侣,你将再没有权利选择后面的女孩;如果拒
绝她,你还可以选择后面的女孩,但对前面已经拒绝的女孩将没有机会
从头再来。
20位女孩的排名虽然可以在事后确定,但是在观察完20位女孩之
前,你并不知道全部女孩的排名,你只知道已经观察过的女孩中谁比谁
更好。而且,上帝是完全随机地安排每个时间段出现的女孩,即出现时
间的先后与女孩的质量完全没有关系。那么,你应该在什么时候决定接
受一位女孩,并且使得被接受的那位女孩属于最好女孩的概率最大呢?
当然,你可以采取与候车模型中“随便”策略类似的做法,抓阄来任
意选定一位女孩。如果你这样做,那么你有5%的可能性获得最好的女
孩。概率比较小,很难发生。另一种看来复杂一点的策略是:把全部女孩分成前后两段,最先出
现的10位均不接受,但了解了这10位女孩的质量,然后在后来出现的10
位女孩当中,第一次碰到比以前都可爱的女孩,就立刻接受。这就
是“等一等、看一看”的策略。在这样的策略中,你得到最好女孩的概率
似乎是(1020)×(1019)=0.263。这个概率已经不算太小。补充说明
一下此策略中概率的算法:在这样的规则下,确保得到最好的女孩必然
要求最好的女孩在后10名女孩中出现──否则你怎么也得不到最好的了
──其概率是1020,同时,还要求第二好的女孩出现在前10名,其概率
为1019──为什么是1019?因为除了最好的,剩下人数为19个,第二好
的女孩出现在前10名的概率就是1019──这样就确保了你会得到最好的
女孩。
但是,这个策略得到最好女孩的概率真的是0.263吗?可能不是,因为这只是第二好的女孩刚好出现在前10位的情况;实际上,即使第二
好的女孩没有出现在先前的10位,但只要在最好的女孩出现之前的所有
女孩中质量最高的出现在前10位,那么该策略也可确保得到最好的女孩
(这一点要想通,否则就难以明白接下来的内容)。也就是说,该策略
获得最好女孩的概率实际上是超过0.263的(我们很快会发现这个概率
应是0.359 4。哇!这的确已经是一个不小的概率了)。
但是,还有更好的方法吗?或者我们可以问,放弃先出现的10位女
孩是否是最优的?如果不是,那么应该放弃几位先出现的女孩呢?幸运的是,我们的确有更好的策略(你应该先把前面的内容看懂,如果前面没看懂,下面可能就更看不懂了)。既然20位质量不同的女孩
其质量在你生命里是随机出现的,没有任何规律,那么,第k个女孩刚
好是最好女孩的概率是120,而刚好把这个最好的女孩选择到的概率是
多少?对此的考虑应该是:既然给定了第k个女孩质量最好,而我们决
定放弃前面n-1位女孩,从第n位开始执行前述策略的规则(第一次碰到
比以前都可爱的女孩,就立刻接受),那么必须要求在k之前的女孩中
质量排名最高的那个必须出现前n-1位女孩中,这样才能确保k被选中,其概率就是(n-1)(k-1)。从而第k个女孩刚好是最好的女孩而且又
一定被选中的概率就是(120)×(n-1)(k-1)。这里,k的取值范围
显然应该是[n,20]中的整数。所以,放弃n-1位女孩而一定会得到最可
爱的那位女孩的概率实际上就是
这个概率可以用Mathematica软件来计算,或者用Excel来计算也可
以[4]
,读者会发现,当n=8时,该概率有最大值0.3842。也就是说,如
果我们放弃前7位女孩,先看一看,心里有个谱,然后只要看到比前7位
女孩中最好的还要好的女孩,那么我们就立即选择接受。而这位被接受
的女孩刚好属于最好女孩的概率是0.3842。这比我们放弃10位女孩
(n=11)的策略要好,该策略根据上述公式计算得出获得最好女孩的
概率为0.3594。我们用Mathematica软件绘出获得最好女孩的概率图形(纵轴是概
率,横轴表示从第几位开始认真考虑接受。最大概率出现在n=8,即放
弃前7位,从第8位开始认真考虑接受,见图2-2)。
根据上述结果,我们可以得出这样的结论:若一个人在20~30岁之
间选择结婚对象,而这20位女孩以每年两位的平均分布出现,那么你应
当在24岁才开始认真考虑终身大事。
这个例子也可任意改动数据后用同样的方法求解。比如,如果是30
位女孩,那么你应该从第11位女孩开始认真考虑终身大事[5]。
图2-2 转向认真考虑婚姻选择的决策点这个例子也可以改成其他的版本,比如:在20层楼中,每层楼都放
着一颗宝石,每颗宝石的大小不一。现在你从第一层开始上楼,每到一
层楼你都可以决定要不要该层楼中的宝石。如果不要,不能回头。如果
要,以后就不能再取。或者,有20位求职者,你希望尽可能雇用到最好
的那位,但你对他们的面试机会只有一次。你应该如何才可以有最大的
机会获得最大的那颗宝石(最好的那位求职者)?这个问题,据说是微
软公司的面试题。但它的道理,与最大可能获得女孩的道理是一样的。
由此还可引发出另外一重考虑:为什么在求职或演讲比赛之类的竞
争场合,人们通常不愿作为第一个或前几个登台呢?而且越是好的越不
愿意第一个登台呢?因为人们可能存在等一等、看一看的决策习惯,前
几名往往只作为参照标准被评审人有意无意地放弃了[6]。
不要被概率愚弄
概率计算,是一项颇具挑战性的工作。事实上,大多数人都是概率
方面的白痴。即使是一些数学专家犯错误也是常事。[7]
专家尚且如此,普通大众被概率愚弄也就很正常了。下面是常见概率决策失误的例子。
一种常见错误是,人们往往有夸大小样本代表性的倾向。阿克洛夫
(G.Akerlof,2001年诺贝尔经济学奖得主)1991年的一篇文章中提到了
这种现象:
人们往往有夸大小样本代表性的倾向。让我们假定,你想买一辆新车,并从价格经济和使用寿命角度考虑
决定买沃尔沃或萨帕。作为精明的买家,你阅读了《消费者调查》获取
相关信息,发现大多数专家认为沃尔沃的机械性能更好,大多数读者认
为沃尔沃有良好的维修记录。在这些信息的武装下,你准备下周就去和
沃尔沃销售商谈判。然而,在这个周末你参加了一次聚会,和一个熟人
谈起你的打算,他的反应是质疑和警告:“买沃尔沃!不会是开玩笑
吧?我姐夫有一辆沃尔沃,先是计油器出问题,然后是后备箱出问题,再后来是变速器和离合器。最后,不到三年就把那辆车当废品卖掉
了。”
在这种情况下,你还会买沃尔沃吗?估计你会立即转向购买萨帕
了。但是,仔细想想,你的朋友提供的信息,不过是在有关沃尔沃的大
量样本信息中再加入一个样本信息而已,并不足以改变样本的平均值
──也就是说,仅凭你朋友的一席话,并不足以改变原先支持你选择沃
尔沃的理由。但是,现实中有多少人还能这样理性地思考呢?
人们也常常犯下以总体特征来推断小样本特征的错误。
类似地,人们也常常犯下以总体特征来推断小样本特征的错误。譬
如许多人认为,一家医院中一年出生的小孩大致应该是男孩和女孩各占
50%左右。事实上,很多小医院的出生性别比完全不是这样。一个城市
的出生性别比可能是1:1,但这不等于在更小的单位也是如此。如果你
不能理解小医院为什么通常不是1:1的性别比,那么你想想更小的单位,比如家庭,有多少家庭出生的小孩会是男孩女孩各占一半呢?读者
有必要记住,小样本的特征不一定服从总体的特征,所以不能把总体的
特征作为小样本特征的描述。当然,反过来也一样,小样本难以反映总
体的情况,所以也不能把小样本特征当做总体特征。比如,不能看到几
个没文化的人比几个有文化的人赚了更多的钱,就得出结论说文化程度
高对提高经济收入并没有帮助。又比如,你不能因为看到一个无臂人用
脚画画很好,就得出结论说要学好画画就要砍掉双手一样。可是现实中
却有持这种逻辑的人。
另一种常见的错误是人们常常忽略了随机事件的独立性,错误地把
它们关联起来。比如掷硬币,每一次投掷出现正面或反面的概率都是
0.5。也就是说,以前曾经出现过什么样的历史,对于下一次投掷的结
果是没有影响的。考虑你现在参加投掷硬币的赌博游戏,每投掷一次赌
注1元。已经投了9次结果都很“偶然”地出现了正面,现在面临第10次投
掷,你应该选择押注正面还是反面?有不少人是这样想的,既然已经出
现了9次正面,均匀的硬币要连续出现10次正面的概率太小了(这个概
率为0.510=0.097 7%),因此下一次出现反面的概率应该很大。这样的
决策,忽略了下一次投掷概率与历史无关的事实。只要硬币是均匀的,不管前9次结果如何,下一次正面和反面出现的概率均为0.5,所以你押
注哪一面,胜负概率都一样。当然,这里还有另一种可能,那就是硬币
不是均匀的,所以前面9次出现正面并不那么“偶然”,如此第10次还很
有可能出现正面──你现在应该选择的就是正面,而不是像先前所思考的那样选择反面。
人们常常忽略了随机事件的独立性,错误地把它们关联起来。
这个赌硬币的例子和股票市场很类似。股票市场也充满了随机性。
基本上有两种投资理念,一种认为股票价格完全随机,与业绩无关,这
种情况下股票与均匀硬币本质上是一样的,股票价格的历史表现不足以
作为决策的依据,因为未来价格与历史价格无关;另一种观点认为,股
票的长期业绩较好,很可能表明股票存在内在价值支撑,这就与非均匀
材质的硬币一样,按照这样的理念,那么过去业绩表现较好的,在未来
也更有可能表现出较好的业绩。这两类观点究竟哪一类更符合股票市场
的现实?现在似乎还没有研究可以将它们检验出来。但是通过一些仿真
实验可以明白的是,存在大量均匀和非均匀的硬币不断投掷,比如经过
30轮投掷,能够保持30次都在正面的硬币仍然存在[8]
,而这些硬币也并
不完全是非均匀的硬币,这表明可能部分股票的业绩确实有内在支撑,但也有些股票业绩良好可能仅仅是偶然因素。
很多人不善于从结果去推断信息,以至于过度夸大了某些后果的严
重性。
还有一种经常犯错误的情况是很多人不善于从结果去推断信息,以
至于过度夸大了某些后果的严重性。我太太的一个朋友怀了小孩,因高
龄怀孕担心胎儿的健康做了唐氏筛查。唐氏综合征俗称先天性痴呆,是最常见的一种染色体疾病。怀孕年龄越大,胎儿患此病的概率越高,按
照年龄段来看这位朋友胎儿患此病的概率为0.13%。如果胎儿确实患有
此病,则唐氏筛查有80%的可能性会查出来(也就是有20%的可能性查
不出,但胎儿实际上是患病的);如果胎儿未患此病,则不会查出异
常。这位朋友不放心去做了筛查,结果没什么问题,但她反而更担心
了。我太太说,没检查出问题不是很好吗,可以放心了;她却说,还是
有20%的可能性患病啊,只是没有查出来啊。我太太的数学很差,听她
这样说也懵了,但又觉得不对劲,回来问我,为什么检查无恙之后,患
病的概率反而提高了?我一听就觉得好笑:她们是先验地假定胎儿已经
患上唐氏综合征,所以才会认为未检查出病状有20%的患病概率;事实
上,胎儿患病的概率仅为0.13%,检查后未发现异常而胎儿患病的概率
应是(0.13%×20%)(0.13%×20%+99.87%×100%)=0.026%,比未检
查时的0.13%概率降低了约80%。
也许聪明的读者会觉得这些失误太明显了,自己不会犯这样的错
误。那么请你看看下面这则报道是否存在问题。有一份关于中国吸烟与
健康的研究报告写道:“吸烟与肺癌发生的关系已为众多的实验研究以
及多个设计严格的大宗人群研究所证实。约80%以上的肺癌与吸烟(包
括被动吸烟)有关。”读完这话,你是不是觉得吸烟很可能导致患肺癌
(即认为吸烟是一个严重损害健康的问题)?吸烟几乎就是肺癌的罪
魁?如果你认为是,不妨继续往下看。我国约有36%的烟民;肺癌发病率(缺乏中国数据,以世界数据
0.333%代替);肺癌患者80%是烟民或被动吸烟者,即是说肺癌患者中
还有20%是非吸烟者;为了让不太熟悉概率的读者能够理解,我不妨假
设肺癌患者共100名,其中80名是为烟民或被动吸烟者,20名是非吸烟
者。那么我们据此可推算社会总体人口为100(0.333%)=30 030人,其
中烟民为30 030(36%)=10811人,被动吸烟者的频率不知,姑且假设
为X人,那么吸烟者(包括烟民和被动吸烟者)致癌的概率为80(10
811+X)。非吸烟者的致癌概率为20(30 030-10 811-X)。稍加计算就
可以知道,除非被动吸烟者数量X<13 213,或被动吸烟者比例小于
44%,吸烟者患癌症的概率才会超过非吸烟者患癌症的概率。在缺乏被
动吸烟者比例的情况下,我们无法推断出吸烟对癌症究竟有多大影响。
不过,这份报告披露了我国男性吸烟率为66%,女性吸烟率为
3.1%;而男性肺癌发病率为0.355%,女性为0.312%。而一个社会男女
性别比基本上为1:1,则按照我们前面的假设,100个肺癌患者中,大
约有100[0.355(0.355+0.312)]=53人为男性,有100-53=47人为女性。
社会中男女基本上相等意味着这个社会分别有30 030(0.5)=15 015个
男性和女性。两个人口总量相等、烟民结构完全不同(一个有过半烟
民,一个只有少数烟民)的群体,肺癌发病率和发病人数竟然如此接
近,这能说明吸烟是肺癌的发病罪魁吗?
我应当承认,在上述两段推理中,在某些地方我用世界数据来代替中国数据(因为找不到中国数据),可能存在偏差。不过我的本意不在
为吸烟致癌翻案,所以问题不算严重。我只是想借此说明,在对公众发
布信息的时候,应尽量提供背景信息,以免误导公众;更不能有意隐瞒
关键信息,利用公众缺乏概率推断能力而有意误导公众。同时也说明,如果读者能多掌握一点概率推断的知识,就会更少地受到媒体的欺骗。
[1]在美国俚语中,鸡崽(chicken)被用于表示胆怯者、懦夫,而笨驴
(donkey)则表示蠢人。
[2]事实上,来自心理学和行为经济学的研究已表明,对于同等价值的物
品,人们失去它而损失掉的效用会超过拥有它而获得的效用,前者基本
上是后者的两倍。即失去的比得到的更觉珍贵,失去100元带来的痛苦
将是得到100元带来的快乐的两倍。
[3]当然,读者是女孩也可以。我没有任何歧视女孩的意思,模型中的男
女性别假设完全可以互换。
[4]本例的Mathematica文件或Excel计算表可在作者主页www.cnobel.com下
载,文件名分别为Table2.2.nb和Table2.2.xls。
[5]当然还可以对例子进一步一般化,假设有X>1个女孩。那么,从第n
个女孩开始认真考虑,则获得最好女孩的概率为:
上式有一个近似计算方法:当X比较大的时候, ,此函数为凹,求n的一阶条件得到最优解n
=1+Xe,代入Prob(n),有
Prob(n
这个解表明,不管女孩数量是多少,只要数量足够多,获得最
好女孩的最大概率都近似为0.368。与我们精确计算略有差异。
[6]但是参加比赛毕竟与选择女朋友不同。评委的心理往往导致两类偏差
会影响公正评价。一类是记忆偏差,另一类是直接比较偏差。这两种偏
差导致首先登场的选手比第二、第三登场的选手会得到更高的评价,但
是出场顺序更后的选手,也有很大的优势获得更高的评价。Lionel Page
和Katie Page的论文Biases in sequential performance evaluation, a field
study on the idol series利用8个国家的大众偶像评选活动(如“美国偶
像”之类的活动)的数据,表明了这样的结果。当你准备面晤或接到工
作面试通知,并且询问你愿意安排在什么时间时,你应该选择安排在什
么位置呢?两位Page的研究表明:你应尽量安排在最后。
[7]可参阅Paul Hoffman, The Man Loved Only Numbers(New York:
Hyperion,1998)第233~240页,本书讲到了几个概率论专家,包括才
华横溢、著作等身的数学家保罗·厄多斯(Paul Erd?s),他们算错了
一个很简单的概率题,跟他们解释后竟然还不知道自己的错误。
[8]以概率而论,任何1枚硬币要连续30次正面向上的概率(0.530)接近
0,但是如果有100万枚硬币参加投掷,则30轮后至少有1枚硬币连续30
次正面向上的概率约为9.3%(再考虑有2枚、3枚……等情况,则概率超
过9.3%);如果是1 000万枚硬币,则约为92.7%(几乎是肯定的了)。面对不确定性的制胜策略
有些游戏,虽然参加者不止一个人,存在好几个利益冲突的博弈
方。但是,博弈的结果很大程度上将依赖于“运气”而不是互动策略的考
量,此时的博弈问题,实际上仍可看做不确定性环境的单人概率决策问
题。参与人的出招关键是找出最有可能制胜的策略。
俄罗斯轮盘:谁都没有优势
俄罗斯轮盘(Russian roulette)是一个非常残酷的赌博游戏。经典
的俄罗斯轮盘赌游戏如同电影《猎鹿者》(The Deer Hunter,1978)中
所描述的虐待战俘的方法:在一支可装六发子弹的左轮手枪里,只放一
颗子弹,随机地一转后,要求两名战俘轮流用手枪对准自己的头部发
射,直到一名战俘中枪,另一名战俘才逃过一劫。
这种残酷游戏据说最早可以追溯到克里米亚半岛,不过真正流行还
是在第一次世界大战期间。当时,白天打了败仗的沙俄军官和士兵到了
夜里便借酒浇愁,于是“俄罗斯轮盘赌”便成了最好的“助兴”节目。虽然
屡屡有人惨死在枪下,但是这种惊险刺激的游戏却在俄罗斯越来越流
行,甚至赢得了“俄罗斯轮盘赌”的“美名”。
不过,我在这里要问的问题是:这样的游戏对于先发者或者后发者
是否会更有利或更不利呢?我曾把这个问题贴在人大经济论坛(www.pinggu.orgbbs),既有网友认为先发者更有利,也有网友认为
后发者更有利。
而实际上,这是一个纯粹凭运气的博弈。子弹装上再一转之后,子
弹的位置就已经固定下来,因而究竟是先发者死亡还是后发者死亡也就
确定下来。如果子弹正好在1、3、5的位置,则先发者将死亡;如果子
弹在2、4、6的位置,则后发者死亡。而子弹进入1、3、5以及进入2、4、6的概率各为12。因此,先发者和后发者的死亡概率均为12,并不
存在先发优势或后发优势。[1]
当然,可能确有始终被运气眷顾的人,比如英国作家格雷厄姆·格
林。他曾对俄罗斯轮盘赌乐此不疲,认为这是一剂解乏的“良药”。年轻
时他曾对未婚妻这样写道:“以这样的方式自杀实在太刺激了。”后来他
承认当自己在大学念书的时候,夜深人静时常在宿舍里玩这种游戏。令
人惊奇的是,他自己如履薄冰地幸运活了下来,而他的同伴中却屡屡有
人死于非命。
回头再讨论一下人们对俄罗斯轮盘中的概率的看法。不少网友竟然
认为这当中存在先发优势或后发优势──这让我想到生活中的抓阄。比
如,有一份不可分割的物品,需要分配给5个人,为保证公平采用抓阄
的方式确定谁将得到这份物品。五个信封中只有一个信封内的纸片上写
着获得该物品。不少人以为先抓阄和后抓阄可能面临不同的机会。但
是,真的是这样吗?一个博弈论专家的教训
俄罗斯轮盘赌中的胜负纯粹依靠运气。但是在另一场轮盘赌中,一
个博弈论专家本可稳操胜券,却因为未曾细想其策略而满盘皆输。
巴里·奈尔伯夫(Barry Nalbuff)是一个博弈论经济学家。他与迪克
西特合作的《策略思维》是一本非常著名的博弈论科普之作。在那本书
中记录了巴里的一次深刻教训。话说当年巴里为了庆祝大学毕业,参加
了剑桥大学的五月舞会。庆祝活动的一部分包括在一个赌场下注。每人
都得到相当于20美元的筹码,截至舞会结束时候,收获最多的一位将免
费获得下一年度舞会的入场券。到了最后一轮轮盘赌的时候,纯粹是出
于一个令人愉快的巧合,巴里手中已经拥有了相当于700美元的筹码,独占鳌头。第二名是一位拥有300美元筹码的英国女子。其他参与者实
际上已经被淘汰出局。该女子提出与巴里分享下一年的入场券,但是巴
里拒绝了。是的,自己占有绝对的优势,怎么可能满足于得到一般的奖
赏呢?
为了理解接下来的策略,有必要交代一下轮盘赌的规则。典型的轮
盘赌是轮盘上刻有37个数字,标记为0~36。轮盘赌的输赢取决于轮盘
停止转动时小球落在哪一格。假如小球落在0处,就算庄家赢。轮盘赌
最可靠的玩法就是赌小球落在偶数还是奇数。这种玩法的赔率是一赔
一,比如1美元赌注变成2美元,不过取胜的机会只有1837(37个格中
除了0外只有18个偶数,或18个奇数)。采取这样一种玩法,即使该女子押上全部300美元筹码也不能稳操胜券。因此她被迫选择一种风险更
大的玩法,她把全部的筹码押在小球落在3的倍数上。这种玩法的赔率
是二赔一(若她赢了,则她的300美元将变成900美元),但取胜的机会
只有1237(37格中除0外有12个数字是3的倍数)。
现在,那名女子已经将她的筹码摆上桌面,表示已经下注,不能反
悔。那么巴里应该怎么办呢?
读者也可以先想一想巴里应该怎么办。真实的结果是,巴里将200
美元押在偶数上,并且嘀咕他输掉冠军宝座的唯一可能性就是他输并且
她赢,而这种可能性发生的几率为1:5,因此形势对他非常有利。然
而,几率为1:5的事件也时有发生。在这里,结果是那名女子赢了。
事后,巴里承认做出这种错误的押注方式是因为当时已经凌晨三
点,他喝了太多香槟,没有办法保持头脑清醒了。他真正应该采取的策
略是模仿那名女子的做法,同样把300美元押在小球落在3的倍数上。为
什么呢?因为尽管小球是否落在3的倍数上是不确定的,但若巴里采取
与女子同样的押注方式,那么出现的结果只会是要赢一起赢,要输一起
输,但无论输赢巴里都会比那名女子多出400美元而获得冠军宝座。相
反,如果巴里采取与女子不同的押注方式,则女子赢得赌注而巴里输掉
赌注的可能性就是存在的──这正是真实的故事。
这件事情给了巴里一个深刻的教训。保持清醒的头脑来选择最恰当的策略对于在博弈中取胜是至关重要的。不过,在毕业晚会上这样兴
奋、疲倦的时刻,保持清醒头脑可能也很不容易。不仅巴里如此,其实
那个女子也是在不清醒的状态下偶然取胜的。怎么可以判断出来?很简
单,巴里只要采取与那名女子一样的策略,那名女子就必败,只有两人
采取不一样的策略时,那名女子才有获胜的可能;既然如此,该女子就
不应率先下注,因为率先下注,巴里就可以跟随其下同样的注;她应该
等巴里先下注,然后再下与巴里不同的注,这样才更有反败为胜的可
能。
保持清醒的头脑来选择最恰当的策略对于在博弈中取胜是至关重要
的。
巴里的这个故事所蕴涵的道理是深刻的。在现实中,我们常常会发
现类似的领先者模仿落后者的例子。比如帆船竞赛,领先者总是试图与
落后者保持同一航道,而落后者总是希望走上与领先者不同的航道。因
为帆船会受到风速、风向的随机影响,对于不同航道的船,这种随机影
响可能有差异,但同一航道则影响往往是一致的。领先者维持与落后者
同一航道,就可避免因随机因素影响而失败;而落后者选择与领先者不
同的航道,虽不能保证胜利,但可以通过随机因素获得反败为胜的机
会。在一个市场中的企业其实又何尝不是如此?先进企业常常会采取大
多数企业所采取的比较保守的常规战略,而后进企业中有不少则提
出“超常规发展”。遵循常规的后进企业没有机会超越先进企业,而“超常规发展”战略虽然面临更大的风险,却的确也成就了少数恰好碰对了
运气的企业。同样的情形也出现在股市分析员和经济预测员身上。业绩
领先的预测员总是想方设法随大流,尽量做出与其他人差不多的预测。
这样一来,大家就不容易改变对这些预测员能力的看法。另一方面,初
出茅庐的预测员则常常会采取冒险策略:他们喜欢预言市场出现繁荣或
者崩溃。通常他们都会说错,以后再没人相信他们。不过,偶尔也有人
做出了正确的预测而一夜成名,从此扬名立万。
领先者维持与落后者同一航道,就可避免因随机因素影响而失败;
而落后者选择与领先者不同的航道,虽不能保证胜利,但可以通过随机
因素获得反败为胜的机会。
我还想到了另一个例子。前不久的北京奥运会,相信大家对中国乒
乓球的辉煌赛绩仍历历在目。在好些场中外选手对抗中,外国运动员都
采取了所谓的“搏杀”。搏杀行为是一种高风险策略,它可能使自己失误
更多,当然对对手也有较大威胁。那些外国运动员为什么要采取搏杀?
因为他们处于弱势。他们的搏杀行为与后进企业、初出茅庐的预报员等
采取更冒险的行为本质上有相同的效果。
应该先与谁赛
读者大概都听说过“田忌赛马”的故事。话说齐王有上、中、下三
马,田忌也有上、中、下三马,但田忌每一个等级的马都不及齐王同等级的马,因此田忌每每以“上中下”对齐王“上中下”都惨遭失败。后来孙
膑为其出谋划策,以下马对齐王上马,以上马对齐王中马,以中马对齐
王下马,取得一负二胜的成绩。
今天,我们将赛马的故事再改编一下,来看看概率计算对于不确定
性下的策略选择的重要性。
话说齐王知道了孙膑为田忌出谋划策而使田忌赢得比赛后,心中暗
叹此人聪明,又有些不服气。于是叫来田忌、孙膑要再赛一场马,并且
他要和田忌组成联队对抗孙膑,即每个人一匹马,但是齐王和田忌组成
联队与孙膑比赛,规则如下:齐王和田忌轮流与孙膑比赛,若三局中孙
膑连胜两局就算孙膑胜,否则就算孙膑输;不过孙膑有权挑选先跟谁比
赛。
现在,已知的情况是齐王的马比孙膑的马好,孙膑的马比田忌的
好。孙膑与齐王比赛则每局有0.4的可能性取胜,跟田忌比赛则有0.7的
可能性取胜。那么,孙膑最好选择先与谁进行比赛呢?
乍一看,孙膑先与田忌比赛,则与齐王只需要赛一局,似乎比较有
利。而另一方面由于要连胜两局,第二局非胜不可,则似乎又应选择与
田忌赛第二局,因此先与齐王比赛好像更有利。究竟应该怎么选择呢?
不妨推导看看。
假设孙膑胜齐王的概率为a,胜田忌的概率为b,且a
故先与齐王赛则获胜的概率为:aba+ab(1-a)+(1-a)ba=ab(2-a)。
若先与田忌赛,则获胜的概率为bab+ba(1-b)+(1-b)ab=ab(2-b)。
因为a
a=0.4,b=0.7代入前面的计算,则可发现,如果先与齐王比赛,则孙膑
获胜的概率为0.448,如果先与田忌比赛,则孙膑获胜的概率为0.364。
有时候确定一下与对手竞争的顺序,对自己是有好处的。
这个故事说明,有时候确定一下与对手竞争的顺序,对自己是有好
处的。小到体育比赛日程的安排,大到国家法案立法讨论的顺序,往往
都可以影响成败的概率。这也是在竞争中,人们在赛前纷纷展开影响竞
争顺序安排的游说活动的原因。
三方对决:弱者的生存之道
下面要讲的例子在我的《身边的博弈》一书中曾提到其简单版本,现在考虑得相对复杂一点,概率计算上也更为困难一点。建议有概率论
基础的读者阅读;无概率论基础的读者可跳过分析过程。
A、B、C三人决斗,每人每次发射一枪。A枪法最差,命中概率为
PA;B一般,命中概率为PB;C是神枪手,命中概率为1。显然PA
1。三位按照ABC的顺序依次发射,直到只剩一人存活。每个射手,在
轮到其发射时,他可以选择任一对手开枪射击,也可以对空射击(不会射杀任何人)。假设任一射手一旦中枪即毙命,死亡的射手不允许再射
击。
现在的问题是:A的最佳策略是什么?
A的最佳策略,应当是使A有最大生存机会的策略。为了寻找最佳
策略,可以这样分析:如果只剩下一个对手,那么最佳的选择就是向那
个对手开枪;如果两个对手都存在,而轮到A射击时,那么情况就与博
弈开始时由A射击的情况一样。所以,只需要重点考虑A刚开始博弈时
会怎么选择。
A刚开始博弈时面临的选择不外乎三种:对空发射、对C发射、对B
发射。对此三种情况逐一分析。如果A射B,若射杀B,就等于签了死亡
协议(因为接下来就是C射A);若没能射杀B,则与对空放枪没两样,接下来B会先攻击C(因为C比A对B更危险),A就赚得一轮机会。结论
是:对B发射的策略,严格劣于对空发射的策略。再看A射C的情况,若
射杀C,则接下来该B射A,因此A存活概率不会超过1-PB;若未能射杀
C,则接下来B射C,无论B是否得手,A存活的概率都不低于PA(请读
者想想为什么)──而未射杀C与对空发射并无两样。显然,只要PA≥1-
PB,则射杀B也严格劣于对空发射。最终的结论是,若PA≥1-PB,则A的
最佳射击策略是:B、C都存在时就始终对空发射,若B、C仅剩一人则
对幸存者发射。当然,不能排除有这样的情况,PA<1-PB,此时A选择
射C还是对空发射,就需要更细致的分析才可以讨论。[2]容易发现,当B稍强时,A最好先放手,让B对付C,然后再与B和C
的幸存者拼命;若B也较弱,那么A应当先协助B对付C,以谋求更大的
生存机会。
这个例子也刻画了现实生活中弱者的生存之道。在一强两弱的三方
对决中,如果次强者相对较强,那么弱者最好是退一步,让次强者与强
者争锋,然后再与其中的胜者拚命;如果次强者能力与弱者也相差无
几,那么弱者应与次强者联合对付强者,然后再与次强者拚命。历史上
的三国,就是这样一种情形。[3]
其对于现实生活的启示,还可参见《身
边的博弈》的第1章。
在一强两弱的三方对决中,如果次强者相对较强,那么弱者最好是
退一步,让次强者与强者争锋,然后再与其中的胜者拚命;如果次强者
能力与弱者也相差无几,那么弱者应与次强者联合对付强者,然后再与
次强者拚命。
[1]对俄罗斯轮盘赌问题还有不少推广,可参见D.Sandell, Fair Russian
Roulette,The Mathematical Scientist 22,1997,52-57。
[2]分别考虑A的如下三种策略:
(1)对空发射。若A对空发射,则A获胜的可能的后续情况如下:①B
射中C,A射中B;②B射中C,“A未射中B,B未射中A”循环n次
(n≥1),然后A射中B;③B未射中C,C射中B,A射中C。令 表示采
取对空发射的策略,那么A获胜(存活)的概率为(2)A射向C。此时,若A未射中C,则事态将如同策略(1)的发展;
若A射中C,则事态发展为:B未射中A,“A未射中B,B未射中A”循环
n次(n≥0),然后A射中B。令表示采取策略射向C,则A获胜的概率为
(3)A射向B。此策略有两种可能性,其一是A射中B,则A随即将被C
射杀;其二为A未射中B,则此时状态发展同策略(1)是一样的。从而
A获胜的概率为 。
显然,因为1-PA<1,因此始终有 ,说明策略(3)始终劣与策略
(1),因此A始终不会选先射杀B的策略。策略(2)和策略(1)相比
较,谁的存活概率大则A就选谁:
故 ,当且仅当 。
因为1-PA<1,经过解PB>(1-PB)2可得到无论PB为何值,当
时,A采取策略(2)比较好。而据假设有1-PA>1-
PB,经过解PB<(1-PB)2可得到PB<0.318时,A选择策略(2)比较好。
[3]三方对决问题还可做不同的假设,可参考M.J.Gardner,Strategy for
life:a guide to decision making,Mathematical Spectrum 5,197273,54-
58。应对风险的策略
前面这些例子说明,如何可以通过选择不同的策略来提高竞争中获
胜的概率。这些策略选择并不会影响不确定性本身所导致的风险──不
能降低风险,也没有考虑如何规避风险。在现实生活中,我们其实还有
很多措施可以降低风险、规避风险或者操纵风险获利。下面就是这样的
例子。
风险混合:鸡蛋不要放在一个篮子里
应对风险的第一种重要方法是对风险进行混合。即达到降低风险的
目的,将不同的收入风险结合起来。
即达到降低风险的目的,将不同的收入风险结合起来。
举个例子来说。你居住在一个小岛上,以种植为生,这是一个完全
靠天吃饭的职业。这个小岛很奇怪,岛的东部和西部的天气刚好相反,东部是好(或坏)天气,则西部就会是坏(或好)天气。用专业术语来
说,那就是岛的东西部天气是完全负相关的。
现在你要做出决定,将1千克小麦种子播种在东部还是西部。1千克
种子若遭遇好天气,可产出100千克小麦;若遭遇坏天气,则颗粒无
收。考虑不对风险进行混合,即你只把种子播在东部或西部。结果很明
显,无论你播种在东部还是西部,你的预期收成皆为100×0.5+0×0.5=50
千克。但这50千克的预期收成具有很大的风险,因为你并不是得到确定
的50千克,而是要么得到100千克,要么得到0千克(倘真如此你就捱不
过日子了,风险确实大!)。或者说,你面临的结果具有很大的离散程
度(离散程度越大,风险越高)。
现在考虑对风险进行混合。你的决定是将1千克小麦分为两份,分
别播种在东部和西部,比如0.5千克小麦种在东部,另外0.5千克种在西
部。你的预期收成将是多少呢?可以这样想:如果东部天气坏,则东部
收成为0,但此时西部天气必然好,则西部收成50;如果东部天气好,则东部收成50,但此时西部天气必然坏,则西部收成0。也就是说,你
这种对风险进行混合的策略,使得你总可以得到确定的50千克小麦,这
50千克小麦收成没有任何风险(结果的离散程度为0)。因此,通过这
样的风险混合,你的确在维持预期收成相同的情况下降低了风险。
当然,读者也可能会说,风险之所以降低也许是因为你假定了东部
和西部的天气变化刚好是相反的(完全负相关),如果它们不完全相
反,这个结论还可靠吗?为了回答这个问题,不妨放宽先前的假设,重
新假设东部和西部的天气变化相互之间完全独立,即东部天气和西部天
气没有任何联系。那么,先前的风险混合策略所得到的预期收成是多少
呢?可以发现,你将面临的结果无非是以下四种:·东部好天气,西部坏天气:总收成50,概率0.25(=0.5×0.5)。
·东部好天气,西部好天气:总收成100,概率0.25。
·东部坏天气,西部坏天气:总收成0,概率0.25。
·东部坏天气,西部好天气:总收成50,概率0.25。
你的预期收成仍是50千克
(=50×0.25+100×0.25+0×0.25+50×0.25)。但是与没有混合风险的策略
相比较,你现在至少有0.5的概率会收成50千克;同时,获得100千克或
0千克两种极端结果的概率,也从各自的0.5下降到了0.25。换句话说,现在你减少了极端结果发生的概率,而增加了中间结果发生的概率──
这减小了结果的离散程度,风险因而也降低了。事实上,只要东部和西
部的天气不完全正相关,则通过分散播种来降低收成风险就总是可行
的。
风险混合,这一降低风险的原理,是许多现实的风险规避机制被人
们采用的理论基础。可以类推,你现在要投入的不是小麦种子,而是股
票投资,那么投资于几种价格走势不完全正相关的股票,就比投资于单
一股票的风险要小。这一分散投资原则正是诺贝尔奖得主经济学家詹姆
斯·托宾曾经说过的一句名言:“不要把鸡蛋放在一个篮子里。”中国古
代谚语“狡兔三窟”,也是同样的道理,将希望寄托在多个途径,比吊死
在一棵树上的风险要低。同样,家庭、企业、国家有着多种经济来源和经济成分,比单一经济来源和经济成分面临的收入风险要低。城市之所
以比农村有更强的抗风险能力,不仅因为城市具有更雄厚的经济实力,也与城市经济的多元化有关;农村经济常常局限于农业,因此抗风险能
力不如城市。
风险交易:买进保险,卖出风险
风险交易,也可以降低风险,并提升交易双方的福利。
一种最简单的风险交易方式,是订立合同来转移或承担风险。譬如
对于前面的例子,我们可以稍加修改:你住在岛的东部,你的邻居住在
岛的西部。你们每个人,天气好则收成为100千克,天气坏则颗粒无
收。仍假设东部和西部的天气好坏刚好是相反的。那么,如果你们之间
没有任何合同,则结果无非两种:
·东部好天气,西部坏天气:你收成100,你的邻居收成0;概率
0.5。
·东部坏天气,西部好天气:你收成0,你的邻居收成100;概率
0.5。
对于你们每个人,这样的结果风险都很大,每个人都有50%的概率
收成为0而饿肚子。
如果你们订立这样一个合同:无论谁丰收(此时另一方必歉收),都将自己收成的一半即50千克赠送给对方。这样的一个合同实际上是双
方混合了彼此的风险,效果与前面的风险混合是一样的。无论出现什么
天气,总会有一方收成100,而另一方收成0,而在这样的合同下,丰收
方会赠送歉收方50。也就是说,无论天气好坏,这样的合同确保了每个
人得到确定的50千克。这样的合同降低了彼此的风险。或者说,每个人
以丰收时的50千克小麦有条件地买下了一份保险,这个保险使得任何时
候一定可以得到50千克小麦。
不过,上述合同也有其局限性。一个局限性是,等到结果出现后,丰收方可能会违约拒绝赠送小麦给歉收方。当然这个局限并不算严重,因为只要有一个强有力的法律体制,确保合同得到实施就不算太困难。
更严重的局限在于:如果西部的天气永远(或者大多时候)是好天气,那么你的邻居就不会与你订立这样一个混合风险的合同──是的,他本
来毫无风险(或风险很低),凭什么要与你共同承担风险呢?
此时,是否还有解决问题的办法呢?可以想像,由于你(东部农
民)面临巨大风险,因此如果有人帮助你承担一定的风险,但要求你对
帮助承担风险者给予一定的补偿,若这补偿支付额度尚可承受,那么你
大概是愿意付出这一补偿以激励对方帮助你分担风险的。而对于你的邻
居(西部农民),假设他现在完全没有风险,可以确定地得到收成
100,此时如果你支付的补偿足以刺激他帮你分担风险,那么他可能也
是愿意的。这样,你们就可以订立一个合同,以某种价格(风险补偿)来交易一定数量的风险。
为了说明这个道理,我们需要引入风险规避的概念。风险规避是一
种厌恶风险而希望尽可能避开风险的心理态度。只有风险规避者,才愿
意为了降低风险而支付交易价格。经济学中对风险规避态度的刻画是通
过凹的效用函数来进行的。这里我们不需过多地纠缠于概念和术语,而
是直接给出一个满足凹性的效用函数,比如 。这里,x是财富数
量,u是对应的效用值。假设你和西部农民的效用函数都是如此,并且
你们都追求更高的效用。从而我们可以计算,在没有风险交易合同时,你从小麦收成中获得的预期效用为: ,即是
说,如果你的收成为100,则获得效用为 ,此种情况的概率为
0.5;如果你的收成为0,则获得效用为 ,其概率也是0.5。而综合起
来,你的预期效用是5。同样,也可计算你的邻居在没有风险交易合同
下的效用,因为他可得到确定的100,因此他的效用将是确定的:。
我们现在要考虑的是,是否存在一个可以成交的风险交易价格(风
险补偿)区间。不妨先假设这个补偿区间是存在的,姑且假设该补偿也
以小麦来衡量,而你们的风险交易合同签订如下条款:如果你丰收,则
你补偿给你的邻居x千克小麦;如果你歉收,则你的邻居补偿给你y千克
小麦。显然,若要让双方都同意这一条款,必须是双方都认为同意这一条款比不同意要好,也就是如下两个条件应该得到满足:
条件(C1)是说,你接受该条款的预期效用不低于不接受该条款的
预期效用;条件(C2)是说,你的邻居接受该条款的预期效用不低于不
接受该条款的预期效用。当两个条件都得到满足的时候,合同是可以达
成的。关键是,存在x和y值满足两个条件吗?求解两个不等式,的确可
以发现,只要x和y满足如下条件,则(C1)、(C2)两个条件将同时
成立:
上述条件看起来很复杂,其实很简单。它无非刻画的是条件(C1)
(C2)所形成的交集,即合约空间。如果绘制出其图形(见图2-3),则意味着(x,y)只能在阴影区域取值,这个阴影区域就是合同可以达
成的区间。如果合同(x,y)所确定的点越往右下,即你的邻居要求的
风险补偿x越高,而你要求的风险分担越少,则对你的邻居越有利;反
之,(x,y)所确定的点越往左上,则对你越有利。不过我们在这里只
想说明,的确存在使双方获益的风险交易合同达成的区间(阴影部
分),至于在该区间哪个点上达成,那只是一个利益分割问题,要看谁
更善于谈判了。如果是很多人在从事风险交易,那么将会由市场来决定一个风险交易价格,即确定一个利益分割点。这些交易的共同之处是,借由合理的价格,使风险少者减少风险多者的负担,以达到互利的效
果。
借由合理的价格,使风险少者减少风险多者的负担,以达到互利的
效果。
作为一个特例,我们考虑达成合同的点(x,y)=(64,32),即
合同规定:如果你丰收,则支付64千克小麦给你的邻居,如果你歉收,则你的邻居支付32千克小麦给你。可以计算,此时你的预期收益是
0.5(100-64)+0.5(32)=34千克,虽然比不订合同时的预期收成50千
克减少了,但由于转嫁了风险,你的预期效用变为
,比不订合同的预期效用增加了5.83-
5=0.83。同样,你的邻居接受合同后的预期收益是
0.5(100+64)+0.5(100-32)=116,比合约前的预期收益增加了,不过
由于他承担了风险,实际上其效用将有所折扣;尽管如此,由于补偿足
够大,使得其预期效用为 ,比不订
合同下的效用高出10.53-10=0.53。这说明,双方订立风险交易合同后,的确改进了双方的福利。图 2-3 风险交易的合约区间
如果你明白了上述道理,就可以明白现实中大量的风险交易或保险
购买行为。因为每个人对于风险的承受能力不一样,更能承受风险的人
乐于向不能承受风险的人出售保险服务;而不能承受风险的人也乐于向
更能承受风险的人购买保险服务。西部农民因为产量有保障,所以他更
能承受风险,他就像保险公司一样,为你(东部农民)提供保险服务。
现实中,保险公司比个人更能承受风险,所以它们向不能承受风险的个
人出售保险,而个人也因为能够通过买入保险来转嫁个人难以承受的风
险,而提高了自身的福利。
更能承受风险的人乐于向不能承受风险的人出售保险服务;而不能
承受风险的人也乐于向更能承受风险的人购买保险服务。事实上,风险价格及风险市场的概念,正是现代经济中几乎所有的
金融安排之基础。股票、债券以及其他诸如衍生品之类的复杂金融工
具,都具有这样的功能:把风险分散给那些最愿意为风险收益承受代价
的人们。许多人认为金融市场纯粹是冒险的一种形式,从某方面来看的
确是,但风险越小的人越冒险,也许因为他们把风险分散了,所以他们
可以尝试更冒险的企业计划,而金融市场也因风险交易而促进了企业的
发展。当然,这些市场也受到道德风险、逆向选择甚至直接欺骗的限
制,所以不能完全做到风险分散。例如,公司的经理通常必须承担其决
策的部分风险,通过持有公司股票或其他机制,让他们有努力为公司赚
钱的动机。
利用风险
风险不一定是坏的。在某些场合,利用风险可以为个人带来好处。
一个利用风险的现实例子就是股票期权。它实际上是一种选择权,在一定期限内,持有股票期权的人有权利按照行权价格买入或卖出股
票。很多公司激励高层管理者的一种手段就是给予他们一定数量的股票
期权,而且现实中的股票期权基本上是买入期权,很少有卖出期权。
在某些场合,利用风险可以为个人带来好处。
考虑高层管理者被授予股票期权,而将来行权日的行权价格为50
元。现在有两种投资方案。一种方案比较稳健,它使得企业未来的股票价格在行权日各有50%的概率为80元或者40元。如果实施此方案,那么
当股票价格为80元,高层管理者就可以行权从而每份股票获利80-50=30
元;如果股票价格为40元,高层管理者就会放弃行权从而获利0元。所
以,此方案下每份期权给高层管理者带来的预期价值就是
0.5×30+0.5×0=15元。
另一种方案是高风险方案,它使得未来的行权日股票价格各有50%
的概率为90元或10元。该方案下每份期权给高层管理者带来的预期价值
就是0.5×40+0.5×0=20元。
显然,高层管理者会选择高风险方案,因为这样可以为他们带来更
大的预期收益。或者说,高层管理者采取冒险行为(利用风险)来提升
自己的利益。当然,高风险方案可能对企业本身是有害的。比如在我们
的例子中,稳健方案不仅风险更小,而且相应的企业股票预期价值为
0.5×80+0.5×30=55元,高于高风险方案相应的企业股票预期价值为
0.5×90+0.5×10=50元。这就是管理层行为与股东利益冲突的地方。
利用风险的另一个例子是管理激励,比如业绩工资。一般来说,员
工的业绩不仅受员工努力的影响,也会受到一些随机因素的影响。这
样,即使观察到员工的业绩,也不能准确判断员工是否努力。当观察到
低业绩的时候,员工可以辩解是“运气”不好,是随机因素影响的结果,声称自己已经努力。如果企业承担全部风险,给予员工固定工资,那么
员工就不会努力。如果按照业绩支付工资,实际上就是将部分风险转嫁到员工身上。然而,正是因为承担了风险,员工为了获得更高的预期报
酬,就必须付出努力。
风险操纵:选择有利于自己的环境
在很多情形下,人们也可以通过影响自己和他人所面临的风险来获
得好处;这就是风险操纵,是针对风险的另一种形式的利用。
在很多情形下,人们也可以通过影响自己和他人所面临的风险来获
得好处;这就是风险操纵。
一般来说,在竞争中,我们总会见到强者宁愿选择稳健的策略,而
弱者宁愿选择冒险的策略。这就是源于风险操纵:因为强者更愿意把竞
争结果建立在能力的基础上,所以他们选择更依靠能力的策略,尽量减
少环境中的不确定干扰;而弱者更愿意把竞争结果建立在“运气”的基础
上,他们深知凭借能力是难以获胜的,还不如选择高风险方案多得一点
运气。“死马当做活马医”也是这个道理,反正已经濒临绝境,不如采取
高风险方案,反而有可能绝处逢生。比如,网球技术很烂的你要挑战网
球高手,选个风大的日子是不是对你更有利呢?
上述道理说明,越是能力弱的人,越应该选择一个有利于自己“运
气”的环境。我想起2003年诺贝尔经济学奖得主格兰杰(Clive
W.J.Granger)教授在获奖之后对记者的一番话。当时记者问他:“怎么
样有助于获得诺贝尔经济学奖?”格兰杰回答:“首先你要选择一所好的但不是顶尖的(good but not top)大学。”这个观点是很有道理的。如果
学校不好,就缺乏做出优秀成果的平台;如果进入顶尖的学校,虽有平
台,但是获得平台的机会就少得多(因为顶尖大学的高手太多了)。格
兰杰从1974年就一直在加州大学圣迭戈分校(UCSD),这所学校在当
时其实就是“好的但不是顶尖的”大学(现在它可以算是一流大学了,2007年UCSD在全美大学综合排名为第33名)。
所以个人在选择工作和职业的时候,应当考虑在成功机会和资源能
力之间进行恰当的平衡。因为个人要谋求成功,固然与能力有关,也与
机遇有关;选择更有利于匹配自己能力以获得更大胜算的环境,是追求
个人成功的事业中需要重点考虑的一环。
此外,在竞争中,一个人不仅可以在策略中操纵风险,更可以操纵
与对手风险的相关性来获得好处。领先的选手会尽量选择更高的正相
关:这样一来,无论他的运气好坏,对手的运气也会跟他一样,这样他
就可以继续保持领先。相反,落后的选手会选择负相关。就像两人帆船
竞赛的例子一样,落后者应选择与领先者不同的航道,而领先者应该顺
着落后者的航道。[1]
本章前面的“一个博弈论专家的教训”也是一个非常
好的例子,巴里本来可以操纵赌博的风险,他只需要保持与那名女子完
全相同的押注方式,使得自己与女子的风险完全相关,他就可以稳操胜
券。可惜他选择了另外的押注方式,使得自己的风险与女子的风险相互
独立,最终酿成了败局。制造风险:哑弹战略
有时候,我们还可以创造出不确定性,来谋取好处。博弈论中的混
合策略,就是典型的例子。譬如下面的经理和员工之间的监督博弈(图
2-4):
这个博弈基于这样的假设:如果经理监督而员工努力,则双方都没
有额外收益,标记各自赢利为0;经理监督而员工偷懒,则经理从员工
处罚款1元,经理赢利记为1,员工赢利记为-1;如果经理不监督而员工
努力,则经理节约监督成本1元记为其赢利,员工无额外收益其赢利记
为0;经理不监督而员工偷懒,则相当于员工从经理处盗窃到1元,记经
理赢利为-1,员工赢利为1。
图 2-4 监督博弈
在这个博弈中,没有纯策略均衡。经理监督则员工最好选择努力,而员工努力则经理最好就不要监督,但经理不监督则员工最好就偷懒,员工偷懒则经理最好还是监督──这是一个策略不断循环的情形,没有
纯策略均衡。但是,它存在一个混合策略均衡,即经理以0.5的概率选监察、环境保护监察等领域,完全监察的成本太高,但监管当局又试图
上述道理在很多监管领域都有运用。比如公司财务审计、劳动行政
案──努力工作。经理通过人为制造出的风险激励了员工。
定性,当这种不确定性足够大(x>0.5)时,员工宁愿选择一种保险方
督但员工仍然努力,其原因在于经理的随机监督给员工造成了一种不确
可以满足企业的要求,又可以提升自己的福利。而给定经理并未完全监
了。所以,经理不必全力监督,只需要以x>0.5的概率监督员工,就既
x(0)+(1-x)(1)=1-x>0,即经理的赢利状况比之全力监督时改善
选择是始终努力。在这样的监督策略下,经理的预期赢利为
为0,而偷懒的预期赢利为x(-1)+(1-x)(1)=1-2x<0,员工的最佳
>0.5的概率监督,就足以使员工努力──因为此时员工努力的预期赢利
力这种状况下,经理始终只得到赢利0。聪明的经理会发现,他只要以x 令员工努力,但是经理会发现这样做不值得,因为在自己监督而员工努
懒,但是不是意味着经理就一定要全力监督呢?经理全力监督固然可以
工偷懒就会解雇经理。为了防止被解雇,经理就会试图让员工不能偷
不偷懒。为了保证经理愿意执行企业的要求,不妨假设企业一旦发现员
现在,我们假设企业对经理做出要求,即要求经理必须确保其员工
弈》。)更多电子书关注
概率选择偷懒。(不熟悉纳什均衡的读者,请参阅拙著《身边的博
择监督,以0.5的概率选择不监督;员工以23的概率选择努力,以13的阻止被监管对象的不法或违规行为,那么监管当局就可以通过随机检查
的策略,配以高额的处罚,这样就有助于遏止不轨行为,而监察成本又
在可接受范围之内。
通过随机性向对手制造风险的思想,在军事领域还有一个很好的例
子,即“哑弹战略”。在战争当中,防空体系必须确保摧毁几乎100%的
入侵导弹。对于进攻方而言,击败防空体系的一个办法就是用假导弹掩
护真导弹。一枚假导弹的成本远远低于一枚真导弹。除非防守方的确可
以100%地识别真导弹和假导弹,否则遭受导弹的重大损失将迫使其对
真假导弹一视同仁地加以防卫。进攻方就能以更低的代价让对方的防空
体系背上重负。
发射哑弹的做法最初起源于第二次世界大战,当时人们其实并非有
意发射哑弹,而是由于导弹质量控制本身有问题。但是,人们很快发
现,如果可以生产一些哑弹随机发射出去,也有好处。正如麦克唐纳在
《扑克、商业与战争的策略》(Strategy in Poker, Business and War)
一书中写道:“销毁生产中的次品炮弹成本很高。有人就想到一个主
意,说把生产出的哑弹随机发射过去。对方军官担负不起任凭一枚起爆
弹落在自己阵地的风险,而且他也辨别不了哪些是不会爆炸的哑弹,面
对真真假假的炮弹,他不敢大意,只好竭尽全力摧毁发射过来的每一枚
炮弹。”
哑弹战略在军事以外的领域也有很多例子。譬如前面提到的监管问题,那些希望击败监管当局的人,也可以利用哑弹策略来提高监管当局
的代价,使监管当局降低监督力度。
最后还有一个关键问题是:什么叫制造风险?随机性是可以制造出
来的吗?如果是制造,那还叫随机的吗?3271918712,这是一串随机数
字吗?178761115,是一串随机数字吗?这确实是通过随机数发生器给
出的一串0~9的随机数字。如果我们来玩猜数的游戏,你在手中写下0
~9之间的任意一个数字,我猜是几;你当然明白不能让你的数字有规
律,因为我会识别规律然后战胜你。所以,你持有上述一串随机数字并
按照这些数字出招应该是明智的。但这真的是随机的吗?如果你认为
是,那么我想问的是,我获悉了你手中这串数字会产生什么后果,我会
不会确定地赢你?所以,一串随机数字其实可能写不下来,一旦写下
来,它就是确定的,不再是随机的了。随机性只体现在过程之中,一旦
结果实现,则随机性也就丧失了。所谓的制造风险,或者制造随机性,其实只是说让对手不能识别你的规则。在密码传递中,为了防止敌人破
译密码,一种好的方式就是随时换代码。一种常见的策略也许是,以一
本书作为代码的底本,以页码、行、列标记为其对应字的代码,只要对
手不知道是以哪本书作为底本,他就没法破译。但这仍不具有随机性。
对手毕竟有可能获悉你用哪本书做底本。如果你连自己都不知道是哪本
书做底本(比如每次都临时从一批书中随便抽取一本),那么对手
要“猜”中就困难多了。所以,真正的随机选择,应该是连自己都不知道
的选择。就像骗人一样,老说谎骗不了人,有规律地说谎也难以骗人;只有自己都不知道是不是在骗人,那才最具有欺骗性。
所谓的制造风险,或者制造随机性,其实只是说让对手不能识别你
的规则。
[1]若希望了解更多的一般理论分析,请参考Luis Cabral,Football,Sailing, Tennis, and R&D:Dynamic Competition with Strategic Choice of
Variance and Covariance,Journal of Economics and Management Strategy,Vol.12,no.1(Spring 2003),pp.139-150。友好提示
·有些博弈中的胜负主要依靠“运气”,运用概率决策对此是有帮助
的。
·存在多个依次出现的被选物品或方案时,“等一等、看一看”常常
是一个好的策略。
·参加比赛,请避免作为前几个出场。
·不要把个案或小样本的特征当做总体的特征。
·对媒体公布的数据,请多加思考,它们有可能隐蔽了关键的背景
信息。
·对于抓阄这样的博弈,先抓或后抓对谁都不可能有优势,它是机
会公平的。
·在有些场合,竞争对手上场的顺序也会影响你成功的机会,所以
要在赛前尽可能使对手的出场顺序对你有利。
·在力量悬殊的三方角逐中,若你是弱者,则最佳的斗争策略是:
当次强者和强者能力相差不大,就挑起次强者与强者的斗争,自己坐收
渔利;当次强者远不及强者,则先帮助次强者共同对付强者,打倒强者后再与次强者拚命。
·对付风险的一个有效方法是:鸡蛋不要放在一个篮子里。
·对付风险的第二个有效方法是:出售风险,为风险买一份保险。
·风险可以为我所用,策略性地利用风险也可获得好处。
·成功取决于能力和运气,在能力不足的时候,就更要注重增加“运
气”──选择一个有利于增加个人“运气”的环境很重要。
·你还可以通过操纵自己的风险与对手的风险之相关性,来增加胜
算。
·有些场合,你可以制造出不确定性,让对手面临风险,增加你的
竞争优势。非对称信息博弈
我拒绝加入任何收我为会员的俱乐部。
──格劳乔·马可斯(Groucho Marx)
与腐败有关的问题是它有变成腐败问题的趋势,即使在道德问题相
对小而实际问题却很大的时候,道德问题通常也会掩盖实际的问题。
──詹姆斯·威尔逊(James Q.Wilson)
在现实中,信息不但经常是不完全的,而且也经常是不对称的,即
博弈的一方比另一方掌握着更多的私有信息。譬如,员工比经理更清楚
自己是否付出努力;经理比股东更清楚企业的经营状况;投保人比保险
公司更清楚自己的健康风险;卖家比买家更清楚其产品的质量……
非对称信息博弈经常面临的潜在后果是逆向选择和道德风险。前者
是指发起交易的一方因为不了解对手的类型信息而做出了不利于自己的
选择;后者是指发起交易的一方因为不能观察到对手的行动信息而导致
对手采取了不利于交易发起方的行动。本章我们将接触到大量逆向选择
和道德风险的例子。另外,当信息非对称时,参与人的言行往往也能传
递其拥有的私有信息,因此在这类博弈中务必要学会观察蛛丝马迹,以
确定自己的最优反应行动。逆向选择和道德风险:基本思想
逆向选择
逆向选择(adverse selection)本来是保险行业的术语。考虑一大群
投保人,他们的健康风险各不一样,有些人患疾病的风险比较低,有些
人则比较高。如本书第2章曾讲到,通过购买保险将全部或部分风险转
嫁出去,是对付风险的良方之一。所以每个人都愿意为自己的健康买一
份保险,但是每个人意愿支付的保险费(即购买保险的价格)是不一样
的。健康风险越高的人,越愿意支付更高的保险价格;相反,风险越低
的人愿意支付的保险价格也越低。保险公司面临的问题在于,它难以知
道谁是风险更高和风险最低的人。如果,保险公司确实不清楚一个人的
健康风险水平,那么它就难以根据个人的健康风险水平实施差别价格,于是它可能只好根据平均赔付水平来确定保险费。这样的定价会产生什
么后果?风险高的人将乐于购买保险,因为他们可以以比其意愿支付价
格更低的保险费买到保险;而风险低的人将拒绝购买保险,因为保险费
水平超出了其意愿支付的价格。结果,保险公司的保险合同全部卖给了
高风险的人,保险公司最终的赔付水平可能就会超过制定保险费时所依
据的平均赔付水平。就是说,由于不了解投保人的健康类型,保险公司
吸引到的最终是其最不愿意吸引的高风险人群;保险公司做出了不利于
自己的选择,这就是逆向选择。当然,现实中的保险公司,常常也会有一些用以甄别投保人健康类
型的手段。比如它会要求投保人先在指定的医院进行健康检查,这在一
定程度上可以识别出投保人的健康风险。但无论如何,确实存在许多由
于逆向选择问题而使得保险公司难以成功提供的险种。比如历史上有保
险公司提供过个人怀孕保险、婚姻保险,但现在这样的保险已经不存
在,原因在于怀孕计划、婚姻生活等具有只有被保险人才知道而别人难
以观察到的特征,这种特征对保险成本具有巨大影响,保险公司很容易
遭受严重逆向选择的影响,所以只好退出了这样的保险领域。另一个类
似的领域是战争风险。一般来说,人们对战争是否发生的推测比其他自
然随机事件的推测要准确得多,如果保险公司提供战争风险的保险,那
么结果将是面临高度战争风险的人才会购买这个保险,保险公司就会面
临逆向选择。所以,在很多保险种类及其条款中,都把战争的后果排斥
在理赔责任之外。[1]
保险公司也可以通过其他一些手段来避免逆向选择。一种常见的手
段是,向某些大型的集团推销保险,因为大集团的成员中风险程度常常
是分散的,这样就避免了逆向选择。比如说,一个地区的汽车全部强制
保险,这就避免了只有技术最差劲的司机才购买保险的情况;向大企
业、学校或小企业联盟出售集体医疗保险和人寿保险,就避免了只有存
在较大健康隐患的人才购买保险的情况。
今天,逆向选择这个概念早已走出了保险领域。在经济和社会生活中,诸多因信息不对称而导致行为主体做出不利于自己选择的现象,都
被归结为逆向选择。逆向选择业已成为现代经济学中的一个基本概念。
经济学家早就认识到逆向选择问题会干扰市场的有效运行。但是对其进
行正式的理论研究则始于阿克洛夫(G.Akerlof,2001年经济学诺奖得
主)在1970年的论文《次品市场:质量、不确定性与市场机制》(又名
《柠檬市场》)。[2]
在经济和社会生活中,诸多因信息不对称而导致行为主体做出不利
于自己选择的现象,都被归结为逆向选择。
阿克洛夫考察了这样一个市场。这个市场交易的物品是二手车,存
在大量的买家和卖家。卖家知道其待售汽车的质量,但买家则不知道。
阿克洛夫假设汽车的质量在0~1之间均匀分布,最差质量水平为0,最
高质量水平为1。任何一辆车的质量为q,必有0≤q≤1。对于质量为q的汽
车,他假定对于卖家来说,其保留价格正好是q(即一辆车质量为q,那
么卖家就要求价格不低于q才肯卖掉它);而对买家来说,对质量为q的
车的保留价格为1.5q(即价格不超过1.5q,则买家愿意购买)。
显然,在这样的市场上,如果买卖双方都知道汽车的质量,则交易
是很有效率的。对于任何一辆质量为q的汽车,其成交价格将位于q~
1.5q之间,至于究竟是多少,就取决于买卖双方的谈判能力。为了简化
分析,阿克洛夫假设买家人数超过卖家人数,因此市场成交价格将在买
家保留价格上,即1.5q。但问题是,买家并不知道汽车的质量。如果他真的支付1.5q的价
格,买回的完全有可能是一辆质量低于q的汽车。怎么样让自己不会过
于吃亏呢?读者可能想到了,按照平均质量出价。既然汽车质量是在0
~1之间平均分布,平均质量为0.5,因此买家按照1.5(0.5)=0.75的价
格购买,则看起来会购买到平均质量为0.5的车,不算吃亏。但问题也
就在这里,由于买家只愿意出0.75的价格,所以那些拥有质量q>0.75的
车的卖家就不愿卖出。所以,出价0.75的买家能够买回的车,质量将平
均分布于0~0.75之间,平均质量仅为0.375。既然如此,买家就不能出
价0.75,而只能出价1.5(0.375)=0.562 5。但是,这个出价又使得q>
0.562 5的卖家退出市场,结果市场上的汽车平均质量变为0.562
52=0.281 25;买家的出价因而最好调整为1.5(0.281 25)=0.421 875,质量q>0.421 875的卖家将退出市场,平均质量进一步下降,买家支付
价格也进一步下降……一轮一轮,平均质量和买家支付价格交互持续下
降,最终导致市场上任何质量高于0的汽车卖家都退出了市场,买家支
付的价格也成为0,即整个市场瘫痪了,或者不存在了。
阿克洛夫的例子代表了逆向选择问题最极端的结果。现实中确有这
种极端结果,比如前面提到的怀孕保险、婚姻保险这类市场最终不存在
了,就是极端结果。但就一般情况来说,并不是所有的交易都会消失,市场可能维持在一个只有低劣产品横行的状态,这样的状态就是劣货驱
逐良货──伪劣品横行,而真品却没有出路。这样的状态也是缺乏效率
的,因为有不少想买质量高一点的车的买家,将买不到高质量车;而希望出售高质量车的卖家,无法在其意愿最低价格上出售。
现实中还有另一种可能的情况则是,市场并没有跌落到完全由低劣
产品主宰的状态。因为有一些策略行动或制度安排可以传递汽车质量的
信息。比如,高质量车的卖家将有动力提供某些信号来表明自己的汽车
是高质量的,比如提供免费保修服务等,这样的信号传递是本书第4章
的主题;反过来,聪明的买家也可以通过一些机制来甄别汽车的质量,比如要求查看卖家以前的质量记录,或者要求卖家出示质量监督机构的
认证证书等,这就是信息甄别,是本书第5章的主题。
道德风险
道德风险(moral hazard)的概念最初也来自保险领域,它指的是
这样一种情况:投保人通过购买保险将风险转嫁给保险公司,自己就不
需要像未投保前那样努力控制风险。这看起来就像投保人的道德有问
题,所以叫做道德风险。比如,一个人的财产在投保之前,因为担心火
灾毁坏其财产,常常会很留意家庭的火灾隐患,因此其财产遭受火灾损
失的概率可能并不大;投保之后,虽然他可能仍会留意火灾隐患,但这
种时时留意毕竟需要付出精力、时间等代价,既然现在发生火灾有保险
公司赔偿而损失很小,他就不会如以前那样尽心留意,结果火灾隐患和
财产损失的概率增加了。投保人这种行为的变化对保险公司是很不利
的,但是保险公司却无法监督投保人的行为。甚至还有极端的道德风险
──的确是道德本身有问题──投保人投保某种风险,然后制造出该风险来骗取保险金。比如几年前《南方周末》曾报道一起骗保案件:一个男
青年为其女友投保巨额的人身意外险,然后将女友推入湖中溺死制造出
意外溺水身亡的现场,试图骗取巨额的保险赔付。
投保人通过购买保险将风险转嫁给保险公司,自己就不需要像未投
保前那样努力控制风险。这叫做道德风险。
与保险相关的道德风险在生活中频繁发生,因此道德风险这一术语
也如逆向选择一样,早已超越保险领域,成为现代经济学中的一个基本
词汇。比如,当你租赁一辆汽车,如果该车受损你要承担全部责任,与
你购买了碰撞损害弃权书(在碰撞事故后可得到保险)的情况相比,可
能你开车会专心得多。当你拿到旱涝保收的固定工资,与你要根据业绩
来获得工作相比(前者相当于接受了保险),你可能更不愿意付出努
力。有必要提醒读者,经济学使用道德风险这个术语,并不是在道德本
身的意义上使用的,道德风险问题本质上是一个信息问题。在一些知识
专业化程度很高的领域,我们常常难以判断人们的努力水平,这样的情
况下道德风险也是很大的潜在威胁。比如教师的授课,他对授课是否尽
心尽力了?医生看病,声称你的病很严重需要他付出很大努力,你怎么
判断他确实努力了?同样的还有律师对于案件的办理努力等,都是道德
风险的典型例子。
在经济生活的现实中,人们常常会设计一些合同或机制来克服道德
风险问题。比如激励报酬,即根据代理人的业绩来支付报酬,就是为了解决生产中的道德风险;不完全保险,即保险公司不提供完全赔偿损失
额度,要求投保人自己也必须承担一部分损失,是为了解决投保人的道
德风险。当存在道德风险时,如何设计激励机制,是一个有趣且充满智
慧的问题,但本书不打算讨论此类问题,因为我计划专门为此另外写一
本书。
在经济生活的现实中,人们常常会设计一些合同或机制来克服道德
风险问题。
[1]当然,现实中也存在某些包含战争风险的保险种类,比如旅行责任
险。但是保险公司能提供这种保险合同的前提,一定是客户在战争风险
方面是分散的,使得保险公司不面临逆向选择才可以实施。所以,大多
数的合同都排斥对战争风险的保险。
[2]Akerlof, G A.1970.The Market for'Lemons':Quality, Uncertainty,and the Market Mechanism,Quarterly Journal of Economics 87:488-500.逆向选择的例子
二手市场为何难火
好几年前看到一篇报道《旧车市场为何难火》,说的是专家曾预测
国内旧车市场将日渐红火,文章引用数据说发达国家的新旧车销售比例
已达1:1,而我国人均收入逐年上升,更多的人欲过把车瘾,必将把目
光投向旧车市场云云。该文认为,我国旧车市场并不红火,原因有四,即收入尚欠火候,二手车定价不准,售后服务无保证,以及中介人员乱
出手等。
当大家了解到阿克洛夫的柠檬市场理论后,相信对这个问题会有更
深刻的认识,并认识到该文章提出原因的合理或不合理成分。从本质上
而言,旧车市场难火的原因在于信息问题。买家对于质量不放心,因此
只愿支付更低的价格,而更低的价格又进一步将良质车排挤出市场;良
质车更少,则买家意愿支付价格就更低;这种恶性循环导致二手车市场
将不断萎缩。除非有某些方式来解决信息问题,使得买家可以避免逆向
选择问题,旧车市场才能真正地火起来。
同样的道理还可扩展到旧车市场之外。几乎所有的二手市场都面临
着信息问题。任何买家都会质疑,如果产品质量的确很好的话,对方是
出于什么目的要急于出售二手货呢?比如你今天购买一台新电脑,明天准备转手出售,可能价格必须便宜一半,因为买家难以相信你的电脑不
存在某种严重问题使你在购买的第二天就急于出售。事实上,当买家支
付的价格很低,如果你的电脑确实等同新电脑的价值,你也就不会出
售。所以,二手电脑市场,或者其他二手市场,都存在逆向选择问题而
使得市场难火。
读者可能会问,为什么发达国家的二手车市场似乎比我国的二手车
市场要繁荣一些。答案正在于发达国家有较为成熟的市场制度安排来克
服信息不对称所导致的逆向选择问题。比如,发达国家往往有更好的治
理交易的法律及其实施保证,形成了更高的信任和注重商誉的社会环
境,等等。无论如何,发达国家中市场机制的运行被证明比发展中国家
有效得多,因此其交易中面临的信息问题常常能够得到更有效的克服,市场也就更繁荣。
价格离散
有时,同一种商品会以不同的价格出售。这是生活中常见的一个现
象,经济学称之为价格离散。解释价格离散的最佳模型是搜索模型。经
济学家夏洛普(Salop)和斯蒂格利茨(Stigliz,2001年诺贝尔经济学奖
得主之一)就曾经假定买方具有不同的搜索成本,导致购买同样产品的
价格不同。
不过,逆向选择可以为价格离散提供另外一个解释。考虑不同品牌的立体音箱以不同价格出售的情况。顾客愿意支付高价格,是因为他们
知道高价格品牌同时包括高质量的和低质量的音箱,而低价格品牌则必
然为低质量的音箱。结果,低质量的音箱实际上可以在两个价格上出
售:与高质量音箱竞争的高价格,以及在不同商店以不同牌子出售给对
质量不大关注的顾客的低价格。
这个解释也可以刻画伪劣品和真品可以共存的现象。但是,它要依
赖于音箱的卖家具有较高固定成本或运营成本的假设。否则,低质量的
音箱一定会充斥市场,太多的低质量产品最终通过降低平均质量(而不
是价格竞争)扰乱市场,使高质量产品不得不退出市场。
财务困难企业应降低工资吗
当企业面临困难的时候,是否应该考虑削减员工的工资以改善企业
的经营利润呢?可能不少企业是这样做的。但是这会带来很大的逆向选
择问题。因为企业降低工资,那么高质量的员工就会离开企业。什么样
的工资水平吸引什么质量层次的员工,低工资只能吸引低质量的员工。
低质量的员工导致生产率更低下,反而可能会令企业的生产和经营状况
更糟糕。百年老店沃尔沃斯(Woolworth)的倒闭就是这样的例子。
沃尔沃斯是美国零售业的巨头,在美国经营了118年,是名正言顺
的百年老店。后来由于各种各样的原因导致它在1996年宣布破产倒闭。
专家认为它倒闭的原因主要有四个,一是未能顺应消费者消费习惯变化的潮流,二是零售百货业竞争加剧,三是不能满足消费者对专业化服务
的需求及个性化的审美要求,第四个原因则与我们提到的逆向选择问题
有关──在20世纪90年代,其经营面临困难的情况下,为削减开支而大
幅削减员工工资,结果导致员工队伍质量越来越差,恶化了经营的困难
形势,最终加速了公司的倒闭。哈佛商学院关于沃尔沃斯的案例中写
道:“为了减少开支,沃尔沃斯雇用了大量的临时工、季节工,这些人
大都是新移民,不具备专业服务水准,公司也很少对他们进行岗位培
训,甚至有些人还不具备英语会话能力。这些人不要说提供周到的服
务,有时连商店货物陈列的具体位置都搞不清楚,工作经常出错。当顾
客问及何种商品摆放在何处时,总是不能得到满意的回答。而且收银员
的计算能力极差,收钱经常出错,使顾客买东西时总有不放心的感
觉……”这就是财务困难降低工资的逆向选择后果。
当然,如果读者认为,财务困难的企业为了改善经营状况,就应该
大力雇用更高质量的员工,那么读者也误解了我的意思。如果超过企业
对人才质量的实际需求,雇用更高质量的人才,这种“人才高消费”政策
也是一种逆向选择,因为雇用更高能力的员工不一定对企业最合适,但
它却会耗费更高的人工成本。我要表达的意思是,企业雇用劳动力质量
的选择,将根据雇用劳动力本身的投入产出比来决定,这个决定应独立
于企业的财务状况。正如经济学家拉齐尔(E.Lazear)写道:“劳动力质
量的选择不取决于企业的财务状况……企业的财务状况只会对企业是否
愿意继续经营下去产生影响,一旦企业决定继续进行生产,那么财务状况对于企业确定成本效益最优的劳动力决策不应有任何影响。”[1]
企业雇用劳动力质量的选择,将根据雇用劳动力本身的投入产出比
来决定,这个决定应独立于企业的财务状况。
上述结论,在一定程度上也可以解释为什么公司面临经营不景气的
时候,其雇用调整政策通常是选择裁员而不是选择减薪。因为裁员可以
强令低质量的员工离开;而减薪则导致高质量员工主动离开,因为高质
量员工很容易在别处找到薪水不错的工作,而低质量员工则因为难以再
找到工作反而接受减薪留在企业中。所以,企业的工资刚性,可以说有
部分原因是为了避免逆向选择问题。
雇用中的逆向选择
在企业的雇用中,逆向选择是经常面临的潜在问题。譬如,当企业
打出广告许诺固定年薪10万元招募一个经理,那么就会导致太多年薪不
到10万元的人前来应聘。越是表现出对这份工作很有兴趣的人,就越有
可能是在其他地方拿不到10万元年薪的低质量经理。如果他是高质量的
经理,那么他就不会表现得非常看重这个招聘。甚至,更有能力,其年
薪可以在其他地方拿到超过10万元的经理,根本就不会来企业应聘。所
以,如果企业在固定薪水下招募到一个越是想来企业工作的人,其实越
有可能招募到的是一个能力比较低的人(当然,读者阅读第5章“激励报
酬的筛选作用”一节之后会发现,业绩工资不会导致这样的逆向选择),所以企业对那些越想得到工作的人,反而没有多大兴趣。
对于求职者,上述道理也有一定的行为启示:如果企业开出的是固
定薪水,那么为了让企业对你有兴趣,你反而不能表现得太急于得到这
份工作。
如果企业开出的是固定薪水,那么为了让企业对你有兴趣,你反而
不能表现得太急于得到这份工作。
当然,雇用中的逆向选择不仅表现为在员工招募中录用了不适合企
业的员工,它还有另外一种表现形式──在劝退员工时将差的员工保留
了而将好的员工劝退了。前面提到的减薪导致优秀人才流失的逆向选
择,就是后一种。拉齐尔在《人事管理经济学》一书中还提到了另外一
个例子:[2]
美国在1979年修订了就业法中年龄歧视部分的条款。这一修正所导
致的后果是,终身教授强制退休年龄从65岁提高到70岁,并且从1993年
起,最终取消强制退休的规定。大多数大学都在考虑,这样一来,占据
大学课堂的大多将是昏昏欲睡的老先生们,而不是学生所喜欢的那种博
学多才而又精力充沛的年轻教授。为了诱使这些高龄教授们自动退出讲
台,许多大学都实施了买断计划,即如果55岁以上的教授马上退休,学
校将提供优厚的养老金。有些教授接受了这种条件。然而不幸的是,大
多数情况下,这些自动退职的教授往往是大学希望挽留的,而那些拒绝自动退职的教授又常常是学校希望他们离开的那些人。
这个问题也是逆向选择问题。最好的教授离开了,是因为他们可以
轻松地在另一所大学谋到职位。比如,一个原来在斯坦福大学工作的诺
贝尔奖获得者可以接受买断计划从斯坦福大学退休,然后很快再到加州
大学伯克利分校获得另一个教授职位。但是另外一位若干年前就已失去
创造力的教授,则没有这样的选择机会;他拒绝接受买断计划,因为他
无法在其他任何大学以现在的报酬水平再找到一份工作。
逆向选择与信贷配给
企业降低工资,就可能将高质量员工排挤出企业。与此类似,如果
银行提高利率,就可能将低风险的企业排挤出潜在客户群,反而让银行
面临不利选择。这是经济学家斯蒂格利茨和韦斯(A.Weiss)曾经在一
篇论文中仔细研究过的问题。我们可以用简单的例子来说明其思想。
假设有两类借款人A和B,每类借款人都需要初始投资100万元,但
他们自己都没有投资资金,因此只好向银行贷款。A类借款人的投资几
乎没有风险,他们的投资可以确切地收回110万元,即投资回报率为
10%。B类借款人存在投资风险,其投资各有一半的机会获得90万元或
130万元。
如果银行利率为5%,两类借款人都会申请银行贷款。由于借款人
没有额外的抵押,银行面临的最坏结果是,B类投资人获得90万元时,银行也只能收回这90万元;否则,银行就可收回本息。面临这两类随机
的借款人,银行不会面临逆向选择问题。
现在假设经济中货币吃紧(即可以放贷的金额少于借款人申请的贷
款金额),银行的资金成本增加,从而银行在向随机的借款人发放贷款
时,可能会提高利率。但是,我们可以断言,其利率提高必须小于
10%。原因在于:利率一旦达到10%(或以上),则A类投资者申请贷
款实际上已无利可图,他们将放弃贷款;银行所贷出的资金将全部到B
类贷款人手中。这时候银行就遭遇了逆向选择问题。因为B类贷款人若
投资成功,则归还银行110万元本息,但如果投资失败,则仅以投资回
收的90万元承担有限责任;所以银行将承担相当的预期损失。其原因在
于,利率提高导致借款者群体的“质量”下降了。
为了避免出现这样的逆向选择问题,银行于是把利率定在相对低的
水平上。尽管根据货币供给和需求可以把利率定在10%的水平以上,结
果银行还是把利率定在10%以下。而这样相对较低的利率将使得银行避
免逆向选择问题,但是却产生了可贷款金额不足以满足借款申请人需求
金额的情况,于是银行对每个企业的贷款不都全额满足,信贷配给就出
现了。
当出现信贷配给的时候,依据什么原则来配给信贷呢?也许银行愿
意按照这样一个奇怪的原则来配给:凡是公司名称笔画为单数的企业就
可以获得贷款,为双数就不给予贷款。这样做不是有什么特别的歧视意图,而是为了回避将贷款过多地配给了高风险企业。只要公司名称笔画
数与公司项目风险之间的关系是独立的(不相干的),那么银行的这种
做法就有一定的道理,因为这避免了逆向选择。
穷人借款为何难
许多人指责银行“嫌贫爱富”。是的,穷人获得贷款要比富人难得
多。在许多发展中国家,贫困农村的金融信贷体系非常脆弱,许多穷人
得不到贷款,即使他们拥有很好的商业创意或项目,但却得到不贷款来
进行投资,当然也就难以改变贫穷的命运。这几乎是一个恶性循环:
穷,贷不到款,于是更穷,更贷不到款……
银行为什么会嫌贫爱富呢?难道就没有一家银行有一点爱心或社会
责任吗?经济学家对此有另外一个解释,问题不是出在银行有没有爱心
或社会责任,而是在于信息非对称。其道理很简单:面对素不相识且没
有借贷记录的陌生顾客,银行难以判断他的诚信程度和偿债能力;如果
银行不加区别地将贷款发放出去,那么就会造成大量的呆账坏账。所
以,银行必须借助某些手段来甄别顾客的诚信程度和偿债能力,或者想
要贷款的人必须向银行表明自己的偿债能力。而揭示一个人偿债能力的
最好指标,莫过于这个人的财产。所以,如果一个人愿意将财产抵押给
银行,银行也就乐于为他提供贷款。这样,银行就避免了将贷款大量发
放给无偿债能力借款人的逆向选择。但问题是,穷人通常没有财产可以抵押,所以穷人就更难得到贷
款。穷人当然可以承诺自己的项目一定会赚钱,而且赚钱后将付给银行
一定的利息回报。但是,银行既无法判断项目的投资收益性是否良好,也无法在没有抵押品的情况下相信穷人的还款承诺。当然,考虑到贷款
给穷人的风险很大,那么银行可以提高对他们的贷款利率,但这只会使
得那些更具风险性(因而违约率也更高)的项目才会申请贷款。银行将
面临着对自己不利的选择。
所以,很多时候,为了让贫困农民获得金融支持,往往是政府来为
他们提供担保获取贷款。即便如此,政府也将面临于己不利的逆向选
择,因为农民还不了钱或者拒绝还钱,那么政府就要背负农民的那些债
务。所以,政府担保,常常只是小额贷款,而且要求农民必须将贷款用
于农业生产,政府才肯提供担保。
同样的道理可用来解释中小企业贷款难的现象。因为中小企业也
是“穷人”,可抵押的资产太少,若银行把贷款门槛放得太低,就会面临
逆向选择问题。
银行贷款中的逆向选择很早就受到经济学家的重视。比如经济学家
伯南克就曾经用这个思想来解释美国的大萧条。[3]
解释大萧条的困难不
在于最初的股票市场崩溃,而在于随之发生的失业的持续性。伯南克认
为股票市场的崩溃弄垮了地方银行,并使信贷人员的专业知识随之损
失。在损失了专业知识之后,由于逆向选择的存在,余下的银行更不愿意出借,这就使得经济的恢复更加困难。
金融市场上的逆向选择
金融市场上也存在逆向选择问题。投资于证券的读者朋友大概都有
感受,投资者很希望了解所要投资的企业的财务状况。但是企业的财务
状况常常只有企业自己最清楚,单个投资者要获得那些信息常常代价高
昂,难以承受。由于难以区分经营有方和经营不善的企业,投资者就不
愿意购买那些不熟悉的企业股票或债券,除非有大量关于企业的公众信
息。金融市场上提供这种公众信息的常常是一些券商和投资公司等中介
机构。也就是说,只有那些经过中介机构的分析师跟踪过的企业,才可
能被投资者关注。但问题是,分析师感兴趣的企业或者分析得最多的企
业,恰恰也是投资者最关注的企业。结果是,一些影响巨大的公司随处
可以找到它们的公众信息,而且分析师也仅仅跟踪它们;一些难以找到
公众信息的企业,投资者不大关注,而分析师也不会紧紧跟踪,它们的
公众信息仍然很少,而得不到投资者关注。所以,我们会发现有些公司
可以发行股票和债券来筹资,但是有些企业却做不到这一点。
许多国家的证券监管部门,都出台了相关的监管规定以减轻信息不
对称和逆向选择问题,比如要求企业向潜在投资者提供含有企业财务信
息的招股书,这确实增加了投资者可获得的信息量,因而也促进了更多
的企业可以通过发行股票和债券来筹资。但是,金融市场的信息问题仍
然很严重。在20世纪90年代,全球股市繁荣,投资者变得掉以轻心,更乐于投资所知甚少的企业;随着投资者对股价的关注,企业的压力也增
加了,它们不得不报告说自己赚取了与投资分析师预测的一样高的利
润。公司报告的利润一旦低于投资分析师的预测水平,其股价就会出现
大跌。结果,一些公司管理层“不得不”造假,夸大自己的利润。并最终
在新世纪之初,形成蔓延全球的系列公司丑闻。
送上门的没好货
逆向选择问题不仅存在于商业活动,日常生活中也经常会遇到。比
如,当你周末在家休息,突然有推销员来敲你的房门,推销其公司的新
产品。你会购买他的产品吗?如果这位推销员非常热切地想把产品推销
给你,你难免要想一想他为什么这么热切地想推销给你。他可能会说,这是公司试销阶段,只需要支付少许成本费。但是,如果你真的聪明,就不应该相信他的话。原因很简单,如果仅凭他这样的几句描述就可以
证明他帮你谋得了好处,那么劣质产品的推销员也可以同样方式来欺骗
你。当你考虑到可能遭受劣质产品推销员欺骗的时候,你对推销员的信
任就会下降,那么真正高质量产品的推销员就不会尝试以同样的方式来
拜访你。所以,你只能购买到劣质的产品,或者花掉冤枉钱。这就是逆
向选择。
送上门的没好货,这一思想可以扩展到生活中很多的领域。当你到
商场去购买一件物品,如果在某个价格下店员非常热心地劝你购买,那
就意味着你的出价很可能太高了。相反,如果你出的价格让她觉得比较犹豫,说明你的价格基本到位了。店员越是纠缠你要求加一点价,那么
你加价就越应慎重,因为只有你的出价让她觉得有利可图,她才会愿意
花时间与你费口舌。如果你的价格让她都没有兴趣跟你继续谈,那么你
应该考虑加价,否则就会陷入逆向选择。当然,有的读者朋友会质疑,既然如此,那店员完全可以在你给出一个高价时仍表现出一副毫无兴趣
的样子来引诱你继续加价。这种情况是有的,但是就大多数情况来说,除非你表现出迫切希望得到这个物品,否则店员也不会冒卖不掉商品的
风险来诱导加价。
所以,越是对你热情的人,越需要保持谨慎。当然朋友之间的热情
可能是例外。当你某一天接到一个投资专家的电话,希望为你提供代理
理财。他可能会吹嘘他有多么成功的业绩,但是你应想到一点:如此成
功的理财代理,会有时间突然给你越是对你热情的人,越需要保持谨
慎。
这样根本没多少钱的人打电话?或者,他居然很在乎得到你这么一
点为数不多的投资?如果一个打电话给你的理财代理说得天花乱坠,几
乎就要让你相信他,那么我的建议是,还是不要相信他。因为他的口才
太好了,也许他本身只是一个很有鼓动性的推销员,而不是一个优秀的
理财代理。
为什么不允许选择不知道读者朋友有没有逛蔬菜瓜果市场的经历?我虽很少去逛,但
偶尔有空的时候也会陪太太去买菜。在市场里,可以很容易发现某些水
果或其他物品是事先装袋并明码标价的;或者虽然事先没有装袋,但是
卖家不允许买家进行挑选,如果要挑选则要提高单位售价。这是什么原
因呢?
一种非常直观的解释可以是:有些水果不适宜太多翻动,比如樱
桃,如果挑选行为太多可能会导致樱桃被弄伤,不好看也不好卖。这固
然可以成为原因之一,但还不能解释全部的原因。有些干果(如花生)
和水果(如苹果),翻动次数基本上不会影响其外观和内在质量,但是
也不允许挑拣;而有些干果(如核桃)和水果(如西瓜)则允许挑拣。
这是为什么?
更好的一种解释是卖家为了避免逆向选择问题。花生、苹果之类,虽然挑拣行为不影响其外观和内在质量,但是每一粒花生、每一个苹果
的内在质量是可以直接观察到的,而卖家的定价是按照其平均内在质量
给出的,因此不允许挑拣,卖家就可以平均质量的价格卖出平均质量的
物品,不会吃亏。如果允许挑拣,那么人们挑拣购买的物品质量将超过
待售物品的平均质量,若他们还支付平均质量的价格,卖家就会亏损。
所以,卖家不会允许买家挑选,如果买家非要挑选就必须支付高于平均
质量价格的价格。
相反,核桃、西瓜之类,其内在质量不可直接观察,买家难以使得挑选出的物品之平均质量超过待售物品的平均质量,卖家便不会亏损。
或者,不排除有些非常有经验的精明买家,他们的确可以使得自己挑选
的核桃或西瓜比待售的核桃或西瓜平均质量要高,而他们也只付出了待
售物品的平均质量价格,所以他们赚了;但是只要不是所有的买家都有
此识别能力,那么卖家也不会亏损,因为被挑选之后的核桃和西瓜平均
内在质量难以观察,那些没有经验的买家无法得到额外的信息来修正待
售物品内在质量的信念,所以他们还是支付平均质量价格(这会使他们
成为亏家)。实际上,存在有经验的买家和大量无经验买家的时候,允
许对核桃、西瓜之类难以观察质量的物品进行挑选,卖家也并不亏损,有经验买家的额外赚得只不过是无经验买家的额外损失而已。
有经验买家的额外赚得只不过是无经验买家的额外损失而已。
恋爱兵法
甚至在男女婚恋关系中,也面临着一些逆向选择问题。社会长期演
化出的习俗是男孩追女孩。在这样的习俗中,如果女孩反过来追求男
孩,其实男孩应该小心一点,你尤其需要分析女孩为什么要违背习俗来
追你。是真的为了爱情,怕你被其他女孩捷足先登,还是看中了你的其
他某一方面?
一个一无所有的男孩,常常无须为这些问题发愁,原因在于他一无
所有,追他的女孩除了看中他本人之外还能看中什么呢,所以他不大会面临逆向选择问题。
但是一个拥有显赫家世或殷实财富的男孩,就不得不考虑女孩究竟
是爱他本人还是爱他的家世和财富。既然那么多女孩都向往嫁入豪门,富家子弟当然也很明白越是主动出击的女孩往往也是嫁入豪门动机最强
烈的女孩,他如果足够聪明,显然就不会相信她们。一个需要他千辛万
苦追来的女孩,显然比一个直接投怀送抱的女孩更不可能是因为家世和
财富而嫁给他。原因很简单,即使一个看重其家世或财富的女孩故意让
他追得辛苦,但这实际上也使女孩面临失去对方家世和财富的风险,一
个敢于冒这个风险的女孩和直接投怀送抱不敢冒这个风险的女孩,我相
信前者看重男孩家世和财富的程度更低。
也许,一个女孩喜欢上一个富家子弟,但为了表明自己喜欢的是富
家子弟本人而不是其家世背景,需要刻意冒失去富家子弟的风险,这也
是一种不得已而为之的策略。这与前面提到的找工作有点类似,你若希
望企业对你有兴趣,就不应表现得太急于获得这份工作;同样,一个女
孩希望富家子弟对她有兴趣,就不要太急于投怀送抱。所以影视电影中
我们经常看到王子和灰姑娘的爱情总是要经历很多波折,而且很多波折
的原因是灰姑娘的逃避所致,看来这些影视作品是有生活和理性基础
的。
写到这里,我想起不久前看的贺岁电影《鸿运高照》。最后有个情
节与这里的道理一样。女主人公苏倩倩最终爱上了男主人公侯翔。侯翔也喜欢苏倩倩,但是侯的家人和朋友告诫他,苏倩倩是不会真心喜欢侯
翔的(因为侯翔说话口吃,在婚姻市场上是滞留品,曾经相亲多次都没
成功,他的家人和朋友怎么能相信聪明漂亮的苏倩倩会爱上他呢),她
只是为了获得侯的欢心后将与其一起中奖得到的房子归入她的名下。所
以,这里侯翔不能判断苏倩倩是爱上他本人还是盯着那套房子,他就很
犹豫,不能做决定。聪明的苏倩倩最后用了我们这里所提的险招──她
把房子钥匙还给了侯翔,并且将房子的所有权也过户给侯翔,然后让侯
翔选择留住她或者放弃她。这样做的风险在于,如果侯翔真的放弃了,那么苏倩倩就会人房两空,如果不是真的爱侯翔,她不这样冒险至少可
以保留一半的房屋产权。所以,这个举动可以表明她是爱侯翔本人的。
而侯翔也正是从苏倩倩的险招中,明白了倩倩的心意,两人终成眷
属。[4]
当然,富家子弟避免逆向选择也有其他的方法,这个社会演化出门
当户对的婚嫁习俗,可能也与避免逆向选择有关系。如果女孩本身的财
富越多,她就越不可能为了财富而嫁。不过,反过来,有家世的女孩也
面临着逆向选择问题,因为她无法识别男孩是因为爱其本人还是其财富
而追求她?她避免逆向选择的手段,与富家公子一样,要么就依靠门当
户对,对方财富越多就越不可能因财富而娶自己;要么就是主动出击,她因自己的财富可以令男孩明白她不是因财富而追他,但是一个为了表
明自己并非是为了爱其财富的男孩,现在也有必要冒险让她追得辛苦,就像灰姑娘让王子追得辛苦一样。社会演化出门当户对的婚嫁习俗,可能也与避免逆向选择有关系。
看来,婚姻的门当户对本身是有助于解决信息问题的。一旦富家公
子或富家小姐要追求一门不满足门当户对的爱情,他她获得真爱的过
程就会因为信息问题而更辛苦;如果这个过程一点都不辛苦,那么他
她的爱情在真爱的程度上可能就会打折扣。当然,从小就青梅竹马的除
外,因为在漫长的成长过程中,已然获得对方是否真爱自己的丰富信
息。不过,若非门当户对,恐怕也难青梅竹马。
政治选举的悲哀
在政治领域,也有很多潜在的逆向选择问题。
人们通常认为,现代社会的民主选举政治比君主政治体制要好。是
的。但是,民主选举政治也有其悲哀之处,那就是它可能导致逆向选择
──人们本来希望选举出真心为公、不贪恋权力的政治家,但结果选举
出的常常是最热 ......
您现在查看是摘要介绍页, 详见PDF附件(2743KB,333页)。





