策略思维:商界、政界及日常生活中的策略竞争.pdf
http://www.100md.com
2020年1月16日
![]() |
| 第1页 |
![]() |
| 第9页 |
![]() |
| 第12页 |
![]() |
| 第26页 |
![]() |
| 第37页 |
![]() |
| 第201页 |
参见附件(5912KB,360页)。
策略思维:商界、政界及日常生活中的策略竞争,这是一本关于博弈论策略思维的,在书中作者利用现实的例子来写,帮助读者能够更直观的理解到直观的策略思维。

策略思维内容提要
人生是一个永不停息的决策过程。从事什么样的工作,怎样打理一宗生意,该和谁结婚,怎样将孩子抚养成人,要不要竞争总裁的位置,都是这类决策的例子。你不是在一个真空的世界里做决定。相反,你身边全是和你一样的决策制定者。虽然冲突的成分很多,但是合作的因素也不少。
本书将帮助你学会策略地思考,在人生博弈中扩大胜面。
本书以讲故事取胜。它的学术根源是迪克西特教授在普林斯顿大学公共与国际事务学院开设的“策略博弈”课程。简而言之,这是关于了解对手打算如何战胜你,然后你战而胜之的艺术。怎样打赢一场网球,少数如何战胜多数,为什么要“喜爱”讨厌的对手等等,都在讨论之列。
这是一门新兴的策略科学,由一些简单的基本原理组成。不同背景和行业的读者掌握了这些原理,运筹帷幄取得胜利的本领就会上升—个层次。
策略思维作者
阿维纳什K迪克西特(Avinash K.Dixit),麻省理工学院博士,现任普林斯顿大学以约翰JF谢拉德命名的经济学“大学教授”。他教授有关博弈论的课程,同时研究国际贸易政策的策略行为,曾在(英国)瓦威克大学、伯克利加州大学和牛津大学任教。
巴里J奈尔伯夫(Barry J.Nalebuff),牛津大学博士,现任耶鲁组织与管理学院经济学及管理学教授。他教授有关策略、政治和决策的课程,经常为《华盛顿邮报》和《纽约时报》等拥有众多读者的报纸撰写关于策略问题的文章。他还运用策略思维这一工具,为化学银行、麦肯锡公司以及索亚-米勒集团提供咨询。
策略思维主目录
第1部分
第1章、10个策略故事
第2章、准备接招
第3章、看穿对手的策略
第2部分
第4章、走出囚徒困境
第5章、策略行动
第6章、可信的承诺
第7章、不可预测性
第3部分
第8章、边缘政策
第9章、合作与协调
第10章、投票的策略
第11章、讨价还价
第12章、激励
第13章、案例分析
策略思维:商界、政界及日常生活中的策略竞争截图


目录
版权页
中文版前言
巴里·奈尔伯夫 前 言
作为魅力学问的博弈论
序 言
第1部分
第1章 10个策略故事
1.妙手传说
2.领先还是不领先
3.直奔牢房
4.我将坚持到底
5.给猫拴个铃铛
6.楔子的尖端
7.三思而后行
8.多管齐下
9.别跟笨蛋对等打赌
10.博弈论可能危害你的健康
11.未来的模样
12.案例分析之一:红色算我赢,黑色算你输
第2章 准备接招
1.轮到你了,查理·布朗
2.两种策略互动
3.策略的第一法则
4.决策树与博弈树
6.讨价还价
7.战争与和平
8.英国人玩的博弈
9.案例分析之二:汤姆·奥斯本与1984年橙碗球场决赛的故事
第3章 看穿对手的策略
1.优势策略
2.封面之战
3.劣势策略
4.均衡策略5.盛宴还是饥荒
6.案例分析之三:莽汉软招
第1部 分结语
第2部分
第4章 走出囚徒困境
1.如何达成合作
2.觉察作弊
3.对作弊者的惩罚
4.惩罚的保证
5.惩罚方式的选择
6.以牙还牙
7.以牙还牙策略的一个替代选择
8.案例分析之四:国会对联邦储备委员会
第5章 策略行动
1.无条件行动
2.威胁与许诺
3.警告与保证
4.核阻吓
5.时报的策略
6.更多的策略行动
7.杀鸡焉用牛刀?
8.案例分析之五:波音、波音,完蛋了?
第6章 可信的承诺
1.建立可信度的八正道
2.只有一次生命可以献给你的祖国
3.你难以拒绝的提议
4.案例分析之六:你会不会宁可向IBM租一台电脑?
第7章 不可预测性
1.怎样使输赢机会相等?
2.有人要打网球吗?
3.为什么你应该选择正确的混合策略?
4.为什么不能依赖对手的随机化?
5.你的技巧变化了,你的最佳混合策略怎样变化?
6.怎样随机行动?
7.独一无二的情况
8.谎言的安全措施
9.出人意料10.得势不饶人
11.案例分析之七:霸王行动
第2部分 结语
1.历史注记
2.深入阅读
3.我们的遗漏责任
4.从这里开始
第3部分
第8章 边缘政策
1.为什么选择不确定性?
2.风险机制
3.风险控制
4.逃离边缘
5.跌落边缘
6.核边缘政策
7.案例分析之八:大西洋上的边缘政策
第9章 合作与协调
1.钟为谁而鸣?
2.那条人迹罕至的路线
3.第22条军规?
4.比超速驾驶传票还快
5.他们为什么离开?
6.可能高处不胜寒
7.政治家与苹果酒
8.股市与选美
9.复习
10.案例分析之九:牙医分布的解决方案
第10章 投票的策略
1.打破平局
2.中点的选民
3.天真的投票
4.法庭的秩序
5.老于世故者
6.历久不衰的名人
7.爱一个可恶的敌人
8.案例分析之十:全取或全失
第11章 讨价还价1.谈判中的锄强扶弱体系
2.“这对你的伤害大于对我的伤害”
3.边缘政策与罢工
4.同时就许多事情讨价还价
5.案例分析之十一:施比受好?
6.附录:耐性自有回报
第12章 激 励
1.怎样奖赏工作表现?
2.怎样组织一个合作项目?
3.招标、拍卖的策略
4.案例分析之十二:取胜的风险
第13章 案例分析
1.别人的信封总是更诱人
2.末位应该变成首位
3.三方对决
4.弄巧成拙的防鲨网
5.糊涂取胜
6.大好时节与时机选择
7.坚持就是胜利?
8.贵人行为理应高尚
9.独霸天下
10.海湾大桥
11.公用地悲剧
12. 1美元的价格
13.李尔王的难题
14.美国诉艾科亚
15.错错得对
16.赢得最后一步
17.边缘政策与陪审团
18.管闲事的自由
19.给市长发一枚“大奖章”
20.大洋两岸的武装
21.慈善捐助的局限性
22.再分配的局限性
23.有时骗倒所有人:拉斯韦加斯的老虎机
注 释
索 引附录
译后记版权页
图书在版编目(CIP)数据
策略思维:商界、政界及日常生活中的策略竞争(美)迪克西特,(美)
奈尔伯夫著;王尔山译. —北京:中国人民大学出版社,2013.4
(大师细说博弈论)
ISBN 978-7-300-17262-0
Ⅰ. ①策… Ⅱ. ①迪…②奈…③王… Ⅲ. ①决策学 Ⅳ. ①C934
中国版本图书馆CIP数据核字(2013)第060569号
出版发行 中国人民大学出版社
定价 42.00元
Thinking Strategically: The Competitive Edge in Business, Politics, and
Everyday Life
by Avinash K. Dixit and Barry J. Nalebuff
Copyright?1991 by Avinash K. Dixit and Barry J. Nalebuff
Originally published by W. W. Norton Company, Inc.
Simplified Chinese version?2013 by China Renmin University Press
All Rights Reserved.中文版前言
现在距离我们完成《策略思维》之日已有十几年时间。在这段时间
里,博弈论达到全盛时期。当初我们动笔的时候,知道博弈论的人还寥
寥无几,懂得将博弈论用于实践者更是屈指可数;有关博弈论的著作充
满数学公式,令人望而生畏,其应用也仅限于“奇爱博
士”(Dr.Strangelove,同名电影主角)这样的防务分析员。不过,从那时
起,博弈论的贡献渐渐获得世人承认,先是约翰·纳什获得诺贝尔奖,然后有了一部获得奥斯卡奖的电影。如今,在绝大多数大学,博弈论成
了热门课程,在不少商学院甚至被规定为一门必修课。博弈论在实践中
也得到了广泛的应用。从拍卖金额高达几十亿美元的用于承载手机信号
的电波波段,到为麦肯锡这样的顶尖咨询公司提供策略咨询服务,再到
预测谁会在真人秀《幸存者》中被淘汰出局,博弈论可说无处不在。
策略思维在中国有着很深的渊源。人人都知道孙武和他的《孙子兵
法》
注1 ,其实在中国还有很多不那么知名的策略作者和思想家。译者
王尔山在翻译本书的时候,就想到了中国历史和传说中的几个故事,意
识到这些故事包含博弈论的基本要素,可以用于解释这个理论。现在,她正在考虑撰写一部以这些历史故事为基础阐述博弈论的著作;我们期
待早日看到这部作品。
我们希望各位可以从本书得到一些收获。一是改变观点。我们希望
你可以从别人的角度观察这个世界。正确做到这一点对于确定你自己的
最佳策略是必不可少的。不过,从别人的角度观察这个世界做起来并不
容易。我们总喜欢把别人看做和我们一样的人,而不是完全不同的类
型。博弈论要求你设身处地,仔细分析自己若处于对方的境地,思路会
有什么变化,哪怕你完全不能同意他们的见解。说不定,在你读完本书
的时候,你会发现自己对美国人的见解有了进一步的认识。
二是向前展望,倒后推理。这里说的是做出一系列行动和反行动,预计沿着你现在前进的道路走下去,最后你会到达哪里。我们听说,有
一句成语的大致意思是“如果你留在目前的道路上,这就是你最后的归
宿”。“向前展望,倒后推理”的法则却告诉你,应该首先确定自己最后
希望达到什么目标,然后从这个结果倒后研究,直到找出自己现在应该
选择哪条道路,这样才能保证以后可以达到那个目标。
记住,博弈论说的并不仅仅限于击败对方。这个理论同时解释了建立合作与战而胜之两方面的策略。也许这意味着我们应该将孙武和托尔
斯泰结合起来,变成《战争与和平的艺术》。
最后,我们希望各位可以从阅读本书的过程中得到许多乐趣。我们
在写作本书时,感到很有乐趣。
阿维纳什·迪克西特巴里·奈尔伯夫 前 言
策略思维是关于了解对手打算如何战胜你,然后战而胜之的艺术。
我们每个人都会在工作中和日常生活中用到策略思维。生意人和企业必
须借助有效的竞争策略才能生存下去;政治家必须设计竞选策略,使自
己得以当选,还要构思立法策略,使自己的主张得以贯彻;橄榄球教练
必须制定策略,由球员在场上实施;父母若想教会孩子良好的行为举
止,自己至少应该变成业余的策略家(而孩子是职业选手);40年来,超
级大国的核策略一直主宰着人类的生死。
范畴如此广泛的好的策略思维,一直是一门艺术。不过,它的基础
是由一些简单的基本原理组成的。这是一门新兴的策略科学。我们写作
本书的信念在于,假如来自不同背景和行业的读者了解了这些原理,他
们就会变成更出色的策略家。
关于策略思维的科学称为博弈论。这是一门相对年轻的科学,历史
尚不足50年。博弈论已经为现实生活当中的策略家们提供了许多有用的
启迪。不过,就像其他学科一样,博弈论也渐渐陷入了行话术语和数学
符号之中。虽然这些都是必不可少的研究工具,但结果却将理解其基本
想法变成少数专业人士的特权。我们试图将其中许多重要思想翻译过
来,使聪明的普通读者也能读懂。我们用描述性的例子和案例分析取代
了理论证明。我们去掉了全部数学以及大部分术语。对于一切愿意思考
一点算术、表格和图表的读者,读懂本书应该不会有什么困难。
许多书籍已经尝试过为特定目的找出策略思维的方法。汤姆·谢林
(Tom Schelling)关于核策略的著作,尤其是《冲突策略》(Strategy of
Conflict)和《军备与影响》(Arms and Influence),都颇负盛名。实际
上,谢林还是将博弈论大量应用到核冲突领域的先行者。迈克尔·波特
(Michael Porter)的《竞争战略》(Competitive Strategy)描绘了商业策略当
中的博弈论教训,也同样有名。史蒂文·布拉姆斯(Steven Brams)也写过
几本书,最有名的当数《博弈论与政治》(Game Theory and Politics)。
我们在本书中并未将整个博弈思想局限于任何一个特定场景;相
反,我们用了许多不同的例子说明每一个基本原理。这么一来,具有不
同背景的读者总能从中看到一些令人感到亲切的案例。他们还会看到同
样的原理是如何适用于相对陌生的情况的;我们希望这样做能使他们用
一种新的眼光看待许多新闻或者历史事件。我们还从大多数美国读者共有的经验当中提取例子,比如来自文学、电影和体育的生动案例。严肃
的科学家可能觉得这会使策略学问变得琐碎,不过,我们相信,来自电
影和体育的熟悉的例子是一个非常有效的工具,有助于传达重要的博弈
概念。
就像托尔金(Tolkien)的《指环王》(Lord of the Rings)一样,我们这
本书也是以讲故事取胜的。它的“古代起源”是阿维纳什·迪克西特在普
林斯顿的伍德罗·威尔逊公共与国际事务学院开设和讲授的一门关于策
略博弈的课程。巴里·奈尔伯夫后来也在耶鲁大学的政治科学系以及耶
鲁的组织与管理学院(简称SOM)教过这门课程和另一门类似的课程。有
许多学生对这些课程表现出很大的热情,贡献了许多想法,我们深表谢
意。尤其需要提到的名字包括安妮·凯斯(Anne Case)、乔纳森·弗莱明
(Jonathan Flemming)、希瑟·哈泽德(Heather Hazard)、丹尼·罗德里克
(Dani Rodrik)和乔纳森·希姆索尼(Jonathan Shimshoni)。和野崇(Takashi
Kanno)与岛津泳一(Yuichi Shimazu)承担了将我们的论述和概念译为日语
的工作,而在这个翻译过程中,他们也使英文版本变得更完善。
写作一本更接近大众阅读层面而非教科书的想法来自密歇根大学的
哈尔·瓦里安(Hal Varian)。他还在初稿阶段就给我们提供了许多有用的
想法和评价。W.W.诺顿公司的德雷克·迈克费利(Drake McFeely)是一个
严格细致的编辑,非常了不起,很有眼光。正是他做了非同寻常的工
作,才使我们的学术论文成为生动有趣的故事。假如本书现在仍然留有
教案的痕迹,那一定是因为我们没有全盘接受他的建议。
许多同事和朋友都认真阅读了本书早期的草稿,向我们提出了大量
详细而出色的改进建议。我们要特别感谢戴维·奥斯汀-史密斯(David
Austen-Smith,罗切斯特大学)、艾伦·布林德(Alan Blinder,普林斯顿大
学)、塞思·马斯特斯(Seth Masters,S.Bernstein 公司)、卡尔·夏皮罗(Carl
Shapiro,普林斯顿大学)、路易斯·泰勒(Louis Taylor,MITRE公司)、托
马斯·特伦戴尔(Thomas Trendell,ATT-Paradyne公司)、特里·沃恩(Terry
Vaughn,麻省理工学院出版社)以及罗伯特·威利格(Robert Willig,普林
斯顿大学)。斯泰西·曼德尔鲍姆(Stacey Mandelbaum)和劳拉·康·沃德
(Laura Kang Ward)作为手稿编辑,对我们的错漏之处非常宽容。各位每
次阅读的时候,假如找不出一个错误,就该感谢她们的功劳。
我们还要感谢那些帮助我们确定本书书名的人。哈尔·瓦里安从一
开始就建议我们用“策略思维”的书名。耶鲁SOM的学生们给我们提供了
更多选择。我们比较中意的书名包括德博拉·哈尔彭(Deborah Halpern)的“超越球场”以及威廉·巴恩斯(William Barnes)主笔的广告语:
“策略思维——上阵时千万别忘了它”。
注2
阿维纳什·迪克西特
巴里·奈尔伯夫作为魅力学问的博弈论
(总序)
有许多理由让我向读者们推荐博弈论,也顺便推荐本套丛书。说起
博弈论,在过去的10多年里,人们对于它的感受是随着时间的推移而变
化的。20世纪90年代初,我开始为研究生和博士生开设博弈论课程,一
些同事用怀疑的眼光看着我。随后,在中国经济学界出现了博弈论热
潮,而这种博弈论热潮是我在1996年发表在当时很有名的《经济学消息
报》上面的文章所准确预言了的。
注3 随后,有一些反潮流的人撰文批
评这样的博弈论热,但是,我们看到,即使包括张五常这样的大家在内
的批评者都没有成功地为博弈论热降温。在今天的经济学专业杂志上,包括国际上著名的经济学刊物,甚至在超出一般意义的经济学期刊,譬
如管理、法律、政治学、生物学、心理学、军事科学等学术杂志上,运
用博弈论方法构造数学模型的论文可以说是汗牛充栋、随处可见了。
与许多学问不同,博弈论不仅仅因为它开始成为包括经济学在内的
社会科学的一般性研究框架而显得重要,犹如19世纪的牛顿力学在自然
科学中的地位,而且,博弈论还是一门充满韵味且魅力十足的学问。正
是由于博弈论那深刻的策略分析与对于大千世界中无所不在的复杂现象
的巧妙解读,人们不仅满足了好奇心,而且还会感到茅塞顿开,豁然开
朗,甚至在读了博弈论对于从经济管理到进化生物学一系列学术难题的
精妙解读之后,禁不住会大呼过瘾,爽极!
对于许多人来说,科学的价值是能够帮助人们去认识世界、改造世
界。其实,这是实用主义者的感受。对于科学家,特别是一些大科学家
来说,他们认为科学理论的价值是它无比的美感,譬如爱因斯坦、薛定
谔。对于既不同于普罗大众,也不是爱因斯坦那样的大科学家的大多数
研究者来说,玩科学的感受其实就是有趣。趣味,是使得大多数科学家
埋头于学问的主要推力。这种沉迷于学问里面的无穷趣味,是普通人难
以想象甚至难以企及的境界,那可不是一般的趣味,那是“神趣”!——
令人神魂颠倒、忘乎所以之意境!有如窥见上帝秘密之快感和人世间任
何其他满足都难以比拟的快乐。当然,并不是所有的学问都能够如此这
般地给人带来快乐,但是博弈论肯定是位列其中的。
作为研究策略性互动的学问,博弈论在解释经济行为的原因、政治
制度的形成与演化、进化心理学假说的模型构建、进化生物学的数学化、市场设计与供求匹配等方面大获成功,已经成为生命体行为现象微
观研究的重要方法——不仅仅是人类的经济行为。
美国第一位获得诺贝尔经济学奖的大师保罗·萨缪尔森说过:如果
你想成为一个有见识的人,就一定要读读博弈论。其实,读读博弈论,还不仅是让人开眼界、长见识,喜欢深刻思考的人,会发现博弈论正是
你爱不释手、丢弃不了的东西。
到底博弈论有什么迷人的地方呢?随便举个信手拈来的例子,就是
中国的跨地区移动通讯为什么要收取漫游费。要知道,全世界只有三个
国家在收取漫游费——中国、印度和日本。为什么?在我曾经参加的听
证会上,运营商说跨地区移动通讯会增加运营商的业务量,所以成本的
增加使得它们通过收取漫游费来填补额外的成本。其实,收取的漫游费
数量远远超出了它们购买设备处理业务的费用,这样的理由是不成立
的。那么,是什么难言之隐让运营商要收取漫游费呢?博弈论让我们很
容易推演出运营商难言的秘密:如果取消漫游费,那么运营商们就处于
全国统一的竞争性市场中,它们之间就会打起价格战,导致大多数运营
商退出,而留下极少数幸存者垄断市场。并不是所有的运营商都有这样
的自信:我会是最后的幸存者。所以它们之间就达成这样的默契:通过
漫游费将市场分割为各个区域性市场。漫游费是地区市场分割的壁垒,各个地区的运营商都在自己的地盘里过着垄断带来的好日子。比如,在
漫游费的高墙下,你是北京的用户,想用重庆的电话,因为重庆的话费
可能要便宜一些。但是,漫游费就让你用重庆的电话比用北京的电话还
要贵。这样,即使重庆的电话费比北京的电话费便宜,漫游费也让你难
以企及,因为加上漫游费,对你来说用重庆的电话就要比用北京的电话
贵了。同样,重庆的用户也会只用重庆的电话,各个地区的用户都只用
本地区的电话,全国性的统一竞争性市场就被分割成各个地区的垄断市
场,而用户们也不得不支付高额的话费。在这里,博弈论所起的作用
是:它预言统一市场中会出现价格战。因为如果你知道一点博弈论,就
一定知道“囚徒困境”这样简单的博弈论模型,也知道两个小偷在警察面
前都会相互出卖同伙的结果。竞争性市场里的企业相互杀价,进行价格
战就是“囚徒困境”,而相互出卖是它们的选择。
怎么样,博弈论让你大开眼界了吧。其实,在博弈论里,这样的妙
招很多,它会教你怎样识破谎言。1996年的诺贝尔经济学奖得主之一、博弈论专家维克里就教会招标人如何识破投标人的谎言,让投标人老老
实实地把真实的底价告诉招标人。举一反三,同样基于惧怕价格战的原因,沃尔玛与麦德龙连锁店在
选址上就不会十分接近。读者也许会注意到,沃尔玛与麦德龙在全世界
任何地方的分店,通常都有足够远的距离。这样,即使居住在沃尔玛附
近的消费者知道麦德龙的商品可能较沃尔玛便宜,但是较远的空间距离
也让他对于放弃沃尔玛而去麦德龙购物望而却步。同样,居住在麦德龙
附近的消费者也会是麦德龙的客户。沃尔玛与麦德龙之间拉开空间距
离,就能够相互维护二者之间的市场细分而避免价格战对于双方的伤
害。这是一种默契,也是博弈的结果。
博弈论不仅仅是学问,也不仅仅可供人们在茶余饭后消遣。更加重
要的是,博弈论在现实中被广泛运用,从英美国家的3G手机频率拍
卖,到1999年台湾“大选”中陈水扁上台,都明显或者不明显地采用了博
弈论的策略。1999年,台湾“总统大选”。当时,卸任“总统”李登辉暗地
想把“台独”分子陈水扁扶上台。国民党有两个候选人:连战与宋楚瑜。
尽管在那个时候国民党在台湾已经有一些日薄西山,但是与新起的民进
党相比,仍然是“瘦死的骆驼比马大”,小小的民进党是难以撼倒国民党
的。但是,李登辉是经济学家,作为台湾大学的经济学教授,他自然想
到了运用博弈论策略对国民党使阴招,尽管他当时还是国民党的总裁。
他通过媒体发表许多伤害宋楚瑜的言论,使宋楚瑜上当。因为一气之下
的宋楚瑜为了与作为国民党总裁的李登辉划清界限,就贸然把他的支持
者从国民党拉出去,另外成立了一个亲民党。这样,本来可以轻松击败
民进党的国民党,就由于选票被国民党与亲民党两个党分散,让民进党
最终取胜。可以说,李登辉在1999年是运用博弈论霍特林模型中的策
略,成功分化了国民党的选票而使陈水扁登上台湾“总统”的宝座,而他
对博弈论策略的运用也达到了炉火纯青、天衣无缝的水准。在霍特林模
型中,如果是两个候选人竞争,他们会使自己的政治纲领相互靠近,但
是,如果是三个候选人竞争,则其中一个候选人把自己的政治纲领适当
地与其他两个候选人的政治纲领拉开距离就可以取胜。由于连战与宋楚
瑜之前的选民都是国民党的选民,他们俩分开后,他们的支持者之间的
政治偏好是差不多的,所以,陈水扁只要把自己的政治主张适当地与他
们俩区分开来,就可以分别击败他们。李登辉是通过博弈论而瞒天过海
的,不仅让宋楚瑜上当,而且使整个国民党甚至选民们也被蒙在鼓里。
博弈论不仅仅是好玩,而且十分有用。我们来看看下面这个例子。
20世纪80年代,在美国有两家销售音响产品的商店——疯狂艾迪和纽马
克路易斯。疯狂艾迪为了阻止纽马克路易斯私下进行降价竞争,陷
入价格战导致双方同归于尽,便打出了这样一个广告:凡是在疯狂艾迪购买商品的顾客,如果发现在其他商店可以以更低的价格买到同样的商
品,疯狂艾迪可以按照差价的双倍对顾客进行补偿。这样,如果纽马克
路易斯私下降价,任何人都不会去它那里买东西。因为所有人为了获
得两倍差价的补偿都会去疯狂艾迪买商品。这意味着一旦纽马克路易
斯私下降价,则对方会自动降价更多,并且纽马克路易斯的顾客还会
流失。这种方式就迫使纽马克路易斯不敢私下降价,价格战就这样避
免了。
这个案例在全世界都被模仿。我在重庆的家乐福超市也看到过类似
于疯狂艾迪那样的广告:谁要是在重庆主城区以比本店更加便宜的价格
买到同样的商品,本店将按照差价的三倍补偿。
更加鲜活的例子是,在2012年,中国的电子商务巨头京东试图挑起
的一场大家电价格战被苏宁电器用与当年疯狂艾迪完全相同的博弈策略
秒杀了!2012年8月14日,京东商城的首席执行官刘强东在其实名认证
的微博上面声明:京东商城的所有大型家电将在未来三年里保持零毛
利,“保证比苏宁、国美连锁店便宜至少10%以上”。苏宁立即以微博接
招,宣布所有产品价格必然低于京东,否则将给予消费者两倍差价赔
付。于是,硝烟还没有升起,京东便偃旗息鼓了。苏宁简单搬用疯狂艾
迪的策略便一招致命,击退了京东的挑战。
在政治领域,博弈论更是如鱼得水。现今的政治科学研究,大量采
用博弈论的方法已经是世风。一些令人头疼的政治现象,用博弈论方法
看就是直截了当的了。譬如,中东和平进程为什么受阻,就是因为目前
的停滞状态是博弈论中的纳什均衡。巴勒斯坦要求以色列首先交还被占
领土,然后才声明放弃恐怖活动;而以色列要求巴勒斯坦首先宣布放弃
恐怖活动,然后它们才交还占领的巴勒斯坦领土。双方都不愿意首先改
变自己的策略。因为如果巴勒斯坦宣布放弃恐怖活动,以色列也可以不
交还被占领土,巴勒斯坦就惨了。同样,如果以色列交还了占领的巴勒
斯坦领土,巴勒斯坦也可以不宣布放弃恐怖活动,以色列也会吃大亏
的。因此,双方都不会首先改变自己目前的策略,这就是博弈论里的纳
什均衡。既然是纳什均衡,就是一种难以改变的胶着状态。
混合策略博弈是指博弈的参与人通过模糊自己的策略动机迷惑对手
的博弈。在人们的生活中,谈恋爱就是一种混合策略博弈。在谈恋爱的
过程中,女孩子通常会对于男孩子的追求反应含糊。因为如果女孩子说
她爱男孩子,男孩子就认为已经搞定,就不会继续狠追女孩子了,女孩
子会因此失去被追的愉悦。如果女孩子说她不爱男孩子,男孩子就会放弃,女孩子就会失去继续考察男孩子的机会。所以,女孩子总是对于男
孩子的追求若即若离,不轻易说她对他爱与不爱。这是混合策略的运
用。
一旦引入信息不对称,博弈论就更加魅力十足了。许许多多曾经是
扑朔迷离的社会现象、经济现象,甚至生命现象,在信息不对称假设下
就会令人感到茅塞顿开。
在2013年初,包括韩国和日本在内的一些在华外资汽车公司,纷纷
开始推出将新购汽车的保修期延长至5年的营销策略。外资企业采用这
种策略的目标是试图将中国的国产汽车公司挤出市场。以往,中国的国
产汽车与外资之间在华市场的竞争主要依靠价格优势。但是,由于劳动
力成本的上升,价格优势不再,外资企业依靠的是质量优势,这是国产
汽车公司难以模仿的,它们由此发出高质量的信号,从而形成不对称信
息中的分离均衡。
也就是说,在过去中国还具有低劳动力成本的情况下,国产汽车公
司与外资之间还存在竞争,这种竞争的均衡是外资的高质量与国产汽车
公司的低价格之间的平衡。到了2013年,国产汽车的低价格优势由于原
材料涨价和劳动力成本上升而逐渐式微,外资与国产汽车之间都在差不
多的价格水平上进行竞争了。在这种情况下,在同样的价格水平上,消
费者就更加偏好高质量的汽车。保修期越长,就可以被认为是质量越高
的产品。因为只有生产高质量产品的公司,才不会因为较长的保修期而
产生高昂的费用,这是由于高质量产品在即使是较长的时间里也较少出
现质量问题。这样,通过较长的保修期,企业就把高质量的信号发送给
了消费者,而消费者也就因此放弃购买没有发送高质量产品的企业产
品,转而购买发送高质量信号的企业产品了。
生命现象是我们这个地球上最神奇、最神秘的现象。达尔文的进化
论为我们说明了复杂的生命现象是如何进化而来的。正是博弈论为进化
论建立起了数学模型。
生命的个体也许并不是对于许多不同的生存策略进行理性的选择,而是通过偶然的试错过程发现了最优的策略。当所有个体都完成了最优
生存策略的“自然选择”之后,就达到了纳什均衡。个体因为发生突变而
面对不同的生存策略,而不同的生存策略给个体带来了不同的生存适应
度。只有那些带来最大适应度的策略才可以让个体生存下去,而通过遗
传,那些成功地“自然”选择了最优策略的个体便把自己的基因遗传了下来,而其他物种个体便灭绝了。博弈论专家证明,这种自然选择出来的
最优策略是纳什均衡策略,尽管并不假定生命个体一定是理性人——这
避免了传统经济学理性人假设带来的尴尬,因为心理学家经常会批评这
样的假定。
在人类出现的东非大峡谷,那些高个子的人类祖先,因为生存更加
困难(高个子更容易被豺狼虎豹看见,在野兽追来时更难以躲避),心脏
负荷大,需要更多的食物而处于生存劣势。因此,只有那些生存能力较
强的高个子基因遗传下来了。这是一种不对称信息博弈中的信号博弈现
象。高个子是发送优良基因的信号,所以人们在谈对象的时候,一般喜
欢高个子,这是因为他们或许载有更加优良的基因,可以通过与他们结
合把自己的基因遗传下去,因为既然高个子生存更加困难,但是当他们
还生存着时,就意味着他们具有更加强大的生存基因。表面看起来,喜
欢高个子是因为我们觉得高个子赏心悦目,是美的元素。其实,人类的
美感是与生存能力联系起来的。这是所谓进化博弈论的发现。
博弈论中最具魅力的部分是信号博弈。在进化博弈论里,信号博弈
把过去人们认为是纯粹主观性的审美解读成进化中的生存博弈形成的策
略,当然是物种在进化过程中的纯粹是自然选择的策略。
信号博弈还可以解释官僚贪污现象。官员贪污腐败是忠诚的信号。
读者可能会觉得奇怪:贪污腐败怎么与忠诚联系在一起?其实,政府官
员贪污尽管是古今中外都普遍存在的现象,但是从历史上看,在东方要
盛于西方。在东方,至少在过去,特别是东方一些完成现代化进程之前
的国家,贪污甚至是人们习以为常的,或者说是老百姓看来无可奈何的
现象。同时,我们注意到,在历史上,东方也普遍采取专制社会的社会
治理模式,以至在文献上会出现“东方专制社会”的术语。
我们下面从博弈论的信号发送机制出发,说明这两个社会现象之间
存在着密切的联系,即专制社会与官员贪污腐败之间存在着因果关系。
专制会带来贪污腐败,或者说比非专制社会更加普遍的贪污腐败现象,这种因果关系并不是简单地因为专制社会缺乏对于官员的监督,而是因
为在专制社会里,官员向其上司表忠诚,可以通过自己贪污腐败来发送
忠诚的信号,以利于保护自己。
在专制社会,官员的全部命运基本上都掌握在他上司手里。上司可
以决定他们的升迁,甚至掌控着他们的身家性命!官员为了保护自己,让上司找不到任何可以灭掉自己的口实,或者
让上司相信自己不会谋反,自己是完全忠诚于上司的,就需要发送这样
的信号给上司——我是忠诚于您的!
但是,发送的信号必须要满足“可置信”的条件。上司怎么才会相信
你的表白呢?
如果你非常清廉,这样就会有好的声誉。一旦你谋反成功,譬如谋
朝篡位,你的好声望就会让人民接受你,而让想攻击你的潜在敌人感到
要击败你是比较困难的。正是你的好声誉会助你谋反成功。
但是,如果你的声誉很糟糕,即使你谋反成功,人民也不会接受
你,你的敌人也会利用这一点对你发起攻击,并且会得到人民的响应,你会落败的。
这样,当你具有好的声誉时,你谋反成功并且取而代之的动机就会
比较强烈,相反,你的坏声誉会增加你谋反成功的难度,你的谋反动机
也就比较小了。
如果你并不想谋反,同时也要向上司表明你的忠诚,你就可以采取
自毁声誉的办法,增加你谋反成功的难度,同时也告诉你的上司,你是
不会谋反的,因为你谋反成功的机会很小!这种信号是可置信的。
当你的上司相信你不会谋反时,你就成功地保护了自己。
当然,官员的贪污不仅仅是为了实施这样的策略,也有真正对于财
富的贪婪。但是,人们对于财富的贪婪无论在东方还是西方社会都应该
是一样的,为什么在东方社会要更加普遍?这是因为东方社会普遍存在
的专制治理模式给这一信号发送提供了动力。所以,贪污作为信号是有
一定解释力的。
当然,这种信号理论比较适合解释皇帝身边的权臣贪污,并不能解
释下层官员的贪污。譬如,和珅生活在乾隆皇帝身边,但是其贪得无厌
到了不能企及的程度,乾隆皇帝反而对他宠爱有加。
据说张良在跟随刘邦进入京城的时候,便叫家丁们到街上去打砸
抢。这样的自毁声誉与贪污行为其实都是保护自己的策略,两者异曲同
工。博弈论看起来深刻奥妙,有一些玄乎。其实,博弈论就在我们身
边,每时每刻,无所不在。2013年春,朝鲜三次核爆,单方面宣布《朝
鲜停战协定》无效,大肆反美,令全世界都为朝鲜捏了一把汗。其实,如果从博弈策略的角度分析,朝鲜是有充分的自信的。朝鲜知道,美国
其实是不会打击朝鲜的。如果美国对朝鲜进行核打击,则东北亚会出现
核污染,会伤及驻日本和韩国的美军。美国政府在选民的压力下不得不
从东北亚撤出。这样,美国在东北亚核战争中不仅一无所得,而且还会
遭到全世界的责骂,并且灰溜溜地从长期盘踞的东北亚撤出。如果美国
用高科技常规武器打击朝鲜,朝鲜会用核武器反击,美军大败,加上东
北亚的核污染,导致美国同样会从东北亚撤出,朝鲜会崛起,统一半
岛。所以,美国人并不会对朝鲜进行打击,无论是用核武器还是常规武
器。事实上,这样的判断是存在先例的。1969年,当时因为中国与苏联
在珍宝岛的冲突,苏联打算对中国进行核打击,被美国的尼克松总统干
预制止了。尼克松并不是要帮中国的忙,而是怕中国与苏联的核战争污
染了驻日本和韩国的美军,导致美军不得不撤出东北亚。由此,朝鲜核
爆反美是它的占优策略——这是博弈论的术语,即在任何情况下都是最
优的策略。
因此,朝鲜完全可以大张旗鼓地反美,不断进行核爆挑衅,并不担
心美国会拿它怎么样。我们看到,在朝鲜不断升级的挑衅下,美国人基
本上是无动于衷的。因为一方面是朝鲜猜透了美国人的想法——他们不
敢动真格;另一方面,美国人也猜出了朝鲜的想法,知道他们知道自己
的想法——这就是博弈论——你知道他知道你知道他的……这就是博
弈!
既然是这样,双方都是在演戏,那么,朝鲜演这出戏是给谁看呢?
答案是:演给朝鲜的老百姓看。这样,新上台的领导会树立威信——瞧
瞧,咱弄得美国佬都拿咱没有办法!——还行吧!其实,在朝鲜核爆的
背后存在好几个博弈呢!在这样的情况下,当朝鲜雄起的时候,美国只
有处于守势,而给定美国处于守势,朝鲜当然会选择攻势——这是众所
周知的胆小鬼博弈,或者叫做斗鸡博弈。而且,朝鲜玩的是边缘博弈,并且,朝鲜越是疯狂,其实是表面上看起来是疯狂,越是脱离中国或者
俄罗斯的管束,边缘博弈的威慑作用就越大,不知道有多少人看出了这
一点!
好了,我们看到,潜藏在博弈论精深的数学模型背后的故事是多么
地精彩!每一个博弈论模型都有着一个好听的故事。本套丛书就为大家提供了更多更加好听的故事,赶快去读读吧……
蒲勇健
2013年3月20日
重庆渝中区瑞天路雍江苑
序 言
什么是策略行为?
人们在社会当中应该怎样举止行事?
我们将要给出的答案与道德或礼节无关。我们也不打算与哲学家、传道者或埃米莉·波斯特
注4 (Emily Post)一争高下。我们将要讨论的主题
虽然没有道德或礼节那么宏大,却同样反映我们每一个人的生活。本书
是讲述策略行为的。不管我们是否乐意,我们每一个人其实都是策略
家。既然这样,当一个出色的策略家总比当一个蹩脚的策略家更好一点
吧。本书的目的就是帮助你改善在开发和运用行之有效的策略方面的技
巧。
工作,即便只是社交生活,也可以看做是一个永无止息的决策过
程。从事什么样的工作,怎样打理一宗生意,该和谁结婚,怎样将孩子
抚养成人,要不要竞选总统,等等,这些都只不过是重大决策的几个例
子。上述情况存在一个共同的条件,即你不是在一个毫无干扰的真空世
界里做决定。相反,你的身边全是和你一样主动的决策制定者,他们的
选择与你的选择相互作用。这种互动关系将对你的思维和行动产生重要
的影响。
为了解释这一点,我们不妨设想一个伐木工人的决策和一个将军的
决策会有什么区别。当伐木工人考虑怎样砍伐树木的时候,他不必担心
木头可能跳起来进行反击。他的工作环境是中立的,没有对抗。不过,当一名将军打算消灭敌方军队的时候,他的每一步计划都会引来抵抗,他必须设法克服这种抵抗。和这位将军一样,你必须意识到,你的商业
对手、未来伴侣乃至你的孩子都是聪明而有主见的人。虽然他们的目标
常常与你的目标发生冲突,但他们当中同样包含你潜在的同盟者。在你
做决定的时候,必须将冲突考虑在内,同时注意发挥合作的效力。类似
的互动决定就具有策略性,与之相适应的行动计划称为一个策略。本书
将帮助你策略地思考,然后将这些想法付诸实践。
在社会科学当中,研究策略性决策制定过程的分支称为博弈论,原
意为游戏理论。这一理论涉及的“游戏”范围很广,从象棋到孩子抚养,从网球到企业兼并,从广告到军备控制,几乎无所不包。正如匈牙利幽
默大师乔治·米克斯(George Mikes)描述的那样,“许多欧洲人认为生活是一场游戏;英国人认为板球才是一场游戏”。我们则认为双方说得都不
错。
玩这些游戏需要用到许多不同类型的技巧。其中一种是基本技巧,比如打篮球不能缺少的投篮能力,在法律界工作不能缺少的判例知识,乃至打扑克不能缺少的一副不动声色的面孔。策略思维则是另外一种技
巧。策略思维从你的基本技巧开始,考虑的是怎样将这些基本技巧最大
限度地加以发挥。比如,你了解法律,就要确定为自己的委托人辩护的
策略;你了解你的橄榄球队传球或带球突破的本事有多大,而对手防御
的能力又有多好,那么,你作为一个教练,就要决定本队到底是应该传
球还是带球突破。有些时候,比如几个超级大国处心积虑构想一个大胆
的计划,其中包含触发一场核战争的危险,那么,策略思维还意味着懂
得适可而止。
我们的目标在于提高你的策略IQ。不过,我们并不打算提供一本策
略大全。我们建立了策略思维的概念和原理,假如你想将它们运用于自
己面临的某一个具体情况,并且想找出正确的选择,那么你还得再做一
些工作。这是因为,在一些关键方面,各种情况的具体条件都不尽相
同,我们即便开出用于指导行动的通用处方,到头来很可能只是误导了
你,弄巧成拙。无论遇到什么情况,你都要将我们讨论过的好的策略的
原理以及其他方面结合起来,一并进行考虑。你必须综合考虑这些因
素,而且,假如这些因素相互冲突,还要权衡各种不同因素的分量。我
们并不能承诺我们可以解决你遇到的一切问题。实际上,博弈论这门科
学远未达到完美佳境,而策略思维在某些方面看来仍然属于一门艺术。
我们倒是可以提供一些指导,帮助你将想法变成行动。第1章举了
几个例子,解释了在一系列不同的决定下策略问题是怎样出现的。我们
指出了一些行之有效的策略以及一些不那么行之有效的策略,甚至提到
了一些完全错误的策略。接下来的章节则把这些例子变成一个思考体系
或一个思考框架。而在最后几章,我们阐述了几个涉及范围更加广泛的
策略的情况,比如边缘政策、投票选举、激励机制以及讨价还价,你将
看到有关原理是怎样发挥作用的。
本书运用的例子既有人们熟悉的、琐碎的或有趣的类型——通常取
材于文学作品、体育比赛或者电影,也有令人畏惧的类型,比如核对
峙。前者只是一个用来阐述博弈论概念的赏心悦目的工具;至于后者,有些读者一度可能觉得核战争这个话题实在太吓人,不会有理性分析的
空间。不过,随着冷战的阴云渐渐消散,大家都相信世界会进入一种更加安定的局面。我们希望,在排除军备竞赛以及古巴导弹危机中的情绪
化内容干扰之后,我们可以重新检讨其中的博弈层面包含的策略逻辑。
这些章节以实例作为重要内容,不过,这些例子主要用于建立或描
述正在讨论的某个特定原理,至于具体用到的这个例子,其在现实当中
的许多细节都会忽略不计。在每章结尾,我们都提供了一个“案例分
析”,这就跟你在商学院上课时可能遇到的情形差不多。每个案例都具
备一系列特定条件,由你负责运用该章讨论的原理,确定这一情况下应
该采取的正确策略。有些案例没有标准答案,不过,这也正是人生的一
大特点。许多时候,并不存在完全正确的解决方案,只能用并不完美的
方法去处理遇到的问题。在研究我们的讨论之前,请仔细思考每一个案
例,这将比简单地读无数遍课文更有助于理解其中的观点和思路。为了
给大家提供更多的练习机会,我们在最后一章收录了23个案例,大致按
照越往后就越难的顺序排列。
读完本书,我们希望你能成为一位更精明的经理人、谈判者、运动
员、政治家或更高明的父母。我们提醒你,一些有助于达成上述目标的
好策略,不一定会为你赢得被你击败的对手的敬意。假如你想公平竞
争,那就告诉他们,你有这么一本书。第1部分
第1章 10个策略故事
我们从10个来自生活不同方面的策略故事开始,提供一些怎样才能
发挥最佳水准的初步概念。许多读者一定在日常生活中遇到过类似情
况,而且,通过一些思考或尝试,犯过一些错误后,也找出了正确的解
决方法。对于其他读者,这里的一些答案可能出人意料,不过,让读者
感到惊讶不是我们提出这些例子的根本目的。我们的目的是要指出,类
似这样的情形普遍存在,而且形成一系列相互关联的问题,系统地思考
这些问题可能会让你收到事半功倍的效果。请把这些故事当做主菜之前
的开胃菜,它们的作用是增进你的食欲,而不是马上把你撑饱。
1.妙手传说
运动员究竟有没有一朝命中、百发百中的“妙手”这一说?有时候,乍看上去,篮球明星拉里·伯德(Larry Bird)、冰球明星韦恩·格雷茨基
(Wayne Gretzky)或是足球明星迭戈·马拉多纳(Diego Maradona)真的是百
发百中,永不落空。体育比赛解说员们看到这种长期存在、永不落空的
成功事迹,就会宣称这名运动员具有出神入化的妙手。不过,按照心理
学教授托马斯·吉洛维奇(Thomas Gilovich)、罗伯特·瓦隆(Robert Vallone)
和阿莫斯·特维斯基(Amos Tversky)的说法,这其实是对真实情况的一种
误解。[1] 他们指出,假如你抛硬币抛上足够长的时间,你也会遇到
在很长一段时间里全是抛出同一面的情况。这几位心理学家怀疑体育解
说员们其实是找不到更有意思的话题,只好从一个漫长的赛季中寻找某
种模式,而这些模式跟长时间抛硬币得出的结果其实没有什么两样。因
此,他们提出了一个更加严格的测试。比如,在篮球比赛中,他们只看
一个运动员投篮命中的数据,据此考察这名运动员下一次出手仍然命中
的概率究竟有多大。他们也用同样的方法研究这名运动员在这次出手没
有命中却在下一次出手命中的情形。比较命中一次之后再次出手仍然命
中的概率与这次没有命中而再次出手命中的概率,假如前者高于后者,那就表明妙手一说不无道理。
他们选择美国NBA费城76人队(Philadelphia 76ers)进行测试,结果与
妙手一说发生矛盾:一名运动员投篮命中之后,下一次出手就不大可能
命中了;假如他在上一次出手没有命中,再出手时反倒更可能命中。就
连拥有“得分机器”称号的安德鲁·托尼(Andrew Toney)也不例外。这是否意味着,我们谈论的其实是“射频观测器之手”,因为运动员的水准有起
有伏,就跟射频观测器的灯光忽明忽暗一样?
博弈论提出了一个不同的解释。尽管统计数据否定了一朝命中、百
发百中之说,却没有驳倒一个“鸿运当头”的运动员很可能在比赛当中通
过其他方式热身,渐入佳境。“得分机器”之所以会不同于“妙手”,原因
在于攻方和守方的策略会相互影响。比如,假设安德鲁·托尼真有那么
一只妙手,对手们一定会对他实施围追堵截,从而降低他的投篮命中
率。
事实还不仅如此。当防守一方集中力量对付托尼的时候,他的某个
队友就无人看管,更有机会投篮得分。换句话说,托尼的妙手大大改善
了76人队的团队表现,尽管托尼自己的个人表现可能有所下降。因此,我们也许应该通过考察团队合作连续得分的数据来测试妙手一说。
许多其他团队项目也有类似情况。比如在一支橄榄球队里,一个出
色的助攻后卫将大大改善全队的传球质量,而一个拥有优异的接球才能
的运动员则有助于提高全队的攻击力,因为对方被迫将大部分防守资源
用于看管这些明星。在1986年的世界杯足球决赛上,阿根廷队的超级明
星迭戈·马拉多纳自己一个球也没有进,不过,全靠他从一群联邦德国
后卫当中把球传出来,阿根廷队两次射门得分。明星的价值不能单凭他
的得分表现来衡量;他对其他队友的贡献更为至关重要,而助攻数据有
助于衡量这种贡献的大小。冰球项目排列个人表现名次的时候,助攻次
数和射门得分次数占有同等分量。
一个运动员甚至可能通过一只妙手带动另一只手热身,进而变成妙
手,帮助他自己提高个人表现水准。比如波士顿凯尔特人队的明星拉里
·伯德,他喜欢用右手投篮,虽然他的左手投篮技术同样远在大多数人
之上。防守一方知道伯德通常用右手投篮,自然会不惜集中一切兵力防
他的右手。不过,他们的这一计划不能完全奏效,因为伯德的左手投篮
技术亦实在了得,他们不敢大意,非得同样派人看守不可。
假如伯德在两个赛季之间苦练左手投篮技术,又会怎样呢?防守一
方的反应就是增派兵力阻止他用左手投篮,结果却让他更容易用右手投
篮得分。左手投篮得分提高了,右手投篮得分也会提高。在这个案例当
中,左手不仅知道右手在做什么,而且帮了大忙。
再进一步,我们会在第7章说明左手越厉害,用到的机会反而可能越少。许多读者大约在打网球的时候已经遇到过类似的情况。假如你的
反手不如正手,你的对手渐渐就会看出这一点,进而专攻你的反手。最
后,多亏了这样频繁的反手练习,你的反手技术大有改善。等到你的正
反手技术几乎不分上下,你的对手再也不能靠攻击你的弱势反手占便宜
时,他们攻击你的正手和反手的机会渐渐持平,而这可能就是你通过改
善自己的反手技术得到的真正好处。
2.领先还是不领先
1983年美洲杯帆船赛决赛前4轮结束之后,丹尼斯·康纳(Dennis
Conner)的“自由号”在这项共有7轮比赛的重要赛事当中暂时以3胜1负的
成绩排在首位。那天早上,第五轮比赛即将开始,“整箱整箱的香槟送
到‘自由号’的甲板。而在他们的观礼船上,船员们的妻子全都穿着美国
国旗红、白、蓝三色的背心和短裤,迫不及待要在她们的丈夫夺取美国
人失落132年之久的奖杯之后参加合影。”[2] 可惜事与愿违。
比赛一开始,由于“澳大利亚二号”抢在发令枪响之前起步,不得不
退回到起点线后再次起步,这使“自由号”获得了37秒的优势。澳大利亚
队的船长约翰·伯特兰(John Bertrand)打算转到赛道左边,满心希望风向
发生变化,可以帮助他们赶上去。丹尼斯·康纳则决定将“自由号”留在
赛道右边。这一回,伯特兰大胆押宝押对了,因为风向果然按照澳大利
亚人的心愿偏转了5 ,“澳大利亚二号”以1分47秒的巨大优势赢得这轮
比赛。人们纷纷批评康纳,说他策略失败,没能跟随澳大利亚队调整航
向。再赛两轮之后,“澳大利亚二号”赢得了决赛桂冠。
帆船比赛给我们提供了一个很好的机会,观察“跟随领头羊”策略的
一个很有意思的反例。成绩领先的帆船,通常都会照搬尾随船只的策
略。一旦遇到尾随的船只改变航向,那么成绩领先的船只也会照做不
误。实际上,即便成绩尾随的船只采用一种显然非常低劣的策略时,成
绩领先的船只也会照样模仿。为什么?因为帆船比赛与在舞厅里跳舞不
同,在这里,成绩接近是没有用的,只有最后胜出才有意义。假如你成
绩领先了,那么,维持领先地位的最可靠的办法就是看见别人怎么做,你就跟着怎么做。
注5
股市分析员和经济预测员也会受这种模仿策略的感染。业绩领先的
预测员总是想方设法随大流,制造出一个跟其他人差不多的预测结果。
这么一来,大家就不容易改变对这些预测员的能力的看法。另一方面,初出茅庐者则会采取一种冒险的策略:他们喜欢预言市场会出现繁荣或崩溃。通常他们都会说错,以后再也没人听信他们,不过,偶尔也会有
人做出正确的预测,一夜成名,跻身名家行列。
产业和技术竞争提供了进一步的证据。在个人电脑市场,IBM的创
新能力远不如将标准化的技术批量生产、推向大众市场的本事那么闻
名。新概念更多是来自苹果电脑、太阳电脑和其他新近创立的公司。冒
险性的创新是这些公司脱颖而出夺取市场份额的最佳策略,大约也是唯
一途径。这一点不仅在高科技产品领域成立。宝洁作为尿布行业的
IBM,也会模仿金佰利(Kimberly Clark)发明的可再贴尿布粘合带,以再
度夺回市场统治地位。
跟在别人后面第二个出手有两种办法。一是一旦看出别人的策略,你立即模仿,好比帆船比赛的情形;二是再等一等,直到这个策略被证
明成功或者失败之后再说,好比电脑产业的情形。而在商界,等得越久
越有利,这是因为,商界与体育比赛不同,这里的竞争通常不会出现赢
者通吃的局面。结果是,市场上的领头羊们,只有当它们对新生企业选
择的航向同样充满信心时,才会跟随这些企业的步伐 。
3.直奔牢房
有这么一个笑话,说的是在斯大林时期的苏联,有一位乐队指挥坐
火车前往下一个演出地点,正在车上翻看当晚将要指挥演奏的作品的乐
谱。两名克格勃军官看见他在读着什么,错把乐谱当成某种密码,立即
将他作为间谍逮捕了。他争辩说那只是柴可夫斯基的小提琴协奏曲,却
无济于事。在他被投入牢房的第二天,审问者自鸣得意地走进来,说:“我看你最好还是老实招了吧。我们已经抓住你的朋友柴可夫斯基
了,他这会儿正向我们招供呢。”
这个笑话成了介绍囚徒困境的开场白,而囚徒困境可能是最广为人
知的博弈。现在我们就来看看它如何导出符合逻辑的结果:假设克格勃
真的逮捕了某人,而此人的唯一罪名就是取了“柴可夫斯基”这么一个名
字,而且克格勃将乐队指挥和他分开进行审问。如果这两名无辜者否认
克格勃指控的罪名,那么,他们将分别被判处3年徒刑。
注6 如果乐队指
挥昧着良心承认罪名,其中还牵涉到那位素不相识的所谓“同谋”,柴可
夫斯基却仍然否认罪名,那么,乐队指挥可以在1年之后获得自由(以及
克格勃的赞赏之情),而柴可夫斯基则会因拒不认罪而遭到严厉惩罚,被判处25年徒刑。当然了,假如乐队指挥与柴可夫斯基调换一下,乐队
指挥拒不认罪,柴可夫斯基不但屈从认罪,还把他供了出来,那么,两人的下场也会发生相应的变化。假如两人同时认罪,那么,他们都将被
判处这一罪名的标准刑罚——10年徒刑。
注7
现在设想乐队指挥的思路。他知道柴可夫斯基要么招供,要么拒不
认罪。假如柴可夫斯基招供,乐队指挥若是拒不认罪或招供,与之对
应,他会被判处25年或10年徒刑,相比之下,对他来说招供的下场显然
略胜一筹。假如柴可夫斯基拒不认罪,乐队指挥若是同样拒不认罪或招
供,与之对应,他会被判处3年或1年徒刑,相比之下,对他来说招供的
下场仍然略胜一筹。由此可见,招供显然是乐队指挥的最佳做法。
而在捷尔任斯基广场(Dzerzhinsky Square)另一个单人牢房里,柴可
夫斯基也在做同样的盘算,得出同样的结论。当然了,结果是两个人同
时招供。之后,当他们在古拉格群岛(Gulag Archipelago)流放地见面,说出各自的经历后,比较一番,就会发现,他们其实吃亏了。因为,假
如他们两人都拒不认罪,他们两人的刑期都会大大缩短,早日重获自
由。
假如他们在接受审问之前有机会见面好好谈清楚,那该有多好,他
们一定会同意拒不认罪。不过,接下来他们很快就会意识到,无论如
何,那样一个协定也不见得管用。一旦他们被分开,审问开始,每个人
内心深处那种企图通过出卖别人而换取一个更好判决的想法就会变得非
常强烈。这么一来,他们还是逃脱不了最终在古拉格相遇的命运,大概
还会在那里好好算一账,看看谁欠谁更多。这两个人究竟有没有可能取
得足够的相互信任,从而达成双方都希望看到的结果呢?
许多人,许多企业,乃至许多国家,都曾经吃过囚徒困境之苦。看
看生死攸关的核军备控制问题吧。每个超级大国最希望看到的结果都是
另一个超级大国销毁核武器,而它自己则继续保留核武器,以防万一。
最糟糕的结果莫过于自己销毁核武器,而别人却依旧全副武装。因此,无论另一方怎么做,自己一方仍然倾向于保留核武器。不过,它们双方
也有可能一致认为,双方同时销毁核武器的结果会比一方销毁而另一方
不销毁的结果更好。现在的问题在于决策之间的相互依赖性:双方一致
希望看到的结果出现在各方都选择各自比较糟糕的策略的时候。假如各
方都有很明确的想法,打算突破有关协定,私底下发展自己的核武器,还有没有可能达成各方一致希望看到的结果呢?在这种情况下,只有其
中一方来一个思维方式的根本改变,才能推动世界回到裁减核军备的轨
道上去。本着为自己的舒适生活、安全乃至生命着想,我们都有必要了解如
何走出囚徒困境。在第4章,我们还会探讨一些类似的方法,看看这些
方法什么时候可能有效,又是怎样发挥作用的。
囚徒困境的故事还体现了一个普遍的现象:大多数经济的、政治的
或社会的博弈游戏都跟类似橄榄球或扑克这样的博弈游戏不同。橄榄球
和扑克是零和博弈:一个人的得就是另一个人的失。但在囚徒困境里,有可能出现共同利益,也有可能出现利益冲突;不招供的结果对两个囚
徒都是有利的,而不是相反。与此相仿,在劳资双方的讨价还价中,虽
然存在利益冲突,一方希望降低工资,而另一方要求提高工资,不过,大家都知道,假如谈判破裂而导致罢工,双方都将遭受更大的损失。任
何一个关于博弈的有用的分析,都应该考虑到怎样处理冲突与利益同时
存在的情形。我们通常将博弈游戏的参加者称为“对立者”,不过,你也
要记住,有时候,策略可能将原本毫不相干的人变成一条绳上相互依存
的两只蚂蚱。
4.我将坚持到底
天主教会要求马丁·路德(Martin Luther)公开悔过,收回他抨击教皇
及其顾问班子的主张。他拒绝公开认错:“我不会收回任何一点主张,因为违背良心做事既不正确,也不安全。”而且他也不打算寻求妥
协:“我将坚持到底,我不能屈服。”[3] 路德拒不让步的态度是以他
自己的立场的神学性为基础的。在确定什么才是正确的问题上,根本没
有妥协的余地。长期来看,他的坚定立场产生了深远的影响;他的抨击
最后引发了新教改革运动,从根本上改变了中世纪的天主教会。
注8
与此相仿,查尔斯·戴高乐(Charles de Gaulle)也借助拒不妥协的力
量,在国际关系竞技场上成为一个强有力的参与者。正如他的传记作者
唐·库克(Don Cook)描述的那样,“(戴高乐)单凭自己的正直、智慧、人
格和使命感就能创造力量”[ 4] 。不过,说到底,他的力量是“拒不妥
协的力量”。第二次世界大战期间,他作为从一个战败且被占领的国家
逃亡出来的自封的领导人,在与罗斯福(Roosevelt)和丘吉尔(Churchill)的
谈判中仍然坚守着自己的立场。20世纪60年代,他作为总统说出
的“不!”迫使欧洲经济共同体多次按照法国的意愿修改决策。
在讨价还价当中,他的拒不妥协态度究竟是怎样赋予他力量的呢?
一旦戴高乐下定决心坚守一个立场,其他各方只有两个选择:要么接
受,要么放弃。比如,他曾经单方面宣布要将英国拒于欧共体之外,一次是1963年,一次是1968年;其他国家不得不从接受戴高乐的否决票和
分裂欧共体两条出路当中做出选择。当然,戴高乐非常谨慎地衡量过自
己的立场,以确保这一立场会被接受。不过,他这么做往往使法国独占
了大部分战利品,很不公平。戴高乐的拒不妥协剥夺了另一方重新考虑
整个局面、提出一个可被接受的相反建议的机会。
在实践中,“坚持到底,拒不妥协”说起来容易做起来难,理由有
二。第一个理由在于,讨价还价通常会将今天谈判桌上的议题以外的事
项牵扯进来。大家知道你一直以来都是贪得无厌的,因此以后不大愿意
跟你进行谈判。又或者,下一次他们可能采取一种更加坚定的态度,力
求挽回他们认为自己将要输掉的东西。在个人层面上,一次不公平的胜
利很可能破坏商业关系,甚至破坏人际关系。实际上,传记作者戴维·
舍恩布伦(David Schoenbrun)这样批评戴高乐的盲目的爱国主义:“在人
际关系当中,不愿给予爱的人不会得到爱;不愿做别人朋友的人到头来
会一个朋友也没有。戴高乐拒绝建立友谊,最后受伤的还是法
国。”[5] 一个短期妥协可能从长期来看会是一个更好的策略。
第二个理由在于达到必要程度的拒不妥协并不容易。路德和戴高乐
通过他们的个性做到了这一点。不过这样做是要付出代价的。一种顽固
死硬的个性可不是你想有就有,想改变就能改变的。尽管有些时候顽固
死硬的个性可能拖垮一个对立者,迫使他做出让步,但同样可能使小损
失变成大灾难。
费迪南德·德雷赛布(Ferdinand de Lesseps)是一个能力中等的工程
师,具有非同寻常的远见和决心。他由于在外人看来几乎不可能的情况
下建成了苏伊士运河而名噪一时。他并不认同不可能的说法,因此完成
了这一伟业。后来,他照搬同样的思路,试图建设巴拿马运河,结果演
变成一场大灾难。
注9 尽管尼罗河的沙子让他备感得心应手,热带瘴气
却打了他一个措手不及。德雷赛布的问题在于他顽固死硬的个性不允许
他承认失败,哪怕战役早已输掉。
我们怎样才能做到有选择的顽固死硬呢?虽然我们没有一个理想的
解决方案,却有几个办法可以帮助达成约定,并且维持下去;这是第6
章将要谈到的内容。
5.给猫拴个铃铛
童话故事里有一个给猫拴铃铛的故事,大意是这样:老鼠们意识到,假如可以在猫脖子上拴一个铃铛,那么,它们的小命就会大有保
障。问题在于,谁会愿意冒赔掉小命的风险给猫拴上铃铛呢?
这个问题同样摆在老鼠和人类面前。占据支配地位的党派或独裁暴
君怎样才能通过规模相对较小的军队长期控制数目很大的一个人群呢?
整架飞机的众多乘客为什么只要出现一个持枪劫机者就会显得无计可
施,束手就擒?在这两个例子里,只要大多数人同时采取行动,就很容
易取得成功。不过,统一行动少不了沟通与合作,偏偏沟通与合作在这
个时候变得非常困难,而压迫者由于深知群众的力量有多大,还会采取
特殊的措施,阻挠他们进行沟通与合作。一旦人们不得不单独行动,希
望聚沙成塔,集腋成裘,问题就出来了:“谁该第一个采取行动?”担当
这个任务的领头人意味着要付出重大代价,甚至可能付出生命。他得到
的回报则会是死后的光荣或受人感激。确实有人在想到责任或荣誉的时
候会感到热血沸腾,挺身而出,但大多数人还是认为这么做的代价超出
了得益。
在苏共第二十次代表大会上,赫鲁晓夫首次谴责斯大林的大清洗运
动。他那充满戏剧性的讲话刚刚结束,听众里就有人大叫起来,质问赫
鲁晓夫自己那个时候又在做什么。赫鲁晓夫的反应是请提问者站起来,报出自己的姓名。听众一片沉默。赫鲁晓夫答道:“当时我也是这么做
的。”
从某种意义上讲,我们以前都见过这样的例子。这只不过是涉及超
过两个人的囚徒困境;你也可以把它称为“人质困境”。现在我们要用这
个困境阐述一个不同的观点,确切地说,就是惩罚经常压倒回报而处于
上风。独裁者可以通过向大众提供物质乃至精神安慰保持局势稳定,不
过,这个做法可能需要付出高昂代价。建立在人质困境之上的压迫和恐
吓可能是一种代价小得多的替代选择。
这一原理有很多例子。在一个大型出租车队里,汽车经常是由调度
员派给司机的。车队里既有好车,也有年久失修的老爷车。调度员可以
利用他的调度权向每个司机收取一点贿赂。谁若是拒绝行贿,就一定会
得到一部老爷车,而那些愿意合作的司机就会“抽到”上上好签。
注10 这
么一来,调度员是发达了,但司机们作为一个群体,面对的还是他们就
算不贿赂调度员也能得到的同样一些汽车。假如司机们联合起来,也许
可以结束这种被迫行贿的日子,问题在于怎样才能组织起来采取行动。
问题的关键不是调度员能从行贿者那里得到多少好处,而是他可以严厉
惩罚那些不肯行贿的人。将租户从实行房租控制的公寓中赶出去是另外一个类似的例子。假
如某人在纽约买了这么一幢房子,他有权赶走一个租户,这样自己就能
住进去。不过,这个规定最后却变成了赶走全部租户的权利。一个新房
东可以对住在1A房间的租户说:“我有权住在自己的房子里。因此,我
打算把你赶走,搬进你的房间。不过,假如你肯合作,自愿离开,我会
给你5 000美元作为报答。”对于一幢实行房租控制的房子的价格而言,这个数目只是九牛一毛(虽然这笔钱确实可以在纽约买一堆地铁票)。租
户面临两个选择,一是拿着5 000美元走人,二是什么也得不到,还是
要走人,当然他选择前者。接下来,房东向1B的租户说同样的话,直到
所有租户都搬家走人。
汽车制造业工人工会在跟汽车制造商一个接一个进行谈判的时候也
占有类似的优势。单是一场针对福特汽车公司的罢工就会使福特处于非
常不利的地位,因为通用汽车公司和克莱斯勒公司继续对工会采取合作
态度,因此,福特很有可能迅速采纳对工会有利的条件,达成和解。这
么一场罢工在工会这边看来代价也是较小的,毕竟只有13的工会成员
失去工作。赢得福特一役之后,工会转而会跟通用谈判,接着是克莱斯
勒,引用前面各次战役的胜利作为先例,进一步壮大自己的声威。日本
工会则另有一套做法,因为日本工会是由公司组织的,在公司里占有很
大的利润份额。假如丰田的工会罢工,其成员的薪水就会随着丰田的利
润下跌而下跌,他们以前的努力什么也得不到。
我们倒不是说上述任何一个或所有例子都是好的结局或理想的政
策。在某些情况下,可能引起强烈的争议,要求避免我们所描述的那种
结果。不过,要想使我们所做的努力奏效,我们必须看清问题产生的机
制,即“手风琴效应”,每一个折叠都会推动或拉动邻近一个折叠。这一
现象虽然一再发生,其实又是可以克服的,我们将在第9章告诉各位怎
样可以做到这一点。
6.楔子的尖端
许多国家运用关税、配额以及其他方法限制进口,保护本土产业。
这样的政策会抬高价格,损害国内所有使用受保护产品的消费者的利
益。经济学家估计,假如美国运用进口配额保护钢铁、纺织或制糖产
业,导致大家不得不购买价格更高的产品,换算过来,相当于每保住这
些产业一个职位,美国国内其他人就要付出10万美元的代价。[6] 为
什么会这样,极少数人的得益怎么总是会压倒更大多数人的损失而得到优先考虑呢?
秘诀在于一次提出一件事情。首先,美国制鞋产业的1万个职位面
临着威胁。要想挽救这些职位,国内其他人就得付出10亿美元,或人均
付出4美元。谁不愿意付出4美元保住1万个职位呢?即便素昧平生的陌
生人也会愿意的吧,尤其是在可以把所谓不择手段的外国人当做现成的
诅咒目标之际。接着就轮到服装产业、钢铁产业、汽车产业,等等。没
等我们明白过来,我们已经点头同意付出500多亿美元,相当于人均付
出200多美元,或每个家庭付出1 000多美元。假如我们事前可以看穿整
个过程,我们大概会想,这个代价是不是太高了,继而坚持要让上述各
个产业的工人自己承担国际贸易带来的风险,就像他们承担任何其他经
济风险一样。就个案逐项进行决策可能导致全部结果都与我们的意愿南
辕北辙。实际上,一项决定即便获得多数人投票赞成,仍然有可能导致
一个在每个人看来都比现状更糟的结果。
1985—1986年间的所得税改革之所以几乎走向崩溃,原因就在于参
议院一开始采取的是对提案逐个解决的思路。在财政委员会第一轮条款
讨论会上,财政部提案已被修改到带有太多特别利益条款而变得不堪重
负,最后不得不宣告无效。参议员们意识到,他们面对有组织的院外集
团的游说活动时简直是“软弱无力”,根本不可能阻止这些游说者谋求特
殊待遇。要命的是,这些游说者若是联合起来,最终很可能毁灭这个法
案,比干脆不推出任何法案更糟糕。于是,委员会主席、参议员帕克伍
德(Packwood)进行了他自己的游说活动:他劝说委员会大多数成员投票
反对任何一个针对所得税法案的修正案,哪怕这个修正案特别有利于他
们的选民也在所不惜。本次改革终于得以立法通过。不过,已经有人发
起了要求增加特殊条款的反击,每次提出一两条要求修正。
按照同样的思路,逐项否决权使总统可以有选择地否决法案。假如
一个法案授权拨款资助学校提供午餐和建造一架新的航天飞机,总统本
可以选择两个都否定、只批准其中一个或两个都批准,但是目前却只有
两个选择,即两个都否定或者两个都批准。虽然第一反应可能是这将赋
予总统更大的权力,控制立法过程,但若是反过来,结果可能是国会将
更有选择性地看待有待它通过的法案。
注11 逐项否决权虽然一般被认为
违反宪法,不过究竟是否如此,还是留给高等法院裁决为好。
之所以出现这些问题,是因为短视的决策者没能看远一点,他们看
不到全局。在所得税改革的例子里,参议院勉强来得及恢复自己的远
见;但在保护主义的老问题上,依旧未能取得突破。第2章将会建立一个体系,有助于改善长期策略远见。
7.三思而后行
人们陷入某种境地而发现从此难以脱身的情况实在是太普遍了。比
如,一旦你在某个城市找到一份工作,那么,换一个地方重新安置下来
的代价就会变得很高;一旦你买了一台电脑,学会了怎样使用其操作系
统,那么,学会另一种操作系统,改写你的全部程序,其代价就会变得
很高。同样,参加了一家航空公司的里程积分计划的旅行者若想搭乘另
一家航空公司的飞机,付出的代价也会更高。还有,当然了,从婚姻围
城中逃脱出来的代价也很高。
问题在于,一旦你做出了类似的承诺,比如接受了工作或结了婚,你的讨价还价地位就会被削弱。公司大可以利用其职员预期的搬家成本
高,向他们支付较低薪水或降低加薪幅度。电脑公司可以给新出的可兼
容的外围设备标出更高的价码,因为它们知道,它们的消费者不会轻易
转向同样是新出的却不兼容的技术。至于航空公司,一旦找到数目庞大
的里程积分计划参加者,就不大愿意参与价格战了。夫妻签订的平均分
担家务的协议一旦遇到小孩出生,就不得不重新谈判一番。
能够预见到上述后果的策略家会赶在他们的讨价还价能力仍然存在
的时候充分利用,换句话说就是在他们订下契约之前。一般情况是采取
预先支付酬劳再签约的形式。潜在的利益谋取者相互竞争会导致同样的
结果。比如,公司不得不提供更具吸引力的起薪;电脑制造商不得不为
它们生产的中央处理器(CPU)标出足够低的价格;而航空公司的里程积
分计划也不得不为登记参加者提供更多的积分奖励以吸引他们。至于结
了婚的夫妇,其对各自利益的谋取可能会变成一场两个人玩的博弈游
戏。
同样的深谋远虑也使许多好奇却又理智的人不至于亲身尝试会上瘾
的毒品,比如海洛因。汤姆·莱勒(Tom Lehrer)写的一首歌这样描述毒品
贩子的策略:
他给孩子赠送免费样品,因为他实在太了解,今天仍然天真无邪的面孔,明天就会变成他的新客户。
聪明的孩子也了解这一点,所以拒绝了那些免费样品。
8.多管齐下
现在让我们回到体育世界。在橄榄球比赛里,每一次贴身争抢之
前,攻方都会在传球或带球突破之中择其一,而守方则会把赌注押在其
中一个选择上,做好准备进行反击。在网球比赛里,发球一方可能选择
接球一方的正手或反手,而接球一方则准备在回击的时候选择打对角线
或直线。在这两个例子里,每一方都对自己的优点和对方的弱点有所了
解。假如他们的选择可以同时考虑到怎样利用对方所有的弱点,而不是
仅仅瞄准其中一个弱点,那么,这个选择应该算是上上之策。球员和球
迷一样都很明白,必须多管齐下,来些出其不意的奇袭。理由在于,假
如你每次都做同样的事情,对方就能集中全部力量最大限度地还击你的
单一策略,还击效果也会更好。
多管齐下并不等于说要按照一个可以预计的模式交替使用你的策
略。若是那样的话,你的对手就会通过观察得出一个模式,从而最大限
度地利用这个模式还击,其效果几乎跟你使用单一策略一样好。实施多
管齐下策略,诀窍在于不可预测性。
设想一下,假如存在一些人人都知道的公式,用来确定谁将受到美
国国税局(IRS)的审计,在你填写报税单的时候,你就会套用这些公式
看看自己会不会受到审计。假如预计到你会受到审计,而你又找到一个
办法“修改”你的报税单,使其不再符合那些公式以避免被审计,很可能
你已经动手这样做了。假如被审计已经无法避免,你大概会选择如实相
告。国税局的审计行动若是具有完全可预见性,结果将会把审计目标确
定在错误的人群身上。所有那些被审计的人早就预见到自己的命运,早
就选择了如实相告,而对于那些逃过审计的人,能够看管他们的就只有
他们自己的良心了。假如国税局的审计公式在一定程度上是模糊而笼统
的,大家都有那么一点面临审计的风险,人们也就会更加倾向于选择诚
实。
商界也有类似的现象。设想一下剃须刀市场的竞争情况。假设吉列
定期举行购物券优惠活动,比如每隔一个月的第一个星期天进行,那么
毕克(Bic)可以通过提前一个星期举行购物券优惠活动的方式予以反击。
当然,这么一来毕克的路数就会变得具有可预见性,吉列可以照搬毕克的策略,相应将自己的优惠活动提前到毕克前面去。这种做法最终导致
刺刀见红的残酷竞争,双方的利润都会下跌。不过,假如双方都采用一
种难以预见或者多管齐下的混合策略,那么很可能会一起降低竞争的惨
烈程度。
随机策略的重要性是博弈论早期提出的一个深谋远虑的观点。这个
观点本身既简单,又直观,不过,要想在实践当中发挥作用,我们还得
做一些细致的设计。比如,对于网球运动员,光是知道应该多管齐下,时而攻击对方的正手,时而攻击对方的反手,这还不够。他还必须知道
他应该将30%的时间还是64%的时间用于攻击对方的正手,以及应该怎
样根据双方的力量对比做出选择。在第7章我们会介绍一些可以解答上
述问题的方法。
9.别跟笨蛋对等打赌
在《红男绿女》(Guys and Dolls)一片中,赌棍斯凯·马斯特森(Sky
Masterson)想起他父亲给他提的这个很有价值的建议:
孩子,在你的旅途中,总有一天会遇到有一个家伙走上前来,在你
面前拿出一副漂亮的新扑克,连塑料包装纸都没有拆掉的那种;这个家
伙打算跟你打一个赌,赌他有办法让梅花J从扑克牌里跳出来,并把苹
果汁溅到你的耳朵里。不过,孩子,千万别跟这个家伙打赌,因为就跟
你确确实实站在那里一样,最后你确确实实会落得苹果汁溅到耳朵里的
下场。
这个故事的背景是,内森·底特律(Nathan Detroit)要跟斯凯·马斯特
森打赌,看看明迪糕饼店的苹果酥和奶酪蛋糕哪一样卖得比较好。正
好,内森刚刚发现了答案(苹果酥!)。他当然愿意打赌,只要斯凯把赌
注压在奶酪蛋糕上。
这个例子听上去也许有些极端。当然没有人会打这么一个愚蠢的
赌。不过,仔细看看芝加哥交易所的期货合同市场吧。假如一个交易者
提出要卖给你一份期货合同,那他只会在你损失的情况下得益。这个交
易是一宗零和博弈,就跟体育比赛一样,一方的胜利意味着另一方的失
败。因此,假如有人愿意卖给你一份期货合同,你绝对不应该买下来。
反过来也是如此。
其中的策略意义在于,其他人的行动向我们提示了他们究竟知道什么,我们应该利用这些信息指导我们自己的行动。当然,我们应该将这
些信息连同我们自己有关这个问题的信息综合起来加以利用,运用全部
策略机制,尽可能从其他人那里获取整个事情的真相。
在前面提到的《红男绿女》的例子里,存在这一类型的一个简单机
制。斯凯应该问一下内森,看他在什么情况下愿意把赌注压在奶酪蛋糕
上。假如回答是“无论什么情况都不会”,那么斯凯就能推断答案一定是
苹果酥。假如内森回答说他下注在苹果酥和奶酪蛋糕上的可能性一样
大,他显然是在隐瞒自己知道的信息,甘愿冒让斯凯在赌博中可能猜中
的风险。
在股票市场、外汇市场和其他金融市场,人们可以像这个例子所描
述的那样自行决定应该把赌注压在哪一边。实际上,在一些有组织的交
易市场,包括伦敦股票市场,只要你询问一只股票的价格,按照规定,证券商必须在他知道你打算买入还是卖出之前同时告诉你买入价和卖出
价。假如缺少这么一个监察机制,证券商就有可能单凭自己掌握的信息
赚上一笔,而由于外面的投资者担心受骗上当,很可能最终导致整个市
场崩溃。买入价和卖出价并不完全一致;两者之间存在一个价差(bid-
ask spread)。在流动资金市场,这个差额非常小,意味着无论哪一份买
入或卖出的订单,其中包含的信息都是微乎其微的。另一方面,内森·
底特律愿意不惜一切代价把赌注压在苹果酥上,坚决不要奶酪蛋糕,他
的价差则是无限大。千万当心这样的证券商。
在这里我们应该补充一点:斯凯没有认真听取他父亲的教诲。一分
钟后他就跟内森打赌说内森不知道他的蝴蝶领结是什么颜色。斯凯无论
如何赢不了:假如内森知道是什么颜色,他一定愿意打赌,并且取胜;
假如他不知道,他一定不愿意打赌,也就不会输。
10.博弈论可能危害你的健康
一天深夜,耶路撒冷举行的一个会议结束之后,两名美国经济学家
找了一辆有牌照的出租车,告诉司机应该怎么去他们的酒店。司机几乎
立即认出他们是美国观光客,因此拒绝打表,并声称自己热爱美国,许
诺会给他们一个低于打表数目的更好的价钱。自然,两人对这样的许诺
颇有点将信将疑。在他们表示愿意按照打表数目付钱的前提下,这个陌
生的司机为什么还要提出这么一个奇怪的少收一点的许诺呢?他们怎么
才能知道自己有没有多付车钱呢?
注12另一方面,此前他们除了答应按照打表数目付钱之外,并没有许诺
再向司机支付其他报酬。假如他们打算跟司机讨价还价,而这场谈判又
破裂了,那么他们就得另找一辆出租汽车。他们的思路是,一旦他们到
达酒店,他们的讨价还价地位将会大大改善。何况,此时此刻再找一辆
出租车实在很不容易。
于是他们坐车出发,顺利到达酒店。司机要求他们支付以色列币2
500谢克尔(相当于2.75美元)。谁知道什么样的价钱才是合理的呢?因为
在以色列,讨价还价非常普遍,所以他们还价2 200谢克尔。司机生气
了。他嚷嚷着说从那边来到酒店,这点钱根本不够用。他不等对方说话
就用自动装置锁死了全部车门,按照原路没命地开车往回走,一路上完
全没把交通灯和行人放在心上。两位经济学家是不是被绑架到贝鲁特去
了?不是。司机开车回到出发点,非常粗暴地把他们扔出车外,一边大
叫:“现在你们自己去看看你们那2 200谢克尔能走多远吧!”
他们又找了一辆出租车。这名司机开始打表,跳到2 200谢克尔的
时候,他们也回到了酒店。
毫无疑问,花这么多时间折腾对于两位经济学家来说还值不到300
谢克尔。另一方面,这个故事却很有价值。它描述了跟那些没有读过我
们这本书的人讨价还价可能存在什么样的危险。更普遍的情况是,我们
不能忽略自尊和失去理性这两种要素。有时候,假如总共只不过要多花
20美分,更明智的选择可能是到达目的地之后乖乖付钱。
注13
这个故事还有第二个教训。设想一下,假如两位经济学家是在下车
之后再来讨论价钱问题,他们的讨价还价地位该有多大的改善。(当然
了,若是租一辆出租车,思路应该与此完全相反。假如你在上车之前告
诉司机你要到哪里去,那么,你很有可能眼巴巴看着出租车弃你而去,另找更好的主顾。记住,你最好先上车,然后告诉司机你要到哪里
去。)
11.未来的模样
前面的例子让我们初步领略了指导策略决策的原理。我们可以借助
这些故事的寓意将这些原理进行归纳。
妙手传说告诉我们,在策略里,就跟在物理学当中一样,“我们所
采取的每一个行动,都会引发一个反行动”。我们并非生活在一个真空世界,也不是在一个真空世界里举止行事。因此,我们不可以假定说,虽然我们改变了自己的行为,其他事情还会保持原样。
戴高乐在谈判桌上获得成功,这表明“只有卡住的轮子才能得到润
滑油”
注14 。不过,坚持顽固强硬并非总是轻而易举,尤其在你遇到一
个同样顽固强硬的对手而不得不表现得比对方更加顽固强硬的时候更难
做到。
古拉格的笑话以及给猫拴铃铛的故事刻画了需要协调和个人牺牲才
能有所收获的事情做起来可能具有的难度。贸易政策的故事则强调了逐
个解决问题的危险性。在技术竞赛当中,就跟在帆船比赛中差不多,追
踪而来的新公司总是倾向于采用更加具有创新性的策略,而龙头老大们
则愿意模仿跟在自己后面的公司。
网球和税务审计的故事指出,策略的优势在于不可预测性。不可预
测的行为可能还有一个好处,就是使人生变得更加有趣了。
我们当然可以再讲几个故事,借助这些故事再讲一些道理,不过,这不是系统思考策略博弈的最佳方法。从一个不同角度研究同一个主题
会更见效。我们每次讲一个原理,比如承诺、合作和多管齐下。在每一
个章节,我们还会介绍一些以这个主题为核心的故事,直到说清整个原
理为止。然后,读者可以在每章后面所附“案例分析”中运用这个原理。
12.案例分析之一:红色算我赢,黑色算你输
虽然我们两位作者也许永远没有机会担当美洲杯帆船赛的船长,但
其中一位却遇到了一个非常接近的情形。巴里毕业的时候,为了庆祝一
番,参加了剑桥大学的五月舞会(这是英国版本的大学正式舞会)。庆祝
活动的一部分包括在一个赌场下注。每人都得到相当于20美元的筹码,截至舞会结束之时,收获最大的一位将免费获得下一年度舞会的入场
券。到了准备最后一轮轮盘赌的时候,纯粹是出于一个令人愉快的巧
合,巴里手里已经有了相当于700美元的筹码,独占鳌头,第二位是一
名拥有300美元筹码的英国女子。其他参加者实际上已经被淘汰出局。
就在最后一次下注之前,那个女子提出分享下一年舞会的入场券,但是
巴里拒绝了。他占有那么大的优势,怎么可能满足于得到一半的奖赏
呢?
为了帮助大家更好地理解接下去的策略行动,我们先来简单介绍一下轮盘赌的规则。轮盘赌的输赢取决于轮盘停止转动时小球落在什么地
方。典型情况是,轮盘上刻有从0到36的37个格子。假如小球落在0处,就算庄家赢了。玩轮盘赌最可靠的玩法就是赌小球落在偶数还是奇数格
子(分别用黑色和红色表示)。这种玩法的赔率是一赔一,比如一美元赌
注变成两美元,不过取胜的机会只有1837。在这种情况下,即便那名
英国女子把全部筹码押上,也不可能稳操胜券;因此,她被迫选择一种
风险更大的玩法。她把全部筹码押在小球落在3的倍数上。这种玩法的
赔率是二赔一(假如她赢了,她的300美元就会变成900美元),但取胜的
机会只有1237。现在,那名女子把她的筹码摆上桌面,表示她已经下
注,不能反悔。那么,巴里应该怎么办?
案例讨论
巴里应该模仿那名女子的做法,同样把300美元筹码押在小球落在3
的倍数上。这么做可以确保他领先对方400美元,最终赢得那张入场
券:假如他们都输了这一轮,巴里将以400∶0取胜;假如他们都赢了,巴里将以1 300∶900取胜。那名女子根本没有其他选择。即使她不赌这
一轮,她还是会输,因为巴里会和她一样退出这一轮,照样取胜。
注15
她的唯一希望在于巴里先赌。假如巴里先在黑色下注200美元,她
应该怎么做?她应该把她的300美元押在红色。把她的筹码押在黑色对
她没有半点好处,因为只有巴里取胜,她才能取胜(而她将是亚军,只
有600美元,排在巴里的900美元后面)。自己取胜而巴里失败就是她唯
一的反败为胜的希望所在,这就意味着她应该在红色下注。
这个故事的策略寓意与马丁·路德和戴高乐的故事恰恰相反。在这
个关于轮盘赌的故事里,先行者处于不利地位。由于那名女子先下注,巴里可以选择一个确保胜利的策略。假如巴里先下注,那名女子就可以
选择一个具有同样取胜机会的赌注。这里需要说明的是,在博弈游戏
里,抢占先机、率先出手并不总是好事。因为这么做会暴露你的行动,其他参与者可以利用这一点占你的便宜。第二个出手可能使你处于更有
利的策略地位。
第2章 准备接招
1.轮到你了,查理·布朗
连环漫画《花生》里有一个反复出现的主题,说的是露西(Lucy)将一个橄榄球按住,竖在地上,招呼查理·布朗(Charlie Brown)过去踢那个
球。不过,每次到了最后一刻,露西总要拿走橄榄球,查理·布朗因为
一脚踢空,仰天跌一跤,心怀不轨的露西就会高兴得不得了(如图2—1
所示)。
任何人都会劝告查理·布朗不要上露西的当。即便露西去年(以及前
年和再前一年)没有在他身上玩过这个花招,他也应该从其他事情了解
她的性格,完全有可能预见她会采取什么行动。
就在查理盘算要不要接受露西的邀请跑去踢球的时候,她的行动还
没有发生。不过,单凭她的行动还没有发生这一点,并不意味着查理就
应该把这个行动看做是不确定性的。他应该知道,在两种可能的结果
——让他踢中那个球以及让他仰天跌一跤——当中,露西倾向于后者。
因此,他应该预见到,一旦时机到了,她就会拿走橄榄球。从逻辑推理
得出的露西会让他踢中那个球的可能性实际上已经毫无影响。对这么一
种可能性仍然抱有信心,套用约翰逊(Johnson)博士描述的再婚的特征,是希望压倒经验的胜利。查理不应该那样想,而应预见到接受露西的邀
请最终会让自己仰天跌一跤。他应该拒绝露西的邀请。图2—1
2.两种策略互动
策略博弈的精髓在于参与者的决策相互依存。这种相互影响或互动
通过两种方式体现出来。第一种方式是相继发生,比如查理·布朗的故
事。参与者轮流出招。每个参与者在轮到自己的时候,必须展望一下他
的这一步行动将会给其他人以后的行动造成什么影响,反过来又会对自
己以后的行动造成什么影响。
第二种互动方式是同时发生,比如第1章囚徒困境故事的情节。参
与者同时出招,完全不理会其他人刚刚走了哪一步。不过,每个人必须
心中有数,知道这个博弈游戏存在其他参与者,而这些人反过来也非常
清楚这一点,如此类推。因此,每个人必须设想一下若是自己处在其他
人的位置,会做出什么反应,从而预计自己这一步会带来什么结果。他
选择的最佳策略也是这一全盘考虑的一个组成部分。
一旦你发现自己正在玩一个策略博弈,你必须确定其中的互动究竟
是相继发生的还是同时发生的。有些博弈,比如橄榄球,同时具备上述
两种互动元素。这时候你必须确保自己的策略符合整个环境的要求。在
这一章,我们将粗略介绍一些有助于你玩相继发生的互动的博弈的概念
和规则;而同时发生的互动的博弈将是第3章的主题。我们从非常简
单、有时候是设计出来的例子开始,比如查理·布朗的故事。我们有意
这么做,毕竟,这些故事本身并不十分重要,而正确的策略通常也是通
过简单的直觉就能发现的,这么一来,可以更加清晰地凸显其中蕴涵的
概念。我们用到的例子会在案例分析以及以后的章节里变得越来越接近
现实生活,也越来越复杂。
3.策略的第一法则
相继出招的博弈有一个总的原则,就是每一个参与者必须预计其他
参与者接下来会有什么反应,据此盘算自己的最佳招数。这一点非常重
要,值得确立为策略行为的一个基本法则。
法则1:向前展望,倒后推理。
展望你的最初决策最后可能导致什么结果,利用这个信息确定自己的最佳选择。
在查理·布朗的故事里,做到这点对所有人来说应该都是不费吹灰
之力的,只有查理·布朗除外。他只有两个选择,其中一个导致露西在
两个可能的招数之间选择了一个。大多数策略情况都会涉及一系列更长
的决策结果,每个结果都有几种选择,单是口头上进行推理实在是无法
表述清楚。要想成功地运用这个向前展望、倒后推理的法则,我们需要
一个更好的视觉辅助工具。一个涵盖了博弈当中全部选择的“树状图”就
是这么一个工具。现在我们就来演示一下怎么使用这些树。
4.决策树与博弈树
一系列需要向前展望、倒后推理的决策,甚至有可能出现在一个孤
立的决策者面前,而这个人并非置身于一个有其他人参加的策略博弈
中。对于走在黄树林里的罗伯特·弗罗斯特(Robert Frost):
两条路在树林里分岔,而我
我选择人迹罕至的那一条,从此一切变了样。[1]
我们可以画出这样一幅示意图(如图2—2所示)。
图2—2
到此未必就不用再选择了。每一条路后面可能还会有分岔,图2—2
相应也会变得越来越复杂。以下就是我们亲身经历的一个例子。从普林斯顿到纽约旅行会遇到几次选择。第一个决策点是选择旅行
的方式:乘公共汽车、乘火车还是自己开车。选择自己开车的人接下来
就要选择走费拉扎诺·奈罗斯桥、荷兰隧道、林肯隧道还是乔治·华盛顿
桥。选择搭乘火车者必须决定是在纽瓦克(Newark)换乘PATH列车还是
直达纽约宾夕法尼亚车站。等到进入纽约,搭乘火车或公共汽车的人还
必须决定怎样抵达自己的最后目的地,是步行、乘地铁(是本地地铁还
是高速地铁)、乘公共汽车还是乘出租车。最佳决策取决于多种因素,包括价格、速度、难以避免的交通堵塞、纽约城里的最终目的地所在以
及对泽西收费公路上的空气污染的厌恶程度,等等。
图2—3描述了你在每一个岔道口面临的选择,看上去就像一棵枝叶
繁茂的大树,所以称为“决策树”。如何正确使用这样一张图或这么一棵
树呢?绝对不是选择第一个岔道口看上去最好的分枝,然后等到下一个
岔道口出现再去思考接下来应该怎么办;相反,你应该预计到以后将面
临的选择,利用这些信息倒过头来确定前面几个岔道口你应该怎么决
断。举个例子,假设你要去华尔街,乘PATH火车就好于开车,因为这
条铁路从纽瓦克直达华尔街。图2—3
我们可以通过一棵这样的树描述一个策略博弈当中的选择,不过,现在出现了一个新的元素。我们遇到一个有两个人或更多人参与的博
弈。沿着这棵树出发,后面许多分枝可能是几个参与者轮流决策。每个
参与者在前一个分枝做决策时必须向前展望,而且考察的范围不应仅局
限于他自己的决策,还要包括其他参与者的决策。他必须对其他人的下
一步决策进行预计,办法就是置身于其他参与者的地位,按照他们的思
维方式进行思考。为了强调一下这个做法与前面一个做法的区别,我们
把一棵反映一场策略博弈当中的决策次序的树称为“博弈树”,而把“决
策树”留做描述只有一个人参加的情形。
虽然查理·布朗的故事简单得简直令人难以置信,不过,你还是可
以通过将这个故事放进一棵博弈树,开始熟悉博弈树的概念。这个博弈
从露西发出邀请开始,查理·布朗面临的选择是要不要接受邀请。假如
查理拒绝邀请,那么这个博弈到此为止。假如他接受,露西就有两个选
择,一是让查理踢中那个橄榄球,二是把球拿走。我们可以通过添加一
个分枝的方法描绘这个故事。
正如我们在前面说过的那样,露西有两个选择,即图2—4中的上下
两个分枝,查理应该预计到她一定会选择上面那个分枝。因此,他应该
置身于她的地位,从这棵树上剪掉下面那个分枝。现在,回到他自己的
两个选择,也是上下两个分枝,假如他选择上面那个分枝,结果一定是
仰天跌一大跤。因此,相比之下,他更好的选择是沿着下面的分枝前
进。
图2—4为了进一步了解这个思路,我们不妨设想一个包含同样一棵博弈树
的商界中的例子。我们不想惹恼任何一个真实存在的公司,在此先向格
雷厄姆·格林(Graham Greene)道歉,我们借用的是他的例子:假设在卡
斯特罗执政之前的古巴,吸尘器市场由一家名为“快洁”的公司独占,一
家名为“新洁”的新公司正在考虑要不要进军这个市场。假如“新洁”决定
进入,“快洁”将面临两个选择:一是接纳“新洁”,和平共处,满足于一
个与以前相比降低了的市场份额,二是打一场价格战。
注16 假设“快
洁”接纳“新洁”,后者就可以赚得10万美元利润,但是,假如“快洁”发
动一场价格战,就将给“新洁”造成20万美元的损失。假如“新洁”决定留
在市场外而不进入,那么它的利润当然为零。下面我们画出这棵博弈树
(如图2—5所示),标明每一种结果会带来什么样的利润。
图2—5
“新洁”应该怎么办?这是决策分析员需要解决的问题,也是商学院
里讲授的问题。他们会画出一幅非常相似的图,却称之为“决策树”。理
由是,他们通常把“接纳”和“打价格战”两种选择方案的结果看做偶然现
象。因此他们会标出两者的出现概率。比如,假如他们认为接纳与打价
格战出现的机会一样大,那么两者的概率同为12。接着,他们可以计
算出“新洁”进入市场会得到多少利润,方法是将盈利和损失分别乘以相
应的概率再相加。他们得到
·×100 000-?×200 000=-50 000
由于这是一个亏损数字,商业分析员们就会根据这些概率下结论
说“新洁”不应该进军古巴市场。
以上的估计数字是从哪里来的呢?博弈论提供了答案:它们来
自“新洁”自己对“快洁”在各种情形下的利润情况的估计。要估计“快
洁”会怎么做,“新洁”首先应该估计“快洁”在不同情形下会得到多少利润。然后通过向前展望、倒后推理,预计对方会怎么做。进一步分析这
个例子:我们假设“快洁”作为一个垄断者,有能力赚取30万美元利润。
与“新洁”分享市场则意味着自己的利润降为10万美元。另外,从“快
洁”这边估计,发动一场价格战的代价是10万美元。现在我们可以在这
棵树上添加这些结果(如图2—6所示)。
图2—6
我们利用这棵树包含的信息预计以后的全部招数。由于具体招数可
以由这个博弈的结果确定,这棵树完全适合看做一棵博弈树,而不是一
棵决策树。比如,要预计“快洁”对“新洁”进入的反应,我们知道,“快
洁”接纳“新洁”的话仍会有10万美元利润,发动价格战则会损失10万美
元;“新洁”应该预计到“快洁”会选择前者。向这个方向展望,同时倒后
推理,“新洁”应该在盘算的时候先把打价格战这个分枝去掉。它应该进
入这个市场,因为预计它可以赚到10万美元。
若是换了其他环境,最后的决策可能发生变化。比如,假设“新
洁”下一步有可能继续进军“快洁”早已建立市场的其他岛屿,“快洁”大
约会觉得有必要在这个新来者面前摆出一副不好对付的样子,宁可在古
巴损失10万美元也要发动一场价格战。“新洁”应该看到,这意味着自己
注定会损失20万美元,最后决定还是留在外面,不要硬闯的好。
“新洁”可以看出任何一个得失数字都会转化为相应的行动。不过,它自己可能并不知道“快洁”在这棵树的顶端会得到什么样的回报。这种
利润的不确定性将会转化为行动的不确定性。比如,“新洁”可能认为,有33.3%的机会“快洁”会在一场价格战中损失10万美元,有33.3%的机会
双方会打个平手(利润为零),最后还有33.3%的机会“快洁”即便打价格战
也能赚到12万美元。若遇到这种情况,“向前展望,倒后推理”会认为,有23的概率“快洁”会选择接纳“新洁”——赚到10万美元总比损失10万美元或双方打个平手要好,只比不上赚到12万美元。因此,发动一场价格
战的可能性是33.3%。要弄清究竟会发生什么情况,唯一途径就是进军
市场。不过,基于上述可能性,“新洁”有23的概率赚到10万美元,13
的概率损失20万美元,因此,它的预计利润实际为零,根本没有理由进
军市场。
在这个例子里,“新洁”对于“快洁”的得失的不确定性直接转化为
对“快洁”会有什么反应的概率估计。不过,我们必须注意应该在哪里加
入这种不确定性。正确的地方是在树的末端。现在就来看看,假如我们
在考虑的时候企图跳到前面去会犯什么错:平均而言,“快洁”可以在一
场价格战当中赚到6 667(即13×120 000+13×0-13×100 000)。但
这并不意味着“快洁”就一定想打价格战。愿意打价格战的可能性不是
100%。而且这种不确定性并不表示我们就应该猜测“快洁”愿意打价格
战的可能性是50%。对“新洁”而言,分析这个问题的正确思路是从这个
博弈的终点着手,预计“快洁”每一步会怎么做。5.更加复杂的树
在现实生活里,你会遇到的博弈远比上述我们用来进行形象描述的
例子复杂。不过,即便这些“小树苗”长成“大树”,同样的原理也依然管
用。象棋(国际象棋)可能是最好的例子。虽然象棋的规则相对比较简
单,却已经形成一种需要进行策略推理的博弈游戏。白棋先行,黑棋回
应,双方依次相继移动。因此,象棋当中最“纯粹”的策略推理就包含着
向前展望你自己这一步将会导致什么后果,就跟我们在前面看到的一
样。其实例可能是这样:“假如我现在走兵,我的对手就会进马,威胁
我的车。我在走兵之前必须用我的象护住那四个格子,不让对手的马得
逞。”
象棋是一种相继出招的博弈游戏,我们可以用一棵树来表示。白方
可以从20种开局方式中任选一种。[2] 在图2—7中,我们用这棵树的
第一个决策点(或节点)表示白方拥有的第一个先行机会,标为W1。他可
以选择的20种走法变成20个枝条,从这个节点发散出去。每一个枝条代
表的行动方式就是这个枝条的标签:兵进K4(P-K4或代数标记法里的
e4)、兵进Q4,等等。我们的目的只是描述普遍情况,因此,为了避免
这幅图表变得枝节丛生,我们不会显示或标明所有枝条。每一个枝条都
会引出下一个节点,代表黑方的第一次行动,标为B1。黑方同样可以从
20种开局方式中任选一种,于是,同样会有20个枝条从每一个标明B1的
节点发散出去。双方走完第一步,我们已经看到有400种可能性。从现
在开始,枝条的数目就会取决于前面一步。举个例子:假如白方的第一步是P-K4,他的第二步就有许多选择,因为他的后以及王旁边的象现在
都可以出动。然后你就会发现,建立这棵树所要运用的原理多么简单,而这棵树在实践中又会很快变得多么复杂。
我们可以选择这棵博弈树上每一个决策点(节点)的一个枝条,沿着
这个枝条一路走下去。这表示这盘博弈继续下去的一种特定方式。象棋
大师早在博弈初期(开局阶段)就盘算过许多这样的路径,考虑过这些路
径会有什么结果。比如我们已经标出的路径,白方第一步是P-K4,黑方
以P-QB4回敬,就是预兆一场恶战的西西里防御。
注17图2—7
在许多博弈里,每一条这样的路径都会在有限次的选择之后到达终
点。在体育或棋类比赛中,这可能是在一方取胜或双方打平的时候。更
常见的情况是,博弈的最终结果可能是以给参与者货币回报、非货币回
报或惩罚的形式出现。比如,商业对手之间的一场商界博弈可能给一家
公司带来非常可观的利润,却使另一家公司破产。而核军备竞赛的博弈
则可能达成一项成功的条约或导致两败俱伤。
假如一个博弈无论选择哪一条路径,都会在有限次的行动之后到达
终点,我们在理论上就可以完全解决这个博弈。这意味着能找出谁将取
胜以及他将怎样取胜。这是通过沿着这棵树倒后推理得出的。一旦我们
走通了整棵树,我们就会发现我们究竟能不能取胜,还有,假如可以取
胜,我们应该使用怎样的策略。对于任何一个相继选择并且数目有限的
博弈,总是存在某种最佳策略。当然,存在一个最佳策略并不等于说我
们总是可以轻而易举地找到这个最佳策略。象棋就是一个很好的例子。
临到比赛结束之际,象棋大师在刻画最优策略方面一直做得非常出
色。一旦棋盘上只剩下三四个棋子,大师级选手就能预见博弈的结局,(通过倒后推理)确定一方有没有一个万无一失的取胜策略,或另一方是
否能迫使双方打平。接着,他们可以通过预计最后阶段的各种不同局
势,评估中盘阶段的策略。问题在于,从来没有人可以一直倒后走通整
棵树,直到开局的第一步。
一些简单的博弈可以用这样的方法得到完全解决。比如,3×3的连
城游戏总是可以变成平局。
注18 这也是只有小孩才玩这个游戏而大人不
屑一顾的原因。即便是西洋跳棋,也存在这个问题。大家都相信,第二
个参与者总有办法达成平局,虽然这一结论尚未得到证明。为了保持大
家对这种游戏的兴趣,西洋跳棋比赛让参与者从中局开始行动,在中局
大家还看不出什么取胜或打平的策略。等到象棋也有可能用这种方法完
全解决的那一天,象棋的规则大概也得进行修改了。
而在目前阶段,象棋参与者都做了什么呢?他们做了我们大家将相
继移动的策略运用到实践中去的时候都应该做的事情:将向前展望分析
与价值判断结合在一起。他们会问:“这条路在四五步之后会使自己争
得一个有利局面,抑或陷入一个不利局面?”他们假设现在比赛已经结
束,由此判断每一个可能的结果的价值。然后,他们选择那个五步之后
可以达到最大价值结果的策略,向前展望,倒后推理。倒后推理是相对容易的部分。难的是怎样确定中盘局面的价值。每一个子的价值都要计
算在内,同时要在吃子与取势两方面的优势之间进行权衡取舍。
保罗·霍夫曼(Paul Hoffman)在他的《阿基米德的报复》(Archimedes'
Revenge)一书中描述了汉斯·伯利纳(Hans Berliner)的电脑象棋程序。伯
利纳是以通讯方式进行的象棋比赛的世界冠军,研制了一台专门用于下
象棋的电脑,可以在每一步棋限定的3分钟之内检查3 000万种备选方
案。伯利纳还确定了一个很好的规则,用于评估中盘局面的价值。能够
击败这个电脑程序的人不超过300名。在十五子棋比赛中,伯利纳也开
发了一个程序,该程序已经使世界冠军俯首称臣。
将倒后推理的清晰逻辑与基于实践经验确定的、评估中盘局面价值
高低的最佳规则结合起来,是处理远比象棋复杂的博弈的一种有用方
法。
6.讨价还价
无论在商界还是在国际政坛,参与各方经常通过讨价还价或者谈判
来决定总收益这个“蛋糕”应该怎样划分。我们将在第11章更详细地探讨
这一现象。现在我们把它当做一个形象的例子,解释倒后推理这一方法
怎样使我们得以预见相继行动的博弈的结果。
大多数人基于社会常识,预测一场谈判的结果就是妥协。这样做的
好处是能够保证“公平”。我们可以证明,对于许多常见类型的谈判,一
个50对50的妥协也是倒后推理的结果。
首先,我们必须认识讨价还价的两个普遍特征。我们必须知道谁向
谁提出了一个什么条件,换言之,就是这个博弈的规则是什么;接着,我们还要知道,假如各方不能达成一个协定,将会导致什么后果。
不同的谈判按照不同的规则进行。在大多数零售店里,卖方会标出
价钱,买方的唯一选择就是要么接受这个价格,要么到别的店里碰运
气。
注19 这是一个简单的“接受或者放弃”的法则。而在工资谈判的例子
中,工会首先提出一个价码,接着公司决定是不是接受。假如公司不接
受,可以还一个价码,或者等待工会调整自己要求的价码。有些时候,相继行动的次序是由法律或者习俗决定的,还有些时候这一次序本身就
具有策略意义。接下来,我们会探讨一个讨价还价的问题,在这个问题
里,双方轮流提出条件。谈判的一个必不可少的特征在于时间就是金钱。假如谈判越拉越
长,蛋糕就会开始缩水。不过,这时各方仍然可能不愿意妥协,暗自希
望只要谈成一个对自己更加有利的结果,其好处就将超过谈判的代价。
查尔斯·狄更斯(Charles Dickens)的《荒凉山庄》(Bleak House)描述了一
个极端的情形:围绕贾恩迪斯(Jarndyce)山庄展开的争执变得没完没
了,以至于最后整个山庄不得不卖掉,用于支付律师们的费用。按照同
样的思路,假如不能达成工资协定而引发罢工,那么公司就会失去利
润,工人就会失去工作。假如各国陷入一轮旷日持久的贸易自由化谈
判,它们就会在争吵收益分配的时候丧失贸易自由化带来的好处。这些
例子的共同点在于,参与谈判的所有各方都愿意尽快达成协议。
在现实生活中,收益缩水的方式非常复杂,不同情况缩水比例也不
同。不过,我们可以用一种非常简单的方法充分阐明这一点:假设每提
出一个建议或反建议,蛋糕都会朝零的方向缩小同样大小;设想这是一
个冰淇淋蛋糕,孩子们一边争吵怎么分配,蛋糕一边融化。
首先,假设整个过程总共只有一步。桌子上放了一个冰淇淋蛋糕;
一个孩子(Ali,阿里)向另一个孩子(Baba,巴巴)提议应该如此这般分
配。假如巴巴同意,他们就会按照提议分享这个蛋糕;假如巴巴不同
意,蛋糕融化,谁也吃不到。
现在,阿里处于一个强有力的地位:她使巴巴面临有所收获和一无
所获的选择。即便她提出自己独享整个蛋糕,只让巴巴在她吃完之后舔
一舔切蛋糕的餐刀,巴巴的选择也只能是舔一舔,否则他什么也得不
到。
当然,巴巴可能因为感到这么分配太不公平而生气,断然拒绝接受
这一条件。又或者,他可能希望建立或者保持自己作为一个不好对付的
讨价还价者的形象,从而为日后的讨价还价奠定基础,而日后的讨价还
价可能是跟阿里进行,也可能是跟其他得知今天自己所作所为的孩子们
进行。在实际操作当中,阿里同样需要考虑到这些问题,要向巴巴放出
刚好足够的诱饵(比如一小片蛋糕?),引诱他上钩。为简化阐述过程,我们将所有这些复杂问题搁在一边,假设阿里可以拿走她所要求的
100%的份额。实际上,我们还可以不考虑留给巴巴舔的餐刀,假定阿
里有能力提出“接受或者放弃”的条件,她可以得到整个蛋糕。
注20
一旦出现第二轮谈判,局势就会大大偏向巴巴。不妨再设想一下,现在桌子上放了一个冰淇淋蛋糕,但是两轮谈判过后,整个蛋糕就会融化。假如巴巴拒绝接受阿里提出的条件,他可以提出一个反建议,不
过,到这时,桌子上只剩下半个蛋糕了。假如阿里拒绝接受巴巴的反建
议,剩下的半个蛋糕也会融化,双方都会一无所获。
现在,阿里必须向前展望她最初提出的条件会有什么后果。她知
道,巴巴可以拒绝她的条件,从而占据有利地位,反过来就剩下的半个
蛋糕提出“接受或者放弃”的分配方案。这实际上意味着巴巴已经将那半
个蛋糕掌握在自己手里。因此,他不会接受任何低于阿里第一轮条件的
反建议。假如阿里不能阻止这一幕发生,她将一无所获。一旦看清了这
一点,她会从一开始就提出与巴巴平分这个蛋糕,这正是刚好足够引诱
对方接受而又为自己保有一半收益的条件。于是他们会马上达成一致,平分这个蛋糕。
说到这里,个中原理已经非常清楚,我们的讨论还可以再进一步。
分析结果是相同的,要么加速谈判进程,要么延缓蛋糕融化速度。随着
谈判各方提出每个建议和反建议,蛋糕也在融化,从一个变成23再变
成13,直到零,什么也剩不下。假如阿里提出最后一个建议,而蛋糕
已经缩小到只有13,她就可以全部拥有。巴巴知道这一点,所以在轮
到自己提条件的时候(这时蛋糕还剩下23)许诺分给她13。这么一来,巴巴可以得到的最好结果就是13个蛋糕,即剩下的23的一半。阿里知
道这一点,所以从一开始就许诺分给巴巴13(刚好足够引诱对方接受),自己得到23。
各得一半的分配方案存在什么规律吗?每一次的步骤数目都是偶
数,且这一现象反复出现。更重要的是,即便步骤数目是奇数,随着步
骤数目增加,双方也会越来越接近一半一半的分配方案。
若是四步,巴巴得以提出最后一个条件,从而得到这个时候桌子上
剩下的14个蛋糕。因此,阿里必须在倒数第二轮提出分给巴巴14个蛋
糕,当时桌子上还剩下半个蛋糕。而在此前的一轮,巴巴可以让阿里接
受分给她剩下的34个蛋糕中14个蛋糕的条件。因此,一路这么向前展
望下去,在讨价还价一开始,阿里就应该提出分给巴巴半个蛋糕,自己
得到另一半。
若是五步,阿里一开始可以提出分给巴巴25个蛋糕,自己得到
35。若是六步,那么分配方案又回到各得一半。若是七步,阿里得到
47,巴巴得到37。更为普遍的情况是,假如步骤数目是偶数,各得一
半。假如步骤数目n是奇数,阿里得到 (n+1)(2n),而巴巴得到(n-1)(2n)。等到步骤数目达到101,阿里可以先行提出条件的优势使她可
以得到51101个蛋糕,而巴巴得到50101个。
在这个典型的谈判过程里,蛋糕缓慢缩小,在全部消失之前有足够
时间让人们提出许多建议和反建议。这表明,通常情况下,在一个漫长
的讨价还价过程里,谁第一个提出条件并不重要。除非谈判长时间陷入
僵持状态,胜方几乎什么都得不到了,否则妥协的解决方案看来还是难
以避免的。不错,最后一个提出条件的人可以得到剩下的全部成果。不
过,真要等到整个谈判过程结束,大概也没剩下什么可以赢取的了。得
到了“全部”,但“全部”的意思却是什么也没有,这就是赢得了战役却输
掉了战争。
我们必须看到很重要的一点:虽然我们考虑过许多可能的建议和反
建议,预期结果却是阿里的第一个条件能够被对方接受。谈判过程的后
期阶段不会再发生。不过,假如第一轮不能达成一致,这些步骤将不得
不走下去,这一点在阿里盘算怎样提出一个刚好足够引诱对方接受的第
一个条件时非常关键。
这个观察结果反过来提示了另一种讨价还价策略。向前展望、倒后
推理的原理可能在整个过程开始之前就已经确定了最后结果。策略行动
的时间可能提前,在确定谈判规则的时候就已经开始。
同样的观察结果还会引出一个谜。假如讨价还价的过程真像这里阐
述的那样,应该不会出现罢工。当然,罢工的可能性会影响最终达成的
协议,不过公司会把握第一个提条件的机会,提出一个刚好足以引诱对
方接受的条件,工会也会这样做。罢工变成现实,或者更普遍的情况,即谈判破裂,一定是现实生活更微妙或者更复杂的特征引出的结果,而
这些特征早已从上述这个简单的故事中排除出去,未予考虑。我们会在
第11章探讨其中一些问题。
7.战争与和平
倒后推理的另一个实例是怎样通过一系列双边谈判维护和平。
我们举一个只有部分假设的例子:苏丹是一个相对弱小的国家,现
在面临被其邻国利比亚入侵的危险。假如这两个国家在某种程度上都是
与外界隔绝的,那么,要想阻止利比亚入侵并击败苏丹简直毫无可能。尽管两个敌对邻居可能无法继续和平共处,但第三方的存在也许可
以构成必要的制约。在利比亚与苏丹的例子里,这一原理可能会是“我
的敌人的敌人就是我的朋友”。假如利比亚真要跟苏丹开战,那么,利
比亚将不得不从东部与埃及接壤的边境抽调兵力。埃及当然不愿意贸然
入侵一个全副武装的利比亚,不过,假如利比亚跟苏丹打仗而实力大
减,埃及人也许会得到一个难以抗拒的大好机会,一举干掉这个麻烦的
邻居。利比亚可以(或者至少应该)通过倒后推理,预计到一旦他们进攻
苏丹,埃及就会入侵。表面看来,苏丹安全了。不过,在三个国家后面
就停止继续思考这个问题,可能会造成一种虚假的安全感。
假如三个敌人可以达成稳定状态,四个又如何?现在加入以色列。
假如埃及要打利比亚的主意,很有可能遭到以色列入侵。在萨达特
(Sadat)和贝京(Begin)将双方关系正常化以前,这确实是埃及面临的一个
严重威胁。在1978年以前,利比亚不必担心埃及入侵,就是因为埃及一
想到以色列就战战兢兢,不敢大意。结果,苏丹不可能指望埃及来抑制
利比亚的扩张野心。
注21 随着以色列与埃及关系改善,倒后推理的链条
在埃及这里中断,而苏丹也安全了,至少目前是这样。
这个关于制约因素的例子当然经过了必要的格式化,这样它更加切
合我们讨论的主题。从表面看来,这个例子说明,一个国家究竟会不会
遭到入侵,将取决于潜在侵略者链条的节点数目是奇数还是偶数。一个
更加接近现实生活的情况分析可以把国与国之间的复杂关系考虑在内,从而得到更多细节,用于分析一国入侵别国的企图究竟有多大。不过,还有一个重要的结论:博弈的结果在很大程度上取决于参与者的人数。
参与的人越多越好,参与的人越少越糟,即便在同一个博弈里也是如
此。但是,两个敌对国家难以和平共处、三个敌对国家就能恢复稳定局
面的结论并不意味着若有四个敌对国家就更好;在这个例子里,四个的
结果跟两个是一样的。
注22
为了进一步阐述这个制约因素的观点,我们请读者研究本书最后一
章“案例分析”的“三方对决”一节。三个敌对者,实力各不相同,现在必
须决定自己应该袭击哪一个。你可能会发现答案令人大吃一惊。
8.英国人玩的博弈
本章我们讨论了有序行动或者有序移动的博弈。实际上,现实生活
当中没有几个博弈存在清晰界定而参与者又必须遵守的行动规则。参与
者自己制定自己的规则。那么,他们怎么才能向前展望、倒后推理呢?他们又怎么才能知道这个博弈究竟有没有行动次序呢?
我们借用1987年英国大选的情形说明这一点。玛格丽特·撒切尔
(Margaret Thatcher)领导的执政保守党面对以尼尔·金诺克(Neil Kinnock)
为首的工党的挑战。大选期间,双方都要选择是走平坦大道,即以就事
论事为原则进行竞选,还是走崎岖小径,即进行人身攻击。选民当中很
大一部分人对撒切尔夫人的政绩深表满意,因此,假如双方按照相仿的
规矩拉票,将出现整个竞选一面倒的局面,撒切尔夫人就会取胜。
金诺克先生的唯一希望,在于他可以通过风格完全不同的拉票活
动,建立一个足以超越对手的好印象。现在我们假设,撒切尔夫人选择
平坦大道,而他选择崎岖小径,或者两者调换选择,他的成功概率都是
一样的。假设他们私下里都愿意选择平坦大道,但这一想法必须让位给
取胜这一目标。
哪一条才是“人迹罕至”的路呢?答案取决于双方做决定的次序。我
们现在就来考察一些可能出现的情况。
假设撒切尔夫人首先选择竞选风格,这是因为,比如说,就传统而
言都是执政党在反对党之前公布自己的竞选纲领。这样,她可以画出下
面的博弈树(如图2—8所示)。
图2—8
通过向前展望和倒后推理,撒切尔夫人可以预计,假如她选择平坦
大道,金诺克先生一定会选择崎岖小径,反之亦然。
注23 既然两个方案赋予她的取胜概率相同,她愿意选择平坦大道。
撒切尔夫人先行会使她陷于不利,因为这么一来,金诺克先生就可
以选择与其完全不同的道路。不过,她先行本身不会造成这个问题。现
在我们在这个对局上做一个小小的修改。假设撒切尔夫人已经跟她的保
守党顾问以及竞选宣传经理们开过会,确定了她的策略。但是这一决定
没有公开。金诺克先生也在开同样一个会议。他应该怎么做?他应不应
该假设撒切尔夫人在先行的时候,是按照我们刚刚描述的方法进行推理
的呢?那将意味着她已经选择了平坦大道,因此金诺克先生应该选择走
崎岖小径。不过,假如撒切尔夫人想到金诺克先生也会这么想,她就会
为自己选择崎岖小径的策略。金诺克先生并不确实知道她的选择,他若
是忽略这么一种“第二层次”的思考,他就是一个大傻瓜。那么,他应不
应该选择平坦大道呢?不一定,因为撒切尔夫人可以想到“第三层次”,如此类推。一个普遍的观点是若要运用向前展望、倒后推理的原理,不
可缺少的前提是后行者可以观察到先行者的行动。
即便撒切尔夫人先行,而她的选择也是外人可以看到的,但如果她
在竞选期间改变策略,又会发生什么情况呢?假设只有选民得到的最后
印象才算数,而撒切尔夫人在第一次发表声明的时候说了什么无关紧
要。金诺克先生绝不能信以为真,并据以制定自己的策略。反过来,撒
切尔夫人在考虑自己应该怎么迈出第一步的时候,也不能指望金诺克先
生只有一种反应方式。这样,我们就得到向前展望、倒后推理原理的另
一个适用条件:策略必须是不可逆转的。
假如这两个条件有一个不符合,又会怎么样?即便两党是在不同时
间做出各自的决定,就策略思维而言,这些决定就跟同时做出没有两
样。从相继做出决定到同时做出决定的转变,可能对两党中的一方有
利,也可能对双方都有利。实际上,在1987年的英国大选中,双方至少
都改变了一次自己的策略。第3章将提出同时进行的博弈的行动规则。
关于相继行动与同时行动的博弈的区别,体育比赛提供了另一个例
子。百码短跑是同时行动的博弈,因为根本没时间排出相继行动的次
序。而在蝶泳比赛中,运动员也许有时间进行思考,却会发现看清对手
的位置是非常困难的。马拉松比赛具有相继行动的博弈的组成成分:运
动员们可以看到其他人的位置(以一点为基准),策略也是不可逆转的,因为不可能回头重新比赛早先跑过的路程。
结束这一章的时候,我们回到查理·布朗要不要踢那个橄榄球的问题。在橄榄球教练汤姆·奥斯本(Tom Osborne)指挥冠军争夺战的最后几
分钟,这个问题真的出现了。我们同样认为他做了错误的选择。倒后推
理可以揭示错误的原因。
9.案例分析之二:汤姆·奥斯本与1984年橙碗球场决赛的故事
在1984年的橙碗球场决赛上,战无不胜的内布拉斯加打谷者队
(Nebraska Cornhuskers)与曾有一次败绩的迈阿密旋风队(Miami
Hurricanes)狭路相逢。因为内布拉斯加队晋身决赛的战绩高出一筹,只
要打平,它就能以第一的排名结束整个赛季。
不过,在第四节,内布拉斯加打谷者队以17∶31落后。接着,他们
发动了一次反击,成功触底得分,将比分追至23∶31。这时,内布拉斯
加队的教练汤姆·奥斯本面临一个重大的策略抉择。
在大学橄榄球比赛中,触底得分一方可以从距离入球得分线只有
2 12 码的标记处开球。该队可以选择带球突破或将球传到底线区,再得2分;或者采用一种不那么冒险的策略,将球直接踢过球门柱之
间,再得1分。
奥斯本选择了安全至上,内布拉斯加队成功射门得分,比分改写为
24∶31。该队继续全力反击。在比赛最后阶段,他们最后一次触底得
分,比分变成30∶31。只要再得1分,该队就能战平对手,取得冠军头
衔。不过,这样取胜总不大过瘾。为了漂亮地拿下冠军争夺战,奥斯本
认为他应该在本场比赛取胜。
内布拉斯加队决定要用得2分的策略取胜。欧文·弗赖尔(Irving
Fryer)接到球,却没能得分。迈阿密队与内布拉斯加队以同样的胜负战
绩结束全年比赛。由于迈阿密队击败内布拉斯加队,最终获得冠军的是
迈阿密队。
假设你自己处于奥斯本教练的位置。你能不能做得比他更好?案例
讨论
星期一出版的许多橄榄球评论文章纷纷指责奥斯本不应该贸然求
胜,没有稳妥求和。不过,这不是我们争论的核心问题。核心问题在
于,在奥斯本甘愿冒更大的风险一心求胜的前提下,他选错了策略。他
本来应该先尝试得2分的策略,然后,假如成功了,再尝试得1分的策略,假如不成功,再尝试得2分的策略。
让我们更仔细地研究这个案例。在落后14分的时候,奥斯本知道他
至少还要得到两个触底得分外加3分。他决定先尝试得1分的策略,再尝
试得2分的策略。假如两个尝试都成功了,那么使用两个策略的先后次
序则无关紧要。假如得1分的策略失败,而得2分的策略成功,先后次序
则仍然无关紧要,比赛还是以平局告终,内布拉斯加队赢得冠军。先后
次序影响战局的唯一可能性在于内布拉斯加队尝试得2分的策略没有成
功。假如实施奥斯本的计划,这将导致输掉决赛以及冠军锦标。相反,假如他们先尝试得2分的策略,那么,即便尝试失败,他们仍然未必输
掉这场比赛。他们仍然以23∶31落后。等到他们下一次触底得分,比分
就会改为29∶31。这时候,只要他们尝试得2分的策略得手,比赛就能
打成平局,他们就能赢得冠军头衔!
注24
我们曾经听到有人反驳说,假如奥斯本先尝试得2分的策略,那
么,如果没有成功,他的队将只能为打平对手而努力。但这么做不是那
么鼓舞人心,并且他们很有可能不能第二次触底得分了。更重要的是,等到最后才来尝试这个已经变得生死攸关的得2分的策略,他的队将陷
入成败取决于运气的局面。这种看法是错的,有几个理由。假如内布拉
斯加队等到第二次触底得分才尝试得2分的策略,一旦失败,他们就会
输掉这场比赛。假如他们第一次尝试得2分的策略失败,他们仍然有机
会打平。即使这个机会可能非常渺茫,但有还是比没有强。激励效应的
论点也站不住脚。这是因为,虽然内布拉斯加队的进攻可能在冠军决赛
这样重大的场合突然加强,但迈阿密队的防守也会加强。这场比赛对双
方是同样重要的。相反,假如奥斯本第一次触底得分之后就尝试得2分
的策略,在一定程度上确实存在激励效应,提高第二次触底得分的概
率。这也使他可以通过两个三分球打平。
从这个故事中可总结的教训之一在于,假如你不得不冒一点风险,通常都是越早冒险越好。这一点在网球选手看来再明显不过了:人人都
知道应该在第一发球的时候冒风险,第二发球则必须谨慎。这么一来,就算你一发失误,比赛也不会就此结束。你仍然有时间考虑选择其他策
略,并借此站稳脚跟,甚至一举领先。
第3章 看穿对手的策略
每个星期,《时代》和《新闻周刊》都会暗自较劲,非要做出最引人注目的封面故事不可。一个富有戏剧性或者饶有趣味的封面,可以吸
引站在报摊前的潜在买主的目光。因此,每个星期,《时代》的编辑们
一定会举行闭门会议,选择下一个封面故事。他们这么做的时候,很清
楚在某个什么地方,《新闻周刊》的编辑们也在关起门来开会,选择下
一个封面故事。反过来,《新闻周刊》的编辑们也知道《时代》的编辑
们正在做同样的事情,而《时代》的编辑们也知道《新闻周刊》的编辑
们知道这一点……
这两家新闻杂志投入了一场策略博弈,不过,这个博弈从本质上看
跟我们已经讨论过的博弈存在很大差别。第2章讨论的博弈是由一系列
相继进行的行动组成的。查理·布朗在选择要不要踢那个橄榄球时,心
里明白露西现在还没有决定要不要拿走那个球;在象棋里,白方与黑方
交替行动。相反,《时代》与《新闻周刊》的行动却是同时进行的。双
方不得不在毫不知晓对手的决定的情况下采取行动。等到彼此发现对方
做了什么,再想做什么改变就太迟了。当然,这个星期的输家下个星期
很可能竭力反扑,不过,等到那时,在这个日新月异的世界上说不定已
经出现了一个完全不同的新的故事模式,开始了一场完全不同的博弈。
这两种博弈所要用到的策略思维和行动在本质上存在天壤之别。对
于第2章讨论的相继行动的博弈,每个参与者不得不向前展望,估计对
手的反应,从而倒后推理,决定自己这一轮应该怎么走。这是一条线性
的推理链:“假如我这么做,另一个参与者会那么做——若是那样,我
会这么反击”,依此类推。
而在同时行动的博弈里,没有一个参与者可以在自己行动之前得知
另一个参与者的整个计划。在这种情况下,互动推理不是通过观察对方
的策略进行,而是必须通过看穿对手的策略才能展开。要想做到这一
点,单单假设自己处于对手的位置会怎么做还不够。即便你那样做了,你又能发现什么?你只会发现,你的对手也在做同样的事情,即他也在
假设自己处于你的位置会怎么做。因此,每一个人不得不同时担任两个
角色,一个是自己,一个是对手,从而找出双方的最佳行动方式。与一
条线性的推理链不同,这是一个循环——“假如我认为他认为我认
为……”。诀窍在于怎样破解这个循环。
夏洛克·福尔摩斯(Sherlock Holmes)和他的死对头、罪恶魔头莫里亚
蒂(Moriarty)教授擅长这类推理,对此我们一点都不觉得惊讶。正如福
尔摩斯在《最后的问题》里告诉华生(Watson)的:“我要说的其实已经在你的脑海闪过。”他说。
“那么我的答案大概也已经在你的脑海闪过。”我答道。
你就和华生医生一样,大概也在揣摩福尔摩斯怎么未卜先知。听完
我们的解释,我们希望你会同意这其实相当简单。
你怎样才能看穿所有那些错综复杂而又看不见的策略呢?首先,你
不要把其他参与者的未知行动视做天气那样,具有与个人无关的不确定
性。上班之前,《时代》的编辑可能收听天气预报,知道今天下雨的概
率是40%,他大概会利用这个信息去决定要不要带一把雨伞去上班。但
《新闻周刊》将会采用哪个特定主题作为封面故事的概率则完全是另外
一回事。
区别在于,《时代》的编辑对《新闻周刊》有一个非常中肯的了解
——另一个杂志的编辑与天气不同,他们是策略的博弈参与者,就跟
《时代》的编辑自己一样。
注25 即便一个编辑不可能真的观察到另一个
杂志的决定,他也可以通过另一个杂志的视角思考这个问题,尝试确定
它现在一定在做什么。
在第2章,我们可以提供一个单一的、统一的原理,为相继行动的
博弈确定最佳策略。这就是我们的法则1:向前展望,倒后推理。在这
一章,事情不会那么简单。不过,关于同时行动必不可少的思维方式的
思考可以总结为指导行动的三个简单法则。反过来,这些法则又基于两
个简单概念:优势策略与均衡。与第2章一样,我们也会通过简单的例
子解释这些概念和法则。
1.优势策略
在棒球比赛里,假如一方已经有两个人出局,而又打出三个坏球和
两个好球,那么,任何一名进攻上垒的球员都必须在下一次投球的时候
跑向下一垒。这可以通过琢磨各种可能的情形得出来。在大多数情况
下,攻垒球员怎么做无关紧要。假如击球手碰不到球,要么出现第四个
坏球而攻垒球员成功上垒,要么出现第三个好球而这一局结束。假如投
球手投出界外球,攻垒球员只消退回原先所在的垒。假如这是一个擦棒
球而又被接住,那么这一局就结束了。不过,有一种情况跑动攻垒占有
优势,即假如击球手将投球击到界外,那么攻垒球员就有很好的机会上
垒或者得分。我们认为,在这种局面下,跑动攻垒就是优势策略,即某些时候它
胜于其他策略,且任何时候都不会比其他策略差。一般而言,假如一个
球员有某一做法,无论其他球员怎么做,这个做法都会高出一筹,那么
这个球员就有一个优势策略。假如一个球员拥有这么一个策略,他的决
策就会变得非常简单;他可以选择这个优势策略,完全不必担心其他对
手怎样行事。因此,寻找优势策略是每一个人的首要任务。
一旦你知道自己在找什么,你就会发现这个东西无所遁形,我们身
边其实到处都是优势策略的有趣例子。比如印第安纳·琼斯(Indiana
Jones)在电影《印第安纳·琼斯与最后的十字军东征》(Indiana Jones and
the Last Crusade)的最紧张局势时所处的地位。印第安纳·琼斯、他的父
亲以及纳粹分子全都聚集在安放圣杯的地方。眼看纳粹分子只差一步就
要得到圣杯,琼斯父子却无论如何不愿意助纣为虐。于是,纳粹分子打
了琼斯父亲一枪。只有具备起死回生力量的圣杯才能救老琼斯博士的
命。在这种情况下,琼斯只好引他们走向圣杯。不过,前面还有一个最
后的挑战:琼斯必须在十几个杯子当中做出选择,选出耶稣基督用过的
圣杯。圣杯可以使人永生不死,其他杯子却会致人于死地。纳粹头子迫
不及待地拿起一个华丽的黄金杯,喝下里面的圣水,却突然倒地而死,因为他选错了,那不是圣杯。琼斯选了一个木头杯,那是一个木匠用的
杯子。他一边大叫“只有一个办法可以证实”,一边将杯里的水倒出一点
在圣水器上,自己先喝了下去,希望自己选中的就是生命之杯。当琼斯
发现自己没搞错,立即把杯子送到他父亲那里,圣水果然治愈了致命的
枪伤。
虽然这一幕增添了紧张气氛,但在一定程度上却让我们感到难堪,因为一个像印第安纳·琼斯博士那样了不起的教授,居然会看不到他的
优势策略。他本来应该先把杯子递给他父亲,没有必要自己亲身尝试。
假如琼斯确实选对了杯子,那他父亲就会得救。假如他选错了杯子,那
他父亲就会丧命,却至少可以保全琼斯。在将杯子递给他父亲之前自己
测试一下其实毫无用处,这是因为,假如琼斯选错了杯子,那就再也没
有第二次机会了——琼斯将死于致命之水,而他父亲也会死于致命枪
伤。
注26
相比之下,寻找优势策略会比寻找圣杯容易一些。不妨想想英国桂
冠诗人艾尔弗雷德·丁尼生爵士(Alfred,Lord Tennyson)那令人耳熟能详的
名句:“爱过之后失去总比从来没有爱过好。”[1] 换言之,爱是一种
优势策略。2.封面之战
回到《时代》与《新闻周刊》的竞争上来。假设有一个星期出了两
桩大新闻:一是众议院和参议院就预算问题吵得不可开交;二是发布了
一种据说对艾滋病有特效的新药。编辑们选择封面故事的时候,首要考
虑的是哪一条新闻更能吸引报摊前的买主(订户则无论采用哪一条新闻
做封面故事都会买这本杂志)。在报摊前的买主当中,假设30%的人对预
算问题感兴趣,70%的人对艾滋病新药感兴趣。这些人只会在自己感兴
趣的新闻变成封面故事的时候掏钱买杂志;假如两本杂志用了同一条新
闻做封面故事,那么感兴趣的买主就会平分两组,一组买《时代》,另
一组买《新闻周刊》。
现在,《时代》的编辑可以进行如下推理:“假如《新闻周刊》采
用艾滋病新药做封面故事,那么,假如我采用预算问题,我就会得到整
个‘预算问题市场’(即全体读者的30%),假如我采用艾滋病新药,我们两
家就会平分‘艾滋病新药市场’(即我得到全体读者的35%),因此,艾滋病
新药为我带来的收入就会超过预算问题。假如《新闻周刊》采用预算问
题,那么,假如我采用同样的故事,我会得到15%的读者,假如我采用
艾滋病新药,就会得到70%的读者;这一次,第二方案同样会为我带来
更大的收入。因此,我有一个优势策略,就是采用艾滋病新药做封面。
无论我的对手选择采用上述两个新闻当中的哪一个,这一策略都会比我
的其他策略更胜一筹。”
我们可以借助一个简单的表格,更加迅速而清晰地看出这番推理的
逻辑性。我们用图3—1中的两列表示《新闻周刊》的对应选择,用两行
表示《时代》的对应选择。这时我们得到四个格子,每一个格子对应一
组策略。格子里的数字代表《时代》的销量,用购买《时代》的读者数
占全体潜在读者数的百分比显示。第一行显示的是假如《时代》选择艾
滋病新药,它在《新闻周刊》选择艾滋病新药或者预算问题的两种情况
下的销量。第二行显示的是假如《时代》选择预算问题,它在《新闻周
刊》选择艾滋病新药或者预算问题的两种情况下的销量。比如说,在左
下角或者西南方向的格子,《时代》选择预算问题,《新闻周刊》选择
艾滋病新药,结果《时代》得到30%的市场。
这个优势策略很容易看出来。第一行的两个格子无一例外都比第二
行对应的格子占优,因为第一行的两个数字都比排在同一列下面的数字
大。这是优势地位的特征。通过这个表格,你可以很快就看出这个特征
是不是符合。你可以想象自己用第一行覆盖在第二行上面,然后会发现,盖住第二行的是更大的两个数字。相比之下,这个表格在阐述前面
一段话的时候具有压倒语言推理的直观优势,而这种优势随着博弈的复
杂程度加大而越发明显。在复杂的博弈当中,各方都有好几个策略。
图3—1 《时代》的销售
同理,在这个博弈里,双方都有一个优势策略。为了解释这一点,我们为《新闻周刊》的销量也画了一个表格(如图3—2所示)。第一列数
字显示的是假如《新闻周刊》采用艾滋病新药,它在《时代》采用艾滋
病新药或者预算问题的两种情况下各有多大销量。这一列的两个数字无
一例外都比第二列对应的数字占优,你可以再次想象自己拿起第一列覆
盖在第二列上时会发现什么。因此,艾滋病新药对《新闻周刊》来说也
是优势策略。图3—2 《新闻周刊》的销售
以策略观点来看,各方均有一个优势策略的博弈是最简单的一种博
弈。虽然其中存在策略互动,却有一个可以预见的结局:全体参与者都
会选择自己的优势策略,完全不必理会其他人会怎么做。但这一点并不
会降低参与或者思考这种博弈的趣味性。比如,在百码短跑中,优势策
略是能跑多快就跑多快,但许多人还是很喜欢参加或者观看这种比赛。
在第1章提到的捷尔任斯基广场牢房出现的囚徒困境中,两个参与者都
有一个优势策略,只不过这股压倒一切的力量最终将他们引向了一起倒
霉的结局。这就提出了一个很有意思的问题:参与者怎样合作才能取得
一个更好的结果?我们会在下一章进行更详细的探讨。
有时候,某参与者有一个优势策略,其他参与者则没有。我们只要
略微修改一下《时代》与《新闻周刊》的封面故事大战的例子,就可以描述这种情形。假设全体读者略偏向于选择《时代》。假如两个杂志选
择同样的新闻做封面故事,喜欢这个新闻的潜在买主当中有60%的人选
择《时代》,40%的人选择《新闻周刊》。现在,我们画出《时代》的
销量表格(如图3—3所示)。
图3—3 《时代》的销售
对于《时代》,艾滋病新药仍然是优势策略,但对于《新闻周
刊》,销量表格则变成下面这样(如图3—4所示)。
假如你拿起第一列,覆盖在第二列上,你会发现,30被一个较小的
数字(28)覆盖,而12却被一个较大的数字(70)覆盖。没有一个策略占有
压倒优势。换言之,《新闻周刊》的最佳选择不再与《时代》的策略无
关。假如《时代》选择艾滋病新药,《新闻周刊》选择预算问题就能得
到更好的销量,反之亦然。对于《新闻周刊》,得到整个预算问题市场总比得到一个较小份额的艾滋病新药市场要好,虽然整个艾滋病新药市
场比预算问题市场要大。
图3—4 《新闻周刊》的销售
《新闻周刊》的编辑们不会知道《时代》的编辑们将会选择什么,不过他们可以分析出来。因为《时代》有一个优势策略,那一定就是他
们的选择。因此,《新闻周刊》的编辑们可以很有把握地假定《时代》
已经选了艾滋病新药,并据此选择自己的最佳策略,即预算问题。
由此可见,只有一方拥有优势策略的博弈其实也非常简单。拥有优
势策略的一方将采用其优势策略,另一方则针对这个策略采用自己的最
佳策略。
现在,既然我们已经介绍了优势策略的概念,就有必要强调两点特征,这两点特征可用来确定什么不是优势策略。人们很容易就会弄糊
涂,不知道优势策略的优势究竟是对什么而言的。
1981年,伦纳德·西尔克(Leonard Silk)在撰写有关国会对《经济复苏
税法》争论的新闻时这样概括:“里根先生(Mr. Reagan)早已料到共和党
人拥有博弈论中称为‘优势策略’的东西,一个使参与者领先其对手的策
略,无论这些对手采用什么策略,结局都是一样。”[2] 我们将在第5
章更加仔细地介绍这个博弈,在这里想指出的是,西尔克对优势策略的
定义并不正确。“优势策略”的优势是指你的这个策略对你的其他策略占
有优势,而不是对你的对手的策略占有优势。无论对手采用什么策略,某个参与者如果采用优势策略,就能使自己获得比采用任何其他策略更
好的结果。回顾封面大战的例子,《时代》和《新闻周刊》都有一个优
势策略,但双方都不可能得到比对方更高的销量。
另一个常见的误解在于,一个优势策略必须满足一个条件,即采用
优势策略得到的最坏结果也要比采用另外一个策略得到的最佳结果略胜
一筹。在前面讲到的例子里,所有优势策略凑巧都满足这个条件。按照
最初设定的条件,《时代》假如采用艾滋病新药做封面故事,最坏的结
果是得到35%的市场份额;他们若采用预算问题做封面故事,可能得到
的最佳结果是30%的市场份额。但这并非优势策略的一个普遍特征。
现在让我们想象一下《时代》和《新闻周刊》之间爆发了一场价格
战。假设每本杂志的制作成本是1美元,且售价只有两个可能的价位选
择,分别是3美元(意味着每本利润为2美元)和2美元(意味着每本利润为1
美元)。假设顾客永远倾向于选择价格较低的杂志,且在杂志价格相同
的时候两种杂志各得一半读者。杂志定价3美元的时候,读者总数是500
万;杂志价格降到2美元,读者总数将升到800万。这时,你可以轻易算
出《时代》在4种可能出现的价格组合里将会获得多少利润,并由此得
出图3—5。图3—5 《时代》的利润
《时代》的优势策略是定价2美元(《新闻周刊》亦如此)。《时代》
采用这个优势策略可能得到的最坏结果是赢利400万美元。但是,采用
另外一个策略可能得到的最佳结果将超过这一数字,达到500万美元。
问题是比较这两个数字毫无意义。500万美元的数字是在两本杂志同时
定价3美元的时候出现的;不过,假如这时《时代》把价格降到2美元,利润还会更高,达到800万美元。
我们可以把这些例子归纳为一个指导同时行动的博弈的法则。
法则2:假如你有一个优势策略,请照办。不要担心你的对手会怎么做。假如你没有一个优势策略,但你的对
手有,那么就当他会采用这个优势策略,相应选择你自己最好的做法。
提醒一句:我们已经确立了同时行动的博弈的优势策略的概念。若
是换了相继行动的博弈,采用优势策略的时候就要格外留神。因为策略
互动的本质已经改变,优势策略的概念也会完全不同。假设我们说你有
一个优势策略,无论你的对手选择怎么做,你按照这个策略做都比采用
其他策略更好。若是相继行动,而你的对手先行,你就应该一直选择自
己的优势策略。正如我们已经说过的那样,这是你对你的对手每一个行
动的最佳对策,因此也是对现在他选择的这个特定行动的最佳对策。但
是,假如你先行,你就不会知道你的对手将会采取什么行动。他会观察
你的选择,同时做出自己的决定,因此你有机会影响他的行动。某些情
况下,若是采用优势策略以外的策略,你可能更有效地施加这种影响。
我们将在第6章讨论承诺的时候全面分析这个问题。
3.劣势策略
不是所有博弈都有优势策略,哪怕这个博弈只有一个参与者。实际
上,优势与其说是一种规律,不如说是一种例外。虽然出现一个优势策
略可以大大简化行动的规则,但这些规则却并不适用于大多数现实生活
中的博弈。这时候我们必须用到其他原理。
一个优势策略优于其他任何策略,同样,一个劣势策略则劣于其他
任何策略。假如你有一个优势策略,你可以选择采用,并且知道你的对
手若是有一个优势策略他也会照办;同样,假如你有一个劣势策略,你
应该避免采用,并且知道你的对手若是有一个劣势策略他也会规避。
假如你只有两个策略可以选择,其中一个是劣势,那么另一个一定
是优势策略。因此,与选择优势策略做法完全不同的规避劣势策略做
法,必须建立在至少一方拥有至少三个策略的博弈的基础之上。现在就
让我们看一个这种类型的简单例子。
设想一场橄榄球比赛的一次对抗。攻方一门心思竭尽全力向前推
进,能跑几码算几码,而守方则全力以赴阻挡对方向前移动,寸步不
让。举个例子:当比赛只剩下很少时间,攻方可能希望尽力推进,使自
己更容易得到一个射门得分的机会。
假如攻方只有两个策略,即带球跑或者传球,而守方则有三个策略——拦截带球跑、拦截传球以及闪击四分卫(blitz the quarterback)。我们
可以计算出全部六种策略组合分别能使攻方向前推进多少码。以守方选
择闪击四分卫而攻方打算传球为例。假设四分卫被撞得倒退10码的概率
是10%,迅速传球传出10码的概率是70%,而传球传出更远达到20码的
概率是20%。那么,平均值就是
0.1×(-10)+0.7×10+0.2×20=-1+7+4=10
显而易见,这些数字本应该以两队拥有或者缺少的特殊技能为基
础;我们只不过为了描述方便而选择了一些非常独特的技巧。
注27
我们用图3—6显示所有六种策略组合将会得出怎样的计算结果。
图3—6 攻方期望得到的码数
如图3—6所示,攻方竭力要得到最大数目,守方则尽量压低这个数
目,因此,我们没有必要分开列表确定他们的行动。
注28
双方都没有一个优势策略:没有一行的数字完全高于另一行,也没
有一列的数字完全低于另一列。不过,守方倒是有一个劣势策略,就是闪击四分卫。闪击四分卫的结果是无论如何都会拱手让出较大的码数,因此,这一策略对于守方而言会比它采用其他可能的策略都更糟糕。因
此,守方不应该闪击四分卫,攻方也可以非常自信地认定对手不会那么
做。
至此,这场推导尚未结束。闪击策略可能从守方教练的笔记本中删
除了,整个比赛可以被视为双方各有两个策略。在这场经过简化的比赛
中,攻方有一个优势策略,就是传球。其数字分别是9和8,都大于带球
跑策略的数字,分别是3和7。传球之所以不是原来的比赛的优势策略,原因在于,带球跑的结果在守方采取闪击策略的时候会有一个比较理想
的结果(因为带球者可能趁守方闪击四分卫而分身乏术时,顺利突入开
阔地带),而现在闪击策略已经不予考虑。因此,攻方将会选择传球。
反过来,守方也会想到这一点,选择自己的最佳策略,即防守传球。
这里涉及的普遍适用的概念可以归纳为一个指导相继移动的博弈的
行动法则。
法则3:剔除所有劣势策略,不予考虑,如此一步一步做下去。
假如在这么做的过程当中,在较小的博弈里出现了优势策略,应该
一步一步挑选出来。假如这个过程以一个独一无二的结果告终,那就意
味着你找到了参与者的行动指南以及这个博弈的结果。即便这个过程不
会以一个独一无二的结果告终,它也会缩小整个博弈的规模,降低博弈
的复杂程度。
我们以一个虚构的波斯湾海军对峙局势具体描述逐步剔除劣势策略
的做法。
注29 图3—7所示的格栅代表战斗舰艇的方位以及可能的选择。
I点的一艘伊拉克舰艇准备发射一枚导弹,企图击毁A点的一艘美国舰
艇。这枚导弹的路径已经由电脑程序在发射的时候确定,可以直线前
进,也可以每隔20秒大幅转动一个直角。假如这枚伊拉克导弹笔直从I
点飞向A点,美国导弹防御系统可以非常轻易地进行拦截。因此,伊拉
克一定会尝试带点拐弯的路径。所有能从I点通向A点的路径已经由下面
的格栅显示出来。每条边的长度,比如IF的长度,等于这枚导弹20秒之
内可以走过的距离。
那艘美国舰艇的雷达会监测到伊拉克舰艇发射的这枚导弹,因此电
脑会马上发射一枚反导弹。反导弹的速度和伊拉克导弹相同,也可以做
同样的90°拐弯。于是,这枚反导弹的路径也可以用同样的格栅表示,只不过这次是由A点出发。但是,为了填装足够撞毁一枚导弹的爆炸
物,反导弹不得不少装燃料,装的燃料只够它飞行1分钟,因此,它只
能走过三个节点(比如,从A点到B点,B点到C点,然后再从C点到F
点,这一路径我们用ABCF表示)。
图3—7
假如在这1分钟开始之前或者结束之际,我们的反导弹将与来犯的导弹相遇,那么,反导弹就会爆炸,消除伊拉克导弹的威胁,否则伊拉
克导弹就会击中我们的舰艇。问题是,应该怎样选择两枚导弹的路径?
在这个博弈里,值得关注的只有第1分钟的路径。各方必须事先想
好三个20秒时间段应该怎么走。将每个时间段的可能选择加起来,双方
各有8条可能的路径,共有64种组合方式。我们现在就来考察全部64种
组合方式,计算哪些方式下反导弹和导弹会迎头相撞,哪些方式下不会
相撞。
举个例子:假设伊拉克选择IFCB,即头两个时间段直线从I点经F点
到C点,然后转90°到B。对照美国的ABCF策略,可见,反导弹和导弹
将在两个时间段(即40秒)之后在C点相遇,因此这一组合的结果是相
撞。假如伊拉克还是采取IFCB策略,而美国却选择ABEF迎击,反导弹
和导弹就不会相撞。表面上看来,上述弹道都经过B点和F点,但反导
弹和导弹是在不同时间达到这些点;比如美国反导弹20秒后到达B点,而伊拉克导弹则要在60秒后到达。
图3—8显示了所有这样的组合。伊拉克的8个策略分别标为I1到I8,同时标出具体路径,比如I1表示IFCB。同样地,美国的策略用A1到A8
表示。相撞的结果记做H,不会相撞的结果记做O。
图3—8 击中与错过图
图3—8看起来好像很复杂,但只要借助消除劣势策略的法则,就能将其大大简化。美国反导弹的目标在于得到相撞的结果,因此在美国人
看来,H强于O。不难看出,对于美国人,A2策略与A4策略相比处于劣
势:假如你将A4行举起,盖在A2行上面,你会发现,只要是A2得到H
的地方,A4也会得到H,而且A4还多一个H,即对应伊拉克I5策略的地
方。对全部可能性进行这样的分析,可以知道A2、A3、A6和A7策略与
A4和A8策略相比处于劣势,A1不及A8,A5又不及A4。因此,伊拉克
人可以确信美国人只会采取A4或者A8策略。伊拉克人把注意力集中在
这两行,一心想避免反导弹和导弹相撞,因此在他们看来,I2、I3、I4、I6、I7和I8策略与I1或者I5策略相比处于劣势。划掉劣势策略所在的
行和列之后,整个博弈就简化为图3—10。
注30
我们的两个法则不可能将图3—10进一步简化了,因为这里已经没
有任何优势策略或者劣势策略可言。不过,我们已经做得很不错了。看
一看表格里剩下的策略,我们发现,伊拉克导弹应该沿着格栅外围前
进,而美国反导弹则应该小步曲折前进。这样,我们很快就能看到双方
应该怎样从各自拥有的两个方案中进行抉择了。图3—9 击中与错过图图3—10 简化的击中与错过图
4.均衡策略
......
版权页
中文版前言
巴里·奈尔伯夫 前 言
作为魅力学问的博弈论
序 言
第1部分
第1章 10个策略故事
1.妙手传说
2.领先还是不领先
3.直奔牢房
4.我将坚持到底
5.给猫拴个铃铛
6.楔子的尖端
7.三思而后行
8.多管齐下
9.别跟笨蛋对等打赌
10.博弈论可能危害你的健康
11.未来的模样
12.案例分析之一:红色算我赢,黑色算你输
第2章 准备接招
1.轮到你了,查理·布朗
2.两种策略互动
3.策略的第一法则
4.决策树与博弈树
6.讨价还价
7.战争与和平
8.英国人玩的博弈
9.案例分析之二:汤姆·奥斯本与1984年橙碗球场决赛的故事
第3章 看穿对手的策略
1.优势策略
2.封面之战
3.劣势策略
4.均衡策略5.盛宴还是饥荒
6.案例分析之三:莽汉软招
第1部 分结语
第2部分
第4章 走出囚徒困境
1.如何达成合作
2.觉察作弊
3.对作弊者的惩罚
4.惩罚的保证
5.惩罚方式的选择
6.以牙还牙
7.以牙还牙策略的一个替代选择
8.案例分析之四:国会对联邦储备委员会
第5章 策略行动
1.无条件行动
2.威胁与许诺
3.警告与保证
4.核阻吓
5.时报的策略
6.更多的策略行动
7.杀鸡焉用牛刀?
8.案例分析之五:波音、波音,完蛋了?
第6章 可信的承诺
1.建立可信度的八正道
2.只有一次生命可以献给你的祖国
3.你难以拒绝的提议
4.案例分析之六:你会不会宁可向IBM租一台电脑?
第7章 不可预测性
1.怎样使输赢机会相等?
2.有人要打网球吗?
3.为什么你应该选择正确的混合策略?
4.为什么不能依赖对手的随机化?
5.你的技巧变化了,你的最佳混合策略怎样变化?
6.怎样随机行动?
7.独一无二的情况
8.谎言的安全措施
9.出人意料10.得势不饶人
11.案例分析之七:霸王行动
第2部分 结语
1.历史注记
2.深入阅读
3.我们的遗漏责任
4.从这里开始
第3部分
第8章 边缘政策
1.为什么选择不确定性?
2.风险机制
3.风险控制
4.逃离边缘
5.跌落边缘
6.核边缘政策
7.案例分析之八:大西洋上的边缘政策
第9章 合作与协调
1.钟为谁而鸣?
2.那条人迹罕至的路线
3.第22条军规?
4.比超速驾驶传票还快
5.他们为什么离开?
6.可能高处不胜寒
7.政治家与苹果酒
8.股市与选美
9.复习
10.案例分析之九:牙医分布的解决方案
第10章 投票的策略
1.打破平局
2.中点的选民
3.天真的投票
4.法庭的秩序
5.老于世故者
6.历久不衰的名人
7.爱一个可恶的敌人
8.案例分析之十:全取或全失
第11章 讨价还价1.谈判中的锄强扶弱体系
2.“这对你的伤害大于对我的伤害”
3.边缘政策与罢工
4.同时就许多事情讨价还价
5.案例分析之十一:施比受好?
6.附录:耐性自有回报
第12章 激 励
1.怎样奖赏工作表现?
2.怎样组织一个合作项目?
3.招标、拍卖的策略
4.案例分析之十二:取胜的风险
第13章 案例分析
1.别人的信封总是更诱人
2.末位应该变成首位
3.三方对决
4.弄巧成拙的防鲨网
5.糊涂取胜
6.大好时节与时机选择
7.坚持就是胜利?
8.贵人行为理应高尚
9.独霸天下
10.海湾大桥
11.公用地悲剧
12. 1美元的价格
13.李尔王的难题
14.美国诉艾科亚
15.错错得对
16.赢得最后一步
17.边缘政策与陪审团
18.管闲事的自由
19.给市长发一枚“大奖章”
20.大洋两岸的武装
21.慈善捐助的局限性
22.再分配的局限性
23.有时骗倒所有人:拉斯韦加斯的老虎机
注 释
索 引附录
译后记版权页
图书在版编目(CIP)数据
策略思维:商界、政界及日常生活中的策略竞争(美)迪克西特,(美)
奈尔伯夫著;王尔山译. —北京:中国人民大学出版社,2013.4
(大师细说博弈论)
ISBN 978-7-300-17262-0
Ⅰ. ①策… Ⅱ. ①迪…②奈…③王… Ⅲ. ①决策学 Ⅳ. ①C934
中国版本图书馆CIP数据核字(2013)第060569号
出版发行 中国人民大学出版社
定价 42.00元
Thinking Strategically: The Competitive Edge in Business, Politics, and
Everyday Life
by Avinash K. Dixit and Barry J. Nalebuff
Copyright?1991 by Avinash K. Dixit and Barry J. Nalebuff
Originally published by W. W. Norton Company, Inc.
Simplified Chinese version?2013 by China Renmin University Press
All Rights Reserved.中文版前言
现在距离我们完成《策略思维》之日已有十几年时间。在这段时间
里,博弈论达到全盛时期。当初我们动笔的时候,知道博弈论的人还寥
寥无几,懂得将博弈论用于实践者更是屈指可数;有关博弈论的著作充
满数学公式,令人望而生畏,其应用也仅限于“奇爱博
士”(Dr.Strangelove,同名电影主角)这样的防务分析员。不过,从那时
起,博弈论的贡献渐渐获得世人承认,先是约翰·纳什获得诺贝尔奖,然后有了一部获得奥斯卡奖的电影。如今,在绝大多数大学,博弈论成
了热门课程,在不少商学院甚至被规定为一门必修课。博弈论在实践中
也得到了广泛的应用。从拍卖金额高达几十亿美元的用于承载手机信号
的电波波段,到为麦肯锡这样的顶尖咨询公司提供策略咨询服务,再到
预测谁会在真人秀《幸存者》中被淘汰出局,博弈论可说无处不在。
策略思维在中国有着很深的渊源。人人都知道孙武和他的《孙子兵
法》
注1 ,其实在中国还有很多不那么知名的策略作者和思想家。译者
王尔山在翻译本书的时候,就想到了中国历史和传说中的几个故事,意
识到这些故事包含博弈论的基本要素,可以用于解释这个理论。现在,她正在考虑撰写一部以这些历史故事为基础阐述博弈论的著作;我们期
待早日看到这部作品。
我们希望各位可以从本书得到一些收获。一是改变观点。我们希望
你可以从别人的角度观察这个世界。正确做到这一点对于确定你自己的
最佳策略是必不可少的。不过,从别人的角度观察这个世界做起来并不
容易。我们总喜欢把别人看做和我们一样的人,而不是完全不同的类
型。博弈论要求你设身处地,仔细分析自己若处于对方的境地,思路会
有什么变化,哪怕你完全不能同意他们的见解。说不定,在你读完本书
的时候,你会发现自己对美国人的见解有了进一步的认识。
二是向前展望,倒后推理。这里说的是做出一系列行动和反行动,预计沿着你现在前进的道路走下去,最后你会到达哪里。我们听说,有
一句成语的大致意思是“如果你留在目前的道路上,这就是你最后的归
宿”。“向前展望,倒后推理”的法则却告诉你,应该首先确定自己最后
希望达到什么目标,然后从这个结果倒后研究,直到找出自己现在应该
选择哪条道路,这样才能保证以后可以达到那个目标。
记住,博弈论说的并不仅仅限于击败对方。这个理论同时解释了建立合作与战而胜之两方面的策略。也许这意味着我们应该将孙武和托尔
斯泰结合起来,变成《战争与和平的艺术》。
最后,我们希望各位可以从阅读本书的过程中得到许多乐趣。我们
在写作本书时,感到很有乐趣。
阿维纳什·迪克西特巴里·奈尔伯夫 前 言
策略思维是关于了解对手打算如何战胜你,然后战而胜之的艺术。
我们每个人都会在工作中和日常生活中用到策略思维。生意人和企业必
须借助有效的竞争策略才能生存下去;政治家必须设计竞选策略,使自
己得以当选,还要构思立法策略,使自己的主张得以贯彻;橄榄球教练
必须制定策略,由球员在场上实施;父母若想教会孩子良好的行为举
止,自己至少应该变成业余的策略家(而孩子是职业选手);40年来,超
级大国的核策略一直主宰着人类的生死。
范畴如此广泛的好的策略思维,一直是一门艺术。不过,它的基础
是由一些简单的基本原理组成的。这是一门新兴的策略科学。我们写作
本书的信念在于,假如来自不同背景和行业的读者了解了这些原理,他
们就会变成更出色的策略家。
关于策略思维的科学称为博弈论。这是一门相对年轻的科学,历史
尚不足50年。博弈论已经为现实生活当中的策略家们提供了许多有用的
启迪。不过,就像其他学科一样,博弈论也渐渐陷入了行话术语和数学
符号之中。虽然这些都是必不可少的研究工具,但结果却将理解其基本
想法变成少数专业人士的特权。我们试图将其中许多重要思想翻译过
来,使聪明的普通读者也能读懂。我们用描述性的例子和案例分析取代
了理论证明。我们去掉了全部数学以及大部分术语。对于一切愿意思考
一点算术、表格和图表的读者,读懂本书应该不会有什么困难。
许多书籍已经尝试过为特定目的找出策略思维的方法。汤姆·谢林
(Tom Schelling)关于核策略的著作,尤其是《冲突策略》(Strategy of
Conflict)和《军备与影响》(Arms and Influence),都颇负盛名。实际
上,谢林还是将博弈论大量应用到核冲突领域的先行者。迈克尔·波特
(Michael Porter)的《竞争战略》(Competitive Strategy)描绘了商业策略当
中的博弈论教训,也同样有名。史蒂文·布拉姆斯(Steven Brams)也写过
几本书,最有名的当数《博弈论与政治》(Game Theory and Politics)。
我们在本书中并未将整个博弈思想局限于任何一个特定场景;相
反,我们用了许多不同的例子说明每一个基本原理。这么一来,具有不
同背景的读者总能从中看到一些令人感到亲切的案例。他们还会看到同
样的原理是如何适用于相对陌生的情况的;我们希望这样做能使他们用
一种新的眼光看待许多新闻或者历史事件。我们还从大多数美国读者共有的经验当中提取例子,比如来自文学、电影和体育的生动案例。严肃
的科学家可能觉得这会使策略学问变得琐碎,不过,我们相信,来自电
影和体育的熟悉的例子是一个非常有效的工具,有助于传达重要的博弈
概念。
就像托尔金(Tolkien)的《指环王》(Lord of the Rings)一样,我们这
本书也是以讲故事取胜的。它的“古代起源”是阿维纳什·迪克西特在普
林斯顿的伍德罗·威尔逊公共与国际事务学院开设和讲授的一门关于策
略博弈的课程。巴里·奈尔伯夫后来也在耶鲁大学的政治科学系以及耶
鲁的组织与管理学院(简称SOM)教过这门课程和另一门类似的课程。有
许多学生对这些课程表现出很大的热情,贡献了许多想法,我们深表谢
意。尤其需要提到的名字包括安妮·凯斯(Anne Case)、乔纳森·弗莱明
(Jonathan Flemming)、希瑟·哈泽德(Heather Hazard)、丹尼·罗德里克
(Dani Rodrik)和乔纳森·希姆索尼(Jonathan Shimshoni)。和野崇(Takashi
Kanno)与岛津泳一(Yuichi Shimazu)承担了将我们的论述和概念译为日语
的工作,而在这个翻译过程中,他们也使英文版本变得更完善。
写作一本更接近大众阅读层面而非教科书的想法来自密歇根大学的
哈尔·瓦里安(Hal Varian)。他还在初稿阶段就给我们提供了许多有用的
想法和评价。W.W.诺顿公司的德雷克·迈克费利(Drake McFeely)是一个
严格细致的编辑,非常了不起,很有眼光。正是他做了非同寻常的工
作,才使我们的学术论文成为生动有趣的故事。假如本书现在仍然留有
教案的痕迹,那一定是因为我们没有全盘接受他的建议。
许多同事和朋友都认真阅读了本书早期的草稿,向我们提出了大量
详细而出色的改进建议。我们要特别感谢戴维·奥斯汀-史密斯(David
Austen-Smith,罗切斯特大学)、艾伦·布林德(Alan Blinder,普林斯顿大
学)、塞思·马斯特斯(Seth Masters,S.Bernstein 公司)、卡尔·夏皮罗(Carl
Shapiro,普林斯顿大学)、路易斯·泰勒(Louis Taylor,MITRE公司)、托
马斯·特伦戴尔(Thomas Trendell,ATT-Paradyne公司)、特里·沃恩(Terry
Vaughn,麻省理工学院出版社)以及罗伯特·威利格(Robert Willig,普林
斯顿大学)。斯泰西·曼德尔鲍姆(Stacey Mandelbaum)和劳拉·康·沃德
(Laura Kang Ward)作为手稿编辑,对我们的错漏之处非常宽容。各位每
次阅读的时候,假如找不出一个错误,就该感谢她们的功劳。
我们还要感谢那些帮助我们确定本书书名的人。哈尔·瓦里安从一
开始就建议我们用“策略思维”的书名。耶鲁SOM的学生们给我们提供了
更多选择。我们比较中意的书名包括德博拉·哈尔彭(Deborah Halpern)的“超越球场”以及威廉·巴恩斯(William Barnes)主笔的广告语:
“策略思维——上阵时千万别忘了它”。
注2
阿维纳什·迪克西特
巴里·奈尔伯夫作为魅力学问的博弈论
(总序)
有许多理由让我向读者们推荐博弈论,也顺便推荐本套丛书。说起
博弈论,在过去的10多年里,人们对于它的感受是随着时间的推移而变
化的。20世纪90年代初,我开始为研究生和博士生开设博弈论课程,一
些同事用怀疑的眼光看着我。随后,在中国经济学界出现了博弈论热
潮,而这种博弈论热潮是我在1996年发表在当时很有名的《经济学消息
报》上面的文章所准确预言了的。
注3 随后,有一些反潮流的人撰文批
评这样的博弈论热,但是,我们看到,即使包括张五常这样的大家在内
的批评者都没有成功地为博弈论热降温。在今天的经济学专业杂志上,包括国际上著名的经济学刊物,甚至在超出一般意义的经济学期刊,譬
如管理、法律、政治学、生物学、心理学、军事科学等学术杂志上,运
用博弈论方法构造数学模型的论文可以说是汗牛充栋、随处可见了。
与许多学问不同,博弈论不仅仅因为它开始成为包括经济学在内的
社会科学的一般性研究框架而显得重要,犹如19世纪的牛顿力学在自然
科学中的地位,而且,博弈论还是一门充满韵味且魅力十足的学问。正
是由于博弈论那深刻的策略分析与对于大千世界中无所不在的复杂现象
的巧妙解读,人们不仅满足了好奇心,而且还会感到茅塞顿开,豁然开
朗,甚至在读了博弈论对于从经济管理到进化生物学一系列学术难题的
精妙解读之后,禁不住会大呼过瘾,爽极!
对于许多人来说,科学的价值是能够帮助人们去认识世界、改造世
界。其实,这是实用主义者的感受。对于科学家,特别是一些大科学家
来说,他们认为科学理论的价值是它无比的美感,譬如爱因斯坦、薛定
谔。对于既不同于普罗大众,也不是爱因斯坦那样的大科学家的大多数
研究者来说,玩科学的感受其实就是有趣。趣味,是使得大多数科学家
埋头于学问的主要推力。这种沉迷于学问里面的无穷趣味,是普通人难
以想象甚至难以企及的境界,那可不是一般的趣味,那是“神趣”!——
令人神魂颠倒、忘乎所以之意境!有如窥见上帝秘密之快感和人世间任
何其他满足都难以比拟的快乐。当然,并不是所有的学问都能够如此这
般地给人带来快乐,但是博弈论肯定是位列其中的。
作为研究策略性互动的学问,博弈论在解释经济行为的原因、政治
制度的形成与演化、进化心理学假说的模型构建、进化生物学的数学化、市场设计与供求匹配等方面大获成功,已经成为生命体行为现象微
观研究的重要方法——不仅仅是人类的经济行为。
美国第一位获得诺贝尔经济学奖的大师保罗·萨缪尔森说过:如果
你想成为一个有见识的人,就一定要读读博弈论。其实,读读博弈论,还不仅是让人开眼界、长见识,喜欢深刻思考的人,会发现博弈论正是
你爱不释手、丢弃不了的东西。
到底博弈论有什么迷人的地方呢?随便举个信手拈来的例子,就是
中国的跨地区移动通讯为什么要收取漫游费。要知道,全世界只有三个
国家在收取漫游费——中国、印度和日本。为什么?在我曾经参加的听
证会上,运营商说跨地区移动通讯会增加运营商的业务量,所以成本的
增加使得它们通过收取漫游费来填补额外的成本。其实,收取的漫游费
数量远远超出了它们购买设备处理业务的费用,这样的理由是不成立
的。那么,是什么难言之隐让运营商要收取漫游费呢?博弈论让我们很
容易推演出运营商难言的秘密:如果取消漫游费,那么运营商们就处于
全国统一的竞争性市场中,它们之间就会打起价格战,导致大多数运营
商退出,而留下极少数幸存者垄断市场。并不是所有的运营商都有这样
的自信:我会是最后的幸存者。所以它们之间就达成这样的默契:通过
漫游费将市场分割为各个区域性市场。漫游费是地区市场分割的壁垒,各个地区的运营商都在自己的地盘里过着垄断带来的好日子。比如,在
漫游费的高墙下,你是北京的用户,想用重庆的电话,因为重庆的话费
可能要便宜一些。但是,漫游费就让你用重庆的电话比用北京的电话还
要贵。这样,即使重庆的电话费比北京的电话费便宜,漫游费也让你难
以企及,因为加上漫游费,对你来说用重庆的电话就要比用北京的电话
贵了。同样,重庆的用户也会只用重庆的电话,各个地区的用户都只用
本地区的电话,全国性的统一竞争性市场就被分割成各个地区的垄断市
场,而用户们也不得不支付高额的话费。在这里,博弈论所起的作用
是:它预言统一市场中会出现价格战。因为如果你知道一点博弈论,就
一定知道“囚徒困境”这样简单的博弈论模型,也知道两个小偷在警察面
前都会相互出卖同伙的结果。竞争性市场里的企业相互杀价,进行价格
战就是“囚徒困境”,而相互出卖是它们的选择。
怎么样,博弈论让你大开眼界了吧。其实,在博弈论里,这样的妙
招很多,它会教你怎样识破谎言。1996年的诺贝尔经济学奖得主之一、博弈论专家维克里就教会招标人如何识破投标人的谎言,让投标人老老
实实地把真实的底价告诉招标人。举一反三,同样基于惧怕价格战的原因,沃尔玛与麦德龙连锁店在
选址上就不会十分接近。读者也许会注意到,沃尔玛与麦德龙在全世界
任何地方的分店,通常都有足够远的距离。这样,即使居住在沃尔玛附
近的消费者知道麦德龙的商品可能较沃尔玛便宜,但是较远的空间距离
也让他对于放弃沃尔玛而去麦德龙购物望而却步。同样,居住在麦德龙
附近的消费者也会是麦德龙的客户。沃尔玛与麦德龙之间拉开空间距
离,就能够相互维护二者之间的市场细分而避免价格战对于双方的伤
害。这是一种默契,也是博弈的结果。
博弈论不仅仅是学问,也不仅仅可供人们在茶余饭后消遣。更加重
要的是,博弈论在现实中被广泛运用,从英美国家的3G手机频率拍
卖,到1999年台湾“大选”中陈水扁上台,都明显或者不明显地采用了博
弈论的策略。1999年,台湾“总统大选”。当时,卸任“总统”李登辉暗地
想把“台独”分子陈水扁扶上台。国民党有两个候选人:连战与宋楚瑜。
尽管在那个时候国民党在台湾已经有一些日薄西山,但是与新起的民进
党相比,仍然是“瘦死的骆驼比马大”,小小的民进党是难以撼倒国民党
的。但是,李登辉是经济学家,作为台湾大学的经济学教授,他自然想
到了运用博弈论策略对国民党使阴招,尽管他当时还是国民党的总裁。
他通过媒体发表许多伤害宋楚瑜的言论,使宋楚瑜上当。因为一气之下
的宋楚瑜为了与作为国民党总裁的李登辉划清界限,就贸然把他的支持
者从国民党拉出去,另外成立了一个亲民党。这样,本来可以轻松击败
民进党的国民党,就由于选票被国民党与亲民党两个党分散,让民进党
最终取胜。可以说,李登辉在1999年是运用博弈论霍特林模型中的策
略,成功分化了国民党的选票而使陈水扁登上台湾“总统”的宝座,而他
对博弈论策略的运用也达到了炉火纯青、天衣无缝的水准。在霍特林模
型中,如果是两个候选人竞争,他们会使自己的政治纲领相互靠近,但
是,如果是三个候选人竞争,则其中一个候选人把自己的政治纲领适当
地与其他两个候选人的政治纲领拉开距离就可以取胜。由于连战与宋楚
瑜之前的选民都是国民党的选民,他们俩分开后,他们的支持者之间的
政治偏好是差不多的,所以,陈水扁只要把自己的政治主张适当地与他
们俩区分开来,就可以分别击败他们。李登辉是通过博弈论而瞒天过海
的,不仅让宋楚瑜上当,而且使整个国民党甚至选民们也被蒙在鼓里。
博弈论不仅仅是好玩,而且十分有用。我们来看看下面这个例子。
20世纪80年代,在美国有两家销售音响产品的商店——疯狂艾迪和纽马
克路易斯。疯狂艾迪为了阻止纽马克路易斯私下进行降价竞争,陷
入价格战导致双方同归于尽,便打出了这样一个广告:凡是在疯狂艾迪购买商品的顾客,如果发现在其他商店可以以更低的价格买到同样的商
品,疯狂艾迪可以按照差价的双倍对顾客进行补偿。这样,如果纽马克
路易斯私下降价,任何人都不会去它那里买东西。因为所有人为了获
得两倍差价的补偿都会去疯狂艾迪买商品。这意味着一旦纽马克路易
斯私下降价,则对方会自动降价更多,并且纽马克路易斯的顾客还会
流失。这种方式就迫使纽马克路易斯不敢私下降价,价格战就这样避
免了。
这个案例在全世界都被模仿。我在重庆的家乐福超市也看到过类似
于疯狂艾迪那样的广告:谁要是在重庆主城区以比本店更加便宜的价格
买到同样的商品,本店将按照差价的三倍补偿。
更加鲜活的例子是,在2012年,中国的电子商务巨头京东试图挑起
的一场大家电价格战被苏宁电器用与当年疯狂艾迪完全相同的博弈策略
秒杀了!2012年8月14日,京东商城的首席执行官刘强东在其实名认证
的微博上面声明:京东商城的所有大型家电将在未来三年里保持零毛
利,“保证比苏宁、国美连锁店便宜至少10%以上”。苏宁立即以微博接
招,宣布所有产品价格必然低于京东,否则将给予消费者两倍差价赔
付。于是,硝烟还没有升起,京东便偃旗息鼓了。苏宁简单搬用疯狂艾
迪的策略便一招致命,击退了京东的挑战。
在政治领域,博弈论更是如鱼得水。现今的政治科学研究,大量采
用博弈论的方法已经是世风。一些令人头疼的政治现象,用博弈论方法
看就是直截了当的了。譬如,中东和平进程为什么受阻,就是因为目前
的停滞状态是博弈论中的纳什均衡。巴勒斯坦要求以色列首先交还被占
领土,然后才声明放弃恐怖活动;而以色列要求巴勒斯坦首先宣布放弃
恐怖活动,然后它们才交还占领的巴勒斯坦领土。双方都不愿意首先改
变自己的策略。因为如果巴勒斯坦宣布放弃恐怖活动,以色列也可以不
交还被占领土,巴勒斯坦就惨了。同样,如果以色列交还了占领的巴勒
斯坦领土,巴勒斯坦也可以不宣布放弃恐怖活动,以色列也会吃大亏
的。因此,双方都不会首先改变自己目前的策略,这就是博弈论里的纳
什均衡。既然是纳什均衡,就是一种难以改变的胶着状态。
混合策略博弈是指博弈的参与人通过模糊自己的策略动机迷惑对手
的博弈。在人们的生活中,谈恋爱就是一种混合策略博弈。在谈恋爱的
过程中,女孩子通常会对于男孩子的追求反应含糊。因为如果女孩子说
她爱男孩子,男孩子就认为已经搞定,就不会继续狠追女孩子了,女孩
子会因此失去被追的愉悦。如果女孩子说她不爱男孩子,男孩子就会放弃,女孩子就会失去继续考察男孩子的机会。所以,女孩子总是对于男
孩子的追求若即若离,不轻易说她对他爱与不爱。这是混合策略的运
用。
一旦引入信息不对称,博弈论就更加魅力十足了。许许多多曾经是
扑朔迷离的社会现象、经济现象,甚至生命现象,在信息不对称假设下
就会令人感到茅塞顿开。
在2013年初,包括韩国和日本在内的一些在华外资汽车公司,纷纷
开始推出将新购汽车的保修期延长至5年的营销策略。外资企业采用这
种策略的目标是试图将中国的国产汽车公司挤出市场。以往,中国的国
产汽车与外资之间在华市场的竞争主要依靠价格优势。但是,由于劳动
力成本的上升,价格优势不再,外资企业依靠的是质量优势,这是国产
汽车公司难以模仿的,它们由此发出高质量的信号,从而形成不对称信
息中的分离均衡。
也就是说,在过去中国还具有低劳动力成本的情况下,国产汽车公
司与外资之间还存在竞争,这种竞争的均衡是外资的高质量与国产汽车
公司的低价格之间的平衡。到了2013年,国产汽车的低价格优势由于原
材料涨价和劳动力成本上升而逐渐式微,外资与国产汽车之间都在差不
多的价格水平上进行竞争了。在这种情况下,在同样的价格水平上,消
费者就更加偏好高质量的汽车。保修期越长,就可以被认为是质量越高
的产品。因为只有生产高质量产品的公司,才不会因为较长的保修期而
产生高昂的费用,这是由于高质量产品在即使是较长的时间里也较少出
现质量问题。这样,通过较长的保修期,企业就把高质量的信号发送给
了消费者,而消费者也就因此放弃购买没有发送高质量产品的企业产
品,转而购买发送高质量信号的企业产品了。
生命现象是我们这个地球上最神奇、最神秘的现象。达尔文的进化
论为我们说明了复杂的生命现象是如何进化而来的。正是博弈论为进化
论建立起了数学模型。
生命的个体也许并不是对于许多不同的生存策略进行理性的选择,而是通过偶然的试错过程发现了最优的策略。当所有个体都完成了最优
生存策略的“自然选择”之后,就达到了纳什均衡。个体因为发生突变而
面对不同的生存策略,而不同的生存策略给个体带来了不同的生存适应
度。只有那些带来最大适应度的策略才可以让个体生存下去,而通过遗
传,那些成功地“自然”选择了最优策略的个体便把自己的基因遗传了下来,而其他物种个体便灭绝了。博弈论专家证明,这种自然选择出来的
最优策略是纳什均衡策略,尽管并不假定生命个体一定是理性人——这
避免了传统经济学理性人假设带来的尴尬,因为心理学家经常会批评这
样的假定。
在人类出现的东非大峡谷,那些高个子的人类祖先,因为生存更加
困难(高个子更容易被豺狼虎豹看见,在野兽追来时更难以躲避),心脏
负荷大,需要更多的食物而处于生存劣势。因此,只有那些生存能力较
强的高个子基因遗传下来了。这是一种不对称信息博弈中的信号博弈现
象。高个子是发送优良基因的信号,所以人们在谈对象的时候,一般喜
欢高个子,这是因为他们或许载有更加优良的基因,可以通过与他们结
合把自己的基因遗传下去,因为既然高个子生存更加困难,但是当他们
还生存着时,就意味着他们具有更加强大的生存基因。表面看起来,喜
欢高个子是因为我们觉得高个子赏心悦目,是美的元素。其实,人类的
美感是与生存能力联系起来的。这是所谓进化博弈论的发现。
博弈论中最具魅力的部分是信号博弈。在进化博弈论里,信号博弈
把过去人们认为是纯粹主观性的审美解读成进化中的生存博弈形成的策
略,当然是物种在进化过程中的纯粹是自然选择的策略。
信号博弈还可以解释官僚贪污现象。官员贪污腐败是忠诚的信号。
读者可能会觉得奇怪:贪污腐败怎么与忠诚联系在一起?其实,政府官
员贪污尽管是古今中外都普遍存在的现象,但是从历史上看,在东方要
盛于西方。在东方,至少在过去,特别是东方一些完成现代化进程之前
的国家,贪污甚至是人们习以为常的,或者说是老百姓看来无可奈何的
现象。同时,我们注意到,在历史上,东方也普遍采取专制社会的社会
治理模式,以至在文献上会出现“东方专制社会”的术语。
我们下面从博弈论的信号发送机制出发,说明这两个社会现象之间
存在着密切的联系,即专制社会与官员贪污腐败之间存在着因果关系。
专制会带来贪污腐败,或者说比非专制社会更加普遍的贪污腐败现象,这种因果关系并不是简单地因为专制社会缺乏对于官员的监督,而是因
为在专制社会里,官员向其上司表忠诚,可以通过自己贪污腐败来发送
忠诚的信号,以利于保护自己。
在专制社会,官员的全部命运基本上都掌握在他上司手里。上司可
以决定他们的升迁,甚至掌控着他们的身家性命!官员为了保护自己,让上司找不到任何可以灭掉自己的口实,或者
让上司相信自己不会谋反,自己是完全忠诚于上司的,就需要发送这样
的信号给上司——我是忠诚于您的!
但是,发送的信号必须要满足“可置信”的条件。上司怎么才会相信
你的表白呢?
如果你非常清廉,这样就会有好的声誉。一旦你谋反成功,譬如谋
朝篡位,你的好声望就会让人民接受你,而让想攻击你的潜在敌人感到
要击败你是比较困难的。正是你的好声誉会助你谋反成功。
但是,如果你的声誉很糟糕,即使你谋反成功,人民也不会接受
你,你的敌人也会利用这一点对你发起攻击,并且会得到人民的响应,你会落败的。
这样,当你具有好的声誉时,你谋反成功并且取而代之的动机就会
比较强烈,相反,你的坏声誉会增加你谋反成功的难度,你的谋反动机
也就比较小了。
如果你并不想谋反,同时也要向上司表明你的忠诚,你就可以采取
自毁声誉的办法,增加你谋反成功的难度,同时也告诉你的上司,你是
不会谋反的,因为你谋反成功的机会很小!这种信号是可置信的。
当你的上司相信你不会谋反时,你就成功地保护了自己。
当然,官员的贪污不仅仅是为了实施这样的策略,也有真正对于财
富的贪婪。但是,人们对于财富的贪婪无论在东方还是西方社会都应该
是一样的,为什么在东方社会要更加普遍?这是因为东方社会普遍存在
的专制治理模式给这一信号发送提供了动力。所以,贪污作为信号是有
一定解释力的。
当然,这种信号理论比较适合解释皇帝身边的权臣贪污,并不能解
释下层官员的贪污。譬如,和珅生活在乾隆皇帝身边,但是其贪得无厌
到了不能企及的程度,乾隆皇帝反而对他宠爱有加。
据说张良在跟随刘邦进入京城的时候,便叫家丁们到街上去打砸
抢。这样的自毁声誉与贪污行为其实都是保护自己的策略,两者异曲同
工。博弈论看起来深刻奥妙,有一些玄乎。其实,博弈论就在我们身
边,每时每刻,无所不在。2013年春,朝鲜三次核爆,单方面宣布《朝
鲜停战协定》无效,大肆反美,令全世界都为朝鲜捏了一把汗。其实,如果从博弈策略的角度分析,朝鲜是有充分的自信的。朝鲜知道,美国
其实是不会打击朝鲜的。如果美国对朝鲜进行核打击,则东北亚会出现
核污染,会伤及驻日本和韩国的美军。美国政府在选民的压力下不得不
从东北亚撤出。这样,美国在东北亚核战争中不仅一无所得,而且还会
遭到全世界的责骂,并且灰溜溜地从长期盘踞的东北亚撤出。如果美国
用高科技常规武器打击朝鲜,朝鲜会用核武器反击,美军大败,加上东
北亚的核污染,导致美国同样会从东北亚撤出,朝鲜会崛起,统一半
岛。所以,美国人并不会对朝鲜进行打击,无论是用核武器还是常规武
器。事实上,这样的判断是存在先例的。1969年,当时因为中国与苏联
在珍宝岛的冲突,苏联打算对中国进行核打击,被美国的尼克松总统干
预制止了。尼克松并不是要帮中国的忙,而是怕中国与苏联的核战争污
染了驻日本和韩国的美军,导致美军不得不撤出东北亚。由此,朝鲜核
爆反美是它的占优策略——这是博弈论的术语,即在任何情况下都是最
优的策略。
因此,朝鲜完全可以大张旗鼓地反美,不断进行核爆挑衅,并不担
心美国会拿它怎么样。我们看到,在朝鲜不断升级的挑衅下,美国人基
本上是无动于衷的。因为一方面是朝鲜猜透了美国人的想法——他们不
敢动真格;另一方面,美国人也猜出了朝鲜的想法,知道他们知道自己
的想法——这就是博弈论——你知道他知道你知道他的……这就是博
弈!
既然是这样,双方都是在演戏,那么,朝鲜演这出戏是给谁看呢?
答案是:演给朝鲜的老百姓看。这样,新上台的领导会树立威信——瞧
瞧,咱弄得美国佬都拿咱没有办法!——还行吧!其实,在朝鲜核爆的
背后存在好几个博弈呢!在这样的情况下,当朝鲜雄起的时候,美国只
有处于守势,而给定美国处于守势,朝鲜当然会选择攻势——这是众所
周知的胆小鬼博弈,或者叫做斗鸡博弈。而且,朝鲜玩的是边缘博弈,并且,朝鲜越是疯狂,其实是表面上看起来是疯狂,越是脱离中国或者
俄罗斯的管束,边缘博弈的威慑作用就越大,不知道有多少人看出了这
一点!
好了,我们看到,潜藏在博弈论精深的数学模型背后的故事是多么
地精彩!每一个博弈论模型都有着一个好听的故事。本套丛书就为大家提供了更多更加好听的故事,赶快去读读吧……
蒲勇健
2013年3月20日
重庆渝中区瑞天路雍江苑
序 言
什么是策略行为?
人们在社会当中应该怎样举止行事?
我们将要给出的答案与道德或礼节无关。我们也不打算与哲学家、传道者或埃米莉·波斯特
注4 (Emily Post)一争高下。我们将要讨论的主题
虽然没有道德或礼节那么宏大,却同样反映我们每一个人的生活。本书
是讲述策略行为的。不管我们是否乐意,我们每一个人其实都是策略
家。既然这样,当一个出色的策略家总比当一个蹩脚的策略家更好一点
吧。本书的目的就是帮助你改善在开发和运用行之有效的策略方面的技
巧。
工作,即便只是社交生活,也可以看做是一个永无止息的决策过
程。从事什么样的工作,怎样打理一宗生意,该和谁结婚,怎样将孩子
抚养成人,要不要竞选总统,等等,这些都只不过是重大决策的几个例
子。上述情况存在一个共同的条件,即你不是在一个毫无干扰的真空世
界里做决定。相反,你的身边全是和你一样主动的决策制定者,他们的
选择与你的选择相互作用。这种互动关系将对你的思维和行动产生重要
的影响。
为了解释这一点,我们不妨设想一个伐木工人的决策和一个将军的
决策会有什么区别。当伐木工人考虑怎样砍伐树木的时候,他不必担心
木头可能跳起来进行反击。他的工作环境是中立的,没有对抗。不过,当一名将军打算消灭敌方军队的时候,他的每一步计划都会引来抵抗,他必须设法克服这种抵抗。和这位将军一样,你必须意识到,你的商业
对手、未来伴侣乃至你的孩子都是聪明而有主见的人。虽然他们的目标
常常与你的目标发生冲突,但他们当中同样包含你潜在的同盟者。在你
做决定的时候,必须将冲突考虑在内,同时注意发挥合作的效力。类似
的互动决定就具有策略性,与之相适应的行动计划称为一个策略。本书
将帮助你策略地思考,然后将这些想法付诸实践。
在社会科学当中,研究策略性决策制定过程的分支称为博弈论,原
意为游戏理论。这一理论涉及的“游戏”范围很广,从象棋到孩子抚养,从网球到企业兼并,从广告到军备控制,几乎无所不包。正如匈牙利幽
默大师乔治·米克斯(George Mikes)描述的那样,“许多欧洲人认为生活是一场游戏;英国人认为板球才是一场游戏”。我们则认为双方说得都不
错。
玩这些游戏需要用到许多不同类型的技巧。其中一种是基本技巧,比如打篮球不能缺少的投篮能力,在法律界工作不能缺少的判例知识,乃至打扑克不能缺少的一副不动声色的面孔。策略思维则是另外一种技
巧。策略思维从你的基本技巧开始,考虑的是怎样将这些基本技巧最大
限度地加以发挥。比如,你了解法律,就要确定为自己的委托人辩护的
策略;你了解你的橄榄球队传球或带球突破的本事有多大,而对手防御
的能力又有多好,那么,你作为一个教练,就要决定本队到底是应该传
球还是带球突破。有些时候,比如几个超级大国处心积虑构想一个大胆
的计划,其中包含触发一场核战争的危险,那么,策略思维还意味着懂
得适可而止。
我们的目标在于提高你的策略IQ。不过,我们并不打算提供一本策
略大全。我们建立了策略思维的概念和原理,假如你想将它们运用于自
己面临的某一个具体情况,并且想找出正确的选择,那么你还得再做一
些工作。这是因为,在一些关键方面,各种情况的具体条件都不尽相
同,我们即便开出用于指导行动的通用处方,到头来很可能只是误导了
你,弄巧成拙。无论遇到什么情况,你都要将我们讨论过的好的策略的
原理以及其他方面结合起来,一并进行考虑。你必须综合考虑这些因
素,而且,假如这些因素相互冲突,还要权衡各种不同因素的分量。我
们并不能承诺我们可以解决你遇到的一切问题。实际上,博弈论这门科
学远未达到完美佳境,而策略思维在某些方面看来仍然属于一门艺术。
我们倒是可以提供一些指导,帮助你将想法变成行动。第1章举了
几个例子,解释了在一系列不同的决定下策略问题是怎样出现的。我们
指出了一些行之有效的策略以及一些不那么行之有效的策略,甚至提到
了一些完全错误的策略。接下来的章节则把这些例子变成一个思考体系
或一个思考框架。而在最后几章,我们阐述了几个涉及范围更加广泛的
策略的情况,比如边缘政策、投票选举、激励机制以及讨价还价,你将
看到有关原理是怎样发挥作用的。
本书运用的例子既有人们熟悉的、琐碎的或有趣的类型——通常取
材于文学作品、体育比赛或者电影,也有令人畏惧的类型,比如核对
峙。前者只是一个用来阐述博弈论概念的赏心悦目的工具;至于后者,有些读者一度可能觉得核战争这个话题实在太吓人,不会有理性分析的
空间。不过,随着冷战的阴云渐渐消散,大家都相信世界会进入一种更加安定的局面。我们希望,在排除军备竞赛以及古巴导弹危机中的情绪
化内容干扰之后,我们可以重新检讨其中的博弈层面包含的策略逻辑。
这些章节以实例作为重要内容,不过,这些例子主要用于建立或描
述正在讨论的某个特定原理,至于具体用到的这个例子,其在现实当中
的许多细节都会忽略不计。在每章结尾,我们都提供了一个“案例分
析”,这就跟你在商学院上课时可能遇到的情形差不多。每个案例都具
备一系列特定条件,由你负责运用该章讨论的原理,确定这一情况下应
该采取的正确策略。有些案例没有标准答案,不过,这也正是人生的一
大特点。许多时候,并不存在完全正确的解决方案,只能用并不完美的
方法去处理遇到的问题。在研究我们的讨论之前,请仔细思考每一个案
例,这将比简单地读无数遍课文更有助于理解其中的观点和思路。为了
给大家提供更多的练习机会,我们在最后一章收录了23个案例,大致按
照越往后就越难的顺序排列。
读完本书,我们希望你能成为一位更精明的经理人、谈判者、运动
员、政治家或更高明的父母。我们提醒你,一些有助于达成上述目标的
好策略,不一定会为你赢得被你击败的对手的敬意。假如你想公平竞
争,那就告诉他们,你有这么一本书。第1部分
第1章 10个策略故事
我们从10个来自生活不同方面的策略故事开始,提供一些怎样才能
发挥最佳水准的初步概念。许多读者一定在日常生活中遇到过类似情
况,而且,通过一些思考或尝试,犯过一些错误后,也找出了正确的解
决方法。对于其他读者,这里的一些答案可能出人意料,不过,让读者
感到惊讶不是我们提出这些例子的根本目的。我们的目的是要指出,类
似这样的情形普遍存在,而且形成一系列相互关联的问题,系统地思考
这些问题可能会让你收到事半功倍的效果。请把这些故事当做主菜之前
的开胃菜,它们的作用是增进你的食欲,而不是马上把你撑饱。
1.妙手传说
运动员究竟有没有一朝命中、百发百中的“妙手”这一说?有时候,乍看上去,篮球明星拉里·伯德(Larry Bird)、冰球明星韦恩·格雷茨基
(Wayne Gretzky)或是足球明星迭戈·马拉多纳(Diego Maradona)真的是百
发百中,永不落空。体育比赛解说员们看到这种长期存在、永不落空的
成功事迹,就会宣称这名运动员具有出神入化的妙手。不过,按照心理
学教授托马斯·吉洛维奇(Thomas Gilovich)、罗伯特·瓦隆(Robert Vallone)
和阿莫斯·特维斯基(Amos Tversky)的说法,这其实是对真实情况的一种
误解。[1] 他们指出,假如你抛硬币抛上足够长的时间,你也会遇到
在很长一段时间里全是抛出同一面的情况。这几位心理学家怀疑体育解
说员们其实是找不到更有意思的话题,只好从一个漫长的赛季中寻找某
种模式,而这些模式跟长时间抛硬币得出的结果其实没有什么两样。因
此,他们提出了一个更加严格的测试。比如,在篮球比赛中,他们只看
一个运动员投篮命中的数据,据此考察这名运动员下一次出手仍然命中
的概率究竟有多大。他们也用同样的方法研究这名运动员在这次出手没
有命中却在下一次出手命中的情形。比较命中一次之后再次出手仍然命
中的概率与这次没有命中而再次出手命中的概率,假如前者高于后者,那就表明妙手一说不无道理。
他们选择美国NBA费城76人队(Philadelphia 76ers)进行测试,结果与
妙手一说发生矛盾:一名运动员投篮命中之后,下一次出手就不大可能
命中了;假如他在上一次出手没有命中,再出手时反倒更可能命中。就
连拥有“得分机器”称号的安德鲁·托尼(Andrew Toney)也不例外。这是否意味着,我们谈论的其实是“射频观测器之手”,因为运动员的水准有起
有伏,就跟射频观测器的灯光忽明忽暗一样?
博弈论提出了一个不同的解释。尽管统计数据否定了一朝命中、百
发百中之说,却没有驳倒一个“鸿运当头”的运动员很可能在比赛当中通
过其他方式热身,渐入佳境。“得分机器”之所以会不同于“妙手”,原因
在于攻方和守方的策略会相互影响。比如,假设安德鲁·托尼真有那么
一只妙手,对手们一定会对他实施围追堵截,从而降低他的投篮命中
率。
事实还不仅如此。当防守一方集中力量对付托尼的时候,他的某个
队友就无人看管,更有机会投篮得分。换句话说,托尼的妙手大大改善
了76人队的团队表现,尽管托尼自己的个人表现可能有所下降。因此,我们也许应该通过考察团队合作连续得分的数据来测试妙手一说。
许多其他团队项目也有类似情况。比如在一支橄榄球队里,一个出
色的助攻后卫将大大改善全队的传球质量,而一个拥有优异的接球才能
的运动员则有助于提高全队的攻击力,因为对方被迫将大部分防守资源
用于看管这些明星。在1986年的世界杯足球决赛上,阿根廷队的超级明
星迭戈·马拉多纳自己一个球也没有进,不过,全靠他从一群联邦德国
后卫当中把球传出来,阿根廷队两次射门得分。明星的价值不能单凭他
的得分表现来衡量;他对其他队友的贡献更为至关重要,而助攻数据有
助于衡量这种贡献的大小。冰球项目排列个人表现名次的时候,助攻次
数和射门得分次数占有同等分量。
一个运动员甚至可能通过一只妙手带动另一只手热身,进而变成妙
手,帮助他自己提高个人表现水准。比如波士顿凯尔特人队的明星拉里
·伯德,他喜欢用右手投篮,虽然他的左手投篮技术同样远在大多数人
之上。防守一方知道伯德通常用右手投篮,自然会不惜集中一切兵力防
他的右手。不过,他们的这一计划不能完全奏效,因为伯德的左手投篮
技术亦实在了得,他们不敢大意,非得同样派人看守不可。
假如伯德在两个赛季之间苦练左手投篮技术,又会怎样呢?防守一
方的反应就是增派兵力阻止他用左手投篮,结果却让他更容易用右手投
篮得分。左手投篮得分提高了,右手投篮得分也会提高。在这个案例当
中,左手不仅知道右手在做什么,而且帮了大忙。
再进一步,我们会在第7章说明左手越厉害,用到的机会反而可能越少。许多读者大约在打网球的时候已经遇到过类似的情况。假如你的
反手不如正手,你的对手渐渐就会看出这一点,进而专攻你的反手。最
后,多亏了这样频繁的反手练习,你的反手技术大有改善。等到你的正
反手技术几乎不分上下,你的对手再也不能靠攻击你的弱势反手占便宜
时,他们攻击你的正手和反手的机会渐渐持平,而这可能就是你通过改
善自己的反手技术得到的真正好处。
2.领先还是不领先
1983年美洲杯帆船赛决赛前4轮结束之后,丹尼斯·康纳(Dennis
Conner)的“自由号”在这项共有7轮比赛的重要赛事当中暂时以3胜1负的
成绩排在首位。那天早上,第五轮比赛即将开始,“整箱整箱的香槟送
到‘自由号’的甲板。而在他们的观礼船上,船员们的妻子全都穿着美国
国旗红、白、蓝三色的背心和短裤,迫不及待要在她们的丈夫夺取美国
人失落132年之久的奖杯之后参加合影。”[2] 可惜事与愿违。
比赛一开始,由于“澳大利亚二号”抢在发令枪响之前起步,不得不
退回到起点线后再次起步,这使“自由号”获得了37秒的优势。澳大利亚
队的船长约翰·伯特兰(John Bertrand)打算转到赛道左边,满心希望风向
发生变化,可以帮助他们赶上去。丹尼斯·康纳则决定将“自由号”留在
赛道右边。这一回,伯特兰大胆押宝押对了,因为风向果然按照澳大利
亚人的心愿偏转了5 ,“澳大利亚二号”以1分47秒的巨大优势赢得这轮
比赛。人们纷纷批评康纳,说他策略失败,没能跟随澳大利亚队调整航
向。再赛两轮之后,“澳大利亚二号”赢得了决赛桂冠。
帆船比赛给我们提供了一个很好的机会,观察“跟随领头羊”策略的
一个很有意思的反例。成绩领先的帆船,通常都会照搬尾随船只的策
略。一旦遇到尾随的船只改变航向,那么成绩领先的船只也会照做不
误。实际上,即便成绩尾随的船只采用一种显然非常低劣的策略时,成
绩领先的船只也会照样模仿。为什么?因为帆船比赛与在舞厅里跳舞不
同,在这里,成绩接近是没有用的,只有最后胜出才有意义。假如你成
绩领先了,那么,维持领先地位的最可靠的办法就是看见别人怎么做,你就跟着怎么做。
注5
股市分析员和经济预测员也会受这种模仿策略的感染。业绩领先的
预测员总是想方设法随大流,制造出一个跟其他人差不多的预测结果。
这么一来,大家就不容易改变对这些预测员的能力的看法。另一方面,初出茅庐者则会采取一种冒险的策略:他们喜欢预言市场会出现繁荣或崩溃。通常他们都会说错,以后再也没人听信他们,不过,偶尔也会有
人做出正确的预测,一夜成名,跻身名家行列。
产业和技术竞争提供了进一步的证据。在个人电脑市场,IBM的创
新能力远不如将标准化的技术批量生产、推向大众市场的本事那么闻
名。新概念更多是来自苹果电脑、太阳电脑和其他新近创立的公司。冒
险性的创新是这些公司脱颖而出夺取市场份额的最佳策略,大约也是唯
一途径。这一点不仅在高科技产品领域成立。宝洁作为尿布行业的
IBM,也会模仿金佰利(Kimberly Clark)发明的可再贴尿布粘合带,以再
度夺回市场统治地位。
跟在别人后面第二个出手有两种办法。一是一旦看出别人的策略,你立即模仿,好比帆船比赛的情形;二是再等一等,直到这个策略被证
明成功或者失败之后再说,好比电脑产业的情形。而在商界,等得越久
越有利,这是因为,商界与体育比赛不同,这里的竞争通常不会出现赢
者通吃的局面。结果是,市场上的领头羊们,只有当它们对新生企业选
择的航向同样充满信心时,才会跟随这些企业的步伐 。
3.直奔牢房
有这么一个笑话,说的是在斯大林时期的苏联,有一位乐队指挥坐
火车前往下一个演出地点,正在车上翻看当晚将要指挥演奏的作品的乐
谱。两名克格勃军官看见他在读着什么,错把乐谱当成某种密码,立即
将他作为间谍逮捕了。他争辩说那只是柴可夫斯基的小提琴协奏曲,却
无济于事。在他被投入牢房的第二天,审问者自鸣得意地走进来,说:“我看你最好还是老实招了吧。我们已经抓住你的朋友柴可夫斯基
了,他这会儿正向我们招供呢。”
这个笑话成了介绍囚徒困境的开场白,而囚徒困境可能是最广为人
知的博弈。现在我们就来看看它如何导出符合逻辑的结果:假设克格勃
真的逮捕了某人,而此人的唯一罪名就是取了“柴可夫斯基”这么一个名
字,而且克格勃将乐队指挥和他分开进行审问。如果这两名无辜者否认
克格勃指控的罪名,那么,他们将分别被判处3年徒刑。
注6 如果乐队指
挥昧着良心承认罪名,其中还牵涉到那位素不相识的所谓“同谋”,柴可
夫斯基却仍然否认罪名,那么,乐队指挥可以在1年之后获得自由(以及
克格勃的赞赏之情),而柴可夫斯基则会因拒不认罪而遭到严厉惩罚,被判处25年徒刑。当然了,假如乐队指挥与柴可夫斯基调换一下,乐队
指挥拒不认罪,柴可夫斯基不但屈从认罪,还把他供了出来,那么,两人的下场也会发生相应的变化。假如两人同时认罪,那么,他们都将被
判处这一罪名的标准刑罚——10年徒刑。
注7
现在设想乐队指挥的思路。他知道柴可夫斯基要么招供,要么拒不
认罪。假如柴可夫斯基招供,乐队指挥若是拒不认罪或招供,与之对
应,他会被判处25年或10年徒刑,相比之下,对他来说招供的下场显然
略胜一筹。假如柴可夫斯基拒不认罪,乐队指挥若是同样拒不认罪或招
供,与之对应,他会被判处3年或1年徒刑,相比之下,对他来说招供的
下场仍然略胜一筹。由此可见,招供显然是乐队指挥的最佳做法。
而在捷尔任斯基广场(Dzerzhinsky Square)另一个单人牢房里,柴可
夫斯基也在做同样的盘算,得出同样的结论。当然了,结果是两个人同
时招供。之后,当他们在古拉格群岛(Gulag Archipelago)流放地见面,说出各自的经历后,比较一番,就会发现,他们其实吃亏了。因为,假
如他们两人都拒不认罪,他们两人的刑期都会大大缩短,早日重获自
由。
假如他们在接受审问之前有机会见面好好谈清楚,那该有多好,他
们一定会同意拒不认罪。不过,接下来他们很快就会意识到,无论如
何,那样一个协定也不见得管用。一旦他们被分开,审问开始,每个人
内心深处那种企图通过出卖别人而换取一个更好判决的想法就会变得非
常强烈。这么一来,他们还是逃脱不了最终在古拉格相遇的命运,大概
还会在那里好好算一账,看看谁欠谁更多。这两个人究竟有没有可能取
得足够的相互信任,从而达成双方都希望看到的结果呢?
许多人,许多企业,乃至许多国家,都曾经吃过囚徒困境之苦。看
看生死攸关的核军备控制问题吧。每个超级大国最希望看到的结果都是
另一个超级大国销毁核武器,而它自己则继续保留核武器,以防万一。
最糟糕的结果莫过于自己销毁核武器,而别人却依旧全副武装。因此,无论另一方怎么做,自己一方仍然倾向于保留核武器。不过,它们双方
也有可能一致认为,双方同时销毁核武器的结果会比一方销毁而另一方
不销毁的结果更好。现在的问题在于决策之间的相互依赖性:双方一致
希望看到的结果出现在各方都选择各自比较糟糕的策略的时候。假如各
方都有很明确的想法,打算突破有关协定,私底下发展自己的核武器,还有没有可能达成各方一致希望看到的结果呢?在这种情况下,只有其
中一方来一个思维方式的根本改变,才能推动世界回到裁减核军备的轨
道上去。本着为自己的舒适生活、安全乃至生命着想,我们都有必要了解如
何走出囚徒困境。在第4章,我们还会探讨一些类似的方法,看看这些
方法什么时候可能有效,又是怎样发挥作用的。
囚徒困境的故事还体现了一个普遍的现象:大多数经济的、政治的
或社会的博弈游戏都跟类似橄榄球或扑克这样的博弈游戏不同。橄榄球
和扑克是零和博弈:一个人的得就是另一个人的失。但在囚徒困境里,有可能出现共同利益,也有可能出现利益冲突;不招供的结果对两个囚
徒都是有利的,而不是相反。与此相仿,在劳资双方的讨价还价中,虽
然存在利益冲突,一方希望降低工资,而另一方要求提高工资,不过,大家都知道,假如谈判破裂而导致罢工,双方都将遭受更大的损失。任
何一个关于博弈的有用的分析,都应该考虑到怎样处理冲突与利益同时
存在的情形。我们通常将博弈游戏的参加者称为“对立者”,不过,你也
要记住,有时候,策略可能将原本毫不相干的人变成一条绳上相互依存
的两只蚂蚱。
4.我将坚持到底
天主教会要求马丁·路德(Martin Luther)公开悔过,收回他抨击教皇
及其顾问班子的主张。他拒绝公开认错:“我不会收回任何一点主张,因为违背良心做事既不正确,也不安全。”而且他也不打算寻求妥
协:“我将坚持到底,我不能屈服。”[3] 路德拒不让步的态度是以他
自己的立场的神学性为基础的。在确定什么才是正确的问题上,根本没
有妥协的余地。长期来看,他的坚定立场产生了深远的影响;他的抨击
最后引发了新教改革运动,从根本上改变了中世纪的天主教会。
注8
与此相仿,查尔斯·戴高乐(Charles de Gaulle)也借助拒不妥协的力
量,在国际关系竞技场上成为一个强有力的参与者。正如他的传记作者
唐·库克(Don Cook)描述的那样,“(戴高乐)单凭自己的正直、智慧、人
格和使命感就能创造力量”[ 4] 。不过,说到底,他的力量是“拒不妥
协的力量”。第二次世界大战期间,他作为从一个战败且被占领的国家
逃亡出来的自封的领导人,在与罗斯福(Roosevelt)和丘吉尔(Churchill)的
谈判中仍然坚守着自己的立场。20世纪60年代,他作为总统说出
的“不!”迫使欧洲经济共同体多次按照法国的意愿修改决策。
在讨价还价当中,他的拒不妥协态度究竟是怎样赋予他力量的呢?
一旦戴高乐下定决心坚守一个立场,其他各方只有两个选择:要么接
受,要么放弃。比如,他曾经单方面宣布要将英国拒于欧共体之外,一次是1963年,一次是1968年;其他国家不得不从接受戴高乐的否决票和
分裂欧共体两条出路当中做出选择。当然,戴高乐非常谨慎地衡量过自
己的立场,以确保这一立场会被接受。不过,他这么做往往使法国独占
了大部分战利品,很不公平。戴高乐的拒不妥协剥夺了另一方重新考虑
整个局面、提出一个可被接受的相反建议的机会。
在实践中,“坚持到底,拒不妥协”说起来容易做起来难,理由有
二。第一个理由在于,讨价还价通常会将今天谈判桌上的议题以外的事
项牵扯进来。大家知道你一直以来都是贪得无厌的,因此以后不大愿意
跟你进行谈判。又或者,下一次他们可能采取一种更加坚定的态度,力
求挽回他们认为自己将要输掉的东西。在个人层面上,一次不公平的胜
利很可能破坏商业关系,甚至破坏人际关系。实际上,传记作者戴维·
舍恩布伦(David Schoenbrun)这样批评戴高乐的盲目的爱国主义:“在人
际关系当中,不愿给予爱的人不会得到爱;不愿做别人朋友的人到头来
会一个朋友也没有。戴高乐拒绝建立友谊,最后受伤的还是法
国。”[5] 一个短期妥协可能从长期来看会是一个更好的策略。
第二个理由在于达到必要程度的拒不妥协并不容易。路德和戴高乐
通过他们的个性做到了这一点。不过这样做是要付出代价的。一种顽固
死硬的个性可不是你想有就有,想改变就能改变的。尽管有些时候顽固
死硬的个性可能拖垮一个对立者,迫使他做出让步,但同样可能使小损
失变成大灾难。
费迪南德·德雷赛布(Ferdinand de Lesseps)是一个能力中等的工程
师,具有非同寻常的远见和决心。他由于在外人看来几乎不可能的情况
下建成了苏伊士运河而名噪一时。他并不认同不可能的说法,因此完成
了这一伟业。后来,他照搬同样的思路,试图建设巴拿马运河,结果演
变成一场大灾难。
注9 尽管尼罗河的沙子让他备感得心应手,热带瘴气
却打了他一个措手不及。德雷赛布的问题在于他顽固死硬的个性不允许
他承认失败,哪怕战役早已输掉。
我们怎样才能做到有选择的顽固死硬呢?虽然我们没有一个理想的
解决方案,却有几个办法可以帮助达成约定,并且维持下去;这是第6
章将要谈到的内容。
5.给猫拴个铃铛
童话故事里有一个给猫拴铃铛的故事,大意是这样:老鼠们意识到,假如可以在猫脖子上拴一个铃铛,那么,它们的小命就会大有保
障。问题在于,谁会愿意冒赔掉小命的风险给猫拴上铃铛呢?
这个问题同样摆在老鼠和人类面前。占据支配地位的党派或独裁暴
君怎样才能通过规模相对较小的军队长期控制数目很大的一个人群呢?
整架飞机的众多乘客为什么只要出现一个持枪劫机者就会显得无计可
施,束手就擒?在这两个例子里,只要大多数人同时采取行动,就很容
易取得成功。不过,统一行动少不了沟通与合作,偏偏沟通与合作在这
个时候变得非常困难,而压迫者由于深知群众的力量有多大,还会采取
特殊的措施,阻挠他们进行沟通与合作。一旦人们不得不单独行动,希
望聚沙成塔,集腋成裘,问题就出来了:“谁该第一个采取行动?”担当
这个任务的领头人意味着要付出重大代价,甚至可能付出生命。他得到
的回报则会是死后的光荣或受人感激。确实有人在想到责任或荣誉的时
候会感到热血沸腾,挺身而出,但大多数人还是认为这么做的代价超出
了得益。
在苏共第二十次代表大会上,赫鲁晓夫首次谴责斯大林的大清洗运
动。他那充满戏剧性的讲话刚刚结束,听众里就有人大叫起来,质问赫
鲁晓夫自己那个时候又在做什么。赫鲁晓夫的反应是请提问者站起来,报出自己的姓名。听众一片沉默。赫鲁晓夫答道:“当时我也是这么做
的。”
从某种意义上讲,我们以前都见过这样的例子。这只不过是涉及超
过两个人的囚徒困境;你也可以把它称为“人质困境”。现在我们要用这
个困境阐述一个不同的观点,确切地说,就是惩罚经常压倒回报而处于
上风。独裁者可以通过向大众提供物质乃至精神安慰保持局势稳定,不
过,这个做法可能需要付出高昂代价。建立在人质困境之上的压迫和恐
吓可能是一种代价小得多的替代选择。
这一原理有很多例子。在一个大型出租车队里,汽车经常是由调度
员派给司机的。车队里既有好车,也有年久失修的老爷车。调度员可以
利用他的调度权向每个司机收取一点贿赂。谁若是拒绝行贿,就一定会
得到一部老爷车,而那些愿意合作的司机就会“抽到”上上好签。
注10 这
么一来,调度员是发达了,但司机们作为一个群体,面对的还是他们就
算不贿赂调度员也能得到的同样一些汽车。假如司机们联合起来,也许
可以结束这种被迫行贿的日子,问题在于怎样才能组织起来采取行动。
问题的关键不是调度员能从行贿者那里得到多少好处,而是他可以严厉
惩罚那些不肯行贿的人。将租户从实行房租控制的公寓中赶出去是另外一个类似的例子。假
如某人在纽约买了这么一幢房子,他有权赶走一个租户,这样自己就能
住进去。不过,这个规定最后却变成了赶走全部租户的权利。一个新房
东可以对住在1A房间的租户说:“我有权住在自己的房子里。因此,我
打算把你赶走,搬进你的房间。不过,假如你肯合作,自愿离开,我会
给你5 000美元作为报答。”对于一幢实行房租控制的房子的价格而言,这个数目只是九牛一毛(虽然这笔钱确实可以在纽约买一堆地铁票)。租
户面临两个选择,一是拿着5 000美元走人,二是什么也得不到,还是
要走人,当然他选择前者。接下来,房东向1B的租户说同样的话,直到
所有租户都搬家走人。
汽车制造业工人工会在跟汽车制造商一个接一个进行谈判的时候也
占有类似的优势。单是一场针对福特汽车公司的罢工就会使福特处于非
常不利的地位,因为通用汽车公司和克莱斯勒公司继续对工会采取合作
态度,因此,福特很有可能迅速采纳对工会有利的条件,达成和解。这
么一场罢工在工会这边看来代价也是较小的,毕竟只有13的工会成员
失去工作。赢得福特一役之后,工会转而会跟通用谈判,接着是克莱斯
勒,引用前面各次战役的胜利作为先例,进一步壮大自己的声威。日本
工会则另有一套做法,因为日本工会是由公司组织的,在公司里占有很
大的利润份额。假如丰田的工会罢工,其成员的薪水就会随着丰田的利
润下跌而下跌,他们以前的努力什么也得不到。
我们倒不是说上述任何一个或所有例子都是好的结局或理想的政
策。在某些情况下,可能引起强烈的争议,要求避免我们所描述的那种
结果。不过,要想使我们所做的努力奏效,我们必须看清问题产生的机
制,即“手风琴效应”,每一个折叠都会推动或拉动邻近一个折叠。这一
现象虽然一再发生,其实又是可以克服的,我们将在第9章告诉各位怎
样可以做到这一点。
6.楔子的尖端
许多国家运用关税、配额以及其他方法限制进口,保护本土产业。
这样的政策会抬高价格,损害国内所有使用受保护产品的消费者的利
益。经济学家估计,假如美国运用进口配额保护钢铁、纺织或制糖产
业,导致大家不得不购买价格更高的产品,换算过来,相当于每保住这
些产业一个职位,美国国内其他人就要付出10万美元的代价。[6] 为
什么会这样,极少数人的得益怎么总是会压倒更大多数人的损失而得到优先考虑呢?
秘诀在于一次提出一件事情。首先,美国制鞋产业的1万个职位面
临着威胁。要想挽救这些职位,国内其他人就得付出10亿美元,或人均
付出4美元。谁不愿意付出4美元保住1万个职位呢?即便素昧平生的陌
生人也会愿意的吧,尤其是在可以把所谓不择手段的外国人当做现成的
诅咒目标之际。接着就轮到服装产业、钢铁产业、汽车产业,等等。没
等我们明白过来,我们已经点头同意付出500多亿美元,相当于人均付
出200多美元,或每个家庭付出1 000多美元。假如我们事前可以看穿整
个过程,我们大概会想,这个代价是不是太高了,继而坚持要让上述各
个产业的工人自己承担国际贸易带来的风险,就像他们承担任何其他经
济风险一样。就个案逐项进行决策可能导致全部结果都与我们的意愿南
辕北辙。实际上,一项决定即便获得多数人投票赞成,仍然有可能导致
一个在每个人看来都比现状更糟的结果。
1985—1986年间的所得税改革之所以几乎走向崩溃,原因就在于参
议院一开始采取的是对提案逐个解决的思路。在财政委员会第一轮条款
讨论会上,财政部提案已被修改到带有太多特别利益条款而变得不堪重
负,最后不得不宣告无效。参议员们意识到,他们面对有组织的院外集
团的游说活动时简直是“软弱无力”,根本不可能阻止这些游说者谋求特
殊待遇。要命的是,这些游说者若是联合起来,最终很可能毁灭这个法
案,比干脆不推出任何法案更糟糕。于是,委员会主席、参议员帕克伍
德(Packwood)进行了他自己的游说活动:他劝说委员会大多数成员投票
反对任何一个针对所得税法案的修正案,哪怕这个修正案特别有利于他
们的选民也在所不惜。本次改革终于得以立法通过。不过,已经有人发
起了要求增加特殊条款的反击,每次提出一两条要求修正。
按照同样的思路,逐项否决权使总统可以有选择地否决法案。假如
一个法案授权拨款资助学校提供午餐和建造一架新的航天飞机,总统本
可以选择两个都否定、只批准其中一个或两个都批准,但是目前却只有
两个选择,即两个都否定或者两个都批准。虽然第一反应可能是这将赋
予总统更大的权力,控制立法过程,但若是反过来,结果可能是国会将
更有选择性地看待有待它通过的法案。
注11 逐项否决权虽然一般被认为
违反宪法,不过究竟是否如此,还是留给高等法院裁决为好。
之所以出现这些问题,是因为短视的决策者没能看远一点,他们看
不到全局。在所得税改革的例子里,参议院勉强来得及恢复自己的远
见;但在保护主义的老问题上,依旧未能取得突破。第2章将会建立一个体系,有助于改善长期策略远见。
7.三思而后行
人们陷入某种境地而发现从此难以脱身的情况实在是太普遍了。比
如,一旦你在某个城市找到一份工作,那么,换一个地方重新安置下来
的代价就会变得很高;一旦你买了一台电脑,学会了怎样使用其操作系
统,那么,学会另一种操作系统,改写你的全部程序,其代价就会变得
很高。同样,参加了一家航空公司的里程积分计划的旅行者若想搭乘另
一家航空公司的飞机,付出的代价也会更高。还有,当然了,从婚姻围
城中逃脱出来的代价也很高。
问题在于,一旦你做出了类似的承诺,比如接受了工作或结了婚,你的讨价还价地位就会被削弱。公司大可以利用其职员预期的搬家成本
高,向他们支付较低薪水或降低加薪幅度。电脑公司可以给新出的可兼
容的外围设备标出更高的价码,因为它们知道,它们的消费者不会轻易
转向同样是新出的却不兼容的技术。至于航空公司,一旦找到数目庞大
的里程积分计划参加者,就不大愿意参与价格战了。夫妻签订的平均分
担家务的协议一旦遇到小孩出生,就不得不重新谈判一番。
能够预见到上述后果的策略家会赶在他们的讨价还价能力仍然存在
的时候充分利用,换句话说就是在他们订下契约之前。一般情况是采取
预先支付酬劳再签约的形式。潜在的利益谋取者相互竞争会导致同样的
结果。比如,公司不得不提供更具吸引力的起薪;电脑制造商不得不为
它们生产的中央处理器(CPU)标出足够低的价格;而航空公司的里程积
分计划也不得不为登记参加者提供更多的积分奖励以吸引他们。至于结
了婚的夫妇,其对各自利益的谋取可能会变成一场两个人玩的博弈游
戏。
同样的深谋远虑也使许多好奇却又理智的人不至于亲身尝试会上瘾
的毒品,比如海洛因。汤姆·莱勒(Tom Lehrer)写的一首歌这样描述毒品
贩子的策略:
他给孩子赠送免费样品,因为他实在太了解,今天仍然天真无邪的面孔,明天就会变成他的新客户。
聪明的孩子也了解这一点,所以拒绝了那些免费样品。
8.多管齐下
现在让我们回到体育世界。在橄榄球比赛里,每一次贴身争抢之
前,攻方都会在传球或带球突破之中择其一,而守方则会把赌注押在其
中一个选择上,做好准备进行反击。在网球比赛里,发球一方可能选择
接球一方的正手或反手,而接球一方则准备在回击的时候选择打对角线
或直线。在这两个例子里,每一方都对自己的优点和对方的弱点有所了
解。假如他们的选择可以同时考虑到怎样利用对方所有的弱点,而不是
仅仅瞄准其中一个弱点,那么,这个选择应该算是上上之策。球员和球
迷一样都很明白,必须多管齐下,来些出其不意的奇袭。理由在于,假
如你每次都做同样的事情,对方就能集中全部力量最大限度地还击你的
单一策略,还击效果也会更好。
多管齐下并不等于说要按照一个可以预计的模式交替使用你的策
略。若是那样的话,你的对手就会通过观察得出一个模式,从而最大限
度地利用这个模式还击,其效果几乎跟你使用单一策略一样好。实施多
管齐下策略,诀窍在于不可预测性。
设想一下,假如存在一些人人都知道的公式,用来确定谁将受到美
国国税局(IRS)的审计,在你填写报税单的时候,你就会套用这些公式
看看自己会不会受到审计。假如预计到你会受到审计,而你又找到一个
办法“修改”你的报税单,使其不再符合那些公式以避免被审计,很可能
你已经动手这样做了。假如被审计已经无法避免,你大概会选择如实相
告。国税局的审计行动若是具有完全可预见性,结果将会把审计目标确
定在错误的人群身上。所有那些被审计的人早就预见到自己的命运,早
就选择了如实相告,而对于那些逃过审计的人,能够看管他们的就只有
他们自己的良心了。假如国税局的审计公式在一定程度上是模糊而笼统
的,大家都有那么一点面临审计的风险,人们也就会更加倾向于选择诚
实。
商界也有类似的现象。设想一下剃须刀市场的竞争情况。假设吉列
定期举行购物券优惠活动,比如每隔一个月的第一个星期天进行,那么
毕克(Bic)可以通过提前一个星期举行购物券优惠活动的方式予以反击。
当然,这么一来毕克的路数就会变得具有可预见性,吉列可以照搬毕克的策略,相应将自己的优惠活动提前到毕克前面去。这种做法最终导致
刺刀见红的残酷竞争,双方的利润都会下跌。不过,假如双方都采用一
种难以预见或者多管齐下的混合策略,那么很可能会一起降低竞争的惨
烈程度。
随机策略的重要性是博弈论早期提出的一个深谋远虑的观点。这个
观点本身既简单,又直观,不过,要想在实践当中发挥作用,我们还得
做一些细致的设计。比如,对于网球运动员,光是知道应该多管齐下,时而攻击对方的正手,时而攻击对方的反手,这还不够。他还必须知道
他应该将30%的时间还是64%的时间用于攻击对方的正手,以及应该怎
样根据双方的力量对比做出选择。在第7章我们会介绍一些可以解答上
述问题的方法。
9.别跟笨蛋对等打赌
在《红男绿女》(Guys and Dolls)一片中,赌棍斯凯·马斯特森(Sky
Masterson)想起他父亲给他提的这个很有价值的建议:
孩子,在你的旅途中,总有一天会遇到有一个家伙走上前来,在你
面前拿出一副漂亮的新扑克,连塑料包装纸都没有拆掉的那种;这个家
伙打算跟你打一个赌,赌他有办法让梅花J从扑克牌里跳出来,并把苹
果汁溅到你的耳朵里。不过,孩子,千万别跟这个家伙打赌,因为就跟
你确确实实站在那里一样,最后你确确实实会落得苹果汁溅到耳朵里的
下场。
这个故事的背景是,内森·底特律(Nathan Detroit)要跟斯凯·马斯特
森打赌,看看明迪糕饼店的苹果酥和奶酪蛋糕哪一样卖得比较好。正
好,内森刚刚发现了答案(苹果酥!)。他当然愿意打赌,只要斯凯把赌
注压在奶酪蛋糕上。
这个例子听上去也许有些极端。当然没有人会打这么一个愚蠢的
赌。不过,仔细看看芝加哥交易所的期货合同市场吧。假如一个交易者
提出要卖给你一份期货合同,那他只会在你损失的情况下得益。这个交
易是一宗零和博弈,就跟体育比赛一样,一方的胜利意味着另一方的失
败。因此,假如有人愿意卖给你一份期货合同,你绝对不应该买下来。
反过来也是如此。
其中的策略意义在于,其他人的行动向我们提示了他们究竟知道什么,我们应该利用这些信息指导我们自己的行动。当然,我们应该将这
些信息连同我们自己有关这个问题的信息综合起来加以利用,运用全部
策略机制,尽可能从其他人那里获取整个事情的真相。
在前面提到的《红男绿女》的例子里,存在这一类型的一个简单机
制。斯凯应该问一下内森,看他在什么情况下愿意把赌注压在奶酪蛋糕
上。假如回答是“无论什么情况都不会”,那么斯凯就能推断答案一定是
苹果酥。假如内森回答说他下注在苹果酥和奶酪蛋糕上的可能性一样
大,他显然是在隐瞒自己知道的信息,甘愿冒让斯凯在赌博中可能猜中
的风险。
在股票市场、外汇市场和其他金融市场,人们可以像这个例子所描
述的那样自行决定应该把赌注压在哪一边。实际上,在一些有组织的交
易市场,包括伦敦股票市场,只要你询问一只股票的价格,按照规定,证券商必须在他知道你打算买入还是卖出之前同时告诉你买入价和卖出
价。假如缺少这么一个监察机制,证券商就有可能单凭自己掌握的信息
赚上一笔,而由于外面的投资者担心受骗上当,很可能最终导致整个市
场崩溃。买入价和卖出价并不完全一致;两者之间存在一个价差(bid-
ask spread)。在流动资金市场,这个差额非常小,意味着无论哪一份买
入或卖出的订单,其中包含的信息都是微乎其微的。另一方面,内森·
底特律愿意不惜一切代价把赌注压在苹果酥上,坚决不要奶酪蛋糕,他
的价差则是无限大。千万当心这样的证券商。
在这里我们应该补充一点:斯凯没有认真听取他父亲的教诲。一分
钟后他就跟内森打赌说内森不知道他的蝴蝶领结是什么颜色。斯凯无论
如何赢不了:假如内森知道是什么颜色,他一定愿意打赌,并且取胜;
假如他不知道,他一定不愿意打赌,也就不会输。
10.博弈论可能危害你的健康
一天深夜,耶路撒冷举行的一个会议结束之后,两名美国经济学家
找了一辆有牌照的出租车,告诉司机应该怎么去他们的酒店。司机几乎
立即认出他们是美国观光客,因此拒绝打表,并声称自己热爱美国,许
诺会给他们一个低于打表数目的更好的价钱。自然,两人对这样的许诺
颇有点将信将疑。在他们表示愿意按照打表数目付钱的前提下,这个陌
生的司机为什么还要提出这么一个奇怪的少收一点的许诺呢?他们怎么
才能知道自己有没有多付车钱呢?
注12另一方面,此前他们除了答应按照打表数目付钱之外,并没有许诺
再向司机支付其他报酬。假如他们打算跟司机讨价还价,而这场谈判又
破裂了,那么他们就得另找一辆出租汽车。他们的思路是,一旦他们到
达酒店,他们的讨价还价地位将会大大改善。何况,此时此刻再找一辆
出租车实在很不容易。
于是他们坐车出发,顺利到达酒店。司机要求他们支付以色列币2
500谢克尔(相当于2.75美元)。谁知道什么样的价钱才是合理的呢?因为
在以色列,讨价还价非常普遍,所以他们还价2 200谢克尔。司机生气
了。他嚷嚷着说从那边来到酒店,这点钱根本不够用。他不等对方说话
就用自动装置锁死了全部车门,按照原路没命地开车往回走,一路上完
全没把交通灯和行人放在心上。两位经济学家是不是被绑架到贝鲁特去
了?不是。司机开车回到出发点,非常粗暴地把他们扔出车外,一边大
叫:“现在你们自己去看看你们那2 200谢克尔能走多远吧!”
他们又找了一辆出租车。这名司机开始打表,跳到2 200谢克尔的
时候,他们也回到了酒店。
毫无疑问,花这么多时间折腾对于两位经济学家来说还值不到300
谢克尔。另一方面,这个故事却很有价值。它描述了跟那些没有读过我
们这本书的人讨价还价可能存在什么样的危险。更普遍的情况是,我们
不能忽略自尊和失去理性这两种要素。有时候,假如总共只不过要多花
20美分,更明智的选择可能是到达目的地之后乖乖付钱。
注13
这个故事还有第二个教训。设想一下,假如两位经济学家是在下车
之后再来讨论价钱问题,他们的讨价还价地位该有多大的改善。(当然
了,若是租一辆出租车,思路应该与此完全相反。假如你在上车之前告
诉司机你要到哪里去,那么,你很有可能眼巴巴看着出租车弃你而去,另找更好的主顾。记住,你最好先上车,然后告诉司机你要到哪里
去。)
11.未来的模样
前面的例子让我们初步领略了指导策略决策的原理。我们可以借助
这些故事的寓意将这些原理进行归纳。
妙手传说告诉我们,在策略里,就跟在物理学当中一样,“我们所
采取的每一个行动,都会引发一个反行动”。我们并非生活在一个真空世界,也不是在一个真空世界里举止行事。因此,我们不可以假定说,虽然我们改变了自己的行为,其他事情还会保持原样。
戴高乐在谈判桌上获得成功,这表明“只有卡住的轮子才能得到润
滑油”
注14 。不过,坚持顽固强硬并非总是轻而易举,尤其在你遇到一
个同样顽固强硬的对手而不得不表现得比对方更加顽固强硬的时候更难
做到。
古拉格的笑话以及给猫拴铃铛的故事刻画了需要协调和个人牺牲才
能有所收获的事情做起来可能具有的难度。贸易政策的故事则强调了逐
个解决问题的危险性。在技术竞赛当中,就跟在帆船比赛中差不多,追
踪而来的新公司总是倾向于采用更加具有创新性的策略,而龙头老大们
则愿意模仿跟在自己后面的公司。
网球和税务审计的故事指出,策略的优势在于不可预测性。不可预
测的行为可能还有一个好处,就是使人生变得更加有趣了。
我们当然可以再讲几个故事,借助这些故事再讲一些道理,不过,这不是系统思考策略博弈的最佳方法。从一个不同角度研究同一个主题
会更见效。我们每次讲一个原理,比如承诺、合作和多管齐下。在每一
个章节,我们还会介绍一些以这个主题为核心的故事,直到说清整个原
理为止。然后,读者可以在每章后面所附“案例分析”中运用这个原理。
12.案例分析之一:红色算我赢,黑色算你输
虽然我们两位作者也许永远没有机会担当美洲杯帆船赛的船长,但
其中一位却遇到了一个非常接近的情形。巴里毕业的时候,为了庆祝一
番,参加了剑桥大学的五月舞会(这是英国版本的大学正式舞会)。庆祝
活动的一部分包括在一个赌场下注。每人都得到相当于20美元的筹码,截至舞会结束之时,收获最大的一位将免费获得下一年度舞会的入场
券。到了准备最后一轮轮盘赌的时候,纯粹是出于一个令人愉快的巧
合,巴里手里已经有了相当于700美元的筹码,独占鳌头,第二位是一
名拥有300美元筹码的英国女子。其他参加者实际上已经被淘汰出局。
就在最后一次下注之前,那个女子提出分享下一年舞会的入场券,但是
巴里拒绝了。他占有那么大的优势,怎么可能满足于得到一半的奖赏
呢?
为了帮助大家更好地理解接下去的策略行动,我们先来简单介绍一下轮盘赌的规则。轮盘赌的输赢取决于轮盘停止转动时小球落在什么地
方。典型情况是,轮盘上刻有从0到36的37个格子。假如小球落在0处,就算庄家赢了。玩轮盘赌最可靠的玩法就是赌小球落在偶数还是奇数格
子(分别用黑色和红色表示)。这种玩法的赔率是一赔一,比如一美元赌
注变成两美元,不过取胜的机会只有1837。在这种情况下,即便那名
英国女子把全部筹码押上,也不可能稳操胜券;因此,她被迫选择一种
风险更大的玩法。她把全部筹码押在小球落在3的倍数上。这种玩法的
赔率是二赔一(假如她赢了,她的300美元就会变成900美元),但取胜的
机会只有1237。现在,那名女子把她的筹码摆上桌面,表示她已经下
注,不能反悔。那么,巴里应该怎么办?
案例讨论
巴里应该模仿那名女子的做法,同样把300美元筹码押在小球落在3
的倍数上。这么做可以确保他领先对方400美元,最终赢得那张入场
券:假如他们都输了这一轮,巴里将以400∶0取胜;假如他们都赢了,巴里将以1 300∶900取胜。那名女子根本没有其他选择。即使她不赌这
一轮,她还是会输,因为巴里会和她一样退出这一轮,照样取胜。
注15
她的唯一希望在于巴里先赌。假如巴里先在黑色下注200美元,她
应该怎么做?她应该把她的300美元押在红色。把她的筹码押在黑色对
她没有半点好处,因为只有巴里取胜,她才能取胜(而她将是亚军,只
有600美元,排在巴里的900美元后面)。自己取胜而巴里失败就是她唯
一的反败为胜的希望所在,这就意味着她应该在红色下注。
这个故事的策略寓意与马丁·路德和戴高乐的故事恰恰相反。在这
个关于轮盘赌的故事里,先行者处于不利地位。由于那名女子先下注,巴里可以选择一个确保胜利的策略。假如巴里先下注,那名女子就可以
选择一个具有同样取胜机会的赌注。这里需要说明的是,在博弈游戏
里,抢占先机、率先出手并不总是好事。因为这么做会暴露你的行动,其他参与者可以利用这一点占你的便宜。第二个出手可能使你处于更有
利的策略地位。
第2章 准备接招
1.轮到你了,查理·布朗
连环漫画《花生》里有一个反复出现的主题,说的是露西(Lucy)将一个橄榄球按住,竖在地上,招呼查理·布朗(Charlie Brown)过去踢那个
球。不过,每次到了最后一刻,露西总要拿走橄榄球,查理·布朗因为
一脚踢空,仰天跌一跤,心怀不轨的露西就会高兴得不得了(如图2—1
所示)。
任何人都会劝告查理·布朗不要上露西的当。即便露西去年(以及前
年和再前一年)没有在他身上玩过这个花招,他也应该从其他事情了解
她的性格,完全有可能预见她会采取什么行动。
就在查理盘算要不要接受露西的邀请跑去踢球的时候,她的行动还
没有发生。不过,单凭她的行动还没有发生这一点,并不意味着查理就
应该把这个行动看做是不确定性的。他应该知道,在两种可能的结果
——让他踢中那个球以及让他仰天跌一跤——当中,露西倾向于后者。
因此,他应该预见到,一旦时机到了,她就会拿走橄榄球。从逻辑推理
得出的露西会让他踢中那个球的可能性实际上已经毫无影响。对这么一
种可能性仍然抱有信心,套用约翰逊(Johnson)博士描述的再婚的特征,是希望压倒经验的胜利。查理不应该那样想,而应预见到接受露西的邀
请最终会让自己仰天跌一跤。他应该拒绝露西的邀请。图2—1
2.两种策略互动
策略博弈的精髓在于参与者的决策相互依存。这种相互影响或互动
通过两种方式体现出来。第一种方式是相继发生,比如查理·布朗的故
事。参与者轮流出招。每个参与者在轮到自己的时候,必须展望一下他
的这一步行动将会给其他人以后的行动造成什么影响,反过来又会对自
己以后的行动造成什么影响。
第二种互动方式是同时发生,比如第1章囚徒困境故事的情节。参
与者同时出招,完全不理会其他人刚刚走了哪一步。不过,每个人必须
心中有数,知道这个博弈游戏存在其他参与者,而这些人反过来也非常
清楚这一点,如此类推。因此,每个人必须设想一下若是自己处在其他
人的位置,会做出什么反应,从而预计自己这一步会带来什么结果。他
选择的最佳策略也是这一全盘考虑的一个组成部分。
一旦你发现自己正在玩一个策略博弈,你必须确定其中的互动究竟
是相继发生的还是同时发生的。有些博弈,比如橄榄球,同时具备上述
两种互动元素。这时候你必须确保自己的策略符合整个环境的要求。在
这一章,我们将粗略介绍一些有助于你玩相继发生的互动的博弈的概念
和规则;而同时发生的互动的博弈将是第3章的主题。我们从非常简
单、有时候是设计出来的例子开始,比如查理·布朗的故事。我们有意
这么做,毕竟,这些故事本身并不十分重要,而正确的策略通常也是通
过简单的直觉就能发现的,这么一来,可以更加清晰地凸显其中蕴涵的
概念。我们用到的例子会在案例分析以及以后的章节里变得越来越接近
现实生活,也越来越复杂。
3.策略的第一法则
相继出招的博弈有一个总的原则,就是每一个参与者必须预计其他
参与者接下来会有什么反应,据此盘算自己的最佳招数。这一点非常重
要,值得确立为策略行为的一个基本法则。
法则1:向前展望,倒后推理。
展望你的最初决策最后可能导致什么结果,利用这个信息确定自己的最佳选择。
在查理·布朗的故事里,做到这点对所有人来说应该都是不费吹灰
之力的,只有查理·布朗除外。他只有两个选择,其中一个导致露西在
两个可能的招数之间选择了一个。大多数策略情况都会涉及一系列更长
的决策结果,每个结果都有几种选择,单是口头上进行推理实在是无法
表述清楚。要想成功地运用这个向前展望、倒后推理的法则,我们需要
一个更好的视觉辅助工具。一个涵盖了博弈当中全部选择的“树状图”就
是这么一个工具。现在我们就来演示一下怎么使用这些树。
4.决策树与博弈树
一系列需要向前展望、倒后推理的决策,甚至有可能出现在一个孤
立的决策者面前,而这个人并非置身于一个有其他人参加的策略博弈
中。对于走在黄树林里的罗伯特·弗罗斯特(Robert Frost):
两条路在树林里分岔,而我
我选择人迹罕至的那一条,从此一切变了样。[1]
我们可以画出这样一幅示意图(如图2—2所示)。
图2—2
到此未必就不用再选择了。每一条路后面可能还会有分岔,图2—2
相应也会变得越来越复杂。以下就是我们亲身经历的一个例子。从普林斯顿到纽约旅行会遇到几次选择。第一个决策点是选择旅行
的方式:乘公共汽车、乘火车还是自己开车。选择自己开车的人接下来
就要选择走费拉扎诺·奈罗斯桥、荷兰隧道、林肯隧道还是乔治·华盛顿
桥。选择搭乘火车者必须决定是在纽瓦克(Newark)换乘PATH列车还是
直达纽约宾夕法尼亚车站。等到进入纽约,搭乘火车或公共汽车的人还
必须决定怎样抵达自己的最后目的地,是步行、乘地铁(是本地地铁还
是高速地铁)、乘公共汽车还是乘出租车。最佳决策取决于多种因素,包括价格、速度、难以避免的交通堵塞、纽约城里的最终目的地所在以
及对泽西收费公路上的空气污染的厌恶程度,等等。
图2—3描述了你在每一个岔道口面临的选择,看上去就像一棵枝叶
繁茂的大树,所以称为“决策树”。如何正确使用这样一张图或这么一棵
树呢?绝对不是选择第一个岔道口看上去最好的分枝,然后等到下一个
岔道口出现再去思考接下来应该怎么办;相反,你应该预计到以后将面
临的选择,利用这些信息倒过头来确定前面几个岔道口你应该怎么决
断。举个例子,假设你要去华尔街,乘PATH火车就好于开车,因为这
条铁路从纽瓦克直达华尔街。图2—3
我们可以通过一棵这样的树描述一个策略博弈当中的选择,不过,现在出现了一个新的元素。我们遇到一个有两个人或更多人参与的博
弈。沿着这棵树出发,后面许多分枝可能是几个参与者轮流决策。每个
参与者在前一个分枝做决策时必须向前展望,而且考察的范围不应仅局
限于他自己的决策,还要包括其他参与者的决策。他必须对其他人的下
一步决策进行预计,办法就是置身于其他参与者的地位,按照他们的思
维方式进行思考。为了强调一下这个做法与前面一个做法的区别,我们
把一棵反映一场策略博弈当中的决策次序的树称为“博弈树”,而把“决
策树”留做描述只有一个人参加的情形。
虽然查理·布朗的故事简单得简直令人难以置信,不过,你还是可
以通过将这个故事放进一棵博弈树,开始熟悉博弈树的概念。这个博弈
从露西发出邀请开始,查理·布朗面临的选择是要不要接受邀请。假如
查理拒绝邀请,那么这个博弈到此为止。假如他接受,露西就有两个选
择,一是让查理踢中那个橄榄球,二是把球拿走。我们可以通过添加一
个分枝的方法描绘这个故事。
正如我们在前面说过的那样,露西有两个选择,即图2—4中的上下
两个分枝,查理应该预计到她一定会选择上面那个分枝。因此,他应该
置身于她的地位,从这棵树上剪掉下面那个分枝。现在,回到他自己的
两个选择,也是上下两个分枝,假如他选择上面那个分枝,结果一定是
仰天跌一大跤。因此,相比之下,他更好的选择是沿着下面的分枝前
进。
图2—4为了进一步了解这个思路,我们不妨设想一个包含同样一棵博弈树
的商界中的例子。我们不想惹恼任何一个真实存在的公司,在此先向格
雷厄姆·格林(Graham Greene)道歉,我们借用的是他的例子:假设在卡
斯特罗执政之前的古巴,吸尘器市场由一家名为“快洁”的公司独占,一
家名为“新洁”的新公司正在考虑要不要进军这个市场。假如“新洁”决定
进入,“快洁”将面临两个选择:一是接纳“新洁”,和平共处,满足于一
个与以前相比降低了的市场份额,二是打一场价格战。
注16 假设“快
洁”接纳“新洁”,后者就可以赚得10万美元利润,但是,假如“快洁”发
动一场价格战,就将给“新洁”造成20万美元的损失。假如“新洁”决定留
在市场外而不进入,那么它的利润当然为零。下面我们画出这棵博弈树
(如图2—5所示),标明每一种结果会带来什么样的利润。
图2—5
“新洁”应该怎么办?这是决策分析员需要解决的问题,也是商学院
里讲授的问题。他们会画出一幅非常相似的图,却称之为“决策树”。理
由是,他们通常把“接纳”和“打价格战”两种选择方案的结果看做偶然现
象。因此他们会标出两者的出现概率。比如,假如他们认为接纳与打价
格战出现的机会一样大,那么两者的概率同为12。接着,他们可以计
算出“新洁”进入市场会得到多少利润,方法是将盈利和损失分别乘以相
应的概率再相加。他们得到
·×100 000-?×200 000=-50 000
由于这是一个亏损数字,商业分析员们就会根据这些概率下结论
说“新洁”不应该进军古巴市场。
以上的估计数字是从哪里来的呢?博弈论提供了答案:它们来
自“新洁”自己对“快洁”在各种情形下的利润情况的估计。要估计“快
洁”会怎么做,“新洁”首先应该估计“快洁”在不同情形下会得到多少利润。然后通过向前展望、倒后推理,预计对方会怎么做。进一步分析这
个例子:我们假设“快洁”作为一个垄断者,有能力赚取30万美元利润。
与“新洁”分享市场则意味着自己的利润降为10万美元。另外,从“快
洁”这边估计,发动一场价格战的代价是10万美元。现在我们可以在这
棵树上添加这些结果(如图2—6所示)。
图2—6
我们利用这棵树包含的信息预计以后的全部招数。由于具体招数可
以由这个博弈的结果确定,这棵树完全适合看做一棵博弈树,而不是一
棵决策树。比如,要预计“快洁”对“新洁”进入的反应,我们知道,“快
洁”接纳“新洁”的话仍会有10万美元利润,发动价格战则会损失10万美
元;“新洁”应该预计到“快洁”会选择前者。向这个方向展望,同时倒后
推理,“新洁”应该在盘算的时候先把打价格战这个分枝去掉。它应该进
入这个市场,因为预计它可以赚到10万美元。
若是换了其他环境,最后的决策可能发生变化。比如,假设“新
洁”下一步有可能继续进军“快洁”早已建立市场的其他岛屿,“快洁”大
约会觉得有必要在这个新来者面前摆出一副不好对付的样子,宁可在古
巴损失10万美元也要发动一场价格战。“新洁”应该看到,这意味着自己
注定会损失20万美元,最后决定还是留在外面,不要硬闯的好。
“新洁”可以看出任何一个得失数字都会转化为相应的行动。不过,它自己可能并不知道“快洁”在这棵树的顶端会得到什么样的回报。这种
利润的不确定性将会转化为行动的不确定性。比如,“新洁”可能认为,有33.3%的机会“快洁”会在一场价格战中损失10万美元,有33.3%的机会
双方会打个平手(利润为零),最后还有33.3%的机会“快洁”即便打价格战
也能赚到12万美元。若遇到这种情况,“向前展望,倒后推理”会认为,有23的概率“快洁”会选择接纳“新洁”——赚到10万美元总比损失10万美元或双方打个平手要好,只比不上赚到12万美元。因此,发动一场价格
战的可能性是33.3%。要弄清究竟会发生什么情况,唯一途径就是进军
市场。不过,基于上述可能性,“新洁”有23的概率赚到10万美元,13
的概率损失20万美元,因此,它的预计利润实际为零,根本没有理由进
军市场。
在这个例子里,“新洁”对于“快洁”的得失的不确定性直接转化为
对“快洁”会有什么反应的概率估计。不过,我们必须注意应该在哪里加
入这种不确定性。正确的地方是在树的末端。现在就来看看,假如我们
在考虑的时候企图跳到前面去会犯什么错:平均而言,“快洁”可以在一
场价格战当中赚到6 667(即13×120 000+13×0-13×100 000)。但
这并不意味着“快洁”就一定想打价格战。愿意打价格战的可能性不是
100%。而且这种不确定性并不表示我们就应该猜测“快洁”愿意打价格
战的可能性是50%。对“新洁”而言,分析这个问题的正确思路是从这个
博弈的终点着手,预计“快洁”每一步会怎么做。5.更加复杂的树
在现实生活里,你会遇到的博弈远比上述我们用来进行形象描述的
例子复杂。不过,即便这些“小树苗”长成“大树”,同样的原理也依然管
用。象棋(国际象棋)可能是最好的例子。虽然象棋的规则相对比较简
单,却已经形成一种需要进行策略推理的博弈游戏。白棋先行,黑棋回
应,双方依次相继移动。因此,象棋当中最“纯粹”的策略推理就包含着
向前展望你自己这一步将会导致什么后果,就跟我们在前面看到的一
样。其实例可能是这样:“假如我现在走兵,我的对手就会进马,威胁
我的车。我在走兵之前必须用我的象护住那四个格子,不让对手的马得
逞。”
象棋是一种相继出招的博弈游戏,我们可以用一棵树来表示。白方
可以从20种开局方式中任选一种。[2] 在图2—7中,我们用这棵树的
第一个决策点(或节点)表示白方拥有的第一个先行机会,标为W1。他可
以选择的20种走法变成20个枝条,从这个节点发散出去。每一个枝条代
表的行动方式就是这个枝条的标签:兵进K4(P-K4或代数标记法里的
e4)、兵进Q4,等等。我们的目的只是描述普遍情况,因此,为了避免
这幅图表变得枝节丛生,我们不会显示或标明所有枝条。每一个枝条都
会引出下一个节点,代表黑方的第一次行动,标为B1。黑方同样可以从
20种开局方式中任选一种,于是,同样会有20个枝条从每一个标明B1的
节点发散出去。双方走完第一步,我们已经看到有400种可能性。从现
在开始,枝条的数目就会取决于前面一步。举个例子:假如白方的第一步是P-K4,他的第二步就有许多选择,因为他的后以及王旁边的象现在
都可以出动。然后你就会发现,建立这棵树所要运用的原理多么简单,而这棵树在实践中又会很快变得多么复杂。
我们可以选择这棵博弈树上每一个决策点(节点)的一个枝条,沿着
这个枝条一路走下去。这表示这盘博弈继续下去的一种特定方式。象棋
大师早在博弈初期(开局阶段)就盘算过许多这样的路径,考虑过这些路
径会有什么结果。比如我们已经标出的路径,白方第一步是P-K4,黑方
以P-QB4回敬,就是预兆一场恶战的西西里防御。
注17图2—7
在许多博弈里,每一条这样的路径都会在有限次的选择之后到达终
点。在体育或棋类比赛中,这可能是在一方取胜或双方打平的时候。更
常见的情况是,博弈的最终结果可能是以给参与者货币回报、非货币回
报或惩罚的形式出现。比如,商业对手之间的一场商界博弈可能给一家
公司带来非常可观的利润,却使另一家公司破产。而核军备竞赛的博弈
则可能达成一项成功的条约或导致两败俱伤。
假如一个博弈无论选择哪一条路径,都会在有限次的行动之后到达
终点,我们在理论上就可以完全解决这个博弈。这意味着能找出谁将取
胜以及他将怎样取胜。这是通过沿着这棵树倒后推理得出的。一旦我们
走通了整棵树,我们就会发现我们究竟能不能取胜,还有,假如可以取
胜,我们应该使用怎样的策略。对于任何一个相继选择并且数目有限的
博弈,总是存在某种最佳策略。当然,存在一个最佳策略并不等于说我
们总是可以轻而易举地找到这个最佳策略。象棋就是一个很好的例子。
临到比赛结束之际,象棋大师在刻画最优策略方面一直做得非常出
色。一旦棋盘上只剩下三四个棋子,大师级选手就能预见博弈的结局,(通过倒后推理)确定一方有没有一个万无一失的取胜策略,或另一方是
否能迫使双方打平。接着,他们可以通过预计最后阶段的各种不同局
势,评估中盘阶段的策略。问题在于,从来没有人可以一直倒后走通整
棵树,直到开局的第一步。
一些简单的博弈可以用这样的方法得到完全解决。比如,3×3的连
城游戏总是可以变成平局。
注18 这也是只有小孩才玩这个游戏而大人不
屑一顾的原因。即便是西洋跳棋,也存在这个问题。大家都相信,第二
个参与者总有办法达成平局,虽然这一结论尚未得到证明。为了保持大
家对这种游戏的兴趣,西洋跳棋比赛让参与者从中局开始行动,在中局
大家还看不出什么取胜或打平的策略。等到象棋也有可能用这种方法完
全解决的那一天,象棋的规则大概也得进行修改了。
而在目前阶段,象棋参与者都做了什么呢?他们做了我们大家将相
继移动的策略运用到实践中去的时候都应该做的事情:将向前展望分析
与价值判断结合在一起。他们会问:“这条路在四五步之后会使自己争
得一个有利局面,抑或陷入一个不利局面?”他们假设现在比赛已经结
束,由此判断每一个可能的结果的价值。然后,他们选择那个五步之后
可以达到最大价值结果的策略,向前展望,倒后推理。倒后推理是相对容易的部分。难的是怎样确定中盘局面的价值。每一个子的价值都要计
算在内,同时要在吃子与取势两方面的优势之间进行权衡取舍。
保罗·霍夫曼(Paul Hoffman)在他的《阿基米德的报复》(Archimedes'
Revenge)一书中描述了汉斯·伯利纳(Hans Berliner)的电脑象棋程序。伯
利纳是以通讯方式进行的象棋比赛的世界冠军,研制了一台专门用于下
象棋的电脑,可以在每一步棋限定的3分钟之内检查3 000万种备选方
案。伯利纳还确定了一个很好的规则,用于评估中盘局面的价值。能够
击败这个电脑程序的人不超过300名。在十五子棋比赛中,伯利纳也开
发了一个程序,该程序已经使世界冠军俯首称臣。
将倒后推理的清晰逻辑与基于实践经验确定的、评估中盘局面价值
高低的最佳规则结合起来,是处理远比象棋复杂的博弈的一种有用方
法。
6.讨价还价
无论在商界还是在国际政坛,参与各方经常通过讨价还价或者谈判
来决定总收益这个“蛋糕”应该怎样划分。我们将在第11章更详细地探讨
这一现象。现在我们把它当做一个形象的例子,解释倒后推理这一方法
怎样使我们得以预见相继行动的博弈的结果。
大多数人基于社会常识,预测一场谈判的结果就是妥协。这样做的
好处是能够保证“公平”。我们可以证明,对于许多常见类型的谈判,一
个50对50的妥协也是倒后推理的结果。
首先,我们必须认识讨价还价的两个普遍特征。我们必须知道谁向
谁提出了一个什么条件,换言之,就是这个博弈的规则是什么;接着,我们还要知道,假如各方不能达成一个协定,将会导致什么后果。
不同的谈判按照不同的规则进行。在大多数零售店里,卖方会标出
价钱,买方的唯一选择就是要么接受这个价格,要么到别的店里碰运
气。
注19 这是一个简单的“接受或者放弃”的法则。而在工资谈判的例子
中,工会首先提出一个价码,接着公司决定是不是接受。假如公司不接
受,可以还一个价码,或者等待工会调整自己要求的价码。有些时候,相继行动的次序是由法律或者习俗决定的,还有些时候这一次序本身就
具有策略意义。接下来,我们会探讨一个讨价还价的问题,在这个问题
里,双方轮流提出条件。谈判的一个必不可少的特征在于时间就是金钱。假如谈判越拉越
长,蛋糕就会开始缩水。不过,这时各方仍然可能不愿意妥协,暗自希
望只要谈成一个对自己更加有利的结果,其好处就将超过谈判的代价。
查尔斯·狄更斯(Charles Dickens)的《荒凉山庄》(Bleak House)描述了一
个极端的情形:围绕贾恩迪斯(Jarndyce)山庄展开的争执变得没完没
了,以至于最后整个山庄不得不卖掉,用于支付律师们的费用。按照同
样的思路,假如不能达成工资协定而引发罢工,那么公司就会失去利
润,工人就会失去工作。假如各国陷入一轮旷日持久的贸易自由化谈
判,它们就会在争吵收益分配的时候丧失贸易自由化带来的好处。这些
例子的共同点在于,参与谈判的所有各方都愿意尽快达成协议。
在现实生活中,收益缩水的方式非常复杂,不同情况缩水比例也不
同。不过,我们可以用一种非常简单的方法充分阐明这一点:假设每提
出一个建议或反建议,蛋糕都会朝零的方向缩小同样大小;设想这是一
个冰淇淋蛋糕,孩子们一边争吵怎么分配,蛋糕一边融化。
首先,假设整个过程总共只有一步。桌子上放了一个冰淇淋蛋糕;
一个孩子(Ali,阿里)向另一个孩子(Baba,巴巴)提议应该如此这般分
配。假如巴巴同意,他们就会按照提议分享这个蛋糕;假如巴巴不同
意,蛋糕融化,谁也吃不到。
现在,阿里处于一个强有力的地位:她使巴巴面临有所收获和一无
所获的选择。即便她提出自己独享整个蛋糕,只让巴巴在她吃完之后舔
一舔切蛋糕的餐刀,巴巴的选择也只能是舔一舔,否则他什么也得不
到。
当然,巴巴可能因为感到这么分配太不公平而生气,断然拒绝接受
这一条件。又或者,他可能希望建立或者保持自己作为一个不好对付的
讨价还价者的形象,从而为日后的讨价还价奠定基础,而日后的讨价还
价可能是跟阿里进行,也可能是跟其他得知今天自己所作所为的孩子们
进行。在实际操作当中,阿里同样需要考虑到这些问题,要向巴巴放出
刚好足够的诱饵(比如一小片蛋糕?),引诱他上钩。为简化阐述过程,我们将所有这些复杂问题搁在一边,假设阿里可以拿走她所要求的
100%的份额。实际上,我们还可以不考虑留给巴巴舔的餐刀,假定阿
里有能力提出“接受或者放弃”的条件,她可以得到整个蛋糕。
注20
一旦出现第二轮谈判,局势就会大大偏向巴巴。不妨再设想一下,现在桌子上放了一个冰淇淋蛋糕,但是两轮谈判过后,整个蛋糕就会融化。假如巴巴拒绝接受阿里提出的条件,他可以提出一个反建议,不
过,到这时,桌子上只剩下半个蛋糕了。假如阿里拒绝接受巴巴的反建
议,剩下的半个蛋糕也会融化,双方都会一无所获。
现在,阿里必须向前展望她最初提出的条件会有什么后果。她知
道,巴巴可以拒绝她的条件,从而占据有利地位,反过来就剩下的半个
蛋糕提出“接受或者放弃”的分配方案。这实际上意味着巴巴已经将那半
个蛋糕掌握在自己手里。因此,他不会接受任何低于阿里第一轮条件的
反建议。假如阿里不能阻止这一幕发生,她将一无所获。一旦看清了这
一点,她会从一开始就提出与巴巴平分这个蛋糕,这正是刚好足够引诱
对方接受而又为自己保有一半收益的条件。于是他们会马上达成一致,平分这个蛋糕。
说到这里,个中原理已经非常清楚,我们的讨论还可以再进一步。
分析结果是相同的,要么加速谈判进程,要么延缓蛋糕融化速度。随着
谈判各方提出每个建议和反建议,蛋糕也在融化,从一个变成23再变
成13,直到零,什么也剩不下。假如阿里提出最后一个建议,而蛋糕
已经缩小到只有13,她就可以全部拥有。巴巴知道这一点,所以在轮
到自己提条件的时候(这时蛋糕还剩下23)许诺分给她13。这么一来,巴巴可以得到的最好结果就是13个蛋糕,即剩下的23的一半。阿里知
道这一点,所以从一开始就许诺分给巴巴13(刚好足够引诱对方接受),自己得到23。
各得一半的分配方案存在什么规律吗?每一次的步骤数目都是偶
数,且这一现象反复出现。更重要的是,即便步骤数目是奇数,随着步
骤数目增加,双方也会越来越接近一半一半的分配方案。
若是四步,巴巴得以提出最后一个条件,从而得到这个时候桌子上
剩下的14个蛋糕。因此,阿里必须在倒数第二轮提出分给巴巴14个蛋
糕,当时桌子上还剩下半个蛋糕。而在此前的一轮,巴巴可以让阿里接
受分给她剩下的34个蛋糕中14个蛋糕的条件。因此,一路这么向前展
望下去,在讨价还价一开始,阿里就应该提出分给巴巴半个蛋糕,自己
得到另一半。
若是五步,阿里一开始可以提出分给巴巴25个蛋糕,自己得到
35。若是六步,那么分配方案又回到各得一半。若是七步,阿里得到
47,巴巴得到37。更为普遍的情况是,假如步骤数目是偶数,各得一
半。假如步骤数目n是奇数,阿里得到 (n+1)(2n),而巴巴得到(n-1)(2n)。等到步骤数目达到101,阿里可以先行提出条件的优势使她可
以得到51101个蛋糕,而巴巴得到50101个。
在这个典型的谈判过程里,蛋糕缓慢缩小,在全部消失之前有足够
时间让人们提出许多建议和反建议。这表明,通常情况下,在一个漫长
的讨价还价过程里,谁第一个提出条件并不重要。除非谈判长时间陷入
僵持状态,胜方几乎什么都得不到了,否则妥协的解决方案看来还是难
以避免的。不错,最后一个提出条件的人可以得到剩下的全部成果。不
过,真要等到整个谈判过程结束,大概也没剩下什么可以赢取的了。得
到了“全部”,但“全部”的意思却是什么也没有,这就是赢得了战役却输
掉了战争。
我们必须看到很重要的一点:虽然我们考虑过许多可能的建议和反
建议,预期结果却是阿里的第一个条件能够被对方接受。谈判过程的后
期阶段不会再发生。不过,假如第一轮不能达成一致,这些步骤将不得
不走下去,这一点在阿里盘算怎样提出一个刚好足够引诱对方接受的第
一个条件时非常关键。
这个观察结果反过来提示了另一种讨价还价策略。向前展望、倒后
推理的原理可能在整个过程开始之前就已经确定了最后结果。策略行动
的时间可能提前,在确定谈判规则的时候就已经开始。
同样的观察结果还会引出一个谜。假如讨价还价的过程真像这里阐
述的那样,应该不会出现罢工。当然,罢工的可能性会影响最终达成的
协议,不过公司会把握第一个提条件的机会,提出一个刚好足以引诱对
方接受的条件,工会也会这样做。罢工变成现实,或者更普遍的情况,即谈判破裂,一定是现实生活更微妙或者更复杂的特征引出的结果,而
这些特征早已从上述这个简单的故事中排除出去,未予考虑。我们会在
第11章探讨其中一些问题。
7.战争与和平
倒后推理的另一个实例是怎样通过一系列双边谈判维护和平。
我们举一个只有部分假设的例子:苏丹是一个相对弱小的国家,现
在面临被其邻国利比亚入侵的危险。假如这两个国家在某种程度上都是
与外界隔绝的,那么,要想阻止利比亚入侵并击败苏丹简直毫无可能。尽管两个敌对邻居可能无法继续和平共处,但第三方的存在也许可
以构成必要的制约。在利比亚与苏丹的例子里,这一原理可能会是“我
的敌人的敌人就是我的朋友”。假如利比亚真要跟苏丹开战,那么,利
比亚将不得不从东部与埃及接壤的边境抽调兵力。埃及当然不愿意贸然
入侵一个全副武装的利比亚,不过,假如利比亚跟苏丹打仗而实力大
减,埃及人也许会得到一个难以抗拒的大好机会,一举干掉这个麻烦的
邻居。利比亚可以(或者至少应该)通过倒后推理,预计到一旦他们进攻
苏丹,埃及就会入侵。表面看来,苏丹安全了。不过,在三个国家后面
就停止继续思考这个问题,可能会造成一种虚假的安全感。
假如三个敌人可以达成稳定状态,四个又如何?现在加入以色列。
假如埃及要打利比亚的主意,很有可能遭到以色列入侵。在萨达特
(Sadat)和贝京(Begin)将双方关系正常化以前,这确实是埃及面临的一个
严重威胁。在1978年以前,利比亚不必担心埃及入侵,就是因为埃及一
想到以色列就战战兢兢,不敢大意。结果,苏丹不可能指望埃及来抑制
利比亚的扩张野心。
注21 随着以色列与埃及关系改善,倒后推理的链条
在埃及这里中断,而苏丹也安全了,至少目前是这样。
这个关于制约因素的例子当然经过了必要的格式化,这样它更加切
合我们讨论的主题。从表面看来,这个例子说明,一个国家究竟会不会
遭到入侵,将取决于潜在侵略者链条的节点数目是奇数还是偶数。一个
更加接近现实生活的情况分析可以把国与国之间的复杂关系考虑在内,从而得到更多细节,用于分析一国入侵别国的企图究竟有多大。不过,还有一个重要的结论:博弈的结果在很大程度上取决于参与者的人数。
参与的人越多越好,参与的人越少越糟,即便在同一个博弈里也是如
此。但是,两个敌对国家难以和平共处、三个敌对国家就能恢复稳定局
面的结论并不意味着若有四个敌对国家就更好;在这个例子里,四个的
结果跟两个是一样的。
注22
为了进一步阐述这个制约因素的观点,我们请读者研究本书最后一
章“案例分析”的“三方对决”一节。三个敌对者,实力各不相同,现在必
须决定自己应该袭击哪一个。你可能会发现答案令人大吃一惊。
8.英国人玩的博弈
本章我们讨论了有序行动或者有序移动的博弈。实际上,现实生活
当中没有几个博弈存在清晰界定而参与者又必须遵守的行动规则。参与
者自己制定自己的规则。那么,他们怎么才能向前展望、倒后推理呢?他们又怎么才能知道这个博弈究竟有没有行动次序呢?
我们借用1987年英国大选的情形说明这一点。玛格丽特·撒切尔
(Margaret Thatcher)领导的执政保守党面对以尼尔·金诺克(Neil Kinnock)
为首的工党的挑战。大选期间,双方都要选择是走平坦大道,即以就事
论事为原则进行竞选,还是走崎岖小径,即进行人身攻击。选民当中很
大一部分人对撒切尔夫人的政绩深表满意,因此,假如双方按照相仿的
规矩拉票,将出现整个竞选一面倒的局面,撒切尔夫人就会取胜。
金诺克先生的唯一希望,在于他可以通过风格完全不同的拉票活
动,建立一个足以超越对手的好印象。现在我们假设,撒切尔夫人选择
平坦大道,而他选择崎岖小径,或者两者调换选择,他的成功概率都是
一样的。假设他们私下里都愿意选择平坦大道,但这一想法必须让位给
取胜这一目标。
哪一条才是“人迹罕至”的路呢?答案取决于双方做决定的次序。我
们现在就来考察一些可能出现的情况。
假设撒切尔夫人首先选择竞选风格,这是因为,比如说,就传统而
言都是执政党在反对党之前公布自己的竞选纲领。这样,她可以画出下
面的博弈树(如图2—8所示)。
图2—8
通过向前展望和倒后推理,撒切尔夫人可以预计,假如她选择平坦
大道,金诺克先生一定会选择崎岖小径,反之亦然。
注23 既然两个方案赋予她的取胜概率相同,她愿意选择平坦大道。
撒切尔夫人先行会使她陷于不利,因为这么一来,金诺克先生就可
以选择与其完全不同的道路。不过,她先行本身不会造成这个问题。现
在我们在这个对局上做一个小小的修改。假设撒切尔夫人已经跟她的保
守党顾问以及竞选宣传经理们开过会,确定了她的策略。但是这一决定
没有公开。金诺克先生也在开同样一个会议。他应该怎么做?他应不应
该假设撒切尔夫人在先行的时候,是按照我们刚刚描述的方法进行推理
的呢?那将意味着她已经选择了平坦大道,因此金诺克先生应该选择走
崎岖小径。不过,假如撒切尔夫人想到金诺克先生也会这么想,她就会
为自己选择崎岖小径的策略。金诺克先生并不确实知道她的选择,他若
是忽略这么一种“第二层次”的思考,他就是一个大傻瓜。那么,他应不
应该选择平坦大道呢?不一定,因为撒切尔夫人可以想到“第三层次”,如此类推。一个普遍的观点是若要运用向前展望、倒后推理的原理,不
可缺少的前提是后行者可以观察到先行者的行动。
即便撒切尔夫人先行,而她的选择也是外人可以看到的,但如果她
在竞选期间改变策略,又会发生什么情况呢?假设只有选民得到的最后
印象才算数,而撒切尔夫人在第一次发表声明的时候说了什么无关紧
要。金诺克先生绝不能信以为真,并据以制定自己的策略。反过来,撒
切尔夫人在考虑自己应该怎么迈出第一步的时候,也不能指望金诺克先
生只有一种反应方式。这样,我们就得到向前展望、倒后推理原理的另
一个适用条件:策略必须是不可逆转的。
假如这两个条件有一个不符合,又会怎么样?即便两党是在不同时
间做出各自的决定,就策略思维而言,这些决定就跟同时做出没有两
样。从相继做出决定到同时做出决定的转变,可能对两党中的一方有
利,也可能对双方都有利。实际上,在1987年的英国大选中,双方至少
都改变了一次自己的策略。第3章将提出同时进行的博弈的行动规则。
关于相继行动与同时行动的博弈的区别,体育比赛提供了另一个例
子。百码短跑是同时行动的博弈,因为根本没时间排出相继行动的次
序。而在蝶泳比赛中,运动员也许有时间进行思考,却会发现看清对手
的位置是非常困难的。马拉松比赛具有相继行动的博弈的组成成分:运
动员们可以看到其他人的位置(以一点为基准),策略也是不可逆转的,因为不可能回头重新比赛早先跑过的路程。
结束这一章的时候,我们回到查理·布朗要不要踢那个橄榄球的问题。在橄榄球教练汤姆·奥斯本(Tom Osborne)指挥冠军争夺战的最后几
分钟,这个问题真的出现了。我们同样认为他做了错误的选择。倒后推
理可以揭示错误的原因。
9.案例分析之二:汤姆·奥斯本与1984年橙碗球场决赛的故事
在1984年的橙碗球场决赛上,战无不胜的内布拉斯加打谷者队
(Nebraska Cornhuskers)与曾有一次败绩的迈阿密旋风队(Miami
Hurricanes)狭路相逢。因为内布拉斯加队晋身决赛的战绩高出一筹,只
要打平,它就能以第一的排名结束整个赛季。
不过,在第四节,内布拉斯加打谷者队以17∶31落后。接着,他们
发动了一次反击,成功触底得分,将比分追至23∶31。这时,内布拉斯
加队的教练汤姆·奥斯本面临一个重大的策略抉择。
在大学橄榄球比赛中,触底得分一方可以从距离入球得分线只有
2 12 码的标记处开球。该队可以选择带球突破或将球传到底线区,再得2分;或者采用一种不那么冒险的策略,将球直接踢过球门柱之
间,再得1分。
奥斯本选择了安全至上,内布拉斯加队成功射门得分,比分改写为
24∶31。该队继续全力反击。在比赛最后阶段,他们最后一次触底得
分,比分变成30∶31。只要再得1分,该队就能战平对手,取得冠军头
衔。不过,这样取胜总不大过瘾。为了漂亮地拿下冠军争夺战,奥斯本
认为他应该在本场比赛取胜。
内布拉斯加队决定要用得2分的策略取胜。欧文·弗赖尔(Irving
Fryer)接到球,却没能得分。迈阿密队与内布拉斯加队以同样的胜负战
绩结束全年比赛。由于迈阿密队击败内布拉斯加队,最终获得冠军的是
迈阿密队。
假设你自己处于奥斯本教练的位置。你能不能做得比他更好?案例
讨论
星期一出版的许多橄榄球评论文章纷纷指责奥斯本不应该贸然求
胜,没有稳妥求和。不过,这不是我们争论的核心问题。核心问题在
于,在奥斯本甘愿冒更大的风险一心求胜的前提下,他选错了策略。他
本来应该先尝试得2分的策略,然后,假如成功了,再尝试得1分的策略,假如不成功,再尝试得2分的策略。
让我们更仔细地研究这个案例。在落后14分的时候,奥斯本知道他
至少还要得到两个触底得分外加3分。他决定先尝试得1分的策略,再尝
试得2分的策略。假如两个尝试都成功了,那么使用两个策略的先后次
序则无关紧要。假如得1分的策略失败,而得2分的策略成功,先后次序
则仍然无关紧要,比赛还是以平局告终,内布拉斯加队赢得冠军。先后
次序影响战局的唯一可能性在于内布拉斯加队尝试得2分的策略没有成
功。假如实施奥斯本的计划,这将导致输掉决赛以及冠军锦标。相反,假如他们先尝试得2分的策略,那么,即便尝试失败,他们仍然未必输
掉这场比赛。他们仍然以23∶31落后。等到他们下一次触底得分,比分
就会改为29∶31。这时候,只要他们尝试得2分的策略得手,比赛就能
打成平局,他们就能赢得冠军头衔!
注24
我们曾经听到有人反驳说,假如奥斯本先尝试得2分的策略,那
么,如果没有成功,他的队将只能为打平对手而努力。但这么做不是那
么鼓舞人心,并且他们很有可能不能第二次触底得分了。更重要的是,等到最后才来尝试这个已经变得生死攸关的得2分的策略,他的队将陷
入成败取决于运气的局面。这种看法是错的,有几个理由。假如内布拉
斯加队等到第二次触底得分才尝试得2分的策略,一旦失败,他们就会
输掉这场比赛。假如他们第一次尝试得2分的策略失败,他们仍然有机
会打平。即使这个机会可能非常渺茫,但有还是比没有强。激励效应的
论点也站不住脚。这是因为,虽然内布拉斯加队的进攻可能在冠军决赛
这样重大的场合突然加强,但迈阿密队的防守也会加强。这场比赛对双
方是同样重要的。相反,假如奥斯本第一次触底得分之后就尝试得2分
的策略,在一定程度上确实存在激励效应,提高第二次触底得分的概
率。这也使他可以通过两个三分球打平。
从这个故事中可总结的教训之一在于,假如你不得不冒一点风险,通常都是越早冒险越好。这一点在网球选手看来再明显不过了:人人都
知道应该在第一发球的时候冒风险,第二发球则必须谨慎。这么一来,就算你一发失误,比赛也不会就此结束。你仍然有时间考虑选择其他策
略,并借此站稳脚跟,甚至一举领先。
第3章 看穿对手的策略
每个星期,《时代》和《新闻周刊》都会暗自较劲,非要做出最引人注目的封面故事不可。一个富有戏剧性或者饶有趣味的封面,可以吸
引站在报摊前的潜在买主的目光。因此,每个星期,《时代》的编辑们
一定会举行闭门会议,选择下一个封面故事。他们这么做的时候,很清
楚在某个什么地方,《新闻周刊》的编辑们也在关起门来开会,选择下
一个封面故事。反过来,《新闻周刊》的编辑们也知道《时代》的编辑
们正在做同样的事情,而《时代》的编辑们也知道《新闻周刊》的编辑
们知道这一点……
这两家新闻杂志投入了一场策略博弈,不过,这个博弈从本质上看
跟我们已经讨论过的博弈存在很大差别。第2章讨论的博弈是由一系列
相继进行的行动组成的。查理·布朗在选择要不要踢那个橄榄球时,心
里明白露西现在还没有决定要不要拿走那个球;在象棋里,白方与黑方
交替行动。相反,《时代》与《新闻周刊》的行动却是同时进行的。双
方不得不在毫不知晓对手的决定的情况下采取行动。等到彼此发现对方
做了什么,再想做什么改变就太迟了。当然,这个星期的输家下个星期
很可能竭力反扑,不过,等到那时,在这个日新月异的世界上说不定已
经出现了一个完全不同的新的故事模式,开始了一场完全不同的博弈。
这两种博弈所要用到的策略思维和行动在本质上存在天壤之别。对
于第2章讨论的相继行动的博弈,每个参与者不得不向前展望,估计对
手的反应,从而倒后推理,决定自己这一轮应该怎么走。这是一条线性
的推理链:“假如我这么做,另一个参与者会那么做——若是那样,我
会这么反击”,依此类推。
而在同时行动的博弈里,没有一个参与者可以在自己行动之前得知
另一个参与者的整个计划。在这种情况下,互动推理不是通过观察对方
的策略进行,而是必须通过看穿对手的策略才能展开。要想做到这一
点,单单假设自己处于对手的位置会怎么做还不够。即便你那样做了,你又能发现什么?你只会发现,你的对手也在做同样的事情,即他也在
假设自己处于你的位置会怎么做。因此,每一个人不得不同时担任两个
角色,一个是自己,一个是对手,从而找出双方的最佳行动方式。与一
条线性的推理链不同,这是一个循环——“假如我认为他认为我认
为……”。诀窍在于怎样破解这个循环。
夏洛克·福尔摩斯(Sherlock Holmes)和他的死对头、罪恶魔头莫里亚
蒂(Moriarty)教授擅长这类推理,对此我们一点都不觉得惊讶。正如福
尔摩斯在《最后的问题》里告诉华生(Watson)的:“我要说的其实已经在你的脑海闪过。”他说。
“那么我的答案大概也已经在你的脑海闪过。”我答道。
你就和华生医生一样,大概也在揣摩福尔摩斯怎么未卜先知。听完
我们的解释,我们希望你会同意这其实相当简单。
你怎样才能看穿所有那些错综复杂而又看不见的策略呢?首先,你
不要把其他参与者的未知行动视做天气那样,具有与个人无关的不确定
性。上班之前,《时代》的编辑可能收听天气预报,知道今天下雨的概
率是40%,他大概会利用这个信息去决定要不要带一把雨伞去上班。但
《新闻周刊》将会采用哪个特定主题作为封面故事的概率则完全是另外
一回事。
区别在于,《时代》的编辑对《新闻周刊》有一个非常中肯的了解
——另一个杂志的编辑与天气不同,他们是策略的博弈参与者,就跟
《时代》的编辑自己一样。
注25 即便一个编辑不可能真的观察到另一个
杂志的决定,他也可以通过另一个杂志的视角思考这个问题,尝试确定
它现在一定在做什么。
在第2章,我们可以提供一个单一的、统一的原理,为相继行动的
博弈确定最佳策略。这就是我们的法则1:向前展望,倒后推理。在这
一章,事情不会那么简单。不过,关于同时行动必不可少的思维方式的
思考可以总结为指导行动的三个简单法则。反过来,这些法则又基于两
个简单概念:优势策略与均衡。与第2章一样,我们也会通过简单的例
子解释这些概念和法则。
1.优势策略
在棒球比赛里,假如一方已经有两个人出局,而又打出三个坏球和
两个好球,那么,任何一名进攻上垒的球员都必须在下一次投球的时候
跑向下一垒。这可以通过琢磨各种可能的情形得出来。在大多数情况
下,攻垒球员怎么做无关紧要。假如击球手碰不到球,要么出现第四个
坏球而攻垒球员成功上垒,要么出现第三个好球而这一局结束。假如投
球手投出界外球,攻垒球员只消退回原先所在的垒。假如这是一个擦棒
球而又被接住,那么这一局就结束了。不过,有一种情况跑动攻垒占有
优势,即假如击球手将投球击到界外,那么攻垒球员就有很好的机会上
垒或者得分。我们认为,在这种局面下,跑动攻垒就是优势策略,即某些时候它
胜于其他策略,且任何时候都不会比其他策略差。一般而言,假如一个
球员有某一做法,无论其他球员怎么做,这个做法都会高出一筹,那么
这个球员就有一个优势策略。假如一个球员拥有这么一个策略,他的决
策就会变得非常简单;他可以选择这个优势策略,完全不必担心其他对
手怎样行事。因此,寻找优势策略是每一个人的首要任务。
一旦你知道自己在找什么,你就会发现这个东西无所遁形,我们身
边其实到处都是优势策略的有趣例子。比如印第安纳·琼斯(Indiana
Jones)在电影《印第安纳·琼斯与最后的十字军东征》(Indiana Jones and
the Last Crusade)的最紧张局势时所处的地位。印第安纳·琼斯、他的父
亲以及纳粹分子全都聚集在安放圣杯的地方。眼看纳粹分子只差一步就
要得到圣杯,琼斯父子却无论如何不愿意助纣为虐。于是,纳粹分子打
了琼斯父亲一枪。只有具备起死回生力量的圣杯才能救老琼斯博士的
命。在这种情况下,琼斯只好引他们走向圣杯。不过,前面还有一个最
后的挑战:琼斯必须在十几个杯子当中做出选择,选出耶稣基督用过的
圣杯。圣杯可以使人永生不死,其他杯子却会致人于死地。纳粹头子迫
不及待地拿起一个华丽的黄金杯,喝下里面的圣水,却突然倒地而死,因为他选错了,那不是圣杯。琼斯选了一个木头杯,那是一个木匠用的
杯子。他一边大叫“只有一个办法可以证实”,一边将杯里的水倒出一点
在圣水器上,自己先喝了下去,希望自己选中的就是生命之杯。当琼斯
发现自己没搞错,立即把杯子送到他父亲那里,圣水果然治愈了致命的
枪伤。
虽然这一幕增添了紧张气氛,但在一定程度上却让我们感到难堪,因为一个像印第安纳·琼斯博士那样了不起的教授,居然会看不到他的
优势策略。他本来应该先把杯子递给他父亲,没有必要自己亲身尝试。
假如琼斯确实选对了杯子,那他父亲就会得救。假如他选错了杯子,那
他父亲就会丧命,却至少可以保全琼斯。在将杯子递给他父亲之前自己
测试一下其实毫无用处,这是因为,假如琼斯选错了杯子,那就再也没
有第二次机会了——琼斯将死于致命之水,而他父亲也会死于致命枪
伤。
注26
相比之下,寻找优势策略会比寻找圣杯容易一些。不妨想想英国桂
冠诗人艾尔弗雷德·丁尼生爵士(Alfred,Lord Tennyson)那令人耳熟能详的
名句:“爱过之后失去总比从来没有爱过好。”[1] 换言之,爱是一种
优势策略。2.封面之战
回到《时代》与《新闻周刊》的竞争上来。假设有一个星期出了两
桩大新闻:一是众议院和参议院就预算问题吵得不可开交;二是发布了
一种据说对艾滋病有特效的新药。编辑们选择封面故事的时候,首要考
虑的是哪一条新闻更能吸引报摊前的买主(订户则无论采用哪一条新闻
做封面故事都会买这本杂志)。在报摊前的买主当中,假设30%的人对预
算问题感兴趣,70%的人对艾滋病新药感兴趣。这些人只会在自己感兴
趣的新闻变成封面故事的时候掏钱买杂志;假如两本杂志用了同一条新
闻做封面故事,那么感兴趣的买主就会平分两组,一组买《时代》,另
一组买《新闻周刊》。
现在,《时代》的编辑可以进行如下推理:“假如《新闻周刊》采
用艾滋病新药做封面故事,那么,假如我采用预算问题,我就会得到整
个‘预算问题市场’(即全体读者的30%),假如我采用艾滋病新药,我们两
家就会平分‘艾滋病新药市场’(即我得到全体读者的35%),因此,艾滋病
新药为我带来的收入就会超过预算问题。假如《新闻周刊》采用预算问
题,那么,假如我采用同样的故事,我会得到15%的读者,假如我采用
艾滋病新药,就会得到70%的读者;这一次,第二方案同样会为我带来
更大的收入。因此,我有一个优势策略,就是采用艾滋病新药做封面。
无论我的对手选择采用上述两个新闻当中的哪一个,这一策略都会比我
的其他策略更胜一筹。”
我们可以借助一个简单的表格,更加迅速而清晰地看出这番推理的
逻辑性。我们用图3—1中的两列表示《新闻周刊》的对应选择,用两行
表示《时代》的对应选择。这时我们得到四个格子,每一个格子对应一
组策略。格子里的数字代表《时代》的销量,用购买《时代》的读者数
占全体潜在读者数的百分比显示。第一行显示的是假如《时代》选择艾
滋病新药,它在《新闻周刊》选择艾滋病新药或者预算问题的两种情况
下的销量。第二行显示的是假如《时代》选择预算问题,它在《新闻周
刊》选择艾滋病新药或者预算问题的两种情况下的销量。比如说,在左
下角或者西南方向的格子,《时代》选择预算问题,《新闻周刊》选择
艾滋病新药,结果《时代》得到30%的市场。
这个优势策略很容易看出来。第一行的两个格子无一例外都比第二
行对应的格子占优,因为第一行的两个数字都比排在同一列下面的数字
大。这是优势地位的特征。通过这个表格,你可以很快就看出这个特征
是不是符合。你可以想象自己用第一行覆盖在第二行上面,然后会发现,盖住第二行的是更大的两个数字。相比之下,这个表格在阐述前面
一段话的时候具有压倒语言推理的直观优势,而这种优势随着博弈的复
杂程度加大而越发明显。在复杂的博弈当中,各方都有好几个策略。
图3—1 《时代》的销售
同理,在这个博弈里,双方都有一个优势策略。为了解释这一点,我们为《新闻周刊》的销量也画了一个表格(如图3—2所示)。第一列数
字显示的是假如《新闻周刊》采用艾滋病新药,它在《时代》采用艾滋
病新药或者预算问题的两种情况下各有多大销量。这一列的两个数字无
一例外都比第二列对应的数字占优,你可以再次想象自己拿起第一列覆
盖在第二列上时会发现什么。因此,艾滋病新药对《新闻周刊》来说也
是优势策略。图3—2 《新闻周刊》的销售
以策略观点来看,各方均有一个优势策略的博弈是最简单的一种博
弈。虽然其中存在策略互动,却有一个可以预见的结局:全体参与者都
会选择自己的优势策略,完全不必理会其他人会怎么做。但这一点并不
会降低参与或者思考这种博弈的趣味性。比如,在百码短跑中,优势策
略是能跑多快就跑多快,但许多人还是很喜欢参加或者观看这种比赛。
在第1章提到的捷尔任斯基广场牢房出现的囚徒困境中,两个参与者都
有一个优势策略,只不过这股压倒一切的力量最终将他们引向了一起倒
霉的结局。这就提出了一个很有意思的问题:参与者怎样合作才能取得
一个更好的结果?我们会在下一章进行更详细的探讨。
有时候,某参与者有一个优势策略,其他参与者则没有。我们只要
略微修改一下《时代》与《新闻周刊》的封面故事大战的例子,就可以描述这种情形。假设全体读者略偏向于选择《时代》。假如两个杂志选
择同样的新闻做封面故事,喜欢这个新闻的潜在买主当中有60%的人选
择《时代》,40%的人选择《新闻周刊》。现在,我们画出《时代》的
销量表格(如图3—3所示)。
图3—3 《时代》的销售
对于《时代》,艾滋病新药仍然是优势策略,但对于《新闻周
刊》,销量表格则变成下面这样(如图3—4所示)。
假如你拿起第一列,覆盖在第二列上,你会发现,30被一个较小的
数字(28)覆盖,而12却被一个较大的数字(70)覆盖。没有一个策略占有
压倒优势。换言之,《新闻周刊》的最佳选择不再与《时代》的策略无
关。假如《时代》选择艾滋病新药,《新闻周刊》选择预算问题就能得
到更好的销量,反之亦然。对于《新闻周刊》,得到整个预算问题市场总比得到一个较小份额的艾滋病新药市场要好,虽然整个艾滋病新药市
场比预算问题市场要大。
图3—4 《新闻周刊》的销售
《新闻周刊》的编辑们不会知道《时代》的编辑们将会选择什么,不过他们可以分析出来。因为《时代》有一个优势策略,那一定就是他
们的选择。因此,《新闻周刊》的编辑们可以很有把握地假定《时代》
已经选了艾滋病新药,并据此选择自己的最佳策略,即预算问题。
由此可见,只有一方拥有优势策略的博弈其实也非常简单。拥有优
势策略的一方将采用其优势策略,另一方则针对这个策略采用自己的最
佳策略。
现在,既然我们已经介绍了优势策略的概念,就有必要强调两点特征,这两点特征可用来确定什么不是优势策略。人们很容易就会弄糊
涂,不知道优势策略的优势究竟是对什么而言的。
1981年,伦纳德·西尔克(Leonard Silk)在撰写有关国会对《经济复苏
税法》争论的新闻时这样概括:“里根先生(Mr. Reagan)早已料到共和党
人拥有博弈论中称为‘优势策略’的东西,一个使参与者领先其对手的策
略,无论这些对手采用什么策略,结局都是一样。”[2] 我们将在第5
章更加仔细地介绍这个博弈,在这里想指出的是,西尔克对优势策略的
定义并不正确。“优势策略”的优势是指你的这个策略对你的其他策略占
有优势,而不是对你的对手的策略占有优势。无论对手采用什么策略,某个参与者如果采用优势策略,就能使自己获得比采用任何其他策略更
好的结果。回顾封面大战的例子,《时代》和《新闻周刊》都有一个优
势策略,但双方都不可能得到比对方更高的销量。
另一个常见的误解在于,一个优势策略必须满足一个条件,即采用
优势策略得到的最坏结果也要比采用另外一个策略得到的最佳结果略胜
一筹。在前面讲到的例子里,所有优势策略凑巧都满足这个条件。按照
最初设定的条件,《时代》假如采用艾滋病新药做封面故事,最坏的结
果是得到35%的市场份额;他们若采用预算问题做封面故事,可能得到
的最佳结果是30%的市场份额。但这并非优势策略的一个普遍特征。
现在让我们想象一下《时代》和《新闻周刊》之间爆发了一场价格
战。假设每本杂志的制作成本是1美元,且售价只有两个可能的价位选
择,分别是3美元(意味着每本利润为2美元)和2美元(意味着每本利润为1
美元)。假设顾客永远倾向于选择价格较低的杂志,且在杂志价格相同
的时候两种杂志各得一半读者。杂志定价3美元的时候,读者总数是500
万;杂志价格降到2美元,读者总数将升到800万。这时,你可以轻易算
出《时代》在4种可能出现的价格组合里将会获得多少利润,并由此得
出图3—5。图3—5 《时代》的利润
《时代》的优势策略是定价2美元(《新闻周刊》亦如此)。《时代》
采用这个优势策略可能得到的最坏结果是赢利400万美元。但是,采用
另外一个策略可能得到的最佳结果将超过这一数字,达到500万美元。
问题是比较这两个数字毫无意义。500万美元的数字是在两本杂志同时
定价3美元的时候出现的;不过,假如这时《时代》把价格降到2美元,利润还会更高,达到800万美元。
我们可以把这些例子归纳为一个指导同时行动的博弈的法则。
法则2:假如你有一个优势策略,请照办。不要担心你的对手会怎么做。假如你没有一个优势策略,但你的对
手有,那么就当他会采用这个优势策略,相应选择你自己最好的做法。
提醒一句:我们已经确立了同时行动的博弈的优势策略的概念。若
是换了相继行动的博弈,采用优势策略的时候就要格外留神。因为策略
互动的本质已经改变,优势策略的概念也会完全不同。假设我们说你有
一个优势策略,无论你的对手选择怎么做,你按照这个策略做都比采用
其他策略更好。若是相继行动,而你的对手先行,你就应该一直选择自
己的优势策略。正如我们已经说过的那样,这是你对你的对手每一个行
动的最佳对策,因此也是对现在他选择的这个特定行动的最佳对策。但
是,假如你先行,你就不会知道你的对手将会采取什么行动。他会观察
你的选择,同时做出自己的决定,因此你有机会影响他的行动。某些情
况下,若是采用优势策略以外的策略,你可能更有效地施加这种影响。
我们将在第6章讨论承诺的时候全面分析这个问题。
3.劣势策略
不是所有博弈都有优势策略,哪怕这个博弈只有一个参与者。实际
上,优势与其说是一种规律,不如说是一种例外。虽然出现一个优势策
略可以大大简化行动的规则,但这些规则却并不适用于大多数现实生活
中的博弈。这时候我们必须用到其他原理。
一个优势策略优于其他任何策略,同样,一个劣势策略则劣于其他
任何策略。假如你有一个优势策略,你可以选择采用,并且知道你的对
手若是有一个优势策略他也会照办;同样,假如你有一个劣势策略,你
应该避免采用,并且知道你的对手若是有一个劣势策略他也会规避。
假如你只有两个策略可以选择,其中一个是劣势,那么另一个一定
是优势策略。因此,与选择优势策略做法完全不同的规避劣势策略做
法,必须建立在至少一方拥有至少三个策略的博弈的基础之上。现在就
让我们看一个这种类型的简单例子。
设想一场橄榄球比赛的一次对抗。攻方一门心思竭尽全力向前推
进,能跑几码算几码,而守方则全力以赴阻挡对方向前移动,寸步不
让。举个例子:当比赛只剩下很少时间,攻方可能希望尽力推进,使自
己更容易得到一个射门得分的机会。
假如攻方只有两个策略,即带球跑或者传球,而守方则有三个策略——拦截带球跑、拦截传球以及闪击四分卫(blitz the quarterback)。我们
可以计算出全部六种策略组合分别能使攻方向前推进多少码。以守方选
择闪击四分卫而攻方打算传球为例。假设四分卫被撞得倒退10码的概率
是10%,迅速传球传出10码的概率是70%,而传球传出更远达到20码的
概率是20%。那么,平均值就是
0.1×(-10)+0.7×10+0.2×20=-1+7+4=10
显而易见,这些数字本应该以两队拥有或者缺少的特殊技能为基
础;我们只不过为了描述方便而选择了一些非常独特的技巧。
注27
我们用图3—6显示所有六种策略组合将会得出怎样的计算结果。
图3—6 攻方期望得到的码数
如图3—6所示,攻方竭力要得到最大数目,守方则尽量压低这个数
目,因此,我们没有必要分开列表确定他们的行动。
注28
双方都没有一个优势策略:没有一行的数字完全高于另一行,也没
有一列的数字完全低于另一列。不过,守方倒是有一个劣势策略,就是闪击四分卫。闪击四分卫的结果是无论如何都会拱手让出较大的码数,因此,这一策略对于守方而言会比它采用其他可能的策略都更糟糕。因
此,守方不应该闪击四分卫,攻方也可以非常自信地认定对手不会那么
做。
至此,这场推导尚未结束。闪击策略可能从守方教练的笔记本中删
除了,整个比赛可以被视为双方各有两个策略。在这场经过简化的比赛
中,攻方有一个优势策略,就是传球。其数字分别是9和8,都大于带球
跑策略的数字,分别是3和7。传球之所以不是原来的比赛的优势策略,原因在于,带球跑的结果在守方采取闪击策略的时候会有一个比较理想
的结果(因为带球者可能趁守方闪击四分卫而分身乏术时,顺利突入开
阔地带),而现在闪击策略已经不予考虑。因此,攻方将会选择传球。
反过来,守方也会想到这一点,选择自己的最佳策略,即防守传球。
这里涉及的普遍适用的概念可以归纳为一个指导相继移动的博弈的
行动法则。
法则3:剔除所有劣势策略,不予考虑,如此一步一步做下去。
假如在这么做的过程当中,在较小的博弈里出现了优势策略,应该
一步一步挑选出来。假如这个过程以一个独一无二的结果告终,那就意
味着你找到了参与者的行动指南以及这个博弈的结果。即便这个过程不
会以一个独一无二的结果告终,它也会缩小整个博弈的规模,降低博弈
的复杂程度。
我们以一个虚构的波斯湾海军对峙局势具体描述逐步剔除劣势策略
的做法。
注29 图3—7所示的格栅代表战斗舰艇的方位以及可能的选择。
I点的一艘伊拉克舰艇准备发射一枚导弹,企图击毁A点的一艘美国舰
艇。这枚导弹的路径已经由电脑程序在发射的时候确定,可以直线前
进,也可以每隔20秒大幅转动一个直角。假如这枚伊拉克导弹笔直从I
点飞向A点,美国导弹防御系统可以非常轻易地进行拦截。因此,伊拉
克一定会尝试带点拐弯的路径。所有能从I点通向A点的路径已经由下面
的格栅显示出来。每条边的长度,比如IF的长度,等于这枚导弹20秒之
内可以走过的距离。
那艘美国舰艇的雷达会监测到伊拉克舰艇发射的这枚导弹,因此电
脑会马上发射一枚反导弹。反导弹的速度和伊拉克导弹相同,也可以做
同样的90°拐弯。于是,这枚反导弹的路径也可以用同样的格栅表示,只不过这次是由A点出发。但是,为了填装足够撞毁一枚导弹的爆炸
物,反导弹不得不少装燃料,装的燃料只够它飞行1分钟,因此,它只
能走过三个节点(比如,从A点到B点,B点到C点,然后再从C点到F
点,这一路径我们用ABCF表示)。
图3—7
假如在这1分钟开始之前或者结束之际,我们的反导弹将与来犯的导弹相遇,那么,反导弹就会爆炸,消除伊拉克导弹的威胁,否则伊拉
克导弹就会击中我们的舰艇。问题是,应该怎样选择两枚导弹的路径?
在这个博弈里,值得关注的只有第1分钟的路径。各方必须事先想
好三个20秒时间段应该怎么走。将每个时间段的可能选择加起来,双方
各有8条可能的路径,共有64种组合方式。我们现在就来考察全部64种
组合方式,计算哪些方式下反导弹和导弹会迎头相撞,哪些方式下不会
相撞。
举个例子:假设伊拉克选择IFCB,即头两个时间段直线从I点经F点
到C点,然后转90°到B。对照美国的ABCF策略,可见,反导弹和导弹
将在两个时间段(即40秒)之后在C点相遇,因此这一组合的结果是相
撞。假如伊拉克还是采取IFCB策略,而美国却选择ABEF迎击,反导弹
和导弹就不会相撞。表面上看来,上述弹道都经过B点和F点,但反导
弹和导弹是在不同时间达到这些点;比如美国反导弹20秒后到达B点,而伊拉克导弹则要在60秒后到达。
图3—8显示了所有这样的组合。伊拉克的8个策略分别标为I1到I8,同时标出具体路径,比如I1表示IFCB。同样地,美国的策略用A1到A8
表示。相撞的结果记做H,不会相撞的结果记做O。
图3—8 击中与错过图
图3—8看起来好像很复杂,但只要借助消除劣势策略的法则,就能将其大大简化。美国反导弹的目标在于得到相撞的结果,因此在美国人
看来,H强于O。不难看出,对于美国人,A2策略与A4策略相比处于劣
势:假如你将A4行举起,盖在A2行上面,你会发现,只要是A2得到H
的地方,A4也会得到H,而且A4还多一个H,即对应伊拉克I5策略的地
方。对全部可能性进行这样的分析,可以知道A2、A3、A6和A7策略与
A4和A8策略相比处于劣势,A1不及A8,A5又不及A4。因此,伊拉克
人可以确信美国人只会采取A4或者A8策略。伊拉克人把注意力集中在
这两行,一心想避免反导弹和导弹相撞,因此在他们看来,I2、I3、I4、I6、I7和I8策略与I1或者I5策略相比处于劣势。划掉劣势策略所在的
行和列之后,整个博弈就简化为图3—10。
注30
我们的两个法则不可能将图3—10进一步简化了,因为这里已经没
有任何优势策略或者劣势策略可言。不过,我们已经做得很不错了。看
一看表格里剩下的策略,我们发现,伊拉克导弹应该沿着格栅外围前
进,而美国反导弹则应该小步曲折前进。这样,我们很快就能看到双方
应该怎样从各自拥有的两个方案中进行抉择了。图3—9 击中与错过图图3—10 简化的击中与错过图
4.均衡策略
......
您现在查看是摘要介绍页, 详见PDF附件(5912KB,360页)。





