水电工检修一次多少钱:策略思维

来源:百度文库 编辑:偶看新闻 时间:2024/04/27 00:48:09
[美]阿维纳什·K,迪克西特Avinash K.Dixit巴里·J.奈尔伯夫Barry J.Nalebuff /著王尔山/译王则柯/校
  内容简介
  耶鲁大学教授奈尔伯夫和普林斯顿大学教授迪克西特的这本著作,用许多活生生的例子,向没有经济学基础的读者展示了博弈论策略思维的道理。试看一例:奈尔伯夫大学毕业的时候,在剑桥大学的正式舞会上参加轮盘赌游戏并且以700:300的大比数领先,眼看大奖在望,鬼使神差他却无视己经具有的后动优势,在最后一轮大意先行,结果功败垂成。事后他回忆那天酒喝多了,忘记了博弈论的教导:领先的时候要采取让对手先行的保守策略。这位博弈论的高才生,就这样输在原来处干第二位并且曾经求和建议分享奖励的女士手下(参见本书第一章)。
  人生是一个永不停息的决策过程。从事什么样的工作,怎样打理一桩生意,该和谁结婚,怎样将孩子抚养成人,要不要竞争总裁的位置,都是这类决策的例子。你不是在一个真空的世界里做决定,相反,你身边全是和你一样的决策制定者。虽然冲突的成分很多,但是合作的因素也不少。本书将帮助你学会策略地思考,在人生博弈中扩大胜面。
  本书以讲故事取胜。它的学术根源,是迪克西特教授在普林斯顿大学公共与国际事务学院开设的“策略博弈”课程。简而言之:这是关于了解对手打算如何战胜你,然后你战而胜之的艺术。怎样打赢一场网球,少数如何战胜多数,为什么要“喜爱”你最讨厌的对手等等,都在讨论之列。
  这是一门新兴的策略科学,由一些简单的基本原理组成。不同背景和行业的读者掌握了这些原理,运筹帷幄取得胜利的本领就会上升一个层次。
  “当代世界学术名著”出版说明
  中华民族历来有海纳百川的宽阔胸怀,她在创造灿烂文明的同时,不断吸纳整个人类文明的精华,滋养、壮大和发展自己。当前,全球化使得人类文明之间的相互交流和影响进一步加强,互动效应更为明显。以世界眼光和开放的视野,引介世界各国的优秀哲学社会科学的前沿成果,服务于我国的社会主义现代化建设,服务于我国的科教兴国战略,是新中国出版的优良传统,也是中国当代出版工作者的重要使命。
  我社历来注重对国外哲学社会科学成果的译介工作,所出版的“经济科学译丛”、“工商管理经典译丛”等系列译丛受到社会广泛欢迎。这些译丛多侧重于西方经典性教材,本套丛书则旨在译国外当代学术名著。所谓“当代”,我们一般指近几十年发表的著作;所谓“名著”,是指这些著作在该领域产生巨大影响并被各类文献反复引用,成为研究者的必读著作。这套丛书拟按学科划分为若干个子系列,经过不断的筛选和积累,将成为当代的“汉译世界学术名著丛书”,成为读书人的精神殿堂。
  由于所选著作距今时日较短,未经历史的充分洗炼,加之判断标准的见仁见智,以及我们选择眼光的局限,这项工作肯定难以尽如人意。我们期待着海内外学界积极参与,并对我们的工作提出宝贵的意见和建议。我们深信,经过学界同仁和出版者的共同努力,这套丛书必将日臻完善。
  中国人民大学出版社2002 年6 月
  “经济学系列”策划人语
  经济学到了20 世纪才真正进入一个群星璀璨的时代。在20
  世纪,经济学第一次有了一个相对完整的体系。这个体系包容了微观经济学和宏观经济学这两个主要的领域。经济学家们在这两个主要的领域不断地深耕密植,使得经济学的分析方法日益精细完美。经济学家们还在微观和宏观这两个主干之上发展出了许多经济学的分支,比如国际经济学、公共财政、劳动经济学等等。体系的确立奠定了经济学的范式,细致的分工带来了专业化的收益。这正是经济学能够以加速度迅猛发展的原因。
  走进经济学的神殿,人们不禁生出高山仰止的感慨。年轻的学子顿时会感到英雄气短,在这个美仑美奂的殿堂里做一名工匠,付出自己一生的辛勤努力,哪怕只是为了完成窗棂上的雕花都是值得的。
  然而,21
  世纪悄然降临。经济学工匠向窗外望去,发现在更高的山冈上,已经矗立起一座更加富丽堂皇的神殿的脚手架。我们的选择在于:是继续在20
  世纪的经济学殿堂里雕梁画栋,还是到21 世纪经济学的工地上添砖加瓦。
  斯蒂格利茨教授,这位21 世纪的首位诺贝尔经济学奖得主曾经发表过一篇文章,题为《经济学的又一个世纪》。在这篇文章中他谈到,20
  世纪的经济学患了“精神分裂症”,即微观经济学和宏观经济学的脱节,这种脱节既表现为研究方法上的难以沟通,又反映出二者在意识形态上的分歧和时立。21
  世纪将是经济学分久必合的时代。一方面,宏观经济学正在寻找微观基础;另一方面,微观经济学也正在试图从微观个体的行为推演出总量上的含义。这背后的意识形态的风气转变也值得我们注意。斯蒂格利茨教授曾经讲到,以下两种主张都无法正确估计市场经济的长期活力:一种是凯恩斯式的认为资本主义正在没落的悲观思想;另一种是里根经济学的社会达尔文主义,表达了对资本主义的盲目乐观。我们已经接近一种处于两者之间的哲学,它将为我们的时代指引方向。
  21 世纪的经济学将从纸上谈兵转变为研究真实世界中的现象。炉火纯青的分析方法和对现实世界的敏锐感觉将成为经济学研究的核心所在。
  “当代世界学术名著·经济学系列”所翻译的主要是处在20 世纪和21
  世纪之交的经济学著作。这些著作在学术的演进过程中起到的更多是传承的作用。它们是20 世纪经济学的集大成者,也是21
  世纪经济学的开路先锋。这些著作的作者大多有一个共同的特征。他们不仅是当代最优秀的经济学家,而且是最好的导师。他们善于传授知识,善于开拓新的前沿,更善于指引遥远的旷野中的方向。如果不惮“以偏概全”的指责,我们可以大致举出21
  世纪经济学的若干演进方向:博弈论将几乎全面地改写经济学;宏观经济学将日益动态化;政治经济分析尝试用经济学的逻辑对复杂的政策决策过程有一个清晰的把握;经济学的各个分支将“枝枝相覆盖,叶叶相交通”;平等、道德等伦理学的讨论也将重新进入经济学。
  介绍这些著作并不仅仅是为了追踪国外经济学的前沿。追赶者易于蜕变成追随者,盲目的追随易于失去自己的方向。经济学是济世之学,它必将回归于现实。重大现实问题的研究更有可能做出突破性的创新,坚持终极关怀的学者更有可能成长为一代宗师。中国正在全方位地融入世界经济,中国的国内经济发展也到了关键的阶段。我们推出这套丛书,并不是出于赶超的豪言或是追星的时髦。我们的立足点是,在世纪之交,经济学的发展也正处于一个关键的阶段,这个阶段的思想最为活跃,最为开放。这恰恰契合了中国的当前境况。我们借鉴的不仅仅是别人已经成型的理论,我们想要从中体会的正是这种思想的活跃和开放。
  这套丛书的出版是一项长期的工作,中国社会科学院、中国人民大学、北京大学、南京大学、南开大学、复旦大学、中山大学以及留学海外的许多专家、学者参与了这套译丛的推荐、翻译工作。这套译丛的选题是开放式的,我们真诚地欢迎经济学界的专家、学者在关注这套丛书的同时,能给予它更多的支持,把优秀的经济学学术著作推荐给我们。
  中文版前言现在距离我们完成《策略思维》之日已有十几年时间。在这段时间里,博弈论达到全盛时期。当初我们动笔的时候,知道博弈论的人还寥寥无几,懂得将博弈论用于实践者更是屈指可数;有关博弈论的著作充满数学公式,令人望而生畏,其应用也仅限于“奇爱博士”(
  Dr.Strangelove
  ,同名电影主角)这样的防务分析员。不过,从那时起,博弈论的贡献渐渐获得世人承认,先是约翰·纳什获得诺贝尔奖,然后有了一部获得奥斯卡奖的电影。如今,在绝大多数大学,博弈论成了热门课程,在不少商学院甚至被规定为一门必修课。博弈论在实践中也得到了广泛的应用。从拍卖金额高达几十亿美元的用于承载手机信号的电波波段,到为麦肯锡这样的顶尖咨询公司提供策略咨询服务,再到预测谁会在真人秀《幸存者》中被淘汰出局,博弈论可说无处不在。到目前为止,本书已经售出25
  万多册。
  策略思维在中国有着很深的渊源。人人都知道孙武和他的《孙子兵法》*,其实在中国还有很多不那么知名的策略作者和思想家。译者王尔山在翻译本书的时候,就想到了中国历史和传说中的几个故事,意识到这些故事包含博弈论的基本要素,可以用于解释这个理论。现在,她正在考虑撰写一部以这些历史故事为基础阐述博弈论的著作;我们期待早日看到这部作品。
  我们希望各位可以从本书得到一些收获。一是改变观点。我们希望你可以从别人的角度观察这个世界。正确做到这一点对于确定你自己的最佳策略是必不可少的。不过,从别人的角度观察这个世界做起来并不容易。我们总喜欢把别人看做和我们一样的人,而不是完全不同的类型。博弈论要求你设身处地,仔细分析自己若处于对方的境地,思路会有什么变化,哪怕你完全不能同意他们的见解。说不定,在你读完本书的时候,你会发现自己对美国人的见解有了进一步的认识。
  二是向前展望,倒后推理。这里说的是做出一系列行动和反行动,预计沿着你现在前进的道路走下去,最后你会到达哪里。我们听说,有一句成语的大致意思是“如果你留在目前的道路上,这就是你最后的归宿”。“向前展望,倒后推理”的法则却告诉你,应该首先确定自己最后希望达到什么目标,然后从这个结果倒后研究,直到找出自己现在应该选择哪条道路,这样才能保证以后可以达到那个目标。
  记住,博弈论说的并不仅仅限于击败对方。这个理论同时解释了建立合作与战而胜之两方面的策略。也许这意味着我们应该将孙武和托尔斯泰结合起来,变成《战争与和平的艺术》。
  最后,我们希望各位可以从阅读本书的过程中得到许多乐趣。我们在写作本书时,感到很有乐趣。
  阿维纳什·迪克西特巴里·奈尔伯夫2002 年5 月21 日*英译名为《战争的艺术》。—译者注
  策略思维是关于了解对手打算如何战胜你,然后战而胜之的艺术。我们每个人都会在工作中和日常生活中用到策略思维。生意人和企业必须借助有效的竞争策略才能生存下去;政治家必须设计竞选策略,使自己得以当选,还要构思立法策略,使自己的主张得以贯彻;橄榄球教练必须制定策略,由球员在场上实施;父母若想教会孩子良好的行为举止,自己至少应该变成业余的策略家(而孩子是职业选手);
  40 年来,超级大国的核策略一直主宰着人类的生死。
  范畴如此广泛的好的策略思维,一直是一门艺术。不过,它的基础是由一些简单的基本原理组成的。这是一门新兴的策略科学。我们写作本书的信念在于,假如来自不同背景和行业的读者了解了这些原理,他们就会变成更出色的策略家。
  关于策略思维的科学称为博弈论。这是一门相对年轻的科学,历史尚不足50
  年。博弈论已经为现实生活当中的策略家们提供了许多有用的启迪。不过,就像其他学科一样,博弈论也渐渐陷人了行话术语和数学符号之中。虽然这些都是必不可少的研究工具,但结果却将理解其基本想法变成少数专业人士的特权。我们试图将其中许多重要思想翻译过来,使聪明的普通读者也能读懂。我们用描述性的例子和案例分析取代了理论证明。我们去掉了全部数学以及大部分术语。对于一切愿意思考一点算术、表格和图表的读者,读懂本书应该不会有什么困难。许多书籍已经尝试过为特定目的找出策略思维的方法。汤姆·谢林(Tom
  schelling )关于核策略的著作,尤其是《冲突策略》 (Strategy of Conflict)和《军备与影响》(Arms
  and Influence),都颇负盛名。实际上,谢林还是将博弈论大量应用到核冲突领域的先行者。迈克尔·波特( Michael
  Porter )的《竞争战略》(Competitive Strategy
  )描绘了商业策略当中的博弈论教训,也同样有名。史蒂文·布拉姆斯(Steven Brams) 也写过几本书,最有名的当数《博弈论与政治》
  (Game Theory and Politics )。
  我们在本书中并未将整个博弈思想局限于任何一个特定场景;相反,我们用了许多不同的例子说明每一个基本原理。这么一来,具有不同背景的读者总能从中看到一些令人感到亲切的案例。他们还会看到同样的原理是如何适用于相对陌生的情况的;我们希望这样做能使他们用一种新的眼光看待许多新闻或者历史事件。我们还从大多数美国读者共有的经验当中提取例子,比如来自文学、电影和体育的生动案例。严肃的科学家可能觉得这会使策略学问变得琐碎,不过,我们相信,来自电影和体育的熟悉的例子是一个非常有效的工具,有助于传达重要的博弈概念。
  就像托尔金(Tolkien)的《指环王》(Lord of the
  Rings)一样,我们这本书也是以讲故事取胜的。它的“古代起源”是阿维纳什·迪克西特在普林斯顿的伍德罗·威尔逊公共与国际事务学院开设和讲授的一门关于策略博弈的课程。巴里·奈尔伯夫后来也在耶鲁大学的政治科学系以及耶鲁的组织与管理学院(简称SOM)教过这门课程和另一门类似的课程。有许多学生对这些课程表现出很大的热情,贡献了许多想法,我们深表谢意。尤其需要提到的名字包括安妮·凯斯(Anne
  Case )、乔纳森·弗莱明(Jonthan Flemming)、希瑟·哈泽德(Heather Hazard
  )、丹尼·罗德里克(Dani Rodrik )和乔纳森·希姆索尼(Jonthan Shimshoni)。和野崇(Takashi
  Kanno)与岛津泳一(Yuichi Shimshoni)
  承担了将我们的论述和概念译为日语的工作,而在这个翻译过程中,他们也使英文版本变得更完善。
  写作一本更接近大众阅读层面而非教科书的想法来自密歇根大学的哈尔·瓦里安(Hal
  Varian)。他还在初稿阶段就给我们提供了许多有用的想法和评价。W.W.诺顿公司的德雷克·迈克费利(Drake McFeely)
  是一个严格细致的编辑,非常了不起,很有眼光。正是他做了非同寻常的工作,才使我们的学术论文成为生动有趣的故事。假如本书现在仍然留有教案的痕迹,那一定是因为我们没有全盘接受他的建议。
  许多同事和朋友都认真阅读了本书早期的草稿,向我们提出了大量详细而出色的改进建议。我们要特别感谢戴维·奥斯汀-史密斯(David
  Ansten-Smith ,罗切斯特大学)、艾伦·布林德(Alan Blinder ,普林斯顿大学)、塞思·马斯特斯(Seth
  Masters , S.Bernstein公司)、卡尔·夏皮罗(Carl Shapiro ,普林斯顿大学)、路易斯·泰勒(Louis
  Taylor , MITRE 公司)、托马斯·特伦戴尔(Thomas Trendell ,
  ATT-Paradyne公司)、特里·沃恩(Teriy Vaughn ,麻省理工学院出版社)以及罗伯特·威利格(Robert
  willig ,普林斯顿大学)。斯泰西·曼德尔鲍姆(Staccy Mandelbaum)和劳拉·康·沃德(Laura Kang
  ward)作为手稿编辑,对我们的错漏之处非常宽容。各位每次阅读的时候,假如找不出一个错误,就该感谢她们的功劳。
  我们还要感谢那些帮助我们确定本书书名的人。哈尔·瓦里安从一开始就建议我们用“策略思维”的书名。耶鲁SOM的学生们给我们提供了更多选择。我们比较中意的书名包括德博拉·哈尔彭(Deborah
  Halpern)的“超越球场”以及威廉·巴恩斯(William Barnes )主笔的广告语:“策略思维——上阵时千万别忘了它”。①
  阿维纳什·迪克西特
  巴里·奈尔伯夫
  1990 年10月
  ① 当然还有其他一些相当有意思的提议,比如“策略与你”。
  序言
  什么是策略行为
  人们在社会当中应该怎样举止行事?1我们将要给出的答案与道德或礼节无关。我们也不打算与哲学家、传道者或埃米莉·波斯特“*(Emily
  Post)一争高下。我们将要讨论的主题虽然没有道德或礼节那么宏大,却同样反映我们每一个人的生活。本书是讲述策略行为的。不管我们是否乐意,我们每一个人其实都是策略家。既然这样,当一个出色的策略家总比当一个蹩脚的策略家更好一点吧。本书的目的就是帮助你改善在开发和运用行之有效的策略方面的技巧。
  *埃米莉·波斯特(1873——1960 ) ,美国礼节风尚专家,他1922 年出版的《礼节》
  一书,其定其权威地位,至今畅销不衰。——译者注工作,即便只是社交生活,也可以看做是一个永无止息的决策过程。从事什么样的工作,怎样打理一宗生意,该和谁结婚,怎样将孩子抚养成人,要不要竞选总统,等等,这些都只不过是重大决策的几个例子。上述情况存在一个共同的条件,即你不是在一个毫无干扰的真空世界里做决定。相反,你的身边全是和你一样主动的决策制定者,他们的选择与你的选择相互作用。这种互动关系将对你的思维和行动产生重要的影响。
  为了解释这一点,我们不妨设想一个伐木工人的决策和一个将军的决策会有什么区别。当伐木工人考虑怎样砍伐树木的时候,他不必担心木头可能跳起来进行反击。他的工作环境是中立的,没有对抗。不过,当一名将军打算消灭敌方军队的时候,他的每一步计划都会引来抵抗,他必须设法克服这种抵抗。和这位将军一样,你必须意识到,你的商业对手、未来伴侣乃至你的孩子都是聪明而有主见的人。虽然他们的目标常常与你的目标发生冲突,但他们当中同样包含你潜在的同盟者。在你做决定的时候,必须将冲突考虑在内,同时注意发挥合作的效力。类似的互动决定就具有策略性,与之相适应的行动计划称为一个策略。本书将帮助你策略地思考,然后将这些想法付诸实践。
  在社会科学当中,研究策略性决策制定过程的分支称为博弈论,原意为游戏理论。这一理论涉及的“游戏”范围很广,从象棋到孩子抚养,从网球到企业兼并,从广告到军备控制,几乎无所不包。正如匈牙利幽默大师乔治·米克斯(George
  Mikes)描述的那样,“许多欧洲人认为生活是一场游戏;英国人认为板球才是一场游戏”。我们则认为双方说得都不错。
  玩这些游戏需要用到许多不同类型的技巧。其中一种是基本技巧,比如打篮球不能缺少的投篮能力,在法律界工作不能缺少的判例知识,乃至打扑克不能缺少的一副不动声色的面孔。策略思维则是另外一种技巧。策略思维从你的基本技巧开始,考虑的是怎样将这些基本技巧最大限度地加以发挥。比如,你了解法律,就要确定为自己的委托人辩护的策略;你了解你的橄榄球队传球或带球突破的本事有多大,而对手防御的能力又有多好,那么,你作为一个教练,就要决定本队到底是应该传球还是带球突破。有些时候,比如几个超级大国处心积虑构想一个大胆的计划,其中包含触发一场核战争的危险,那么,策略思维还意味着懂得适可而止。
  我们的目标在于提高你的策略IQ
  .不过,我们并不打算提供一本策略大全。我们建立了策略思维的概念和原理,假如你想将它们运用于自己面临的某一个具体情况,并且想找出正确的选择,那么你还得再做一些工作。这是因为,在一些关键方面,各种情况的具体条件都不尽相同,我们即便开出用于指导行动的通用处方,到头来很可能只是误导了你,弄巧成拙。无论遇到什么情况,你都要将我们讨论过的好的策略的原理以及其他方面结合起来,一并进行考虑。你必须综合考虑这些因素,而且,假如这些因素相互冲突,还要权衡各种不同因素的分量。我们并不能承诺我们可以解决你遇到的一切问题。实际上,博弈论这门“科学远未达到完美佳境,而策略思维在某些方面看来仍然属于一门艺术。
  我们倒是可以提供一些指导,帮助你将想法变成行动。第1章举了几个例子,解释了在一系列不同的决定下策略问题是怎样出现的。我们指出了一些行之有效的策略以及一些不那么行之有效的策略,甚至提到了一些完全错误的策略。接下来的章节则把这些例子变成一个思考体系或一个思考框架。而在最后几章,我们阐述了几个涉及范围更加广泛的策略的情况,比如边缘政策、投票选举、激励机制以及讨价还价,你将看到有关原理是怎样发挥作用的。
  本书运用的例子既有人们熟悉的、琐碎的或有趣的类型——通常取材于文学作品、体育比赛或者电影,也有令人畏惧的类型,比如核对峙。前者只是一个用来阐述博弈论概念的赏心悦目的工具;至于后者,有些读者一度可能觉得核战争这个话题实在太吓人,不会有理性分析的空间。不过,随着冷战的阴云渐渐消散,大家都相信世界会进人一种更加安定的局面。我们希望,在排除军备竞赛以及古巴导弹危机中的情绪化内容干扰之后,我们可以重新检讨其中的博弈层面包含的策略逻辑。
  这些章节以实例作为重要内容,不过,这些例子主要用于建立或描述正在讨论的某个特定原理,至于具体用到的这个例子,其在现实当中的许多细节都会忽略不计。在每章结尾,我们都提供了一个“案例分析”,这就跟你在商学院上课时可能遇到的情形差不多。每个案例都具备一系列特定条件,由你负责运用该章讨论的原理,确定这一情况下应该采取的正确策略。有些案例没有标准答案,不过,这也正是人生的一大特点。许多时候,并不存在完全正确的解决方案,只能用并不完美的方法去处理遇到的问题。在研究我们的讨论之前,请仔细思考每一个案例,这将比简单地读无数遍课文更有助于理解其中的观点和思路。为了本给大家提供更多的练习机会,我们在最后一章收录了23个案例,大致按照越往后就越难的顺序排列。
  读完本书,我们希望你能成为一位更精明的经理人、谈判者、运动员、政治家或更高明的父母。我们提醒你,一些有助于达成上述目标的好策略,不一定会为你赢得被你击败的对手的敬意。假如你想公平竞争,那就告诉他们,你有这么一本书。
  当代世界学术名著·经济学系列
  策略思维
  第1部分
  第1章10个策略故事
  我们从10个来自生活不同方面的策略故事开始,提供一些怎样才能发挥最佳水准的初步概念。许多读者一定在日常生活中遇到过类似情况,而且,通过一些思考或尝试,犯过一些错误后,也找出了正确的解决方法。对于其他读者,这里的一些答案可能出人意料,不过,让读者感到惊讶不是我们提出这些例子的根本目的。我们的目的是要指出,类似这样的情形普遍存在,而且形成一系列相互关联的问题,系统地思考这些问题可能会让你收到事半功倍的效果。请把这些故事当做主菜之前的开胃菜,它们的作用是增进你的食欲,而不是马上把你撑饱。
  1 .妙手传说
  运动员究竟有没有一朝命中、百发百中的“妙手”这一说?有时候,乍看上去,篮球明星拉里·伯德(Larry
  Bird)、冰球明星韦恩·格雷茨基(Wayne Gretzky)或是足球明星迭戈·马拉多纳(Diego Maradona)
  真的是百发百中,永不落空。体育比赛解说员们看到这种长期存在、永不落空的成功事迹,就会宣称这名运动员具有出神人化的妙手。不过,按照心理学教授托马斯·吉洛维奇(Thomas
  Gilovich)、罗伯特·瓦隆(Robert Vallone)和阿莫斯·特维斯基(Amos
  Tversky)的说法,这其实是对真实情况的一种误解。[l]他们指出,假如你抛硬币抛上足够长的时间,你也会遇到在很长一段时间里全是抛出同一面的情况。这几位心理学家怀疑体育解说员们其实是找不到更有意思的话题,只好从一个漫长的赛季中寻找某种模式,而这些模式跟长时间抛硬币得出的结果其实没有什么两样。因此,他们提出了一个更加严格的测试。比如,在篮球比赛中,他们只看一个运动员投篮命中的数据,据此考察这名运动员下一次出手仍然命中的概率究竟有多大。他们也用同样的方法研究这名运动员在这次出手没有命中却在下一次出手命中的情形。比较命中一次之后再次出手仍然命中的概率与这次没有命中而再次出手命中的概率,假如前者高于后者,那就表明妙手一说不无道理。
  他们选择美国NBA费城76人队(Philadelphia
  76ers)进行测试,结果与妙手一说发生矛盾:一名运动员投篮命中之后,下一次出手就不大可能命中了;假如他在上一次出手没有命中,再出手时反倒更可能命中。就连拥有“得分机器”称号的安德鲁·托尼(Andrew
  Toney)也不例外。这是否意味着,我们谈论的其实是“射频观测器之手”,因为运动员的水准有起有伏,就跟射频观测器的灯光忽明忽暗一样?
  博弈论提出了一个不同的解释。尽管统计数据否定了一朝命中、百发百中之说,却没有驳倒一个“鸿运当头”的运动员很可能在比赛当中通过其他方式热身,渐入佳境。“得分机器”之所以会不同于“妙手”,
  原因在于攻方和守方的策略会相互影响。比如,假设安德鲁·托尼真有那么一只妙手,对手们一定会对他实施围追堵截,从而降低他的投篮命中率。
  事实还不仅如此。当防守一方集中力量对付托尼的时候,他的某个
  队友就无人看管,更有机会投篮得分。换句话说,托尼的妙手大大改善了76人队的团队表现,尽管托尼自己的个人表现可能有所下降。因此,我们也许应该通过考察团队合作连续得分的数据来测试妙手一说。
  许多其他团队项目也有类似情况。比如在一支橄榄球队里,一个出色的助攻后卫将大大改善全队的传球质量,而一个拥有优异的接球才能的运动员则有助于提高全队的攻击力,因为对方被迫将大部分防守资源用于看管这些明星。在1986年的世界杯足球决赛上,阿根廷队的超级明星迭戈·马拉多纳自己一个球也没有进,不过,全靠他从一群联邦德国后卫当中把球传出来,阿根廷队两次射门得分。明星的价值不能单凭他的得分表现来衡量;他对其他队友的贡献更为至关重要,而助攻数据有助于衡量这种贡献的大小。冰球项目排列个人表现名次的时候,助攻次数和射门得分次数占有同等分量。
  一个运动员甚至可能通过一只妙手带动另一只手热身,进而变成妙手,帮助他自己提高个人表现水准。比如波士顿凯尔特人队的明星拉里·伯德,他喜欢用右手投篮,虽然他的左手投篮技术同样远在大多数人之上。防守一方知道伯德通常用右手投篮,自然会不惜集中一切兵力防他的右手。不过,他们的这一计划不能完全奏效,因为伯德的左手投篮技术亦实在了得,他们不敢大意,非得同样派人看守不可。
  假如伯德在两个赛季之间苦练左手投篮技术,又会怎样呢?防守一方的反应就是增派兵力阻止他用左手投篮,结果却让他更容易用右手投篮得分。左手投篮得分提高了,右手投篮得分也会提高。在这个案例当中,左手不仅知道右手在做什么,而且帮了大忙。
  再进一步,我们会在第7章说明左手越厉害,用到的机会反而可能越少。许多读者大约在打网球的时候已经遇到过类似的情况。假如你的反手不如正手,你的对手渐渐就会看出这一点,进而专攻你的反手。最后,多亏了这样频繁的反手练习,你的反手技术大有改善。等到你的正反手技术几乎不分上下,你的对手再也不能靠攻击你的弱势反手占便宜时,他们攻击你的正手和反手的机会渐渐持平,而这可能就是你通过改善自己的反手技术得到的真正好处。
  2 .领先还是不领先
  1983 年美洲杯帆船赛决赛前4轮结束之后,丹尼斯·康纳(Dennis 10
  Conner)的“自由号”在这项共有7轮比赛的重要赛事当中暂时以3胜1负的成绩排在首位。那天早上,第五轮比赛即将开始,“整箱整箱的香槟送到‘自由号’的甲板。而在他们的观礼船上,船员们的妻子全都穿着美国国旗红、白、蓝三色的背心和短裤,迫不及待要在她们的丈夫夺取美国人失落132年之久的奖杯之后参加合影。[2]可惜事与愿违。
  比赛一开始,由于“澳大利亚二号”抢在发令枪响之前起步,不得不退回到起点线后再次起步,这使“自由号”获得了37秒的优势。澳大利亚队的船长约翰·伯特兰(John
  Bertrand)打算转到赛道左边,满心希望风向发生变化,可以帮助他们赶上去。丹尼斯·康纳则决定将“自由号”留在赛道右边。这一回,伯特兰大胆押宝押对了,因为风向果然按照澳大利亚人的心愿偏转了5度,“澳大利亚二号”以1分47秒的巨大优势赢得这轮比赛。人们纷纷批评康纳,说他策略失败,没能跟随澳大利亚队调整航向。再赛两轮之后,“澳大利亚二号”赢得了决赛桂冠。
  帆船比赛给我们提供了一个很好的机会,观察“跟随领头羊”策略的一个很有意思的反例。成绩领先的帆船,通常都会照搬尾随船只的策略。一旦遇到尾随的船只改变航向,那么成绩领先的船只也会照做不误。实际上,即便成绩尾随的船只采用一种显然非常低劣的策略时,成绩领先的船只也会照样模仿。为什么?因为帆船比赛与在舞厅里跳舞不同,在这里,成绩接近是没有用的,只有最后胜出才有意义。假如你成绩领先了,那么,维持领先地位的最可靠的办法就是看见别人怎么做,你就跟着怎么做。①①
  这一策略在竞争者超过两个之后就不再适用了。即便只有三条船只,假如一条船偏向右边,一条船偏向左边,成绩领先者就得择其一,确定自己要跟哪一条船。
  股市分析员和经济预测员也会受这种模仿策略的感染。业绩领先的预测员总是想方设法随大流,制造出一个跟其他人差不多的预测结果。这么一来,大家就不容易改变对这些预测员的能力的看法。另一方面,初出茅庐者则会采取一种冒险的策略:他们喜欢预言市场会出现繁荣或崩溃。通常他们都会说错,以后再也没人听信他们,不过,偶尔也会有人做出正确的预测,一夜成名,跻身名家行列。
  产业和技术竞争提供了进一步的证据。在个人电脑市场,IBM的创新能力远不如将标准化的技术批量生产、推向大众市场的本事那么闻名。新概念更多是来自苹果电脑、太阳电脑和其他新近创立的公司。冒险性的创新是这些公司脱颖而出夺取市场份额的最佳策略,大约也是惟一途径。这一点不仅在高科技产品领域成立。宝洁作为尿布行业的IBM,也会模仿金佰利(Kimberly
  Clark)发明的可再贴尿布粘合带,以再度夺回市场统治地位。
  跟在别人后面第二个出手有两种办法。一是一旦看出别人的策略,你立即模仿,好比帆船比赛的情形;二是再等一等,直到这个策略被证明成功或者失败之后再说,好比电脑产业的情形。而在商界,等得越久越有利,这是因为,商界与体育比赛不同,这里的竞争通常不会出现赢者通吃的局面。结果是,市场上的领头羊们,只有当它们对新生企业选择的航向同样充满信心时,才会跟随这些企业的步伐。
  3 .直奔牢房
  有这么一个笑话,说的是在斯大林时期的苏联,有一位乐队指挥坐火车前往下一个演出地点,正在车上翻看当晚将要指挥演奏的作品的乐谱。两名克格勃军官看见他在读着什么,错把乐谱当成某种密码,立即将他作为间谍逮捕了。他争辩说那只是柴可夫斯基的小提琴协奏曲,却无济于事。在他被投入牢房的第二天,审问者自鸣得意地走进来,说:“我看你最好还是老实招了吧。我们已经抓住你的朋友柴可夫斯基了,他这会儿正向我们招供呢。”
  这个笑话成了介绍囚徒困境的开场白,而囚徒困境可能是最广为人知的博弈。现在我们就来看看它如何导出符合逻辑的结果:假设克格勃真的逮捕了某人,而此人的惟一罪名就是取了“柴可夫斯基”这么一个名字,而且克格勃将乐队指挥和他分开进行审问。如果这两名无辜者否认克格勃指控的罪名,那么,他们将分别被判处3年徒刑。①
  如果乐队指挥昧着良心承认罪名,其中还牵涉到那位素不相识的所谓“同谋”,
  柴可夫斯基却仍然否认罪名,那么,乐队指挥可以在1年之后获得自由(以及克格勃的赞赏之情),而柴可夫斯基则会因拒不认罪而遭到严厉惩罚,被判处25年徒刑。当然了,假如乐队指挥与柴可夫斯基调换一下,乐队指挥拒不认罪,柴可夫斯基不但屈从认罪,还把他供了出来,那①
  还有一个笑话讲的是古拉格(Gulag)的老囚犯问新来的囚犯:“你的刑期有多长?”回答是“10
  年。”“你究竟做了什么啦?”“什么也没做。”“不可能,一定搞错了。什么也没做的刑期只有3年而已。”
  么,两人的下场也会发生相应的变化。假如两人同时认罪,那么,他们都将被判处这一罪名的标准刑罚——10年徒刑。①现在设想乐队指挥的思路。他知道柴可夫斯基要么招供,要么拒不认罪。假如柴可夫斯基招供,乐队指挥若是拒不认罪或招供,与之对应,他会被判处25年或10年徒刑,相比之下,对他来说招供的下场显然略胜一筹。假如柴可夫斯基拒不认罪,乐队指挥若是同样拒不认罪或招供,与之对应,他会被判处3年或1年徒刑,相比之下,对他来说招供的下场仍然略胜一筹。由此可见,招供显然是乐队指挥的最佳做法。
  而在捷尔任斯基广场(Dzerzhinsky
  Square)另一个单人牢房里,柴可夫斯基也在做同样的盘算,得出同样的结论。当然了,结果是两个人同时招供。之后,当他们在古拉格群岛(Gulag
  Archipelago)流放地见面,说出各自的经历后,比较一番,就会发现,他们其实吃亏了。因为,假如他们两人都拒不认罪,他们两人的刑期都会大大缩短,早日重获自由。
  假如他们在接受审问之前有机会见面好好谈清楚,那该有多好,他们一定会同意拒不认罪。不过,接下来他们很快就会意识到,无论如何,那样一个协定也不见得管用。一旦他们被分开,审问开始,每个人内心深处那种企图通过出卖别人而换取一个更好判决的想法就会变得非常强烈。这么一来,他们还是逃脱不了最终在古拉格相遇的命运,大概还会在那里好好算一账,看看谁欠谁更多。这两个人究竟有没有可能取得足够的相互信任,从而达成双方都希望看到的结果呢?
  许多人,许多企业,乃至许多国家,都曾经吃过囚徒困境之苦。看看生死枚关的核军备控制问题吧。每个超级大国最希望看到的结果都是另一个超级大国销毁核武器,而它自己则继续保留核武器,以防万一。最糟糕的结果莫过于自己销毁核武器,而别人却依旧全副武装。因此,无论另一方怎么做,自己一方仍然倾向于保留核武器。不过,它们双方也有可能一致认为,双方同时销毁核武器的结果会比一方销毁而另一方不销毁的结果更好。现在的问题在于决策之间的相互依赖性:双方一致希望看到的结果出现在各方都选择各自比较糟糕的策略的时候。假如各方都有很明确的想法,打算突破有关协定,私底下发展自己的核武器,①
  实际刑期是3653天,因为“额外的3天是闰年多出来的时间”(A.Solzhenitsyn,One Day in the Life of
  Ivan Denisovitch, 1962)。
  还有没有可能达成各方一致希望看到的结果呢?在这种情况下,只有其中一方来一个思维方式的根本改变,才能推动世界回到裁减核军备的轨道上去。
  本着为自己的舒适生活、安全乃至生命着想,我们都有必要了解如何走出囚徒困境。在第4章,我们还会探讨一些类似的方法,看看这些方法什么时候可能有效,又是怎样发挥作用的。
  囚徒困境的故事还体现了一个普遍的现象:大多数经济的、政治的或社会的博弈游戏都跟类似橄榄球或扑克这样的博弈游戏不同。橄榄球和扑克是零和博弈:一个人的得就是另一个人的失。但在囚徒困境里,有可能出现共同利益,也有可能出现利益冲突;不招供的结果对两个囚徒都是有利的,而不是相反。与此相仿,在劳资双方的讨价还价中,虽然存在利益冲突,一方希望降低工资,而另一方要求提高工资,不过,大家都知道,假如谈判破裂而导致罢工,双方都将遭受更大的损失。任何一个关于博弈的有用的分析,都应该考虑到怎样处理冲突与利益同时存在的情形。我们通常将博弈游戏的参加者称为“对立者”,不过,你也要记住,有时候,策略可能将原本毫不相干的人变成一条绳上相互依存的两只蚂蚱。
  4 .我将坚持到底
  天主教会要求马丁·路德(Martin
  Luther)公开悔过,收回他抨击教皇及其顾问班子的主张。他拒绝公开认错:“我不会收回任何一点主张,因为违背良心做事既不正确,也不安全。”而且他也不打算寻求妥协:“我将坚持到底,我不能屈服。”[3]路德拒不让步的态度是以他自己的立场的神学性为基础的。在确定什么才是正确的问题上,根本没有妥协的余地。长期来看,他的坚定立场产生了深远的影响;他的抨击最后引发了新教改革运动,从根本上改变了中世纪的天主教会。①与此相仿,查尔斯·戴高乐(Charles
  de Gaulle)也借助拒不妥协的力量,在国际关系竞技场上成为一个强有力的参与者。正如他的传记作者唐·库克(Don
  Cook)描述的那样,“(戴高乐)单凭自己的正直、智慧、人格和使命感就能创造力量”[4].不过,说到底,他的力量是“拒不妥协的力量”。第二次世界大战期间,他作为从一个战败且被占领的国家逃亡出来的自封的领导人,在与罗斯福(Roosevelt)和邱吉尔(Churchill)的谈判中仍然坚守着自己的立场。20世纪60年代,他作为总统说出的“不!”迫使欧洲经济共同体多次按照法国的意愿修改决策。
  ①
  路德的声望远远超出了教会的范畴,还延伸到“铁幕”的另一边。比如,民主德国自己生产的小汽车瓦特伯格(Wartburg)就被开玩笑似的称为“路德”;很显然,意思是说这种小汽车会变得跟路德一样死硬,拒不动弹。
  在讨价还价当中,他的拒不妥协态度究竟是怎样赋予他力量的呢?一旦戴高乐下定决心坚守一个立场,其他各方只有两个选择:要么接受,要么放弃。比如,他曾经单方面宣布要将英国拒于欧共体之外,一次是1963
  年,一次是1968年;其他国家不得不从接受戴高乐的否决票和分裂欧共体两条出路当中做出选择。当然,戴高乐非常谨慎地衡量过自己的立场,以确保这一立场会被接受。不过,他这么做往往使法国独占了大部分战利品,很不公平。戴高乐的拒不妥协剥夺了另一方重新考虑整个局面、提出一个可被接受的相反建议的机会。
  在实践中,“坚持到底,拒不妥协”说起来容易做起来难,理由有二。第一个理由在于,讨价还价通常会将今天谈判桌上的议题以外的事项牵扯进来。大家知道你一直以来都是贪得无厌的,因此以后不大愿意跟你进行谈判。又或者,下一次他们可能采取一种更加坚定的态度,力求挽回他们认为自己将要输掉的东西。在个人层面上,一次不公平的胜利很可能破坏商业关系,甚至破坏人际关系。实际上,传记作者戴维·舍恩布伦(David
  Schoenribrun)这样批评戴高乐的盲目的爱国主义:“在人际关系当中,不愿给予爱的人不会得到爱;不愿做别人朋友的人到头来会一个朋友也没有。戴高乐拒绝建立友谊,最后受伤的还是法国。”[5]一个短期妥协可能从长期来看会是一个更好的策略。
  第二个理由在于达到必要程度的拒不妥协并不容易。路德和戴高乐通过他们的个性做到了这一点。不过这样做是要付出代价的。一种顽固死硬的个性可不是你想有就有,想改变就能改变的。尽管有些时候顽固死硬的个性可能拖垮一个对立者,迫使他做出让步,但同样可能使小损失变成大灾难。
  费迪南德·德雷赛布(Ferdinand de
  Lesseps)是一个能力中等的工程师,具有非同寻常的远见和决心。他由于在外人看来几乎不可能的情况下建成了苏伊士运河而名噪一时。他并不认同不可能的说法,因此完成了这一伟业。后来,他照搬同样的思路,试图建设巴拿马运河,结果演变成一场大灾难。①
  尽管尼罗河的沙子让他备感得心应手,热带瘴气却打了他一个措手不及。德雷赛布的问题在于他顽固死硬的个性不允许他承认失败,哪怕战役早已输掉。
  我们怎样才能做到有选择的顽固死硬呢?虽然我们没有一个理想的解决方案,却有几个办法可以帮助达成约定,并且维持下去;这是第6章将要谈到的内容。
  5 .给猫拴个铃挡
  童话故事里有一个给猫拴铃挡的故事,大意是这样:老鼠们意识到,假如可以在猫脖子上拴一个铃挡,那么,它们的小命就会大有保障。问题在于,谁会愿意冒赔掉小命的风险给猫拴上铃档呢?
  这个问题同样摆在老鼠和人类面前。占据支配地位的党派或独裁暴君怎样才能通过规模相对较小的军队长期控制数目很大的一个人群呢?整架飞机的众多乘客为什么只要出现一个持枪劫机者就会显得无计可施,束手就擒?在这两个例子里,只要大多数人同时采取行动,就很容易取得成功。不过,统一行动少不了沟通与合作,偏偏沟通与合作在这个时候变得非常困难,而压迫者由于深知群众的力量有多大,还会采取特殊的措施,阻挠他们进行沟通与合作。一旦人们不得不单独行动,希望聚沙成塔,集腋成裘,问题就出来了:“谁该第一个采取行动?”担当这个任务的领头人意味着要付出重大代价,甚至可能付出生命。他得到的回报则会是死后的光荣或受人感激。确实有人在想到责任或荣誉的时候会感到热血沸腾,挺身而出,但大多数人还是认为这么做的代价超出了得益。
  在苏共第二十次代表大会上,赫鲁晓夫首次谴责斯大林的大清洗运动。他那充满戏剧性的讲话刚刚结束,听众里就有人大叫起来,质问赫鲁晓夫自己那个时候又在做什么。赫鲁晓夫的反应是请提问者站起来,报出自己的姓名。听众一片沉默。赫鲁晓夫答道:“当时我也是这么做的。”
  从某种意义上讲,我们以前都见过这样的例子。这只不过是涉及超过两个人的囚徒困境;你也可以把它称为“人质困境”。现在我们要用这个困境阐述一个不同的观点,确切地说,就是惩罚经常压倒回报而处于上风。独裁者可以通过向大众提供物质乃至精神安慰保持局势稳定,不过,这个做法可能需要付出高昂代价。建立在人质困境之上的压迫和恐吓可能是一种代价小得多的替代选择。
  ①
  苏伊士运河是一条位于海平面的通道。由于土地本来已经较低,又是沙漠,挖掘起来相对容易许多。巴拿马的海拔要高得多,沿途分布着许多湖泊和茂密的原始森林。德雷赛布打算一直挖到海平面高度的计划落空了。又过了很久,美国陆军工程兵采取一种完全不同的思路,建起一系列船闸,充分利用沿途的湖泊,最终取得成功。
  这一原理有很多例子。在一个大型出租车队里,汽车经常是由调度员派给司机的。车队里既有好车,也有年久失修的老爷车。调度员可以利用他的调度权向每个司机收取一点贿赂。谁若是拒绝行贿,就一定会得到一部老爷车,而那些愿意合作的司机就会“抽到”上上好签。①
  这么一来,调度员是发达了,但司机们作为一个群体,面对的还是他们就算不贿赂调度员也能得到的同样一些汽车。假如司机们联合起来,也许可以结束这种被迫行贿的日子,间题在于怎样才能组织起来采取行动。问题的关键不是调度员能从行贿者那里得到多少好处,而是他可以严厉惩罚那些不肯行贿的人。
  将租户从实行房租控制的公寓中赶出去是另外一个类似的例子。假如某人在纽约买了这么一幢房子,他有权赶走一个租户,这样自己就能住进去。不过,这个规定最后却变成了赶走全部租户的权利。一个新房东可以对住在1A房间的租户说:“我有权住在自己的房子里。因此,我打算把你赶走,搬进你的房间。不过,假如你肯合作,自愿离开,我会给你5000美元作为报答。”对于一幢实行房租控制的房子的价格而言,这个数目只是九牛一毛(虽然这笔钱确实可以在纽约买一堆地铁票)。租户面临两个选择,一是拿着5000美元走人,二是什么也得不到,还是要走人,当然他选择前者。接下来,房东向1B1
  的租户说同样的话,直到所有租户都搬家走人。
  汽车制造业工人工会在跟汽车制造商一个接一个进行谈判的时候也占有类似的优势。单是一场针对福特汽车公司的罢工就会使福特处于非常不利的地位,因为通用汽车公司和克莱斯勒公司继续对工会采取合作态度,因此,福特很有可能迅速采纳对工会有利的条件,达成和解。这么一场罢工在工会这边看来代价也是较小的,毕竟只有1/3
  的工会成员失去工作。赢得福特一役之后,工会转而会跟通用谈判,接着是克莱斯勒,引用前面各次战役的胜利作为先例,进一步壮大自己的声威。日本工会则另有一套做法,因为日本工会是由公司组织的,在公司里占有很大的利润份额。假如丰田的工会罢工,其成员的薪水就会随着丰田的利润下跌而下跌,他们以前的努力什么也得不到。
  ①
  哪怕大家都交钱,一些司机最后还是会分配到一辆老爷车。不过,假如老爷车是随机分配的,也就不会出现哪个司机比较容易得到老爷车的情况。相反,带头拒绝交钱的司机通常都会得到老爷车。
  我们倒不是说上述任何一个或所有例子都是好的结局或理想的政策。在某些情况下,可能引起强烈的争议,要求避免我们所描述的那种结果。不过,要想使我们所做的努力奏效,我们必须看清问题产生的机制,即“手风琴效应”,每一个折叠都会推动或拉动邻近一个折叠。这一现象虽然一再发生,其实又是可以克服的,我们将在第9章告诉各位怎样可以做到这一点。
  6 .楔子的尖端
  许多国家运用关税、配额以及其他方法限制进口,保护本土产业。这样的政策会抬高价格,损害国内所有使用受保护产品的消费者的利益。经济学家估计,假如美国运用进口配额保护钢铁、纺织或制糖产业,导致大家不得不购买价格更高的产品,换算过来,相当于每保住这些产业一个职位,美国国内其他人就要付出10万美元的代价。[6]为什么会这样,极少数人的得益怎么总是会压倒更大多数人的损失而得到优先考虑呢?
  秘诀在于一次提出一件事情。首先,美国制鞋产业的1万个职位面临着威胁。要想挽救这些职位,国内其他人就得付出10亿美元,或人均付出4美元。谁不愿意付出4美元保住1万个职位呢?即便素昧平生的陌生人也会愿意的吧,尤其是在可以把所谓不择手段的外国人当做现成的诅咒目标之际。接着就轮到服装产业、钢铁产业、汽车产业,等等。没等我们明白过来,我们已经点头同意付出500多亿美元,相当于人均付出200多美元,或每个家庭付出1000多美元。假如我们事前可以看穿整个过程,我们大概会想,这个代价是不是太高了,继而坚持要让上述各个产业的工人自己承担国际贸易带来的风险,就像他们承担任何其他经济风险一样。就个案逐项进行决策可能导致全部结果都与我们的意愿南辕北辙。实际上,一项决定即便获得多数人投票赞成,仍然有可能导致一个在每个人看来都比现状更糟的结果。
  1985-1986年间的所得税改革之所以几乎走向崩溃,原因就在于参议院一开始采取的是对提案逐个解决的思路。在财政委员会第一轮条款讨论会上,财政部提案已被修改到带有太多特别利益条款而变得不堪重负,最后不得不宣告无效。参议员们意识到,他们面对有组织的院外集团的游说活动时简直是“软弱无力”,根本不可能阻止这些游说者谋求特殊待遇。要命的是,这些游说者若是联合起来,最终很可能毁灭这个法案,比干脆不推出任何法案更糟糕。于是,委员会主席、参议员帕克伍德(Packwood)进行了他自己的游说活动:他劝说委员会大多数成员投票反对任何一个针对所得税法案的修正案,哪怕这个修正案特别有利于他们的选民也在所不惜。本次改革终于得以立法通过。不过,已经有人发起了要求增加特殊条款的反击,每次提出一两条要求修正。
  按照同样的思路,逐项否决权使总统可以有选择地否决法案。假如一个法案授权拨款资助学校提供午餐和建造一架新的航天飞机,总统本可以选择两个都否定、只批准其中一个或两个都批准,但是目前却只有两个选择,即两个都否定或者两个都批准。虽然第一反应可能是这将赋予总统更大的权力,控制立法过程,但若是反过来,结果可能是国会将更有选择性地看待有待它通过的法案。①
  逐项否决权虽然一般被认为违反宪法,不过究竟是否如此,还是留给高等法院裁决为好。
  之所以出现这些问题,是因为短视的决策者没能看远一点,他们看不到全局。在所得税改革的例子里,参议院勉强来得及恢复自己的远见;但在保护主义的老问题上,依旧未能取得突破。第2章将会建立一个体系,有助于改善长期策略远见。
  7 .三思而后行
  人们陷入某种境地而发现从此难以脱身的情况实在是太普遍了。比如,一旦你在某个城市找到一份工作,那么,换一个地方重新安置下来的代价就会变得很高;一旦你买了一台电脑,学会了怎样使用其操作系统,那么,学会另一种操作系统,改写你的全部程序,其代价就会变得很高。同样,参加了一家航空公司的里程积分计划的旅行者若想搭乘另①
  哥伦比亚大学教授道格拉斯·霍尔茨-埃金(Douglas
  Holtz-Eakin)研究过州一级逐项否决权的影响。他的结论是看不出在具有逐项否决权的地方,财政支出会有什么区别。我们将在讨论投票策略的第10章对这个问题进行更详细的案例分析。
  一家航空公司的飞机,付出的代价也会更高。还有,当然了,从婚姻围城中逃脱出来的代价也很高。
  问题在于,一旦你作出了类似的承诺,比如接受了工作或结了婚,你的讨价还价地位就会被削弱。公司大可以利用其职员预期的搬家成本高,向他们支付较低薪水或降低加薪幅度。电脑公司可以给新出的可兼容的外围设备标出更高的价码,因为它们知道,它们的消费者不会轻易转向同样是新出的却不兼容的技术。至于航空公司,一旦找到数目庞大的里程积分计划参加者,就不大愿意参与价格战了。夫妻签订的平均分担家务的协议一旦遇到小孩出生,就不得不重新谈判一番。
  能够预见到上述后果的策略家会赶在他们的讨价还价能力仍然存在的时候充分利用,换句话说就是在他们订下契约之前。一般情况是采取预先支付酬劳再签约的形式。潜在的利益谋取者相互竞争会导致同样的结果。比如,公司不得不提供更具吸引力的起薪;电脑制造商不得不为它们生产的中央处理器(CPU)标出足够低的价格;而航空公司的里程积分计划也不得不为登记参加者提供更多的积分奖励以吸引他们。至于结了婚的夫妇,其对各自利益的谋取可能会变成一场两个人玩的博弈游戏。
  同样的深谋远虑也使许多好奇却又理智的人不至于亲身尝试会上瘾的毒品,比如海洛因。汤姆·莱勒(Tom
  Lehrer)写的一首歌这样描述毒品贩子的策略:他给孩子赠送免费样品,因为他实在太了解,今天仍然天真无邪的面孔,明天就会变成他的新客户。
  聪明的孩子也了解这一点,所以拒绝了那些免费样品。
  8 .多管齐下
  现在让我们回到体育世界。在橄榄球比赛里,每一次贴身争抢之前,攻方都会在传球或带球突破之中择其一,而守方则会把赌注押在其中一个选择上,做好准备进行反击。在网球比赛里,发球一方可能选择接球一方的正手或反手,而接球一方则准备在回击的时候选择打对角线或直线。在这两个例子里,每一方都对自己的优点和对方的弱点有所了解。假如他们的选择可以同时考虑到怎样利用对方所有的弱点,而不是仅仅瞄准其中一个弱点,那么,这个选择应该算是上上之策。球员和球迷一样都很明白,必须多管齐下,来些出其不意的奇袭。理由在于,假如你每次都做同样的事情,对方就能集中全部力量最大限度地还击你的单一策略,还击效果也会更好。
  多管齐下并不等于说要按照一个可以预计的模式交替使用你的策略。若是那样的话,你的对手就会通过观察得出一个模式,从而最大限度地利用这个模式还击,其效果几乎跟你使用单一策略一样好。实施多管齐下策略,诀窍在于不可预测性。
  设想一下,假如存在一些人人都知道的公式,用来确定谁将受到美国国税局(IRS)的审计,在你填写报税单的时候,你就会套用这些公式看看自己会不会受到审计。假如预计到你会受到审计,而你又找到一个办法“修改”你的报税单,使其不再符合那些公式以避免被审计,很可能你已经动手这样做了。假如被审计已经无法避免,你大概会选择如实相告。国税局的审计行动若是具有完全可预见性,结果将会把审计目标确定在错误的人群身上。所有那些被审计的人早就预见到自己的命运,早就选择了如实相告,而对于那些逃过审计的人,能够看管他们的就只有他们自己的良心了。假如国税局的审计公式在一定程度上是模糊而笼统的,大家都有那么一点面临审计的风险,人们也就会更加倾向于选择诚实。
  商界也有类似的现象。设想一下剃须刀市场的竞争情况。假设吉列定期举行购物券优惠活动,比如每隔一个月的第一个星期天进行,那么毕克(Bic)可以通过提前一个星期举行购物券优惠活动的方式予以反击。当然,这么一来毕克的路数就会变得具有可预见性,吉列可以照搬毕克的策略,相应将自己的优惠活动提前到毕克前面去。这种做法最终导致刺刀见红的残酷竞争,双方的利润都会下跌。不过,假如双方都采用一种难以预见或者多管齐下的混合策略,那么很可能会一起降低竞争的惨烈程度。
  随机策略的重要性是博弈论早期提出的一个深谋远虑的观点。这个观点本身既简单,又直观,不过,要想在实践当中发挥作用,我们还得做一些细致的设计。比如,对于网球运动员,光是知道应该多管齐下,时而攻击对方的正手,时而攻击对方的反手,这还不够。他还必须知道他应该将30%的时间还是64%的时间用于攻击对方的正手,以及应该怎样根据双方的力量对比做出选择。在第7章我们会介绍一些可以解答上述问题的方法。
  9.别跟笨蛋对等打赌
  在《红男绿女》(Guys and Dolls)一片中,赌棍斯凯·马斯特森(Sky
  Masterson)想起他父亲给他提的这个很有价值的建议:孩子,在你的旅途中,总有一天会遇到有一个家伙走上前来,在你面前拿出一副漂亮的新扑克,连塑料包装纸都没有拆掉的那种;这个家伙打算跟你打一个赌,赌他有办法让梅花J从扑克牌里跳出来,并把苹果汁溅到你的耳朵里。不过,孩子,千万别跟这个家伙打赌,因为就跟你确确实实站在那里一样,最后你确确实实会落得苹果汁溅到耳朵里的下场。
  这个故事的背景是,内森·底特律(Nathan
  Detroit)要跟斯凯·马斯特森打赌,看看明迪糕饼店的苹果酥和奶酪蛋糕哪一样卖得比较好。正好,内森刚刚发现了答案(苹果酥!)。他当然愿意打赌,只要斯凯把赌注押在奶酪蛋糕上。
  这个例子听上去也许有些极端。当然没有人会打这么一个愚蠢的赌。不过,仔细看看芝加哥交易所的期货合同市场吧。假如一个交易者提出要卖给你一份期货合同,那他只会在你损失的情况下得益。这个交易是一宗零和博弈,就跟体育比赛一样,一方的胜利意味着另一方的失败。因此,假如有人愿意卖给你一份期货合同,你绝对不应该买下来。反过来也是如此。
  其中的策略意义在于,其他人的行动向我们提示了他们究竟知道什么,我们应该利用这些信息指导我们自己的行动。当然,我们应该将这些信息连同我们自己有关这个问题的信息综合起来加以利用,运用全部策略机制,尽可能从其他人那里获取整个事情的真相。
  在前面提到的《红男绿女》
  的例子里,存在这一类型的一个简单机制。斯凯应该问一下内森,看他在什么情况下愿意把赌注押在奶酪蛋糕上。假如回答是“无论什么情况都不会”,那么斯凯就能推断答案一定是苹果酥。假如内森回答说他下注在苹果酥和奶酪蛋糕上的可能性一样大,他显然是在隐瞒自己知道的信息,甘愿冒让斯凯在赌博中可能猜中的风险。
  在股票市场、外汇市场和其他金融市场,人们可以像这个例子所描述的那样自行决定应该把赌注押在哪一边。实际上,在一些有组织的交易市场,包括伦敦股票市场,只要你询问一只股票的价格,按照规定,证券商必须在他知道你打算买入还是卖出之前同时告诉你买入价和卖出价。假如缺少这么一个监察机制,证券商就有可能单凭自己掌握的信息赚上一笔,而由于外面的投资者担心受骗上当,很可能最终导致整个市场崩溃。买入价和卖出价并不完全一致;两者之间存在一个价差(bid-ask
  spread)。在流动资金市场,这个差额非常小,意味着无论哪一份买入或卖出的订单,其中包含的信息都是微乎其微的。另一方面,内森·底特律愿意不惜一切代价把赌注押在苹果酥上,坚决不要奶酪蛋糕,他的价差则是无限大。千万当心这样的证券商。
  在这里我们应该补充一点:斯凯没有认真听取他父亲的教诲。一分钟后他就跟内森打赌说内森不知道他的蝴蝶领结是什么颜色。斯凯无论如何赢不了:假如内森知道是什么颜色,他一定愿意打赌,并且取胜;假如他不知道,他一定不愿意打赌,也就不会输。
  10 .博弈论可能危害你的健康
  一天深夜,耶路撒冷举行的一个会议结束之后,两名美国经济学家找了一辆有牌照的出租车,告诉司机应该怎么去他们的酒店。司机几乎立即认出他们是美国观光客,因此拒绝打表,并声称自己热爱美国,许诺会给他们一个低于打表数目的更好的价钱。自然,两人对这样的许诺颇有点将信将疑。在他们表示愿意按照打表数目付钱的前提下,这个陌生的司机为什么还要提出这么一个奇怪的少收一点的许诺呢?他们怎么才能知道自己有没有多付车钱呢?①①
  假如这个司机想要证明他确实打算少收车钱,他完全可以按乘客的要求打表,等到了目的地之后再按打表数字收取80%的车钱。但他没有按乘客的要求打表,这其实已经扭曲了他的真实动机。参看前面提到的斯凯·马斯特森的故事。
  另一方面,此前他们除了答应按照打表数目付钱之外,并没有许诺再向司机支付其他报酬。假如他们打算跟司机讨价还价,而这场谈判又破裂了,那么他们就得另找一辆出租汽车。他们的思路是,一旦他们到达酒店,他们的讨价还价地位将会大大改善。何况,此时此刻再找一辆出租车实在很不容易。
  于是他们坐车出发,顺利到达酒店。司机要求他们支付以色列币2500谢克尔(相当于2.75美元)。谁知道什么样的价钱才是合理的呢?因为在以色列,讨价还价非常普遍,所以他们还价2200
  谢克尔。司机生气了。他嚷嚷着说从那边来到酒店,这点钱根本不够用。他不等对方说话就用自动装置锁死了全部车门,按照原路没命地开车往回走,一路上完全没把交通灯和行人放在心上。两位经济学家是不是被绑架到贝鲁特去了?不是。司机开车回到出发点,非常粗暴地把他们扔出车外,一边大叫:“现在你们自己去看看你们那2200
  谢克尔能走多远吧!"他们又找了一辆出租车。这名司机开始打表,跳到2200谢克尔的时候,他们也回到了酒店。
  毫无疑问,花这么多时间折腾对于两位经济学家来说还值不到300谢克尔。另一方面,这个故事却很有价值。它描述了跟那些没有读过我们这本书的人讨价还价可能存在什么样的危险。更普遍的情况是,我们不能忽略自尊和失去理性这两种要素。有时候,假如总共只不过要多花20美分,更明智的选择可能是到达目的地之后乖乖付钱。①①
  两位亲身参与了这一幕惊险闹剧,并且侥幸活着回来讲这个故事的经济学家分别是耶普大学的约翰·吉纳科普洛斯(John
  Geanakoplos)以及本书作者之一巴里· 奈尔伯夫。
  这个故事还有第二个教训。设想一下,假如两位经济学家是在下车之后再来讨论价钱问题,他们的讨价还价地位该有多大的改善。(当然了,若是租一辆出租车,思路应该与此完全相反。假如你在上车之前告诉司机你要到哪里去,那么,你很有可能眼巴巴看着出租车弃你而去,另找更好的主顾。记住,你最好先上车,然后告诉司机你要到哪里去。)
  11.未来的模样
  前面的例子让我们初步领略了指导策略决策的原理。我们可以借助这些故事的寓意将这些原理进行归纳。
  妙手传说告诉我们,在策略里,就跟在物理学当中一样,“我们所采取的每一个行动,都会引发一个反行动”。我们并非生活在一个真空世界,也不是在一个真空世界里举止行事。因此,我们不可以假定说,虽然我们改变了自己的行为,其他事情还会保持原样。
  戴高乐在谈判桌上获得成功,这表明“只有卡住的轮子才能得到润滑油”①
  .不过,坚持顽固强硬并非总是轻而易举,尤其在你遇到一个同样顽固强硬的对手而不得不表现得比对方更加顽固强硬的时候更难做到。
  ①
  有些读者可能还听过这个成语的另一个版本,说的是“咯吱作响的车轮才能得到润滑油”,意思是一样的,因为卡住的轮子需要更多的润滑油。当然,有时候它会被换掉。
  古拉格的笑话以及给猫拴铃档的故事刻画了需要协调和个人牺牲才能有所收获的事情做起来可能具有的难度。贸易政策的故事则强调了逐个解决问题的危险性。在技术竞赛当中,就跟在帆船比赛中差不多,追踪而来的新公司总是倾向于采用更加具有创新性的策略,而龙头老大们则愿意模仿跟在自己后面的公司。
  网球和税务审计的故事指出,策略的优势在于不可预测性。不可预测的行为可能还有一个好处,就是使人生变得更加有趣了。
  我们当然可以再讲几个故事,借助这些故事再讲一些道理,不过,这不是系统思考策略博弈的最佳方法。从一个不同角度研究同一个主题会更见效。我们每次讲一个原理,比如承诺、合作和多管齐下。在每一个章节,我们还会介绍一些以这个主题为核心的故事,直到说清整个原理为止。然后,读者可以在每章后面所附“案例分析”中运用这个原理。
  12 .案例分析之一:红色算我赢,黑色算你输
  虽然我们两位作者也许永远没有机会担当美洲杯帆船赛的船长,但其中一位却遇到了一个非常接近的情形。巴里毕业的时候,为了庆祝一番,参加了剑桥大学的五月舞会(这是英国版本的大学正式舞会)。庆祝活动的一部分包括在一个赌场下注。每人都得到相当于20美元的筹码,截至舞会结束之时,收获最大的一位将免费获得下一年度舞会的人场券。到了准备最后一轮轮盘赌的时候,纯粹是出于一个令人愉快的巧合,巴里手里已经有了相当于700美元的筹码,独占鳌头,第二位是一名拥有300美元筹码的英国女子。其他参加者实际上已经被淘汰出局。就在最后一次下注之前,那个女子提出分享下一年舞会的人场券,但是巴里拒绝了。他占有那么大的优势,怎么可能满足于得到一半的奖赏呢?
  为了帮助大家更好地理解接下去的策略行动,我们先来简单介绍一下轮盘赌的规则。轮盘赌的输赢取决于轮盘停止转动时小球落在什么地方。典型情况是,轮盘上刻有从0到36的37个格子。假如小球落在0处,就算庄家赢了。玩轮盘赌最可靠的玩法就是赌小球落在偶数还是奇数格子(分别用黑色和红色表示)。这种玩法的赔率是一赔一,比如一美元赌注变成两美元,不过取胜的机会只有18/37
  .在这种情况下,即便那名英国女子把全部筹码押上,也不可能稳操胜券;因此,她被迫选择一种风险更大的玩法。她把全部筹码押在小球落在3的倍数上。这种玩法的赔率是二赔一(假如她赢了,她的300美元就会变成900美元),
  但取胜的机会只有12/37 .现在,那名女子把她的筹码摆上桌面,表示她已经下注,不能反悔。那么,巴里应该怎么办?
  案例讨论巴里应该模仿那名女子的做法,同样把300美元筹码押在小球落在3的倍数上。这么做可以确保他领先对方400美元,最终赢得那张入场券:假如他们都输了这一轮,巴里将以400:0取胜;假如他们都赢了,巴里将以1300:900
  取胜。那名女子根本没有其他选择。即使她不赌这一轮,她还是会输,因为巴里会和她一样退出这一轮,照样取胜。①她的惟一希望在于巴里先赌。假如巴里先在黑色下注200美元,她应该怎么做?她应该把她的300美元押在红色。把她的筹码押在黑色对她没有半点好处,因为只有巴里取胜,她才能取胜(而她将是亚军,只有600美元,排在巴里的900美元后面)。自己取胜而巴里失败就是她惟一的反败为胜的希望所在,这就意味着她应该在红色下注。
  这个故事的策略寓意与马丁·路德和戴高乐的故事恰恰相反。在这个关于轮盘赌的故事里,先行者处于不利地位。由于那名女子先下注,巴里可以选择一个确保胜利的策略。假如巴里先下注,那名女子就可以选择一个具有同样取胜机会的赌注。这里需要说明的是,在博弈游戏里,抢占先机、率先出手并不总是好事。因为这么做会暴露你的行动,其他参与者可以利用这一点占你的便宜。第二个出手可能使你处于更有利的策略地位。
  ①
  如果一定要说实话,这是巴里事后懊悔自己没有采取的策略。当时是凌晨3点,他已经喝了太多香槟,再也没有办法保持头脑清醒了。结果,他把200美元押在偶数上,心里嘀咕他输掉冠军宝座的惟一可能性就是这一轮他输并且她赢,而这种可能性的发生几率只有1:5
  ,所以形势对他非常有利。当然,几率为1:5 的事情有时也会发生,这里讲的就是其中的一个例子:她赢了。
  第2章 准备接招
  1 .轮到你了,查理·布朗
  连环漫画《花生》里有一个反复出现的主题,说的是露西(Lucy)将一个橄榄球按住,竖在地上,招呼查理·布朗(Charlie
  Brown)过去踢那个球。不过,每次到了最后一刻,露西总要拿走橄榄球,查理·布朗因为一脚踢空,仰天跌一跤,心怀不轨的露西就会高兴得不得了(如图2-1所示)。
  任何人都会劝告查理·布朗不要上露西的当。即便露西去年(以及前年和再前一年)没有在他身上玩过这个花招,他也应该从其他事情了解她的性格,完全有可能预见她会采取什么行动。
  就在查理盘算要不要接受露西的邀请跑去踢球的时候,她的行动还没有发生。不过,单凭她的行动还没有发生这一点,并不意味着查理就应该把这个行动看做是不确定性的。他应该知道,在两种可能的结果——让他踢中那个球以及让他仰天跌一跤——当中,露西倾向于后者。因此,他应该预见到,一旦时机到了,她就会拿走橄榄球。从逻辑推理得出的露西会让他踢中那个球的可能性实际上已经毫无影响。对这么一种可能性仍然抱有信心,套用约翰逊(Johnson)博士描述的再婚的特征,是希望压倒经验的胜利。查理不应该那样想,而应预见到接受露西的邀请最终会让自己仰天跌一跤。他应该拒绝露西的邀请。
  2 .两种策略互动
  策略博弈的精髓在于参与者的决策相互依存。这种相互影响或互动通过两种方式体现出来。第一种方式是相继发生,比如查理·布朗的故事。参与者轮流出招。每个参与者在轮到自己的时候,必须展望一下他的这一步行动将会给其他人以后的行动造成什么影响,反过来又会对自己以后的行动造成什么影响。
  第二种互动方式是同时发生,比如第1章囚徒困境故事的情节。参与者同时出招,完全不理会其他人刚刚走了哪一步。不过,每个人必须心中有数,知道这个博弈游戏存在其他参与者,而这些人反过来也非常清楚这一点,如此类推。因此,每个人必须设想一下若是自己处在其他人的位置,会做出什么反应,从而预计自己这一步会带来什么结果。他选择的最佳策略也是这一全盘考虑的一个组成部分。
  一旦你发现自己正在玩一个策略博弈,你必须确定其中的互动究竟是相继发生的还是同时发生的。有些博弈,比如橄榄球,同时具备上述两种互动元素。这时候你必须确保自己的策略符合整个环境的要求。在这一章,我们将粗略介绍一些有助于你玩相继发生的互动的博弈的概念和规则;而同时发生的互动的博弈将是第3章的主题。我们从非常简单、有时候是设计出来的例子开始,比如查理·布朗的故事。我们有意这么做,毕竟,这些故事本身并不十分重要,而正确的策略通常也是通过简单的直觉就能发现的,这么一来,可以更加清晰地凸显其中蕴涵的概念。我们用到的例子会在案例分析以及以后的章节里变得越来越接近现实生活,也越来越复杂。
  3 .策略的第一法则
  相继出招的博弈有一个总的原则,就是每一个参与者必须预计其他参与者接下来会有什么反应,据此盘算自己的最佳招数。这一点非常重要,值得确立为策略行为的一个基本法则。
  法则1:向前展望,倒后推理。
  展望你的最初决策最后可能导致什么结果,利用这个信息确定自己的最佳选择。
  在查理·布朗的故事里,做到这点对所有人来说应该都是不费吹灰之力的,只有查理·布朗除外。他只有两个选择,其中一个导致露西在两个可能的招数之间选择了一个。大多数策略情况都会涉及一系列更长的决策结果,每个结果都有几种选择,单是口头上进行推理实在是无法表述清楚。要想成功地运用这个向前展望、倒后推理的法则,我们需要一个更好的视觉辅助工具。一个涵盖了博弈当中全部选择的“树状图”就是这么一个工具。现在我们就来演示一下怎么使用这些树。
  4 .决策树与博弈树
  一系列需要向前展望、倒后推理的决策,甚至有可能出现在一个孤立的决策者面前,而这个人并非置身于一个有其他人参加的策略博弈中。对于走在黄树林里的罗伯特·弗罗斯特(Robert
  Frost) :两条路在树林里分岔,而我我选择人迹罕至的那一条,从此一切变了样。[1]我们可以画出这样一幅示意图(如图2-2 所示)。
  许多人走的路黄树林人迹罕至的路到此未必就不用再选择了。每一条路后面可能还会有分岔,图2-2
  相应也会变得越来越复杂。以下就是我们亲身经历的一个例子。
  从普林斯顿到纽约旅行会遇到几次选择。第一个决策点是选择旅行的方式:乘公共汽车、乘火车还是自己开车。选择自己开车的人接下来就要选择走费拉扎诺·奈罗斯桥、荷兰隧道、林肯隧道还是乔治·华盛顿桥。选择搭乘火车者必须决定是在纽瓦克(Newark)换乘PATH列车"还是直达纽约宾夕法尼亚车站。等到进入纽约,搭乘火车或公共汽车的人还必须决定怎样抵达自己的最后目的地,是步行、乘地铁(是本地地铁还是高速地铁)、乘公共汽车还是乘出租车。最佳决策取决于多种因素,包括价格、速度、难以避免的交通堵塞、纽约城里的最终目的地所在以及对泽西收费公路上的空气污染的厌恶程度,等等。
  图2-3
  描述了你在每一个岔道口面临的选择,看上去就像一棵枝叶繁茂的大树,所以称为“决策树”。如何正确使用这样一张图或这么一棵树呢?绝对不是选择第一个岔道口看上去最好的分枝,然后等到下一个岔道口出现再去思考接下来应该怎么办;相反,你应该预计到以后将面临的选择,利用这些信息倒过头来确定前面几个岔道口你应该怎么决断。举个例子,假设你要去华尔街,乘PATH火车就好于开车,因为这条铁路从纽瓦克直达华尔街。
  公共汽车 市内交通在纽瓦克换乘PATH列车 市内交通
  普林斯顿 火车直达宾夕法尼亚车站 市内交通费拉扎诺·奈罗斯桥小汽车
  荷兰隧道林肯隧道乔治·华盛顿桥我们可以通过一棵这样的树描述一个策略博弈当中的选择,不过,现在出现了一个新的元素。我们遇到一个有两个人或更多人参与的博弈。沿着这棵树出发,后面许多分枝可能是几个参与者轮流决策。每个参与者在前一个分枝做决策时必须向前展望,而且考察的范围不应仅局限于他自己的决策,还要包括其他参与者的决策。他必须对其他人的下一步决策进行预计,办法就是置身于其他参与者的地位,按照他们的思维方式进行思考。为了强调一下这个做法与前面一个做法的区别,我们把一棵反映一场策略博弈当中的决策次序的树称为“博弈树”,而把“决策树”留做描述只有一个人参加的情形。
  虽然查理·布朗的故事简单得简直令人难以置信,不过,你还是可以通过将这个故事放进一棵博弈树,开始熟悉博弈树的概念。这个博弈从露西发出邀请开始,查理·布朗面临的选择是要不要接受邀请。假如查理拒绝邀请,那么这个博弈到此为止。假如他接受,露西就有两个选择,一是让查理踢中那个橄榄球,二是把球拿走。我们可以通过添加一个分枝的方法描绘这个故事。
  正如我们在前面说过的那样,露西有两个选择,即图2-4中的上下两个分枝,查理应该预计到她一定会选择上面那个分枝。因此,他应该置身于她的地位,从这棵树上剪掉下面那个分枝。现在,回到他自己的两个选择,也是上下两个分枝,假如他选择上面那个分枝,结果一定是仰天跌一大跤。因此,相比之下,他更好的选择是沿着下面的分枝前进。
  把球拿走露西接受查理
  让查理踢拒绝图2-4为了进一步了解这个思路,我们不妨设想一个包含同样一棵博弈树的商界中的例子。我们不想惹恼任何一个真实存在的公司,在此先向格雷厄姆·格林(Graham
  Greene)道歉,我们借用的是他的例子:假设在卡斯特罗执政之前的古巴,吸尘器市场由一家名为“快洁”的公司独占,一家名为“新洁”的新公司正在考虑要不要进军这个市场。假如‘新洁“决定进入,”快洁“将面临两个选择:一是接纳”新洁“,和平共处,满足于一个与以前相比降低了的市场份额,二是打一场价格战。①
  假设”快洁“接纳”新洁“;后者就可以赚得10万美元利润,但是,假如”快洁“发动一场价格战,就将给”新洁“造成20万美元的损失。假如”新洁“决定留在市场外而不进入,那么它的利润当然为零。下面我们画出这棵博弈树(如图2-5
  所示),标明每一种结果会带来什么样的利润。
  ① 在格林(Greene)写的《我们在哈瓦那的人》(Our Man in
  Havana)一书中,为这两家公司当中一家工作的销售员决定打仗,只不过用的是毒药而不是价格。
  接纳 新洁得10万美元快洁打价格战 新洁亏20万美元进入新洁不进入 新洁得0
  美元图2-5“新洁”应该怎么办?这是决策分析员需要解决的问题,也是商学院里讲授的问题。他们会画出一幅非常相似的图,却称之为“决策树”。理由是,他们通常把“接纳”和“打价格战”两种选择方案的结果看做偶然现象。因此他们会标出两者的出现概率。比如,假如他们认为接纳与打价格战出现的机会一样大,那么两者的概率同为1/2.接着,他们可以计算出“新洁”进人市场会得到多少利润,方法是将盈利和损失分别乘以相应的概率再相加。他们得到1/2*$100000-1/2*$200000=-$50000由于这是一个亏损数字,商业分析员们就会根据这些概率下结论说“新洁”不应该进军古巴市场。
  以上的估计数字是从哪里来的呢?博弈论提供了答案:它们来自“新洁”自己对“快洁”在各种情形下的利润情况的估计。要估计“快洁”会怎么做,“新洁”首先应该估计“快洁”在不同情形下会得到多少利润。然后通过向前展望、倒后推理,预计对方会怎么做。进一步分析这个例子:我们假设“快洁”作为一个垄断者,有能力赚取30万美元利润。与“新洁”分享市场则意味着自己的利润降为10万美元。另外,从“快洁”这边估计,发动一场价格战的代价是10万美元。现在我们可以在这棵树上添加这些结果(如图2-6
  所示)。
  接纳 新洁得10万美元快洁得10万美元快洁打价格战 新洁亏20万美元快洁亏10万美元进入新洁不进入
  新洁得O美元快洁得30万美元图2-6我们利用这棵树包含的信息预计以后的全部招数。由于具体招数可以由这个博弈的结果确定,这棵树完全适合看做一棵博弈树,而不是一棵决策树。比如,要预计“快洁”对“新洁”进入的反应,我们知道,“快洁”接纳“新洁”的话仍会有10万美元利润,发动价格战则会损失10万美元:“新洁”应该预计到“快洁”会选择前者。向这个方向展望,同时倒后推理,“新洁”应该在盘算的时候先把打价格战这个分枝去掉。它应该进入这个市场,因为预计它可以赚到10万美元。
  若是换了其他环境,最后的决策可能发生变化。比如,假设“新洁”下一步有可能继续进军“快洁”早已建立市场的其他岛屿,“快洁”大约会觉得有必要在这个新来者面前摆出一副不好对付的样子,宁可在古巴损失10万美元也要发动一场价格战。“新洁”应该看到,这意味着自己注定会损失20万美元,最后决定还是留在外面,不要硬闯的好。
  “新洁”可以看出任何一个得失数字都会转化为相应的行动。不过,它自己可能并不知道“快洁”在这棵树的顶端会得到什么样的回报。这种利润的不确定性将会转化为行动的不确定性。比如,“新洁”可能认为,有33.3%的机会“快洁”会在一场价格战中损失10
  万美元,有33.3%的机会双方会打个平手(利润为零),最后还有33.3%的机会“快洁”即便打价格战也能赚到12万美元。若遇到这种情况,“向前展望,倒后推理”会认为,有2/3
  的概率“快洁”会选择接纳“新洁”——赚到10万美元总比损失10万美元或双方打个平手要好,只比不上赚到12万美元。因此,发动一场价格战的可能性是33.3%。要弄清究竟会发生什么情况,惟一途径就是进军市场。不过,基于上述可能性,“新洁”有2/3
  的概率赚到10万美元,1/3 的概率损失20万美元,因此,它的预计利润实际为零,根本没有理由进军市场。
  在这个例子里,“新洁”对于“快洁”的得失的不确定性直接转化为对“快洁”会有什么反应的概率估计。不过,我们必须注意应该在哪里加人这种不确定性。正确的地方是在树的末端。现在就来看看,假如我们在考虑的时候企图跳到前面去会犯什么错:平均而言,“快洁”可以在一场价格战当中赚到$6667(即1/3*$120000+1/3*$0-1/3*$100000
  )。但这并不意味着“快洁”就一定想打价格战。愿意打价格战的可能性不是100%。而且这种不确定性并不表示我们就应该猜测“快洁”愿意打价格战的可能性是50%。对“新洁”而言,分析这个问题的正确思路是从这个博弈的终点着手,预计“快洁”每一步会怎么做。
  5 .更加复杂的树
  在现实生活里,你会遇到的博弈远比上述我们用来进行形象描述的例子复杂。不过,即便这些“小树苗”长成“大树”,同样的原理也依然管用。象棋(国际象棋)可能是最好的例子。虽然象棋的规则相对比较简单,却已经形成一种需要进行策略推理的博弈游戏。白棋先行,黑棋回应,双方依次相继移动。因此,象棋当中最“纯粹”的策略推理就包含着向前展望你自己这一步将会导致什么后果,就跟我们在前面看到的一样。其实例可能是这样:“假如我现在走兵,我的对手就会进马,威胁我的车。我在走兵之前必须用我的象护住那四个格子,不让对手的马得逞。”
  象棋是一种相继出招的博弈游戏,我们可以用一棵树来表示。白方可以从20种开局方式中任选一种。[2]在图2-7
  中,我们用这棵树的第一个决策点(或节点)表示白方拥有的第一个先行机会,标为W1.他可以选择的20种走法变成20个枝条,从这个节点发散出去。每一个枝条代表的行动方式就是这个枝条的标签:兵进K4
  (P-K4 或代数标记法里的e4)、兵进Q4
  ,等等。我们的目的只是描述普遍情况,因此,为了避免这幅图表变得枝节丛生,我们不会显示或标明所有枝条。每一个枝条都会引出下一个节点,代表黑方的第一次行动,标为B1.黑方同样可以从20种开局方式中任选一种,于是,同样会有20个枝条从每一个标明B1的节点发散出去。双方走完第一步,我们已经看到有400种可能性。从现在开始,枝条的数目就会取决于前面一步。举个例子:假如白方的第一步是P-K4
  ,他的第二步就有许多选择,因为他的后以及王旁边的象现在都可以出动。然后你就会发现,建立这棵树所要运用的原理多么简单,而这棵树在实践中又会很快变得多么复杂。
  我们可以选择这棵博弈树上每一个决策点(节点)的一个枝条,沿着这个枝条一路走下去。这表示这盘博弈继续下去的一种特定方式。象棋大师早在博弈初期(开局阶段)就盘算过许多这样的路径,考虑过这些路径会有什么结果。比如我们已经标出的路径,白方第一步是P-K4
  ,黑方以P-QB4 回敬,就是预兆一场恶战的西西里防御。①① 继续下去,就是第二步,N-KB3,P-Q3 ;第三步,R-Q4,PxP
  ;第四步,NxP , N-KB3;第五步,N-QB3 , P-QR3 ;第六步,B-KN5 , P-K3 ;第七步,P-KB4,Q-N3
  ;第八步,Q-Q2,QxP .这种走法称为毒兵变局(Poisoned pawn variation)
  ,听上去好像来自善于玩弄阴谋诡计的西班牙博尔吉亚家族(the Borgias)的宫廷,或是华尔街。
  在许多博弈里,每一条这样的路径都会在有限次的选择之后到达终点。在体育或棋类比赛中,这可能是在一方取胜或双方打平的时候。更常见的情况是,博弈的最终结果可能是以给参与者货币回报、非货币回报或惩罚的形式出现。比如,商业对手之间的一场商界博弈可能给一家公司带来非常可观的利润,却使另一家公司破产。而核军备竞赛的博弈则可能达成一项成功的条约或导致两败俱伤。
  假如一个博弈无论选择哪一条路径,都会在有限次的行动之后到达终点,我们在理论上就可以完全解决这个博弈。这意味着能找出谁将取胜以及他将怎样取胜。这是通过沿着这棵树倒后推理得出的。一旦我们走通了整棵树,我们就会发现我们究竟能不能取胜,还有,假如可以取胜,我们应该使用怎样的策略。对于任何一个相继选择并且数目有限的博弈,总是存在某种最佳策略。当然,存在一个最佳策略并不等于说我们总是可以轻而易举地找到这个最佳策略。象棋就是一个很好的例子。临到比赛结束之际,象棋大师在刻画最优策略方面一直做得非常出色。一旦棋盘上只剩下三四个棋子,大师级选手就能预见博弈的结局,(通过倒后推理)确定一方有没有一个万无一失的取胜策略,或另一方是否能迫使双方打平。接着,他们可以通过预计最后阶段的各种不同局势,评估中盘阶段的策略。问题在于,从来没有人可以一直倒后走通整棵树,直到开局的第一步。
  一些简单的博弈可以用这样的方法得到完全解决。比如,3 x3 的连城游戏总是可以变成平局。①
  这也是只有小孩才玩这个游戏而大人不屑一顾的原因。即便是西洋跳棋,也存在这个问题。大家都相信,第二个参与者总有办法达成平局,虽然这一结论尚未得到证明。为了保持大家对这种游戏的兴趣,西洋跳棋比赛让参与者从中局开始行动,在中局大家还看不出什么取胜或打平的策略。等到象棋也有可能用这种方法完全解决的那一天,象棋的规则大概也得进行修改了。
  ①
  你也许觉得连城游戏是一种简单的博弈,但你还是不要指望能画出这裸博弈树。请注意,没有一局能在第五次行动之前走完,因为直到这时其中一方才第一次有机会在棋盘上放下三颗棋子,而此时枝条的数目已经达到9x8x7x6x5
  = 15120
  .当然,即便如此,这个博弈还是可以轻易解决,因为大多数枝条从策略上看是一模一样的。举个例子:虽然第一步有9种可能的走法,但这个博弈的对称性使我们不难发现,实际上这里只有3种完全不同的走法,即角、边线或中间。正是这样的小诀窍使这棵博弈树变得易于处理。
  而在目前阶段,象棋参与者都做了什么呢?他们做了我们大家将相继移动的策略运用到实践中去的时候都应该做的事情:将向前展望分析与价值判断结合在一起。他们会问:“这条路在四五步之后会使自己争得一个有利局面,抑或陷入一个不利局面?”他们假设现在比赛已经结束,由此判断每一个可能的结果的价值。然后,他们选择那个五步之后可以达到最大价值结果的策略,向前展望,倒后推理。倒后推理是相对容易的部分。难的是怎样确定中盘局面的价值。每一个子的价值都要计算在内,同时要在吃子与取势两方面的优势之间进行权衡取舍。保罗·霍夫曼(Paul
  Hoffman)在他的《阿基米德的报复》(Archimedes' Revenge)一书中描述了汉斯·伯利纳(Hans
  Berliner)的电脑象棋程序。伯利纳是以通讯方式进行的象棋比赛的世界冠军,研制了一台专门用于下象棋的电脑,可以在每一步棋限定的3分钟之内检查3000
  万种备选方案。伯利纳还确定了一个很好的规则,用于评估中盘局面的价值。能林够击败这个电脑程序的人不超过300名。在十五子棋比赛中,伯利纳也开发了一个程序,该程序已经使世界冠军俯首称臣。
  将倒后推理的清晰逻辑与基于实践经验确定的、评估中盘局面价值高低的最佳规则结合起来,是处理远比象棋复杂的博弈的一种有用方法。
  6 .讨价还价
  无论在商界还是在国际政坛,参与各方经常通过讨价还价或者谈判来决定总收益这个“蛋糕”应该怎样划分。我们将在第11章更详细地探讨这一现象。现在我们把它当做一个形象的例子,解释倒后推理这一方法怎样使我们得以预见相继行动的博弈的结果。
  大多数人基于社会常识,预测一场谈判的结果就是妥协。这样做的好处是能够保证“公平”。我们可以证明,对于许多常见类型的谈判,一个50对50的妥协也是倒后推理的结果。
  首先,我们必须认识讨价还价的两个普遍特征。我们必须知道谁向谁提出了一个什么条件,换言之,就是这个博弈的规则是什么;接着,我们还要知道,假如各方不能达成一个协定,将会导致什么后果。
  不同的谈判按照不同的规则进行。在大多数零售店里,卖方会标出价钱,买方的惟一选择就是要么接受这个价格,要么到别的店里碰运气。①
  这是一个简单的“接受或者放弃”的法则。而在工资谈判的例子中,工会首先提出一个价码,接着公司决定是不是接受。假如公司不接受,可以还一个价码,或者等待工会调整自己要求的价码。有些时候,相继行动的次序是由法律或者习俗决定的,还有些时候这一次序本身就具有策略意义。接下来,我们会探讨一个讨价还价的问题,在这个问题里,双方轮流提出条件。
  ① 有些顾客似乎可以在任何地方(甚至包括西尔斯百货公司)讨价还价。在这方面,赫伯·科恩(Herbo
  Coben)的著作《你可以就任何事情讨价还价》(You Can Negotiate Anything)提供了许多有用的小提示。
  谈判的一个必不可少的特征在于时间就是金钱。假如谈判越拉越长,蛋糕就会开始缩水。不过,这时各方仍然可能不愿意妥协,暗自希望只要谈成一个对自己更加有利的结果,其好处就将超过谈判的代价。查尔斯·狄更斯(Charles
  Dickens)的《荒凉山庄》(Bleak
  House)描述了一个极端的情形:围绕贾恩迪斯(Jarndyce)山庄展开的争执变得没完没了,以至于最后整个山庄不得不卖掉,用于支付律师们的费用。按照同样的思路,假如不能达成工资协定而引发罢工,那么公司就会失去利润,工人就会失去工作。假如各国陷人一轮旷日持久的贸易自由化谈判,它们就会在争吵收益分配的时候丧失贸易自由化带来的好处。这些例子的共同点在于,参与谈判的所有各方都愿意尽快达成协议。
  在现实生活中,收益缩水的方式非常复杂,不同情况缩水比例也不同。不过,我们可以用一种非常简单的方法充分阐明这一点:假设每提出一个建议或反建议,蛋糕都会朝零的方向缩小同样大小;设想这是一个冰淇淋蛋糕,孩子们一边争吵怎么分配,蛋糕一边融化。
  首先,假设整个过程总共只有一步。桌子上放了一个冰淇淋蛋糕;一个孩子(Ali ,阿里)向另一个孩子(Baba
  ,巴巴)提议应该如此这般分配。假如巴巴同意,他们就会按照提议分享这个蛋糕;假如巴巴不同意,蛋糕融化,谁也吃不到。
  现在,阿里处于一个强有力的地位:她使巴巴面临有所收获和一无所获的选择。即便她提出自己独享整个蛋糕,只让巴巴在她吃完之后舔一舔切蛋糕的餐刀,巴巴的选择也只能是舔一舔,否则他什么也得不到。
  当然,巴巴可以因为感到这么分配太不公平而生气,断然拒绝接受这一条件。又或者,他可能希望建立或者保持自己作为一个不好对付的讨价还价者的形象,从而为日后的讨价还价奠定基础,而日后的讨价还价可能是跟阿里进行,也可能是跟其他得知今天自己所作所为的孩子们进行。在实际操作当中,阿里同样需要考虑到这些问题,要向巴巴放出刚好足够的诱饵(比如一小片蛋糕?)
  ,引诱他上钩。为简化阐述过程,我们将所有这些复杂问题搁在一边,假设阿里可以拿走她所要求的100%的份额。实际上,我们还可以不考虑留给巴巴舔的餐刀,假定阿里有能力提出“接受或者放弃”的条件,她可以得到整个蛋糕。①①
  同样的简化做法还将用在我们对更多回合的建议和反建议的讨论上。读者可以很方便地将我们的分析套用到一个更接近现实、但也更庞大的决策过程中,这个过程可以将我们在这里忽略的复杂情况包含在内。
  一旦出现第二轮谈判,局势就会大大偏向巴巴。不妨再设想一下,现在桌子上放了一个冰淇淋蛋糕,但是两轮谈判过后,整个蛋糕就会融化。假如巴巴拒绝接受阿里提出的条件,他可以提出一个反建议,不过,到这时,桌子上只剩下半个蛋糕了。假如阿里拒绝接受巴巴的反建议,剩下的半个蛋糕也会融化,双方都会一无所获。
  现在,阿里必须向前展望她最初提出的条件会有什么后果。她知道,巴巴可以拒绝她的条件,从而占据有利地位,反过来就剩下的半个蛋糕提出“接受或者放弃”的分配方案。这实际上意味着巴巴已经将那半个蛋糕掌握在自己手里。因此,他不会接受任何低于阿里第一轮条件的反建议。假如阿里不能阻止这一幕发生,她将一无所获。一旦看清了这一点,她会从一开始就提出与巴巴平分这个蛋糕,这正是刚好足够引诱对方接受而又为自己保有一半收益的条件。于是他们会马上达成一致,平分这个蛋糕。
  说到这里,个中原理已经非常清楚,我们的讨论还可以再进一步。分析结果是相同的,要么加速谈判进程,要么延缓蛋糕融化速度。随着谈判各方提出每个建议和反建议,蛋糕也在融化,从一个变成2/3再变成1/3,直到零,什么也剩不下。假如阿里提出最后一个建议,而蛋糕已经缩小到只有1/3,她就可以全部拥有。巴巴知道这一点,所以在轮到自己提条件的时候(这时蛋糕还剩下2/3)许诺分给她1/3.这么一来,巴巴可以得到的最好结果就是1/3
  个蛋糕,即剩下的2/3的一半。阿里知道这一点,所以从一开始就许诺分给巴巴1/3 (刚好足够引诱对方接受),自己得到2/3
  .各得一半的分配方案存在什么规律吗?每一次的步骤数目都是偶数,且这一现象反复出现。更重要的是,即便步骤数目是奇数,随着步骤数目增加,双方也会越来越接近一半一半的分配方案。
  若是四步,巴巴得以提出最后一个条件,从而得到这个时候桌子上剩下的1/4个蛋糕。因此,阿里必须在倒数第二轮提出分给巴巴1/4
  个蛋糕,当时桌子上还剩下半个蛋糕。而在此前的一轮,巴巴可以让阿里接受分给她剩下的3/4个蛋糕中1/4个蛋糕的条件。因此,一路这么向前展望下去,在讨价还价一开始,阿里就应该提出分给巴巴半个蛋糕,自己得到另一半。
  若是五步,阿里一开始可以提出分给巴巴2/5个蛋糕,自己得到3/5
  .若是六步,那么分配方案又回到各得一半。若是七步,阿里得到4/7,巴巴得到3/7.更为普遍的情况是,假如步骤数目是偶数,各得一半。假如步骤数目n是奇数,阿里得到(n+l)/(2n),而巴巴得到(n-1)/(2n)。等到步骤数目达到101,阿里可以先行提出条件的优势使她可以得到51/101个蛋糕,而巴巴得到50/101
  个。
  在这个典型的谈判过程里,蛋糕缓慢缩小,在全部消失之前有足够时间让人们提出许多建议和反建议。这表明,通常情况下,在一个漫长的讨价还价过程里,谁第一个提出条件并不重要。除非谈判长时间陷入僵持状态,胜方几乎什么都得不到了,否则妥协的解决方案看来还是难以避免的。不错,最后一个提出条件的人可以得到剩下的全部成果。不过,真要等到整个谈判过程结束,大概也没剩下什么可以赢取的了。得到了“全部”,但“全部”的意思却是什么也没有,这就是赢得了战役却输掉了战争。
  我们必须看到很重要的一点:虽然我们考虑过许多可能的建议和反建议,预期结果却是阿里的第一个条件能够被对方接受。谈判过程的后期阶段不会再发生。不过,假如第一轮不能达成一致,这些步骤将不得不走下去,这一点在阿里盘算怎样提出一个刚好足够引诱对方接受的第一个条件时非常关键。
  这个观察结果反过来提示了另一种讨价还价策略。向前展望、倒后推理的原理可能在整个过程开始之前就已经确定了最后结果。策略行动的时间可能提前,在确定谈判规则的时候就已经开始。
  同样的观察结果还会引出一个谜。假如讨价还价的过程真像这里阐述的那样,应该不会出现罢工。当然,罢工的可能性会影响最终达成的协议,不过公司会把握第一个提条件的机会,提出一个刚好足以引诱对方接受的条件,工会也会这样做。罢工变成现实,或者更普遍的情况,即谈判破裂,一定是现实生活更微妙或者更复杂的特征引出的结果,而这些特征早已从上述这个简单的故事中排除出去,未予考虑。我们会在第11章探讨其中一些问题。
  7 .战争与和平
  倒后推理的另一个实例是怎样通过一系列双边谈判维护和平。我们举一个只有部分假设的例子:苏丹是一个相对弱小的国家,现在面临被其邻国利比亚人侵的危险。假如这两个国家在某种程度上都是与外界隔绝的,那么,要想阻止利比亚人侵并击败苏丹简直毫无可能。
  尽管两个敌对邻居可能无法继续和平共处,但第三方的存在也许可以构成必要的制约。在利比亚与苏丹的例子里,这一原理可能会是“我的敌人的敌人就是我的朋友”。假如利比亚真要跟苏丹开战,那么,利比亚将不得不从东部与埃及接壤的边境抽调兵力。埃及当然不愿意贸然入侵一个全副武装的利比亚,不过,假如利比亚跟苏丹打仗而实力大减,埃及人也许会得到一个难以抗拒的大好机会,一举干掉这个麻烦的邻居。利比亚可以(或者至少应该)通过倒后推理,预计到一旦他们进攻苏丹,埃及就会人侵。表面看来,苏丹安全了。不过,在三个国家后面就停止继续思考这个问题,可能会造成一种虚假的安全感。
  假如三个敌人可以达成稳定状态,四个又如何?现在加入以色列。假如埃及要打利比亚的主意,很有可能遭到以色列入侵。在萨达特(Sadat)和贝京(Begin)将双方关系正常化以前,这确实是埃及面临的一个严重威胁。在1978年以前,利比亚不必担心埃及入侵,就是因为埃及一想到以色列就战战兢兢,不敢大意。结果,苏丹不可能指望埃及来抑制利比亚的扩张野心。①
  随着以色列与埃及关系改善,倒后推理的链条在埃及这里中断,而苏丹也安全了,至少目前是这样。
  ① 由此我们知道“我的敌人的朋友不是我的朋友”。
  这个关于制约因素的例子当然经过了必要的格式化,这样它更加切合我们讨论的主题。从表面看来,这个例子说明,一个国家究竟会不会遭到入侵,将取决于潜在侵略者链条的节点数目是奇数还是偶数。一个更加接近现实生活的情况分析可以把国与国之间的复杂关系考虑在内,从而得到更多细节,用于分析一国入侵别国的企图究竟有多大。不过,还有一个重要的结论:博弈的结果在很大程度上取决于参与者的人数。参与的人越多越好,参与的人越少越糟,即便在同一个博弈里也是如此。但是,两个敌对国家难以和平共处、三个敌对国家就能恢复稳定局面的结论并不意味着若有四个敌对国家就更好;在这个例子里,四个的结果跟两个是一样的。②②
  实际上,假如这个链条存在的国家数目是奇数,那么,A是安全的。假如这个链条的节点数目是偶数,那么B就会人侵A;B发动入侵之后,链条上的节点数目就会减为奇数,B就安全了。
  为了进一步阐述这个制约因素的观点,我们请读者研究本书最后一章“案例分析”的“三方对决”一节。三个敌对者,实力各不相同,现在必须决定自己应该袭击哪一个。你可能会发现答案令人大吃一惊。
  8 .英国人玩的博弈
  本章我们讨论了有序行动或者有序移动的博弈。实际上,现实生活当中没有几个博弈存在清晰界定而参与者又必须遵守的行动规则。参与者自己制定自己的规则。那么,他们怎么才能向前展望、倒后推理呢?他们又怎么才能知道这个博弈究竟有没有行动次序呢?
  我们借用1987年英国大选的情形说明这一点。玛格丽特·撒切尔(Margaret
  Thatcher)领导的执政保守党面对以尼尔·金诺克(Neil
  Kinnock)为首的工党的挑战。大选期间,双方都要选择是走平坦大道,即以就事论事为原则进行竞选,还是走崎岖小径,即进行人身攻击。选民当中很大一部分人对撒切尔夫人的政绩深表满意,因此,假如双方按照相仿的规矩拉票,将出现整个竞选一面倒的局面,撒切尔夫人就会取胜。
  金诺克先生的惟一希望,在于他可以通过风格完全不同的拉票活动,建立一个足以超越对手的好印象。现在我们假设,撒切尔夫人选择平坦大道,而他选择崎岖小径,或者两者调换选择,他的成功概率都是一样的。假设他们私下里都愿意选择平坦大道,但这一想法必须让位给取胜这一目标。
  哪一条才是“人迹罕至”的路呢?答案取决于双方做决定的次序。我们现在就来考察一些可能出现的情况。
  假设撒切尔夫人首先选择竞选风格,这是因为,比如说,就传统而言都是执政党在反对党之前公布自己的竞选纲领。这样,她可以画出下面的博弈树(如图2-8
  所示)。
  通过向前展望和倒后推理,撒切尔夫人可以预计,假如她选择平坦大道,金诺克先生一定会选择崎岖小径,反之亦然。①
  既然两个方案赋予她的取胜概率相同,她愿意选择平坦大道。
  ① 苏格兰民歌《罗梦湖》(Loch
  Lomond)唱道:“噢,你走你的平坦大道,我走我的崎岖小径,我会比你早到苏格兰。”因此,我们必须指出,工党在苏格兰赢得了多数议席,虽然保守党以大比分赢得了整个英国大选。
  撒切尔夫人先行会使她陷于不利,因为这么一来,金诺克先生就可以选择与其完全不同的道路。不过,她先行本身不会造成这个问题。现在我们在这个对局上做一个小小的修改。假设撒切尔夫人已经跟她的保守党顾问以及竞选宣传经理们开过会,确定了她的策略。但是这一决定“没有公开。金诺克先生也在开同样一个会议。他应该怎么做?他应不应该假设撒切尔夫人在先行的时候,是按照我们刚刚描述的方法进行推理的呢?那将意味着她已经选择了平坦大道,因此金诺克先生应该选择走崎岖小径。不过,假如撒切尔夫人想到金诺克先生也会这么想,她就会为自己选择崎岖小径的策略。金诺克先生并不确实知道她的选择,他若是忽略这么一种”第二层次“的思考,他就是一个大傻瓜。那么、他应不应该选择平坦大道呢?不一定,因为撒切尔夫人可以想到”第三层次“,如此类推。一个普遍的观点是若要运用向前展望、倒后推理的原理,不可缺少的前提是后行者可以观察到先行者的行动。
  即便撒切尔夫人先行,而她的选择也是外人可以看到的,但如果她在竞选期间改变策略,又会发生什么情况呢?假设只有选民得到的最后印象才算数,而撒切尔夫人在第一次发表声明的时候说了什么无关紧要。金诺克先生绝不能信以为真,并据以制定自己的策略。反过来,撒切尔夫人在考虑自己应该怎么迈出第一步的时候,也不能指望金诺克先生只有一种反应方式。这样,我们就得到向前展望、倒后推理原理的另一个适用条件:策略必须是不可逆转的。
  假如这两个条件有一个不符合,又会怎么样?即便两党是在不同时间做出各自的决定,就策略思维而言,这些决定就跟同时做出没有两样。从相继做出决定到同时做出决定的转变,可能对两党中的一方有利,也可能对双方都有利。实际上,在1987年的英国大选中,双方至少都改变了一次自己的策略。第3章将提出同时进行的博弈的行动规则。
  关于相继行动与同时行动的博弈的区别,体育比赛提供了另一个例子。百码短跑是同时行动的博弈,因为根本没时间排出相继行动的次序。而在蝶泳比赛中,运动员也许有时间进行思考,却会发现看清对手的位置是非常困难的。马拉松比赛具有相继行动的博弈的组成成分:运动员们可以看到其他人的位置(以一点为基准),策略也是不可逆转的,因为不可能回头重新比赛早先跑过的路程。
  结束这一章的时候,我们回到查理·布朗要不要踢那个橄榄球的问题。在橄榄球教练汤姆·奥斯本(Tom
  Osborne)指挥冠军争夺战的最后几分钟,这个问题真的出现了。我们同样认为他做了错误的选择。倒后推理可以揭示错误的原因。
  9 .案例分析之二:汤姆·奥斯本与1984年橙碗球场决赛的故事
  在1984年的橙碗球场决赛上,战无不胜的内布拉斯加打谷者队( Nebraska
  Cornhuskers)与曾有一次败绩的迈阿密旋风队(Miami
  Hurricanes)狭路相逢。因为内布拉斯加队晋身决赛的战绩高出一筹,只要打平,它就能以第一的排名结束整个赛季。
  不过,在第四节,内布拉斯加打谷者队以17:31
  落后。接着,他们发动了一次反击,成功触底得分,将比分追至23:31.这时,内布拉斯加队的教练汤姆·奥斯本面临一个重大的策略抉择。
  在大学橄榄球比赛中,触底得分一方可以从距离入球得分线只有2
  1/2码的标记处开球。该队可以选择带球突破或将球传到底线区,再得2分;或者采用一种不那么冒险的策略,将球直接踢过球门柱之间,再得1分。
  奥斯本选择了安全至上,内布拉斯加队成功射门得分,比分改写为24:31
  .该队继续全力反击。在比赛最后阶段,他们最后一次触底得分,比分变成30:31 .只要再得1
  分,该队就能战平对手,取得冠军头衔。不过,这样取胜总不大过瘾。为了漂亮地拿下冠军争夺战,奥斯本认为他应该在本场比赛取胜。
  内布拉斯加队决定要用得2分的策略取胜。欧文·弗赖尔(Irving
  Fryer)接到球,却没能得分。迈阿密队与内布拉斯加队以同样的胜负战绩结束全年比赛。由于迈阿密队击败内布拉斯加队,最终获得冠军的是迈阿密队。
  假设你自己处于奥斯本教练的位置。你能不能做得比他更好?
  案例讨论星期一出版的许多橄榄球评论文章纷纷指责奥斯本不应该贸然求胜,没有稳妥求和。不过,这不是我们争论的核心问题。核心问题在于,在奥斯本甘愿冒更大的风险一心求胜的前提下,他选错了策略。他本来应该先尝试得2分的策略,然后,假如成功了,再尝试得1
  分的策略,假如不成功,再尝试得2分的策略。
  让我们更仔细地研究这个案例。在落后14分的时候,奥斯本知道他至少还要得到两个触底得分外加3分。他决定先尝试得1分的策略,再尝试得2分的策略。假如两个尝试都成功了,那么使用两个策略的先后次序则无关紧要。假如得1分的策略失败,而得2分的策略成功,先后次序则仍然无关紧要,比赛还是以平局告终,内布拉斯加队赢得冠军。先后次序影响战局的惟一可能性在于内布拉斯加队尝试得2分的策略没有成功。假如实施奥斯本的计划,这将导致输掉决赛以及冠军锦标。相反,假如他们先尝试得2分的策略,那么,即便尝试失败,他们仍然未必输掉这场比赛。他们仍然以23:31落后。等到他们下一次触底得分,比分就会改为29:31
  .这时候,只要他们尝试得2分的策略得手,比赛就能打成平局,他们就能赢得冠军头衔!①①
  而且,这将是尝试取胜的努力失败之后导致的平局,因此没有人会批评奥斯本,说他一心想打成平局。
  我们曾经听到有人反驳说,假如奥斯本先尝试得2分的策略,那么,如果没有成功,他的队将只能为打平对手而努力。但这么做不是那么鼓舞人心,并且他们很有可能不能第二次触底得分了。更重要的是,等到最后才来尝试这个已经变得生死攸关的得2分的策略,他的队将陷入成败取决于运气的局面。这种看法是错的,有几个理由。假如内布拉斯加队等到第二次触底得分才尝试得2分的策略,一旦失败,他们就会输掉这场比赛。假如他们第一次尝试得2分的策略失败,他们仍然有机会打平。即使这个机会可能非常渺茫,但有还是比没有强。激励效应的论点也站不住脚。这是因为,虽然内布拉斯加队的进攻可能在冠军决赛这样重大的场合突然加强,但迈阿密队的防守也会加强。这场比赛对双方是同样重要的。相反,假如奥斯本第一次触底得分之后就尝试得2分的策略,在一定程度上确实存在激励效应,提高第二次触底得分的概率。这也使他可以通过两个三分球打平。
  从这个故事中可总结的教训之一在于,假如你不得不冒一点风险,通常都是越早冒险越好。这一点在网球选手看来再明显不过了:人人都知道应该在第一发球的时候冒风险,第二发球则必须谨慎。这么一来,就算你一发失误,比赛也不会就此结束。你仍然有时间考虑选择其他策略,并借此站稳脚跟,甚至一举领先。
  第3章看穿对手的策略
  每个星期,《时代》和《新闻周刊》都会暗自较劲,非要做出最引人注目的封面故事不可。一个富有戏剧性或者饶有趣味的封面,可以吸引站在报摊前的潜在买主的目光。因此,每个星期,《时代》的编辑们一定会举行闭门会议,选择下一个封面故事。他们这么做的时候,很清楚在某个什么地方,《新闻周刊》的编辑们也在关起门来开会,选择下一个封面故事。反过来,《新闻周刊》的编辑们也知道《时代》的编辑们正在做同样的事情,而《时代》的编辑们也知道《新闻周刊》的编辑们知道这一点……
  这两家新闻杂志投入了一场策略博弈,不过,这个博弈从本质上看跟我们已经讨论过的博弈存在很大差别。第2章讨论的博弈是由一系列相继进行的行动组成的。查理·布朗在选择要不要踢那个橄榄球时,心里明白露西现在还没有决定要不要拿走那个球;在象棋里,白方与黑方交替行动。相反,《时代》与《新闻周刊》的行动却是同时进行的。双方不得不在毫不知晓对手的决定的情况下采取行动。等到彼此发现对方做了什么,再想做什么改变就太迟了。当然,这个星期的输家下个星期很可能竭力反扑,不过,等到那时,在这个日新月异的世界上说不定已经出现了一个完全不同的新的故事模式,开始了一场完全不同的博弈。
  这两种博弈所要用到的策略思维和行动在本质上存在天壤之别。对于第2章讨论的相继行动的博弈,每个参与者不得不向前展望,估计对手的反应,从而倒后推理,决定自己这一轮应该怎么走。这是一条线性的推理链:“假如我这么做,另一个参与者会那么做——若是那样,我会这么反击”,依此类推。
  而在同时行动的博弈里,没有一个参与者可以在自己行动之前得知另一个参与者的整个计划。在这种情况下,互动推理不是通过观察对方的策略进行,而是必须通过看穿对手的策略才能展开。要想做到这一点,单单假设自己处于对手的位置会怎么做还不够。即便你那样做了,你又能发现什么?你只会发现,你的对手也在做同样的事情,即他也在假设自己处于你的位置会怎么做。因此,每一个人不得不同时担任两个角色,一个是自己,一个是对手,从而找出双方的最佳行动方式。与一条线性的推理链不同,这是一个循环——“假如我认为他认为我认为……”。诀窍在于怎样破解这个循环。
  夏洛克·福尔摩斯(Sherlock
  Holmes)和他的死对头、罪恶魔头莫里亚蒂(M噢riarty)教授擅长这类推理,对此我们一点都不觉得惊讶。正如福尔摩斯在《最后的问题》里告诉华生(Watson)的:“我要说的其实已经在你的脑海闪过。”他说。
  “那么我的答案大概也已经在你的脑海闪过。”我答道。
  你就和华生医生一样,大概也在揣摩福尔摩斯怎么未卜先知。听完我们的解释,我们希望你会同意这其实相当简单。
  你怎样才能看穿所有那些错综复杂而又看不见的策略呢?首先,你不要把其他参与者的未知行动视做天气那样,具有与个人无关的不确定性。上班之前,《时代》的编辑可能收听天气预报,知道今天下雨的概率是40%,他大概会利用这个信息去决定要不要带一把雨伞去上班。但《新闻
  周刊》将会采用哪个特定主题作为封面故事的概率则完全是另外一回事。
  区别在于,《时代》的编辑对《新闻周刊》有一个非常中肯的了解——另一个杂志的编辑与天气不同,他们是策略的博弈参与者,就跟《时代》的编辑自己一样。①
  即便一个编辑不可能真的观察到另一个杂志的决定,他也可以通过另一个杂志的视角思考这个问题,尝试确定它现在一定在做什么。
  ①
  有些人相信,自然界也是一个策略博弈的参与者,而且心肠狠毒,整天想着怎样破坏我们早已定下的计划,以从中取乐。比如,当你听说下雨的概率是40%,这意味着,有六成概率是你带了雨伞上班而老天爷又没有下雨,另有四成机会则是你忘带雨伞而老天爷偏偏下起雨来。
  在第2章,我们可以提供一个单一的、统一的原理,为相继行动的博弈确定最佳策略。这就是我们的法则1:向前展望,倒后推理。在这一章,事情不会那么简单。不过,关于同时行动必不可少的思维方式的思考可以总结为指导行动的三个简单法则。反过来,这些法则又基于两个简单概念:优势策略与均衡。与第2章一样,我们也会通过简单的例子解释这些概念和法则。
  1 .优势策略
  在棒球比赛里,假如一方已经有两个人出局,而又打出三个坏球和两个好球,那么,任何一名进攻上垒的球员都必须在下一次投球的时候跑向下一垒。这可以通过琢磨各种可能的情形得出来。在大多数情况下,攻垒球员怎么做无关紧要。假如击球手碰不到球,要么出现第四个坏球而攻垒球员成功上垒,要么出现第三个好球而这一局结束。假如投球手投出界外球,攻垒球员只消退回原先所在的垒。假如这是一个擦棒球而又被接住,那么这一局就结束了。不过,有一种情况跑动攻垒占有优势,即假如击球手将投球击到界外,那么攻垒球员就有很好的机会上垒或者得分。
  我们认为,在这种局面下,跑动攻垒就是优势策略,即某些时候它胜于其他策略,且任何时候都不会比其他策略差。一般而言,假如一个球员有某一做法,无论其他球员怎么做,这个做法都会高出一筹,那么这个球员就有一个优势策略。假如一个球员拥有这么一个策略,他的决策就会变得非常简单;他可以选择这个优势策略,完全不必担心其他对手怎样行事。因此,寻找优势策略是每一个人的首要任务。
  一旦你知道自己在找什么,你就会发现这个东西无所遁形,我们身边其实到处都是优势策略的有趣例子。比如印第安纳·琼斯(Indiana
  Jones)在电影《印第安纳·琼斯与最后的十字军东征》(Indiana Jones and the Last
  Crusade)的最紧张局势时所处的地位。印第安纳·琼斯、他的父亲以及纳粹分子全都聚集在安放圣杯的地方。眼看纳粹分子只差一步就要得到圣杯,琼斯父子却无论如何不愿意助封为虐。于是,纳粹分子打了琼斯父亲一枪。只有具备起死回生力量的圣杯才能救老琼斯博士的命。在这种情况下,琼斯只好引他们走向圣杯。不过,前面还有一个最后的挑战:琼斯必须在十几个杯子当中做出选择,选出耶稣基督用过的圣杯。圣杯可以使人永生不死,其他杯子却会致人于死地。纳粹头子迫不及待地拿起一个华丽的黄金杯,喝下里面的圣水,却突然倒地而死,因为他选错了,那不是圣杯。琼斯选了一个木头杯,那是一个木匠用的杯子。他一边大叫“只有一个办法可以证实”,一边将杯里的水倒出一点在圣水器上,自己先喝了下去,希望自己选中的就是生命之杯。当琼斯发现自己没搞错,立即把杯子送到他父亲那里,圣水果然治愈了致命的枪伤。
  虽然这一幕增添了紧张气氛,但在一定程度上却让我们感到难堪,因为一个像印第安纳·琼斯博士那样了不起的教授,居然会看不到他的优势策略。他本来应该先把杯子递给他父亲,没有必要自己亲身尝试。假如琼斯确实选对了杯子,那他父亲就会得救。假如他选错了杯子,那他父亲就会丧命,却至少可以保全琼斯。在将杯子递给他父亲之前自己测试一下其实毫无用处,这是因为,假如琼斯选错了杯子,那就再也没有第二次机会了——琼斯将死于致命之水,而他父亲也会死于致命枪伤。①①
  这个例子同时指出博弈论的弱点:人们单凭行为导致的结果给行为打分,行为本身则变得无足轻重。比如,即便印第安纳·琼斯的父亲已经受了致命枪伤,琼斯可能还是不愿意为导致父亲死亡的行为承担责任,一定要亲身试饮那杯水。
  相比之下,寻找优势策略会比寻找圣杯容易一些。不妨想想英国桂冠诗人艾尔弗雷德·丁尼生爵士(Alfred,Lord
  Tennyson)那令人耳熟能详的名句:“爱过之后失去总比从来没有爱过好。”[1]换言之,爱是一种优势策略。
  2 .封面之战
  回到《时代》与《新闻周刊》的竞争上来。假设有一个星期出了两桩大新闻:一是众议院和参议院就预算问题吵得不可开交;二是发布了一种据说对艾滋病有特效的新药。编辑们选择封面故事的时候,首要考虑的是哪一条新闻更能吸引报摊前的买主(订户则无论采用哪一条新闻做封面故事都会买这本杂志)。在报摊前的买主当中,假设30%的人对预算问题感兴趣,70%的人对艾滋病新药感兴趣。这些人只会在自己感兴趣的新闻变成封面故事的时候掏钱买杂志;假如两本杂志用了同一条新闻做封面故事,那么感兴趣的买主就会平分两组,一组买《时代》,另一组买《新闻周刊》
  .现在,《时代》的编辑可以进行如下推理:“假如《新闻周刊》采用艾滋病新药做封面故事,那么,假如我采用预算问题,我就会得到整个‘预算问题市场’(即全体读者的30%
  ) ,假如我采用艾滋病新药,我们两家就会平分‘艾滋病新药市场’(即我得到全体读者的35%)
  ,因此,艾滋病新药为我带来的收入就会超过预算问题。假如《新闻周刊》采用预算问题,那么,假如我采用同样的故事,我会得到15%的读者,假如我采用艾滋病新药,就会得到70%的读者;这一次,第二方案同样会为我带来更大的收入。因此,我有一个优势策略,就是采用艾滋病新药做封面。无论我的对手选择采用上述两个新闻当中的哪一个,这一策略都会比我的其他策略更胜一筹。”
  我们可以借助一个简单的表格,更加迅速而清晰地看出这番推理的逻辑性。我们用图3-1 中的两列表示《
  新闻周刊》的对应选择,用两行表示《时代》的对应选择。这时我们得到四个格子,每一个格子对应一组策略。格子里的数字代表《时代》的销量,用购买《时代》的读者数占全体潜在读者数的百分比显示。第一行显示的是假如《时代》选择艾滋病新药,它在《新闻周刊》选择艾滋病新药或者预算问题的两种情况下的销量。第二行显示的是假如《时代》选择预算问题,它在《新闻周刊》选择艾滋病新药或者预算问题的两种情况下的销量。比如说,在左下角或者西南方向的格子,《时代》选择预算问题,《新闻周刊》选择艾滋病新药,结果《时代》得到30%的市场。
  这个优势策略很容易看出来。第一行的两个格子无一例外都比第二朋行对应的格子占优,因为第一行的两个数字都比排在同一列下面的数字大。这是优势地位的特征。通过这个表格,你可以很快就看出这个特征是不是符合。你可以想像自己用第一行覆盖在第二行上面,然后会发现,盖住第二行的是更大的两个数字。相比之下,这个表格在阐述前面一段话的时候具有压倒语言推理的直观优势,而这种优势随着博弈的复杂程度加大而越发明显。在复杂的博弈当中,各方都有好几个策略。
  《 新闻周刊》
  的选择艾滋病新药预算问题图3-1《时代》的销售同理,在这个博弈里,双方都有一个优势策略。为了解释这一点,我们为《新闻周刊》的销量也画了一个表格(如图3-2
  所示)。第一列数字显示的是假如《新闻周刊》采用艾滋病新药,它在《时代》采用艾滋病新药或者预算问题的两种情况下各有多大销量。这一列的两个数字无一例外都比第二列对应的数字占优,你可以再次想像自己拿起第一列覆盖在第二列上时会发现什么。因此,艾滋病新药对《新闻周刊》来说也是优势策略。
  《 新闻周刊》 的选择艾滋病新药预算问题图3-2
  《新闻周刊》的销售以策略观点来看,各方均有一个优势策略的博弈是最简单的一种博弈。虽然其中存在策略互动,却有一个可以预见的结局:全体参与者都会选择自己的优势策略,完全不必理会其他人会怎么做。但这一点并不会降低参与或者思考这种博弈的趣味性。比如,在百码短跑中,优势策略是能跑多快就跑多快,但许多人还是很喜欢参加或者观看这种比赛。在第1章提到的捷尔任斯基广场牢房出现的囚徒困境中,两个参与者都有一个优势策略,只不过这股压倒一切的力量最终将他们引向了一起倒霉的结局。这就提出了一个很有意思的间题:参与者怎样合作才能取得一个更好的结果?我们会在下一章进行更详细的探讨。
  有时候,某参与者有一个优势策略,其他参与者则没有。我们只要略微修改一下《时代》与《新闻周刊》的封面故事大战的例子,就可以描述这种情形。假设全体读者略偏向于选择《时代》。假如两个杂志选择同样的新闻做封面故事,喜欢这个新闻的潜在买主当中有60%的人选择《时代》,40%的人选择《新闻周刊》。现在,我们画出《时代》的销量表格(如图3-3
  所示)。
  图3-3《时代》的销售对于《时代》,艾滋病新药仍然是优势策略,但对于《新闻周刊》,销量表格则变成下面这样(如图3-4 所示)。
  假如你拿起第一列,覆盖在第二列上,你会发现,30被一个较小的数字(28)覆盖,而12却被一个较大的数字(70
  覆盖。没有一个策略占有压倒优势。换言之,《新闻周刊》的最佳选择不再与《时代》的策略无关。假如《时代》选择艾滋病新药,《新闻周刊》选择预算问题就能得到更好的销量,反之亦然。对于《新闻周刊》,得到整个预算问题市场总比得到一个较小份额的艾滋病新药市场要好,虽然整个艾滋病新药市场比预算问题市场要大。
  图3-4《新闻周刊》的销售《新闻周刊》的编辑们不会知道《时代
  的编辑们将会选择什么,不过他们可以分析出来。因为《时代》有一个优势策略,那一定就是他们的选择。因此,《新闻周刊
  的编辑们可以很有把握地假定《时代》已经选了艾滋病新药,并据此选择自己的最佳策略,即预算问题。由此可见,只有一方拥有优势策略的博弈其实也非常简单。拥有优势策略的一方将采用其优势策略,另一方则针对这个策略采用自己的最佳策略。
  现在,既然我们已经介绍了优势策略的概念,就有必要强调两点特征,这两点特征可用来确定什么不是优势策略。人们很容易就会弄糊涂,不知道优势策略的优势究竟是对什么而言的。
  1981年,伦纳德·西尔克(L俄onard
  Silk)在撰写有关国会对《经济复苏税法》争论的新闻时这样概括:“里根先生(Mr.Reagan)早已料到共和党人拥有博弈论中称为‘优势策略’的东西,一个使参与者领先其对手的策略,无论这些对手采用什么策略,结局都是一样。”[2]
  我们将在第5章更加仔细地介绍这个博弈,在这里想指出的是,西尔克对优势策略的定义并不正确。“优势策略”的优势是指你的这个策略对你的其他策略占有优势,而不是对你的对手的策略占有优势。无论对手采用什么策略,某个参与者如果采用优势策略,就能使自己获得比采用任何其他策略更好的结果。回顾封面大战的例子,《时代》和《新闻周刊》都有一个优势策略,但双方都不可能得到比对方更高的销量。
  另一个常见的误解在于,一个优势策略必须满足一个条件,即采用优势策略得到的最坏结果也要比采用另外一个策略得到的最佳结果略胜一筹。在前面讲到的例子里,所有优势策略凑巧都满足这个条件。按照最初设定的条件,《时代》假如采用艾滋病新药做封面故事,最坏的结果是得到35%的市场份额;他们若采用预算问题做封面故事,可能得到的最佳结果是30%的市场份额。但这并非优势策略的一个普遍特征。
  现在让我们想像一下《时代》和《新闻周刊》之间爆发了一场价格战。假设每本杂志的制作成本是1美元,且售价只有两个可能的价位选择,分别是3美元(意味着每本利润为2美元)和2美元(意味着每本利润为1美元)。假设顾客永远倾向于选择价格较低的杂志,且在杂志价格相同的时候两种杂志各得一半读者。杂志定价3美元的时候,读者总数是500万;杂志价格降到2美元,读者总数将升到800
  万。这时,你可以轻易算出《时代》在4种可能出现的价格组合里将会获得多少利润,并由此得出图3-5
  .图3-5《时代》的利润《时代》的优势策略是定价2美元(《新闻周刊》亦如此)。《时代》采用这个优势策略可能得到的最坏结果是赢利400万美元。但是,采用另外一个策略可能得到的最佳结果将超过这一数字,达到500万美元。问题是比较这两个数字毫无意义。500万美元的数字是在两本杂志同时定价3美元的时候出现的;不过,假如这时《时代》把价格降到2美元,利润还会更高,达到800
  美元。
  我们可以把这些例子归纳为一个指导同时行动的博弈的法则。
  法则2:假如你有一个优势策略,请照办。
  不要担心你的对手会怎么做。假如你没有一个优势策略,但你的对手有,那么就当他会采用这个优势策略,相应选择你自己最好的做法。提醒一句:我们已经确立了同时行动的博弈的优势策略的概念。若是换了相继行动的博弈,采用优势策略的时候就要格外留神。因为策略互动的本质已经改变,优势策略的概念也会完全不同。假设我们说你有一个优势策略,无论你的对手选择怎么做,你按照这个策略做都比采用其他策略更好。若是相继行动,而你的对手先行,你就应该一直选择自己的优势策略。正如我们已经说过的那样,这是你对你的对手每一个行动的最佳对策,因此也是对现在他选择的这个特定行动的最佳对策。但是,假如你先行,你就不会知道你的对手将会采取什么行动。他会观察你的选择,同时做出自己的决定,因此你有机会影响他的行动。某些情况下,若是采用优势策略以外的策略,你可能更有效地施加这种影响。我们将在第6章讨论承诺的时候全面分析这个问题。
  3 .劣势策略
  不是所有博弈都有优势策略,哪怕这个博弈只有一个参与者。实际上,优势与其说是一种规律,不如说是一种例外。虽然出现一个优势策略可以大大简化行动的规则,但这些规则却并不适用于大多数现实生活中的博弈。这时候我们必须用到其他原理。
  一个优势策略优于其他任何策略,同样,一个劣势策略则劣于其他任何策略。假如你有一个优势策略,你可以选择采用,并且知道你的对手若是有一个优势策略他也会照办;同样,假如你有一个劣势策略,你应该避免采用,并且知道你的对手若是有一个劣势策略他也会规避。
  假如你只有两个策略可以选择,其中一个是劣势,那么另一个一定是优势策略。因此,与选择优势策略做法完全不同的规避劣势策略做法,必须建立在至少一方拥有至少三个策略的博弈的基础之上。现在就让我们看一个这种类型的简单例子。
  设想一场橄榄球比赛的一次对抗。攻方一门心思竭尽全力向前推进,能跑几码算几码,而守方则全力以赴阻挡对方向前移动,寸步不让。举个例子:当比赛只剩下很少时间,攻方可能希望尽力推进,使自己更容易得到一个射门得分的机会。
  假如攻方只有两个策略,即带球跑动或者传球,而守方则有三个策略——拦截带球跑动,拦截传球以及闪击四分卫(blitz the
  quarterback)。我们可以计算出全部六种策略组合分别能使攻方向前推进多少码的距离。以守方选择闪击四分卫而攻方打算传球为例。假设四分卫被撞得倒退10码的概率是10%
  ,迅速传球传出10码的概率是70%
  ,而传球传出更远达到20码的概率是20%。那么,平均值就是0.1l*(-10)+0.7*10+0.2*20 =-1+7+4
  =10显而易见,这些数字本应该以两队拥有或者缺少的特殊技能为基础;我们只不过为了描述方便而选择了一些非常独特的技巧。①①
  在这个例子里,攻方善于传球,不善于带球跑动。因此,即便是在对方集中防御传球的时候,选择传球还是会比带球跑动更好。带球之所以比闪击四分卫更好,是因为防守后卫不在他们的位置上。
  我们用图3-6 显示所有六种策略组合将会得出怎样的计算结果。
  图3-6攻方期望得到的码数如图3-6所示,攻方竭力要得到最大数目,守方则尽量压低这个数目,因此,我们没有必要分开列表确定他们的行动。①①
  所有零和博弈都会出现这样的情况,而零和博弈是指一方所得等于另一方所失。
  双方都没有一个优势策略:没有一行的数字完全高于另一行,也没有一列的数字完全低于另一列。不过,守方倒是有一个劣势策略,就是闪击四分卫。闪击四分卫的结果是无论如何都会拱手让出较大的码数,因此,这一策略对于守方而言会比它采用其他可能的策略都更糟糕。因此,守方不应该闪击四分卫,攻方也可以非常自信地认定对手不会那么做。
  至此,这场推导尚未结束。闪击策略可能从守方教练的笔记本中删除了,整个比赛可以被视为双方各有两个策略。在这场经过简化的比赛中,攻方有一个优势策略,就是传球。其数字分别是9和8,都大于带球跑动策略的数字,分别是3和
  .传球之所以不是原来的比赛的优势策略,原因在于,带球跑动的结果在守方采取闪击策略的时候会有一个比较理想的结果(因为带球者可能趁守方闪击四分卫而分身无术时,顺利突人开阔地带),而现在闪击策略已经不予考虑。因此,攻方将会选择传球。反过来,守方也会想到这一点,选择自己的最佳策略,即防守传球。
  这里涉及的普遍适用的概念可以归纳为一个指导相继移动的博弈的行动法则。
  法则3 :剔除所有劣势策略,不予考虑,如此一步一步做下去。
  假如在这么做的过程当中,在较小的博弈里出现了优势策略,应该一步一步挑选出来。假如这个过程以一个独一无二的结果告终,那就意味着你找到了参与者的行动指南以及这个博弈的结果。即便这个过程不会以一个独一无二的结果告终,它也会缩刁整个博弈的规模,降低博弈的复杂程度。
  我们以一个虚构的波斯湾海军对峙局势具体描述逐步剔除劣势策略的做法。② 图3-7
  所示的格栅代表战斗舰艇的方位以及可能的选择。I点的一艘伊拉克舰艇准备发射一枚导弹,企图击毁A点的一艘美国舰艇。这枚导弹的路径已经由电脑程序在发射的时候确定,可以直线前进,也可以每隔20秒大幅转动一个直角。假如这枚伊拉克导弹笔直从I点飞向A点,美国导弹防御系统可以非常轻易地进行拦截。因此,伊拉克一定会尝试带点拐弯的路径。所有能从I点通向A点的路径已经由下面的格栅显示出来。每条边的长度,比如IF的长度,等于这枚导②这个故事是J.D.威廉斯(J.D.Williams)在《完全策略大师》(The
  Compleat Strategyst)一书中描绘的猫捉老鼠游戏的一个更新版本。猫可能指的就是波斯人。弹20 秒之内可以走过的距离。
  那艘美国舰艇的雷达会监测到伊拉克舰艇发射的这枚导弹,因此电脑会马上发射一枚反导弹。反导弹的速度和伊拉克导弹相同,也可以做同样的90度拐弯。于是,这枚反导弹的路径也可以用同样的格栅表示,只不过这次是由A点出发。但是,为了填装足够撞毁一枚导弹的爆炸物,反导弹不得不少装燃料,装的燃料只够它飞行1分钟,因此,它只能走过三个节点(比如,从A
  到B点,B点到C点,然后再从C点到F点,这一路径我们用ABCF表示)。
  图3-7假如在这1分钟开始之前或者结束之际,我们的反导弹将与来犯的导弹相遇,那么,反导弹就会爆炸,消除伊拉克导弹的威胁,否则伊拉克导弹就会击中我们的舰艇。问题是,应该怎样选择两枚导弹的路径?在这个博弈里,值得关注的只有第1分钟的路径。各方必须事先想好三个20秒时间段应该怎么走。将每个时间段的可能选择加起来,双方各有8条可能的路径,共有64种组合方式。我们现在就来考察全部64种组合方式,计算哪些方式下反导弹和导弹会迎头相撞,哪些方式下不会相撞。
  举个例子:假设伊拉克选择IFCB,即头两个时间段直线从I点经F点到C点,然后转90度到B.对照美国的ABCF策略,可见,反导弹和导弹将在两个时间段(即40秒)之后在C点相遇,因此这一组合的结果是相撞。假如伊拉克还是采取IFCB策略,而美国却选择ABEF迎击,反导弹和导弹就不会相撞。表面上看来,上述弹道都经过B点和F点,但反导弹和导弹是在不同时间达到这些点;比如美国反导弹20秒后到达B点,而伊拉克导弹则要在60秒后到达。
  图3-8显示了所有这样的组合。伊拉克的8个策略分别标为I1到I8,同时标出具体路径,比如I1表示IFCB.同样地,美国的策略用A1到A8表示。相撞的结果记做H,不会相撞的结果记做O.图3-8
  击中与错过图图3-8看起来好像很复杂,但只要借助消除劣势策略的法则,就能将其大大简化。美国反导弹的目标在于得到相撞的结果,因此在美国人看来,H强于O.不难看出,对于美国人,A2策略与A4策略相比处于劣势:假如你将A4行举起,盖在A2行上面,你会发现,只要是A2
  得到H的地方,A4也会得到H,而且A4还多一个H,即对应伊拉克巧策略的地方。对全部可能性进行这样的分析,可以知道A2、A3、A6和A7策略与A4和A8策略相比处于劣势,A1不及A8,
  A8又不及A4.因此,伊拉克人可以确信美国人只会采取A4或者A8策略。伊拉克人把注意力集中在这两行,一心想避免反导弹和导弹相撞,因此在他们看来,I2、I3、I4、I6、I7和I8策略与I1或者I5策略相比处于劣势。划掉劣势策略所在的行和列之后,整个博弈就简化为图3-10
  .*
  *简化过程详见图3-9.——译者注我们的两个法则不可能将图3-10进一步简化了,因为这里已经没有任何优势策略或者劣势策略可言。不过,我们已经做得很不错了。看一看表格里剩下的策略,我们发现,伊拉克导弹应该沿着格栅外围前进,而美国反导弹则应该小步曲折前进。这样,我们很快就能看到双方应该怎样从各自拥有的两个方案中进行抉择了。
  图3-9,击中与错过图图3-10,简化的击中与错过图
  4 .均衡策略
  利用优势策略方法与劣势策略方法进行简化之后,整个博弈的复杂程度已经降到最低限度,不能继续简化,而我们也不得不面对循环推理的问题。你的最佳策略要以对手的最佳策略为基础,反过来从你的对手的角度分析也是一样。接下来我们将会介绍解开这个循环的技巧,最终走出这个循环。
  为了说明这一点,我们首先回到《时代》与《新闻周刊》的价格战,不过这次不会假设备选价格只有2美元和3美元两种,而是一系列价格。现在,《时代》的管理层必须针对《新闻周刊》可能选择的每一个价格确定最佳对策。假设每种杂志都有一群忠实读者,也有一群可能受到价格竞争影响的流动读者。如果出于某种原因,《新闻周刊》的管理层把价格定在1美元的水平,也就是制作成本的水平,那么,《时代》的管理层一定不会跟随这个毫无盈利的价格策略,而会定出一个较高的价格,杂志仍然可以卖给忠实读者而获得一定利润。如果《新闻周刊》提价,那么《时代》也会提价,只不过幅度较小,从而为自己赢得一定的竞争优势。假定《新闻周刊》每提价1美元,《时代》的最佳对策是提价50美分,于是,我们可以用图3-11表示《时代》针对《新闻周刊》可能选择的每一个定价而确定的最佳对策。
  我们假定两本杂志的成本一样,具有同等大小的忠实读者群以及同样的吸引流动读者群的能力。那么,《新闻周刊》针对《时代》可能选择的每一个定价而确定的最佳对策将与图3-11完全一致。
  现在我们可以想像两种杂志的经理正各自埋头琢磨。《时代》的经理说:“如果他卖1美元,我就卖2美元。不过,他因为知道我这么想,所以不会真的卖1美元,而是执行他在我卖2美元时的最佳对策,即2.50
  美元。那样的话我就不能卖2美元,而是采用我在他卖2.50 美元时的最佳对策,卖2.75 美元。不过,他因为知道我这么想……
  ”这样一层一层分析下去,究竟有完没完呢?
  有的,结局是3美元。假如这位《时代》经理认为《新闻周刊》会卖3美元,那么他自己的最佳对策就是也卖3美元,反过来,从《新闻周刊》的角度分析也是一样。整个循环推理最后将聚成一点。
  我们可以用图3-12 来显示这个结果,该图同时反映了两者的对策。可以看到,两条线在两家都卖3美元的一点相交。
  图3-ll图3-12我们已经找到了一个策略组合,其中,各方的行动就是针对对方行动而确定的最佳对策。一旦知道对方在做什么,就没人愿意改变自己的做法。博弈论学者把这么一个结果称为“均衡”。这个概念是由普林斯顿大学数学家约翰·纳什(John
  Nash)提出的。纳什的想法成为我们指导同时行动博弈的最后一个法则的基础。这个法则如下。
  法则4:走完寻找优势策略和剔除劣势策略的捷径之后,下一步就是寻找这个博弈的均衡。
  这一定就是夏洛克·福尔摩斯和莫里亚蒂教授曾经用来看穿对方心思的秘诀。
  我们还要解释一下这个法则。为什么一个博弈的参与者非得达到这么一个结局呢?我们可以说出好几个理由。没有一个理由本身就有足够的说服力,不过,只要把几个理由结合起来,就能形成一个有力的答案。
  首先,存在避免循环推理的必要,因为循环推理帮不上忙。均衡在没完没了的“我知道他知道我知道……
  ”的循环里是稳定不变的,这使参与者对其他人的行动的估计能保持连贯性。各方正确预计别人的行动,并且确定自己的最佳对策。
  均衡策略的第二个好处出现在零和博弈中。在这种博弈里,参与者的利益严格相悖。你的对手不能通过引诱你采取一个均衡策略而得到任何好处。你已经充分考虑到他们对你正在做的事情会有什么样的最佳对策。
  第三个理由是,均衡方法注重实效。要想证明一个东西是布丁,就要吃一吃。综观全书,我们将会利用均衡方法讨论许多博弈。我们希望读者来检验它对博弈结果的预测以及这种思维方式产生的行为指导方针。我们相信,这么做会使我们提供的案例更有意思,比抽象地讨论均衡方法的优点更有意义。[3]最后,可能存在一个对均衡概念的误解,我们希望各位可以避免。当我们说博弈的结果是均衡,并不自动意味着这就是对博弈的全体参与者最有利的结果,更不意味着是对整个社会作为一个整体而言最有利的结果。有利或者不利的评价永远属于另外一个问题,答案视各个案例的具体情况而各有不同。在第4章和第9章,我们会谈到这两种例子。
  5 .盛宴还是饥荒
  盛宴
  均衡的概念是不是同时行动的博弈中循环推理问题的一个完全解?老天爷,不是的。有些博弈存在好几个均衡,有些博弈却一个均衡也没有,而在另外一些博弈里,均衡的概念还会由于接纳新型策略而变得更加微妙。我们现在就来描述和解释这几点。
  开车的时候你应该走哪一边?这个问题不能通过运用优势策略或者劣势策略理论予以回答。不过,即便如此,答案却显得很简单。假如别人都靠右行驶,你也会留在右边。套用“假如我认为他认为”的框架进行分析,假如每个人都认为其他人认为每个人都会靠右行驶,那么每个人都会靠右行驶,而他们的预计也全都确切无误。靠右行驶将成为一个均衡。
  不过,靠左行驶也是一个均衡,正如在英国、澳大利亚和日本出现的情况。这个博弈有两个均衡。均衡的概念没有告诉我们哪一个更好或者哪一个应该更好。假如一个博弈具有多个均衡,所有参与者必须就应该选择哪一个达成共识,否则就会导致困惑。
  在开车行驶的例子里,一条早已制定的规则给了你答案。不过,若是遇到彼得和波拉打电话打到一半突然断了的事,你该怎么办?假如彼得马上再给波拉打电话,那么波拉应该留在电话旁(且不要给彼得打电话),好把自家电话的线路空出来。另一方面,假如波拉等待彼得给她打电话,而彼得也在等待,那么他们的聊天就永远没有机会继续下去。一方的最佳策略取决于另一方会采取什么行动。这里又有两个均衡,一个是彼得打电话而波拉等在一边,另一个则是恰好相反。
  这两个人需要进行一次谈话,以帮助他们确定彼此一致的策略,也就是就应该选择哪一个均衡达成共识。一个解决方案是,原来打电话的一方再次负责打电话,而原来接电话的一方则继续等待电话铃响。这么做的好处是原来打电话的一方知道另一方的电话号码,反过来却未必是这样。另一种可能性是,假如一方可以免费打电话,而另一方不可以(比如彼得是在办公室而波拉用的是收费电话),那么,解决方案是拥有免费电话的一方应该负责第二次打电话。
  为了检验读者协调达成一个均衡的能力,请思考下面的问题:明天某个时候你要在纽约市会见某人。他已被告知要与你会面。不过,双方都没有更多信息,不知道究竟何时或者在哪里会面。那么,你应该于何时去何地?
  托马斯·谢林(Thomas
  Schelling)在他的《冲突策略》一书里使这个问题家喻户晓。这个问题只有通常最常见的答案,除此之外没有任何预先确定的正确答案。在我们的学生当中,正午时分在中央车站一直是最常见的答案。即便是普林斯顿的学生,虽然他们乘坐的到纽约的火车是在宾州车站而非中央车站停,他们的答案也是一样。①①
  也许最具创意的另一个答案来自加州大学圣迭戈分校教授塔妮亚·鲁尔曼(Tanya
  Luhrmann)。她的回答是:“纽约公立图书馆阅览室。”我们告诉她,这假如不是空前绝后的答案,也是相当少见的答案。她立即为她的选择进行了辩解。她说,这是因为,虽然她的成功机会可能很低,可她还是更有兴趣跟愿意选择纽约公立图书馆阅览室而非选择纽约中央车站的人见面!
  饥荒
  另一个复杂因素在于,并非所有博弈都有我们前面描述的那种均衡,哪怕是一个,在导弹截击的故事里,余下4个结果没有一个是均衡。举个例子,我们看看伊拉克I1策略遇到美国A4策略的情况。这一策略组合的结果是反导弹没能拦截导弹,假如美国转向A8策略,情况就会大不一样。不过,那样的话伊拉克就该转向I5策略,而美国反过来也要转向A4
  策略,伊拉克则相应转向I1策略,如此类推。关键在于,如果一方坚守某种确定行为,另一方就会因此大占便宜。双方惟一明智的做法在于随机选择自己这一步怎么走。实际上,导弹截击问题具有很强的对称性,以至于正确的策略组合简直是显而易见的:美国的策略应该随机地“一分为二”,一半时间选择A4策略,另一半时间选择A8策略,伊拉克则以同样的概率选择I1和I5策略。
  这种“混合策略”即便在双方打算合作的时候也会出现。在前面提到的打电话的例子中,设想双方都投硬币决定自己是不是应该给对方打电话,根据前面给出的条件,两人这种随机行动的组合成为第三个均衡:假如我打算给你打电话,我有一半机会可以打通(因为这时你恰巧在等我打电话),还有一半机会发现电话占线;假如我等你打电话,那么,我同样会有一半机会接到你的电话,因为你有一半机会主动给我打电话。每一个回合双方完全不知道对方将会采取什么行动,他们的做法实际上对彼此都最理想。因为我们只有一半机会重新开始被打断的电话聊天,我们知道我们(平均来说)要尝试两次才能成功接通。
  而在其他博弈中,各方应该按照什么概率采取不同策略的答案却没有这么明显。在第7章我们会建立一套法则来确定什么时候需要采取混合策略,还会介绍一个找出正确的几率组合的方法。
  我们现在简要回顾一下。在同时行动的博弈中,我们有三个行动法则:一是寻找和运用优势策略;二是寻找和避免劣势策略,与此同时假设你的对手也在这么做;三是寻找和运用均衡。本章结束之际,我们来看一个案例,这个案例向各位展示了这些指导法则是怎样转化为实际行动的。
  6 .案例分析之三:莽汉软招
  罗伯特·坎普(Robert
  Campeau)在第一次投标收购联盟商店(及其掌上明珠布鲁明代尔百货商店)的时候,运用了一个称为两阶段出价法的竞购方案。这个案例分析将会研究这种出价方案作为一个策略行动的效能。这一行动会不会让收购者占了便宜,从而违反公平原则了呢?
  典型的两阶段出价法给先出让股份的股东支付的价格高,给后出让股份的股东支付的价格低。为避免复杂的计算,我们假设出价收购前的股价是每股100美元。收购者在第一阶段提出一个较高价格,即每股105美元,向先出让股份的股东支付,直到全部股份的一半出让为止。另一半待出让股份则进入第二阶段,收购者愿意支付的股价只有90美元。出于公平原则,股份不是按照股东出让的时间次序分属不同阶段。相反,每个人都会得到一个混合的价格:所有出让股份会按照一定比例均等划入两个阶段(假如招标成功,那些未出让自己股份的人就会发现他们的股份落入第二阶段)。①
  我们可以用一个简单的代数表达式说明这些股份的平均支付价格。假如愿意出让的股份不超过50%
  ,每个人都会得到105美元的股价;假如这家公司的全部股份当中有X%愿意出让,且X%〉=50%
  ,那么,每股平均价格就是$105*50/X+$90*(X-50/X)=90+15*50/X①
  拥有这家公司控制权的收购者有权将公司收为私有,然后悉数收购余下股份。按照法律,他必须向这些股东提供一个“公平市场”价格,以收购他们的股份。一般而言,在两阶段出价的竞购过程中,较低阶段的出价应该仍在可被接纳为公平市场价值的范围内。
  值得注意的一点是,两阶段出价的竞购方案是无条件进行的;即便收购者没能得到公司的控制权,仍然应该按照第一阶段的价格收购全部愿意拍卖的股票。第二个特点在于,两阶段出价法的性质决定了假如所有人都愿意出让自己的股票,那么每股的平均价格只有97.
  50美元。这个价格不仅低于收购者提出收购前的股价,也低于股东们在收购失败后可能得到的股价,这是因为,假如收购者被击败,股东们将会看到股价回到原来100美元的水平。因此,股东们希望要么收购者被击败,要么再出现一个收购者。
  实际上,当时真的出现了另一个收购者,那就是梅西百货公司。现在就让我们假设梅西提出一个有条件的收购计划:它愿意用每股102
  美元的价钱收购股份,前提是它能得到该公司大部分股份,那么,你将向哪一家出让你的股份,而你又觉得哪一家的计划会成功呢?
  案例讨论以两阶段出价的竞购方案来出让股份,是一种优势策略。为了证明这一点,我们会考察全部可能的情形。总共存在3种可能性,分别是:两阶段出价的竞购方案吸引到的股份不足50%
  ,因而收购失败。
  两阶段出价的竞购方案吸引到超过50%的股份,因而收购成功。
  两阶段出价的竞购方案刚好吸引到50%的股份;假如这时你同意出让你的股份,收购就能成功,否则的话收购只能失败。
  在第一种情形下,两阶段出价的竞购方案遭到失败,因此,股价要么回到100美元水平,要么达到102美元,后者是在竞争对手成功收购的条件下。不过,假如你出让自己的股份,你就能得到105美元的股价,比前面提到的两个结果都要好。在第二种情形下,假如你不出让你的股份,你能得到的股价只有90美元,而出让股份则至少能让你得到97.50
  美元。因此,出让股份仍然是一个更好的选择。在第三种情形下,假如收购成功,别人得到的价格都不如以前,但你自己的结果却变好了。理由是,由于出让的股份刚好达到50%
  ,你将得到105美元的股价。这个价格值得出让。因此你愿意促成这桩收购。
  因为出让是一种优势策略,我们可以预计人人都愿意出让自己的股份。一旦人人都出让股份,每股的平均混合价格可能低于收购前的价格,甚至可能低于预期收购失败后的价格。因此,两阶段出价的竞购方案可以使收购者以低于公司价值的价格收购成功。由此可见,股东们拥有一个优势策略的事实并不意味着他们就能占先。收购者利用第二阶段的低价不公平地占到了便宜。通常,第二阶段的狡猾本质不会像在我们这里给出的例子那样赤裸裸地暴露出来,因为这一胁迫手段多多少少会被收购后红利的诱惑隐蔽起来。假如一家公司在收购之后的实际价值是每股110美元,收购者仍然可以通过一个低于110美元而又高于100美元的第二阶段出价占到便宜。律师们认为两阶段出价法具有胁迫性质,并且成功地利用这一点作为一个依据,在法庭上跟收购者打官司。在争夺布鲁明代尔的战役中,罗伯特·坎普取得最后胜利,但他却是通过一个修改了的出价达到目的的,其中并不包含任何阶段性的结构。
  我们还会发现,一个有条件的竞购方案对于一个无条件的两阶段出价竞购方案不是一个有力的抵御策略。在我们给出的例子中,假如梅西许诺无条件支付每股102美元的话,那么它的竞购方案就会更难对付。梅西的无条件竞购将会破坏两阶段出价竞购方案取胜而达到的均衡。理由在于,假如人们认为两阶段出价竞购方案笃定取胜,他们将会得到的只是97.50
  美元的平均混合价格,而这个数字显然低于他们把股份出让给梅西将会得到的股价。因此,不可能出现股东们希望两阶段出价竞购方案成功且又愿意向梅西出让股份的情况。①①不幸的是,同样不可能出现一个梅西竞购成功的均衡点,因为若是这样,意味着两阶段出价的竞购方案吸引到不足50%的股份,那么股价仍将高于梅西愿意支付的价格。唉,这就是一个没有均衡点的例子。要想找出解决方案就必须用到随机策略,这一点我们将在第7章进行讨论。
  1989
  年年底,坎普由于负债累累而陷人经营困境。联盟商店按照《破产法》第十一条申请重组。当我们说坎普的策略很成功时,我们只想表明他的策略成功地达到了赢得竞购战的目的。成功经营一家公司完全是另外一场不同的博弈。
  第1部分结语
  我们在前三章借助商界、体育、政治等领域的例子作为辅助工具,介绍了许多概念和方法。在后面的章节,我们会实际运用这些概念和技巧。这里我们对这些概念和技巧进行回顾和总结,供读者参考。
  博弈是一种策略的相互依存状况:你的选择(即策略)将会得到什么结果,取决于另一个或者另一群有目的的行动者的选择。处于一个博弈中的决策者称为参与者,而他们的选择称为行动。一个博弈当中的参与者的利益可能严格对立,一人所得永远等于另一人所失。这样的博弈称为零和博弈。不过,更常见的情况是,既有共同利益,也有利益冲突,从而可能出现导致共同受益或者共同受害的策略组合。但是,我们通常还是会把这个博弈当中的其他参与者称为一方的对手。
  一个博弈的行动可能是相继进行,也可能是同时进行。在相继行动的博弈里,存在一条线性思维链:假如我这么做,我的对手可以那么做,反过来我应该这样应对……
  这种博弈通过描绘博弈树进行研究。只要遵循法则1:向前展望,倒后推理,就能找出最佳行动方式。
  而在同时行动的博弈中,存在一个逻辑循环的推理过程:我认为他认为我认为……
  这个循环必须解开,一方必须看穿对手的行动,哪怕他在行动的时候并不知道这是怎么一回事。要想解开这么一种博弈,可以建立一张图,这张图能显示所有可能想像得到的策略组合将会相应产生什么结果。然后按照下列步骤进行分析。
  首先看参与各方有没有优势策略,优势策略意味着,无论对手采取什么策略,这一策略都将胜过其他任何策略。这就引出法则2:假如你有一个优势策略,请照办。假如你没有优势策略,但你的对手有,那么,尽管认定他一定会照办吧,然后相应选择你自己的最佳策略。
  接着,假如没有一方拥有优势策略,那就看看有没有人拥有一个劣势策略,劣势策略意味着无论对手采取什么策略,这一策略都将逊于其他任何策略。如果有,请遵循法则3:剔除劣势策略,不予考虑。如此一步一步做下去。假如在这么做的过程当中,在简化之后的博弈里出现了一个优势策略,应该采用这个优势策略。假如这个过程以一个独一无二的结果告终,那就意味着你找到了参与者的行动法则以及这个博弈的结果。即便这个过程可能不会导出一个独一无二的结果,这么做也可以缩小整个博弈的规模,使其变得更加容易控制。最后,假如既没有优势策略,又没有劣势策略,又或者这个博弈已经经过第二步进行了最大限度的简化,那么,请遵循法则4:寻找这个博弈的均衡,即一对策略,按照这对策略做,各个参与者的行动都是对对方行动的最佳回应。假如存在一个这样的独一无二的均衡,我们就有许多很好的证据证明为什么所有参与者都应该选择这个均衡。假如存在许多这样的均衡,你就需要用一个普遍认同的法则或者惯例做出取舍。假如并不存在这样的均衡,这通常意味着一切有规则可循的行为都有可能被对方加以利用,这时候你需要将你的策略混合运用。
  在实践当中,博弈可能包含一些相继行动过程,也可能包含一些同时行动过程,因此须将上述技巧综合起来,灵活运用,思考和决定自己的最佳行动应该是什么。