メイキングラバーズ:学习博弈论的目的,不是为了赢得更好的结局,而在于享受博弈分析的过程

来源：百度文库编辑：偶看新闻时间：2024/04/29 01:19:34

学习博弈论的目的,不是为了赢得更好的结局,而在于享受博弈分析的过程.

中国发展出版社日常生活中的博弈策略
王春永编著
    本书通过日常生恬中常见的例子，来介绍博弈论的基本
思想及运用，井日寻求用这种智慧来指导生活决策的方法。
    休还记得找j一司要求提薪未果，自己也不知道是为什么
吗?如果休能学习一点博弈的策略知识．就可以做到提升工
资水平．而且提的幅度比你预料的还多。
    你还iL得上次凼为迁就女友而倍感委曲吗?如果应用博
弈论的知识，保证你能够和她相处得更为融治。
你不知应设如何对付一个总是借钱不还的朋友吗?你小
知道如何与生意对手讨价还价吗?
    阅读本书，我们便知道如何运用博弈论的。诡计”
大限度地在这个被动过手脚的环境中实现自己的目标。
．
博弈论就在你身边
    阿普顿是普林斯大学的高材生，毕业后被安排在爱迪生身边工作，他对
依靠自学而没有文凭的爱迪生很不以为然。
    一次，爱迪生要阿普顿算出梨形玻璃泡的容积，阿普顿点点头，心想：
这么简单的事一会几就行了。只见他拿来梨形玻璃泡，用尺上下量了几遍，
再按照武样在纸上画好革田，列出了一道算式，算来算去，算得满头大汗仍
没算出来。一连换了几十个公式，还是没结果，阿普顿惠得满脸通红，狼狈
不堪。
    爱迪生在实验室等了很久，觉得奇怪，便走到阿普顿的工作问，看到几
张白纸上密密麻麻的算式．便笑荚说：“您这样计算太浪费时间了。”
    只见爱迪生将一杯水倒连玻璃泡内，交给阿普顿说：“再找个量筒来就知
道答案了。”阿普顿茅塞顿开，终于对爱迪生敬服．最后成为爱迪生事业上的
好助手。
    有时候。科学并不一定意味着烦琐的计算与剥量，而是一种有浓厚艺术
气息的思维方式。前者固然可以得出正确的结论，但是后者同样可以用一种
出入意表的方式曲径通幽。这种方式，与我们在生活中运用博弈科学有异曲
同工之妙。大量的教学模型吓不倒我们，因为我们可以对它们置之不理。
    有一个脑筋息转弯问题是这样的：
    在什么情况下零大干二，二大干五，五又大干零’
    答案是：在玩“石头．剪刀．布”游戏的时候。
    博弈．就是用这种游戏思维来突破看似无法改变的局面，解决现实的严
肃问题的策略。在博弈中，每个参与者都在特定条件下争取其最大利益，强
差一
者来必胜券在握，弱者也未必永无出头之日。因为在博弈中，特别是多十参
与者的博彝中，结果不仅取决干参与者的实力与策略，而且还取决于其他参
与者的制约和策略。
    事实上，博弈过程本来就不过是一种日常现象。我们在日常生活中经常
薷要先分析他人的意田从而做出合理的行为选择，而所谓博弈就是行为者在
一定环境条件和规则下，选择一定的行为或策略加以实施并取得相应结果的
过程。
    博弈论用途很广。但正如上文所讲，博彝论原是数学运筹中的一个支系，
其研究运用了种种的数学工具，一般读者如何能掌握呢?
    这里存在着一个矛盾。一方面，正如马克思所说：一种科学只有在成功
地运用了数学时，才算是达到了真正完善的地步；另一方面，数学似乎成了
博弈论和我们普通人的生活之间的一条难以逾越的鸿沟。
    面对这条鸿沟，很多人的反应要么是耸耸肩膀走开，少数人台企图通过
学习教学柬菠过。但是这两种反应都忽略了一个很浅显的道理：一个不会编
程的人麒样可以成为电脑应用高手，没有高深的数学知识，我们同样可蹦通
过博弈论的学习成为生活中的策略高手。就像孙膑没有学过高等数学，但是
这并不影响他通过运用策略来帮助田忌赢得赛马。
    博弈论首先是我们思索现实世界的一套逻辑，其次才是把这套逻辑严密
化的数学形式。博彝论的目的在于巧妙的策略，而不是解法。我们学习博弈
论的目的．不是为了享受博彝分析的过程，而在于赢得更好的结局。说到底，
博彝论毕竟只是一个分析问题的工具，用这个工具来简化问题，使问题的分
析清晰明了也就够了。
    另一方面，博弈的思想既然来自现实生活，它就既可以高度抽象化地用
教学工具来表述，也可以用日常事例来说明，并运用到生活中去。本书作者
所做的一切努力，正是试图通过日常生活中常见的例子，来介绍博弈论的基
本思想及运用，并且寻求用这种智慧来指导生活决策的方法。
    阅读本书，我们除了了解到令人震撼的社会真实轨迹之外．还可以学到
最合适的待人处世方法。
    你还记得上次找上司要求提薪未果，自己也不知道是为什么吗?可惜．
博奔论就在你身边
那时你还没有学习一点博弈的策略知识．这些知识本来可以帮助体提工资，
而且提的幅度比体预料的还多。
    体还记得上次因为迁就女友而倍感垂曲吗’如果应用博弈论的知识，保
证你能够和她相处得更为融涪。
    你不知应该如何对付一个总是借钱不还的朋友吗?或者如何与生意对手
讨价还价吗?
    约瑟夫·福特曹经说：上帝和整个宇宙玩敢于，但是这些骰子是被动了
手脚的。这话一点不错，我们的主要目的．是要了解它是怎样被动的手脚，
我们又应如何利用博弈论的“诡计”，最大限度地在这个被动过手脚的环境中
实现自己的目标。
                                                   ---作者
第1章走近博弈论：一场游戏一场梦
战争是怎样发生的，l
博弈的构成要素，4
相互依存与均衡，6
负和、零和与正和／9
博弈论的局限性，l】
第2章囚徒困境：自愿坐牢的嫌疑人
克椿勃们的小花招，13
不背叛就会被淘汰，17
把对方陷入困境中，18
倒霉是因为太聪明／20
对执法者也有启示，22
第3章重复博弈：一夜情与地老天荒
没有未来必然背叛，24
如何破解迟到困局，26
带剑的契约才有效／27
用道德来保证均衡，29
假装不知道有尽头，32
博彝论的碰}舻
第4章一报还一报：出来混迟早要还的
以牙还牙，雌眼还眼，35
地者天荒的胜利者，39
向合作进化的棘轮，4l
在一在二不在三，43
以直报怨的人生哲学，46
输掉战役赢战争，48
第5章人质困境：多个人的囚徒困境
赫鲁晓夫在哪里，52
束手无策的人群，55
两种理性的矛盾，57
威力巨大的武器，60
是竞争也是劫持，6l
与对手联合起来，63
第6章酒吧博弈：混沌系统中的策略
酒吧里会有多少人，66
一加一未必等于二，69
混沌世界里的临界点／72
谁颠覆了社区的平衡，74
策略的多米诺骨脾，77
“少数者”的红衣服，79
让开那架独木桥，82
第7章枪手博弈：先发优势与后发制人
谁能最后活下来，84
同时出招的策略，88
相继出招的蓑略，90
陆逊为什么回兵，92
进攻方向的选择，94
王身事外的智慧，98
第8章猎鹿博弈：走上集体优化之路
从胡雪岩破产谈起，】0l
“看不见的手”失灵，105
从合作走向共赢／107
猎人的帕累托效率，109
猎鹿中的公平问题，112
公共资源的悲剧，113
第9章智猪博弈：多劳并不多得
小猪躺着大猪跑，】16
比比皆是的智猪，119
猪圜里的跟随策略，122
后发制人的策略，124
什么时候应谊出手，125
汽车在哪扇门后面，127
冒险襞略趟早越好，130
对管理者的启示，134
第’0章警察与小偷博弈：猜猜猜与换换换
从防小偷地图谈起，】37
当电话打到一半时，140
乱拳打死老师傅，142
不可预测的算计，144
纯粹的随机策略，147
槽糕策略的背后，149
5I
博奔论的l岔舻
第11章斗鸡博弈：狭路相逢的策略
二虎相争盐有一伤，151
鹬蚌相争的困局，152
攻击的“仪式化”，155
把时手变成朋友，157
学会见好就收，158
让老板加薪的博弈，160
第12章协和谬误：欲罢不能的团局
不能承受的代价，162
认赔服输的智慧，164
不要去看碗背面／167
要考虑机会成本，】69
有勇气咬断后腿，172
生活如一袋豌豆，174
放弃愚蠢的坚持，175
强迫自己击成功，177
第13章蜈蚣博弈：从终点出发的思维
强盗们如何分脏，180
人生的倒后推理，184
从墓志铭想人生，186
蜈蚣博彝的悖论，189
第14章分蛋糕博弈：革命就是讨价还价
创造生活的艺术，193
蛋糕在不断融化／195
煮了吃还是蒸了吃，198
坚定不移的力量，200
单数与双数的优势，20i
减少你的等待成本，203
保护讨价还价能力，205
货比三家的艺术，207
外部机会的算计，208
偷梁换柱来还价，210
进二退一的囊略，212
第15章鹰鸽博弈：进化中的路径依赖
办公室里的高纸板，215
栅栏上的路径依赖，217
胜出的未必是好的，219
孙权敖与超速均衡，223
香蕉可以从两头吃／225
成名发财都要趁早／228
第16章脏脸博弈：共同知识的车轱辘
他们为什么会脸红，230
别人的信封更谤人，232
1天与100天的博弃，236
共同知识的作用，238
第17章信息不对称：买的不如卖的精
劣币驱遥良币效应，240
只许佳人独自知，243
不确定性带来风险，245
信息决定博弈结果，247
信息披露的策略，249
应谊传递什么信号／250
清官为什么被淘汰，253
。l
博奔论的瘫}舻
第18章信息传递：好酒也怕巷子深
无法发起的总攻，256
信息传递的模型／257
标王背后的博弃／260
信息传递有成本，263
第19章信息甄别：分离均衡的筛于
粮中的分离均衡，265
票价为何如此低，268
所罗门王的智慧，271
老虎的信息甄别，273
第20章策略欺骗：假作真时真亦假
善用自己的弱点／276
被人耍弄的杨修，278
j1拿别人当笨蛋，28l
不要暴露了自己，283
茕略欺骗的步骤，285
第21章承诺与威胁：胡萝I、加大棒的艺术
不战而胜的策略，288
威胁与许诺要适度，291
无条件的回应规则，293
保护好自己的武器，296
西点军校的规矩，298
蓑略意义的可信度，300
陆象先的边缘政策，：301
小步慢行的策略，303
参考文献
《‰
第1章
走近博弈论：一场游戏一场梦
何不游戏人间
专它盘麓事，拳A
何不游戏人间
看尽思思想怨
喔…何不游戏人间
管它风风波波多少年
——《游戏人闻》歌词
战争是怎样发生的
    8岁的男孩问父亲：“爸爸，战争是怎样发生的7”男孩的父亲回答：“很
简单。比如说第一次世界大战的爆发，是因为德国入侵比利时-…-”在一旁
的妻子立即打断他的话：“你讲得不对。第一次世界大战的起因是有人在萨拉
热窝被刺杀了。”丈夫听了一脸不悦．冲妻子不耐烦地说道：“是你回答这个
问题，还是我回答，”妻子听了也是满脸的不高兴，她转身跑出起居室．砰
的一声将门关上。紧接着，从厨房传来碗碟猛摔在地上的声音，过了一会儿，
整个屋子陷入死一般的沉寂。男弦眼眶里含着泪水．轻声说：“爸爸，你不用
说了，我知道战争是怎样发生的了。”
    夫妻二人以一种两败俱伤的方式，使自己的孩子明白了战争的发生和夫
妻两个人吵架之间的内在关联：让国家之间一步步走向世界大战的机制，同
样也正是同一屋檐下夫妻失和的原因。
    也就是说，无论国与国之间，还是人与人之间的合作和冲突，其中所蕴
含的博弈原理是大同小异的。诺贝尔经济学奖得主奥曼在权威的《帕尔格雷
夫大辞典》中，对“博弈论”词条的解释十分精辟和凝练。他认为，博弈论
描述性的名称应是“互动的决策论”。因为人们之间的决策与行为会形成互为
影响的关系，一个主体在决策时必须考虑到对方的反应。
    对具有博奔性质的决策问题的研究可以追溯到18世纪甚至更早。20世纪
20年代，法国数学家布莱尔用最佳策略法研究弈棋和其他具体的决策问题，
并从数学角度做了尝试性的分析。
    1944年约翰·纽曼和摩根斯坦合著的《博弈论与经济行为》一书出版，
这标志着现代博弈理论的初步形成。纽曼和摩根斯坦认为。博弈论是运用数
学方法研究有利益冲突的双方在竞争性活动中制定最优化的胜利策略的理
论，博弈策略即根据游戏规则制定的处理竞争、冲突或危机的最佳方案。
    第二次世界大战期间，博弈论的思想方法、研究手段被运用到军事领域，
显示了它的重要作用。
    20世纪70年代以来，博奔论在经济学中得到了广泛的运用，成为经济学
思想史上与“边际分析”和“凯恩斯革命”并列的重大“革命”，为人类带来
了一种全新的方法论和思维。
    1994年，美国著名的数学天才约翰·纳什(JotIn Nash)．由于在非合作
博奔的均衡分析理论方面做出了开创性贡献，对博弈论和经济学产生重大影
响，获得当年诺贝尔经济学奖。
    除了经济学领域．博弈论在国际关系研究中也得到了广泛的应用。20世
纪50年代以后，学界在运筹学的博弈概念基础上综合运用心理学、统计学、
社会学和策略学等原理，逐步形成国际关系学的博弈论。这既是研究国际冲
突的繁略理论，也是处理国际关系的实际手段，能够为行为者在面临危机和
冲突时设计出各种合理选择和理性决策。
    时下，对博弈论的研究是如此的广泛，以至于有些人说．最新的经济学
和国际关系理论，都已经被博奔论重写了。
样也正是同一屋檐下夫妻失和的原因。
    也就是说，无论国与国之间，还是人与人之间的合作和冲突，其中所蕴
含的博弈原理是大同小异的。诺贝尔经济学奖得主奥曼在权威的《帕尔格雷
夫大辞典》中，对“博弈论”词条的解释十分精辟和凝练。他认为，博弈论
描述性的名称应是“互动的决策论”。因为人们之间的决策与行为会形成互为
影响的关系，一个主体在决策时必须考虑到对方的反应。
    对具有博奔性质的决策问题的研究可以追溯到18世纪甚至更早。20世纪
20年代，法国数学家布莱尔用最佳策略法研究弈棋和其他具体的决策问题，
并从数学角度做了尝试性的分析。
    1944年约翰·纽曼和摩根斯坦合著的《博弈论与经济行为》一书出版，
这标志着现代博弈理论的初步形成。纽曼和摩根斯坦认为。博弈论是运用数
学方法研究有利益冲突的双方在竞争性活动中制定最优化的胜利策略的理
论，博弈策略即根据游戏规则制定的处理竞争、冲突或危机的最佳方案。
    第二次世界大战期间，博弈论的思想方法、研究手段被运用到军事领域，
显示了它的重要作用。
    20世纪70年代以来，博奔论在经济学中得到了广泛的运用，成为经济学
思想史上与“边际分析”和“凯恩斯革命”并列的重大“革命”，为人类带来
了一种全新的方法论和思维。
    1994年，美国著名的数学天才约翰·纳什(JotIn Nash)．由于在非合作
博奔的均衡分析理论方面做出了开创性贡献，对博弈论和经济学产生重大影
响，获得当年诺贝尔经济学奖。
    除了经济学领域．博弈论在国际关系研究中也得到了广泛的应用。20世
纪50年代以后，学界在运筹学的博弈概念基础上综合运用心理学、统计学、
社会学和策略学等原理，逐步形成国际关系学的博弈论。这既是研究国际冲
突的繁略理论，也是处理国际关系的实际手段，能够为行为者在面临危机和
冲突时设计出各种合理选择和理性决策。
    时下，对博弈论的研究是如此的广泛，以至于有些人说．最新的经济学
和国际关系理论，都已经被博奔论重写了。
离k譬鲨尘篮
博弈的构成要素
    博弈的目的是利益，利益形成博弈的基础。经济学的最基本的假设就是
经济人或理性人的目的就在于使收益最大化。参与博弈者正是为了自身收益
的最大化而互相竞争。也就是说，参与博弈的备方形成相互竞争、相互对抗
的关系，以争得利益的多少来决定胜负，一定的外部条件又决定了竞争和对
抗的具体形式，这就形成了博弈。
    从经济学角度来看，如果有一种资源为人们所筲要，而这种资源又具有稀
缺性或者说总量是有限豹，就会发生竞争；竞争需要有一个具体形式把大家拉
在一起，一旦找到了这种形式，竞争各方之间就会开始一场博弈。
    我们通过下面这个例子，来深人浅出地解释一场博奔的各个要素。
    夫妻俩下班回到家，吃罂晚饭看电视。电视预报显示．一个频道会播放
丈夫喜爱的足球赛，而另一个频道会播放妻子喜爱的音乐节目。但是家里只
有一台电视机。这样．围绕着到底看什么节目，一场博弈就展开了。
    在这场博弈中，完整地包含着形成一个博弈的以下4个要索。
    (1)2个或2个以上的参与者(player)。在博弈中存在一个必需的条件，
即不是一个人在一个毫无干扰的环境中做决策。比如，在上面的案例中，如
果只有丈夫或者妻子一个人在家，就不存在博奔。从经济学的角度来看，如
果是一个人做决策而不受到他人干扰的话．那就是一个传统的最优化问题，
也就是在一个既定的局面或情况下如何决策的问题。
    博弈者的身边充斥着其他具有主观能动性的决策者，他们的选择与其他
博奔者的选择相互作用、相互影响。这种互动关系自然会对博弈各方的思维
和行动产生重要的影响，有时甚至直接影响博弈结果。
    (2)博弈要有参与各方争夺的资源或收益(mouTce咖ayo刖。资源指的
不仅仅是自然资源，如矿山、石油、土地、水资源等，还包括了各种社会资
源，如人脉、信誉、学历、职位等。人们之所以参与博奔是受到利益的吸引，
预期将来所获得利益的大小直接影响到博弈的吸引力和参与者的关注程度。
经济学的效用理论可以用来解释这个问题．凡是自己主观需要的就是资源；
走近博弈论：一场游戏一场梦
相反，主观不需要的对自己就不能构成资源。
    这就是“情人眼里出西施”的道理。再比如人们经常说的“孩子是自己
的好．老婆是别人好”，也是这个道理。自己的孩子在自己眼里可以抵过世间
万物，但是对别人来说就不是这么珍重；而老婆呢，即使是众人公认的绝代
佳人，日子一长也会产生审美疲劳，其价值对自己来说便不断下降，这正是
效用递减规律的作用。
    在上面的案例中，资源或收益并不是电视机的所有权，而是在菜一时段
的使用权。事实上在那些对于足球和音乐都没有偏好的人们眼里，哪一个节
目都不会成为其资薅【。
    (3)参与者有自己能够选择的策略(strategy)。所谓策略，就是《孙子
兵法》中所说“计利以昕，乃为之势，以佐其外”，指的是直接、实用地针对
某一个具体问题所采取的应对方式。通俗地说，策路就是计策．是博弈参与
者所选择的手段方法。博弈论中的策略，是先对局势和整体状况进行分析，
确定局势特征，找出其中关键因素，为达到最重要的目标进行手段选择。
由此可见，博弈论中的策略是牵一发而动全身的，直接对整个局势造成重大
影响。
    (4)参与者拥有一定量的信息(infort"natron)。博弈就是个人或组织在一
定的环境条件与既定的规则下，同时或先后，一次或是多次选择策略并实施，
从而得到某种结果的过程。
    简单说来，博弈论就是研究人们如何进行决策、以及这种决策如何达到
均衡的科学。每个博弈者在决定采取何种行动时．不但要根据自身的利益和
目的行事，还必须考虑到他的决策行为可能对其他人造成的影响．以及其他
人的反应行为可能带来的后果，通过选择最佳行动计划，来寻求收益或效用
的最大化。
    本节所选的“夫妻博弈”模型大致会出现三种情况：一是两人争执不下．
于是干脆关掉电视，谁都别看；二是你看足球。我到其他地方听音乐。或你
听音乐，我到其他地方看足球；三是其中一方说服另一方，两人同看足球或
同听音乐。
    夫妻二人通常不会因为电视节目的分歧而分开活动的。这是研究该问题
的潜在前提但是．对于看什么节目．双方叉各有偏好，因此我们可以假定：
如果丈夫和妻子分开活动．男女双方的效用为0；如果双方一起去看球赛．则
丈夫的般用为5．而妻子的效用为l：如果双方一起听音乐．则丈夫的效用为
l，妻子的效j}{为5：
    根据上述假定．夫妻双方不同选择的所有结果及其效用组合如表l一1所示c
表1．1    夫妻博弈效用矩阵
    就是这样一个矩阵，可以一目了然地把我们介绍的几种因素包含在里面
矩阵是博弈论中用来描述两个或多个参与人的策略和效用的最常用工具-又
被称为“收益矩阵”或“得益矩阵”。
相互依存与均衡
    汉代刘向的《新序》中有这样一个故事j春秋末期．晋国的执政者赵襄
子喝酒．五日五夜没有停杯，仍然没有醉倒赵襄子十分自豪地对侍候在身
边的人说：“我真是国中最出色的人呀!喝酒五天仍不觉难受一国内应该没有
人能够比得上我了”弄臣优莫恭恭敬敬地回答说：“你还可以接着喝!纣王
一连喝了七日七夜．现在您才是五日五夜”赵襄子听了以后．有些紧张地放
下酒杯问道：“如此说来．我要灭亡了吗9”优莫答道：”还不至于灭亡”赵
襄子问：··我跟纣王只差两天了，不灭亡还等什么?”优莫回答道：“夏桀和
商纣的灭1l=．是因为分别遇上了对手商汤和周武王．现在天下各国的君主全
是夏桀一类的人物，而您和商纣王类似、夏桀和商纣同时存在一个时代t彼
此都没有被消灭的危险、不过，长此以往．事情就难说了!”
    其实不仅是昏君与明主之间．所有博弈参与者的策略都有相互依存的关
系、每一个博弈者从博弈中所得结果的好坏不仅取决于自身的策略选择．同
走近搏弈论：一场游戏一场梦
时也取决于其他参加者的策略选择。有时甚至一个坏的策略也会带来并不坏
的结果，原因是对方选择了更坏的利他而不利己的莆略。
    2006年9月29日．年度“超级女声”大赛在掌声和欢呼声中谢幕，尚雯
捷凭借5 196975的票数登上冠军宝座。有人发出疑问：与2004年的冠军安又
琪相比，她没有出众的外表；与2005年的冠军李宇春相比．她没有倾倒观众
的舞台魅力；与2006年亚军谭维维相比，她没有“无可挑剔”的唱功。那她
凭什么夺冠呢’
    实际上．这个疑问本身就反映了疑问者对于博弈论的不了解。这个冠军
本来就不是尚雯婕一个人得到的，而是在主办方湖南电视台和天娱传媒、参
赛的女生们、电视观众、媒体、各女生的“粉丝”(fans)等方方面面共同博
弈的结果。
    每一次超级女声的比赛．电视上几个女生在台上比赛唱歌跳舞。而实际
上真正的博弈在屏幕之外。以主办方来说，就不断根据观众的反应而修改策
略，从开始的评委打分到专业评委、大众评审团、短信共同决定．再到最后
完全靠短信决胜负，这种修改可以看做对形势发展的妥协，也可以解释为追
求商业利益最大化的对策。有人认为整个过程中还出现了非合作博弈与合作
博奔的可能：某些得分较低的女生的“粉丝”．联手对付得分高的选手；得分
最高的选手联合肯定无望出线的选手以巩固地位．防止次高选手反超。
    这就是一种相互依存的博弈，而相互依存的策略就构成一种均衡。
    均衡可以说是博弈论中最重要的思想之一，但是却并不复杂。我们可以
用描述法来加以定义：在博弈达到均衡时．局中的每一个博弈者都不可能因
为单方面改变自己的策略而增加收益，于是各方为了自己利益的最大化而选
择了某种晟优策略．并与其他对手达成了某种暂时的平衡。在外界环境没有
变化的情况下，倘若有关各方坚持原有的利益最大化原则并理性面对现实．
那么这种平衡状况就能够长期保持稳定。
    在所有的均衡中，纳什均衡又是一个基础性的概念。简单地说．所谓纳
什均衡就是所有人的选择综合在一块，不一定所有选择都能实现最大化原则，
但能使所有人都达到最大化的均衡状态。诺贝尔经济学奖获得者萨缨尔森有
一句调侃的话：你可以将一只鹦鹉训练成经济学家，因为它所需要学习的只
丫√    博彝论的
诡计
有两个词——供给与需求。博弈论专家坎多瑞引申说：要成为现代经济学家，
这只鹦鹉必须再多学一个词．这个词就是“纳什均衡”。
    在现实生括中，有相当多的博弈，我们无法使用严格优势策略均衡或重
复剔除的优势策略均衡的方法找出均衡解。比如在房地产开发中．假定市场
需求有限，只能满足某种规模的开发量．A、B两个开发商都想开发这一规模
的房地产，而且，每个房地产商必须一次性开发这一规模的房地产才能获利。
在这种情况下，无论是对开发商A还是对开发商B，都不存在一种策略优于另
一种策略，也不存在严格劣策略(所谓严格劣策略是指在博弈中．不论其他
人采取什么策略，某一参与人可能采取的策略中对自己严格不利的策略)。如
果A选择开发，则B的最优策略是不开发；如果A选择不开发，则B的最优
策略是开发。反之亦然。研究这类博弈的均衡解，需要引入纳什均衡。
    在纳什均衡中，每个博弈参与人都确信，在给定其他参与人的策略的情
况下，己方选择了最优策略以回应对手的策略。纳什均衡是完全信息静态博
弈解的一般概念．构成纳什均衡的策略一定是重复剔除严格劣策略过程中不
能被剔除的策略。
    纳什均衡是著名博弈论专家纳什对博奔论的重要贡献之一。纳什在1951
年的两篇重要论文中，从一般意义上给定了非合作博弈及其均衡解。并证明
了解的存在性。正是纳什的这一贡献奠定了非合作博弈论的理论基础，他所
定义的均衡也被称之为“纳什均衡”。
    纳什均衡是一种最常见的均衡。在纳什均衡点上，每个参与者的策略是
最好的．此时没有人愿意先改变或主动改变自己的策略。也就是说，此时如
果他改变策略，他的收益将会降低，每一个理性的参与者都不会有单独改变
策略的冲动。
    与重复剔除的占优策略均衡一样，纳什均衡不仅要求所有的博弈参与人
都是理性的，而且要求每个参与人都了解所有其他参与人也都是理性的。
    在占优策略均衡中，不论所有其他参与人选择什么策略，一个参与人的
占优策略都是他的最优策略。显然．这一策略一定是所有其他参与人选择某
一特定策略时该参与人的占优策略。因此，占优策略均衡一定是纳什均衡。
在重复剔除的占优策略均衡中。最后剩下的唯一策略组合，一定是在重复剔
走近博弈论：一场游戏一场梦
除严格劣策略过程中无法被剔除的策略组合。因此，重复剔除的占优策略均
衡也一定是纳什均衡。
    需要注意的是，博弈的结果并不都能成为均衡。博弈的均衡是稳定的，
因此可以预测。
负和、零和与正和
    在拉封丹寓言中有这样一则，讲的是狐狸与狼之间的博弈。
    一天晚上．狐狸踱步来到了水井旁，低头俯身看到井底水面上月亮的影
子，它认为那是一块大奶酪。这只饿得发昏的狐狸跨进一只吊桶下到了井底．
把与之相连的另一只吊桶升到了井面。下得井来，它才明白这“奶酪”是吃
不得的，自己已铸成大错，处境十分不利，长期下去就只有等死了。如果没
有另一个饥饿的替死鬼来打这月亮的主意，以同样的方式。落得同样悲惨的
下场．而把它从服下窘迫的境地换出来，它怎能指望再活着回到地面上去呢?
    两天两夜过去了．没有一只动物光顾水井．时间一分一秒地不断流逝，
银色的上弦月出现了。沮丧的狐狸正无计可施时，刚好一只口渴的狼途经此
地，狐狸不禁喜上眉梢，它对狼打招呼道：“喂，伙计，我免费招待你一顿美
餐你看怎么样'”看到狼被吸引住了，狐狸于是指着井底的月亮对狼说：“你
看到这个了吗7这可是块十分好吃的干酪，这是家畜森林之神福纳用奶牛伊
蛾的奶做出来的。假如神王朱庇特病了，只要尝到这美味可口的食物都会胃
口顿开。我已吃掉了这奶酪的那一半，剩下这一半也够你吃一顿的了。就请
委屈你钻到我特意为你准备好的桶里下到井里来吧。”狐狸尽量把故事编得天
衣无缝，这只狼果然中了它的奸计。狼下到井里，它的重量使狐狸升到了井
口，这只被困两天的狐狸终于得救了。
    这个故事中狐狸和狼所进行的博弈，我们称为零和博弈。零和博弈是一
种完全对抗、强烈竞争的对局。在零和博弈的结局中．参与者的收益总和是
零(或某个常数)，一个参与者的所得恰是另一参与者的所失。狐狸和狼一只
在上面，一只在下面，下面的这一只想上去，就得想办法让上面的一只下来。
但是通过博弈调换位置以后，仍然是一只在上面．一只在下面。
矗南．M譬邕‘喾譬
    著名经济学家茅于轼曾经说：“在市场经济以前，人类自利是妨碍别人的，
是损人利己的。”他举了个例子说，过去的帝王与将相就是这样一种博奔，他
可以剥削你，抄你的家；休可以造他的反，夺他的天下。一方得利．一方受
损，那是零和博弈。事实上也正是因为这种零和博弈反复上演，才使中国历
史的每…页都充满r阴谋与血腥，并且使“无毒不狠非丈夫”的文化观念深
入到每一个中国人的意识中。
    然而到了今天，除了权力斗争和军事冲突之外，现实生活中一般很少出
现类似寓言中的狐狸与狼这种“有你没我”的局面。因为在市场经济下，你
要想得到好处，就要跟别人合作，这样才可以得到双赢的结果，不但你得到
好处，你的对手也得到好处。所以市场经济安排最奥妙的地方，就在于它是
双方同意的，任何一个买卖都要经过双方同意，买方也赚钱．卖方也赚钱，
财富就创造出来了：这就是与零和博弈相对应的非零和博弈。
    所谓非零和博弈，是既有对抗又有合作的博弈．各参与者的目标不完全
对立，对局表现为各种各样的情况。自时候参与者只按本身的利害关系单方
面做出决策．有时为了共同利益而合作。其结局收益总和是可变的，参与者
可以同时有所得或有所失。
    比如在拉封丹的寓言中，如果狐狸看到狼在井口，心想我在井里受罪，
你也别想舒服，他不是欺骗狼坐在桶里下来．而是让狼跳下来，那么最终结
局将是狼和狐狸都身陷井中不能自拔。这种两败俱伤的非零和博弈．我们称
之为负和博弈。
    反之，如果狼明白狐狸掉到了井里．动了憾隐之心，搬来一块石头放到
上面的桶中，完全可以利用石头的重量把狐狸拉上来。或者，如果狐狸担心
狼没有这种乐于助人的精神，通过欺骗到达井口以后．再用石头把狼再拉上
来。这两种方式的结局是两个参与者都到了井上面．那么双方进行的就是一
种正和博弈。
    实际上，这种正和游戏的思维不仅是一种经济上的智慧，而且可以运用
到生活中的方方面面．用来解决很多看似无法调和的矛盾和你死我活的僵局。
那些看似零和或者是负和的问题，如果转换一下视角，从更广阔的角度来看，
也不是没有解决办法，而且往往也并不一定要牺牲某一方的利益。
走近博弈论：一场游戏一场梦
    一个冬天的上午，几位读者正在一个社区的图书室看书。这时，一位读
者站起来说：“这屋子里空气实在是太闷了，最好打开窗户透透气。”说着，
他就走到窗户旁边，准备推开窗户。但是他的举动遭到了正好坐在窗户旁边
的一位读者的反对。那位读者说：“大冬天的，外面的风太冲了．一开窗户准
冻感冒了。”于是，一位坚持要开，一位坚决不让开，两个人发生了争执。图
书室的管理员闻声走了过来，问明原因，笑着劝这两位脸红脖子粗的读者各
自坐下，然后快步走刊走廊。把走廊里的窗户打开了一扇。一个看似无法通
融解决的矛盾迎刃而解。
    如果我们每个人都通过博弈智慧的学习和运用．在生活中实现更多的正
和博弈，这个世界也就多了很多和谐，少了很多不必要的争斗。
博弈论的局限性
    有两父子正在赶路，突然从一户人家跑出来一条大黑狗，冲着他们“汪
汪”狂吠。儿子吓了一大跳，急忙躲到了父亲的身后。父亲告诉他说：“你放
心．它不会咬你的。难道你没有听说过‘吠犬不咬人’那句话吗?”儿子听
了这番话，仍然紧紧地抓住父亲的衣角，用颤抖的声音说：“我倒是听说过这
句话，但是我不能肯定这条狗有没有听说过。”
    这番对话之所以可笑，是因为儿子“以己度狗”，把“吠犬不咬人”当做
人狗双方据以确定策略的依据。这种推论自然是错误的。
    但是在这个笑话的背后．我们却可以发现儿子的话中包含着对著名的哥
德尔不完备定理的认识：任何一个理论体系必定是不完全的，任何理论都包
含了既不能证明为真也不能证明为假的命题。对这个世界的最好描述可能
只有其本身，但是正如罗宾逊夫人的妙语所说：“比例尺是一比一的地图是没
用的。”
    博弈论也是如此．比如博奔论的基本假设之一就是：人是理性的。所谓
理性的人是指行动者具有推理能力，在具体策略选择时的目的是使自己的利
益最大化。而现实生活中，人们在做决策时往往是有限理性的。
    因为人类的精力和时间永远是有限的，人不可能具备完全理性，不可能
掌握所有知识和信息。人不可能搜寻到所需的全部信息．另一方面信息的搜
寻也是需要成本的，必须为此付出大最的时间、精力和财力等。意图搜寻到
所有信息，企图做出收益最优的决策行为。有时反而是最不理性的举动。
    尽管如此，人们仍然可以用博弈论与信息经济学的思想方法来分析解决
实际问题。诺坦尔经济学奖获得者保罗t萨缪尔逊说：“要想在现代社会做一
个有文化的人，你必须对博弈论有一个大致了解。”然而，目前国内对于博弈
论的介绍，要么是堆砌庞杂的数学算法与令人炫目的数学模型，使之变成束
之高阁、不能亲近的高深学问；要么是企图“以其昏昏，使人昭昭”，使用混
乱模糊的理解把博弈论随意滥用在任何可能的领域与分析中。
    事实上，要求博弈论能够完全刻画真实的世界．注定是徒劳无功的。正
如诺贝尔经济学奖得主菜因哈德·泽尔滕教授所说：“博弈论并不是疗法，也
不是处方，它不能帮我们在赌博中获胜．不能帮我们通过投机来致富，也不
能帮我们在下棋或打牌中赢对手。它不告诉你该付多少钱买东西，这是计算
机或者字典的任务。”
    尽管如此．人类至今还没有找到一种比博弈论更好的思考工具，可以对
现实的客观世界进行如此近似的描述。就像并不完美的力学是自然科学的哲
学和数学一样，博弈论是社会科学的力学和数学。没有牛顿力学我们连最简
单的物理现象都无法理解：同样的道理．没有博弈论我仍也无法解释分析很
多现实的社会现象。
    为了协调缺陷与现实之间的矛盾，也许我们要听一下博弈论大师鲁宾斯
坦的教导：“一个博弈模型是我们关于现实的观念的近似，而不是现实的客观
描述的近似。”
第2章
第么章
囚徒困境：自愿坐牢的嫌疑人
看着你离去后空荡的房间
我的泪水又有谁看见
不是我不懂温柔和留恋
是谁让你如此的背叛
——《无情的背叛》歌词
克格勃们的小花招
    在斯大林时代的苏联，有一位乐队指挥坐火车前往下一个演出地点。正
当他在车上翻看当晚就要指挥演奏的作品乐谱时。两名克格勃(KGB，苏联
国家安全警察。实际是政治特务)将他作为间谍逮捕了。他们以为那乐谱是
某种密码，这位乐队指挥争辩说那只是柴可夫斯基的小提琴协奏曲，却无济
于事。在乐队指挥被投入牢房的第二天，审问者自鸣得意地走进来说：“我看
你最好还是老实招了吧，我们已经抓住你的朋友柴可夫斯基了．他这会儿正
向我们交代呢。你如果再不招就枪毙了你。如果交代了，只判你10年。”
    笑过之后，每个人都会思考其中所蕴涵的东西。但是如果认为这个笑话
仅仅讽刺了克格勃特务的无知与无耻，那是不够的。事实上，克格勃们的花
招，是想运用博弈论中囚徒困境理论，达到自己的目的。虽然他们未必知道
博弈论，但是他们明显企图运用其中的布局，使乐队指挥被迫选择招供。
    i950年，担任斯坦福大学客座教授的数学家图克(Tucker)，给一些心理
学家解释他正在研究的完全信息静态博弈问题，为r更形象地说明博弈过程．
他用两个犯罪嫌疑人的故事构造了一个博弈模型．即囚徒嗣境模型-
    这一模型的过程具体是这样的：两个共同偷窃的犯罪嫌疑人甲和乙被带
进警察局警方对两名犯罪嫌疑人实行隔离关押．隔离审讯，每个犯罪嫌疑
人都无法观察到『司伴的选择
    警方怀疑他们作案，但手中并没有掌握确凿证据，于是明确地分别告知
两名犯罪嫌疑人：对他们犯罪事实的认定及相应的量刑完全取决于他们自己
的供认如果其中一方与警方合作，供认偷窃之事．而对方抵赖．供认打将
不受惩罚，无罪释放．另一方则会被判重刑10年；如果双方都与警方合作共
同供认，各被判刑5年；而如果双方均不认罪．因为警察找不到其他证据．
则无罪释放
    两名囚徒面临的选择及其带来的后果组合可以用表2·I来表示-
表2．1
囚徒困境博弈憧盐矩阵
    哪一种选择对犯罪嫌疑人更有利呢?
    从上表中可以知道：每个犯罪嫌疑人都有两种可供选择的策略：供认或
不供认而且，每个犯罪嫌疑人选择的最优策略不依赖于其同伙的策略选择。
    如果甲选择抵赖．那么就可能会出现两种情况：如果乙选择供认．那么
甲将被加重惩罚．判刑10年．而乙则无罪释放：如果乙也同样选择抵赖，那
么他们两个都将因证据不足而被释放。很显然．这第二种结果对于两个人都
是最有利的但是．因为警方没有把两名嫌疑人放在一间囚室里．因而这种
合作难以顺利进行．使得结果预测的不确定性加大．或者说增加了抵赖合作
的风险性
    因此．基于人是理性的这一前提．由于犯罪嫌疑人不知道对方的想法．
最理性的博弈策略．就是选择供认。这时的策略．我们可以称为占优策略
一
《砬
囚徒困境：自愿坐牢的嫌疑人
而如果所有参与人都有占优策略存在，那么博弈将在所有参与人的占优策略
的基础上达到均衡．这种均衡称为占优策略均衡。
    在囚徒困境中“甲供认，乙供认”的占优策略均衡中，不论所有其他参
与人选择什么繁略，一个参与人的优势策略都是他的最优策略。不管甲乙两
人谁供认．都将得到减轻惩罚的结果：如果甲供认了，乙抵赖，甲将免于惩
罚．如果乙也供认了，那么罪名各担一半，从甲个人看来。也减轻了惩罚；
甲乙互换位置，结果依然是一样。显然，这一策略一定是所有其他参与人选
择某一特定策略时该参与人的占优策略。
    与占优策略相对应，劣势策略则是指在博弈中，不论其他参与人采取什
么策略．某一参与人可能采取的策略中，对自己严格不利的策略。劣势策略
是我们在日常生活中不应该选择的行动。
    有一个要注意的问题是，采用优势策略得到的最坏结果，并不一定比采
用另外一个策略得到的最佳结果要好．这是很多博弈论普及书中容易出错的
一个问题。应该说，参与人采用优势策略时．无论对方采取任何策略总能够
显示出优势。
    由于囚徒困境的模型是如此有趣和简洁．不仅给人们留下了深刻的印象，
而且迅速不胫而走．成为一个被人们广为谈论和研究的博弈模型。在我们开
头的那个笑话中，克格勃们的思路是这样的——乐队指挥知道我们抓住了“柴
科夫斯基”，就必然会考虑：这个“柴科夫斯基”如果交代，我有两种选择——
不交代教枪毙，交代则被判10年。那么此时，我的最好选择是交代。当然，
如果对方不交代，我的最好选择也是交代。
    如果不是这些克格勃因为过于无知．不知道柴科夫斯基是19世纪俄罗斯
最伟大的作曲家．并且早在1893年就去世的话．这个设计本来是天衣无缝的。
从这个角度说下下人有上上之智，也并不为过。
    在囚徒困境的模型中．有一个背景需要向国内的朋友介绍，那就是辩诉
交易。曾经有国内学者在批评囚徒困境时指出：“是否招供并非定罪的充分、
必要条件，定罪的充要条件是证据，有了证据不招供亦可定罪，没有证据
即使招供(证言)，也不能定罪。”这种说法其实恰恰反映了对辩诉交易缺乏
了解。
囚徒困境：自愿坐牢的嫌疑人
而如果所有参与人都有占优策略存在，那么博弈将在所有参与人的占优策略
的基础上达到均衡．这种均衡称为占优策略均衡。
    在囚徒困境中“甲供认，乙供认”的占优策略均衡中，不论所有其他参
与人选择什么繁略，一个参与人的优势策略都是他的最优策略。不管甲乙两
人谁供认．都将得到减轻惩罚的结果：如果甲供认了，乙抵赖，甲将免于惩
罚．如果乙也供认了，那么罪名各担一半，从甲个人看来。也减轻了惩罚；
甲乙互换位置，结果依然是一样。显然，这一策略一定是所有其他参与人选
择某一特定策略时该参与人的占优策略。
    与占优策略相对应，劣势策略则是指在博弈中，不论其他参与人采取什
么策略．某一参与人可能采取的策略中，对自己严格不利的策略。劣势策略
是我们在日常生活中不应该选择的行动。
    有一个要注意的问题是，采用优势策略得到的最坏结果，并不一定比采
用另外一个策略得到的最佳结果要好．这是很多博弈论普及书中容易出错的
一个问题。应该说，参与人采用优势策略时．无论对方采取任何策略总能够
显示出优势。
    由于囚徒困境的模型是如此有趣和简洁．不仅给人们留下了深刻的印象，
而且迅速不胫而走．成为一个被人们广为谈论和研究的博弈模型。在我们开
头的那个笑话中，克格勃们的思路是这样的——乐队指挥知道我们抓住了“柴
科夫斯基”，就必然会考虑：这个“柴科夫斯基”如果交代，我有两种选择——
不交代教枪毙，交代则被判10年。那么此时，我的最好选择是交代。当然，
如果对方不交代，我的最好选择也是交代。
    如果不是这些克格勃因为过于无知．不知道柴科夫斯基是19世纪俄罗斯
最伟大的作曲家．并且早在1893年就去世的话．这个设计本来是天衣无缝的。
从这个角度说下下人有上上之智，也并不为过。
    在囚徒困境的模型中．有一个背景需要向国内的朋友介绍，那就是辩诉
交易。曾经有国内学者在批评囚徒困境时指出：“是否招供并非定罪的充分、
必要条件，定罪的充要条件是证据，有了证据不招供亦可定罪，没有证据
即使招供(证言)，也不能定罪。”这种说法其实恰恰反映了对辩诉交易缺乏
了解。
囚徒困境：自愿坐牢的嫌疑人
    所谓辩诉交易，又称辩诉协商或者辩诉协议，是指检察官和辩护律师在
法院开庭审判之前，对被告人的定罪和量刑问题进行协商和讨价还价，检察
官通过降低指控或者向法官提出减轻量刑的建议．来换取被告人做有罪答辩
的一种活动。1970年，美国联邦最高法院在“布雷迪诉黄利坚合众国政府”
一案的判决中，正式确定了辩诉交易的合法地位。此后，辩诉交易在美国、
英国等西方国家广泛发展起来．并成为诉讼中解决刑事案件的一种主要方式。
    在囚徒困境的案例中．均衡点是建立在两个囚徒非合作的基础上的，并
且两者的非合作还可以获得一定的利益(从宽惩罚)，如果没有辩诉交易提供
的从宽处罚这一利益条件，那么这个严格优势策略也就不复存在。
不背叛就会被淘汰
    在明代宋濂的《宋文宪公全集》中，记载了这样一个故事。
    玉娥生和三乌丛臣是朋友。玉藏生说：“我辈应该自我激励。他日人朝为
官，对于趋炎附势之事绝不涉足。”三乌丛臣说：“这是我痛恨得咬牙切齿的
行为，我们干吗不对神起个誓?”玉蕺生很高兴，二人就歃血盟誓道：“二人
同心，不徇私利，不为权位所诱，不趋附奸邪献媚的人而改变自己的行为准
则。如有违背此盟誓，请神明惩罚他。”
    没多久，他们一起到晋国为官。当时赵宜子在晋王跟前很得宠，各大夫每
天奔走于他家。玉髋生重申以前的誓言。三乌丛臣说：“说过的话犹在耳畔，怎
么敢忘记啊!”但三乌丛臣反悔当初的誓言，叉怕玉就生知道他反悔。于是在一
个大清早，鸡刚一报晓，他就前去拜望赵宣子。进得门来，他忽然看到正屋前
东边的走廊有个人坐在那里。他走上前去举起灯来照，那个人原来是玉就生。
    人们对某种权力表现得忠诚服从．实际上并非兴趣使然．而是人们服从
一种被选择的纳什均衡。因为在人们的预期中，往往先假定别人绝对会服从，
这样为了自己的利益最大化．也只能选择服从。
    在面临有权势的上司时，面临的选择有以下几个：选择A——不巴结．落
选；选择B——巴结，落选；选择c——巴结，升官。在这些选择里面，如果
选择巴结上司会有升官的机会，而其他人也面对同样的局面。假定两个人竞
争一个官职，对于玉娥生来说，只要他选择了巴结，而如果三乌丛臣选择不
巴结，职位自然属于玉靛生；即使三乌丛臣也选择巴结，就需要一个附加的
条件——他巴结得比玉兢生更到位，这样才能得到仅有的一个位置。
    所以，在这一博弈过程中，无论三乌丛臣做出什么选择。玉靓生只要自
己拼命巴结，就会有机会升官．这是遵循我们上面所说的原则的。权力的影
响力以及领导的尊严便是这样形成的，人事腐败也是这样产生的。
    在这个过程中．利害计算在每一个参与者那里都是超越一切价值与信念
的。我们仅就上面故事中两个人的关系来看，可以看出故事中包含的“囚徒
定律”基本精神——背叛。无论对方做出什么样的策略选择，背叛对方(同时
也是背叛自己曾经发过的誓言)，都能够让自己获得收益，那么必然要选择背
叛这一道路。
    这个故事中，玉藏生和三乌丛臣的思维方式，像极了约瑟夫·海勒的小说
《第22条军规》中的尤塞瑞安。小说中的背景是：第二次世界大战胜利在望．
可是为了给自己捞取功劳，一个飞行大队的指挥官没完没了地提高下属的任务定
额．弄得人心惶惶。投弹手尤塞瑞安不想成为胜利前夕最后一批牺牲者．千方百
计逃避执行任务。指挥官质问他：“可是，假如所有士兵都这么想呢，”尤塞瑞
安答道：“那我若是不这么想，岂不就成了一个大傻瓜々”
    在这种思维里面，实际上揭示了一个形成囚徒困境的机制——担心自己成
为傻瓜。而了解这种机制，恰恰可以提供减少自己在“囚徒困境”中损失的
策略——处于囚徒困境的时候，没有什么十全十美的好办法能让自己从困境中
逃脱．同时又能获得利益，只能尽量做到自己不受侵害．正是所谓“两害相
权取其轻”。
把对方陷入困境中
    博弈模型是生活的浓缩和简化，比如在囚徒困境模型里。两个囚犯都十
分清醒地意识到自己所处的环境，以及每一种策略可能得到的结果，因此其
策略选择是可以预知的。而在现实生活中，这种完全信息的理想模式是无法
实现的，因为存在大量的干扰因素。
囚徒困境：自愿坐牢的嫌疑人
    但也正是这些干扰因紊的存在，我们就可以通过巧妙的布局设计，人为
创造出一种囚徒困境的环境．迫使对方做出对自己有利的行动。
    《战国策》记载了这样一个故事．可以作为这种策略的最佳注解。
    春秋时楚国杰出的军事家伍子胥．性格十分刚强。青少年时即好文习武．
勇而多谋。伍子胥祖父伍举、父亲伍奢和兄长伍尚俱是楚国忠臣。周景王二
十三年(前522年)．楚平王怀疑太子“外交诸侯．将人为乱”．遂迁怒于太
子太傅伍奢，将伍奢和伍尚骗到郢都杀害，伍子胥只身逃往吴国。
    在逃亡中，伍子胥在边境上被守关的斥候抓住了。斥候对他说：“你是逃
犯．必须将你抓去面见楚王!”伍子胥说：“楚王确实正在抓我。但是你知道
楚王为什么要抓我吗?是因为有人跟楚王说．我有一颗宝珠。楚王一心想得
到我的宝珠，可我的宝珠已经丢失了。楚王不相信，以为我在欺骗他。我没
有办法了．只好逃跑。现在你抓住了我，还要把我交给楚王。那我将在楚王
面前说是你夺去了我的宝珠，并吞到肚子里去了。楚王为了得到宝球就一定
会先把你杀掉．并且还会剖开你的肚子，把你的肠子一寸一寸地剪断来寻找
宝珠。这样我活不成，而你会死得更惨。”斥候信以为真．非常恐惧，赶紧把
伍子胥放了：伍子胥终于逃出了楚国。
    在被斥候抓住以后．伍子胥是处于一种绝对的劣势地位。要想改善这一
局面，必须采取一个宝宦略。伍子胥的威胁行动，就是抢占先机，宣布自己将
无条件地进行报复、这就使原本同时出招的博弈变成相继出招的博弈．而且
还是伍子胥先行。而这样的选择，显然不是在他和斥候同时出招的博弈里能
够做出的选择。摆脱困境的策略思维的精彩之处，正在于此。伍子胥若是不
宣布进行报复，或者甚至宣布不会进行报复．不会得到任何好处。
    在这里．伍子胥是故意利用信息对称，把斥候拉人一种类似囚徒困境的
局面。这个囚徒困境的收益矩阵如表2．2所示。
表2．2    伍子胥与斥候的博弈收益矩阵
‰翟鲨型
    从上面的矩阵我们可以看出来，诬陷和释放分别是伍子胥和斥候的严格
优势策略．从博弈论看来，人都是理性的，所以斥候一定会选择与伍子胥合
作的策略。
    在这里，斥候能够得到的最好结果是把伍子胥押送给楚王，而伍子胥不
诬陷他吞了珍珠，这样伍于胥就会被杀掉(假定收益为一10)．而斥侯可以得
到楚王的奖赏，我们把这种收益假定为8。但是如果伍子胥诬陷他的话，那么
他的结局就和伍子胥一样．是失去生命，假定收益为一10。
    伍子胥已经告诉他，如果他选择押送，他就会选择诬陷。因为对于伍子
胥来说，在这种情况下无论是否诬陷，自己的结局是不变的。对于这一点，
斥候也十分清楚。因此，伍子胥的威胁是可信的。要想策略地行动，你必须
保证自己不要采取在同时出招博弈里的均衡策略。伍子胥的这一策略行动改
变了斥候的预期，进而改变了他的行动。
    面对可能出现的潜在的危机．人们总是抱着“宁可信其有，不可信其无”
的态度，这是一种预期的支付．以保证自己能够免于陷人困境。这种预期支
付心理，恰恰给了处于显性困境者以机会，或用欺骗方式，或夸大其词，让
对方做出预期支付．帮助自己摆脱困境。
    正是由于这个原因，伍子胥三言两语巧妙地转换了自己的劣势处境，并
且把个人的困境与对手的困境捆绑在了一起．迫使其做出了帮助自己解围的
理性选择。
    这对于我们每个人在处于劣势时转换思维方式．是很有启示的。创造一
种困境．使对方陷人与你一样无法全身而退的困境，那么即便在这种困境出
现之前，他本来拥有拿走你所有的一切的优势．此时他也只能被迫进行理性
的决策．与你合作。
倒霉是因为太聪明
    清朝有个读书人叫乔世荣，其貌不扬．但是却精通诗书。颇有才干。他
于某年大考及第，到吏部候职时，因无余银“上贡”，所以坐了好久的冷板凳
才被任命为一个七品县令。在走马上任的途中，乔世荣碰到一老一少二人在
120
因徒困境：自愿坐牢的嫌疑人
激烈争吵。一阃之下才知道，老者拾获钱袋．在原地等候遗失者前来认领；
而遗失钱袋的年轻人，找到钱袋后反而一口咬定钱袋原装有50两银子．而不
是现在的t0两银子。围观的民众议论纷纷，有的认为老者昧银．有的认为年
轻人耍赖。乔县令走上前去亮明身份，先向老者问话：“你捡到这钱袋，有没
有离开原地，”老者答：“没有。”乔县令又问：“可有人见证?”一部分围观
民众纷纷愿替老者作证。乔县令于是胸有成竹地说：“这就对了，老者检到的
钱袋，是装10两银子，那就不是年轻人的装有50两银子的钱袋。这位老者，
你拾金不昧，本县判将钱袋赏你。这位年轻人，你的50两银子的钱袋．还是
自己再到别的地方找一找吧。”在人们的讥笑声中，年轻人只好自认倒霉．灰
溜溜地走开了。
    这个故事告诉我们：失败不是因为人们太傻，而恰恰是太精明所致。对
于这个论断，哈佛大学巴罗教授在研究囚徒困境的过程中，也有一个很接近
生活的模型。
    两个旅行者从一个出产细瓷花瓶的地方回来，都买了花瓶。可是提取行
李的时候．发现花瓶被摔坏了。于是，他们向航空公司索赔。航空公司知道
花瓶的价格总在八九十元上下浮动，但是不知道两位旅客买的确切价格是
多少。于是，航空公司请两位旅客在100元以内自己写下花瓶的价格。如
果两人写的一样．航空公司将认为他们讲的是真话，并按照他们写的数额赔
偿；如果两人写的不一样，航空公司就论定写得低的旅客讲的是真话，并且
照这个低的价格赔偿，但是对讲真话的旅客奖励2元钱，对讲假话的旅客罚
款2元。
    为了获取最大赔偿，甲乙两位旅客最好的策略就是都写100元，这样两
人都能够获赔100元。
    可是甲很聪明．他想：如果我少写l元变成99元，而乙会写100元，这
样我将得到101元。何乐而不为?所以他准备写99元。可是乙更加聪明，他
算计到甲要算计自己而写99元，“人不犯我，我不犯人，人若犯我．我必犯
人”．于是他准备写98元。想不到甲又聪明一层．算计出乙要这样写98元来
坑他，“来而不往非礼也”．他准备写97元…
    下象棋的时候，不是说要多“看”几步吗7看得越远，胜算越大。你多
博彝论的鹾}舻
看两步，我比你更强多看三步，你多看四步。我比你更老谋深算多看五步。
在花瓶索赔的例子中．如果两个人都“彻底理性”，都能看透十几步甚至几十
步、上百步，那么上面那样“精明比赛”的结果，最后将落到什么田地?事
实上，在彻底理性的假设之下，这个博弈唯一的纳什均衡，是两位旅客都写0。
    对于这个演进了的囚徒困境，巴罗教授称之为“旅行者困境”。一方面．
它启示人们在为私利考虑的时候不要太精明，因为精明不等于高明．太精明
往往会坏事；另一方面。它对于理性行为假设的适用性也提出了警告。
对执法者也有启示
    唐敬宗时，李德裕曾任浙西观察史。当地甘露寺的和尚向官府控告前任
主事僧贪污寺里的钱。他们说．过去寺里历届主事僧办交接时，账面上记载
的金子数目都很清楚。但这个主事僧办交割时。却不见金子。他们众口一词
地指控这主事僧把金子藏起来私用了。经过审讯．案子成立，主事僧也明确
认罪了。但是在审理过程中，并没有进一步交代他把金子用在什么地方了。
    李德裕怀疑这案子还没查完，就想办法对被告进行试探。于是。那个主
事僧向李德裕申诉了自己的冤枉说：“多年以来，寺里都是空交账本，实际上
设有金子。寺里的人们孤立我．想借此把我排挤走。”李德褡说：“这事不难
搞清楚。”他召米了历届主事僧来对证。僧人们各自被打发进一乘轿中，轿门
都面向墙壁．不让他们相见。然后给每人一团黄泥，让他们各自捏出上届交
付下来的金块的模样，声称要以之作为给案犯定罪的证据。那些僧人并不知
金子的形状．都捏不出来。这样，寺里以前的这几届主事僧，都承认了自己
的诬陷罪。
    当囚徒困境中的各方在博彝之中处于不对等地位的时候，博弈的局势很
容易发生偏移，即从合作型的博弈走向非台作型博弈。不过，这种偏移并非
岿然发生，因为影响博弈走向的，不但是双方的地位对比，还有局面的变化。
    这就给我们一种启发，通过设计改变博奔参与者的格局，造成一种压力．
那么他们很有可能改变原来通谨共犯的合作，改而与“警察”合作。能够达
成这种局面的设计可能有很多种，但是最常用也最为有效的一种．就是有意
I 22
囚徒困境：自愿坐牢的嫌疑人
地制造信息的不对称。
    在北美学生的电子邮件交流组中．有这样一个小故事流传甚广。
    两位交往甚密的学生在杜克大学修化学课。两人在小考、实验和中期考
中都表现甚优，成绩一直是A。在期末考试前的周末，他们非常自信，于是
去参加弗吉尼亚大学的一场聚会。聚会太尽兴，结果周日这天就睡过了头，
来不及准备周一上午的化学期末考。他们投有参加考试．而是向教授撒了个
谎，说他们本已从弗吉尼亚大学往回赶．并安排好时间复习准备考试，但途
中轮胎爆了。由于没有备用胎，他们只好整夜呆在路边等待救援。现在他们
实在太累了，请求教授允许他们隔天补考。教授想了想，同意了。两人利用
周一晚上好好准备了一番，胸有成竹地来参加周二上午的考试。教授安排他
们分别在两间教室做答。第一个题目在考卷第一页，占了10分．非常简单。
两人都写出了正确答案，心情舒畅地翻到第二页。第二页只有一个问题，占
了90分。题目是：“请同破的是哪只轮胎?”结果不占而喻，两个学生只好
乖乖地向教授认错。
2。l
第3章
第-二)章
重复博弈：一夜情与地老天荒
月落鸟啼总是千年的风霜
涛声依旧不见当初的夜晚
夸天的你我怎样重复昨天的故事
——《涛声依旧》歌词
没有未来必然背叛
    在车站和旅游点这些人群流动性大的地方，不但商品和服务质量差，而
且假货横行，因为在商家和顾客之间“没有下一次”——旅客因为商品质优价
廉而再次光『临的可能性微乎其微，因而正常情况下的理性选择是：一锤子买
卖，不赚白不赚。
    在公共汽车上，两个陌生人会为一个座位争吵，可如果他们相互认识，
就会相互谦让。在社会联系紧密的人际关系中，人们普遍比较注意礼节和道
德，因为他们需要长期交往，并且对未来的交往存在预期。
    上面这两个例子说明，对未来的预期是影响我们行为的重要因素。一种
是预期收益：我这样做，将来有什么好处；一种是预期风险：我这样做可能
将来面lI卣问题。这都将影响个人的策略。
    当下屡见不鲜的一夜情现象。更能说明这种预期对行为的影响。事实上，
这个对局与经典的囚徒困境如出一辙：出轨的感情本来就是为了满足欲望而
进行的冒险。上一章中两个盗窃犯的相互背叛，其原理也照样适用于“偷情”
重复博奔：一夜情与地老天荒
的男女。
    素昧平生的一对男女，偶尔在旅游中相遇，接着在宾馆里春梦一场，天
一亮就各自扬长而去，谁也不会忠于谁，彼此也不会为对方今后的不忠实而
产生任何不快。其根本原因就在于这种一夜情，本身就是“一次性”的博弈。
    可是，如果男女双方由此一见钟情，决定发展成为恋人的关系，那么他
们彼此的忠心就会有一定程度的增加。原因在于他们今后还要常常碰面，还
有机会重复博弈。他们会像正常的恋人之间一样，在接下来的重复博弈中．
有无数次的机会来对背叛行为做出惩罚。
    这就是一夜情与爱情之间的区别。
    现代博弈论的发展在上述问题上提供了更深入的解释：每一次人际交往
其实都可以简化为两种基本选择：合作还是背叛。在人际交往中普遍存在囚
徒困境：双方明知合作带来双赢，但理性的自私和信任的缺乏导致合作难以
产生。而且，如果博奔是一次性的，那么这必然加剧双方进行坦白的决心．
选择相互背叛。
    在这样的博弈中，背叛是个人的理性选择。但却直接导致集体的非理性。
似乎没有任何方法能够让我们逃脱两败俱伤的局面。难道人类注定要承受这
个无法摆脱的噩梦吗?
    答案是否定的。资深的博弈论专家罗伯特-奥曼在1959年指出，人与人
的长期交往是避免短期冲突、走向协作的重要机制。拥有以色列和美国双重
国籍的奥曼于1955年获美国麻省理工学院数学博士，当时正是博弈论方兴来
艾之际，在以后50年的时间里．他一直在寻找避免囚徒困境式的纳什均衡的
机制，实际上是从理论上探索协调人们利益冲突，增进社会福利的道路。
    在任何博奔中，表现最好的策略直接取决于对方采用的策略．特别是取
决于这个策略为发展双方合作留出多大的余地。这个原则的基础是下一步对
于当前一步的影响足够大，即未来是重要的。总的来说，如果你认为今后将
难以与对方相遇，或者你不太美心自己未来的利益，那么，你现在最好背叛．
而不用担心未来的后果。
    而现实生活中反复交往的人际关系，则是一种“不定次数的重复博弈”。
奥曼通过自己的推导十分严密地证明，在较长的视野内，人与人交往关系的
壤
涵譬拦
重复所造成的“低头不见抬头见”的关系，可以使自私的主体之间走向合作。
    这可以解释许多商业行为。一次性的买卖往往发生在双方以后不再有买
卖机会的时候，特点是尽量谋取暴利并且带欺骗性。而靠“熟客”、“回头客”
便是通过薄利行为使得双方能继续合作下去。
    事实上，重复博弈也更逼真地反映了日常人际关系。在重复博弈中，合作
契约的长期性能够纠正人们短期行为的冲动。这在日常生活里是具有普遍性的。
如何破解迟到困局
    我们已经知道，由于一次性博弈的大量存在．引发了很多不合作的行为。
而且，即便是在重复博弈中，合作的一方在遭到对方背叛之后，往往没有机
会也没有还手之力去进行报复。比如，资本积累阶段的违约行为，国家之间
的核威慑。在这些情况下，要使交易能够进行，并且防止不合作行为，必须
设置严格的惩罚背叛行为的机制。
    有人曾经在网上提供了这样一个集体活动迟到的问题。
    王老师是某班的班主任，他经常组织本班同学参加集体活动，比如郊游。
但在组织的过程中。他遇到了一个棘手的问题。在一次集体活动中，王老师
通知全班同学早上8：oo到校门口集合。结果有几个同学拖拖拉拉．导致大
家8：15才出发，从而白白耽误了一刻钟。
    在此后的集体活动中，王老师改变了策略，虽然真实的集合时间仍是8：00，
但是他通知大家7：45集合，结果最晚的几个同学也在8：00赶到．从而准
时出发。王老师对自己的策略根满意。
    但是好景不长。时间久了．同学们都发现了王老师通知的集合时间故意
提前，甚至可以根据王老师的通知猜测出真实的集合时间。因此．每当王老
师通知7：45集合时，大家仍然按照真实的集合时间．也就是8：00来做安
排，从而导致几个同学在B：00后才赶来。而那些准时即7：45到达集合地
点的同学都开始抱怨，进而也变得不那么守时了。
    王老师的目标是通知合适的集合时间。从而达到准时出发且避免同学因
为等待而有所抱怨。那么应当制定怎样的策略。才能使活动准时开始并使大
126
重复博弈；一夜慵与地老天荒
家都满意呢?
    在这个问题中．存在着老师与学生、学生与学生之间的博弈。实际上也
是一种多人的囚徒困境。因为每个学生都知道，其他学生的占优策略是选择
到达集合地点的时间，既不能太早，以免白白浪费等待的时间；又不能太晚，
以免承担耽误大家时间的责任。
    要破解这个困境，老师有两个策略选择：一是只要过了集合的时间，就
不再等下去，让迟到的同学独自承担责任。这种责任和相应的惩罚对同学会造
成很大的损失，他们就不会再迟到了。二是如果迟到的学生比较多。那么等
某个数量的学生到齐以后马上出发，而让迟到时间过长的那些同学承担责任。
    一般说来，博弈中双方合作时得益最大，但若一方不遵守台作约定．必
定是另一方合作者吃亏。所以需要引入惩罚机制：谁违约，就要处罚他，使
他不敢违约。一位玩家之所以会与另外一位合作，只是因为他知道，如果他
今天被骗．明天还能对欺骗实施惩罚。奥曼先生把这一洞察结论称之为“无
名氏定理”。
    只有对迟到的学生进行惩罚，迟到问题才能解决，一句话，也就是实行
一份带剑的契约。从囚徒困境中我们可以悟出一条真理：合作是有利的“利
己策略”。但它必须符合以下定律：按照你希望别人对你的方式来对别人，但
只有他们也按同样方式行事才行。
带剑的契约才有效
    在每一个鼓励合作的方案里，通常都会包古某种惩罚作弊者的机制。
    一个坦白且供出合作伙伴的囚徒可能遭到对方朋友的报复。若是知道外
面会有什么报应等着自己，尽快逃脱牢狱之灾的前景也就不会显得那么诱人
了。人人都知道，警察会威胁毒品贩子说如果不坦白就要释放他们。这种威
胁的作用在于，一旦他们被释放，卖毒品给他们的人就会认定他们一定是招
供了而加以报复。
    在最初博弈之上增加惩罚机制的做法，其目的就是为了减少作弊的动机。
在博奔的结构里还存在其他类型的惩罚。一般而言，这种机制生效的原因在
27 l
女☆∞j}舻
于博弈反复进行，这一回合作弊所得将导致其他回合所失。
    归纳起来，在一次性的博弈当中没有办法达成互惠合作。只有在一种持
续的关系中才能够体现惩罚的力度．并因此成为督促合作的”术棒”。合作破
裂自然就会付出代价．这一代价会以日后损失的形式出现。假如这个代价足
够大，作弊就会受到遏制，合作就会继续。事实上，法国哲学家卢梭早就指
出了这一点，他曾经有一本《社会契约论》，认为契约是整个人类社会存在的
前提条件之一。
    前面已经分析过，如果囚徒困境只是一次性的博弈，那么签订协议是毫
无意义的，其纳什均衡点并不会改变。可以签订协议的一个最基本的条件，
就是博奔需要重复若干次，至少大于一次。
    重复博弈与一般性的动态博弈是不同的。多轮动态博弈中，参与者能够
了解到博弈的每一步中其他参与者的在自己选择某种策略下的行动，而重复
博奔的参与者无法了解到在任何一步中，其他参与者的策略选择。
    在重复型的囚徒困境中．签订合作协议并不困难，困难的是协议对博弈
各方是否具有很强的约束力。任何协议签订之后，博弈参与者都有作弊的动
机，因为至少在作弊的这一轮博弈中，可以得到更大的收益。
    霍布斯对合作协议的观点是：“不带剑的契约不过是一纸空文。它毫无力
量去保障一个人的安全。”这就是说，没有权威的协议并不能导致民主．而是
导致无政府状态。
    囚徒困境扩展为多人博弈时，暴露了一个更广泛的问题——“社会悖论”，
或“资源悖论”。人类共有的资源是有限的．当每个人都试图从有限的资源中
多拿一点儿时，就产生了局部利益与整体利益的冲突。人口问题、资源危机、
交通阻塞，都可以在社会悖论中得以解释。在这些问题中，关键是制定游戏
规则来控制每个人的行为。
    另外，学者爱克斯罗德所著的《合作的进化》一书暗含着一个重要的假
定，即个体之间的博弈是完全无差异的。但对局者之间绝对的平等是不可能
达到的，因而某些博弈对一方来说是典型的高成本、低回报：一方面，对局
者在实际能力上存在不对称．双方互相背叛时，可能不是各得1分，而是强
者得5分，弱者得0分，这样，弱者的报复就毫无意义；另一方面．即使对
I z日
重复博弈：一夜情与地老天荒
局双方确实旗鼓相当，但某一方可能怀有赌徒心理，认定自己更强大，采取
背叛的策略能占便宜。爱克斯罗德的分析忽视了这种情形，而这种事实或心
理上的不平等恰恰在社会上引发了大量零和与负和博弈。
    在这种情况下，应通过法制手段。以法律的惩罚代替个人之间的“一报
还一报”，才能规范合作行为。事实上．从博弈论的角度看，法律就是通过第
三方实施的行为规范，其功能是或者通过改变当事人的选择空间改变博弈的
结果，或者不改变博弈本身而改变人们的信念或对他人的行为预期，从而改
变博弈的结果。
用道德来保证均衡
    带剑的契约对于保证合作关系是有效的，但是在更多的情况下，我们根
本找不到，或者不值得用“剑”也就是法律来保证合作。那么在这时，有没
有其他办法来达到均衡呢?答案是肯定的。如果法律是保证人与人关系之间
的唯一武器，那么博弈策略也就没有什么价值了。作家吴思在《潜规则》中
曾经讲了这样一个故事，可以作为一个引子。这个故事来自《明史》，是一个
监察官员的故事。
    崇桢元年(1628年)，朱由检刚刚当上皇帝，发出了“文官不爱钱”的号
召。户科给事中韩一良对这种号召颇不以为然．就写了份上疏，说道：如今
何处不是用钱之地?哪位官员不是爱钱之人?本来就是靠钱弄到的官位．怎
么能不花钱偿还昵?…··我这两个月辞却了别人进我的出书费用五百两银
子，我交往少尚且如此，其余的可以推想了。伏请陛下严加惩处，逮捕处治
那些做得过分的家伙。崇祯读了韩一良的上疏。立刻召见群臣．让韩一良当
众念他写的这篇东西。读罢，崇祯对大臣们说：“一良忠诚耿直，可以当佥都
御史。”
    这时，吏部尚书王永光请求皇帝，让韩一良点出具体人来．究竟谁做得
过分．又是谁送他银子。韩一良吞吞吐吐，显出一副不愿意告发别人的样子。
于是崇桢让他密奏。等了五天，韩一良谁也没有告发。崇祯再次把韩一良和
一些大臣召来，当面追问。然而韩一良就是不肯点名。崇桢让韩一良点出人
。9 l
壤
莲‰{}：掣——一
名，本来是想如他所请的那样严加惩处，而韩一良最后竞推说风闻有人要送。
祟祯训斥韩一良前后矛盾，撤了他的职。
    韩一良宁可叫皇帝撤掉自己的官职，断送了自己的前程．甚至顶着被治
罪的风险，硬是不肯告发那些向他送礼行贿的人，他背后必定有强大的支撑
力量。这是一种什么力量々难道只是怕得罪人?作为给事中，检举起诉和得
罪人乃是他的分内事。因此，恐怕还是一种外在规则的压力，或者说外在规
则在其内心中形成的“道德”在起作用，使其坚决不肯背叛向他行贿的人。
    上面这个历史故事讽刺性地告诉我们：在现实环境中，确实存在着一些
道德因素，可以化解个人理性与群体理性的矛盾，维系整个社会的稳定。
    有一群猴子被美在笼子里，从笼子上方垂下一条绳子，绳子末端拴着一
个香蕉，上端连着一个机关，机关可以开启水源。猴子们发现了香蕉。纷纷
跳上去够这个香蕉．当猴子够到香蕉时，相连的绳子带动了机关，于是一盆
水倒了下来，尽管够到香蕉的猴子屹到了香蕉，但大多数猴子被淋湿了。
    这个过程重复着，猴子们发现．吃到香蕉的猴子是少数，而其余的大多
数猴子都被淋湿。于是，每当有猴子去取香蕉，就有其他的猴子主动地去撕
咬那个猴子。久而久之，猴子们产生了默契，再也没有猴子敢去取香蕉了。
    在这个故事里，猴子问产生了“道德”。猴子们认为取香蕉的后果对其
他猴子不利，因而取香蕉是“不道德的”，它们便会主动地惩罚“不道德的”
猴子。
    与法律一样，道德也是对某些不合作行动的惩罚机制。这种机制的出现
使得人类从囚徒困境中走出来。道德感自然地使得人们对不道德的或不正义
的行为谴责或者对不道德的人采取不合作，从而使得不道德的人遭受损失。
这样，社会上不道德的行为就会受到抑制。因此只要社会形成了道德或不道
德、正义或非正义的观念，就自动对行为产生了调节作用。
    但是在日常生活的交际中，单纯依靠对手的道德自律来达成合作是不
保险的。针对这个问题．我们可以通过对道德因素的考虑，对博弈策略进
行相应的调整．把交际变成长期的、多边的，从而形成诚实守信的动力与
压力。
l 5。
壤
莲‰{}：掣——一
名，本来是想如他所请的那样严加惩处，而韩一良最后竞推说风闻有人要送。
祟祯训斥韩一良前后矛盾，撤了他的职。
    韩一良宁可叫皇帝撤掉自己的官职，断送了自己的前程．甚至顶着被治
罪的风险，硬是不肯告发那些向他送礼行贿的人，他背后必定有强大的支撑
力量。这是一种什么力量々难道只是怕得罪人?作为给事中，检举起诉和得
罪人乃是他的分内事。因此，恐怕还是一种外在规则的压力，或者说外在规
则在其内心中形成的“道德”在起作用，使其坚决不肯背叛向他行贿的人。
    上面这个历史故事讽刺性地告诉我们：在现实环境中，确实存在着一些
道德因素，可以化解个人理性与群体理性的矛盾，维系整个社会的稳定。
    有一群猴子被美在笼子里，从笼子上方垂下一条绳子，绳子末端拴着一
个香蕉，上端连着一个机关，机关可以开启水源。猴子们发现了香蕉。纷纷
跳上去够这个香蕉．当猴子够到香蕉时，相连的绳子带动了机关，于是一盆
水倒了下来，尽管够到香蕉的猴子屹到了香蕉，但大多数猴子被淋湿了。
    这个过程重复着，猴子们发现．吃到香蕉的猴子是少数，而其余的大多
数猴子都被淋湿。于是，每当有猴子去取香蕉，就有其他的猴子主动地去撕
咬那个猴子。久而久之，猴子们产生了默契，再也没有猴子敢去取香蕉了。
    在这个故事里，猴子问产生了“道德”。猴子们认为取香蕉的后果对其
他猴子不利，因而取香蕉是“不道德的”，它们便会主动地惩罚“不道德的”
猴子。
    与法律一样，道德也是对某些不合作行动的惩罚机制。这种机制的出现
使得人类从囚徒困境中走出来。道德感自然地使得人们对不道德的或不正义
的行为谴责或者对不道德的人采取不合作，从而使得不道德的人遭受损失。
这样，社会上不道德的行为就会受到抑制。因此只要社会形成了道德或不道
德、正义或非正义的观念，就自动对行为产生了调节作用。
    但是在日常生活的交际中，单纯依靠对手的道德自律来达成合作是不
保险的。针对这个问题．我们可以通过对道德因素的考虑，对博弈策略进
行相应的调整．把交际变成长期的、多边的，从而形成诚实守信的动力与
压力。
l 5。
假装不知道有尽头
    《笑林广记》中记载这样一则笑话。
    有一个人去理发铺剃头，剃头匠给他剃得撮草率。剃完后，这人却付给
剃头匠双倍的钱，什么也没说就走了。一个多月后的一天，这人又来理发铺
剃头。剃头匠还记得他上次多付了钱，觉得此人阔绰大方，为讨其欢心，多
赚点钱，便竭力上心，周到细致．多用了一倍的工夫。剃完后．这人便起身
付钱，反而少给了许多钱。剃头匠不愿意，说：“上次我为您剃头，剃得很草
率．您尚且给了我很多钱；今天我格外用心，为何反而少付钱呢?”这人不
慌不忙地解释道：“今天的剃头钱，上次我已经付给体了；今天给你的钱，正
是上次的剃头费。”说着大笑而去。
    这个故事说明，有限次的囚徒困境．情况不同于无限次的囚徒困境的重
复博彝。当临近博弈的终点时，采取不合作策略的可能性加大。即使参与人
以前的所有策略均为合作策略，如果被告知下一次博奔是最后一次，那么肯
定采取不合作的策略。
    当合作关系存在某种自然而然的缚点时，博弈反复进行的次数是一定的。
运用向前展望、倒后推理的原则，我们可以看到，一旦再也没有机会可以进
行惩罚，合作就会告终。但是，谁也不愿意落在后面，在别人作弊的时候继
续合作。假如真的有人仍然保持合作，最后他就只能自认倒霉。
    既然没人想倒霉。合作也就无从开始。实际上，无论一个博弈将会持续
多长时间。只要大家知道终点在哪里，结果就一定是这样。因为从一开始，
两位参与者就应该向前展望，预计最后一步会是什么。在这最后一步，再也
没有什么“以后”需要考虑，优势策略就是作弊。这最后一步的结果是一个
不可避免的结论：既然没有办法影响这个博弈的最后一步，那么，在考虑对
策的时候，倒数第二步实际上就会成为最后一步。而在这一步．作弊再次成
为优势策略。理由是，位于倒数第二的这一步对最后阶段的策略选择毫无影
响。因此．倒数第二步可以视为孤立阶段，单独进行考虑。对于任何孤立阶
段，作弊都是一种优势策略。
I 52
重复博奔：一夜情与地老天荒
    深诸策略思维者懂得瞻前顾后，避免失足于最后一步。假如他预计自己
会在最后一轮遭到欺骗，他就会提前一轮中止这一关系。不过．这么一来，
倒数第二轮就会变成最后一轮．还是没法摆脱上当受骗的问题。
    现在，最后两个阶段的情形已经确定。早期进行合作根本无从实现．因
为两个参与者已经决心在最后两个阶段作弊。这么一来，在考虑对策的时候，
倒数第三步实际上就会成为最后一步。遵循同样的推理，作弊仍是一种优势
策略。这一论证一路倒推回去．不难发现，从一开始就不存在什么合作了。
    但是在上面的故事中，剃头匠为什么会上当呢?在现实世界里．所有真
实的博弈只会反复进行有限次．但正如剃头匠不知道客人下一次是否还会光
顾一样，没有人知道博弈的具体次数。既然不存在一个确定的结束时间．那
么这种合作关系就有机会继续下去，实现阶段性的成功合作。要想避免信任
瓦解．千万不能让任何确定无疑的最后一轮出现在视野所及的地方。只要仍
然存在继续合作的机会，背叛就会被抑制。
    不可否认，这个世界存在一些“善良的”人．不管作弊可能带来什么样
的物质利益，他们仍然选择合作。但是多数人都没有那么善良，而是按照自
己的理性行事，在一个反复进行有限次的囚徒困境博弈里，他们会从一开始
就作弊。这会使其他参与者很快看清楚其本质．并对之加以提防。于是，为
了掩盖真相，或者是至少掩盖一会儿真相，他们不得不装出“善良”的样子。
剃头的客人一开始为质量低劣的服务付很多的钱，就出于这种考虑。
    在博弈中．假设他一开始就按照善良人的方式行事，其他参与者就会认
为他大约属于周围少有的几个善良人之一。合作一段时闯将会带来实实在在
的好处。而且其他参与者也会打算仿效他的善良做法，换取这些好处，从而
带来合作的收益。当然，他和其他参与者一样，仍然打算在博弈接近尾声
的时候偷偷作弊。但这并不妨碍在最初一个阶段进行互利互惠的合作。因
此．在各人假装善良等待占别人便宜的时候．大家已经从这种共同欺骗中得
到好处。
    能在一个反复进行的囚徒困境中使信任出现的条件，就是作弊所得晚于
合作破裂的代价之前出现。这么一来，作弊与合作相比哪一个更划算．就取
决于现在与将来相比哪一个更重要。
藏
越譬型
    在商界，比较现在与将来的利润的时候，会用一个合适的利率进行折算。
而在政界，现在与将来的重要性的比较更加带有主观色彩。不过，一般而盲，
如果下一次竞选之后的时间看起来无关大局．政治人物间的合作更容易破裂。
即便是在商界．若是遇到不景气的年份，整个产业处于崩溃边缘，管理层觉
得已经走到山穷水尽，没有明天了，那么，竞争就有可能变得比正常年份更
加激烈。同样地，由于战争迫在眉睫，伊朗和伊拉克会认为现在的利润比将
来的利澜更重要，由此加深了协调限制石油产量以保持长期稳定利润的难度。
    但是隐瞒终点或者说假装没有终点的博弈策略，仍然是以背叛为基础的．
其目的无非是在相互背叛之前得到更多的收益。当然也有例外，比如说在多
数恋人之间的博弈，其目的并非是为了在分手时得到更多的“好处”，而是希
望能更好地维持合作的稳定性，从而缔结连理，自首偕老。
第4章
一报还一报：出来混迟早要还的
出来混迟早耍还的
不是不还只分早晚
是你的递也选不摔的
出采混迟早妻还的
熙熙攘攘利柬利往
到头来还不是尘归尘土归土
——《出来混．迟早是要还的》歌词
以牙还牙，以眼还眼
    一天半夜，某教授正在熟睡之际，电话铃突然响了起来。他睡跟惺忪拿
起电话，听筒里传来女邻居怒气冲冲的声音：“麻烦你管一下你的狗，不要再
让它叫了。”说完，电话就挂了。这位教授十分生气。第二天他定好闹钟，半
夜两点钟准时起床．拿起电话拨通了这位女邻居家。过了半天，对方才章起
听筒，带着睡意恼怒地同：“哪一位?”这位教授彬彬有礼地告诉她：“夫人，
昨天我忘记告诉你了。我们家没有养狗。”
    在这个反映现实人际关系的小笑话中，我们可以发现在没有法规和道德
的约束，也没有其他力量从外部对双方进行强制时，对自己最有利的一种策略：
一报还一报。这一策略的提出，应归功于美国密西根大学的学者罗伯特·爱
克斯罗德。他是一个政治科学家．研究方向是人与人之间的合作关系。
赢材譬鲨型
    在开始研究合作之前，爱克斯罗德设定了两个前提：一．每个人都是自
私的；二，没有权威干预个人决策。也就是说，个人可以完全按照自己利益
最大化的目标进行决策。在此前提下，要研究的问题是：第一，人为什么要
合作；第二，人什么时候是合作的，什么时候又是不合作的；第三．如何使
别人与你合作。
    在研究的过程中，爱克斯罗德组织了一场计算机模拟竞赛。思路非常简
单：任何参加这个竞赛的人都扮演囚徒困境案例中一个囚犯的角色．把自己
的策略编成计算机程序，进行捉对博弈，在合作与背叛之间做出选择。但与
囚徒困境案例有个不同之处：他们不止玩一次这个游戏，而是以单循环赛的
方式玩上200次。这就是博弈论专家所谓的“重复的囚徒困境”．它更逼真地
反映了具有经常而长期性的人际关系。
    这个游戏还允许程序在做出合作或背叛的抉择时，参考对手程序前几次
的选择。如果两个程序只玩过一个回合，则背叛显然就是唯一理性的选择。
但如果两个程序已经交手过多次，则双方就建立了各自的历史档案．用以
记录与对手的交往情况。同时，它们也通过多次的交手树立了或好或差的
声誉。
    虽然如此，下一步将会如何行动却仍然极难确定。实际上，这也是该竞
赛的组织者爱克斯罗德希望从这个竞赛中了解的事情之一：一个程序能够总
是不管对手做何种举动都采取合作的态度吗9或者，它能总是采取背叛行动
吗，它是否应该对对手的举动报之以更为复杂的举动7如果是．那会是怎么
样的举动呢?
    第一轮游戏有14个程序参加，其中包含了各种复杂的策略。再加上爱克斯
罗德自己的一个随机程序(即以50％的概率选取合作或背叛)。使爱克斯罗德和
其他人深为吃惊的是．竞赛的桂冠属于一个被称为“一报还一报(Trr FOR
TAT)”的策略．它是由多伦多大学的数学教授阿纳托·拉波波特提交上来的。
    有意思的是，在科学家们上交的14个程序中有8个是“善意的”，但正是
这些永远不会首先背叛的善意程序．轻易地赢了6个非善意的程序。
    因为参与竞赛的程序为数不多，一报还一报策略的胜利也许只是一种侥幸。
为了进一步验证上述结论．爱克斯罗德决定举行第二轮竞赛．邀请更多的人
I M
一报还一报：出来混迟早要还的
再做一次游戏，并把第一次的结果公开发表。这一次有62位科学家递交了改
进的程序，其中包括多个以上一次的策略为基础的改良品种。加上爱克斯罗
德自己的随机程序．63个程序又进行了一次竞赛。竞赛结果表明．在63个程
序的前15名里．只有第8名的哈灵顿程序是“非善意的”；在最后15名中，
只有1个总是合作的程序是“善意的”。而且，夺魁的仍然是一报还一报策略。
    这种让几十位科学家的智慧相形见绌的神奇策略到底是怎样的呢?
    说起来很简单，简单到有些不可思议：第一步合作，此后每一步都重复
对方上一步的行动：合作或背叛。如此简单的程序之所以反复获胜，是因为
它奉行了以其人之道还治其人之身的原则，并且用如下特征最有效地鼓励其
他程序同它长期合作：善良、可激怒、宽容、简单、不妒忌别人的成功。
    ·善良，是指它第一步总是向对方表达善意。它坚持永远不首先背叛对
    方，开始总是选择合作，而不是一开始就选择背叛或主动作弊。
    ·可激怒，是指对方出现背叛行动时，它能够及时识别并一定要采取背
    叛的行动来报复。不会让背叛者遣遥法外，
    ·宽容．是指它不会因为别人一次背叛。长时间怀恨在心或者没完没了
    地报复．而是在对方改过自新、重新回到合作轨道时，能既往不咎地
    恢复合作；
    ·简单．是指它的逻辑清晰．易于识别．能让对方在鞍短时间内辨识出
    来其策略所在：
    ·不妒忌，是指它不耍小聪明，不占对方便宜，不在任何双边关系中争
    强好胜。
    其他各种策略输就输在上述五个方面做得不够好。在比赛结果中，所有
恶意程序(第一步背叛)都未进前10名；而某些程序太过好脾气。被对方背
叛之后不立即反应，结果鼓励菜些狡猾的程序反复占它的便宜；某些程序对
于过往关系的“好坏”太过执著，一旦被别人欺骗就很难宽容，结果使得很
多本来可能恢复的合作关系永久性断绝；还有一些程序把自己搞得太复杂，
总是试图通过某种机巧来占人便宜．尽管在与某些“傻”程序接触中得了高
分，但一旦碰到个性“刚烈”的程序就会搬起石头砸了自己的脚。而从最后
的总分来看，它们的小聪明得不偿失。
"I
一报还一报：出来混迟早要还的
再做一次游戏，并把第一次的结果公开发表。这一次有62位科学家递交了改
进的程序，其中包括多个以上一次的策略为基础的改良品种。加上爱克斯罗
德自己的随机程序．63个程序又进行了一次竞赛。竞赛结果表明．在63个程
序的前15名里．只有第8名的哈灵顿程序是“非善意的”；在最后15名中，
只有1个总是合作的程序是“善意的”。而且，夺魁的仍然是一报还一报策略。
    这种让几十位科学家的智慧相形见绌的神奇策略到底是怎样的呢?
    说起来很简单，简单到有些不可思议：第一步合作，此后每一步都重复
对方上一步的行动：合作或背叛。如此简单的程序之所以反复获胜，是因为
它奉行了以其人之道还治其人之身的原则，并且用如下特征最有效地鼓励其
他程序同它长期合作：善良、可激怒、宽容、简单、不妒忌别人的成功。
    ·善良，是指它第一步总是向对方表达善意。它坚持永远不首先背叛对
    方，开始总是选择合作，而不是一开始就选择背叛或主动作弊。
    ·可激怒，是指对方出现背叛行动时，它能够及时识别并一定要采取背
    叛的行动来报复。不会让背叛者遣遥法外，
    ·宽容．是指它不会因为别人一次背叛。长时间怀恨在心或者没完没了
    地报复．而是在对方改过自新、重新回到合作轨道时，能既往不咎地
    恢复合作；
    ·简单．是指它的逻辑清晰．易于识别．能让对方在鞍短时间内辨识出
    来其策略所在：
    ·不妒忌，是指它不耍小聪明，不占对方便宜，不在任何双边关系中争
    强好胜。
    其他各种策略输就输在上述五个方面做得不够好。在比赛结果中，所有
恶意程序(第一步背叛)都未进前10名；而某些程序太过好脾气。被对方背
叛之后不立即反应，结果鼓励菜些狡猾的程序反复占它的便宜；某些程序对
于过往关系的“好坏”太过执著，一旦被别人欺骗就很难宽容，结果使得很
多本来可能恢复的合作关系永久性断绝；还有一些程序把自己搞得太复杂，
总是试图通过某种机巧来占人便宜．尽管在与某些“傻”程序接触中得了高
分，但一旦碰到个性“刚烈”的程序就会搬起石头砸了自己的脚。而从最后
的总分来看，它们的小聪明得不偿失。
"I
报还一报：出来混迟早要还的
    在香港电影《无间道》有一句广为流传的台词：出来混．迟早要还的。
就是这句台词决定了剧中不少人物的命运，无论是黑道还是白道．警还是匪，
很多人物在以为自己胜券在握或进出生天时，猝不及防地死去．用一条命来
还了。
    在博弈论中，“还”也是早晚的事，不过这不是什么宿命，而是“一报还
一报”策略的出发点和立足点，也是它的胜利基点。
地老天荒的胜利者
    在博弈论中，我们可以得到很多有趣而富于哲理的启示，一报还一报策
略就是其中之一。它那种善意、宽容、强硬、简单明了的合作策略无论对个
人还是对组织的行为方式来说，都有十分重要的指导意义。
    人们通过接受及回报．形成了社会生活的秩序。这种秩序即使在最无指
望的环境中，例如相互隔绝、语言不通的人群之间也是最易理解的东西。哥
伦布登上美洲大陆时．与印第安人最初的交往就开始于互赠礼物。有些看似
纯粹的利他行为，比如无偿馈赠，也通过某些间接方式，比如社会声誉的获
得，得到了回报。研究这种行为，对我们理解社会生活有很重要的意义。
    爱克斯罗德通过进一步研究，发现合作的必要条件是：第一。关系要持
续，一次性的或有限次的博弈中，对局者是没有合作动机的；第二，对对方
的行为要做出回报，一个永远背叛的对局者是不会有人跟他合作的。
    那么，如何提高合作性呢?
    (1)要建立持久的关系。即使是爱情，也需要建立婚姻契约以维持双方
的合作。
    (2)要增强识别对方行动的能力。如果不清楚对方是合作还是不合作。
就没法回报他了。
    (3)要维持声誉。说要报复就一定要做到，人家才知道你是不好欺负的，
才不敢不与你合作。
    (4)能够分步完成的对局不要一次完成．以维持长久关系。比如，贸易、
谈判都要分步进行，以促使对方采取合作态度。
∞I
飘譬鲨型
    (5)不要嫉妒人家的成功。一报还一报正是这样的典范。
    (6)不要首先背叛，以免担上罪魁祸首的道德压力。
    (7)不仅对背叛要回报，对合作也要做出回报。
    (8)不要耍小聪明，占人家便宜。
    友善、有原则、宽容、简单、不妒忌朋友的成功，其实这些信条本来就
是我们生活中应有的为人处世之道。只是很少人会用博弈论模型的科学结论
作指导．将这些信条连接起来作为一种策略组合行事。
    一报还一报的策略的目标，就是要同尽可能多的人形成井巩固互惠关系．
而且发展为信任和友谊。说得通俗点，就是尽可能多交朋友，并且鼓励这些
朋友向你提供帮助。为了达到这个目标，它的手段归结为一个词就是“回报”，
就是要对别人的各种行为进行相称的反应。有意思的是，这一策略不怕曝光．
而且恰恰需要别人知道你的基本原则，这样才能更好地实现台作双赢。
    根据上述结论，我们可以回答很多交际方法问题．比如恋人如何博弈才
能走上红地毡。
    每对恋人都要承受未来不确定性的折磨：如果双方都不变心，那是最好
的结局．在天成为比翼鸟，在地成为连理枝；如果都变了心．效果也不坏，
你走你的阳关道。我过我的独木桥；如果一方变了心，另外找到了更好的情
侣，另一方却还傻乎乎地忠贞不贰，那么，另觅新欢的一方是最幸福的．比
两人都不变心的结果还幸福．因为他找见了更好的情人；而被抛弃的一方是
最不幸的，比两人都变心的结果更为不幸，因为他承担的压力既来自于自己
的太不幸福，也来自于对方的太幸福。
    人生发誓最多的时期大概就是恋爱时期。发什么誓呢?无非是什么非你
不娶非你不嫁一类誓言罢了．日的只有一个，就是让对方相信自己海枯石烂
此情不渝。他们希望彼此忠诚．从而换来一个好的博奔结果。但一对恋人相
互之间的忠诚，靠的不是这种情深爱笃的誓言，而是需要一定的博弈策略。
在恋爱这场不太好玩的“游戏”中，谁能熟练地驾驭博奔规则，谁就是爱情
的赢家。
    很明显，胜利将总是属于那些采取善意、宽容、强硬和简单明了策略的
恋人们。反之，恶意的、尖刻的、软弱的、复杂的恋人们往往会两败俱伤。
I们
报还一报：出来混迟早要还的
所以，对于正在恋爱中的人们来说，获得幸福爱情的博弈原则应该是：
    (I'善意而不是恶意地对待恋人。这个道理很简单了．无须多说。
    (2)宽容而不是尖刻地对待恋人。幸福的恋人可能并不是忠贞不贰的，
当然也肯定不是见异思迁的，他们能够生活得愉快，关键是能够彼此宽容．
既宽容对力的缺点，甚至也宽容对方偶尔的不忠贞。而尖刻地对待彼此的恋
人．往往都不会幸福。
    (3)强硬而不是软弱地对待恋人。就是要在我永远爱你的前提下．做到
有爱必报，有恨也必报；以眼还眼，以牙还牙；以其人之道。还治其人之身。
比如对恋人与其他异性的亲热行为，要有极其强烈的敏感与斩钉截铁的回报。
当然，每次发脾气都是有限度的，而且还要能宽容对方。
    (4)简单明了丽不是山环水绕地对待恋人。爱克斯罗德的实验证明．在
博弈过程中，过分复杂的策略使得对手难于理解，无所适从，因而难以建立
稳定的台作关系。
    事实上．在一个非零和的环境里，“城府深沉”、“兵不厌诈”、“揣着明白
装糊涂”往往并非上策。相反，明晰的个性、简练的作风和坦诚的态度倒是
制胜的要诀。要让恋人明白你说的是什么．切忌让对方猜来猜去的，造成误
会。至于剩下的时间嘛，还是有更多更快乐的事情可以做!
    本来应该提防恋人背叛才能在恋爱中获胜的博弈，因为有了不绝于耳的
爱情誓言，更因为有了对善意的、宽容的、强硬的、简单明了的原则的把握
和利用．人世间才有了很多地老天荒的爱情和自首偕老的婚姻。
向合作进化的棘轮
    一报还一报的策略在静态的群体中得到了很好的表现，那么，在一个动
态的进化的群体中，这种合作能否产生、发展和生存下去呢?群体是会向合
作的方向进化，还是向不合作的方向进化?如果大家开始都不合作，能否在
进化过程中产生合作呢，
    为了回答这些疑问，爱克斯罗德用生态学的原理来分析合作的进化过程。
他假设对局者所组成的策略群体是一代一代进化下去的．进化的规则包括：
博彝论的靖铲
    (1)试错。人们在对待周围环境时，起初不知道该怎么做，于是就试试
这个，试试那个，哪个结果好就照哪个去做。
    (2)遗传。一个人如果合作性好．他的后代的合作基因就多。
    (3)学习。比赛过程就是对手相互学习的过程，一报还一报的策略好，
有人愿意学。
    按这样的思路，爱克斯罗德设计了一个实验，假设63个参与者中．谁在
第一轮中的得分高，他在第二轮的群体中所占比例就相应增加。这样．群体
的结构就会在进化过程中改变，由此可以看出群体是向什么方向进化的。
    实验结果很有趣。一报还一报原来在群体中占1，63，经过1000代的进化，
结构稳定下来时，它占了24％。因此，以合作系数来测量，群体是越来越合
作的。这个结论还可以引申为：共同演化会使一报还一报的合作风格在这个
充满背信弃义的世界上蔚然成风。
    另外，有一些程序在进化过程中消失了。其中有一个值得研究的程序，
即原来前15名中唯一的不善良的哈灵顿程序，它的对策方案是：首先合作，
当发现对方一直在合作，它就突然来个不合作；如果对方立刻报复它，它就
恢复合作．如果对方仍然合作．它就继续背叛。这个程序一开始发展很快，
但等到与一报还一报不同的程序开始消失时．它就开始下降了。
    由此，爱克斯罗德的试验除了表明群体是越来越合作的之外，还揭示了
一个哲理：一个策略的成功应该以对方的成功为基础。
    一报还一报在两个人对局时．得分不可能超过对方，最多打个平手，但
它的总分最高。它赖以生存的基础是很牢固的，因为它让对方得到了高分。
哈灵顿程序就不是这样．它得到高分时．对方必然得到低分。它的成功是建
立在别人失败的基础上的，而失败者总是要被淘汰的．当失败者被淘汰之后．
这个从失败者身上占便宜的成功者也被淘汰。
    即使在一个极端自私者所组成的不台作者的群体中，一报还一报也能够
生存。
    实际上．我们从逻辑上也可以理解这一点。假设少数采取一报还一报策
略的个人在这个世界上通过突变而产生了。那么，只要这些个体能互相遇见，
足够在今后的相逢中形成利害关系，他们就会开始形成小型的合作关系。
I艟
报还一报：出来混迟早要还的
    一旦发生了这种情况，他们就能远胜于周围的那些准备主动背叛的类型。
这样，参与合作的人数就会增多。很快，一报还一报式的合作就会最终占上
风。而一旦建立了这种机制，相互合作的个体就能生存下去。如果不太合作
的类型想侵犯和利用他们的善意，一报还一报策略强硬的一面就会狠狠地惩
罚他们，让他们无法扩散影响。
    爱克斯罗德发现，只要群体的5％或更多成员是一报还一报的，这些合作
者就能生存；而且。只要他们的得分超过群体的总平均分，这个合作的群体
就会越来越大，最后蔓延到整个群体。相反，不合作者无论在一个合作者占
多数的群体中有多大比例，都是不可能越来越多的。
    这就说明．社会向合作进化的棘轮是不可逆转的，群体的合作性会越来
越大。爱克斯罗德正是以这样一个鼓舞人心的结论．为人类突破囚徒困境指
出了一条道路。
在一在二不在三
    公元前512年，吴王闽阃执政，为了称霸诸侯，他四处网罗人才，先后
把伍子胥和孙武收到自己的麾下。不久。吴国和楚国之间爆发了一场大规模
的战争。
    说起这场战争的起因却非常简单，吴国边境有一个小镇叫卑粱，这里与
楚国的边境小镇钟离接壤。虽然分属于两个不同的国家，但是两个小镇的人
之间相处得一直十分和睦。有一日，吴国的一个小筏子采桑叶．与楚国的小
孩子吵了起来，双方的边民因此发生争斗。楚平王得知以后，派大兵去平了
卑粱。吴王以牙还牙。也派公子光带兵去攻打楚国。吴国大军浩浩荡荡开赴
边境，不费吹灰之力就把楚国防守的钟离和居巢荡平了，乘势直追楚国的腹
地，逼得楚国急忙撤军。
    公元前506年，楚国为了报复。出兵攻打已经归附吴国的小国——蔡国。
吴国派大将孙武率领兰万精兵．乘船逆淮河而上教援。楚军赶忙遇兵．在汉
水设防。没想到孙武却突然弃船登岸，从陆路奔袭楚国腹地。吴军五战五胜，
占领了楚的国都郢城。然而，这时越国乘吴军伐楚之机进攻吴国，秦国叉出
硒I
博彝论的确}舻
兵帮助楚国对付吴军，这样．阖闯不得不引兵返吴。此后，吴又继续伐楚．
孙武率领大军挥师直下，一直打到郢都，迫使楚昭王仓皇出逃。
    因为两个小孩的争吵而导致楚国几乎被灭亡的这一连串战争，·在其演进
过程中，我们可以清晰地看到一报还一报策略的作用机制。
    一报还一报的策略解释了一个纯粹自利的人何以会选择合作，只因为合
作是自我利益最大化的一种必要手段。如果对方知道你的镶略是一报还一报．
那么对方将不敢采取不合作策略．因为一旦他采取了不舍作策略，双方便永
远进入不合作的困境。因此，只要有人采取一报还一报策略，那么双方均愿
意采取合作策略。
    但是这个策略面lI占着这样一个问题：如果双方存在误解，或者由于一方
发生选择性的错误，这个错误是无意的，那么结果将是双方均采取不合作的
策略，
    在这里，一报还一报箫略反映出了自己的局限性。两个以牙还牙者会从
合作开始．然后．由于各方反应一致，合作似乎注定可以永久地持续下去，
从而彻底避免囚徒困境问题。但是，不管出现误会的几率怎样微乎其微(即
便是小到万亿分之一)，只要有可能出现误会，长期而言，一报还一报策略会
有一半时间合作，一半时间背叛。理由是，一旦出现谋会．双方将问题复杂
化与澄清误会的可能性一样大。这么一来，一报还一报策略其实就跟扔硬币
决定合作还是背叛的随机策略差不多，因为后者选择合作和背叛的几率也是
相同的。即使出现误会的几率很小，也只是将出现麻烦的时间推迟了。而且，
反过来，一旦出现误会．就要花更长时间才能澄清。
    由于资源的约束。在现实中没有人支出足够的时间、精力来辨识和维持
对别人的各种回报，尤其是当他拥有很多博弈对手的时候。由于各种偶然的
因素，误解随时随地都有可能发生。比如．两个小孩于之间的争吵可能被看
敌对行为的开始而引发战争。
    如何做到回报的“相称”又是一个问题：对手偶然背叛了你，你通过行
动或者不行动来显示你对此介意，你自己觉得是相称的“警告”，但对手很可
能认为你反应过度，小题大做。因而会出现这样一种情况：哪怕是微不足道
的误解一旦发生，一报还一报策略的双赢就会土崩瓦解。
    这个缺陷在人工设计的电脑锦标赛中并不明显，因为电脑根本不会出现
报还一报：出来混迟早要还的
误解。但是，一旦将一报还一报策略用于解决现实世界的问题，误解就难以
避免，结局就可能是灾难性的。一方对另一方的背叛行为进行惩罚。对手受
到惩罚之后．不甘示弱，进行反击。这一反击叉招致第二次惩罚。无论什么
时候．这一策略都不会只接受惩罚而不做任何反击。由此将形成一个循环+
惩罚与报复就这样自动持续下去。
    从这个角度来说．一报还一报策略在现实世界中会出现两种缺陷：第一，
实在太容易激发背叛；第二，它缺少一个宣布“判此为止”的机制。
    当博弈中考虑到这种随机干扰——即由于误会而开始互相背叛的情形时．
吴坚忠博士经研究发现，以修正的一报还一报策略对双方会更有利。这种修
正包括两个方面：一是“宽大的一报还一报”，即以一定的概率不报复对方的
背叛；二是“悔过的一报还一报”，即以一定的概率主动停止背叛。
    当某一背叛行为看上去像是一个错误而非常态举止的时候，你应该保持
宽容之心。必须记住的一个重要原则是，假如有可能出现误会．不要对你看
见的每一次背叛都进行惩罚，而要采取“在一在二不在三”的策略。你必须
猜测一下是不是出现了误会，不管这个误会来自你还是你的对手。这种额外
的宽容固然可能使别人对休稍加背叛，不过，假如他们真的背叛．他们的善
意也就不会再被相信了。误会一再出现时．你也不会再听之任之。所以，如
果你的对手有投机倾向，他终将自食其果。
    如果对手的这一背叛是故意的．你当然也不想太轻易地宽恕对方而被对
方占了便宜。但是经过一个漫长的惩罚循环之后，也许到了该叫停井尝试重
建合作的时候了。
    爱克斯罗德在《合作的进化》一书结尾早已指出：友谊并不是合作的必
要条件，即使是敌人，只要满足了关系持续、互相回报的条件也有可能合作。
合作不依靠善意、诚信或者一个外来的仲裁者，也完全可能从自私自利的冷
酷盘算中产生。比如，第一次世界大战期间在战场上自发产生的“自己活，
也让他人活”的原则。德英两军在战壕战中遇上了三个月的雨季，双方在这
三个月中达成了默契——互相不攻击对方的粮车给养，约束自己不开枪杀伤
人，只要对方也这么做。使这个原则能够实行的原因是，双方军队都已陷人
困境．三个月的时间给了他们相互适应的机会。
¨I
博彝论的；学舻
    这个例子说明，友谊不是合作的前提
因此，我们也可以为“在一在二不在三”
迈向合作的一步。
台适的策略也能达成并保证合作。
的策略制定一些具体的操作，作为
    (I]开始合作。
    (2)继续合作。
    (3)计算在你合作的情况下对方看上去背叛了多少次。
    (4)假如这个百分比变得令人难以接受，转向一报还一报策略。
    注意，与以前不同，此时的一报还一报策略不是作为对良好行为的奖赏，
相反，却是对企图占你便宜的另一方的惩罚。
    要想确定令人难以接受的背叛的百分比是多少，你必须了解对方行为的
短期、中期和长期历史。仅看长期历史是不够的．一个人合作了很长时间并
不意味着他不会在声誉开始下降的时候企图占你的便宜，你还要知道“最近
他都对你做过什么”。
    这种策略的确切规则取决于错误或误会发生的几率、你对未来获益和目
前损失的重要性的看法，等等。不过，在并不完美的现实世界里，这种策略
很可能胜过严格的一报还一报策略。
以直报怨的人生哲学
    上面一节，实际上也是关于为人处世策略的一个讨论。在这方面，世界
各种文化中都留下了很多各不相同的教诲，并且存在着很多道德性的、价值
性的、形而上的分歧与争议。
    接下来，我们用著名经济学家茅于轼的一殷经历，来说明人与人相处的
一个原则问题：当被别人以不正当的手段对待时．你应选择什么样的策略进
行反应。
    有一天，茅先生陪一位外宾去北京西郊戒台寺游览。他们叫了一辆出租
车．来回90多公里，加上停车等待约两个小时，总计价245元。但茅先生发
现司机没有按来回计价。按当时北京市的规定．出租车行驶超过15公里之后
每公里从l 6元加价到2．4元。其理由是假定出租车已驶离市区．回程将是空
I¨
报还报：出来混迟早要还的
车。但对于来回行驶，因不会发生空驶，全程应按1 6元计价。显然，出租车
司机多收费了。
    此时茅先生有三种选择。一是拒绝付款，司机将不得不屈从。因为如果
茅先生去举报他的违规行为．他将被处以停驶一段时间的处罚．损失更大。
这种办法叫做“人不犯我，我不犯人；人若犯我，我必犯人”，也就是“以怨
报怨”。你不守信用，我也不守信用；你欺骗我．我也欺骗你。用这种方法来
教训那些办坏事或破坏规则的人．他们吸取了教训或许会改辕易辙。鲁迅有
一段话说：“损着别人的牙眼，却反对报复．主张宽容的人，万勿和他接近。”
所采用的就是这种态度。
    还有一种方法叫做“以德报怨”策略，也就是永远允许对方采取不合作．
而自己永远采取合作策略，你对我搞阴谋诡计，我仍旧对你友好。这种策略
可以避免冤冤相报无穷尽，但是却只可能被那些道德极端高尚的“圣人”所
采用．因为它是超越理性的。基督教《新约》上说，如果有人打你的左脸，
你应把右脸也让他打，用这种胸怀和博爱去感化对方。基督教相信人之初性
本善，每个人都有善的基因，只要有足够的力量去启动，坏人也能变为好人。
    法国作家雨果的名著《悲惨世界》中．冉阿让偷了神父的东西被警察抓
住，神父却为他开脱，所采取的就是这种策略，并且产生了巨大的道德感召
力，使冉阿让重归正途。但是一般情况下，这个策略对采取者最为不利，因
为多数对手并不是冉阿让，而是一旦知道了你会采取这种策略后，他们会永
远采取背叛策略。
    上述两种办法截然相反，但都有他们的道理。仔细想来确实叫人感到惊
奇。两种极端都有道理，其结果是怎么做都可以。对待坏人真的就设有有效
办法了吗?有没有既非以怨报怨，又非以德报怨的办法?
    答案当然是有。那就是一报还一报策略的修正策略。孔子在几千年前就
提出了“以德报德，以直报怨”这样精彩的策略，所谓“直”．就是公正，以
直报怨就是按照事情本身的是非曲直．公正地回报对方的背叛．而不是以恩
怨来考虑当前的策略。
    这种修正了的一报还一报，修正的是报复的程度，本来会让你损失5分，
现在只让你损失3分．从而以一种公正审判来结束代代相续的报复，形成
”I
博奔论的崩}劳
文明。
    孔子反对以德报怨，因为这样做的话，对坏人也施以德，对好人也旆以
德，变成没有区别，于理不合。以直报怨包含两重意思：一是要用正直的方
式对待破坏规则的人，二是要直率地告诉对方，你什么地方办错了事。
    出租车司机多收费，以怨报怨就是拒绝付款；以德报怨就是不但付钱还
给他一笔小费：以直报怨则是仍按规定付款，但要告诉他犯了规．以后改正。
经济学家茅于轼的做法是：指出司机的违规行为．但仍按规定向他付教。在
这种策略中．他们应付180元。另加停车场收费5元。
    除了以德报德、以直报怨，我们常说的“投桃报李”、“人不犯我，我不
犯人”等都体现了一报还一报的思想。尽管这一策略并不是最优的．在充满
了随机性的现实社会里有这样或那样缺陷．但相对以德报怨和以怨报怨来说，
无论从哪个角度来说都是相对优势的策略。
输掉战役赢战争
    千百年来，楚汉相争一直是中国人回昧无穷的历史片断。自司马迁的《史
记》把项羽描绘成“力拔山兮气盖世”的英雄以后，历代文人墨客往往崇敬
出身将门的项羽．而嘲贬出身平民的刘邦，李清照“生当作人杰，死亦为鬼
雄”的诗句更是把这种祟仰推到了极致。
    抛开这些感性的评价，很多人也会对项羽兵败感到十分奇怪。项羽从起
兵到失败丧生历时七年，多是战绩辉煌，用他自己的话来说就是“身七十余
战，所当者破，所击者服”，最后却一战而全军溃敬．到底是为什么呢?项羽
最后自叹是“此天之亡我，非战之罪也”，其实也说明他正是带着上面这个疑
问死去的。
    项羽于公元前209年与其叔项粱在江东聚集“八千子弟”造反，在随后
的反抗秦国的大战中．显示出无人能敌的强大战斗力，被各派割据武装推为
霸主。公元前206年义军占咸阳灭秦．项羽将刘邦打发到偏僻的汉中。自己
也离开当时天下最富庶的关中而东返彭城(徐州)立都。随后．刘邦暗度陈
仓夺取了关中，接着东袭彭城。项羽即刻回兵打败汉军。随后三年的楚汉战
《飘
报还一报：出来混迟早要还的
争呈持久形态。项羽屡战屡胜，汉军屡战屡败，然而项羽却于公元前202年
在垓下一败而溃。
    力拨山兮气盖世的项羽败给文不知诗书、武不能阵战的刘邦，很多人都
归咎于偶然失手或一念之差，其实这是一种十分浅薄的认识。事实上。项败
刘胜恰恰说明．在任何一场战争中，只有战略的胜利者才是最后的胜利者，
是真正的胜利者。
    对于这一点．我们也可以通过博弈论的研究得到证实。爱克斯罗德通过
数学化和计算机化的方法研究如何突破囚徒困境，在数学上的证明无疑是令
人信服的。他在计算机模拟中得出的一个非常惊人的发现：总分最高的人在
每次博弈中都没有拿到最高分。
    这就像刘邦．每次战役都没有能战胜对手，但是随着战争的进行，实力
日益增强。相反．项羽能够从每一场战役中获得一些胜利．但是实力却愈战
愈衰。最后的结局也就可想而知了。那么这种强弱对比的转化是如何发生的
呢?
    项羽起兵后．一直以起兵时的“八千子弟”为骨干。史学家曾考证这批
江东首义者的出身，发现多是些流浪、乞盗的江湖不逞之徒，虽然勇武好斗
却破坏性极强。他们纵横天下时。战斗力虽胜过诸侯之兵，却有焚杀劫掠恶
习。项羽正是在这批人簇拥下，制造了坑杀秦军降卒、攻城后焚烧洗劫一类
暴行。项羽在关中不敢久留，是因当地百姓对他恨之人骨。相反，初到关中
便“约法三章”的刘邦却赢得了威望。
    第二个原因又是与第一点相联系的，那就是稳固的根据地。刘邦每次兵
败后都能恢复元气，关键是有关中作为后方，能源源不断地供应粮食和补充
兵员。战胜之际论功行赏时，刘邦把“抚百姓，给馈饷．不绝粮道”的萧何
列为三大功臣之首。项羽却从不注重建设后方，主要靠兵威四处索粮掠物，
所得不多又失民心，自然不能持久。正因如此，两军对决时，项羽部只能速
战速决，在一地相持日久就会出现“汉兵盛食多，项王兵罢食绝”。在垓下关
键一战中，楚军叉因“兵少食尽”军心动摇，饥兵听到“四面楚歌”便随之
瓦解。
评估一个策略成功与否．一个常见的方法是衡量它有多大能力来克服自
厶9 I
丫4．*#☆∞自}
f}
己的不足。如果我们从发展的、演进的角度思考．就会发现撮有利于成长的
策略才是真正的优势策略。不同的策略会经常相互较量。除非一个策略能够
保证压倒对手，否则任何最初阶段的成功都将转变为自我毁灭。
    楚汉战争的结局证明，项羽的策略是失败的，他的一场场胜利慢慢消耗
掉了自己的资源和优势，使他最终一败涂地。一失足成千古恨的背后．实际
上有一个从量变到质变的过程。
    这段看似奇特的历史启示我们，即使每一次合作中最优策略都带来损失．
它最后还是能赢得全局的胜利。换句话说．就是你辖掉了每一个战役，却依
然能赢得整个战争。反之，即使你赢得了每一个战役，也不一定能赢得整个
战争。这看起来是不可思议的．但实际上又是租容易理解的：因为这种策略
是善于合作的，对手虽然可能在和他的每一次交锋中都相对得利，但是在全
局上的优势积累上却无法胜过最优策略。要做到辖战役，赢战争，就必须有
全局优先的观念。
    美国第九届总统威廉·哈里逊小时候家里程贫穷，他沉默寡言．家乡的
人们甚至认为他是个傻菝子。有一次，一个人跟他开玩笑，拿一枚五美分的
硬币和一枚一美元的硬币放在他的面前让他挑，说挑哪个就送他哪个。哈里
逊看了看．挑了五美分的硬币。这一举动逗得人们哈哈大笑，都以为哈里逊
是个傻小弦。
    这事很快在当地传开了，很多人都饶有兴致地来看这个“傻小孩”，并拿
来五美分和一美元的硬币让他挑。每次，哈里逊都是拿那枚五美分的。而不
拿一美元的。一位妇女看他这样可怜，就同他：“你难道真的不知道哪个更值
钱吗?”哈里逊回答说：“当然知道，夫人，可是我拿了～美元的硬币．他们
就再也不会把硬币摆在我面前，那么，我就连五美分也拿不到了。”
    如果从某一次合作的局部看可能是吃亏的，但是这些合作对全局发展却
起到极大的作用，那么这种亏是值得吃的。这正是俗语所谓“吃小亏占大便
宜”．细细～想的确十分传神。
    顾维钧是近代中国著名的外交家。他有一段关于吃亏的论述十分精彩。
颐维钧以为中国的事情难办，尤其外交难办。他以为内政的对象是人民．外
交的对象是与国。在内政上有时候可以开大价钱．可以开空头支票。反正人
150
报还一报：出来混迟早要还的
民无知无力．对你也莫可如何。至于外交，那就得货真价实，不能假一点，
不能要大价钱．否则就会自讨没趣，自食其果。他曾经不无惋惜地说：“中国
的外交，从巴黎和会以来．我经手的就很多。所犯的毛病，就是大家乱要价
钱，不愿意吃明亏，结果吃暗亏；不愿意吃小亏，结果吃大亏。”
    虽然说的是国际交往．但是事实上也颇适合很多生活中的事情，分辨明
亏和暗亏、小亏与大亏，是我们每一个人走向成功的必要智慧。
    有一个年轻人大学剐毕业就进入出版社做编辑，他的文笔很好，但更可
贵的是他的工作态度。那时出版社正在进行一套丛书的出版，每个人都很忙．
但上司并没有增加人手的打算．于是编辑也被派到发行部、业务部帮忙。整
个编辑部几乎所有人去一两次就抗议了．只有那个年轻人心情愉快地接受指
派。事实上也看不出他有什么便宜可占，因为他要帮忙包书、送书，像个苦
力工一样f他真是个可以随意指挥的员工．后来他又去业务部参与销售的工
作。此外．连取稿、跑印刷厂、邮寄…一只要开口要求，他都乐意帮忙!两
年过后，他自己成立了一家出版公司，做得很不错。
    原来他在吃亏的时候。把一家出版社的编辑、发行、直销等工作都摸熟
了。现在．他仍然抱着这样的态度做事，对作者，他用吃亏来换取作者的信
任；对员工，他用吃亏来换取他们的积极性；对印刷厂，他用吃亏来换取品
质…·由此看来，他这下真的占到了便宜!
    如果吃亏能会让休得到比其他人更多的工作经验，更多的发展机会．那
么吃亏也就是占便宜!这个年轻的大学生，在最初工作的时候．随意地被老
板和其他员工指派，但就是在这个过程中，他积累了工作经验、人脉关系．
在短短两年之后成功地开始了自己的事业。
    在工作中，我们不要总是计较工作的轻重，比别人干多了，还是干少了，
重要的是能否得到自己所需要的知识技能。尤其是年轻人．这样的吃亏实际
上恰恰是输战役而赢战略的积累，因为它使你积累了工作经验．提高了自己
的做事能力，扩大了人际关系网络。
第5章
第J章
人质困境：多个人的囚徒困境
拥挤的人群和孤独灵魂
空洞的眼脚步夜光星展
人与人的竞争你和我的追连
究竟如何分出胜负
——《心如止水》歌词
赫鲁晓夫在哪里
    囚犯困境作为博弈论中的一个基本的模型．可以解释很多与此类似的杜
会现象，如寡头竞争、军备竞赛等。但是社会中的博弈往往并不止有两个参
与者，这时的博弈还会出现囚徒困境吗?
    答案是肯定的，在多个参与者之间形成的囚犯困境又称为人质困境。从
两个囚犯到一群人质，个人理性与团体理性的巨大冲突能够更真实地反映
出来。
    1956年2月14日．苏共第二十次代表大会在莫斯科召开。24日，大会
闭幕。这天深夜，赫鲁晓夫突然向大会代表们作了《关于个人崇拜及其后果》
的报告(即所谓《秘密报告》)，系统揭露和批评斯大林的重大错误，要求肃
清个人崇拜在各个领域的流毒。报告一出，顿时在国内外引起了强烈反响。
由于赫鲁晓夫曾是斯大林非常信任的人，很多人心里都有个疑问：你既然知
道他的错误，为什么在斯大林生前和掌权的时候，你不提出意见．而要在今
人质困境：多个人的囚徒困境
天才放“马后炮”呢?
    后来，在党的代表会上，当赫鲁晓夫又就这个话题侃侃而谈时，有人从
听众席里传来一张纸条，上面写着：当时你在哪里?
    可以想像，当时赫鲁晓夫是何等尴尬和难堪，回答必然要自暴其短，而
如果不答，把纸条丢到一边，装做什么也收发生．那只会表明自己怯阵了，
结果必然会被在场的人们看不起．丧失威信。从台下听众的一双双眼睛中，
他知道，他们也有同样的疑问。
    赫鲁跷夫想了想，便拿起纸条，大声念出了上面的内容．然后向台下喊
到：“写这张纸条的人，请你马上从座位上站起来，并走到台上。”台下鸦雀
无声。赫鲁晓夫再重复了一遍，但台下仍然是一片死寂．投有人敢动弹一下。
赫鲁晓夫于是淡淡地说：“好吧，就让我告诉你，当时我就坐在你现在所坐的
那个位置上。”
    从这个故事中，我们不仅可以看出改革家赫鲁晓夫的机智和率直，而且
还可以知道，在一群人面对威胁或损窨时，“第一个采取行动”的决定是很难
做出的，因为它意味着惨重的代价。这就是人质困境。
    要理解这一点。我们只需要对比一下1939年苏共第十八次大会与五年前
代表大会的代表情况。五年前的2000名党代表在这次大会上还能出席的仅剩
下区区35人，有1100人因为“从事反革命活动”而被捕，131名中央委员中
有98人遭到清洗，3／5的红军将领、所有11名副国防委员、所有军区司令、
最高军委会80名委员中的75名，也无一例外落得同样的下场。
    这个故事像极了给猫拴铃铛的童话故事，那个故事的大意是这样：老鼠
们意识到，假如可以在猫脖子上拴一个铃铛，那么，它们的安全就会大有保
障。问题在于，谁会愿意冒赌掉小命的风险给猫拴上铃铛呢?老鼠所面临的
这个问题同样摆在人类面前：人们在直接面对威胁或损害时．也面临着同样
的心理困境。
    最常见的例子是：一辆长途车上的几十名乘客，面对两个持刀劫匪无计
可施，任其把所有人的钱包洗劫一空。这种冷漠与软弱的报道屡见报端．对
在场者的指责甚至是谩骂也充斥于各大网站。人们多用“无情”等来指责他
们。但是从博弈论的角度来说，对他们的指责确实有些太过苛刻。
耶I
人质困境：多个人的囚徒困境
天才放“马后炮”呢?
    后来，在党的代表会上，当赫鲁晓夫又就这个话题侃侃而谈时，有人从
听众席里传来一张纸条，上面写着：当时你在哪里?
    可以想像，当时赫鲁晓夫是何等尴尬和难堪，回答必然要自暴其短，而
如果不答，把纸条丢到一边，装做什么也收发生．那只会表明自己怯阵了，
结果必然会被在场的人们看不起．丧失威信。从台下听众的一双双眼睛中，
他知道，他们也有同样的疑问。
    赫鲁跷夫想了想，便拿起纸条，大声念出了上面的内容．然后向台下喊
到：“写这张纸条的人，请你马上从座位上站起来，并走到台上。”台下鸦雀
无声。赫鲁晓夫再重复了一遍，但台下仍然是一片死寂．投有人敢动弹一下。
赫鲁晓夫于是淡淡地说：“好吧，就让我告诉你，当时我就坐在你现在所坐的
那个位置上。”
    从这个故事中，我们不仅可以看出改革家赫鲁晓夫的机智和率直，而且
还可以知道，在一群人面对威胁或损窨时，“第一个采取行动”的决定是很难
做出的，因为它意味着惨重的代价。这就是人质困境。
    要理解这一点。我们只需要对比一下1939年苏共第十八次大会与五年前
代表大会的代表情况。五年前的2000名党代表在这次大会上还能出席的仅剩
下区区35人，有1100人因为“从事反革命活动”而被捕，131名中央委员中
有98人遭到清洗，3／5的红军将领、所有11名副国防委员、所有军区司令、
最高军委会80名委员中的75名，也无一例外落得同样的下场。
    这个故事像极了给猫拴铃铛的童话故事，那个故事的大意是这样：老鼠
们意识到，假如可以在猫脖子上拴一个铃铛，那么，它们的安全就会大有保
障。问题在于，谁会愿意冒赌掉小命的风险给猫拴上铃铛呢?老鼠所面临的
这个问题同样摆在人类面前：人们在直接面对威胁或损害时．也面临着同样
的心理困境。
    最常见的例子是：一辆长途车上的几十名乘客，面对两个持刀劫匪无计
可施，任其把所有人的钱包洗劫一空。这种冷漠与软弱的报道屡见报端．对
在场者的指责甚至是谩骂也充斥于各大网站。人们多用“无情”等来指责他
们。但是从博弈论的角度来说，对他们的指责确实有些太过苛刻。
耶I
人质困境：多个人的囚徒困境
    只要多数人同时采取行动，确实很容易成功地捉住抢劫者。但是问题在
于，统一行动少不了沟通与合作．偏偏沟通与合作在这个时候变得非常困难。
抢劫者由于深知乘客联合起来对自己意味着什么，因此必然会采取特殊的措
施，阻挠他们进行沟通与合作，其中包括危害首先发难的人。
    有人认为，一个人基于公民道德和责任的而应采取的行为，不能掺进成
本利害计算的杂质。这实在是一种不切实际的要求。担当这个任务的领头人
意味着要付出重大代价．甚至可能付出生命。他得到的回报也许是人们的感
激和怀念，而且也确实有人在这种情况下挺身而出，比如徐洪刚。但是付出
生命的代价还是显得过于沉重，沉重到并非多数人所能够承受。
    这就是赫鲁晓夫要告诉大家的真理，也是每个人必须面对的现实。需要
协调和个人牺牲才能有所收获的事情，做起来可能具有人们难以想像的难
度。如同童话里的那些老鼠，它们如果要去拴那个铃铛，就必须基于现实危
险考虑。
束手无策的人群
    有这样一个故事。深刻地反映了生活中的人质困境。
    旅行社的中巴将于下午一点返回．可是临发车时，导游却发现还有三个
人没到。一车人等到下午两点半．三个人优哉游哉地回来了。大家松了一口
气，司机发动了车准备出发。不料那三人转身旁若无人地钻进了路边的一个
小饭馆。车上的人愤怒了：素质太差!快开车吧，太晚了不安全!可是愤怒
了半天．只有一个女人独自下车前往交涉。
    那女人进了饭馆，言词激烈地劝阻他们点菜，可是迟归者冷冷地反驳道：
“大家都没说什么，你一个人就代表大家了々”那女人满脸通红地回到中巴
上搬救兵，可是大家只是在车内嚷嚷一通，算作一种远距离的声讨。三点钟，
三个迟归者吃完饭上车，中巴启动了。那女人提议．由迟归者向大家道歉。
可是全体游客鸦雀无声，过了半天才有人小声说：“得了，出门在外，都不容
易。”一些人随声附和。那女人冷笑着自言自语：“听说当年一个日本鬼子能
管中国一个县．原来我不信，现在算是信了。”
的I
博弈论的蘑舻
    把三个缺德的游客与日本鬼子相比，看上去有些小题大做，但实际上这
里面的机制是一样的，因为二者所赖以成功的东西，都是人质困境。只不过
后者的威胁是明显的暴力，而前者则是人情社会中的面子。
    人质困境在生活中虽然十分普遍，但其实也不是不能克服。我们来探讨
一下怎样才能破解这个困局。
    1945年，德国牧师马丁·尼莫勒说：“刚开始时．纳粹镇压共产主义者，
我没说话．因为我不是共产主义者。然后，他们开始迫害犹太人，我也没说
话，因为我不是犹太人。接着纳粹把矛头指向商业工会，我还是没说话，因
为我不属于商业工会。当他们迫害天主教徒时，我仍然没说话，因为我是个
新教教徒。后来他们开始镇压新教教徒…可那个时候，我周围的人已经被
迫害得一个不剩，没有人能为新教说话了。”
    面对邪恶却明哲保身的人，最后也会成为受害者。
    希特勒是怎样通过规模相对较小的力量一步步控制了包括“共产主义者、
犹太人、商业工会、天主教徒和新教教徒”这样一个数目不断增大的人群呢?
整个德国为什么会在这样一个劫持国家机器的人面前无计可施而柬手就擒
呢?不仅是在德国，在很多极权社会中的人们都面临类似的问题。
    就像上一节所说的，只要大多数人同时采取行动．就很容易取得成功。
不过，统一行动少不了沟通与合作．而压迫者由于深知群众的力量有多大，
会采取特殊的措施，阻挠人们进行沟通与合作。一旦人们不得不单独行动，
希望聚沙成塔，集腋成裘，这个问鼯就出来了：“谁该第一个采取行动?”
    仅仅用道德的呼唤来让人们挺身而出与邪恶作斗争是不现实的，而且．
要任何一个人在人质困境中首先采取行动并独自承担报复的后果都是不公平
的。那么有没有这样一个平台，能把斗争的代价和风险降到最低，并能把人
们从人质困境中解救出来?
    《北京晚报》报道，在该报与北京市公安局公交分局于2004年舍办的“我
为反扒支一扭”活动中，“短信报警”这一建议荣获一等奖。实际上在此之前，
南京公安局已经推出了短信提醒服务．还将开通短信报警。
    在犯罪分子制造的人质困境之中，报警者可能遭到犯罪分子的报复。那
么相应的对策，也就应该从减轻报警者可能遭到的报复和提高报警的回报两
I弘
人质困境：多个人的囚徒困境
方面着手。短信报警能在提大程度上帮助报警者摆脱报复的困境。
    随着手机的普及，短信作为一种新*传播方式得到了飞速的发展。短信
报警擐大的优点在于其隐秘性，使人们能在不动声色、不惊动他人的情况下
报警，因此能在很大程度上避免和犯罪分子直接冲突。短信报警的匿名特征
也使得报警者没有后顾之忧，从而降低了对遭到报复的预期。
    我们通过对短信报警的考察，再来回顾德国纳粹的例子，似乎可以有一
个相对比较乐观的假设。如果互联网旱出现七八十年，也许可以为反对希特
勒的德国人提供一个风险较小的沟通平台，能够把自己从极权的劫持中拯救
出来吧’
两种理性的矛盾
    明崇桢十七年(1644年)三月．李白成攻陷北京，陪都南京府部官员开
始商议由谁来监理国家政事。五月十五日，督师风阳总兵马士英联合江北四
总兵刘泽清、刘良佐、黄得功和高杰拥立朱由崧称帝南京，是为南明政权或
称弘光政权。
    当时，南明诸将以镇守荆楚的左良玉实力最强。南明弘光二年(1645年)，
左盎玉以“清君侧”的名义，发兵沿江东下九江，南明内战开打。在清军南
侵．左良玉又顺江内犯的形势下，弘光帝召对群臣商讨对策。刑部侍郎姚思
孝、御史乔可聘、成友谦说：“左良玉稍缓。北尤急，乞无撤江北兵马．固守
淮、扬，控扼颖、寿。”弘光帝虽荒淫昏庸，却也讲出一句明白话：“左良玉
应该不是真想反叛，还是以兵坚守淮扬抵挡清兵。”而马士英闻吉喝道：“北
兵至，犹可议和。左良玉至，我君臣死无葬身之地。宁可君臣同死于清．不
可死于左良玉手。”他随后命令“有议守推者斩”。
    朝议之后，马士英下令明军皆从江淮沿线回撤，死保南京不被左军攻破。
江淮门户空虚，任由清军跃马直前。不久，左良玉病死军中，但是清军已经
突破虚弱的长江防线．兵I临南京城下。朱由崧逃往芜湖，后被擒杀。马士英
奔浙江而去，京城文武官员数百名，军士23万开门投降。不久之后，左良玉
的儿子左梦庚也率军降清．南明的第一个王朝就此覆灭了。
5’I
忑‰翟鲨型
    在上述博弈中，马士英的选择有四：先攮外打清朝；先安内打左良玉；
联台左良玉打清朝；联合清朝打左良玉。
    在这四种策略中，先攘外，那么就首先会受到清朝的攻击。而此时另一
对手左良玉就有两种选择，攻打马士英或者按兵不动。选择攻打马士英的现
实收益值罪大．因为很容易就可以把马士英给打败：如果等到马士英或者是
清朝打败了对方，那么左良玉再去打的话．就有可能要冒很大的风险了．收
益值很有可能就为负了。因此．按兵不动是左良玉的劣势第略。按照博弈论
的理性人的假设，左良玉肯定会选择优势策略．也就是打马士英。那么．马
士英就会两面受敌．很容易给打败，所以先攘外就成了马士英的劣势策略=
    而如果马士英先打左良玉，安定内部，那么清朝就又获得了主动权．它
去打马士英的话又变得很容易了。但清朝是马士英和左良玉共同的敌人，它
打马士英时就必然要打左良玉，所以此时是马士英和左良玉双方都同时受损，
收益值都得负，但比两面受敌要好得多。
    如果联合左良玉打清朝，马士英和左良玉双方都获益，收益值都为正，
合作是双方的优势策略。如果联合清朝打左良玉，马士英得正，左良玉就为
负了．因为左良玉被打败的风险增加，这是马士英的严格优势策略。但是，
这种策略对左良玉也成立，结果就是马士英和左良玉都采取这种严格优势策
略，双方客观上都跟清朝联合，结果双方都受到损失。
    个人理性与群体理性的矛盾，在这里暴露无遗。
    囚徒困境博弈的一个前提是博弈参与双方都是完全理性的。理性的概念
来源于经济学中的理性人假设。所谓理性人，也就是一个只要求效用，也就
是自身的利益最大化的人。效用是一个心理学上的词语，它描述的是一个人
从某事、某种活动或某种商品的消费中所获得的自身的满足程度，而博弈论
就是指导人们实现效用最大化的手段。
    传统经济学的鼻祖亚当·斯密在其传世经典《国民财富的性质和原因的
研究》中这样描述市场机制：“当个人在追求他自己的私利时．市场的看不见
的手会导致最佳经济后果。”这就是说，每个人的自利行为在“看不见的手”
的指引下，追求自身利益最大化的同时也促进了社会公共利益的增长。也即
自利会带来互利。
I 5日
人质困境：多个人的囚徒困境
    这种以个体利益最大为目标的理性被称为“个体理性”，而有完美的分析
判断能力和不会犯选择行为的错误被称为“完全理性”。完全理性包括追求最
大利益的理性意识、分析推理能力、识别判断能力、记忆能力和准确行为能
力等多方面的完美表现．其中任何一方面不完美就不属于完全理性。
    传统经济学秉承了亚当·斯密的思想，认为：人的经济行为的根本动机
是自利．每个人都有权追求自己的利益，没有私利社会就不会进步．社会的
财富是建立在对每个人自利权利的保护上的。因此经济学不必担心人们参与
竞争的动力，只需关注如何让每个求利者能够自由参与尽可能展开公平竞争
的市场机制。只要市场机制公正，自然会增进社会福利。
    然而．囚徒困境模型动摇了传统经济学的理论基础，带来经济学的重大
革命。模型中的囚徒是完全理性的，因而也是完全自利的，因此绝对不会出
现一个囚徒选择“坦白”，而另一个囚徒选择“抵赖”的局面；也不会出现同
时“抵赖”的结果。这后两种结果的无法实现，恰恰说明个人理性不能通过
市场导致社会福利的最优。每一个参与者可以相信市场所提供的一切条件．
但无法确信其他参与者是否能与自己一样遵守市场规则。
    囚徒困境揭示了个体理性的选择与群体理性选择之间的矛盾，从个体利
益出发的行为往往不能实现团体的最大利益；同时也揭示了市场理性本身的
内在矛盾。从个体理性出发的行为最终也不一定能真正实现个体的最大利益，
甚至舍得到相当差的结果。
    从囚徒困境及其变形模型中，我们可以证明：在人们相互交往的过程中，
每个行为主体的利己主义决策结果，可能是有效率的，也可能是无效率的，
但多次重复这种决策肯定是低效率的。
    趋利避害是社会^的本能，大至国家兴亡，小至兄弟分家，都无法避开
这种本能。“兄弟闻于墙”与“外御其侮”矛盾，是所有联盟参加者所面临的
共同困境。从个人理性的角度来说，因利而合、因利而分直到因利而斗，都
是不难理解的。
59 l
博彝论构簿舻
威力巨大的武器
    在阿拉伯世界流传着这样一个故事：流浪汉手里抱着一块石头．敲开了
一户富人的门，请求女主人借给他锅用一下，因为他想煮“石头汤”喝。女
主人无法拒绝这样简单的要求，而且也很想见识一下这种从未听说过的奇怪
的石头汤。于是，在女主人家的灶火上，流浪议开始煮石头汤。当锅里的水
烧开以后，流浪汉又请求女主人再给他一点点盐。这请求同样是那么简单，
使女主人无法拒绝。之后，流浪汉用汤勺把汤放到嘴里尝了一下，似乎很满
意，但又有些美中不足。他又请求女主人给这个汤加“少许”胡椒粉，因为
这会影响汤的味道……
    最后，流浪汉再一次请求女主人给这个汤加一点“微不足遭”的肉末，“这
会使这神奇的石头汤的味道更加鲜美”。汤煮好了，流浪汉把锅里的石头捞出
来丢到一旁，而后邀请女主人和他一起享用锅里的肉汤。
    这个故事告诉我们，如果逐个提出要求，可以实现被要求者本来不想答
应的目的。这里面的“逐个”，既可以理解为进程的一个个步骤，也可以理解
为逐个对手进行博弈。
    在一个大型出租车队里，汽车经常是由调度员派给司机的。车队里既有
好车，也有年久失修的老爷车。调度员可以利用他的调度权向每个司机收取
一点贿赂。谁若是拒绝行贿，就一定会得到一部老爷车，而那些愿意合作的
司机就会“抽到”上上好签。
    这么一来．调度员是发了，但司机群体面对的其实还是同样的汽车。假
如司机们联合起来，也许可以结束这种被迫行贿的日子，但是怎样才能组织
起来采取行动呢'问题的关键不是调度员能从行贿者那里得到多少好处，而
是他可以惩罚那些不肯行贿的人。
    这个故事我们还可以在生活中找到很多翻版，它说明了一个由人质困境
而产生的现实：如果博弈的一方尝试逐个地解决问题，对于对手具有相当大
的危硷性。
    将住户从准备拆迁的房子里赶出去就是另外一个类似的例子。假如某房
160
^质困境：多个人的囚徒困境
地产开发商在某地买下了这么一块地皮，并且成功地赶走了住在其上的第一
个租户。那么，他很快就可以把通过一连串的行动赶走全部住户，而不必动
用引起公愤的强制力量，或造成重大的社会影响。
    他可以对住在最东边的住户说：“我已经准备在这块土地上建房子，因此，
我打算让你搬走，假如你肯合作自愿搬离的话，我会给你20万元作为补偿，
或者回迁时只收取我们建房的成本价。如果你现在不搬的话，等别人都搬走
的时候，你什么也拿不到。”虽然这笔钱确实可以买到这样的房子，但是对于
即将拔地而起的连片商品房的利润来说，这个数目只是九牛一毛。住户面『插
两个选择：一是拿着20万元走人，二是什么也得不到，还是要走人。当然他
会选择前者。接下来，开发商向第二家住户说同样的话，直到所有住户都搬
家走人。
    上面两个案例的结局虽然成功率很高，但是对社会来说，影响却可能并
不理想，甚至可能引起强烈的争议，要求出台各种措施避免这种结果。不过，
一味地批评是没有任何作用的。无论是想达成还是想避免我们所说的这种结
果，都必须看清问题产生的机制，那就是被称为“手风琴效应”的连锁反应
机制。这种机制之所以发挥作用，是因为博奔的逐步进行，就像演奏手风琴
一样，每一个折叠都会推动或拉动邻近一个折叠。也正因如此，我们在上面
的例子里已经看到，逐步解决问题，可以成为具有相当威力的博弈武器。
是竞争也是劫持
    美国费城西区有两个互为敌手的商店——纽约廉价品商店和美国廉价品
商店。它们正好紧挨着，两家商店的老板一直进行着没完没了的价格战。
    “出售爱尔兰亚麻床单，甚至连有鹰一般眼睛的贝蒂·瑞珀女士都不能
找出任何疵点，不信请问她；而这床单的价格又低得可笑，只祷6 50美元。”
当一个店的橱窗里出现这样的告示时．每位顾客都会习惯地等另一家廉价品
商店的回音。果然．大约过了两小时．另一家商店的橱窗里出现了这样的告
示：“瑞珀女士该配副近视眼镜了，我的床单质量一流．只需5 95美元。”
    价格大战的一天通常就这样开始了。除了贴告示以外，两店的老板还经
博彝论的詹铲
常站在店外尖声对骂，最后总有一方在这场价格战中败下阵来，不再降价。
这时，人们都会拥人获胜的廉价品商店，将床单和其他物品抢购一空。这样
的竞争持续了很长时间，不仅让住在附近的人买到了各种“物美价廉”的商
品，而且使得一些准备在这个区开店的人望iliP-E畏。
    突然有一天．一个店因为老板去世而停业。几天以后，另一个店的老板
声称退休回家，也停业了。过了几个星期．两个商店分别来了新老板。他们
在对商店进行检查时．意外地发现两店之间有一条秘密通道。两位新老板很
奇怪，后来仔细一了解才知道．这两个死对头竟是兄弟俩。
    原来．一切相互间的竞争与人身攻击全是在演戏，每场价格战都是装出
来的．不管谁战胜谁，最后还是把两家的一切库存商品卖给顾客。这兄弟两
个真是一对精明的博弈高手。
    事实上，即使不是在两个兄弟，而是在真正的竞争对手之间，也完全可
以通过以降价向对手进行惩罚的承诺，来营造井维持一个价格联盟，而且完
全是以竞争的名义进行。这就是博弈策略的魔力。
    下面我们看博弈论著作《策略思维》中的一个案例。
    纽约市立体音响商店“疯狂埃迪”打出了自己的口号：“我们不会积压产品。
我们的价格是最低的——保证如此!我们的价格是疯狂的。”而在它的主要竞
争对手纽瓦克＆刘易斯那里，顾客每次购物都会得到这个商店的“终生低价保
证”。按照这一非要击败对手不可的承诺．假如顾客在别的地方看到更低的价
格，商店会按差价的双倍赔偿。不过．尽管这一家的政策听上去很有竞争力，
却有可能加强一个价格联盟的内部约柬。为什么会发生这样的事情呢，
    假设一台录像机的批发价是150元．现在疯狂埃迪和纽瓦克＆刘易斯都卖
．300元。疯狂埃迪偷偷作弊，减价为275元。假如没有对手“差价双倍赔偿”
的承诺．疯狂埃迪完全有可能将一些原本打算在对手那边购物的顾客吸引过来。
    不幸的是，对疯狂埃迪而言．这回减价起了完全相反的效果。因为纽瓦
克＆刘易斯有那么一条保证．人们就想赚便宜，纷纷进来买一台录像机，然后
要求赔偿50元。这么一来．相当于纽瓦克＆刘易斯的录像机自动减价为250
元，比疯狂埃迪减得还厉害。不过，当然了．纽瓦克＆刘易斯～定不愿意就这
么付出50元。因此，它的对策就是降价至275元。无论如何，疯狂埃迪的销
I 6。
氧
人质困境：多个人的囚徒困境
量都不如原来。那又何必搞鬼作弊呢々价格还是保持在300元好了。就这样，
虽然价格联盟在美国是非法的．疯狂埃迪与纽瓦克＆刘易斯却还是结成了这么
一个联盟。
    这个心照不宜的价格联盟是按照我们前面提过的博弈条件运行的：觉察
作弊，并且惩罚作弊者。纽瓦克＆刘易斯可以轻易觉察疯狂埃迪作弊。那些跑
来说疯狂埃迪打出更低价格而要求赔偿的顾客，其实在毫不知情的情况下，
扮演了这个价格联盟的执法侦探。
    惩罚的形式是价格协定破裂，导致利润下降。那则“终生低价保证”的
广告自动而迅速地实施惩罚。这就是博弈的智慧．在看似火热纷繁的表象背后．
往往深藏着出人意表的策略。
与对手联合起来
    在天才的黎巴嫩作家纪伯伦一篇题为《魔鬼》的作品中，一位名叫胡里·赛
姆昂的博学之士每天奔波于黎巴嫩北部山村中，教村民们摆脱魔鬼的纠缠。
他与魔鬼日夜搏斗，从来不知厌倦。然而，有一天他路遇受了重伤而奄奄一
息的魔鬼，却“卷起袖子，把长袍塞进腰里”，把魔鬼背回家去救治。原因就
在于魔鬼对他说了这样的话：“我是永恒的魔鬼，我是万恶之源。但是罪孽灭
绝了，同罪恶搏斗的人也就不见了。你也将随之失业，你的子子孙孙、你的
同事友人也将销声匿迹。难道你愿意以我的死亡来换取罪孽的消亡9”
    这个故事对于那些立志铲除世上一切罪恶的人是一个讽刺，同时也揭示
了那些准备把对手全部消灭的人的矛盾与尴尬。对于这一点，中国人用自己
的语言简单地总结出四个字——兔死狗烹。
    这四个字的总结者是汉朝开国功臣韩信。他最早在霸王项羽的部队里当
兵，由于不受重视，改投汉王刘邦，并成为汉军的统兵元帅。韩信领兵作战，
所向无敌，最后用十面埋伏的办法．把项羽的精锐部队消灭殆尽，并且紧迫
不舍，在乌江边逼得项羽自刎而死。
    然而汉军胜利后，刘邦马上取消了韩信的齐王称号，封他为楚王，后来
又贬为淮阴侯。最后，韩信被刘邦的妻子吕后处死。在被害前，韩信发出了
65 I
飘譬邕邕
响彻千古的慨叹：“狡兔死，走狗烹。禽鸟尽，良弓藏。敌国灭，谋臣亡。”
这句话对我国后代政治的影响，无论怎么评价都不为过。
    唐朝末年，黄巢剐刚起兵造反时，皇帝派大将宋威率兵围剿。宋威对手
下人说：朝廷常负功臣，我们胜了未必有好处，不如留着贼人以自保。此后，
宋威的军队总是与黄巢的队伍保持30里的距离，任由黄巢烧杀抢掠，一天天
壮大。最后，导致唐朝彻底毁灭。
    到了宋朝，开国宰相赵普虽然读书不多，却是个非常有谋略的人，他辅
佐了宋太祖赵匡胤和宋太宗赵光义．统一了大半个中国。然而，当宋朝只剩
下最后一个强敌——北方的契丹时．赵普所有的谋略似乎都消失了．以至于对
契丹的数次统一战争均告失败。在以后的日子里．宋朝一直受到威胁，不得
不年年纳贡以求平安。赵普之后，宋朝的历任掌朝重臣无不心领神会，养敌
自保，从不提出统一对方的盎策。
    明朝的开国功臣徐达也是一个攻无不取、战无不胜的军事统帅。但是，
当他率兵攻取了北京及周边地区后，没有乘胜追击．顺势统一广大的蒙古地
区，反而停滞不前，使元朝残部在蒙古地区得以死灰复燃，成为明朝数百年
的威胁。后来流寇乍起，而朝廷派出的将领采取宋威曾经用过的策略．只追
杀，不围堵，养贼邀功，反叛力量越来越多．致使明朝灭亡。
    兔死狗烹的故事出现得太多了，于是有“太平本是将军定，不许将军见
太平”的感叹。但是如果把能臣良将不敢尽情发挥自己的才华，甚至为了保
护自己而去保存敌人，完全归结于对胜利后难以善终的畏惧心理，未免有些
过于简单了。在每一个养敌自保的故事背后，都有一个直接关系到各方利益
的博弈棋局。
    20世纪50年代，美国的常春藤联校面临一个问题。每个学校都想练出一
支战无不胜的橄榄球队，结果各个学校为了建立一支夺标球队而过分强调体
育．忽略了学术水准。不过，无论各队怎样勤奋训练，各校又是怎样慷慨资
助．赛季结束的时候各队的排名却和以前差不多。一个难以逃避的数学事实
是，有一个胜者就要有一个负者。因此，所有的加倍苦练事实上都会付诸
东流。
    大学体育比赛的吸引力几乎同等地取决于两个因素：一是竞争的接近程
人质困境：多个人的囚徒困境
度以及激烈程度，二是技巧水平。许多球迷更喜欢看大学篮球比赛和橄榄球
比赛，而不是职业比赛；大学体育比赛的技巧水平可能稍低一些，竞争却往
往更刺激、更紧张。
    看到这样的情况，各大学也变聪明了。他们达成协议，将春季训练限定
为一天时间。虽然球场上出现了更多失误，但球赛的激烈程度却一点也没减
少．观众对比赛的热衷程度也没有减退．而运动员有了更多时间准备功课。
可以说，各方的结果都比原来更好。
    由于在这种比赛中，成功是由相对成绩而非绝对成绩决定的。假如一名
参与者改善了自己的排名，那他必然使另一个人的排名变得差了。不过．一
人的胜利要求另一人失败的事实．并不能使这个博弈变成零和博弈。零和博
弈不可能出现所有人都得到更好结果的情况。但在这个例子中却有可能。收
益范围来自减少投人。尽管胜者和负者的数目一定，但所有参与者参加这个
博弈的代价却会减少。
    对那些菲敌自保或养贼邀功的将军们来说，目标也恰在于此，那就是使
自己参与博弈的代价尽可能减少，而使收益最大化。
    在现代商业竞争中，类似的例子比比皆是。
    在一般的消费者看来．可口可乐和百事可乐是饮料市场上两个水火不相
容的对手．两家的市场竞争也可谓你死我活，似乎每家都希望对方忽然发生
重大变故，而把市场份额拱手相让。但是多年来．这种局面让每一家都赚了
个盆满钵溢．而且从来没有因为竞争而使第三者异军突起。
    这里面的真正原因就在于：这两位饮辩市场的龙头老大，宴际上在进行
着一种类似于常春藤联校橄榄球比赛的博弈，从而形成了一种有合作的竞争
关系。他们真正的目标是消费者，以及那些虎视眈眈的后起之秀。只要有企
业想进入碳酸饮料市场，他们就必然展开一场心照不宣的攻势，让挑战者知
难而退，或者一败涂地。
    我们再来看看麦当劳和肯德基在市场上的布局，也许就更能明白这一点。
麦当劳店开在哪里，肯德基店很快就会出现在附近，形成一种十分默契的“遥
相呼应”，很少有第三者在他们中间出现。两大巨头表面上的竞争关系，往往
能够为他们排斥新进入的竞争者提供更多的策略选择。
6。I
第6章
酒吧博弈：混沌系统中的策略
过去我不知世界有很多奇怪
过去我幻想的未来可不是现在
现在才似乎清楚什么是未来
噢
不是我不明白。这世界变化快
——《不是我不明白》歌词
酒吧里会有多少人
    “酒吧问题”(Bar problem)是美国人阿瑟(wB Arthur)1994年在《美
国经济评论》发表的一篇文章中提出来的。阿瑟是斯坦福大学经济学系教授，
同时是美国著名的圣塔菲研究所研究人员。酒肥问题是这样的：
    假设一个小镇上有总共有100人，每个周末均要去酒吧活动或是待在家
里。这个小镇上只有一间酒吧，能容纳60人。并不是说超过60人就禁止人
内．而是因为设计接待人数为60人，只有60人时酒吧的服务最好．气氛最
融洽，最能让人感到舒适。第一次，100人中的大多数去了这间酒吧，导致酒
吧爆满，他们没有享受到应有的乐趣。多数人抱怨还不如不去；那些选择没
去的人反而庆幸．幸亏没去。
    第二次，人们在去之前，根据上一次的经验认为，人多得受不了．决定
还是不去了。结果呢?因为多数人决定不去，所以这次去的人很少．享受了
酒吧博弈：混沌系统中的策略
一次高质量的服务．没去的人知道后叉后悔了：这次应该去呀
    问题是，小镇上的人应该如何做出去还是不去的选择呢‘，
    这是一个典型的动态群体博弈问题。前提条件还做了如下限制：每一个
参与者面临的信息只是以前去酒吧的人数、因此只能根据以前的历史数据归
纳出此次行动的策略．没有其他的信息可以参考．他们之间也没有信息交流
    在这个博弈中．每个参与者都面临着这样一个困惑：如果多数人预测去
酒吧的人数超过60．而决定不去．那么酒吧的人数反而会很少．这时候做出
的预测就错了。反过来．如果多数人预测去的人数少于60．因而去了酒吧，
那么去的人会很多．超过了60，此时他们的预测也错了：
    也就是说．一个人要做出正确的预测，必须知道其他人如何做出预测
但是在这个问题中每个人的预测所根据的信息来源是一样的．即过去的历史．
而并不知道别人当下如何做出预测
    从理论上说的确如上述所言，但是实际的情形会怎么样呢?阿瑟教授通
过计算机模拟和对真实人群的考察两种方法．得到了两个不同的有趣结果，
    计算机的模型实验的情形是：开始．不同的行动者是根据自己的归纳来
行动的．并且去酒吧的人数没有一个固定的规律；然而．经过一段时间以后．
去酒吧的平均人数很快达到60．即去与不去的人数之比是60：40。尽管每个
人不会固定地属于去酒吧或不去酒吧的人群，但这个系统的比例是不变的
也就是说．他们会自组织地形成一个生态稳定系统。
    但是阿瑟教授通过对真实人群的观察研究，却得到了与计算机模型实验
迥然不同的结果，对真实人群的实验中，实验对象的预测呈有规律的渡浪形
态，实验中去酒吧的人数如表6一j所示，
表6．1
酒吧问题对真实人群的实验数据
    不同的行动者可做出不同的预测．例如预测：下次的人数将是前4周的
平均数(53)，两点的周期环(78)，与前面隔一周的相同(78)。
    从上述数据看．实验对象的预测呈有规律的波浪形态虽然不同的博弈
6’I
者采取了不同的策略．但是却有一个共同点：这些预测都是用归纳法进行的。
我们完全可以把实验的结果看做是现实中大多数“理性”人做出的选择。在
这个实验中．更多的博弈者是根据上一次其他人做出的选择而做出其本人“这
一次”的预测。然而，这个预测已经被证明在多数情况下是不正确的。
    从这个层面上可以说，这种预测是一个非线性的过程。
    传统经济学中认为，经济主体或行动者的行动是建立在演绎推理的基础
之上的。但事实并非如此，多数人的行动是基于归纳的基础之上的。而对于
这样一个非线性的过程来说，由于系统的未来情形对初始值有着强烈的敏感
性，对于下次去酒吧的确定的人数，我们是无法做出肯定的预测的。
    对于酒吧问题，由于人们根据以往的历史来预测以后去酒吧的人数．过
去的人数历史就很重要．然而过去的历史可以说是“任意的”，未来就不可能
得到一个确定的值。
    “股票买卖”、“交通拥挤”以及“足球博彩”等等问题都是酒吧博弈模
型的延伸：在现行的说法中，对这一类博奔统称为“少数人博奔”，其最简单
的模型是：失火时面对两个门．你将如何选择人数可能较少的生门，在这个
模型中你的选择决定了你的生与死。
    事实上，这个结论也可以用在股市上。每一位股民都在猜测其他股民的
行为，并努力与大多数股民不同。如果多数股民处于“卖”股票的位置，而
你处于“买”的位置，你买人的价格低，你就是赢家；而当你处于少数的“卖”
股票的位置，多数人想“买”股票．那么你持有的股票就能以高价卖出，你
将获利。
    但是一个股民采取什么样的策略．完全是根据以往的股市表现归纳出来的。
而相同的股市表现．导致其他股民所采用的策略完全是不确定的，也无法预测．
因而任何股民都无法肯定地预测自己是否处于“少数”赢利者的地位。
    也正因如此．历史数据也就未必能够提供什么帮助．因为如果股市的变
化可以从历史数据中推导出来的话．那么所有的股民都将求助于大容量硬盘
和高性能电脑了，只要安装一个软件，就可以财源滚滚。但如果存在这样一
个炒股必赢的系统，那么所有人必将处于无股可买的处境．因为如果所有人
都知道哪些是潜力票，哪些是垃圾股，也就没有人抛出潜力股，也没有人买
I 68
酒吧博弈：混沌系统中的黄略
人垃圾股。
    也就是说，股市只有作为一个无法准确预测的混沌系统，才有存在的可
能．也才能让那些无法预测到其他参与者策略的股民们，在“博傻”过程巾
赚钱。
    酒吧博弈的研究，对于我们的现实启示就在于：
    第一．从一个非线性系统的整体来说，其变化往往是不可预测的。要采
取正确的决策。必须了解其变化规律。所谓非线性的混沌系统．可以这样理
解．2是1的2倍，但是t00万却并不是1的100万倍．1亿也并不是1的1
亿倍。后者是一个无法准确了解的系统．因为我们不知道量变在哪个地方成
为质变，而且改变了变化方式。在下面几节，我们会重点讨论一个混沌系统
的临界点对于策略思维的价值。
    第二，对于处身于一个混沌系统中的个体来说，在无法预测的过程中也
可以采取恰当的策略．并且可以趋吉避凶。在这样的策略中。少数者策略是
值得我们重点关注的。
一加一未必等于二
    有一户人家喂养了一只猫，自己觉得比别人家的猫能捉老鼠．就给它起
了个威武的名字，叫虎猫。这天，他家来了一个客人。谈论起这只猫，客人
说道：“虎的确很勇猛，但不如狮，狮是万兽之王。就请改名为狮猫吧。”主
人拍掌称妙．于是虎猫改成狮猫了。
    可是第二天，家里又来了个客人，听了给猫改名字的事情，不以为然地
说：“狮虽然比虎强．但只能在地上跑；而龙可以在天空行走．比狮更神奇．
不如改名龙猫吧。”主人频频点头，照此办理。
    隔了些天．第三位客人来他家，听说虎猫改成龙猫了．忙说：“龙虽然比
虎神气，但龙升天要靠浮云．不如叫云猫吧。”从此，龙猫改叫云猫了。
    又过了些日子，第四位客人听说龙猫改成了云猫，他认为不好．对主人
说：“满天云气，经不住一阵狂风就吹散了。风的威力大，就叫风猫吧。”于
是云猫变成了风猫。
69 I
酒吧博弈：混沌系统中的黄略
人垃圾股。
    也就是说，股市只有作为一个无法准确预测的混沌系统，才有存在的可
能．也才能让那些无法预测到其他参与者策略的股民们，在“博傻”过程巾
赚钱。
    酒吧博弈的研究，对于我们的现实启示就在于：
    第一．从一个非线性系统的整体来说，其变化往往是不可预测的。要采
取正确的决策。必须了解其变化规律。所谓非线性的混沌系统．可以这样理
解．2是1的2倍，但是t00万却并不是1的100万倍．1亿也并不是1的1
亿倍。后者是一个无法准确了解的系统．因为我们不知道量变在哪个地方成
为质变，而且改变了变化方式。在下面几节，我们会重点讨论一个混沌系统
的临界点对于策略思维的价值。
    第二，对于处身于一个混沌系统中的个体来说，在无法预测的过程中也
可以采取恰当的策略．并且可以趋吉避凶。在这样的策略中。少数者策略是
值得我们重点关注的。
一加一未必等于二
    有一户人家喂养了一只猫，自己觉得比别人家的猫能捉老鼠．就给它起
了个威武的名字，叫虎猫。这天，他家来了一个客人。谈论起这只猫，客人
说道：“虎的确很勇猛，但不如狮，狮是万兽之王。就请改名为狮猫吧。”主
人拍掌称妙．于是虎猫改成狮猫了。
    可是第二天，家里又来了个客人，听了给猫改名字的事情，不以为然地
说：“狮虽然比虎强．但只能在地上跑；而龙可以在天空行走．比狮更神奇．
不如改名龙猫吧。”主人频频点头，照此办理。
    隔了些天．第三位客人来他家，听说虎猫改成龙猫了．忙说：“龙虽然比
虎神气，但龙升天要靠浮云．不如叫云猫吧。”从此，龙猫改叫云猫了。
    又过了些日子，第四位客人听说龙猫改成了云猫，他认为不好．对主人
说：“满天云气，经不住一阵狂风就吹散了。风的威力大，就叫风猫吧。”于
是云猫变成了风猫。
69 I
酒吧博弈：混沌系统中的策略
    又过了几天，第五位客人听说云猫改成风猫了，就向主人建议说：“再大
的风，一堵墙就能挡住．叫墙猫再合适不过了。”这样，风猫叉改成墙猫。
    一位邻居听说了墙猫这个名字，很有意见。他找上门来对主人说：“墙很
结实固然不错，你想过没有，老鼠会在墙上打洞，打了洞的墙．很快就会倒
塌，还是起名叫鼠猫吧。”
    上面这个故事告诉我们，未经协调的选择之间相互影响，达成让全体参
与者一致感到遗憾的结果。研究这种结果的形成机制，可以帮助我们从一开
始有所行动．从而避免出现对大家都不利的情况。
    许多国家运用关税、配额以及其他方法限制进口，保护本土产业。这样
的政策会抬高价格．损害国内所有使用受保护产品的消费者的利益。经济学
家估计，假如美国运用进口配额保护钢铁、纺织或制糖产业，导致大家不得
不购买价格更高的产品，换算过来，相当于每保住这些产业中的一个职位．
美国国内其他人就要付出10万元的代价。为什么会这样，极少数人的得益为
什么能够压倒更大多数人的损失而得到优先考虑呢t
    秘诀在于一次提出一件事情。首先．制鞋产业的1万个职位面临着威胁。
要想挽救这些职位，国内其他人就得付出l亿元．或人均付出4元。谁不愿意
付出4元保住1万个职位呢?即便素昧平生的陌生人也会愿意的吧，尤其是
在可以把所谓不择手段的外国商人当做现成的诅咒目标之际。接着就轮到服
装产业、钢铁产业、汽车产业．等等。没等我们明白过来，我们已经点头同
意付出500多亿元，相当于人均付出200多元．或每个家庭付出1000多元。
假如我们事前可以看穿整个过程．大概会明白这个代价确实是太高了，继而
坚持要让上述各个产业的工人自己承担国际贸易带来的风险，就像他们承担
任何其他经济风险一样。
    就个案逐项进行决策，可能导致全部结果都与我们的意愿南辕北辙。实
际上，一项决定即便获得多数人投票赞成．仍然有可能导致一个对每个人来
说都比现状更糟的结果。之所以出现这些问题。是因为短视的决策者没能看
远一点，更看不到全局。
    明朝灭亡后．朱明皇室的一些藩王相继在江南建立了反清的政权．历史上
称它们为南明。福王朱由崧被凤阳总督马士英等人拥立，于南京即位。朱由崧
翻“蛊鲨型
终日享乐，政事都交给马士英。马士英为了扩充实力，选拔了大量人员人朝．
一时间出现满地是官的景象。拥有这么多官吏，福王却只做了一年皇帝。
    钱钟书说过这样一句意味深长的话：要想把哪个东西搞坏．不要骂它、
不要臭它，而要让它无限制地繁殖泛滥，结果它自然就名声扫地了。与钱钟
书的话有异曲同工之妙的是，一位研究苏共党史的专家说：前苏共20万党员
时打垮了沙皇的反动统治，200万党员时打垮了希特勒的法西斯进攻．而2000
万党员时却打垮了自己。
    早在1583年，药理学家、学者帕拉斯尔萨斯也说过一句极其中肯而精彩
的话：”只有剂量能决定一种东西没有毒。”直到今天，这句话仍然不失其意
义。从整个社会来考察也是这样，对作为个体的每个人来说也是如此，姑且
不论中国民间“是药三分毒”的说法，就是人们一般不可须臾离开的果腹之
物——食物，也并非是“韩信点兵．多多益善”。食物如果过多，也可能造成
副作用和中毒，正所谓过犹不及。那么，从哪一个时刻起，美味的食物会变
成毒药'这种神秘的变化卫是怎样发生的呢?
混沌世界里的临界点
    在法国的一个小村落外有一个小池塘。人们在里面取水，孩子在里面洗
澡。池塘里面有一片荷花，每天荷花自由生长，一群青蛙自由自在地游水，
在荷叶之上跳来跳去。按照线性的思维，这一小片荷花要覆盖池塘，几乎是
不可能的。
    然而有一天，一点污水流进池塘里面．污水里刚好含有荷花的助长剂．
使得荷花的生长速度成倍增快．荷叶的数目每天增加一倍。只需要30天，整
个池塘就会布满荷叶。
    但是在前28天，根本没人发觉池塘中的变化。到第29天，村里的人才
注意到池塘的一半突然充满了荷叶，他们开始担心，但这时候他们已无能为
力。第二天早上．整个永面都布满了荷叶。
    自牛顿以来．直线和简化的思想在我们的头脑中一直占据着主导地位，
然而近年来．很多科学家们在各自的领域中发现．其实世界并不是那么简单．
I’2
酒吧博奔：混沌系统中的策略
它并非是直线发展的．而是在关联和交互影响中进化的。也就是说，世界上
充满着各种不可预测的混沌，这是直线思维所无法理解的。多数生态危机的
形成都是这样，物种的灭绝也是如此：开始时通常不易发觉，慢慢地加速衰
退一段很长的时期后，接着很快绝迹。
    美国前副总统小艾伯特·阿诺德·戈尔在其《平衡中的世界：生态与人
类精神》一书中．介绍了美国物理学家普-巴克和唐超所做的一个研究。
    在研究中．他们让抄子一粒一粒落下．形成逐渐增高的一堆，借助慢速
录影和电脑模拟，精确地计算在沙堆顶部每落一粒沙会连带多少沙粒移动。
初始阶段，落下的沙粒对沙堆整体影响很小。但是当沙堆增高到一定程度之
后，即使落下一粒沙也可能导致整个沙堆发生坍塌。巴克和唐超由此提出一
种“自组织临界”的理论。
    沙堆达到“临界”时，每粒沙与其他沙粒就处于“一体性”状态。那时
每粒新落下的沙都会产生一种“力渡”，尽管微细，却能通过“一体性”的接
触贯穿沙堆整体．将碰撞传给所有沙粒，沙堆的结构将随每粒沙落下逐渐变
得脆弱。说不定哪一粒落下的沙就会牵一发而动全身，导致沙堆整体发生结
构性失衡——坍塌，也可以说崩溃。
    这就类似于那句来自阿拉伯文化的谚语：“压垮骆驼的最后一根稻草。”
往一匹健壮的骆驼身上放一根稻草，骆驼毫无反应；再添加一根稻草，骆驼
还是丝毫没感觉    一直往骆驼身上加稻草，当最后一根轻飘飘的稻草放到
了它身上后．骆驼最终会不堪重负瘫倒在地。在社会学里．有人把这种作用
的原理取名为“稻草原理”。
    对于这种现象，科学家们研究认为，在线性系统中，整体正好等于所有部
分的相加．因此系统中的每一部分都可以自由地做自己的事情而不需要关心其
他部分，如此比较容易做数学分析。而在非线性系统中，整体并不等于所有部
分的相加，它可能大于所有部分的相加．因为系统中的一切都是相关联的：
    观察物理学、生物学或者是社会学上的非线性系统，我们往往会发现它
们的基本组成个体和基本组织法则其实并不复杂。但是这些简单的组成因素
自动地相互发生作用，复杂性于是出现于组织之中：一个系统的组成个体有
无数可能的方式相互作用。
’。l
博奔论的詹舻
    正是由于这些无数可能的相互作用，非线性系统展现出一系列与我们以
往的认识全然不同的特点，突破了我们最为大胆的想像力。其中最能够给我
们带来启示，也最富有科学内涵和哲学魅力的结论是：一个非线性的混沌系
统，一旦超越了它的多样化临界点，就台发生爆炸性的变化；而且原来的平
衡一旦被打破，就不可能自行恢复。
    我们可以用它来观察发生在人类社会的很多现象，远的如稳定地保持了
几百万年的古代物种和生态系统，为什么会在地质期的某一瞬间灭种或演变
为新的物种?近的如为什么超级强大的苏联政权会在几个月之内轰然坍塌，
并且导致这个大国本身也在其后不到两年的时间内分崩离析，并且永远没有
复合的希望’
    在问题被注意到的时候，或许已经太晚了。而起因，只是一片小小的“荷
叶”，甚至比荷叶更小的东西。每一个相关对象的偶然性因素，都包含了对象
必然发展的结果的信息。一个十分微小的诱因，在各内外因素参与下，有时
会产生极其重大、极其复杂的后果。
    重要的是，我们还可以把这种观察与博弈理论结合起来．指导我们如何
在混沌系统中采取更好的策略。
谁颠覆了社区的平衡
    实验室中的临界点变化，可能有其迷人的美学色彩，但是在现实生活中，
却可能需要我们绞尽脑汁去采取措施避免或者推动这种变化。
    “物以类聚，人以群分”在现实生活中是一种司空见惯的现象，但是了
解了稻草原理之后．我们就不仅可以从更宏观的层面上发现社会的内在变化
规律。而且也更有助于我们找到一种方法，更好地实现社会的和谐与多元化。
    2001年诺贝尔奖得主斯宾塞表示，自己于20世纪70年代韧从事信号博
弈与细分策略研究，是在午餐桌上与托马斯·谢林的对话中得到灵感的。谢
林当时问他的问题是：世界上何以“物以类聚、人以群分”'具体说为什么
在加州的海滩．喜欢冲浪的人与喜欢游泳的人各自为政?
    这个问题，实质上指向了真实世界里人群细分背后的机制。我们在这里
I’‘
艇‰
酒吧博弈：混沌系统中的策略
举的是另一个更接近现实生活的例子。
    今天的美国人大多赞成种族混居的社区模式。然而现实是，在美国城市
中没有几个种族混合居住的社区。
    真正的原因可能在于，即便人们实际上都能承受一定的种族混居。但是
每一个家庭对住所的下意识选择，所形成的博弈均衡会直接导致隔离。谢林
认为：假如一个地方的黑人居民的比例超过一个l临界水平．这个比例很快就
会上升到接近100％；假如这一比例跌破一个I临界水平．这里很快就会变成白
人社区。
    承受种族混居的能力不是黑或自的问题．其中存在灰色地带。不同的人，
无论是黑人或白人，对于最佳的混合比例是多少有着不同的见解。比如．很
少有白人坚持认为社区的自人比例应达到95％甚至99％；但大多数白人在一
个白人只占1％或5％的社区会感到没有归属感。多数人愿意看到一个介于上
述两个极端之间的比例。我们可以借助一个图说明居住人群发展的情况，见
图6．1。
新迁人者是白
人的概率(％)
    小区白人家庭的比例(％
圈6—1 不同种族居住人群发展情况
    纵轴表示一个刚刚迁人的新住户是白人的概率．这一数字以目前的种族
混合比例为基础。曲线右上方表示假如一个社区变成了完全的种族隔离，即
全是白人，那么下一个迁人的住户就很有可能是白人。假如种族混合比例降
’5 l
飘盏唑
扩
到白人只有95％或90％．那么下一个迁入的住户是白人的概率仍然很高。假
如种族混合比例沿着这个方向继续变化，那么下一个迁人的住户是白人的概
率就会出现一个急剧下降。最后．随着白人的实际比例降至0，这个社区就变
成了另外一种极端的种族隔离，即住户全是黑人，那么下一个迁入的住户也
很有可能是黑人。
    在这种情况下，只有当地人口种族混合比例恰好等于新迁人住户种族混
合比例时，才会出现均衡，并且保持稳定。然而，社会原因将一直推动整个
社区向一个极端的均衡移动．谢林将这一现象称为“颠覆”。现在我们就来看
看为什么会出现这种现象。
    假定中间的均衡是。70％的白人和30％的黑人。偶然地，一户黑人家庭搬
走了．搬进来一户白人家庭。于是这一社区的白人比例就会稍稍高出’70％，
那么下一个搬进来的人也是白人的概率就会高于70％。这个新住户加大了向
上移动的压力。假设种族混合比例变成75：25，颠覆的压力继续存在。
    这时，新住户是白人的概率超过‘75％，我们可以预计整个社区将会变得
越来越隔离。这一趋势将一直发展下去，直到新住户种族比例等于社区人口
种族比例。如图6．1所示，这一情况只在整个社区变成全白人社区的时候出
现。反之亦然。
    问题的根源在于一户人家的行动对其他人家的影响。从70 30的比例开
始．若有一户白人家庭取代一户黑人家庭，这个社区在打算搬进来的黑人家
庭看来就会减少一分吸引力。但造成这一结果的人不会付出任何代价。
    要阻止这个颠覆过程的加速，必须借助于公共政策的实施。
    美国芝加哥橡树园作为一个种族和谐混居社区，提供了一个绝妙的样板。
这个样板社区采用了两种手段：一是该镇禁止在房屋前院使用写有“出售”
字样的招牌，二是该镇提供保险，保证住户的房屋不会由于种族混合比例改
变而贬值：
    第一项政策的作用在于．使有人搬离这种有可能被视为坏消息的信息不
会扩散，因而在这所房屋出售之前，没有人知道有这么一所房屋要出售．从
而避免了恐慌。
    然而如果只有第一项政策，业主们可能还会觉得他们应该趁着还能出手
的时候卖掉自己的房屋。因为他们担心如果等到整个社区“颠覆”以后再卖，
I’6
酒吧博弈：混沌系统中的锥略
自己的房屋已经大大贬值。不过，保险消除了会加速颠覆过程的经济上的恐
惧。实际上，如果这种保险能够阻止颠覆过程，那么不动产的价值就不会下
跌．因而也就不会付出任何赔偿。
策略的多米诺骨牌
    东晋时，有人将大将桓温与王敦相提并论．桓温很不高兴，他最愿意与
西晋的将领刘琨比较。刘琨曾经北伐夺取土地，桓温也曾北伐为东晋争得大
片土地。刘琨在后世并不如桓温有名，但他有风度有雄才，曾成为一时的明
星人物。
    桓温北伐的时候，遇到一位刘琨家从前的歌伎。桓温非常高兴，赶紧回
屋披上最威武的盔甲，再去喊那个老歌伎来，让她仔细瞧瞧，是不是真的很
像刘琨。这个老歌伎说了一连串可爱而尖锐的排比句：“脸面很像，可惜薄了
点：眼睛很像，可惜小了点；胡须很像，可惜红了点；身材很像，可惜矮了
点；声音很像，可惜细了点。”桓温听了大受打击，回屋一阵风似的把身上的
披挂剥下，好几天闷闷不乐。
    为什么，因为这位歌伎用了五个“像”字．最终得出的结论却是不言而
喻：不像。因为每一个“可惜”虽然只有那么一点点改变，但是加起来却完
全推翻了桓温与刘琨相像的前提。
    头上掉一根头发，很正常；再掉一根，也不用担心；还掉一根．仍旧不
必忧虑 ··但长此以往，一根根头发掉下去．最后秃头出现了。哲学上叫这
种现象为“秃头论证”。
    一群蚂蚁选择了一棵百年老树的树基安营扎寨。为建设家园．蚂蚁们辛
勤工作，挪移一粒粒泥沙，又咬去一点点树皮…·有一天，一阵微风吹来，
百年老树轰然溃倒，逐渐腐烂，乃至最终零落成泥。生物学中，这种循序渐
进的过程也有个名字，叫“蚂蚁效应”。
    第一根头发的脱落，第一粒泥沙的离开，都只是无足轻重的变化。当数
量达到某个程度．才会引起外界的注意，但还只是停留在量变的程度．难以
引起人们的重视。一旦量变达到临界点时，突变就不可避免地出现了!
、，一一博彝论的蘑
    在一组博弈中，一部分参与者做了一个选择，另一部分参与者做了另一
个选择，但若是把全体参与者作为一个整体，从这个整体的立场出发考察，
这些选择可能会造成所有人都意料不到的效果。原因在于其中一个选择可能
对其他人产生更大的影响，而做出这个选择的个体并没有预先将这个影响考
虑在内!我们可以用多米诺骨牌来形容这个过程。
    大不列颠哥伦比亚大学物理学家怀特海德曾经制作了一组骨牌，共13张，
第一张最小，长9 s3毫米，宽4 76毫米，厚1 19毫米，还不如小手指甲大。
以后每张体积扩大l 5倍，这个数据是按照一张骨牌倒下时能推倒一张1 5倍
体积的骨牌而选定的。最大的第13张长6l毫米，宽30 5毫米，厚7 6毫米．
牌面大小接近于扑克牌，厚度相当于扑克牌的20倍。
    把这套骨牌按适当间距排好，轻轻推倒第一张，必然会波及第13张：第
13张骨牌倒下时释放的能量比第一张牌倒下时整整要扩大20多亿倍。因为多
米诺骨牌效应的能量是按指数形式增长的。若推倒第一张骨牌要用0 024微
焦．倒下的第13张骨牌释放的能量达到51焦。
    不过怀特海德毕竟还没有制作出第32张骨牌，因为它将高达415米，两
倍于纽约帝国大厦。如果真有人制作了这样的一套骨牌．那摩天大厦就会在
一指之力下被轰然推倒!
    这种效应的物理原理是：骨牌竖着时，重心较高，倒下时重心下降，倒
下过程中，将其重力势能转化为动能．它倒在第二张牌上，这个动能就转移
到第二张牌上；第二张牌将第一张牌转移来的动能和自己倒下过程中由本身
具有的重力势能转化来的动能之和，再传到第三张牌上    所以每张牌倒下
的时候．具有的动能都比前一块牌大，因此它们的速度一个比一个快，也就
是说．它们依次推倒的能量一个比一个大。
    芝加哥橡树周社区可以通过对颠覆进程的干预，避免出现实质上的“种
族隔离”。那么反过来，我们有没有办法对一种不好的均衡状态进行干预，使
其向我们期望的方向发生逆转呢?
    答案是肯定的。也许．下面这个故事可以为我们提供一种不错的思路。
    有一个人发现一个村子卫生习惯非常差。每条街道都脏乱不堪。他想改
变村民们的习惯，但却很难说服他们。他想了很久，最后买了一条很漂亮的
l’。
酒吧博弈：混沌系统中的策略
裙子送给了村里的一位小女孩。
    小女孩穿上裙子后．女孩的父亲发现她脏兮兮的双手和蓬乱的头发与漂
亮的裙子极不协调．就给她好好地洗了个澡，并把她的头发梳理整齐。这样，
小女孩穿着裙子就十分干净漂亮了，但她父亲发现家里脏乱的环境很快就把
她的双手和裙子弄脏了，于是父亲就发动家人把家里好好地打扫了一遍．整
个家都变得洁净亮堂了。很快这位父亲叉发现从干净的家里出来，门口满是
垃圾的过道让人十分别扭．于是他又发动家人把门口过道好好地打扫了一遍，
并开始注意保持卫生，不再乱倒垃圾了。
    不久．女孩的邻居发现隔壁洁净的环境太令人舒服了，而自家脏乱的环
境却让人难受，于是他也发动家人，把屋里屋外都打扫了一遍，并开始注意
保持卫生了…后来，那位好心人再到村里的时候，他发现整个村子变了样：
村民们都穿着洁净的衣服．村里的街道打扫得千千净净7
    上述理论也同样适用于我们生活中的其他领域。报纸上说．若一个人能
毫不懈怠地每天阅读500字的文章，他有朝一日就能成为博学之士；一个组
织的奋起，也许就是开始于一个员工敲开一扇普通的门，千万不要轻视了细
微的力量，而且更要坚持将一丝一毫的力量积累成最后的成功!
上面几节中，
趋向良性的发展。
策略。
“少数者”的红衣服
我们讨论了对一个混沌系统进行策略干预，使其保持或者
在下面．我们会讨论在系统中的个体．如何找到合适的
    唐贞观十九年(645年)，唐太宗李世民由洛用出发，亲征高丽。高丽派
大将高延寿和高惠真率军15万前来迎战。唐太宗设计将他们诱至安市城东南
8里，双方展开决战。
    李世民选了一处高坡观战。当时战场上风云突变，阴云四起．雷电交加。
双方刚一接阵．唐军中就有一员小将．穿着一件耀眼的白袍，手中握戟，腰
中挎弓．大吼一声杀人敌阵。敌将惊慌失色，正要分兵迎战．但是阵形已被
那员小将冲乱，士卒四散奔逃。唐军随在那员小将的后面掩杀过去．高丽军
’9 I
蒜‰==型
顿时溃不成军。
    战斗结束以后，李世民派人到军中询问：“刚刚冲在最前面的那个穿白衣
的将军是谁?”有人回答：“是薛仁贵。”
    李世民专门召见了薛仁贵，称赞他一身都是胆，并且赐马两匹，绢40匹，
加封他为右领军郎将，负责守卫长安太极宫北面正门玄武门。从此以后，薛
仁贵几次率军南征北战．并且立下了“三箭定天山”的功劳．被封为右威卫
大将军，平阳郡公，兼任安东都护。
    薛仁贵穿上与众不同的白袍杀人敌阵．其初衷也许是为了让自己的士兵
易于辨识，但是在客观上却起到了引起注意并受到器重的效果。他所采取的
白袍策略，在博奔论中被称做“少数派策略”。
    我们来假设这样一种情景：一天晚上，你参加一个聚会，屋子里有许多
人，你们玩得很开心。就在这时候．屋里面突然失火，火势很大，一时无法
扑灭。这间房子有两个门，你必须从它们之间选择一个逃出屋外才能保住性
命。
    但问题是，此时所有的人都和你一样争相逃生，他们也必须抢着从这两
个门逃到屋外。如果你选择的门是很多人选择的，那么你将因人多拥挤冲不
出去而被烧死；相反，如果你选择的是较少人选择的，那么你将逃出生灭。
    如果不考虑道德因素，你将如何选择?
    这是一个叫张翼成的中国人在1997年提出的博弈论模型，被称之为少数
者博弈或少数派博奔。事实上，这个模型不过是变化了形式的酒吧博弈模型：
每一个人的判断与选择．直接影响所有人。
    诺贝尔经济学奖得主莱因哈德·泽尔膝在中国访问时，曾经用一个生活
中的例子来向记者说明什么是博弈论，其中就提到了少数者博弈。他说．从A
地到B地，有两条路可走：一条是路比较好的主干道M．而另一条侧干道s，
路相对不太好。因为开车的人多，主干道M经常非常拥挤，相比之下，人少
的s道反而更顺畅。如果应用了博弈论，开车人在考虑自己如何选择的同时，
还要考虑其他人是怎么想的。
    事实上，阿维纳什-迪克西特巴里·奈尔伯夫在《策略思维》中．对上
述问题有过更为精细的研究。奈尔伯夫的研究是这样的：从伯克利到旧金山
l。。
酒吧罅弈：混沌系统中的莆略
有两条主要路线可以选择。一是自行开车穿越海湾大桥，二是搭乘BART列
车。白行开车的话，假如不塞车只需20分钟。但这样的好事很少遇到。大桥
只有4车道．很容易就发生堵塞。假定每小时内每增加2000辆汽车，就会耽
搁正在路上的每一个人10分钟时间。比如，只有2000辆汽车的时候到达目
的地需要30分钟；若有4000辆汽车．那么大家所需要的时间就延长至40分
钟。另一方面，BAR'I’列车停好几个站，而且乘客还要步行到车站等车，路上
时间加起来也要接近40分钟，但列车从不会因为堵塞而延迟。
    假如在运输高峰时间有10 000人要从伯克利前往旧金山．每个人都会选
择最能缩短自己旅行时间的路线。假定只有2000人愿意开车穿越海湾大桥。
由于汽车较少．交通比较顺畅．这条路线的通行时问也会缩短，只要30分钟。
于是，在选择乘BAR'f’列车的8000人当中，有一部分人会觉得改为开车可以
节省时间，并且愿意这么做。相反，假如8000人选择开车穿越海湾大桥，每
人要花60分钟才能到达目的地，于是他们当中又有一部分人愿意改乘火车，
因为乘火车花的时间只有40分钟。
    在《策略思维》中，作者指出使所有人得到最优结果的方法：为“通行
时间”标出价格，在大桥上安装收费站，这样就使开车穿越海湾大桥者向
搭乘BART列车者购买通行时间，用“看不见的手”引导人们选择最优通行
模式。
    但是这只是一种理论上的建议，事实上往往因为各种现实原因而无法实
施。在这种情况下，我们必须基于个体的需要，寻找一种最优策略。而实际
上，这个策略就隐藏在上面的几个模型当中。
    对，你已经猜到了：那就是要做少数者。由于资源是有限的，在一个社
会中只有这一部分少数者才能充分享有。
    在生活中我们也可以发现，往往是那些与大众不同的少数者，能够顺风
顺水地改变命运。真正的少数者总是在条件还没有齐全的时候就已经向胜利
出发了，他们会想尽一切办法去创造自己所需要的条件，而不是像其他多数
人一样，等已经有人出发了，才开始想是不是时机成熟了。
    美国钢铁大王卡耐基小的时候家里很穷。有一天．他放学回家的时候经
过一个工地，看到一个老板模样的人正在那儿指挥盖一幢摩天大楼。卡耐基
_M譬=邕
走上前闻：“我长大后怎么才能成为像您这样的人呢’”“第一要勤奋 ””“这
我早就知道了。那第二呢7…‘买一件红衣服穿上!”卡耐基满腹狐疑：“这与
成功有关吗?”那人指着前丽的工人说：“有啊!你看他们都穿着清一色的蓝
色衣服，所以我一个都不认识。”说完．他又指着旁边一个工人说：“你看那
个穿红衣服的，就因为他穿得和别人不同，这才引起了我的注意。我也就认
识了他，发现了他的才能，过几天我会安排给他一个职位。”
    上面这个故事，是不是与薛仁贵身穿白袍杀人敌阵有异曲同工之妙呢’
所谓理有必至，事有固然，我们在探索一些成功者的策略时。往往都能从中
发现一些相通的规律，“少数者策略”不过是其中之一罢了。
让开那架独木桥
    《吕氏春秋》中记载了这样一个故事。
    春秋时，孙叔敖课受楚庄王的器重．为楚国的中兴立下了很多功勋，但
是在个人生活方面，他虽然身为令尹，生活却非常俭朴。庄王几次封地给他，
他坚持不受。
    后来．孙叔敖率军打败晋国回来得了重病，临死前特别嘱咐儿子孙安说：
“我死后，你就回到乡下种田，千万别做官。万一大王非得赏赐你东西．楚
越之间有一个地方叫寝丘，地方偏僻贫瘠，地名又不好，楚人视之为鬼域，
越人以为不样。你就要求那块没有人要的寝丘。”孙安当时没有听明白，因为
寝丘在今河南省固始县境内，“寝”字在古代有丑恶的意思，不仅名字很不吉
利，而且是一片十分贫瘠的薄沙地，很久以来都没有人要。但是他知道父亲
这么安排肯定有道理，于是就点头答应了。
    不久孙叔敖过世了．楚庄王悲痛万分，便打算封孙安为大夫，但孙安却
百般推辞，楚庄王只好让他回老家去。孙安回去后，日子过得很清苦，甚至
无以为继，只好靠打柴度日。后来，楚庄王听从了优孟的劝说，派人把孙安
请来准备封赏。孙安遵从父亲遗命，只肯要寝丘那块没有人要的薄沙地。庄
王只得封赠了寝丘土地给他。
    其他功臣勋贵往往为了争那些肥沃的良田做封地而争得不亦乐乎，孙叔
l。2
酒吧博弈：混沌系统中的簧略
敖却要一块薄地．这里所用的就是少数派策略。这种策略是一种“以患为利”
的智慧，把这些不利因素看做利，这正是他的超人之处。按楚国规定．封地
延续两代，如有其他功臣想要，就改封其他功臣。因为寝丘是贫瘠的薄地．
一直没有人要封在那里，因而一直到汉代．孙叔敖子孙十几代拥有这块地，
得以安身立命。
    因为资源都是有限的，如果没有少数派策略，所有人争夺的焦点都在有
限的几种物事上，那么每个人面临的处境都是十分艰难的。唯有另辟蹊径．
找到多数人没有注意到的那个“生门”．才有可能绝处逢生，甚至获得比那挤
上独木桥的千军万马更高的收益。
    19世纪中叶，美国加州传来发现金矿的消息。许多人认为这是一个千载
难逢的发财机会，于是纷纷奔赴加州。17岁的小农夫亚默尔也加入了这支庞
大的淘金队伍．他同大家一样，历尽千辛万苦，赶到了加州。
    淘金梦是美丽的，做这种梦的人很多，而且还有越来越多的人蜂拥而至．
一时间加州遍地都是淘金者，而金子自然越来越难淘。不但金子难淘，而且
生活也越来越艰苦。当地气候于燥，水源奇缺，许多不幸的淘金者不但没有
圆了致富梦，反而葬身此处。
    小亚默尔经过一段时间的努力，和大多数人一样，没有发现黄金，反而
被口渴折磨得半死。一天，望着水袋中一点点舍不得喝的水，听着周围人对
缺水的抱怨，亚默尔忽发奇想：淘金的希望太渺茫了，还不如卖水呢。于是
亚默尔放弃了对金矿的努力，将手中挖金矿的工具变成挖水渠的工具，从远
方将河水引入水池，用细纱过滤，成为清凉可口的饮用水。然后将水装进桶
里．挑到山谷一壶一壶地卖给找金矿的人。
    当时有人嘲笑亚默尔．说他胸无大志：“千辛万苦地到加州来，不挖金子
发大财．却干起这种蝇头小利的小买卖，这种生意哪儿不能干，何必跑到这
里来7”亚默尔毫不在意，继续卖他的水。可以把几乎毫无成本的水卖出去，
哪里有这样好的市场，
    结果，很多淘金者都空手而归，而亚默尔却在很短的时间内靠卖水赚到
几千美元．这在当时是一笔非常可观的财富了。
    这个故事，实际上也为我们提供了一种走出囚徒困境的思维．那就是跳出人
云亦云、人求亦求的怪圈，改变以自己的需求为中心的传统想法，另辟蹊径。
盯I
尸_7
等|章
枪手博弈：先发优势与后发制人
是谁开始先出招
泣什么太不了
见招拆招才重要
敢爱就不要跑
——《爱情三十六计》歌词
谁能最后活下来
    后汉三国时，曹操在官渡击败了袁绍。
    袁绍又羞又怒，于建安八年春二月死去。曹操深知袁绍在河北经营多年．
官渡之败并没有伤到元气，于是出兵攻打袁绍的三个儿子袁谭、袁熙、袁尚。
三兄弟大败．弃黎阳而走。
    曹操率兵追至冀州，袁谭与袁尚人城坚守；袁熙离城30里下寨。曹操连
日攻打不下，郭嘉说：“袁绍废长立幼．袁谭、袁尚兄弟争权，各自树党，急
之则相救，缓之则相争。不如举兵南向荆州，征讨刘表，以候袁氏兄弟之变；
变成而后击之，可一举而定也。”
    曹操听从郭嘉的策划，引大军向荆州进兵。曹操退后．袁谭因为身为长
子而未能继承父业，心中不满．发兵进攻袁尚。袁谭先后两次同袁尚交兵，
均大败，被袁尚追至平原城，无奈投降曹操，请求援助，曹操趁机击败了袁
熙和袁尚。
枪手博弈：先发优势与后发制人
    袁尚、袁熙兄弟投奔乌桓，曹操向鸟桓进兵．击败乌桓。袁氏兄弟又去
投奔辽东太守公孙康。曹营诸将都建议曹操进军．一鼓作气平服辽东，捉拿
二袁。曹操说：“你等勿动．公孙康自会将二袁的头送上门来。”随后，他下
令班师回许昌．静观辽东局势。
    公孙康见二袁归降．心有疑虑：袁家父于一向都有夺取辽东的野心．现
在二袁兵败，如丧家之犬．无处存身．投奔辽东实为迫不得已。自己如收留
二袁，必有后患：再者也会得罪势力强大的曹操。但如果曹操进攻辽东．他
只得收留二袁，共同抵御曹操。当公孙康探听到曹操已经转回许昌，并无进攻
辽东之意时．认为收容二袁有害无益。于是预设伏兵，召见二袁．一举擒拿，
割下首级，派人送到曹操营中。回过头来，曹操叉杀了袁谭。
    在三十六计中有一计叫做“隔岸观火”，意思就是“坐山观虎斗，趴桥看
水流”，如果面对不止一个敌人的时候，切切不可操之过急，免得反而促成他
们暂时联手来对付你，这时正确的方法是静止不动，等待对手矛盾激化、相
互倾轧、力量削弱时再出手。在博弈论中，有专门的一个模型是论述这个策略
的，那就是枪手博弈模型。
    枪手对决，胜者为王。但是枪手们自己知道，在多方对战的时候，最关
键的并不在于先击倒哪个对手．而是要先保全自己。在美国一个西部小镇上，
有三个快枪手相互之间的仇恨到了不可调和的地步。这一天，他们三个人在
街上不期而遇，每个人的手都握住了枪把．气氛紧张到了极点。因为每个人
都知道，一场生死决斗马上就要发生。
    三个枪手对于彼此之间的实力对比都了如指掌：枪手甲枪法精准，十发
八中；枪手乙枪法不错．十发六中；枪手丙枪法拙劣．十发四中。那么我们
来推断一下，假如三人同时开枪，谁活下来的机会大一些，
    假如你认为是枪手甲，结果可能会让你大吃一惊：最可能活下来的是丙——
枪法最劣的那个家伙。
    假如这三个人彼此痛恨．都不可能达成协议，那么作为枪手甲．他一定
要对枪手乙开枪。这是他的最佳策略，因为此人威胁最太。这样他的第一枪
不可能瞄准丙。同样，枪手乙也会把甲作为第一目标，根显然，一旦把甲干
掉，下一轮(如果还有下一轮的话)和丙对决，他的胜算较大。相反，如果
B5 I
他先打丙，即使活到了下一轮，与甲对决也是凶多吉少。丙呢?自然也要对
甲开枪，因为不管怎么说，枪手乙到底比甲差一些(尽管还是比自己强)，如
果一定要和某个人对决下一场的话，选择枪手乙，自己获胜的机会要比与甲
对决大一点。于是一阵乱枪过后，甲还能活下来的机会少得可怜。只有将近一
成．乙是两成，而丙则有十成把握活下来。也就是说，丙很可能是这一场混战
的胜利者。
    现在换一种玩法(在很多情况下，规则决定结果)：三个人轮流开枪，谁
的机会更大’
    这里我们又要遇到琐碎的排序问题．但不管怎么排，丙的运气都好于他
的实力。至少，他不会被第一枪打死。而且，他很可能有在第二轮首先开枪
的便宜。
    例如，顺序是甲、乙、丙，甲一枪干掉了乙，现在，就论到丙开枪了——
尽管枪法不怎么样，但这个便宜还是很大的：那意味着他将近一半的机会赢
得这次决斗(毕竟甲也不是百发百中k如果乙幸运地躲过了甲的攻击呢?他
一定要回击甲，这样即使他成功．下一轮还是轮到丙开枪，自然，他的成功
概率就更大了。
    问题来了：如果三人中首先开枪的是丙．他该怎么办?他可以朝甲开
枪，即使打不中，甲也不太可能回击，毕竟这家伙不是主要威胁。可是万
一他打中了呢?下一轮可就是乙开枪了 ··可能你会感到有点奇怪：丙的
最佳策略是乱开一枪!只要他不打中任何人．不破坏这个局面，他就总是
有利可图的。
    这个故事告诉我们：在多人博弈中常常由于复杂关系的存在，而导致出
人意料的结局。一位参与者最后能否胜出，不仅仅取决于自己的实力，更取
决于实力对比关系以及各方的策略。
    在认识到这种规律之后．如何采取恰当的策略就成为关键。下面我们
根据上面所说的同时开枪和相继开枪两种情况．分别论述应采取的最佳策
略。
他先打丙，即使活到了下一轮，与甲对决也是凶多吉少。丙呢?自然也要对
甲开枪，因为不管怎么说，枪手乙到底比甲差一些(尽管还是比自己强)，如
果一定要和某个人对决下一场的话，选择枪手乙，自己获胜的机会要比与甲
对决大一点。于是一阵乱枪过后，甲还能活下来的机会少得可怜。只有将近一
成．乙是两成，而丙则有十成把握活下来。也就是说，丙很可能是这一场混战
的胜利者。
    现在换一种玩法(在很多情况下，规则决定结果)：三个人轮流开枪，谁
的机会更大’
    这里我们又要遇到琐碎的排序问题．但不管怎么排，丙的运气都好于他
的实力。至少，他不会被第一枪打死。而且，他很可能有在第二轮首先开枪
的便宜。
    例如，顺序是甲、乙、丙，甲一枪干掉了乙，现在，就论到丙开枪了——
尽管枪法不怎么样，但这个便宜还是很大的：那意味着他将近一半的机会赢
得这次决斗(毕竟甲也不是百发百中k如果乙幸运地躲过了甲的攻击呢?他
一定要回击甲，这样即使他成功．下一轮还是轮到丙开枪，自然，他的成功
概率就更大了。
    问题来了：如果三人中首先开枪的是丙．他该怎么办?他可以朝甲开
枪，即使打不中，甲也不太可能回击，毕竟这家伙不是主要威胁。可是万
一他打中了呢?下一轮可就是乙开枪了 ··可能你会感到有点奇怪：丙的
最佳策略是乱开一枪!只要他不打中任何人．不破坏这个局面，他就总是
有利可图的。
    这个故事告诉我们：在多人博弈中常常由于复杂关系的存在，而导致出
人意料的结局。一位参与者最后能否胜出，不仅仅取决于自己的实力，更取
决于实力对比关系以及各方的策略。
    在认识到这种规律之后．如何采取恰当的策略就成为关键。下面我们
根据上面所说的同时开枪和相继开枪两种情况．分别论述应采取的最佳策
略。
、●一．媳舞I电如诡诤
同时出招的策略
    博弈实际上就是互动的策略性行为，在每一个利益对抗中，人们都是在
寻求制胜之策。如同上一节中一个枪手的生死由另外两个枪手的射击方向所
决定一样。另外，博弈的精髓在于参与者的策略相互影响、相互依存。这种
互动通过两种方式体现出来。
    第一种互动方式是同时发生。比如囚徒困境故事中的情节，参与者同时
出招，完全不知道其他人走哪一步。不过，每个人必须心中有数，知道这个
博弈游戏存在其他参与者，而这些人反过来也非常清楚这一点。因此，每个
人必须设想一下若是自己处在其他人的位置，会做出什么反应，从而预计自
己这一步会带来什么结果。他选择的最佳策略也是这一全盘考虑的一个组成
部分。
    无论是对方采取何种策略，均应采取自己的最优策略。这正是博弈论研
究的主题。为了理解这一点，我们来看一个新闻大战的案例。
    每个星期，美国的两大杂志《时代》和《新闻周刊》都会暗自较劲，要
做出最引人注目的封面故事。～个富有戏剧性或者饶有趣味的封面．可以吸
引站在报摊前的潜在买主的目光。因此．每个星期，《时代》的编辑们一定会
举行会议，绞尽脑汁选出下一个封面故事。
    他们这么做的时候．很清楚在此时《新闻周刊》的编辑们也在开会讨论
下一个封面故事。反过来，《新闻周刊》的编辑们也知道《时代》的编辑们正
在做同样的事情。而《时代》的编辑们也知道《新闻周刊》的编辑们知道这
一点
    这两家新闻杂志进人了一场策略博弈。由于《时代》与《新闻周刊》的
行动是同时进行的，双方不得不在毫不知晓对手决定的情况下采取行动。等
到彼此发现对方做了什么，再想做什么改变就太迟了。
    当然t这个星期的输家下个星期很可能竭力反扑．不过，等到那时说不
定已经出现了一个完全不同的新的故事模式，进人了一场完全不同的博奔。
    假定本周有两个大新闻：一是国会就预算问题吵得不可开交；二是发布
I。。
枪手博弈：先发优势与后发制人
了一种据说对艾滋病有特效的新药。
    编辑们选择封面故事的时候，首要考虑的是哪一条额闻更能吸引报摊前
的买主。在报摊前的买主当中。假设30％的人对预算问题感兴趣．70％的人对
艾滋病新药感兴趣。这些人只会在自己感兴趣的新闻变成封面故事的时候掏
钱买杂志；假如两本杂志用了同一条新闻做封面故事，那么感兴趣的买主就
会平分两组．一纽买《时代》．另一组买《新闻周刊》。
    现在．《时代》的编辑可以进行如下推理：“假如《新闻周刊》采用艾滋
病新药馓封面故事，那么．假如我采用预算问题，我就会得到整个‘预算问
题市场’(即全体读者的30％)；假如我采用艾滋病新药，我们两家就会平分‘艾
潜病新药市场’(即我得到全体读者的35％)，因此，艾滋病新药为我带来的收
入就会超过预算问题。假如《新闻周刊》采用预算问题，那么．假如我采用同
样的故事．我会得到15％的读者，假如我采用艾滋病新药，就会得到70％的读
者；这一次，第二方案同样会为我带来更大的收入。因此，我有一个优势策
略，就是采用艾滋病新药做封面。无论我的对手选择采用上述两个新闻当中
的哪一个，这一选择都会比预算问题更胜一筹。”
    而这样的策略考虑．同样对《新闻周刊》有效。选择艾滋病新药是他们
共同的优势策略。
    在每个参与者都有优势策略的情况下，优势策略均衡是非常合乎逻辑的。
但遗憾的是，在大多数博弈中，优势策略均衡是不存在的。
    有时候，某参与者有一个优势策略，其他参与者则没有。只要略微修改
一下上述封面故事大战的例子，就可以了解这种情形。
    假设全体读者略偏向于选择《时代》。假如两个杂志选择同样的新闻做封
面故事，喜欢这个新闻的潜在买主当中有60％的人选择《时代》，40％的人选
择《新闻周刊》。
    对于《时代》，艾滋病新药仍然是优势策略，但对于《新闻周刊》就不再
是了。因为如果《新闻周刊》也做同样选择，那么只能得到28％的读者，小
于选择预算问题的30％。
    也就是说，《新闻周刊》的最佳选择不再与《时代》的策略无关。假如《时
代》选择艾滋病新药，《新闻周刊》选择预算问题就能得到更好的销量．对于
。9 I
ii匆。¨1博奔论的越舻
《新闻周刊》，预算问题的市场总比新药要大。
    《新闻周刊》的编辑们不知道《时代》将会选择什么．不过他们可以分
析出《时代》有一个优势策略，那一定就是它的选择。因此．他们可以很有
把握地假定《时代》已经选了艾滋病新药，并据此选择自己的最佳策略，即
预算闻题。
    由此可见．在那些不存在传统策略均衡的博弈中，仍然可以根据优势策
略的逻辑找出均衡。只要有一方拥有优势策略，那么它将采用其优势策略，
另一方则针对这个策略采用自己的最佳策略。
相继出招的策略
    除了同时出招之外，还有一种方式是参与者的行动相继发生，轮流出招。
每个参与者在轮到自己的时候．必须展望一下他的这一步行动将会给其他人
以后的行动造成什么影响，反过来又会对自己以后的行动造成什么影响。也
就是说，相继出招的博弈中，每一个参与者必须预计其他参与者接下来会有
什么反应，据此盘算自己的最佳招数。这种向前展望、倒后推理的方法非常
重要，是确定策略时的一个基本准则。
    我们同样可以用发生在两大媒体之间的一场战争作为案例来说明，不过
这一次是价格成为双方交火的炮弹。
    1994年夏天．《纽约邮报》试验性地在Staten岛把报纸零售价降到了25
美分，不久，其主要对手《每日新闻》做出反应：把价格从40美分提高到50
美分。这件事看起来颇有些耐人寻味，但它却不过是一连串博奔行动的结果
而已。
    原来，两份报最早的价格都是40美分，但《纽约邮报》认为报纸的零售
价应该涨到50美分才更合适，于是率先采取了行动。而《每日新闻》则借机
把价格停留在40美分上，结果《纽约邮报》失去了一些订户以及由此带来的
广告收人。当时《纽约邮报》认为这种情况不会持续太久，但《每日新闻》
的价格却一直按兵不动，《纽约邮报》颇为恼火．认为需要告诉《每日新闻》：
如果有必要，他有能力发动一场报复性的价格战。
l 9。
枪手博弈：先发优势与后发制人
    当然，最可信的证明就是真的发动一场价格战，但那也会对自己造成损
失，形成两败俱伤的局面。因此，《纽约邮报》的目标是既要让《每日新闻》
感到威胁的可信性，又不投入真正战斗的费用，于是它设计了一种让《每日新
闻》提价的战术，进行了一次试探性的力量显示，就是在Staten岛上把价格
降到了25美分。销量立竿见影地上升了，而《每日新闻》也认识到了其用意。
    鉴于去年《时代》和《每日电讯》之间发生在伦敦的价格战的可怕后果
(1993年9月《时代》从45美分降到了30美分，迫使《每日电讯》也降价．
结果《每日电讯》的利润大幅下降)，以及这次Staten岛的行动．《每日新闻》
放弃了投机心理，采取了明智的妥协策略，也将报价提高了10美分，它既不
敢也不愿激怒《纽约邮报》，再者涨价对它来讲也并不吃亏。
    从博奔双方的支付情况来看，这也正是双方的优势策略下的结果。
    我们可以把这些例子归纳为一个指导同时行动的博弈的法则，即：假如
你有一个优势策略．请照办。不要考虑你的对手会怎么做。假如你没有一个
优势策略，但你的对手有，那么就假定他会采用这个优势策珞，相应选择你
自己最好的做法。
    东晋时，桓玄执掌朝权后，任命卢循为永嘉太守。卢循表面受令，而在
暗中扩展势力。刘裕平桓玄之乱后控扼东晋朝政，任命卢循为广州刺史，卢
循的姐夫徐道覆为始兴相。
    义熙六年(410年)春．卢循和徐道覆趁刘裕北伐南燕，后方空虚之机．
实施北征。他们率军在始兴会合，然后分东西二路北上．进入湘州(治今长
沙)与江州(治寻阳，今江西九江西南)诸郡．一路势如破竹，声威大震。
徐道覆力主东进，卢循犹豫数日才勉强同意，遂自桑落洲(今江西九江东北)
进抵淮口(今江苏南京西北秦淮河口)．逼近兵力不过数千的建康。
    刘裕闻讯自北伐前线急返京师，部署防卫。来到长江边，刘裕对各位将
领说：“贼兵如果从新亭直接挺进．那么他们的锋芒就不可阻挡，应该暂且回
避一下，是胜是负也就不可推测了。如果他们回到西岸去停泊．这就可以一
战擒之了：”
    徐道覆建议从新亭进军白石，然后烧掉战船登陆。分几路进攻刘裕。卢
循打算采取尽可能保险的策略，对徐道覆说：“根据敌军的慌乱程度来看．他
们自会在几天内崩溃散乱。现在，决定胜负也就是一个早上的事，一味凭侥
幸在战场上投机取利，既不是一定能战胜敌人的办法．又会损兵折将．不如
接兵不动。”
    刘裕登上石头城，遥望卢循的部队。最初看见他们向新亭方向移动．刘
裕脸色稍变，恐怕卢循发动突然袭击。后来他看见敌军船只回到蔡州停泊下
来．马上调动各路军队转移集中，砍伐树木在石头城和秦淮河口等地全部立
起栅栏。同时命人尽快整修越城．兴筑查浦、药园、廷尉三座堡垒，振兵在
那里把守。结果，卢循兵临建康近两月，兵疲粮乏，被迫于七月初退还寻阳．
最后兵败投水自杀。
    卢循之所以失败，是因为他不应该受到对方状态的影响，而应一鼓作气，
渡过长江。这是他的最优策略。作为进攻的一方．无论对方是已经调集了人
马还是没有调来人马，他的策略都可以保证自己的锐气不被挫伤．并且制造
最大的压力。
陆逊为什么回兵
    上面我们已经知道，在相继出招的动态博弈中，每一位参与者的策略都
必须基于对另一方策略的预测。可是在现实世界的博弈中．参与者往往并非
两个，这时候．除了预测对手的行动之外，还必须对第三方的策略有清醒的
估计。
    在《三国演义》中，有这样一段故事。东吴大将陆逊火烧连营，战败了
蜀军，然后率数万大军追击。吴军一直追到鱼腹浦，忽见前面的一个乱石堆
挡住去路．一阵杀气冲天而起．可是却不见一兵一卒。陆逊询问当地的人，
一位老者告诉他们：“这里叫鱼腹浦。诸葛亮人川的时候．用石头排成阵势列
于沙滩之上。”陆逊心中诧异，于是带了人马去阵中观看．忽然狂风大作，飞
沙走石，遮天盖地。陆逊回寨，叹了口气：“孔明真‘卧龙’也!我比不上他
啊!”急忙下令班师。
    但是，今天我们回过头来再看这段故事，只能把它作为一段美丽的传说。
实际上，当时使陆逊放弃追击蜀军的，井不是诸葛亮，而是曹丕。
I蛇
枪手博弈：先发优势与后发制人
    在当时，魏、蜀、吴三国就像三个实力各不相同的枪手，在两两火并之
前，必须同时小心第三方。在当时，西蜀大军几乎全军覆没，成为相对弱小
的一方，面临被吴国入侵及至吞并的危险。假如当时没有曹魏的存在，两个
国家在某种程度上都是与外界隔绝的，那么，要想阻止吴军长驱直人几乎是
不可能的事情。
    然而，尽管蜀国面临灭亡的危险，但曹魏的存在构成了必要的制约。在
吴蜀大战的过程中．这一原理就是“敌人的敌人就是我的朋友”。正因如此，
尽管刘备和诸葛亮一直口口声声把北伐曹魏作为自己的主要战略目标．但是
真实情况又怎样呢々当大将黄权归蜀之路被切断而被迫投降曹魏后．刘备并
没表现出多大的愤恨，甚至说：“黄权被吴兵隔断在江北岸，欲归无路，不得
已而降魏。是朕负权，非权负朕也．何必罪其家属?”这些话已经把他当时
的内心真实想法暴露无遗。
    假如吴军真要长驱直人攻打蜀国，那么，它就必须从北部与曹魏接壤的
边境抽调兵力。曹魏虽然不会贸然入侵一个全副武装的吴国，不过．如果陆逊
率大军深入蜀地之后，曹丕也必定难以抗拒这种诱惑，对于一举干掉这个曾经让
他父亲从赤壁狼狈逃窜的麻烦邻居的大好机会．他绝不会放过。陆逊正是(其
实吴国的决策者也应该)通过倒后推理。预计到一旦他们进攻蜀国，曹魏军
必然大举南下，因此才迅速回兵。不久，他果然听说了曹魏调兵遣将的消息。
    这一类故事对于我们的启示意义在于，博弈中可以通过放弃自己的攻击
机会．而取得更好的结果。老子说：“夫唯不争，故天下奠能与之争。”其中
就包含着深刻的博弈论智慧。
    我们在四年一次的美国总统竞选活动中也会看到同样的例子。只要存在
数目庞大的竞争对手，实力顶尖者往往会被中等实力者的反复攻击搞得狼狈
不堪，败下阵来。等到其他人彼此争斗并且退出竞选的时候再登场亮相，形
势反而更加有利。
    因此，你的幸存机会不仅取决于你自己的本事，还要看你威胁到的人。
一个没有威胁到任何人的参与者，可能由于较强的对手相互残杀而幸存下来。
就像上文所讲的甲枪手虽然是最厉害的神枪手．他的幸存概率却最低。最强
者生存的概率居然就这么一点点!而枪法最差的枪手，如果采用最佳策略．
％I
舻
反而能使自己的得到更高的幸存概率。
    不过，如果仅仅把思考停留在只有三个对手的情况下，可能会造成一种
虚假的安全感。毕竟三角关系仍然是一种相对简单的模式。现在让我们考察
一下，假如三个敌人可以达成稳定状态，四个又如何呢?
    现在我们在上面魏、蜀、吴的例子中．加入辽东的公孙渊。假设曹魏要
打吴国的话，很有可能遭到公孙渊的人侵。如果当时公孙渊的力量足够强大，
这确实是曹魏面临的一个严重威胁。如果这样，吴国不必担心曹魏人侵，就
是因为曹魏一想到公孙渊就不敢大意。因而西蜀也就不可能指望曹魏来抑制
吴国的吞并野心。但是公孙渊当时鞭长莫及，倒后推理的链条在曹魏这里中
断，而西蜀最终也因此得到了安全。
    从表面看来，这个例子说明，一个国家究竟会不会遭到人侵，将取决于
潜在侵略者链条的节点数目是奇数还是偶数。但它的实际意义在于，一个更
加接近现实生活的情况分析，能够通过把国与国之间的复杂关系考虑在内。
从而得到更多细节，用于判断一国入侵别国的企图究竟有多大。
    不过，还有一个重要的结论：博弈的结果在很大程度上取决于参与者的
人数。参与的人越多越好，参与的人越少越糟，即便在同一个博弈里也是如
此。但是，两个敌对国家难以和平共处、三个敌对国家就能恢复稳定局面的
结论并不意味着若有四个敌对国家就更和平；在三国的那个例子里．四个的
结果跟两个是一样的。
    事实上，离我们并不太远的抗日战争，也可以看做是一场多个枪手的对
决，大家完全可以依照三国的案例来分析一下。
进攻方向的选择
    如果在多方参与的博弈中，我们已经决定了要向对手中的一个展开进攻，
但是自己叉未能占据实力上的优势．这时候应该怎么办呢?下面这个故事可
以给我们一些启发。
    民国时期，广西出现三足鼎立之势：黄绍陶和李宗仁合在一处有两万多
人，陆荣廷有三万多人，沈鸿英有两万多人。有一年，陆荣廷与沈鸿英在桂
I 9厶
枪手博弈：先发优势与后发制人
林鏖战，相持三个多月不分胜负。这时，坐山观虎斗的李宗仁忽闻陆、沈开
始媾和。
    李宗仁认为，陆沈双方和议如成，则广西仍是三分之局；陆、沈还要合
而谋他．决不能坐失良机。于是与白崇禧及黄旭初商讨有关战事。白崇禧与
李宗仁不谋而合，他说：“陆、沈相急，已达三个多月，我们隔岸观火，现在
火势将熄．我们若不趁火打劫，就会失去大好时机。”黄旭初说：“李总司令，
健生兄你们认为陆、沈二人．我们先打陆好呢’还是先打沈好呢’”
    李宗仁认为：“就道义来说应先讨沈，因为沈某人反复无常，久为两粤人
民所痛恨．对他大张挞伐，定可一快人心。至于陆荣廷，广西一般人并无多
大恶感。”
    白崇禧说：“我认为应先打陆，有三条理由。第一．陆驻在桂林、南宁，
为广西政治中心，防务空虚，易于进攻。第二，陆与湖南相通．湖南叉得到
吴佩孚援助．应于其支援未至时。出其不意，攻其不备。第三，攻打沈鸿英，
胜了，陆之势力犹在，广西仍然不能统一；败了．则更不能打陆、吴。我们
之处境如楚汉相争之韩信，联陆则沈败，联沈则陆败，我们应当联弱攻强．
避实击虚。”
    黄旭初说：“我也认为应当先打陆荣廷。陆、沈交战，陆荣廷将其主力调
至桂林增援，其后方南宁必定空虚，因此，我军袭击南宁必定成功。而且陆
荣廷在桂林被围三个月，已气息奄奄，我们如攻沈．就等于救了他的命。而
且纵然能将沈军击败．伤亡也必大。”
    三人经过充分的协商．最后做出“先陆后沈”的决策，决定先攻陆荣廷：
    李宗仁于是领衔发出通电，请陆荣廷下野。通电发出以后，联军分水陆
两路向南宁所属地区分进合击。一个月后，李宗仁指挥的左翼军兵不血刃占
领南宁。由白崇禧指挥的右翼军于扫荡宾阳、迁江、上林之敌后，即向左回
旋进击武鸣，也未遗激烈抵抗，两军会师南宁。
    被围于桂林的陆荣廷失去南宁之根据地，只得进人湖南。随后．李宗仁
趁热打铁，在不到三年的时间里将沈鸿英、谭浩明等一一剪除，于1925年秋
统一广西。
    对于这场以少胜多的著名战役，给了历代研究者无数启示。但是实际上，
这场胜利除了当时的有利环境等因素外，李宗仁和白崇禧对于攻击方向和先
95 I
博拜论的碴，／
后顺序的安排，也充满了博弈论的智慧。
    美国普林斯顿大学博弈论课程中有这样一道练习题。
    在一次军事演习中．红方要用两个师的兵力．攻克蓝方占据的一座城市．
而蓝方的防守兵力是三个师，红方与蓝方每个师的装备、人员、后勤等完全
相同．自然战斗力相同。
    由于战斗力完全相同．因此两军相遇时，人数居多的一方取胜；战争中
都是“易守难攻”．因此当两方人数相等时．守方获胜。同时．军队的最小单
位为师．不能够再往下分割，只要红方可以突破防线．就算红方胜利：反之
则蓝方胜利，
    不妨假想，红方进攻蓝方有两个方向．分别是A、B两个方向、相应的．
蓝方的防守方向也是这两个。这样．进攻方红方的战略有三个：
    (1)两个师集中向蓝方防线的A方向进攻：
    (2)兵分两路．一个师向蓝方防线的A方向进攻，另一个师向蓝方防线
的B方向进攻
    (3)两个师集中向蓝方防线的B方向进攻，
    防守方蓝方则有四种不同的防守策略：
    (1J三个师集中防守A方向。
    (2)两个师防守A方向，一个师防守B方向。
    (3)一个师防守A方向．二个师防守B方向
    【4)三个师集中防守B方向。
    我们依次用排列组合来看罗列双方各种策略组合下的结果．见表7一l。
表7．1
红蓝双方博弈矩阵
196
《勰
枪手博弈：先发优势与后发制人
    这个博弈中，红方没有劣势策略，而蓝方有劣势策略。很明显，蓝方选
择第一种策略，也就是派三个师防守A方向劣于第二种策略．也就是派两个
师防守A方向．一个防守B方向。
    因为，蓝方选择第二种策略的任何一个结果都不比选择第一种策略差
在表7．1中能够看出三种结果：红方选择第一种策略时．蓝方选择第二种策略
与第一种策略相同．都是蓝方胜利；红方选择第二种策略时．蓝方选择第二
种策略是胜利，而第一种策略则是失败．自然选择第二种策略要好；红方选
择第三种策略时，蓝方选择第一、第二策略结果相同．都是失败。由此可见，
蓝方选择第二种策略自然好于第一种。同理．蓝方选择第三种策略也好于第
四种靖略．也就是说，蓝方策略选择中的第一种和第四种都是劣势策略：
    劣势策略从理性人的角度来看是蓝方一定不会采用的策略，红方知道蓝
方不会选择第一、第四种策略．于是．红方和蓝方都知道博弈可以简化成如
表7．2所示的博弈
表7．2
简化后的红蓝双方博弈矩阵
    这个简化的博弈中，蓝方反而没有劣势策略．红方却有一个劣势策略．
也就是第二种策略．选择分兵两路进攻防线。很明显，红方选择第二种策略
的结局就是根本不可能胜利．理性的红方自然不会选择这个劣势策略。博弈
矩阵得到了进一步的简化．见表7．3。
    这个时候．红蓝双方的形势是相同的，即红方尽管在总兵力上劣于蓝方．
但实际上它只要运用谋略．攻其不备．其获胜的几率与蓝方是相同的。
    在博弈论中，“以弱胜强”的道理就是这样。正如在城渫之战中．总兵力
占优势的楚国联军．并不能保证在某个局部(比如右军)拥有优势；而总兵
97 l
力处于弱势的晋军．却可以巧妙地集中优势精锐兵力，在楚军的右军方向取
得头一场战斗的胜利，然后再击败左军．通过歼灭其两翼，使楚军大败，
表7．3    再次简化后的红蓝双方博弈矩阵
    再如在企业竞争中．也是一样。资本、规模、品牌、人力等都处于劣势
的企业．可以在某个局部市场上．集中自己所有的资源并加以整合，造成在
细分市场上对强势企业的优势，从而成为市场竞争中的胜利者。
置身事外的智慧
    春秋战国时期．韩、赵两国发生战争。韩国派使者到魏国借兵攻打赵国．
魏文侯说：“我与赵国是兄弟之邦．不敢从命，”赵国也来向魏国借兵讨伐韩
国，魏文侯仍然用同样的理由拒绝了。两国使者没有完成任务，快怏而归。
当他们回国后．才知道魏文侯已分别派使者前来调停．劝说双方平息战火：
韩、赵两国国君感激魏文侯化千戈为玉帛的情谊．都来向魏文侯致谢，魏国
于是开始成为魏、赵，韩三国之首，各诸侯国都不能和它争雄。
    韩、赵两国力量相仿．都不可能单独打败对方，因此都想借助魏国的力
量。在这种情形下，魏国的行动直接关系到韩赵之战的胜负。魏文侯没有去
介入两国之争．以第三者公平的立场加以调停．使战争变成了和平．从而使
魏国取得了三国关系中的主导地位。
    由此可见．即使是枪手博弈．在枪弹横飞之前甚至之中．也仍然会出现
某种回旋空间。这时候，对于尚未加入战团的一方来说是相当有利的。因为
当另外两方相争时．第三者越是保持自己的含糊态度，保持一种对另外两方
的威胁态势．其地位越是重要，当他处于这种可能介入但是尚未介人的状态
l 98
抢手博弈：先发优势与后发制人
时，更能保证其优势地位和有利结果。
    这就启示我们，人在很多时候都需要一种置身事外的艺术。如果你的两
个朋友为了小事发生了争执，你已经明显感到其中一个是对的，而另一个错
的，现在他们就在你的对面，要求你判定谁对谁错，你该怎么办’
    其实在这时候一个聪明的人不会直接说任何一个朋友的不是。因为这种
为了小事发生的争执，影响他们做出判断的因素有很多。而不管对错，他们
相互之间都是朋友。当面说一个人的不是，不但会极大地挫伤他的自尊心，
让他在别人面前抬不起头，甚至很可能会因此失去他对你的信任；而得到支
持的那个朋友虽然一时会感谢你，但是等明白过来．也会觉得你帮了倒忙，
使他失去了与朋友和好的机会。
    《清稗类钞》中记载的一个故事，可以说是一个绝妙的例子。
    清朝末年．湖广总督张之洞与湖北巡抚谭继洵关系不太融洽，遇事多有
龃龉。谭继洵就是后来大名鼎鼎的“戊戌六君子”之一谭嗣同的父亲。
    有一天．张之洞和谭继洵等人在长江边上的黄鹤楼举行公宴，当地大小
官员都在座。座客里有人谈到了江面宽窄问题，谭继洵说是五里三分，曾经
在某本书中亲眼见过。张之洞沉思了一会．故意说是七里三分。自己也曾经
在另外一本书中见过这种记载。
    督抚二人相持不下，在场僚属难置一词。于是双方借着酒劲儿戗戗起来，
谁也不肯丢自己的面子。于是张之洞就派了一名随从，快马前往当地的江夏
县衙召县令来断定裁决。当时江夏的知县是陈树屏，听来人说明情况，急忙
整理衣冠飞骑前往黄鹤楼。他到了以后刚刚进门，还没来得及开口．张、谭
二人同声问道：“你管理江夏县事，汉水在你的管辖境内，知道江面是七里三
分．还是五里三分吗?”
    陈树屏知道他们这是借题发挥，对两个人这样搅闹十分不满．但是又怕
扫了众人的兴；再说，这两方面是谁都得罪不起的。他灵机一动．从容不迫
地拱拱手．言语平和地说：“江面水涨就宽到七里三分，而水落时便是五里三
分。张制军是指涨水而言．而中丞大人是指水落而言。两位大人都没有说错，
这有何可怀疑的呢，”张、谭二人本来就是信口胡说，听了陈树屏这个有趣
的圆场，抚掌大笑，一场僵局就此化解。
9q I
_t hl M譬掣
    学会了置身事外，你的处世水平当然就上升到了一个更高的档次。英文
中有一句谚语叫做：涉人某件事比从该事脱身容易得多(It is easier to get
involvedin somethingthan nlstoget 0ut o“t)。可以说是对置身事外的智慧的
一种反向总结。
    也许会有很多人认为．这种置身事外．谁也不得罪的做法是一种墙头草
的行径，十分令人瞧不起。大丈夫敢作敢为，必须敢于挺身人局表明自己的
立场。其实这是对置身事外策略的一种误解。置身事外不过是一种博弈手段，
其目标是为了在冲突的最初阶段更好地保护自己，并且在将来挺身人局的时
候能够占据更为有利的地位。这一点．本章一开始的枪手博弈的模型已经解
释得一清二楚了。
第8章
猎鹿博弈：走上集体优化之路
没理英超的赛果
记忆里只得这崇渡
留低双精结局
静坐并没人抚摸
——《天下太平》歌词
从胡雪岩破产谈起
    1883年，上海阜康钱庄的主人——晚清时期名声显赫、身价高达3000万
两白银的红顶商人胡雪岩。在一夜之间宣布破产，名下所有的钱庄、银号尽
数倒闭。到底发生了什么重大变故，使原本一帆风顺的胡字号大船迅速沉人
了水底呢，
    最常见的一种说法是，胡雪岩的阜康系财团的倒塌，虽然是从钱庄被挤
兑开始的．但这场金融地震的震源，却是胡雪岩与洋商做蚕丝生意时，研判
商情失误．发生了严重的亏损。
    那次导致他破产的坐庄生丝的豪赌．是从1881年开始的。胡雪岩不断地
囤积生丝，到了1882年已经囤积了8000包，超过了上海生丝全年交易量的
2／3。不出他所料，市面的生丝价格果然被抬上去了。但是胡雪岩仍然不满足，
他自恃手上控制着阜康钱庄和当铺，后备资金充足．所以不但不抛出生丝，
反而继续囤积。资金链紧绷到了极点。
ii匆．M 1*#镕∞蘑，，
    当时胡雪岩的判断是：缫丝工厂如果买不到生丝(原材料)，工厂就无工
可开，无货可卖，所以他们迟早要买生丝；而中国的生丝一半都抓在他手里，
要想买生丝，就必须得把钱交到他胡雪岩手上。
    在此之前，上海有个商人曾请胡雪岩做担保，向外商借得一笔款子．此时正
好到期。他拒付本息，外商便向保人胡雪岩讨债。
    消息传出．谣言四起，存户争相前往胡雪岩的钱庄挤兑。上海阜康钱庄
首先出现了挤兑风潮，很快扩散到全国各地。随着挤兑风波的扩大，胡雪岩
在各地的钱庄都受到牵连，在杭州的泰来钱庄首先倒闭。1883年2月5日．
大名鼎鼎的阜康钱庄终于被挤兑得关门大吉。
    阜康钱庄破产引发了全国性的金融恐慌．城门失火．殃及池鱼，各地钱
庄都受到牵连关门大吉。扬州连续倒闭钱庄17家。福州倒闭6家．宁波钱庄
从3l家减为l 8家，镇江的60家只剥15家．汉口只有几家钱庄挨过旧历年
关。北京也不能幸免，取款者“不绝于途，街衙几为之塞”，两周内44家钱
庄破产。
    为了了解龙卷风一样的挤兑风潮．我们来看这样一个简单的例子，从而
分析其机理。
    假设现在有A和B两个人，都借给朋友c tOO万元人民币做生意。c拿
到这200万元在第一年进行投资．第二年才可以赚得利润。笔者不妨假设第
一年的时候，A和B索要借款，c只能还给两人各70万元；若是A和B并不
是那么急着要钱，给c两年的时间．则c连本带利可以获得280万。
    对于A、B两人来说，第一年要回借款，各得70万；若其中一个人索要
借款，而另一个人没有去索要．则索要的人先来一步得到100万本钱。另一
个人则只拿到剩下的40万元；如果两人都在第二年才索要存款，则各得140
万元；在第二年．只有一个人索要借款，另一个人并没有催着c还钱的情况
下，先催款的人得到180万．另一个人只拿到原来的本钱100万。
    这种情况下．就是一个两阶段的动态博弈，见表8—1和表8．2。
l102
ii匆．M 1*#镕∞蘑，，
    当时胡雪岩的判断是：缫丝工厂如果买不到生丝(原材料)，工厂就无工
可开，无货可卖，所以他们迟早要买生丝；而中国的生丝一半都抓在他手里，
要想买生丝，就必须得把钱交到他胡雪岩手上。
    在此之前，上海有个商人曾请胡雪岩做担保，向外商借得一笔款子．此时正
好到期。他拒付本息，外商便向保人胡雪岩讨债。
    消息传出．谣言四起，存户争相前往胡雪岩的钱庄挤兑。上海阜康钱庄
首先出现了挤兑风潮，很快扩散到全国各地。随着挤兑风波的扩大，胡雪岩
在各地的钱庄都受到牵连，在杭州的泰来钱庄首先倒闭。1883年2月5日．
大名鼎鼎的阜康钱庄终于被挤兑得关门大吉。
    阜康钱庄破产引发了全国性的金融恐慌．城门失火．殃及池鱼，各地钱
庄都受到牵连关门大吉。扬州连续倒闭钱庄17家。福州倒闭6家．宁波钱庄
从3l家减为l 8家，镇江的60家只剥15家．汉口只有几家钱庄挨过旧历年
关。北京也不能幸免，取款者“不绝于途，街衙几为之塞”，两周内44家钱
庄破产。
    为了了解龙卷风一样的挤兑风潮．我们来看这样一个简单的例子，从而
分析其机理。
    假设现在有A和B两个人，都借给朋友c tOO万元人民币做生意。c拿
到这200万元在第一年进行投资．第二年才可以赚得利润。笔者不妨假设第
一年的时候，A和B索要借款，c只能还给两人各70万元；若是A和B并不
是那么急着要钱，给c两年的时间．则c连本带利可以获得280万。
    对于A、B两人来说，第一年要回借款，各得70万；若其中一个人索要
借款，而另一个人没有去索要．则索要的人先来一步得到100万本钱。另一
个人则只拿到剩下的40万元；如果两人都在第二年才索要存款，则各得140
万元；在第二年．只有一个人索要借款，另一个人并没有催着c还钱的情况
下，先催款的人得到180万．另一个人只拿到原来的本钱100万。
    这种情况下．就是一个两阶段的动态博弈，见表8—1和表8．2。
l102
表8．1
第一年的索款博弈矩阵
表8-2    第二年的索款博弈矩阵
    动态博弈都是用倒推法进行分析，我们在这里仍然采用倒推法．首先看
第二年时．A和B作为理性人会如何选择行动策略。假如A和B都将资金借
给C用到第二年．这个时候博弈均衡点是双方都索要自己的资金，A和B各
得到140万元的还款，利息率高达40％。这个均衡点是A、B两人理性博弈
的唯一可能结果，
    我们回过头来看第一阶段，也就是第一年双方的博弈情况．由于在第一
年时t双方都不抽回资金的策略将产生第二年的均衡结果．因此在第一年的
博弈矩阵可以改写成表8-3所示的矩阵。
表8-3
简化的素款博弈矩阵
    在我们假定A和B都是理性人的条件下，第一年的纳什均衡点很明显有
两个．一个是双方都索要借款．这时双方都只能拿回70万元；另一个就是双
方在第一年都不索要借款．这时根据我们在第二阶段的分析，双方各能收到
140万元的回报自然对于A和B来说，后一个纳什均衡比前一个纳什均衡
措鹿博弈：走上集体优化之路
要好。
    遗憾的是．并没有什么可以保证A、B双方一定不会在第一年索要借款。
在现实生活中，这个模型中的c就相当于是一家银行，而A和B就是银行的
存款客户。
    银行挤兑往往是由于谣言四起，存款客户不再放心将钱放在银行中，纷
纷去拿回存款。在很短的时问内，银行又无法筹措大量的现金．最终的结果
就是银行倒闭，很多人只能抽回银行存款的一部分，甚至是一分存款都拿不
到。这种情况往往就是实际生活中许多银行因挤兑风潮倒闭的根源。
“看不见的手”失灵
    如果我们从挤兑现象引申开来，似乎又回到了囚徒困境的模型。但是在
这里，我们不再探讨使每个参与者参与挤兑的机制，而是由此寻找一种能够
避免争相挤兑，从而走上集体优化的道路。
    有这样一个寓言故事，说的是一个人有一妻一妾，妻子年纪大而妾年轻。
于是，妻子每天都把丈夫头上的黑发拔一点下去，以使他与自己的年龄相配．
同时使他在朋友面前的形象也显得更为德高望重一些。而小妾每天把丈夫的
白发拨一点下去，以使他显得年轻一些，显得更有活力一些。过了没有多久，
这个人变成了秃头。
    无论是妻还是妾，她们为这个男人拔头发的动机都无可非议，但是最终
却是两败俱伤，不，是三败俱伤，把自己的丈夫变成了秃头。单纯地批评她
们的愚蠢是于事无补的，正如生活中无数类似的故事一样，我们需要的是实
现集体优化的解决方法。
    按照传统经济学的观点，集体优化是不需要刻意追求的．只需要每一个
人都从利己的目的出发，而最终全社会达到优化的效果。也正是在这样的观
念之下．“主观为自己，客观为社会”一度成为广泛流传的观念。
    其实，这种思想真正的来源是亚当·斯密的《国富论》c这本书中提出，
有一只“看不见的手”会从个人自利的经济行动中，提炼出社会整体的经济
福祉。让我们重温一下这段经典论述：
051
飘w当篮
铲
    “我们的晚餐并不是来自屠夫、啤酒酿造者或点心师傅的善心，而是源
于他们对自身利益的考虑    ‘每个人’只关心他自己的安全、他自己的得
益。他由一只看不见的手引导着，去实现他原本没有想过的另一目标。他通
过追求自己的利益．结果也实现了社会的利益，比他一心要提升社会利益还
要有效。”
    1776年这段话在《国富论》中出现以后，很快成为鼓吹自由市场经济者
的最有力论调。很多人因此认为，经济市场的效率意味着政府不要干预个人
为使自己利益最大化而进行的自利尝试。
    随着市场经济的发展和发达．这种思想及其各种变化形式．迅速成为指
导人们行为的一种价值准则．或者为自利行为辩解的一种论据。在《联邦党
人文集》中．麦迪逊认为，在幅员足够大的共和国中，不同政治派别图谋私
利的行为．在某种自动的作用之下反可形成内政的和谐。
    由盂德斯鸠首倡并且实践的美国宪法之中的三权分立与制衡观念，也是
出自同一观点。分权的目的是防止专制，而不是为了政府和谐；其用意在于
使政府各部门在追求本身利益的同时．能节制过分的行为，从而促进大家的
利益。
    同样的原则被应用到国际事务里。各国追求本身利益的同时，对国际社
会也会有所贡献，仿佛有一只隐形的手．能够保证各国凭自由意志所做的选
择必能为人类全体带来福祉。
    然而事实上，并不是只要每一个人都追求自己的利益，世界就会取得最
好的结果。囚徒困境已经向我们详细地说明了这一点。在囚徒困境里，当一
名囚徒坦白时．他伤害了他的同伴，却不会因此而付出代价。个人理性与集
体理性的冲突．各人追求利己行为而导致的最终结局是一个纳什均衡，也是
对所有人都不利的结局。他们两人都是在坦白与抵赖策略上首先追求自己利
益的最大化，这样反而要服长的刑期。只有当他们都首先替对方着想，或者
相互合谋(串供)时，才可以得到最短时间监禁的结果。
    从囚徒困境我们知道了“看不见的手”的原理的一个悖论：从利己目的
出发，也可能损人不利己．既不利己也不利他。每个人可能去傲从个人看来
最好的事情，却得到了从整体看来最坏的结果。实在有太多人会做错事，又
1106
猎鹿博弈：走上集体优化之路
或者可以说是每个人都太容易做错事。在这个背景下．我们说“看不见的手”
在许多方面是失是的。
    奥曼于1987年提出了“相关均衡”机制。所谓相关均衡是指，通过某种
客观的信号装置以及当事人对信号的反应．使本来各自为政的个体行为之间
相互发生关系，形成一种共赢的结果。
    在生括中，我们也可以发现很多这样的例子。比如在交通路口设置红绿
灯、设立金融中介组织以及各种社会媒体与中介组织，世界贸易组织和欧佩
克组织等，可以说都是为了使各方在合作中走向共赢。
    托马斯·霍布斯认为，在有政府存在之前．自然王国充满着由自私个体
的残酷竞争所引发的矛盾，生活显得“孤独、贫穷、肮脏、野蛮和浅薄”。按
照他的观点，没有集权的合作是不可能产生的，一个有力的协调机制是推动
社会发展所必要的。
    然而．真的如他所说，除了强有力的约束机制，再没有其他达成共赢的
形式了吗’
从合作走向共赢
    战国时，越国某地有两位地方官员甲父史和公石师。他们各有所长，甲
父史善于计谋．但处事很不果断；公石师处事果断，却缺少心计，常犯疏忽
大意的错误。这两个人交情很好，所以经常取长补短．合谋共事。他们虽然
是两个人，但好像有一条心，无论一起去干什么总是心想事成。后来，他们
在一些小事上发生了冲突，吵完架后就分道扬镰。当他们各行其是的时候，
却屡赓出现问题。
    一个叫密须奋的属吏对此感到十分痛心。他规劝两人说：“你们听说过海
里的水母没有’它没有眼睛．靠虾来带路。而虾则分享水母的食物。这两者
互相依存，缺一不可。我们再看一看琐蛄吧!它是一种带有螺壳的共栖动物．
寄生蟹把它的腹部当做巢穴。琐蛄饥饿了，靠螃蟹出去觅食。螃蟹带回食物
以后，琐蛄因吃到了食物而饱腹，螃蟹因有了巢穴而安居。这是又一个谁也
离不开谁的例子。让我们再看一个例子，不知你们听说过蜃鼠没有?它前足
D7 I
《
飘J=i鲨型
短，善求食而不善行。可是一种叫邛邛矩虚的动物四条腿很长，善于奔跑而
不善于觅食。平时邛邛炬虚靠蜃鼠提供的甘草生活；一旦遭遇劫难，邛邛炬
虚则背着蜃鼠逃跑。它们也是互相依施的。
    “恐怕你们还没有见过双方不能分开的另一典型例子，那就是西城的二
头鸟。这种鸟有两个头共长在一个身子上．但是彼此妒忌。两个鸟头饥饿起
来互相啄咬，其中的一个睡着了．另一个就往它嘴里塞毒草。如果睡梦中的
鸟头咽下了毒草，两个鸟头就会一起死去．它们谁也不能从分裂中得到好处。
    “下面我再举一个人类的例子。北方有一种肩并肩长在一起的‘比肩人’。
他们轮流着吃喝、交巷着看东西，死一个则全死，同样是二者不可分离。现
在你们两人与这种‘比肩人’非常相似，区别仅仅在于，‘比肩人’是通过形
体．而你们是通过事业联系在一起的。既然你们独自处事时连连失败，为什
么还不和好呢'”
    甲父史和公石师听了密须奋的劝解，会意地说：“要不是密须奋这番道理
讲得好．我们还会单枪匹马受更多的挫折!”于是，两人言归于好，重新精诚
合作。
    这则寓言通过密须奋讲的五个故事．以及甲父史和公石师的教训告诉大
家，生物界中各种个体的能力是非常有限的。在争生存、求发展的斗争中．
只有坚持团结合作、取长补短．才能获得成功。
    其实这还只是一些感性的认识，甚至带有一定的说教气味。如果从每一
个博弈参与者的角度来考察．合作却并非永远是最佳的策略。
    在前面的章节我们已经知道，在一个博奔中，参与者的策略往往有四种
组台：第一，都采取合作的方式，绝不背叛，这对集体来说是最优的策略：
第二，本人采取不合作的方式但个人收益是最大的，这对个人来说是最优的
策略；第三，所有的参与者都选择背叛，这对集体来说是最坏的结果．同时
对个人而言也有可能是最坏的结果；第四，也最后一种选择．就是当别人采
取不合作态度时自己却坚守合作的方式，这种情况对个人和集体来说都不是
最优策略，而且从个人追求自身效益最大化的动机来看，做出这种选择几乎
不可能。
    在巴以冲突中阿拉伯国家态度的变化．为我们提供了一个理解上述情形
I108
猎鹿博奔：走上集体优化之路
的窗口。
    首先，埃及人采取了第二种策略组合。在他们看来．当时的情况下，选
择与以色列人合作肘其自身利益而言无疑是最优的策略．他们能够获得相关
国家所不能获得的额外收益。于是，当时的埃及领导人萨达特采取了一种把
车国国家利益置于阿拉伯世界整体利益基础之上的新思维，单方面与以色列
达成了和解。
    其次，在埃及采取了单独与以色列和解的行动之后，18个阿拉伯国家的
外长在巴格达集会，共同协议切断同埃及的外交和经济关系。他们的协议也
得到了巴解组织的赞成。协议要求各国立即召回驻埃及的大使．在一个月之
内完全切断外交关系，停止所有经济援助，并对埃及进行经济制裁。
    但是这样的协议无法阻止效仿埃及的行为在阿拉伯世界蔓延．其他阿拉
伯国家为了避免自己获得最坏的结果，也先后开始了与以色列的和谈。他们
的这些个体行为造成了集体背叛的恶果，最终的结果便是他们非但没有获得
预想之中的最大收益，反而使自己的利益也受到了损害。同时，这种行为成
为对巴勒斯坦民族利益的最大损害，加剧了巴以冲突恶化的趋势并使危机久
拖不决。
    综上，我们可以清楚地理解，阿拉伯国家和国际社会对萨达特“和平主
义行动”之毁誉参半是符合历史逻辑的。也能够从一个侧面说明，如果阿拉
伯国家整体合作，即采取四种博弈策略中的第一种策略，对解决冲突是有一
定的积极作用的。
猎人的帕累托效率
    有一个在犹太人中广为流传的经典故事。两个孩子得到一个橙子，但是
在分配问题上，两个人吵来吵去，最终达成了一致意见：由一个弦子负责切
橙子，而另一个孩子选橙子。最后，这两个孩子按照商定的办法各自取得了
一半橙子．高高兴兴地拿回家去了。第一个孩子回到家。把半个橙子的皮剥
掉扔进了垃圾桶．把果肉放到果汁机上榨果汁喝。另一个孩子回到家，却把
半个橙子的果肉挖掉扔进了垃圾桶，把橙子皮留下来磨碎了，混在面粉里做
0q1
翩Ⅵ掣鲨型
蛋糕吃。
    从上面的情形我们可以看出，虽然两个孩子各自拿到了一半．获得看似
公平的分配，但是他们各自得到的东西却没有能够物尽其用。这说明．他们
事先并来做好沟通，也就是两个孩子并没有申明各自利益所在。没有事先申
明价值，导致了双方盲目追求形式上和立场上的公平，结果双方各自的利益
并未达到最大化。
    在社会生活中，很多“橙子”也是这样被分配和消耗掉的。人们争持不
下并且由此造成两败俱伤的根本愿因之一，就在于各方的行动策略都是相互
独立的。由于缺乏协调而失去了很多共赢机会。
    如果我们试想，两个孩子充分交流各自所需，或许会有多种解决方案。
可能的一种情况，就是想办法将皮和果肉分开，一个拿到果肉去榨果汁，另
一个拿果皮去烤蛋糕。
    然而，也可能出现经过沟通后的另外一种情况，有一个孩子既想做蛋糕，
又想喝橙汁。这时，通过合作创造价值的机会就出现了。那个想要整个橙子
的孩子提议将其他的问题章出来一块谈．他说：“如果把这个橙子全给我，你
上次欠我的棒棒糖就不用还了。”其实，他的牙齿被蛀得一塌糊涂，父母上个
星期就不让他吃糖了。另外一个孩子想了一想，很快就答应了。他刚刚从父
母那儿要了五块钱，准备买糖还债。这次他可以用这五块钱去打游戏．才不
在乎这酸溜溜的橙子呢。
    要了解合作为什么能够带来收益，以及它比公平更能实现利益最大化的
机制，我们要从“猎鹿博弈”说起。
    猎鹿博弈的理论源泉，最初来自于启蒙思想家卢梭在其著作《论人类不
平等的起源和基础》中的论述。他所描述的个体背叛对集体合作起阻碍作用
这个过程，后来被学者们称为“猎鹿博弈”。
    在古代的一个村庄有两个猎人。为了简化问题，假设主要的猎物只有两
种：鹿和兔子。在古代，人类的狩猎手段比较落后．弓箭的威力也有限。在
这样的条件下，我们可以假设，两个猎人一起去才能猎获1只鹿。如果一个
猎人单兵作战．他只能打到4只兔子。
    从填饱肚子的角度来说，4只兔子能保证一个人4天不挨饿，而1只鹿却
猎鹿博弈：走上集体优化之路
差不多能使两个人吃上10天。这样．两个人的行为决策就可以写成以下的博
弈形式：要么分别打兔子，每人得0；要么合作，每人得10。这样猎鹿博弈
有两个纳什均衡点．那就是：要么分别打兔子，每人吃饱4天；要么合作．
每人吃饱10天。
    两个纳什均衡，就是两个可能的结局：两种结局到底哪一个最终发生，
却无法用纳什均衡本身来确定。比较【10，10】(第一个数代表甲的满意程度或
者得益，第二个数代表乙的满意程度或者得益，余同)和[4，4】两个纳什均衡，
我们只看到一个明显的事实，那就是两人一起去猎鹿，比各自去抓兔子可以
让每个人多吃6天。
    按照经济学的说法．合作猎鹿的纳什均衡此分头抓兔子的纳什均衡，具
有帕累托优势。与【4，4】相比．【10，10]不仅有整体福和改进．而且每个人都
得到福利改进。换一种更加严密的说法就是，【lO，10]与【4，4]相比，其中一
方收益增大，而其他各方的境况都不受损害。【10，lO]对于【4，4】具有帕累托
优势的关键在于每个人都得到改善。
    这里要解释一下何谓帕累托效率。帕累托效率准则是：经济的效率体现
于配置社会资源以改善人们的境况．特别要看资源是否已经被充分利用。如
果资源已经被充分利用，要想再改善我就必须损害你，要想再改善你就必须
损害我，一句话，如果要想再改善任何人都必须损害别人，这时候就说一个
经济已经实现了帕累托效率最优。相反，如果还可以在不损害别人的情况下
改善任何一个人，就认为经济资源尚未充分利用，就不能说已经达到帕累托
效率最优。
    在猎鹿博弈中，两人合作猎鹿的收益[10，10】对于分别猎兔【4．4】具有帕
累托优势。比较原来的境况[4，4】，现在得到【10，10】，我们说境况得到了帕
累托改善。作为定义。帕累托改善是各方的境况都不受损害的改善，是各方
都认同的改善。
    可是上面的情况是假设双方平均分配猎物，也就是说，两个猎人的能力
和贡献差不多．但是实际上并不一定如此。如果一个猎人能力强、贡献大，
他就会要求得到较大的一份，这样分配的结果就可能是『14，6域【15，5】。但
有一点是确定的．那就是能力较差的猎人的所得，至少要多于他独自打猎的
飘翟鲨巡
收益，否则他就没有合作的动机。
    如果合作的结果是[17，3]，相对于分别猎兔【4，4】就没有帕累托优势，这
是因为3比4小，乙受到损害。这样，我们就不能说境况得到了帕累托改善。
虽然17比4多，改善了很多，17+3也比4+4太很多，改善了很多．但是3
比4小．乙没有改善反而恶化。所以站在乙的立场，[17，3】没有原来的[4，
41那么好。如果合作的结果如此，那么乙一定不愿合作。这时并未得到帕累托
改善。
猎鹿中的公平问题
    在上面的猎鹿博弈中，我们假设的猎人双方按照各人的贡献来分配猎物。
如果双方对分配的话语权不平等的情况下，叉会出现什么样的情况呢7
    也许你听过狮子与野驴的寓言吧。
    狮子与野驴一起外出打猎．狮子力气太．野驴跑得快。他们抓获了许多
野兽。狮子把猎物分开堆成三份，说道：“这第一份，该我拿，因为我是王。
第二份也该是我的．把它算作我和你一起合作的报酬。至于第三份呢々如果
你不准备逃走，也许会对你有危险。”
    我们不妨做这样一种假设：猎人A比猎人B狩猎的能力要略高一筹，但
B猎人却是酋长之子，拥有较高的分配权。可以设想．A猎人与B猎人合作
猎鹿之后的分配不是两人平分成果，而是A猎人仅分到了够吃2天的鹿肉，B
猎人却分到了够吃18天的鹿肉。在这种情况下．整体效率虽然提高，但却不
是帕累托改善，因为整体的改善伤害到猎人A的利益。我们假想．具有特权
的猎人B会通过各种手段方法让猎人A乖乖就范。但是猎人A的狩猎热情遭
到伤害，这必然会导致整体效率的下降。
    在生括中不乏这样的案例。有两个人合伙做生意，一个有钱出资金，一
个有神通疏通关系。在共同努力下，他们的生意很红火。
    但这时，那个有神通的人便想独吞生意。于是，他便向出资者提出退还
那些资金，这份生意算他一个人的。出资人当然不愿意，因此双方僵持了很
长时间，矛盾越来越尖锐，最后诉诸公堂。那个有神通的人不愧有神通，他
猫鹿博奔；走上集体优化之路
在两人开始做生意时，便已经给对方下了套，在登记注册时只注册他一个人
的名字。
    虽然出资人是原告，却因对方早就下好了套而输了官司。结果，他跟睁
睁看看对方独吞了生意而没有办法。
    这就是一种无法实现帕累托效率的博弈。
    我们把视野再扩大一点．如果参加狩猎博弈的不是两个人，而是多个人；
而且在分配猎物的时候，出现了既得利益集团与弱势群体，那么最后出现的
情况会是怎样的呢’
    某中型煤矿取得了生产和安全的双丰收。特别是在安全方面，100万吨原
煤生产死亡率降到了2人以下，跻身于同行业的先进行列。为此，上级主管
部门特拨下15万元奖金，作为奖励。该矿矿长召集中层领导开了一个“分配
安全奖金”会议，确定了奖金的分配方案：矿长550元，副矿长500元．科
长400元，一般管理人员200元，工人一律5元。
    奖金发下后全矿表面上显得风平浪静，但几天后矿里的安全事故就接连
不断地发生：先是运输区运转队的人车跳轨，接着采区割煤机电机被烧，随
后就是开拓区冒顶两人受伤。矿长坐不住了．亲自组织带领工作组到各工队
追查事故起因．首先追查跳轨事故。机车司机说钉道工钉的道钉松动，巡检
维修不细心。而钉道工说是司机开得太快，造成了跳轨。
    背地里，大家说出了心里话：“我们拿的安全奖少，没那份安全责任，干
部拿的奖金多，让他们干吧。”甚至有一些lT人说：“老子受伤，就是为了不
让当官的拿安全奖。”矿领导进行了多方面的调整工作。总算把安全事故压下
去了，然而该矿以前那种人人讲安全、个个守规程的景象已经再也看不到了。
    表面上的程序公平无法保证效率．如果像上面这个煤矿分配安全奖一样，
没有任何的公平性，叉怎么能够保证效率呢'
    实际上，这个小小的煤矿就是我们今天的社会生活的缩影。
公共资源的悲剧
我们在上面几节对于集体优化的讨论，只限于分配层面，下面我们看一
‰譬鲨盥
下博弈论中对于管理层面的分析。
    《郁离子》是明代刘基的一本寓言散文集．包括多篇具有深刻警世意义
的作品。其中有一篇讲了官船的故事。
    瓠里于到吴国拜望相国．然后返回粤地。相国派一位官员送他，并告诉
他说：“你可以乘坐官船回家。”瓠里子来到江边，放眼望去，泊在岸边的船
有一千多条，不知哪条是客船。送行的官员微微一笑，说道：“这很容易。我
们沿着岸边走，只要看到那些船篷破旧、船橹断折、船帆破烂的，就一定是
官船了。”瓠里子照此话去找．果然不错。
    这个故事中所讲的就是公共资源的悲剧。这一理论最初是由加利福尼亚
生物学家加勒特-哈丁于1968年在《科学》杂志上发表的文章《公共策略》
中提出来的，因此又被称为“哈丁悲剧”j
    在那篇文章中，哈丁首先讲了一个关于牧民与草地的故事。当草地向牧
民完全开放时，每一个牧民都想多养一头牛．因为多养一头牛增加的收人大
于其成本，明显是有利可图的。尽管因为平均草量下降，增加一头牛可能使
整个草地的牛的单位收益下降，但对于单个牧民来说，他增加一头牛是有利
的。然而，如果所有的牧民都看到这一点而增加一头牛．那么草地将被过度
放牧，从而再也不能满足牛的需要，导致所有的牛都饿死。
    哈丁以这一思路讨论了人口爆炸、污染、过度捕捞和不可再生资源的消
耗等问题．并发现了同样的情形。他指出：“在共享公有物的社会中．每个人，
也就是所有人都追求各自的最大利益。这就是悲剧的所在。每个人都披锁定
在一个迫使他在有限范围内无节制地增加牲畜的制度中。毁灭是所有人都奔
向的目的地。因为在信奉公有物自由的社会当中，每个人均追求自己的最大
利益。”
    不同情况下．公用地悲剧可能成为一个多人囚徒困境(每一个人都养了
太多的牛)：如果社会上每一个人都在追求自己的最大利益，毁灭将成为大家
不能逃脱的命运。
    哈丁的结论是，世界各地的人民必须意识到，有必要限制个人做出这些
选择的自由，接受某种“一致赞成的共同约束”。
    防止公用地悲剧的办法有两种：第一是制度上的，即建立中心化的权力
猎鹿博弈：走上集体优化之路
机构，无论这种权力机构是公共的还是私人的——私人对公用她的处置便是在
使用权力；第二便是道德约束，道德约束与非中心化的奖惩联系在一起。
    确立产权一度是经济学家最热衷的解决公用地悲剧的方案。事实上这也
是十五六世纪在英国“圈地运动”中曾经出现过的历史：土地被圈起来，变
成了当地贵族或地主手里的私有财产，主人可以收取放牧费，为使其租金收
入最大化．将减少对土地的使用。这样，那只“看不见的手”就会恰到好处
地关上大门。此举改善了整体经济效益。却同时也改变了收人的分配；放牧
费使主人更富有，使牧人更贫穷．以至于有人把这段历史控诉为“羊吃人”。
    另外，确立产权在其他场合也许并不适用：公海的产权很难在缺少一个
国际政府的前提下确定和执行，控制携带污染物的空气从一个国家飘向另一
个国家也是一个难题。基于同样的理由，捕鲸和酸雨问题都需要借助更直接
的控制才能处理，但建立一个必要的国际协议却很不容易。
    正如哈丁提到的那样，人口是一个甚至更加艰巨的难题，因为对一个人
的家庭的决定权已经由联合国人权公约和其他人权法案加以保护。
    除了确立产权即卖掉使之成为私有财产，还可以作为公共财产保留．但
准许进入，这种准许可以以多种方式来进行。
    有时候，假如集团规模足够小，自愿合作可以解决这个问题。
    若有两家石油或天然气生产商的油井钻到了同一片地下油田．两家都有
提高自己的开采速度、抢先夺取更大份额的激励。假如两家都这么做．过度
的开采实际上可能降低它们可以从这片油田收获的数量。在实践中，钻探者
意识到了这个问题，达成分享产量的扔议．使从一片油田的所有油井开采出
来的总数量保持在一个适当的水平。
    这些方案都有合理之处。也都有经不起推敲的地方。但是正如哈丁指出
的，像公共草地、人口过度增长、武器竞赛这样的困境“投有技术的解决途
径”。所谓技术的解决途径，是指“仅在自然科学中的技术的变化．而很少要
求或不要求人类价值或道德观念的转变”。
第9章
智猪博弈：多劳并不多得
我不想荒废也不想累赞。
怕的是这一切全都白费
活的疲惫活的受罪，
这个世界为什幺让我这么幕
——《累》歌词
小猪躺着大猪跑
    公元前529年，晋国在平丘召集天下诸侯，举行会盟。
    晋君为了夸耀自己作为盟主的实力，用兵车四千乘围在会场的四周．一
眼望去，车马排布整齐。旌旗摇动．仪仗鲜明。晋君端坐会场中央．看着依
次就座的各国使臣．心中禁不住暗暗得意。
    各国使臣依次坐定以后，郑国代表子产劈头就向晋君提出减少会费分摊
的问题。他说：“自古以来，缴纳给天子的献款都依照爵位的等级而定．只有
京畿地区的诸侯必须缴纳超出等级以上的献款。我们郑侯的等级是伯男．却
和您一样，负担起公侯级的义务，实在太不舍理了，务必请减少献款。近年
来，诸侯息兵．致力于修睦邦交，每月都有使团往来交流，光是这些费用就
不少，又要分摊这么重的会费．像我们这般小国实在负担不起。举行会盟的
目的，无非是为了维持小国的生存，会费的负担若使小国灭亡，岂不是有违
会盟的宗旨吗?务请慎重考虑。”
智猪博弈：多劳并不多得
    这样的理由提得有理有据，确实也反映了当时郑国权利与义务不相符的
现实。但是晋国担心其他小国也会提出同样的要求，因此一口拒绝。
    然而·子产作为一名出色的外交家．惯用死缠烂打的交涉手法。他与晋国大
夫从中午一直争论到傍晚．仍然僵持不下，时间都被花在这桩议案上面，而会盟
的主旨却还根本没有接触c最后晋君没办法．只好接受了子产的这项要求
    在上面的故事中．子产用来说明郏国要减少献款的理由就是：郑侯的等
级是伯男·却按公侯的级别承担义务．这是不合适的其实他在这里所运用
的理论·用现代人的眼光来看．是一种可以称为“智猪博奔’’的博弈策略
    假|殳猪圈里有两头猪同在一个食槽里进食，一头大猪．一头小猪。我们
假设它们都是有着认识和实现自身利益的充分理性的“智猪”，猪圈两头距离
很远·一头安装了一只控制饲料供应的踏板．另一头是饲料的出口和食槽。
绪每踩一下踏板．另一头就会有相当于10份的饲料进槽．但是踩踏板以及跑
到食槽所需要付出的“劳动”，加起来要消耗相当于2份的饲料。
    两头猪可以选择的策略有两个：自己去踩踏板或等待另一头猪去踩踏板：
如果某一头猪做出自己去踩踏板的选择．不仅要付出劳动，消耗掉2份饲料．
而且由于踏板远离饲料，它将比另一头猪后到食槽．从而减少吃到饲料的数
量。我们假定：若大猪先到(即小猪踩踏板)，大猪将吃到9份的饲料．小猪
只能吃到1份的饲料，最后双方得益为[9．一l】；若小猪先到(即大猪踩踏板J．
大猪和小猪将分别吃到6份和4份的饲料。最后双方得益为f4．4 J；若两头猪
I司时踩踏板，同时跑向食槽，大猪吃到7份的饲料，小猪吃到3份的饲料．
即双方得益为[5，11；若两头猪都选择等待．那就都吃不到饲料，即双方得益
均为0，
    智猪博弈的收益矩阵可以用表9-1所示、表9一l中的数字表示不同选择下
每头猪所能吃到的饲料数量减去前去踩踏板的成本之后的净收益水平。
表9-1
智猪博弈的收益矩阵
、，』    博彝论的
诡计
    那么这个博弈的均衡解是什么呢?这个博弈的均衡解是大猪选择接按
钮．小猪选择等待．这时，大猪和小猪的净收益水平均为4个单位。这是一
个“多劳不多得，少劳不少得”的均衡。
    在找出上述智猪博弈的均衡解时，我们实际上是按照“重复剔除严格劣
策略”的逻辑思路进行的。这一思路可以归纳如下：首先找出某参与人的严
格劣策略，将它刹除，重新构造一个不包括已剔除策略的新博弈；然后，继
续剔除这个新的博弈中某一参与人的严格劣策略；重复进行这一过程，直到
剩下唯一的策略组合为止。剩下这个唯一的策略组合，就是这个博弈的均衡
解，称为“重复剔除的占有莆略均衡”。
    在智猪博弈收益矩阵中可以看出：小猪踩踏板其能得到l份甚至损失1
份．不踩踏板反而能得到4份。对小猪而言，无论大猪是否踩动踏板，小猪
采取“搭便车”策略，也就是舒舒服服地等在食槽边，都是最好的选择。
    由于小猪有“等待”这个优势策略，大猪只剩下了两个选择：等待就吃
不到；踩踏板得到4份。所以“等待”就变成了大猪的劣势策略，当大猪知
道小猪是不会去踩动踏板的．自己亲自去踩踏板总比不踩强，只好为自己的4
份饲料不知疲倦地奔忙于踏板和食槽之间。
    也就是说，无论大猪选择什么策略，选择踩踏板对小猪都是一个严格劣策
略，我们首先加以剔除。在剔除小猪踩踏板这一选择后的新博弈中．小猪只有
等待一个选择．而大猪则有两个可供选择的策略。在大猪这两个可供选择的策
略中．选择等待是一个严格劣策略．我们再剔除新博奔中大猪的严格劣策略
等待。剩下的新博弈中只有小猪等待、大猪踩踏板这一个可供选择的策略，
这就是智猪博奔的最后均衡解，达到重复剔除的优势策略均衡。
    智猪博弈与囚徒困境的不同之处在于：囚徒困境中的犯罪嫩疑人都有自
己的严格优势策略；而智猪博弈中，只有小猪有严格优势策略，而大猪没有。
    在一场博弈中，如果每个参与人都有严格优势策略。那么严格优势策略
均衡是合乎逻辑的。但是在绝大多数博弈中。这种严格优势策喀均衡并不存
在。而只存在重复剔除的优势策略均衡。所以，智猪博弈听起来似乎有些滑
稽，但是它却是一个根据优势策略的逻辑找出均衡的博弈模型。
    智猪博弈模型可以用来解释为什么占有更多资源者．比如本章开头的故
智猪博弈：多劳井不多得
事中的晋国，必须承担更多的义务。这样的现象在当代国际和国内政治生活
中都十分普遍。
比比皆是的智猪
    欧佩克的一个重要特点是其成员的生产能力各不相同，特别是沙特阿拉
伯的生产能力远远超出其他成员。同属一个联盟组织的大成员和小成员，它
们的作弊激励是不是一样大?
    为了简化这个问题，我们只看一个小成员．即科威特。假定在合作的情
况下．科威特应该每天生产100万桶石油，沙特阿拉伯则生产400万桶。对
于它们两家，作弊意味着每天多生产100万桶。换言之，科威特的两种选择
分别是100万桶和200万桶；沙特阿拉伯则为400万桶和500万桶。
    基于双方的不同选择。投人市场的总产量可能是500万桶、600万桶或
‘100万桶。假定相应的边际利润(每桶价格减去每桶生产成本)分别为16元、
12元和8元。由此得出下面的利润图(如图9．1所示)。每一个格子里．左下
方的数字是沙特阿拉伯的利润，右上方的数字是科威特的利润。
    科威特的产量(万桶，天)
    100    200
蛐
牝
蛊
g
蛾
宦
蜚
鼎
    朋9-l沙特阿拉伯与科威特的利润(单位：万美元，夭)
    通过分析，我们知道科威特有一个优势策珞：作弊．每天生产200万桶。
沙特阿拉伯也有一个优势策略：遵守合作协议。每天生产400万桶。沙特阿
拉伯一定遵守协议，哪怕科威特作弊也一样。
9I
一橄、幂k一
障彝论的蘑舻
    囚徒困境就此破解：沙特阿拉伯出于纯粹的自利心理，有一种合作的激
励。假如它生产一个较低数量．则市场价格攀升，欧佩克全体成员的边际利
润上扬。假如它的产量只占欧佩克总产量一个很小的份额，它自然不会发现，
原来向整个联盟提供这种“公共服务”对自己也有好处。不过．假如它占的
份额很大，那么，上扬的边际利润会有很大一部分落在它自己手里．因此牺
牲一些产量也是值得的。
    这个例子描述了走出囚徒困境的另一个途径：找出一个“大慈善家”，让
它遵守合作协议，并容忍其他人作弊。在许多国家内部，一个大政党和一个
或多个小政党必须组成一个联合政府。大政党一般愿意扮演负责合作的一方，
委曲求全，确保联盟不会瓦解；而小政党则坚持它们自己的特殊要求，选择
通常可能偏向极端的道路。
    在国际生活中．正如亨利·基辛格在《大外交》中所指出的：几乎是某
种自然定律，每一世纪似乎总会出现一个有实力、有意志且有知识与道德动
力，希图根据其本身的价值观来塑造整个国际体系的国家。而这样的国家，
也就责无旁贷地担当起国际事务中的“大猪”角色。例如，从17世纪到18
世纪，“大猪”的位置先后由法国和英国占据。到了19世纪，梅特涅领导下
的奥地利则重新建构了“欧洲协调”，但是这种主导地位不久叉让给了俾斯麦
主政下的德国。到了20世纪，最能左右国际关系的国家则非美国莫属。再没
有任何一个国家能够像美国一样，如此一厢情愿地认定自己负有在全球推广
其价值观的责任，因而也没有任何国家比美国对海外事务的介入达到如此高
的程度，并且在防务联盟开支中如此自愿地承担一个不恰当比例的份额，大
大便宜了西欧和日本。美国经济学家曼库尔-奥尔森将这一现象称为“小国
对大国的剥削”。
    在社会生活的其他领域也是如此。在一个股份公司当中，股东都承担着
监督经理的职能，但是大小股东从监督中获得的收益大小不一样。在监督成
本相同的情况下，大股东从监督中获得的收益明显大于小股东。因此，小股
东往往不会像大股东那样去监督经理人员，而大股东也明确无误地知道不监
督是小股东的优势策略，知道小股东要搭大股东舶便车，但是别无选择。大
股东选择监督经理的责任、独自承担监督成本，是在小股东占优选择的前提
1120
《‰
智猪博奔：多劳并不多得
下必须选择的最优策略。这样一来．与智猪博弈一样，从每股的净收益(每
股收益减去每股分担的监督成本)来看，小股东要大于大股东。
    这样的客观事实就为那些“小猪”提供了一个十分有用的成长方式．那
就是“借”。有一句话叫做“业成气候人成才”。仅仅依靠自身的力量而不借
助外界的力量．一个人很难成就一番大事业。在市场营销中更是也是如此。
每一位营销者要想发展，都必须学会利用市场上已经存在的舞台和力量。只
有具备更高的精神境界，才能借助外界力量，把自己托上广阔的天空。
    兵法《三十六计》中有计为：“树上开花．借局布势，力小势大。鸿渐于
陆，其羽可用为仪也。”这是指利用别人的优势造成有利于自己的局面，虽然
兵力不大，却能发挥极大的威力。大雁高飞横空列阵，全凭大家的长翼助长
气势。
    在商业运作中借用他人力量的前提，是自己有主导产品。只是在自己的
发展过程中力量不足时，才借“大猪”的活动来壮大自己的实力，扩大自己
的市场份额。
    20世纪50年代末期，美国的佛雷化妆品公司几乎独占了黑人化妆品市场。
尽管有许多同类厂家与之竞争，却无法动摇其精主的地位。这家公司有一名
供销员名叫乔治·约翰逊，他邀集了三个伙伴自立门户经营黑人化妆品。伙
伴们对这样的实力表示怀疑，因为很多比他们实力更强的公司都已经在竞争
中败下阵来。约翰逊解释说：“我们只要能从佛雷公司分得一杯羹就能受用不
尽了啦!所以在某种程度上．佛雷公司越发达．对我们越有利!”
    约翰逊果然不负伙伴们的信任，当化妆品生产出来后，他就在广告宣传
中用了经过深思熟虑的一句话：“黑人兄弟姐妹们!当你用过佛雷公司的产品
化妆之后，再攘上一次约翰逊的粉质膏．将会收到意想不到的效果!”这则广
告用语确有其奇特之处，它不像一般的广告那样尽力贬低别人来抬高自己；
而是貌似推崇佛雷的产品，其实质是来推销约翰逊的产品。
    借着名牌产品这只“大猪”替新产品开拓市场的方法果然灵验。通过将
自己的化妆品同佛雷公司的畅销化妆品排在一起．消费者自然而然地接受了
约翰逊粉质膏。接着这只“小猪”进一步扩大业务，生产出一系列新产品。
经过几年努力，终于成了黑人化妆品市场的新霸主。
V√ *#
葩静
猪圈里的跟随策略
    在《孙子兵法·军争篇》中，有一段十分精辟的论述：“凡先处战地而待
敌者佚，后处战地而趋战者劳。故善战者．致人而不致于人。”然而，先一步
下手固然可以获得一定的优势，但是如果不能把这种优势转化为最后胜利的
推动力．那么反而会陷人被动，给对方造成机会。两个拳师捉对厮杀的时候，
一个往往退让一步，而另一个则气势汹汹，一上来就使出全副本领。那么决
定最终胜利的，却往往是策略地保存自身实力的一方。
    我们看一下智猪博弈就能明白这一点，小猪的优势策略就是坐等大猪去
踩踏板，然后从中受益。换句话说．小猪在这个博弈中具有后动优势．大猪
不踩踏板，小猪的损失不会更多。大猪不踩．双方都没得吃；大猪踩踏板．
小猪可以多吃。
    不过在现实中．选择后发策略的未必就是实力较弱的小猪。《水浒传》中
有一段描述，在柴进家中洪教头要与林冲较量，他使出毕生功夫，大叫着向
林冲进攻。林冲退后几步，看准洪教头的破绽．飞快地一脚踢上去．立时把
洪教头踢翻在地。
    这是对后发制人生动而传神的描写，这其实也正是基于实际情况对博弈
智慧的运用。下面我们用生活中的一个案例来说明这一点。
    《策略思维》的作者之一巴里毕业的时候．参加了剑桥大学的五月舞会
(大学正式舞会)。活动的一部分包括在一个赌场下注。每人都得到相当于20
元的筹码，截至舞会结束之时，收获最大的一位将免费获得下一年度舞会的
人场券。到了准备最后一轮轮盘赌的时候，纯粹是出丁一个巧合，巴里手里
已经有了相当于‘700元的筹码．独占鳌头。第二位是一名拥有：300元筹码的
女生．其他参加者已经被淘汰出局。就在最后一次下注之前，那个女生提出
分享下一年舞会的入场券，但是巴里拒绝了。他占有那么大的优势，怎么可
能满足于得到一半的战果呢'
    为了帮助大家更好地理解接下去的策略行动，我们先来简单介绍一下轮
盘赌的规则。轮盘赌的输赢取决于轮盘停止转动时小球落在什么地方。轮盘
1122
智猪博弈：多劳井不多得
上一般刻有0～36共37个格子。假如小球落在0处．就算庄家赢了。轮盘赌
最常见的玩法就是赌小球落在偶数还是奇数格子(分别用黑色和红色表示)。
这种玩法的赔率是一赔一，比如一元赌注变成两元，不过取胜的机会只有
18／37。在这种情况下，即便那名女生把全部筹码押中，也不可能稳操胜券；
因此，她被迫选择一种风险更大的玩法。她把全部筹码押在小球落在3的倍
数上。这种玩法的赔率是二赔一(假如她赢了，她的300元就会变成900元)．
但取胜的机会只有12137。现在，她的筹码摆上桌面，表示她已经下注．不能
反悔。
    那么，巴里应该怎么办?巴里应该模仿那名女生的做法，同样把300元
筹码押在小球落在3的倍数上。这么做可以确保他领先对方400元．最终赢
得那张入场券：假如他们都输了这一轮．巴里将以400：O取胜；假如他们都
赢了，巴里将以1300：900取胜。那名女生根本没有其他机会。即使她不赌
这一轮，她还是会输，因为巴里会和她一样退出这一轮．照样取胜。
    她的唯一希望在于巴里先赌。假如巴里先在黑色下注300元．她应该
怎么做?她应该把她的300元押在红色。把她的筹码押在黑色对她没有半点
好处，因为只有巴里取胜，她才能取胜(而她将是亚军，只有600元．排
在巴里的1000元后面)。自己取胜而巴里失败(她将取得600元，而巴里只
剩下·400元)就是她唯一的反败为胜的希望所在，这就意味着她应该在红色
下注。
    在这个关于轮盘赌的故事里，先行者处于不利地位。由于那名女生先下
注，巴里可以选择一个确保胜利的策略。假如巴里先下注，那名女生就可以
选择一个具有同样取胜机会的赌注。
    如果有一个优势策略．无论你的对手选择怎么做．休按照这个策略做都
比采用其他策略更好。若是相继行动．而你的对手先行，你就应该一直选择
自己的优势策略。正如我们已经说过的那样．这是你对对手每一个行动的最
佳对策，因此也是对现在他选择的这个特定行动的最佳对策。
    在博弈游戏里，抢占先机、率先出手并不总是好事。因为这么做虽然可
能有机会影响其他参与者的行动，但却会暴露你的行动，对手可以观察你
的选择，同时做出自己的决定．并努力利用这一点占你的便宜。同时，你
∞I
博弈论的塘舻
却无法知道对手将会采取什么行动。第二个出手可能使你处于更有利的策略
地位。
    在经典战争理论方面．《三十六计》中的以逸待劳、减灶诱敌、欲擒故纵、
开门揖盗、假痴不癫都是后发制人。
    清代名臣曾国藩认为．战争双方所处的地位，如强弱、胜负、攻守、主
客等，在一定条件下，是可以向对立面转化的。他尤为注意主客关系的变化．
常对部下说：“凡扑人之墙．扑人之壕，扑者客也，应者主也。敌人攻我壕墙。
我若越壕而应之，则是反主为客，所谓致于人者也。我不越壕．则我常为主，
所谓致人而不致于人者也。”
    为防止反主为客而达到反客为主的目的，曾国藩主张以静制动，后发制
人。临阵则按兵不动，诱敌先发；攻城则挖筑双层壕墙以围之。“蓄养锐气先
备外援，以待内之自敝”。这样，曾国藩往往变被动为主动，变不利为有利．
最后取得胜利。
    历史上后发制人的事例极多，毛泽东在“中国革命战争的战咯问题”一
文中举了楚汉成皋之战、新汉昆阳之战、袁曹官渡之战、吴魏赤壁之战、吴
蜀彝陵之战、秦晋淝水之战等有名的战例。
    总之．在实际的博弈中，既有先动优势策略，也有后动优势策略。由于
双方情况千变万化，弱势一方如果墨守成规，只能使自己坐失良机。因此。
真正的博弈高手绝对是捕捉时机的高手，会根据参与者各方具体情形的变化
而灵活地选择先动还是后动。
后发制人的策略
    战国时，齐国将军田忌经常与齐王以及诸公子赛马，并设重金为赌注。
孙膑发现他们的马脚力都差不太多，可分为上、中、下三等。于是，孙膑对
田忌说：“您只管下大赌注，我能让您取胜。”田忌答应了他，与齐王以千金
作为赌注来赛马。比赛即将开始，孙膑说：“现在用您的下等马对付他的上等
马，拿您的上等马对付他的中等马，拿您的中等马对付他的下等马。”田忌于
是按孙膑的话去做．在平均劣势下赢得千金赌资。
r
《弑
智猪博弈：多劳并不多得
    齐王为什么会在占优势的情况下输掉比赛?
    关键在于第一场，也就是齐王轻松获胜的那一场。在这场比赛中，齐王
虽然取得了胜利，但是却为此付出了巨大的成本——上等马与下等马的实力差
距被白白浪费掉了，并直接导致输掉了后面两场。
    “田忌赛马”的故事，用现代术语来说就是一个典型的博弈问题。实际
上是通过增加对方的成本改变双方的实力对比．并最终取得胜利。它告诉我
们一个重要的原则：在一次行动中，我们为前面的成功支付的成本越大．后
面的局势就越不利。
    围棋上也有类似技巧，任何好的棋手都不希望把棋“走重”，因为这样不
但效率低．而且包袱沉重，一块重棋在遭到攻击时是很难办的：苦苦求活吧．
难免受到对手的百般盘剥；可干脆放弃叉损失太大。所以这种棋往往被称为
“愚形”。真正的高手是一定尽量避免的。
    因此，我们在对任何工作进行决策之前，必须经过一定的“成本估算”：
如果先出招得大于失，就值得运用先发制人；如果得失相抵、甚至得不偿失。
就不要干这种“吃力不讨好”的事了。
    这里面的成本，不仅包括实际付出的代价，而且包括因为率先出手而被
对手所观察到的信息，这也是一种无形的损失。
什么时候应该出手
    1983年美洲杯帆船赛决赛前4轮结束之后．美国队丹尼斯·康纳船长的
“自由号”在这项共有7轮比赛的重要赛事当中，以3胜l负的成绩排在首
位。
    那天早上，第5轮比赛即将开始．整箱整箱的香槟送到“自由号”的甲
板。而在观礼船上，船员们的妻子全都穿着美国国旗红、白、蓝三色的背心
和短裤．迫不及待要在她们的丈夫夺取美国人失落132年之久的奖杯之后参
加合影。
    比赛一开始，由于澳大利亚队的“澳大利亚二号”抢在发令枪响之前起
步，不得不退回到起点线后再次起步，这使“自由号”还获得了37秒的优势。
z5 I
、，．√ 博奔论的
诡计
澳大利亚队的船长约翰-伯特兰打算转到赛道左边，他希望风向发生变化，
可以帮助他们赶上去。而丹尼斯·康纳则决定将“自由号”留在赛道右边。
    没想到这一回伯特兰大胆押宝押对了，因为风向果然按照澳大利亚人的
心愿偏转，“澳大利亚二号”以1分47秒的巨大优势赢得这轮比赛。人们纷
纷批评康纳，说他策略失败．没有跟随澳大利亚队调整航向。再赛两轮之后．
“澳大利亚二号”赢得了决赛桂冠。
    这次帆船比赛成为研究“跟随”策略的一个很有意思的反例。
    成绩领先的帆船，通常都会照搬尾随船只的策略，一旦遇到尾随的船只
改变航向。甚至于采用一种显然非常低劣的策略时，成绩颁先的船只也会照
样模仿。
    为什么?因为帆船比赛与在舞厅里跳舞不同。在这里，成绩接近是没有
用的，只有最后胜出才有意义。假如你成绩领先了，那么，维持领先地位的
最可靠的办法就是看见别人怎么做，你就跟着怎么做。但是如果你的成绩落
后了，那么就很有必要冒险一击。
    股市分析员和经济预测员也会受这种跟随策略的感染。业绩领先的预测
员总是想方设法随大流．制造出一个跟其他人差不多的预测结果。这么一来．
大家就不容易改变对这些预测员的能力的看法。另一方面，初出茅庐者则会
采取一种冒险的策略：他们喜欢预言市场会出现繁荣或崩溃。通常他们都会
说错，以后再也没人听信他们。不过，偶尔也会做出正确的预测，一夜成名，
跻身名家行列。
    产业和技术竞争提供了进一步的证据。技术竞赛就跟在帆船比赛中差不
多。追踪而来的新公司总是倾向于采用更加具有创新性的策略，而龙头老大
们则反过来愿意模仿跟在自己后面的公司。
    在个人电脑市场，IBM的创新能力远不如其将标准化的技术批量生产、
推向大众市场的本事那么闻名。新概念更多是来自苹果电脑、太阳电脑和其
他新近创立的公司。冒险创新是这些公司脱颖而出夺取市场份额的最佳策略．
大约也是唯一途径。这一点不仅在高科技产品领域成立。宝洁作为尿布行业
的IBM，也会模仿金佰利发明的可再贴尿布粘台带，以稳固自己的市场统治
地位。
1126
智猪博弈：多劳并不多得
    跟在别人后面第二个出手有两种办法：一是一旦看出别人的策略，你立
即模仿，好比帆船比赛的情形；二是再等一等．直到这个策略被证明成功或
者失败之后再行动，好比电脑产业的情形。而在商界，等得越久越有利，这
是因为商界与体育比赛不同，这里的竞争通常不会出现赢者通吃的局面。结
果是．市场上的领头羊们只有对新生企业选择的航向同样充满信心时．才会
跟随后者的步伐。
汽车在哪扇门后面
    在一个游戏节目里，主持人把标有1、2、3的三道门指给你，而且明确告
诉你．其中两扇门背后是山羊．另一扇门后则有名牌轿车，你要从三个门里
选择一个，并可以获得所选门后的奖品。当然你希望自己选中的是汽车而非
山羊。既然是三选一，很清楚．你选中汽车的机会就是1，3。
    在没有任何信息帮助的情况下，你选了一个(比如1号门)，这没有对或
不对．完全是运气问题。但主持人并授有立刻打开l号门，而是打开了3号
门，门后出现的是一只羊。这时，主持人问你是否要改变主意选2号门，现
在休就面l临一个决策问题了：改还是不改。
    这个问题是美国专栏作家赛凡特女士在一篇文章中提出来的。她的思路
大致如下：如果你选了1号门．你就有l，3的机会获得一辆轿车，但也有2，3
的机会，车子是在另外两扇门后。接着好心的主持人让你确定车子确实不在3
号门后．不过l号门有车子的几率还是维持不变．而2号门后有车子的几率变
成2，3。实际上，3号门的几率转移到了2号门上，所以你当然应该改选。
    赛凡特的游戏引来数以千计的读者来信，多半是认为她的推论是错的，
主张l、2号门应该有相同的几率，理由你已经把选择变成2选1．也不知道
哪扇门背后有车．因此几率应该跟丢掷铜板一样。
    有趣的是．赛凡特又发现了一个有趣的现象：一般大众的来信里．有90％
认为她是错的；而从大学寄来的信里，只有60％反对她的意见。在后续的发
展里，一些统计博士加人讨论．且多半认为几率应该是l，2。赛凡特很惊讶这
个问题所引发的热潮及反对声浪．不过她仍坚持己见。
27 I
赢‰翟翟拦
    统计学家从过去到今天一直都在寻求上述问题的答案。其实再简单不
过．每个人都可以理解．也可以亲自验证。在此可以模拟一下：用3张盖
起来的牌当做门，一张A．两张鬼牌，分别当作车子和山羊．连续玩十几
次看看。
    你很快就可以发现换牌是比较有利的，就和赛凡特说的一样。那为什么
这些专家还争吵不休，究竟在3号门出现山羊后，l、2号门的几率为什么没
有变成相等'或者是不是所有游戏者都有某些未言明的假设，即使用扑克牌
模拟也是如此?
    一个公平游戏，所以初始几率每个门都是l，3，到目前为止都没问题。
    现在你选了l号门，到这儿也没有什么问题．因为你一无所知，所以猜对
的几率是l／3。
    关键郭分到了，因为主持人打开了3号门，而没有解释他为什么要开3
号门。这里有几种可能性。
    主持人可能只想玩玩票，只要游戏者选1号．他就一定开3号门，不管3
号门后是不是车，如果刚好出现羊．那运气不错；如果是车。那么游戏就告
一段落，游戏者就输了。如果主持人真是这么想．那么3号门后不是车．对
你来说确实是一项新资讯，这时车子出现的可能就是1号或2号门其中之一，
两者间没有特别偏好。主持人并没有给你换门的好理由，也没有提供让你维
持原案的原因。
    多数赛凡特的反对者都相信在这样的情形下，几率是均等的，却全然不
知他们已经对主持人的策略做了假设。
    不过，如果主持人自有另一套规则．他心里知道绝不能打开有车子的那
扇门，因为这会破坏现场的悬疑气氛。提早结束游戏，使观众失去兴趣。以
娱乐大众为己任的主持人．吸引观众应该是其坚定的追求目标。
    因此，如果主持人的策略是绝对不去开有车的那扇门，那么如果你一开
始就选对了，他就可以随便开2号门或3号门；如果你一开始就选错了，那
么他就会开没有车子的那扇门。因此无论如何，他开的那扇门后一定是头山
羊，所以不会有任何新信息。
1128
赢‰翟翟拦
    统计学家从过去到今天一直都在寻求上述问题的答案。其实再简单不
过．每个人都可以理解．也可以亲自验证。在此可以模拟一下：用3张盖
起来的牌当做门，一张A．两张鬼牌，分别当作车子和山羊．连续玩十几
次看看。
    你很快就可以发现换牌是比较有利的，就和赛凡特说的一样。那为什么
这些专家还争吵不休，究竟在3号门出现山羊后，l、2号门的几率为什么没
有变成相等'或者是不是所有游戏者都有某些未言明的假设，即使用扑克牌
模拟也是如此?
    一个公平游戏，所以初始几率每个门都是l，3，到目前为止都没问题。
    现在你选了l号门，到这儿也没有什么问题．因为你一无所知，所以猜对
的几率是l／3。
    关键郭分到了，因为主持人打开了3号门，而没有解释他为什么要开3
号门。这里有几种可能性。
    主持人可能只想玩玩票，只要游戏者选1号．他就一定开3号门，不管3
号门后是不是车，如果刚好出现羊．那运气不错；如果是车。那么游戏就告
一段落，游戏者就输了。如果主持人真是这么想．那么3号门后不是车．对
你来说确实是一项新资讯，这时车子出现的可能就是1号或2号门其中之一，
两者间没有特别偏好。主持人并没有给你换门的好理由，也没有提供让你维
持原案的原因。
    多数赛凡特的反对者都相信在这样的情形下，几率是均等的，却全然不
知他们已经对主持人的策略做了假设。
    不过，如果主持人自有另一套规则．他心里知道绝不能打开有车子的那
扇门，因为这会破坏现场的悬疑气氛。提早结束游戏，使观众失去兴趣。以
娱乐大众为己任的主持人．吸引观众应该是其坚定的追求目标。
    因此，如果主持人的策略是绝对不去开有车的那扇门，那么如果你一开
始就选对了，他就可以随便开2号门或3号门；如果你一开始就选错了，那
么他就会开没有车子的那扇门。因此无论如何，他开的那扇门后一定是头山
羊，所以不会有任何新信息。
1128
    在这样的情况下，不管车子在哪里．他的举动都不会影响最初的选择．
也就是l号门的几率。如果车子不在l号门后．那么他开的门等于是告诉你大
奖的所在，因此2号门有2／3的机会，你第一次选1号门就选错了．他等于已
经告诉你应该选哪一扇门。如果这是主持人的策略，那么有机会就赶快换，
名车将属于你。虽然换选未必保证你一定会获胜，因为你仍有们的概率在第
一次选择时就选对了，不过换选还是使获胜机会加倍了。
    因为对主持人心理所做的假设不同。因此争论双方都有可能是对的。假
设主持人开门是随机的．车子叉不在他开启的那扇门的后面．那么几率就真
的各有50％。假设他早就决定在这个阶段绝不去开有车的那扇门．那么他让
你先看3号门后是什么的同时，你就应该利用这项信息而换选。
    当自己在对局中处于不利地位时，冒更大的风险去换牌是比较有利的。
而当自己处于有利地位时，采取保守策略，跟着对方出牌则是明智的。
冒险策略越早越好
    公元前204年，楚军和汉军大战于彭城，刘邦大败而退。刘邦于是派说
客隋何前往九江．让九江王英布发兵背叛楚国，牵制项羽。
    英布据有九江(郡治寿春．今安徽寿县)、庐江(郡治舒县，今安徽庐江
西南)二郡，具有相当实力。隋何通过一番游说终于使英布同意帮助刘邦，
但他只是暗中答应叛楚归汉，不敢泄漏风声。
    这时，项羽的使者也来到九江．急催英布发兵援救楚军，在传舍中与英
布会见。隋何听说后直接闯入传舍，坐到楚使者的上座，说：“九江王已归附
汉王，楚王凭什么让他发兵?”在座的英布十分愕然，楚使者更是大吃一惊，
起身准备离开。隋何拔剑上前，刺杀了他，回头劝说英布：“大王归汉已成事
实，请尽快与汉军联手。”英布只得听从了隋何的话，起兵攻楚。
    在当时楚强汉弱的形势下，隋何与楚使者都来到英布的地盘上．二者的
优劣地位是一目了然的。隋何深知．如果凭口舌与之相辩．最多只能暂时稳
住英布，与楚使者打一个平手。这样做尽管没有太大风险。但是要获胜也必
然要进行更为艰苦的努力。而以迅雷不及掩耳之势将楚使者杀掉，虽然冒着
1150
智猪博弈：多劳并不多得
触怒英布的危险．但是却断绝了英布的退路。这样做如果成功，就船彻底保
证自己的任务成功．也保障自己韵人身安全。
    从这个故事中可总结出的结论在于：假如不得不冒一点风险，通常都是
越早冒险越好。
    这一点在网球选手看来再明显不过了：人人都知道应凌在第一发球的时
候冒风险。第二发球则必须谨慎。这么一来．如果第一发成功，那么你就可
以一举领先；就算第一发失误，比赛也不会就此结束，你仍然有时问考虑选
择其他策略。
    下面我们再举一个橄榄球的例子来说明。
    美式橄榄球职业比赛的赛况十分复杂，但基本规则并不难理解。每支队
伍由}1人组成，控球的一支叫做进攻方，他们力图通过传球或带球跑到对方阵
地最后端的极阵得分。另一支队伍叫做防守方。他们力图阻止进攻方的进攻并
夺取控球权。如果一方得分了或丧失了控球权则攻防转换(进攻方变成防守方，
防守方变成进攻方)。如此反复，直到比赛的4节全部赛完。得分最多的队获胜。
这是一种激烈对抗的比赛．进攻一浪接一浪．每次进攻之间稍有间歇．好让进
攻队决定下一步采取何种策略。在橄榄球比赛中力量是必要的．但也同样需要
智慧、敏捷和技巧。
    在1984年的橄榄球场决赛上，战无不胜的内布拉斯加打谷者队与曾有一
次败绩的迈阿密旋风队狭路相逢。因为前者晋身决赛的战绩高出一筹，只要
打平，它就能以第一的排名结束整个赛季。
    不过，在第4节，内布拉斯加打谷者队以17：3l落后。接着他们发动了
一次反击，成功触底得分，将比分追至23：31。这时．内布拉斯加队的教练
汤姆·奥斯本面临一个重大的策略抉择：他可以选择带球奥破或将球传到底
线区．再得2分；也可以选择一种不那么冒险的策略，将球直接甥过球门柱
之间．再得1分。
    奥斯本选择了更保险的第二种策略，内布拉斯加队成功射门得分，比分
改写为24：31。该队继续全力反击。在比赛最后阶段，他们最后一次触底得
分。比分变成30：31。只要再得1分，该队就能战平对手而取得冠军头衔。
不过，这样取胜总不大过瘾。为了潭亮地拿下冠军，奥斯本认为应该在本场
博彝论的薄舻
比赛战胜对手，他决定要用得2分的策略取胜。但队员欧文·弗赖尔接到球，
却没能得分。迈阿密队与内布拉斯加队以同样的胜负战绩结柬全年比赛。而
由于迈阿密队击败内布拉斯加队，最终获得冠军。
    假设你自己处于奥斯本教练的位置．你能不能做得比他更好?
    许多橄榄球砰论文章纷纷指责奥斯本贸然求胜．而没有稳妥求和。不过．
这不是真正的核心问题。核心问题在于，在奥斯本甘愿冒更大的风险求胜的
前提下．他选错了次序。他本来应该先尝试得2分的策略．然后．假如成功
了，再尝试得1分的策略。假如不成功，还可以尝试得2分的策略。
    为什么要先开始得2分的策略呢?
    在落后14分的时候，奥斯本知道他至少还耍得到两个触底得分外加3分。
他决定先尝试得1分的策略，再尝试得2分的策略。假如两次都成功了，那
么先后次序则无关紧要。假如得1分的策略失败．而得2分的策略成功．先
后次序仍然无关紧要．比赛还是以平局告终，内布拉斯加队赢得冠军。
    先后次序影响战局的唯一基础，在于内布拉斯加队尝试得2分的策略投
有成功。在这种情况下．假如实施奥斯本的计划．这将导致输掉决赛以及冠
军锦标。相反，假如他们先尝试得2分的策略，那么即便尝试失败，他们仍
然未必输掉比赛。他们仍然以23 31落后。等到他们下一次触底得分．比分
改为29：3l的时候，只要尝试得2分的策略得手，比赛就能打成平局，他们
就能赢得冠军头衔!
    有人反驳说，假如奥斯本先尝试得2分的策略。那么如果没有成功．他
的队将只能为打平对手而努力。但这么做不是那么鼓舞人心，并且他们很有
可能不能第二次触底得分了。
    这种看法是错误的。有几个理由!假如内布拉斯加队等到第二次触底得
分才尝试得2分的策略，一旦失败就会输掉这场比赛；假如他们第一次尝试
得2分的策略失败，却仍然有机会打平．即使这个机会可能非常渺茫，但有
还是比没有强；更重要的是，等到最后才来尝试这个已经变得生死攸关的得2
分的策略，成败将完全取决于运气。
    哀兵必胜的论点也站不住脚。这是因为，虽然内布拉斯加队的进攻可能
在冠军决赛这样重大的场合突然加强，但迈阿密队的防守也会加强。这场比
1152
智猪博弈：多劳并不多得
赛对双方是同样重要的。相反，假如奥斯本第一次触底得分之后就尝试得2
分的策略，反而能在一定程度上激励士气，使之能够提高第二次触底得分的
概率。这也使他可以通过两个三分球打平。因为风险是与收益成正比的，如
果想要冒险获得较大收益的话，那么越早进行越好。
    我们基于这个结论，可以发现一种全新的投资方式。这种包古着深刻博
弈智慧的投资方式是《住在隔壁的财神爷》一书提出的。
    传统的投资工具组合一般采用“三分法”，即将全部资金分成三部分，1／3
用来进行储蓄、保险；1，3进行股票、债券等投资；还有1／3用于房地产、
黄金、珠宝等实物投资。而被称为“100减去目前年龄”的投资法(见图9．2)
则建议，如果你现年20岁，至少应将手中资金的80％拿出来进行投资，进
行创富；而如果我们已经60岁，那么也可以拿出40％的资金买一些保险和
基金。
*
毒
■    一    一    一    曩    一    一
    Ⅻ
    图9-2 100减去年龄投资法
    20岁到30岁时，退休的日子还遥遥无期，风险承受能力是一生中最强的，
可以采用积极成长型的投资模式。按照上面的投资公式，可以将’70％一80％
的资金投人各种证券、基金等。
    30岁到50岁时，家庭成员逐渐增多．承担风险的程度需要比上一阶段相
对保守．但仍以让奉金尽速成长为目标。这一期间，可将资金的50％一60％
投在证券方面．剩下的40％投在有周定收益的投资项目。投在证券方面的资金
可分配为40％投资股票，10％购买基金，10％购买国债。投资在固定收益项目
弱I
的部分也应分散。这种投资组合的目的是保住本金之余还有赚头，也可留一
些现金供家庭日常生活之用。
    50岁到60岁时，孩子已经成年，是赚钱的高峰期，就需要将∞％资金投
于有固定收益的项且，如储蓄等，其余资金可投入到股市或汇市。此种投资
组合的目标是维持保本功能，并留些现金供退休前的不时之需。
    不仅是投资方面如此，在人生的其他方面也应学会运用这种思维方式，
来看待所面临的成败。曾经有人说。一个人起码要在感情上失恋一次，在事
业上失败一次，在选择上失误一次，才能长大。不要说失败是成功之母那样
的老话，失败来得越早越好．要是30岁、40岁之后再经历失败，有些事很可
能就已经来不及了。
对管理者的启示
    在智猪博奔的模型中，小猪踩踏板将一无所获，不踩踏板反而能吃上食
物。对小猪而言．无论大猪是否踩动踏板．不踩踏板总是好的选择。反观大
猪。已明知小猪是不会去踩动踏板的，自己亲自去踩踏板总比不踩强吧，所
以只好亲力亲为了。
    “小猪躺着大猪跑”的现象是由于游戏规则所导致的。但是在现实生活
中，这种搭便车的现象却是不尽合理的。我们撇开其他因索，仅从技术角度
去谈了小猪的等待策略。但一个群体当中，小猪未能参与竞争，小猪搭便车
时的社会资源配置井不是最佳状态。假如“小猪”的策略是对的话，那么“大
猪”就必将越来越少了。
    为使资源最有效配置，规则的设计者是不愿看见有人搭便车的。政府如
此，公司的老板也是如此。从规则制定者的角度来看，智猪博弈是一则激励
失效的典型案例。看完这个故事，几乎所有的管理者都会自然而然地提出这
样一个问题：怎样才能激励小猪和大猎去抢着踩踏板呢7
    事实上，能否尽可能杜绝“搭便车”现象．就要看游戏规则的核心指标
设置是否合适了。在智猪博弈的模型中，这种核心指标是：每次落下的食物
数量和踏板与投食口之间的距离。
智猪博奔：多劳井不多得
    如果改变一下核心指标，猪圈里还会出现同样的“小猪躺着大猪跑”的
景象吗?
    改变方案一：减量方案。投食量仅为原来的一半。结果是小猪、大猪都
不去踩踏板了。小猪去踩．大猪将会把食物吃完；大猪去踩．小猪将也会把
食物吃完。谁去踩踏板，就意味着为对方贡献食物，所以谁也不会有踩踏板
的动力了。如果目的是想让猪们去多踩踏板，这个游戏规则的设计也是失败
的。
    改变方案二：增量方案。投食量为原来的两倍。结果是小猪、大猪都会
去踝踏板。谁想吃，谁就会去踩踏板。反正对方不会一次把食物吃完。小猪
和大猪相当于生活在物质相对丰富的“共产主义”社会，都有足够的食物，
所以竞争意识都不会很强。对于游戏规则的设计者来说，这个规则的成本相
当高(每次提供双份的食物)；而且因为竞争不强烈．想让猪去多踩踏板的目
的没有达到。
    改变方案三：减量加移位方案。投食量仅为原来的一半，但同时将投食
口移到踏板附近。结果呢，小猪和大猪都在拼命地抢着踩踏板。等待者不得
食，而多劳者多得。对于游戏设计者来说，减量移位方案是一个最好的方案。
成本不高，而收获最大．可以说是一个最佳的方案。
    我们用智猪博弈来分析一下公司的激励制度设计。如果奖励力度太大，
又是持股，又是期权，公司职员个个都成了百万富翁，成本高不说，员工的
积极性并不一定很高。这相当于增量方案所描述的情形。但是如果奖励力度
不大，而且见者有份(不劳动的“小猪”也有)，一度十分努力的“大猪”也
不会有动力了——就像减量方案所描述的情形。
    最好的激励机制设计就得像改变方案三——减量加移位的办法．奖励并非
人人有份，而是直接针对个人(如业务接比例提成)，既节约了成本(对公司
而言)，又消除了“搭便车”现象，能实现有效的激励。这个办法的总体思路
就是提高“小猪”的投机成本。
    许多人并未读过“智猪博弈”的故事．但是却在自觉地使用“小猪”的
策略。股市上等待庄家抬轿的散户；等待产业市场中出现具有赢利能力的新
产品，继而大举仿制牟取暴利的游资；公司里不创造效益但分享成果的人，
5。I
等等。
    然而，世上的事不会总是这么简单。譬如股市“小猪”特别多，都想让
“大猪”来拉动股价以从中获利。而股市里的“大猪”往往却是“大鳄”．他
们“踩动踏板”的同时会设置大量的陷阱，以提高“小猪”们的游戏成本。
如此一来，又会引出许许多多的阃题．稍有不慎．大的动荡随之而来。
    除了杜绝搭便车以外，如何平衡“大猪”和“小猪”之间的利益关系．
也是需要各个领域中的专家们深入思索的问题。因此，对于制定各种经济管
理的辨戏规则的人来说，必须深谙“智猪博奔”指标改变的个中机关。
第1 O章
警察与小偷博弈：猜猜猜与换换换
每颗心都在猜猜猜
谁舍带采伟大爱情
每个人都在换换换
挨了他她他还是不行
——杜德伟《绕绕绕》歌词
从防小偷地图谈起
    据报道，2006年初．杭州市民孙海涛在该市各大知名论坛上建立了一个
电子版“防小偷地图”，点开该地图网页，只要动动鼠标，就能知道杭州哪里
最容易遭贼。这张地图问世以来，点击率迅速飙升。
    这张电子版的“防小偷地图”是一个三维的杭州方位图．上面较准确地
反映了杭州各条大街小巷及商场建筑。通过点击标注，网民们可以看到放大
的该路段，具体可以细到某一幢大楼的名称。
    除了地图上已标注的那些易被盗的地点外，网民还可以把自己知道的小
偷出没的地方．随意地进行标注。截至2006年3月被广泛报道时为止．已经
有40多人在该地图上添加新的防盗点。不仅地段标注特别详细，而且连小偷
的活动时间、作案惯用手法都列得一清二楚。
    针对网民的防盗地图。《南京晨报》的文章却问：“为何没有‘警方版防
偷图”’，按说，小偷的情况，警察了解的肯定比普通市民多，他们怎么就没
有想到设计一个防偷图呢々
    实际上，问题并没有这么简单。《时代商报》的评论就指出，警方如果公
布类似的“小偷地图”．很可能打草惊蛇。当小偷也看到地图的时候，肯定会
转移战场。这个回答指出了问题的另一个侧面，但是并不足够。要想真正把
这个问题说清楚，我们需要用到博弈论中的一个模型——警察与小偷博弈。
    某个小镇上只有一名警察，他负责整个镇舶治安。瑰在我们假定，小镇
的一头有一家酒馆，另一头有一家银行。再假定该地只有一个小偷。因为分
身乏术，警察一次只能在一个地方巡逻；而小偷也只能去一个地方。若警察
选择了小偷偷盗的地方巡逻，就能把小偷抓住；而如果小偷选择了没有警察
巡逻的地方偷盗，就能够偷窃成功。假定银行需要保护的财产价格为2万元．
酒馆的财产价格为l万元。警察怎么巡逻才能使效果最好?
    一种最容易被警察采用而且确实也更为常见的做法是．警察对银行进行
巡逻。这样，警察可以保住2万元的财产不被偷窃。但是假如小偷去了酒馆，
偷窃一定成功。这种做法是警察的最好做法吗?答案是否定的．因为我们完
全可以通过博弈论的知识，对这种策略加以改进。
    警察的一个最好的策略是，抽签决定去银行还是酒馆。因为银行的价值
是酒馆的两倍，所以用两个签代表，比如抽到l、2号签去银行，抽到3号签
去酒馆。这样警察有2，3的机会去银行进行巡逻，l，3的机会去酒馆。
    而在这种情况下，小偷的最优策略是：以同样抽签的办法决定去银行还
是去酒馆偷盗．与警察不同的是抽到1、2号签去酒馆，抽到3号签去银行。
这样小偷有v3的机会去银行，2，3的机会去酒馆。
    警察与小偷之间的博弈，提供了混合策略的思路，但更形象的样板是“剪
刀、石头、布”的游戏。在这样一个游戏中，不存在纯策略均衡。对每个小
孩来说，出“剪刀”、“布”还是“石头”的策略应当是随机的．不能让对方
知道自己的策略，甚至是策略的倾向性。一旦对方知道自己出某个策略的可
能性增大，那么在游戏中输的可能性也就增大了。因此，每个小孩的堆优策
略是采取每个策略的可能性是¨。在这样的博弈中．每个小孩各取三个策略
的l，]是纳什均衡。
有想到设计一个防偷图呢々
    实际上，问题并没有这么简单。《时代商报》的评论就指出，警方如果公
布类似的“小偷地图”．很可能打草惊蛇。当小偷也看到地图的时候，肯定会
转移战场。这个回答指出了问题的另一个侧面，但是并不足够。要想真正把
这个问题说清楚，我们需要用到博弈论中的一个模型——警察与小偷博弈。
    某个小镇上只有一名警察，他负责整个镇舶治安。瑰在我们假定，小镇
的一头有一家酒馆，另一头有一家银行。再假定该地只有一个小偷。因为分
身乏术，警察一次只能在一个地方巡逻；而小偷也只能去一个地方。若警察
选择了小偷偷盗的地方巡逻，就能把小偷抓住；而如果小偷选择了没有警察
巡逻的地方偷盗，就能够偷窃成功。假定银行需要保护的财产价格为2万元．
酒馆的财产价格为l万元。警察怎么巡逻才能使效果最好?
    一种最容易被警察采用而且确实也更为常见的做法是．警察对银行进行
巡逻。这样，警察可以保住2万元的财产不被偷窃。但是假如小偷去了酒馆，
偷窃一定成功。这种做法是警察的最好做法吗?答案是否定的．因为我们完
全可以通过博弈论的知识，对这种策略加以改进。
    警察的一个最好的策略是，抽签决定去银行还是酒馆。因为银行的价值
是酒馆的两倍，所以用两个签代表，比如抽到l、2号签去银行，抽到3号签
去酒馆。这样警察有2，3的机会去银行进行巡逻，l，3的机会去酒馆。
    而在这种情况下，小偷的最优策略是：以同样抽签的办法决定去银行还
是去酒馆偷盗．与警察不同的是抽到1、2号签去酒馆，抽到3号签去银行。
这样小偷有v3的机会去银行，2，3的机会去酒馆。
    警察与小偷之间的博弈，提供了混合策略的思路，但更形象的样板是“剪
刀、石头、布”的游戏。在这样一个游戏中，不存在纯策略均衡。对每个小
孩来说，出“剪刀”、“布”还是“石头”的策略应当是随机的．不能让对方
知道自己的策略，甚至是策略的倾向性。一旦对方知道自己出某个策略的可
能性增大，那么在游戏中输的可能性也就增大了。因此，每个小孩的堆优策
略是采取每个策略的可能性是¨。在这样的博弈中．每个小孩各取三个策略
的l，]是纳什均衡。
障弈论的雄计
    还有一种常见的混合策略样板就是猜硬币游戏。比如在足球比赛开场．
裁判将手中的硬币抛掷到空中，让双方队长猜硬币落下后朝上的是正面还是
反面。由于硬币落下地的正反是随机的，概率都是1，2。那么．猜硬币游戏的
参与者选择正反的概率都是1，2，这时博弈达到混合策略纳什均衡。
    这一类博弈与囚徒困境博弈辜例有一个很大的差别．就是投有纯策略纳
什均衡点，只有混合策略均衡点。这个均衡点下的策略选择是每个参与者的
最优(混台)策略选择。
    所谓纯策略是指参与者在他的策略空间中选取唯一确定的策略，是参与
者一次性选取并且一直坚持的策略；而混合策略是指参与者在各种备选策略
中采取随机方式选取并且可以改变，而使之满足一定的概率的策略。
    在每个参与者都有优势策略的情况下，纯策略均衡是非常合乎逻辑的。
一个优势策略优于其他任何箫略，同样。一个劣势策略则劣于其他任何策略。
假如你有一个优势策略．你可以选择采用，并且知道你的对手若是有一个优
势策略他也会照办；同样，假如休有一个劣势策略，你应该避免采用，并且
知道你的对手若是有一个劣势策略他也会规避。
    但通过警察与小偷博弈我们看到，并非所有博奔都有这样优势策略．哪
怕这个博弈只有两个参与者。实际上，纯策略只是博弈论的一种特例。特别
是当博奔是零和博弈，即一方所得是另一方的所失时，只有混合策略均衡。
对于任何一方来说，都不可能有纯粹的占优策略。
    看到这里，我们就可以明白，“警方版”的肪小偷地图．从博弈策略的角
度来考察并不是一个很好的方案。
当电话打到一半时
    在警察与小偷的博弈中，双方采取混合策略的目的是为了战胜对方。是
一种对立者之间的斗智斗勇。实际上，即便在双方打算合作的时候．往往也
会会出现混合策略博奔。
    小汪和小花是大学校园里的一对恋人，有一次电话打到一半突然断了，
两人该怎么办，假如小汪马上再给小花打电话．那么小花应该留在电话旁等
r
艇‰
警察与小偷博弈：猜猜猜与换换换
待，好把自家电话的线路空出来。可是，假如这时小汪也在等待，那么他们
的甜言蜜语就没有机会继续下去。
    一方的最佳策略取决于另一方会罘取什么行动。这里又有两个均衡，一
个是小汪打电话而小花等在一边，另一个则是小花打电话而小汪等在一边。
    这两个人需要进行一次沟通，以帮助他们确定彼此一致的策略．就应该
选择哪一个均衡达成共识。一个解决方案是，原来打电话的一方再次打电话，
而原来接电话的一方则等待电话铃响。这么做的好处是原来打电话的一方知
道另一方的电话号码，反过来却未必如此。
    另一种可能性是，假如一方可以免费打电话或者电话费用比另一方低廉，
比如小汪的电话是包月的，而小花用的是计时收费电话．那么．解决方案是
由前者负责第二次拨打电话。
    但是在更多的情况下，双方并没有上面的约定或条件，那就只有依靠投
硬币决定是不是应该拨打电话。这种随机行动的组合成为第三个均衡：假如
我打算给你打电话，我有一半机会可以打通，还有一半机会发现电话占线，
因为这时你也在给我打电话；假如我等你打电话．那么．我同样会有一半机
会接到休的电话，还有一半机会接不到你的电话，因为你也在等我的电话。
    在这些例子中，选择怎样的协定并不重要，只要大家同意遵守同一协定
即可。不过，有些时候一个协定会比另一个协定好得多。但这并不表示更好
的协定一定会被采纳。如果一个协定已经存在了很长时间，现在环境的变化
使得另一个协定更可取，这时要想改革仍然并不容易。
    对混合策略的传统解释是，局中人应用一种随机方法来决定所选择的策
略。这种解释在理论与实践中均不能令人满意。约翰-查里斯·哈萨尼(John
c Harsanyi)对此提出了更确切的解释方法。
    他认为．每一种真实的博弈形势都受到一些微小的随机波动因素影响。
在标准的博弈模型中，这些影响表现为微小的独立连续随机变量．每个局中
人的每一策略均对应一个。这些随机变量的具体数值仅为相关局中人所知，
这种知识即成为私有信息；而联合分布则是博弈者的共有信息。哈萨尼把这
称为“变动收益博弈”。
    变动收益博弈适用于不完全信息博弈理论，各随机变量的数值影响着每
博彝论的崩}舻
一个博弈者的收益。在适当的技术条件下，变动收益博弈所形成的纯策略组
合与对应无随机影响的标准博弈的混合策略组合恰好一致。实验证明．当随
机变量趋于零时，变动收益博弈的纯第略均衡点转化为对应无随机影响的标
准型博弈的混合策略均衡点。
    变动收益博弈理论提供了对混合策略均衡点具有说服力的解释：局中人
只是表面上以混合策略进行博弈，但实际上仍是在各种略为不同的博奔情形
中以纯策略进行博弈。这种解释是一个具有重大意义的概念创新，是哈萨尼
对博弈论奠定的一块基石。
    举例来说，小汪接到小花的电话，说十分钟以后在校园见面．但是不巧．
尚未说到见面地点小花的手机就没电了。任何一个地方．图书馆、餐厅、自
习室或者小树林边，只要两个人来到同一地点就行．否则男孩就等着心情糟
糕的女朋友训责吧。
    这个典型的混合策略博彝有多个纳什均衡，那么该筛选出哪一个呢?
    如果有一些均衡由于两人所共知而格外显眼，那么它是个答案：如果今
天是他们定情两周年的日子，那就到女孩子答应他求爱的小树林吧；如果役
有其他特殊情况，现在快到午饭的时候，餐厅就是不错的选择。
乱拳打死老师傅
    一位学艺归来的拳师，与老婆发生了争执。老婆摩拳擦掌．跃跃欲试。
拳师心想：“我学武已成，难道还怕你不成，”投曾想尚未摆好架势，老婆已
经张牙舞爪地冲上来．三下五除二，竞将他打得鼻青脸肿，没有还手之力。
事后别人问他：“既然学武已成．为何还败在老婆手下?”拳师说：”她不按
招式出拳．我怎么招架?”
    民间早就有“乱拳打死老师傅”的说法，意思是如果一切都授有章法，连
老师傅都无法招架呢。这里的“乱拳”，可以看做是随机混合策略的一种形象叫
法。
    有一个游戏叫做“一、二、三射击”或称“手指配对”。在这个游戏中。
其中一个选手选择“偶数”，另外一个选手则得到“奇数”。敷到三的时候，
r
警察与小偷博弈；猜猜猜与换换换
两个选手必须同时伸出一个或者两个手指。假如手指的总数是偶数．就算“偶
数”选手赢；假如手指的总数是奇数．就算“奇数”选手赢。
    那么怎样才能保证自己不被对手所赢呢’
    有人的回答是闭着眼“瞎出”。这话说对了一半，因为从博弈论的角度来
看，“瞎出”也存在着一种均衡模式．必须加以计算。
    因为只有奇、偶两种结果，整个局面是如此对称．以至于各个选手的均
衡混合策略应该都是50：50。我们这就验证一下：假如“奇数”选手出一个
指头和两个指头的机会是各一半，那么，“偶数”选手无论选择出一个还是两
个指头，平均每场游戏将会赢得O．50~1+0 50x(一1)=0元。
    因此，假如他的策略也是50：50，那么他的平均所得就是0元。同样的
证明反过来也适用。因此，50：50混合策略对彼此都是最佳选择，它们合起
来就是一个均衡。
    这一解决方案就是混合策略均衡，它反映了个人随机混合自己的策略的
必要性。
    与手指配对游戏不同，很多情况下我们不应该将不可预测性等同为输赢
机会相等，而是应该通过有计划地偏向一边而改善自己的表现．只不过这样
傲的时候应该确保对方不能预见。在警察与小偷博弈中，警察系统地偏向银
行，就是一种十分合理而且很容易理解的改善方式。但是同时，警察必须打
乱自己的巡逻目标才能降低小偷盗窃成功的概率。这么一来，他会让小偷永
远处于迷茫之中．也就没有办法获得准确预测的优势了。
    从警察和小偷的不同角度计算最佳混合策略，会得到一个有趣的共同点：
同样的成功概辜。也就是说，警察若采用自己的最佳混合策略，就能将小偷
的成功概率拉到他采用自己的最佳混合策略所能达到的成功概率。
    这并非巧合．而是两个选手的利益严格对立的所有博弈的一个共同点。
    这个结果称为“最小最大定理”．由数学家约翰·冯·诺伊曼(John Von
Neumann)刨立。这一定理指出，在二人零和博弈中。参与者的利益严格相反
(一人所得等于另一人所失)，每个参与者尽量使对手的最大收益最小化，而
他的对手则努力使自己的最小收益最大化。
    他们这样做的时候．会出现一个令人惊讶的结果．即最大收益的最小值
“I
潦‰翟邕型
(最小最大收益)等于最小收益的最大值(最大最小收益)。双方都没办法改
善自己的收益，因此这些策略形成这个博奔的一个均衡。
    最小最大定理的证明相当复杂，不过，其结论却很实用。假如你想知道
的只不过是一个选手之得或者另一个选手之失。你只要计算其中一个选手的
最佳混合策略并得出结果就行了。
    所有混合策略的均衡具有一个共同点：每个参与者并不在意自己的任何
具体策略。一旦有必要采取混合策略，找出你自己的策略的方法，就是让对
手觉得他们的任何策略对你的下一步都没有影响。
    这听上去像是朝向混沌无为的一种倒退．其实不然。因为它正好符合零
和博弈的随机化动机：一方面要发现对手任何有规则的行为，并相应采取行
动。假如他们确实倾向于采取某一种特别的行动，这只能表示他们选择了最
糟糕的策略。反过来，也要避免一切会被对方占便宜的模式，坚持自己的最
佳混合策略。
    因此．采取混合或者随机策略，并不等同于毫无策略地“瞎出”，这里面
仍然有很强的策略性。其基本要点在于，运用偶然性防止别人发现你的有规
则行为井占你的便宜。
不可预测的算计
    在传统政治中，有所谓“君臣一日而百战”的说法．来形容国君与大臣
之间博弈的激烈程度。因为激烈，所以其层出不穷的招式，给博弈论的研究
提供了丰富的案例。
    《吕氏春秋》中记载了这样一个故事。战国时，宋康王极端变态，整天
喝酒，异常暴虐。凡群臣中有来劝谏的，都被他找理由撤职或者关押起来。
臣下也因此对他更加反感，经常非议他。他十分苦恼地对宰相唐鞅说：“我处
罚的人很多了．但是大臣们越发不畏惧我，这是什么原因呢7”唐鞅说：“您
所治罪的，都是一些犯了法的人。惩罚他们，没有犯法的好人当然不会害怕。
如果您要让您的臣子们害怕，就必须不区分好人坏人，也不管他犯法没有犯
法．髓便抓住就治罪。这样的话，大臣们就知道害怕了。”
警察与小偷博弈：猜猜猜与换换换
    唐鞅提出的这个建议．虽然缺德了一些，但却不能不说是深刻地把握住
了混合策略博弈的精髓之处。能够预测的惩罚，大臣总会想方设法地加以规
避，而无法预测的惩罚，却是防不胜防的，因而也是更令人心惊胆战的。
    宋康王也是个聪明人，听了这个主意以后恍然大悟，深深地点了点头。
不久，他就下令把唐鞅杀了，大臣们果然十分害怕，每天上朝时都战战兢兢
不敢多说一句话。
    策略的随机性是博弈论早期提出的一个深谋远虑的观点。
    众所周知．一个国家每年都需要源源不断地征召到年龄的青年人伍。如
果普通平民百姓大规模拒绝应征．因为法不责众，对违法者进行处罚成了不
可能的任务。这样，如何激励到了法定年龄的青少年去登记，等待政府征召
入伍．就成为一个很需要博弈智慧的工作。
    不过，政府掌握着一个有利的条件：规矩制定权。我们不妨想像政府有
权力惩罚一个没有登记的人。那么，它怎样才能利用这一权力促使大家都去
登记呢，
    政府可以宣布它要按照百家姓的顺序追究违法者。排在第一位的每一个
姓赵的人知道，假如不去登记就会受到惩罚。惩罚的必然性已经足以促使他
乖乖登记。接下来，排在第二位的每一个姓钱的人就会认为．既然所有姓赵
的都登记了．惩罚就会落到自己身上。这么依次分析下去．那些稀有姓氏欧
阳、公孙和诸葛家的人也都会乖乖就范。
    如果一场博弈的参与者按照某种顺序排列．通常能预计到排在首位的人
会怎么做。这一信息会影响到下一个人，接下去影响到第三个人，如此沿着
整个行列一直影响到最后一个人。
    可是问题在于．人数是如此众多．在这种情况下，可以预计到会有一个
很小数目的人群出差错。政府数不到诸葛们，或许等不到政府数完前几位
姓氏，一定就有人因为没有登记而受到惩罚。于是后面的人就不必担心被迫
究了。
    真正有效的激励机制，是不要预先宣布任何顺序，而是随机抽取。好处
在于可以实施惩罚的数目完全不必接近需要激励的人群的数目。所谓杀一儆
百，惩罚1000名违法者．可以对数以百万计可能违法的人群产生阻吓作用。
拍I
0．博奔论的薄舻
    我们不妨再举一个例子。假如存在人人都知道用来确定哪一家企业将会
受到税务审计的顺序。那么在企业报税的时候，必然就会参照这个次序，看
看自己会不会受到审计。假如预计到自己符合受到审计的条件，而又能找到
一个出色的会计师“修改”报税单，使其不再符合条件以免除被审计。没有
一家企业会拒绝这样做。
    假如被审计已经无法避免．企业大概会选择如实申报。税务局的审计行
动若是具有完全可预见性，结果就会把审计目标确定在错误的人群身上。因
为所有那些被审计的人早就预见到自己的命运。早就选择了如实申报．而对
于那些逃过审计的人，能够看管他们的就只有良心了。假如税务局的审计规
律在一定程度上是模糊而笼统的，大家都有那么一点面临审计的风险．人们
也就会更加倾向于选择诚实。
    商界也有类似的现象。在剃须刀市场上，假如吉列品牌定期举行购物券
优惠活动，比如每隔一个月的第一个星期天进行，那么毕克品牌可以通过提
前一个星期举行优惠活动的方式予以反击。当然，这么一来毕克的路数也变
得具有可预见性。吉列可以照搬毕克的策略，相应将优惠活动提前到毕克前
面去。这种做法会最终导致刺刀见红的残酷竞争，双方的利润都下跌。不过，
假如双方都采用一种难以预见或者多管齐下的混合策略．那么很可能会降低
竞争的惨烈程度。
    使用随机策略本身既简单，又直观，不过要想在实践当中发挥作用，我
们还得做一些细致的设计。比如，对于网球运动员，光是知道应该多管齐下，
时而攻击对方的正手．时而攻击对方的反手，这还不够。他还必须知道他应
该将30％的时间还是64％的时间用于攻击对方的正手．以及应该怎样根据双
方的力量对比做出调整。
    在橄榄球比赛里．每一次贴身争抢之前，攻方都会在传球或带球突破之
中选择，而守方则会把赌注押在其中一个选择上，做好准备进行反击。在网
球比赛里，发球一方可能选择接球一方的正手或反手．而接球一方则准备在
回击的时候选择打对角线或直线。
    在这两个例子里，每一方都对自己的优点和对方的弱点有所了解。假如
他们的选择可以同时考虑到怎样利用对方所有的弱点．而不是仅仅瞄准其中
一个弱点．那么这个选择应该算是上上之策。
警察与小偷博弈：猜猜猜与换换换
    球员和球迷一样都明白必须多管齐下，来些出其不意的奇袭。理由在于．
假如你每次都做同样的事情，对方就能集中全部力量最大限度地还击你的单
一策略，而且效果也会更好。
    多管齐下并不等于按照一个可以预计的模式交替使用你的策略。若是这
样的话．你的对手也能通过观察发现这个模式．从而最大限度地利用它还击，
其效果几乎跟你使用单一策略一样好。
    要记住，实施多管齐下的随机策略，诀窍在于不可预测性。
纯粹的随机策略
    《清稗类钞》中记载，清代文学家龚自珍最喜与人押宝，自称能以数学
预测骰子点数。其蚊帐的顶部写满一二l_四等数字。无事就卧于床，仰观帐
顶，以研究其消长规律。他逢人便自夸赌学之精，闻声揣色，十猜八九。但
是龚自珍每下赌场，却又必输无疑。友人取笑他，问他何以屡博屡负。龚自
珍面带戚然地回答：“有人才抱班马，学通孔周，入场不中．乃魁星不照应也。
如我之精于博．其如财神不照应何?”
    这种带有宿命论的解释不过是一种无奈的敷衍。心理学家已经发现，人们
往往会忘记这样一个事实．即投掷硬币翻出正面之后再投掷一次，这时翻出正
面与翻出反面的可能性相等。这么一来，他们连续猜测的时候就会不停地从正
面跳到反面，或从反面换为正面．很少出现连续把宝押在正面或反面的情况。
    概率里有一个重要的概念是事件的独立性概念。很多情况下，人们因为
前面已经有了大量的未中奖人群，而去买彩票或参与到累计回报的游戏，殊
不知，每个人的“运气”都独立于他人的“运气”．并不会因为前人没有中奖
你就多了中奖的机会。
    假如我们抛10次硬币，没有一次抛出了正面，下一次抛出正面的可能性
就大于上次吗?抛硬币出现正反的决定性因素很多，包括硬币的质地和你的
手劲，第11次投掷翻出正面的机会还是跟翻出反面的机会相等，根本没有“反
面已经翻得太多了”这回事。
    拉斯维加斯的很多赌场，老虎机上都顶着跑车，下面写着告示．告诉赌
盯I
博彝论的蘑斤
客已经有多少人玩了游戏，车还没有送出，只要连得三个大奖，就能赢得跑
车云云。但得大奖的规则并无变化．每人能否得到跑车和前面的“铺路石”
毫无关系。同样，在六舍彩中，上周的号码在本周再次成为得奖号码的机会，
跟其他任何号码相等。
    有很多东西对于人们的智力来说根本是不可预测的，与其让主观猜测干
扰我们的决策，不如采取纯粹的随机方式。居住在加章大东北部布拉多半岛
的印第安人，早就意识到了这一点。
    这些靠狩猎为生的人们，每天都要面对一个问题：朝哪个方向进发去寻
找猎物?他们寻找问题答案的方式在文明人看来十分可笑。这种方法类似于
中国古代的烧龟甲占h：把一块鹿骨放在火上炙烤，直到骨头出现裂痕．然
后请部落的专家来破解这些裂痕中包含的信息．找出他们当天寻找猎物应去
的方向。令人惊异的是．这种完全是巫术的决策方法。竟然使他们经常能找
到猎物，所以这个习俗在部落中一直沿袭下来。
    在这样的决策活动中，印第安人无意中将波特所说的“长期战略”运用
于其中。按通常的做法，如果头一天满载而归，那么第二天就应该再到那个
地方去狩猎。在一定时间内，他们的生产可能出现快速增长。但正如管理学
家说的，有许多快速增长常常是在缺乏系统思考、掠夺性利用资源的情况下
取得的．其增长的曲线明显呈抛物线状．在迅速到达顶点后将迅速地下滑。
如果这些印第安人过分看重他们以往取得成果的经验，就会陷入因过度猎取
猎物资源而使之耗竭的危险之中。
    可以说，正是由于测不准原理的影响，如果我们选择随机，反而有可能
超越真宴与谎言的对立。我们虽然没有鹿骨可吼使用，但是仍然可以选择某
种固定的规则，来使自己的策略无法被预测。
    但这种规则必须是绝对秘密而且足够复杂，使对手很难破解。
    举个例子：看看本书的句子的长度。假如一个甸子包含奇数个汉字，把
它当做硬币的正面；假如一个句子包含偶数个汉字，把它当做反面。这就变
成一个很好的随机数字发生器。回过头来计算看过的10个句子，我们就会得
到一组正反序列。
    假如本书不够轻便，没有关系，其实我们随时随地都带着一些随机序列。
瞽察与小偷博弈：猜猜猜与换换换
比如朋友和亲属的出生日期的序列，若出生日期是偶数．当做正面；若是奇
数，当做反面。也可以看你的手表的秒针。只要你的手表走得不准，别人便
没办法知道现在秒针究竟处于什么位置。
    对于必须使自己的混合策略比例维持在50：50的棒球投手，我们的建议
是：每投一个球，先瞅一眼自己的手表。假如秒针指向一个偶数．投一个快
球；假如指向奇数，投一个下坠球。实际上，这种方法可以帮助你获得任何
混合策略方案。比如，现在你要用40％的时间投快球而用另外60％的时闻投
下坠球，那么，请选择在秒针落在l一24之间的时候投快球，落在25～60之
间的时候投下坠球。
糟糕策略的背后
    唐朝末年．安禄山起兵造反。派遣叛将令狐潮率重兵包围了雍丘(今河
南杞县)。雍丘守将张巡留1000人守城．自己带领1000精兵，打开城门冲出。
张巡身先士卒。冲进敌阵猛砍，兵士个个奋勇。叛军做梦也没想到张巡敢冲
出城．措手不及．被杀得人仰马翻。第二天，令狐潮指挥士兵架起云梯登城
作战。张巡率领士兵把用油浸过的草捆点着后抛下城去，登城的叛军被烧得
焦头烂额，非死即伤。此后60多天里，只要一有机会，张巡就突然出兵攻击。
还用计夺取了叛军的大批粮食和盐。
    粮盐虽足，但城中箭矢已消耗得差不多了。张巡让兵士扎了许多草人，
给它们穿上黑衣。当夜月色朦胧．张巡命令兵士用绳子把草人陆陆续续地缒
下城去。城外叛军见这么多人缒城而下，纷纷射箭．一时间箭如飞蝗。射了
半天．叛军发觉不对劲。因为他们始终设听到一声喊叫声，而且又发现这一
批刚拉上城去．那一批又坠下来．始觉中计。派人前去探查以后，他们方知
所射的都是草人。这一夜，张巡竞得箭10万支。
    第二天深夜，张巡叉把外罩黑衣、内穿甲胄的草人从城上放下去。叛军
发现，乱射了一阵．发现又是草人。以后每天夜里，张巡都是如此，城外叛
军渐渐知道是计，也不再拿箭去射。这时．张巡决定发起总攻。这一日．张
巡把500名勇士趁夜色缒下城去，勇士们奋勇突进敌营。叛军一点准备也没
。厶9I
有，立时大乱。接着，叛军的营房四处起火，混乱中也不知来了多少官军。
最后，张巡率军直追杀出lO余里，大获全胜。
    令狐潮的叛军开始发现城头缒下草人，用箭去射是对的。后来发现上当
受骗，就不再用箭射，那就不是很好的策略选择。无论缒下的是草人还是真
人，在一时无法辨别的时候，他们的最佳策略就是用箭去射。因为这样损失
的只是一些箭矢，这种损失与被张巡偷袭相比，显然是微不足道的。
    这个故事给我们的启示在于：假如真能发现博弈对手打算采取一种行动．
而这种行动方针并非随机混合策略，那你就可以利用这一点占他的便宜。
    博弈的特点就是相互猜测，你对对手的策略进行猜测。对手也在对你的策
略进行猜测。取胜的基本思路是要考虑对手的思路．所以博弈中还必须考虑到
对手也在猜测你，无时不在寻找你的行动规律，以便有的放矢地战胜你。
    稳健是博弈的要务，想赢别人一定要先把赢的每一个环节都考虑周到，
不能让对手发现任何真实的规律，否则，想赢别人的时候往往也正是你的弱
点暴露得最明显的时候。如果没有真正了解对手的策略就仓促出手，对手就
可能乘机抓住你的弱点，你可能反倒要被别人赢掉了。
    还是用网球比赛的例子来说，当发球者采取自己的均衡策略，按照40：
60的比例选择攻击对方正手方和反手方时．接球者的成功率为48％。如果发
球者采取其他比例，接球者的成功率就会上升。假如发球者很傻，决定把所
有的球都发向对方较弱的反手方．接球者由于早有预料．其成功率将会增至
60％。一般来说，假如接球者认识发球者，确切了解他有什么癣好，他就能相
应采取有针对性的对策。
    不过，这么做永远存在一种危险．即发球者可能是一个更出色的策略家，
懂得在无关紧要的时候装出只会采用糟糕策略的傻样，引诱对方上当．然后
在关键时刻使出自己的杀手锏。这种策略往往会使接球者白以为看穿了对方
的惯用手法，而放弃自己的均衡混合策略。这样，发球者就用乍看起来很傻
的混合策略布置了一个圈套．让一心要占对方便宜的接球者就会上当。只有
采取自己的均衡混合策略才能避免这一危险。
    这也就是说．如果在博奔开始后算不清对方的行动规律并不可怕；但是
如果对方的规律出乎意料地明显，那么休就要小心了，因为对方可能正在引
诱你走向一个危险的胳阱。
1150
第11章
斗鸡博弈：狭路相逢的策略
离开你不会是一种噱头
我只是要一点呵护还嫌太多
任何结果没有谁有把握
但请你让一条路让大掌好走
——《不要乱说》歌词
二虎相争必有一伤
    试想有两只实力相当的斗鸡狭路相逢，每只斗鸡都有两个行动选择：一
是退下来，一是进攻：如果斗鸡甲退下来，而斗鸡乙没有退．那么乙获得胜
利，甲则很丢面子；如果乙也退下来．则双方打个平手；如果甲没退，而乙
退下去，那么甲则胜利，乙失败；如果两只斗鸡都前进，那么将会两败俱伤。
    因此，对每只斗鸡来说，最好的结果是．对方退下去．而自己不退。但
是这种追求却可能导致两败俱伤的结果。
    不妨假设两只斗鸡均选择前进，结果两败俱伤，这时两者的收益是一2个
单位，也就是损失2个单位；如果一方前进。另外一方后退。前进的斗鸡获
得1个单位的收益，赢得了面子，而后退的斗鸡获得一l韵收益即损失1个单
位．输掉了面子，但没有两者均前进受到的损失大；两者均后退，两者均输
掉了面子获得一l的收益即损失1个单位。具体如表Il l所示。
表11．1
博拜沦的坦』／
斗鸡博弈的收益矩阵
    如果博弈有唯一的纳什均衡点，那么这个博弈是可预测的．均衡点就是
事先知道的唯一的博弈结果。但是如果一场博弈有两个或两个以上的纳什均
衡点．那就无法预测出一个结果来。斗鸡博弈就有两个纳什均衡：一方前进．
另一方后退．但关键是谁进、谁退?因此．我们无法预测斗鸡博弈的结果，即
不能知道谁进谁退，谁输谁赢。
    由此看来，斗鸡博弈描述的便是两个强者在对抗冲突的时候．如何能让
自己占据优势．力争得到最大收益，确保损失最小。
    这电像武侠小说中所描写两大高于比试内力一样．当两人以内力对决的
时候．每个人都欲罢不能．因为对方的内力正源源不断地攻来．自己一撤内
力则非死即伤；而对方呢．处境一点儿不比自己强。两个人这样僵持的局面
就是一个纳什均衡当然两个人不进人或退出这种比试内力的境地可能也是
一个均衡，退出对决僵持状态在小说中一般需要借助外力或者二人凑巧同时
撤回内力才能达到。
    斗鸡博弈在日常生恬中非常普遍．而用斗鸡博弈来解释美苏两个超级大
国之间在冷战期间的军备竞赛．是最合适不过的了。
鹬蚌相争的困局
    在藩镇和宦官夹缝中．唐王朝中央政府叉出现朋党之争，使唐王朝的命
脉悬于一线9世纪20年代后．唐朝中央政府的高级官员分裂为两个政客集
团，一称“李党”．一称“牛党”。李党的重要人物有李德裕、李绅、郑覃；
牛党重要人物有李逢吉、牛僧孺、李宗闵、李党多是出身高贵门第和士族世
家．而牛党多是出身寒门的进士
1152
《砬
表11．1
博拜沦的坦』／
斗鸡博弈的收益矩阵
    如果博弈有唯一的纳什均衡点，那么这个博弈是可预测的．均衡点就是
事先知道的唯一的博弈结果。但是如果一场博弈有两个或两个以上的纳什均
衡点．那就无法预测出一个结果来。斗鸡博弈就有两个纳什均衡：一方前进．
另一方后退．但关键是谁进、谁退?因此．我们无法预测斗鸡博弈的结果，即
不能知道谁进谁退，谁输谁赢。
    由此看来，斗鸡博弈描述的便是两个强者在对抗冲突的时候．如何能让
自己占据优势．力争得到最大收益，确保损失最小。
    这电像武侠小说中所描写两大高于比试内力一样．当两人以内力对决的
时候．每个人都欲罢不能．因为对方的内力正源源不断地攻来．自己一撤内
力则非死即伤；而对方呢．处境一点儿不比自己强。两个人这样僵持的局面
就是一个纳什均衡当然两个人不进人或退出这种比试内力的境地可能也是
一个均衡，退出对决僵持状态在小说中一般需要借助外力或者二人凑巧同时
撤回内力才能达到。
    斗鸡博弈在日常生恬中非常普遍．而用斗鸡博弈来解释美苏两个超级大
国之间在冷战期间的军备竞赛．是最合适不过的了。
鹬蚌相争的困局
    在藩镇和宦官夹缝中．唐王朝中央政府叉出现朋党之争，使唐王朝的命
脉悬于一线9世纪20年代后．唐朝中央政府的高级官员分裂为两个政客集
团，一称“李党”．一称“牛党”。李党的重要人物有李德裕、李绅、郑覃；
牛党重要人物有李逢吉、牛僧孺、李宗闵、李党多是出身高贵门第和士族世
家．而牛党多是出身寒门的进士
1152
《砬
翩¨
博弈．电的蘑舻
    唐朝政府在朋党斗争的26年问(821～846年)，人事变动极其混乱，几
乎每一年都要发生一次“轰然而至”和“轰然而去”的浪潮。李党当权则李
党党羽弹冠相庆。全部调回中央任职，牛党党羽则扫地出门。牛党当权亦然。
比如到832年，牛僧孺被迫辞职，李德褡人朝后，出现了一个能使两个政客
集团和解的很好的机会。身为牛党的长安京兆尹杜棕向李宗闵建议：由李宗
闶推荐李德裕担任科举考试的主考官知贡举，李宗闶不同意。李德裕出身士
族世家．虽然恨透了考试制度。并故意炫耀他不是进士出身．但其实内心何
尝不羡慕?只有杜棕洞察到这个秘密，所以出此建议，企图使世家与寒门在
李德裕这里融合。可惜李宗闵没有这种智慧。杜棕又退而求其次，建议由李
宗闶推荐李德裕担任地位跟宰相相等的御史大夫。
    李宗闵勉强同意，杜棕就去通知李德裕。李德裕昕后惊喜不已．感激得
流下眼泪，连连请杜棕转选对李宗闶的感谢。然而李宗闵到底没有这种胸襟
和见识．他又听从了给事中杨虞卿的意见，变了卦。李德裕认为受到戏弄，
怨恨更深。从此和解的机会一去不返。
    从此以后．每一个党派都发挥“宜将剩勇迫穷寇”的精神．力求把对手
斩草除根，不给对手喘息机会，于是一场场你死我活的政治战争把朝廷变成
了看不见硝烟的战场。
    但是最后得到的，却是一种“驴子式的胜利”。
    伊索寓言中有一个“驴子和驴夫”的故事。驴夫赶着驴子上路，剐走一
会儿，就离开了平坦的大道，沿着陡峭的山路走去。当驴子贴近悬崖时，驴
夫一把抓住它的尾巴，想要把它拉过来。可驴子拼命挣扎，驴夫抓不住，一
下子让驴子滑了下去。驴夫无可奈何地说道：“你胜利了!但那是个悲惨的胜
利。”
    如果凡事一定要争个输赢胜负．那么必然会给自己造成不必要的损失。
这在政坛也随处可见。在这方面，西方政坛上“费厄泼赖”式的宽容，也就
是网开一面琏免把对手逼人死角的政治斗争。相形之下显得更为可取。这不
仅是一种感性和直观的认识，而是有着博弈论的依据。
    这种依据就是斗鸡博弈。在这种博奔中，只有一方先撤退，才能双方获
利。特别是占据优势的一方，如果具有这种以退求进的智慧，提供给对方回
lf5‘
斗鸡博弈：狭路相逢的策略
旋的余地，也将给自己带来胜利，那么双方都成为利益的获得者。
    有时候，双方都明白二虎相争必有一伤的道理．也都不愿意成为牺牲者，
可是他们往往又过于自负，觉得自己会取得胜利。所以，只要把形势说明，
让他明白没有稳操胜券的能力，僵持不下的斗鸡博弈就会被化解了。
    由此我们可以看出，在现实中运用博弈论中的斗鸡定律．是要遵循一定
条件和规则的。哪一只斗鸡前进．哪一只斗鸡后退．不是谁先说就听谁的，
而是要进行实力的比较．谁稍微强大，谁就有更多的前进机会。但这种前进
并不是没有限制的．而是前进和后退都有一定的距离，这个距离是两只斗鸡
都能够接受的。一旦超过了这个界限，只要有一只斗鸡接受不了，那么斗鸡
博弈中的严格优势策略也就不复存在了。
攻击的“仪式化”
    在有进有退的斗鸡博弈中，前进的一方可以获得正的收益值，而后退
的一方也不会损失太大．因为失去面子总比伤痕累累甚至丧命要好得多。
实际上，这已经不仅是个体之间的得失计算，而是与整个种群的生存与发
展有关。
    在自然界中，所有的动物都有四种先天性的本能：觅食、交配、逃跑和攻
击。有人曾经做过这样一个实验，在一个水槽中放置了25种鱼，共loo多条。
没过多久，水槽里就发生了一场混战。最后．经过观察和计算，同类鱼相咬
与异类相咬的比例是85：15。
    作为一种先天行为．攻击是有一定的积极功能的：胜者可以获得更多的
异性和食物，而从种群的范围来看．同物种间的争斗也可以在客观上使个体
的空间分布更为合理，不至于因为过于密集而耗尽食物。实际上也正因如此，
才会出现上面实验中的现象：同种间的攻击远远超过异种间的攻击。
    但攻击也有消极后果。其极端的后果将是种族衰落乃至消亡。因此恰当
地使用攻击手段是一切动物必须解决的问题。最主要的手段之一是将同种问
的攻击变成“仪式化”行为。两只公牛交锋时，各自用巨大的牛角将地皮铲
得尘土飞扬．以显示自己的力量。弱势者往往从这一仪式中认识到自己力有
55 I
飘篁鲨型
不及．及时退却．而强势者从不追赶。
    哺乳类动物中没有嗜杀同类的现象。最嗜杀的狼，恰恰有最好的抑制能
力．从不向同类真正地实施武力。如果投有了这种抑制力，狼程可能早就灭
绝了。
    人类作为一种社会动物，除了食物与异性之外．还要追求心理的满足包
括社会地位等，这也就决定了争斗的理由与起因比自然界中要复杂百万倍。
阶级地位越是接近的个体．形成斗鸡博弈关系的可能性越高，关系的紧张程
度越高。因为阶级地位越接近。越需要争夺同样的资源。
    但是也正因人类比其他的动物高级，他们也更能通过学习．运用更高级
的博弈智慧。或者说，他们的“仪式化”行为也更为复杂和多样，从而能够
成功地避免两败俱伤的结局。
    郑国曾经派子濯孺子去攻打卫国，战败逃跑．卫国派庾公之斯追击。子
濯孺子说：“今天我的风湿病发作了，拉不了弓，我活不成了。”
    子濯孺子又问给他驾车的人：“追击我的是谁呀’”驾车的人回答：“庾
公之斯。”子濯孺子便说：“我死不了啦。”驾车的不明白：“庾公之斯是卫国
的名射手，他追击您．您反说您死不了啦，这是什么道理?”子濯孺子回答
说：“庾公之斯跟尹公之他学的射箭．尹公之他又是跟我学的射箭，尹公之他
是个正派人，他所选择的学生一定也正派。”
    庾公之斯追了上来。庾公之斯见子濯孺子端坐不动，便问道：“老师为什
么不拿弓呢?”子濯孺子说：“我今天病了，拿不了弓。”庾公之斯说：“我跟
尹公之他学射，尹公之他叉跟您学射。我不忍心拿您的技巧反过来伤害您。
但是．今天我追杀您，是国家的公事，我也不能完全放弃。”
    于是，庾公之斯抽出箭．在车轮上敲了几下．把箭头敲掉，用没有箭头
的箭向子濯孺子射了四下．然后回去了。
    实际上这种做做样子的攻击对于庾公之斯来说是很有利的，一方面他保
全了自己不杀伤老师的正人君子的名声．另外也为自己留下了一条后路——万
一将来走投无路落在子濯孺子手里的时候，后者肯定也会手下留情。
    在华容道上，关羽截住了曹操，曹操就是用自己之前对关羽的一番照顾．
加上一句：“将军探明《春秋》，岂不知庾公之斯追子濯孺子之事乎7”从而
1156
斗鸡博弈：狡路相逢的簸略
为自己解了围。由此可见，这种仪式化的攻击观念，早已深人人心并且被很
多人运用着。
把对手变成朋友
    2003年12月，美国的Real Networks公司向美国联邦法院提起诉讼，指
控微软滥用了在Windows上的垄断地位，限制Pc厂商预装其他媒体播放软
件，并且无论Windows用户是否愿意，都强迫他们使用绑定的媒体播放器软
件。RealNetworks要求获得10亿美元的赔偿。
    然而就在官司还没有结束的情况下，Real Networks公司的首席执行宫格
拉塞却致电比尔·盖茨，希望得到微软的技术支持，以使自己的音乐文件能
够在网络和使携设备上播放。所有的人都认为比尔-盖菠一定会拒绝他。但
出人意料的是，比尔·盖茨对他的提议表示欢迎。他通过微软的发言人表示，
如果对方真的想要整合软件的话，他将很有兴趣合作。
    2005年10月。微软与Real Networks公司达成了一份价值7．61亿美元的
法律和解协议。根据协议。微软同意把Real Networks公司的Rhapsody服务包
括进其MSN搜索、MSN讯息以及MSN音乐服务中，并且使之成为Windows
Media Player 10的一个可选服务。
    类似的故事也曾经发生在微软和苹果两大公司之间。
    自20世纪80年代起，苹果和微软就一直处于敌对状态，为争夺个人计
算机这一新兴市场的控制权展开了激烈的竞争。到了90年代中期．微软公司
明显占据了领先优势，占领了约90％的市场份额．而苹果公司则举步维艰。
但让所有人大跌眼镜的是，1997年，微软向苹果公司投资1 5亿美元．把它
从倒闭的边缘拉了回来。2000年，微软为苹果推出Office2001。自此．微软
与苹果真正实现双赢，合作伙伴关系进入了一个新时代。
    上面两个故事发生在世界首富比尔·盖茨身上。绝对不是一个巧合，因
为它们都来源于一种对商机的把握和设计，以及与对手握手言和的处世钽慧。
    一般人面对敌人或对手的时候，采取的态度是不屈不挠，咬紧牙关，迎
面而上．决不退缩。这也是红眼斗鸡们的共识。但是真正明智的人会选择另
57 I
一。√．博奔论的
蘑舻
一种方式：站到敌人的身边去，把敌人变成自己的朋友。
    一个牧场主养了许多羊。他的邻居是个猎户，院子里养了一群凶猛的猎
狗。这些猎狗经常跳过栅栏，袭击牧场里的小羊羔。牧场主几次请猎户把狗
关好，但猎户不以为然，口头上答应。可没过几天，他家的猎狗又跳进牧场
横冲直撞，咬伤了好几只小羊。
    忍无可忍的牧场主找镇上的法官评理。昕了他的控诉．法官说：“我可以
处罚那个猎户，也可以发布法令让他把狗锁起来。但这样一来你就失去了一
个朋友，多了一个敌人。你是愿意和敌人做邻居呢7还是和朋友做邻居'”
牧场主说：“当然是和朋友做邻居。…那好，我给你出个主意。按我说的去做，
不但可以保证你的羊群不再受骚扰，还会为你赢得一个友好的邻居。”法官如
此这般交代一番。牧场主连连称是。
    回到家，牧场主就按法官说的挑选了3只最可爱的小羊羔，送给猎户的3
个儿子。看到洁白温顺的小羊，孩子们如获至宝．每天放学都要在院子里和
小羊羔玩耍嬉戏。因为怕猎狗伤害到儿子们的小羊．猎户做了个大铁笼，把
狗结结实实地锁了起来。从此，牧场主的羊群再也没有受到骚扰。
    生活在纷繁复杂的社会中，难免会与人发生对立和冲突．与这样那样的
对手“狭路相逢”。在这些对手中。有的也许的确是蓄意阻挡你的前进道路．
但大多却是由于阴差阳错或者因缘际会而产生的误会。因为一个理性的人都
明白，挡住别人的去路，实际上自己也无法前进。在后面这种情况下。就不
能讲究“狭路相逢勇者胜”，而应该调整自己的姿态．避免因为针尖对麦芒而
两败俱伤，并且要“一笑泯恩仇”，化对手为朋友，甚至联手找到一条能让双
方共同前进的道路。
学会见好就收
    我国古人虽然没有明确提出斗鸡博弈一类的名词．但其原理在我国古代
历史上早已经得到过程好的应用了。
    春秋时，楚国一直是南方的强国，公元前659年出兵郑国。齐桓公与管
仲约诸侯共同救郑抗楚。齐国和鲁、束、陈、卫、郑、许、曹八国组成联军
1158
斗鸡博弈：狭路相逢的策略
南下．直指楚国。楚国在大军压境的形势下，派使臣届完出来谈判。
    屈完见到齐桓公就问：“你们住在北海，我们住在南海，相隔千里，任何
事情都不相干涉。这次你们到我们这里来，不知是为了什么?”管仲在齐桓
公身旁，听了之后就替齐桓公答道：“从前召康公奉了周王的命令，曾对我们
的祖先太公说过．五等侯九级伯，如不守法你们都可以去征讨。东到海．西
到河，南到穆陵，北到无隶，都在你们征讨范围内。现在楚国不向周王进贡
用于祭祀的滤酒的包茅，公然违反王礼。还有前些年昭王南征途中遇难，这
事也与你们有关。我们现在兴师来到这里，正是为了问罪于你们。”屈完回答
说：“多年没有进贡包茅，确实是我们的过错。至于昭王南征未回是因为船沉
没在汉水中，你们去向汉水问罪好了。”
    齐桓公为了炫耀兵力，就请屈完来到军中与他同车观看军队。齐桓公指
着军队对屈完说：“这样的军队去打仗．什么样的敌人能抵抗得了?这样的军
队去夹攻城寨．有什么样的城寨攻克不下呢7”屈完不卑不亢地回答说：“国
君，休如果用仁德来安抚天下诸侯，准敢不服从呢7如果只凭武力．那么我
们楚国可以把方城山当城。把汉水当池，城这么高．池这么深．你的兵再勇
猛恐怕也无济于事。”齐桓公和管仲本也无意打仗，只是想通过这次军事行
动来增强自己的号召力罢了。所以他们很快就同意与楚国和解．将军队撤到
召陵。
    一个明智的博奔者无论是面对怎样的对手，在开始行动之前必须牢牢记
住这样一个原则——见好就收。但仅此还不够．一个既明智又老到的博弈者事
先必须估计到最坏的博弈结果，更高地警戒自己，更要遵循遇败即退的原则，
以保存实力。斗鸡场上逼使对手让步可能会给人带来无比的愉悦和刺激，但
是强中更有强中手。千万别把它当做永久的法宝。
    2004年12月．在新加坡上市的中国航油(新加坡)股份有限公司因从事
投机性石油衍生品交易，导致亏损5 5亿美元，成为继巴林银行破产以来最大
的国际投机丑闻。
    2004年一季度国际市场油价攀升，导致中航油在期货市场潜亏580万美
元．6月亏损额扩至3500万美元。世界风险评估机构标准普尔公司指出：在
危机显露之初，中航油只需5000万美元即可化解风险。此时中航油第一次收
59 I
博奔论的蘑坩
到有关方面追加保证金的通知。但是当时的中航油新加坡公司总裁陈久霖却
像一只斗红了眼的公鸡，第一反应不是如何控制风险而是赌一口恶气。他继
续加大交易量，更将期权的舍约展期至2005年之后。到了10月，中航油持
有的期权总交易量已上升至5200万桶，相等于实际进口量的3倍。2004年
11月30日，中航油宣布被迫向法院申请破产保护。
让老板加薪的博奔
    两只实力相当的斗鸡，如果它们双方都选择前进，那就只能是两败俱伤。
在对抗条件下的动态博弈中，双方可以通过彼此提出威胁和要求，找到都能
够接受的解决方案，丽不至于因为各自追求自我利益而僵持不下，甚至两败
俱伤。但是这种优势策略的选择，并不是一开始就能做出的，而是要通过反
复的试探。甚至是激烈的争斗后才能实现。
    哪一方前进，不是由两只斗鸡的主观愿望决定的，而是由双方的实力预
测所决定的。当两方都无法完全预测对手实力的强弱时，那就只能通过试探
才能知道。而在试探的时候，既要有分寸，更要有勇气。
    如果你是一位职场人士，那么你与老板之间所进行的最为惊心动魄的博
弈．一定是围绕薪水进行的。一方要让收人更适合自己的付出。而另一方则
要让支出更适合自己的赢利目标，两只斗鸡在办公桌前迎头相遇。
    首先，作为员工，如果想要让老板给你加薪，那么就必须主动提出来。
你不提，不管用什么博弈招数都没用。
    在向老板要求加工资时，除了把加工资的理由一条一条摆出来，详细说
明你为公司做了什么贡献而应该提高报酬之外，最重要的应该是确定自己提
出的加薪数额。你提出的数额，应该超过休自己觉得应该得到的数额。注意．
关键是“超过”。鉴于体与老板之间的地位不平等，这就需要勇气，事先一定
要对着镜子．好好练习一下这个“超过”的数额。这样见了老板就不会欲言
又止、吞吞吐吐了。
    一般人请老板提工资，提的数额都不多。但是这种低数额的要求对他们
有害无益。提的数额越低，在老板眼里的身价也就越低。这大概是人性的怪
1160
斗鸡博弈：狭路相逢的策略
诞之处吧。标价过低的东西．比标价过高的东西更容易把买主吓跑。反过来，
如果提的数额合理而且略高一些．会促使老板重新考虑你的价值，对你的工
作和贡献做更公正的评价。你就是得不到要求的数额，老板也可能对你更好，
比如会改变你的工作条件等。他改变了看休的视角．了解得更清楚，所以会
对你刮目相看。
    你如果不在乎别人小看，就别要求提工资，就是要求也是很小的幅度。
那样，你会发现分配的工作最苦最累，办公条件最差，工作时间最长。总之，
你要是不重视自己，也别指望老板会看重你。要求的数额低，就是小看自己。
    其实，在你与老板之间形成的博弈对局中，老板会综合对你的能力和价
值的了解．判断出该给你加薪的幅度．并以此作为讨价还价的依据。如果你
的理由充分，又有事实根据，可能跟老板对你的看法有出人，发生心理学的
所谓“认知不一致”。老板会设法协调一下这种不一致。但是，如果你不把这
种“认知不一致”暴露出来，在加薪的对局中你就会处于下风，因为他一直
抱着成见。你提供了不同的看法．就迫使他重新评价你，以新的眼光看待你，
最后达成有利于你的和解的可能性反而更高。
    这是斗鸡博弈中如何在避免两败俱伤的前提下为自己争取利益的智慧，
正如本节开头所说的，在需要勇气的同时，更需要揣摩与试探的策略。
第1 2章
协和谬误：欲罢不能的困局
效罢不能
无论喜与悲
与我同醉
芏看人生看波那是与非
——《把酒当歌》歌词
不能承受的代价
    妈妈花2000元给亚莉买了一架电子琴，可亚莉生性好动，对音乐没有什
么兴趣，电子琴渐渐落了灰。不久，亚莉妈妈的同事介绍说有一位音乐学院
钢琴专业的老师可以给亚莉做家教。这个时候你觉得亚莉妈妈会做何决定
呢7亚莉妈妈决定请家教，理由是：“电子琴都买了，当然要好好学，请一个
老师教教．要不这个琴就浪费了!”于是，每月500元的付出又坚持了半年．
最终不得不放弃了。为了不浪费2000元的电子琴，亚莉妈妈继续浪费了3000
元的家教费。
    当你进行了一项不理性的活动后，应该忘记已经发生的行为和你支付的
成本，只要考虑这项活动之后需要耗费的精力和能够带来的好处．再综合评
定它能否给自己带来正效用。比如进行投资时，把目光投向前方．审时度势，
如果发现这项投资并不能赢利，应该及早停掉，不要惋惜已投下去的各项成
本：精力、时间、金钱…··
协和谬误：被罢不能的困局
    这就是亚莉妈妈的教训，她所陷人的困境，在博弈论上称为“协和谬误”。
    20世纪60年代，荚法两国政府联台投资开发大型超音速客机，即协和飞
机。该种飞机机身大、装饰豪华并且速度快．其开发可以说是一场豪赌，单
是设计一个新引擎的成本就可能高达数亿元。难怪政府也会被牵涉进去，竭
力要为本国企业提供更大的支持。
    项目开展不久，英法两国政府发现：继续投资开发这样的机型，花费会
急剧增加．但这样的设计定位能否适应市场还不知道；但是停止研制也是可
怕的，因为以前的投资将付诸东流。随着研制工作的深入，他们更是无法做
出停止研制工作的决定。协和飞机最终研制成功，但因飞机的缺陷(如耗油
大、噪音大、污染严重等)以及运营成本太高，不适合市场竞争，荑法政府
为此蒙受很大的损失。
    在研制过程中，如果英法政府能及早放弃，本来可以使损失减少，但他
们没能做到。最后。萸国和法国航空公司宣布协和飞机退出民航市场．才算
是从这个无底洞中脱身。这也是“壮士断腕”的无奈之举。
    人们往往会陷人类似的误区：一项工作的成本越大，对它的后续投入就
越多。其实不仅是在制造协和飞机这样的重大项目上，就是在日常的生活中，
人们在决定是否继续做一件事情的时候．不仅是看它对自己有没有好处．而
且也过于注意自己是不是已经在这件事情上面有过投八。
    我们把那些已经发生、不可收回的支出如时间、金钱、精力称为“沉没
成本”。沉没的意思是说，如果你在正式完成交易之前投人的成本，一旦交易
不成，就会白白损失掉。但如果对沉没成本过分眷恋，就会继续原来的错误，
造成更大的亏损。
    对于沉没成本，炒股的朋友更容易理解。因为他们或多或少都有由浅人
深被套的经历，其原因就在于最初的“不甘心”。如果在股票发生亏损后能够
及时止损，就可以把损失降到较低的限度。而越是犹豫不决．旷日持久，沉
段成本就越来越大，就更不愿意做壮士断腕之举，导致难以自拔。
    有这样一个人，他在向一家健身俱乐部付了一笔会费后，突然被医生告
知他在一段时问内不适宜剧烈运动。这个人非常可能不顾剧烈运动带来的痛
苦和后果，继续健身。显然．如果尚未支付这笔会员费，他会很乐意接受退
65 I
博奔论的崩}舻
出俱乐部的选择。问题在于．冒着身体的痛苦继续运动，可以使自己不用面
对会员费变成一笔巨大的损失，但是由此带来的痛苦和损害健康的后果，很可
能会远远大于会赞的损失。这里的会员费就是一笔沉没成本，不应再去考虑。
    也许，在健身的问题上很多人还可以清醒过来，但在其他很多类似的事
情上．却往往在沉没成本的误区里泥足深陷。
    做错了一件事。明知是自己有问题．却怎么也不肯认错，反而花加倍的
时间来找借口，反而叉造成自己的形象大打折扣。被人骂了一句，花了无数
时间生气难过，道理相同。为一件事情发火，不惜损人不利己，不惜血本，
不惜时间地进行报复。所有这些不是一样无法从沉没成本中自拔?
    从理性的角度来说，沉没成本不应该影响我们的决策．然而，我们常常
由于想挽回或避免沉没成本而做出很多不理性的行为，从而陷人欲罢不能的
泥潭．而且越陷越深。
认赔服输的智慧
    一位老太太的独生子死了，虽然已埋葬多日，但是她仍然整日以泪洗面，
悲伤不已：“儿子是我唯一的寄托，唯一的依靠。他离我而去．我再活下去还
有什么意思，不如跟他一块去吧!”她心里这样想着．连续四五天呆在墓地里，
不思饮食。
    释尊听说了这件事．带着弟子赶到墓地来。老太太看见释尊，忙向前施
札。释尊问道：“老人家，你在这里做什么呢7”老太太伤心地说：“独生儿
子弃我而去．但是．我对他的爱心却愈来愈炽烈．我总想跟他一块离开人世
算了。”释尊说：“宁愿自己死去．也要让儿子活着，你是这样想的吗?”老
太太闻言满怀希望地同道：“佛陀啊，您认为能做得到吗?”释尊静静地回答：
“你给我拿火来，我就运用法力，让你的儿子复活。不过，这个火必须来自
未曾死过人的家庭，否则，我作了法也投有效果。”老太太赶紧去找火，她站
在街头．逢人就问：“府上曾经死过人吗'”大家回答她：“自古以来，哪有
不曾死过人的家庭呢’”老太太需要的火始终无法到手．只好失望地回到释
尊的面前说：“我出去找火了，就是找不到没有死过人的家庭。”
    ＼
r
《‰
博奔论的崩}舻
出俱乐部的选择。问题在于．冒着身体的痛苦继续运动，可以使自己不用面
对会员费变成一笔巨大的损失，但是由此带来的痛苦和损害健康的后果，很可
能会远远大于会赞的损失。这里的会员费就是一笔沉没成本，不应再去考虑。
    也许，在健身的问题上很多人还可以清醒过来，但在其他很多类似的事
情上．却往往在沉没成本的误区里泥足深陷。
    做错了一件事。明知是自己有问题．却怎么也不肯认错，反而花加倍的
时间来找借口，反而叉造成自己的形象大打折扣。被人骂了一句，花了无数
时间生气难过，道理相同。为一件事情发火，不惜损人不利己，不惜血本，
不惜时间地进行报复。所有这些不是一样无法从沉没成本中自拔?
    从理性的角度来说，沉没成本不应该影响我们的决策．然而，我们常常
由于想挽回或避免沉没成本而做出很多不理性的行为，从而陷人欲罢不能的
泥潭．而且越陷越深。
认赔服输的智慧
    一位老太太的独生子死了，虽然已埋葬多日，但是她仍然整日以泪洗面，
悲伤不已：“儿子是我唯一的寄托，唯一的依靠。他离我而去．我再活下去还
有什么意思，不如跟他一块去吧!”她心里这样想着．连续四五天呆在墓地里，
不思饮食。
    释尊听说了这件事．带着弟子赶到墓地来。老太太看见释尊，忙向前施
札。释尊问道：“老人家，你在这里做什么呢7”老太太伤心地说：“独生儿
子弃我而去．但是．我对他的爱心却愈来愈炽烈．我总想跟他一块离开人世
算了。”释尊说：“宁愿自己死去．也要让儿子活着，你是这样想的吗?”老
太太闻言满怀希望地同道：“佛陀啊，您认为能做得到吗?”释尊静静地回答：
“你给我拿火来，我就运用法力，让你的儿子复活。不过，这个火必须来自
未曾死过人的家庭，否则，我作了法也投有效果。”老太太赶紧去找火，她站
在街头．逢人就问：“府上曾经死过人吗'”大家回答她：“自古以来，哪有
不曾死过人的家庭呢’”老太太需要的火始终无法到手．只好失望地回到释
尊的面前说：“我出去找火了，就是找不到没有死过人的家庭。”
    ＼
r
《‰
_妇翟翟型
    释尊这才说道：“自从开天辟地以来，没有不死的人。死去的人已经死了，
可是活着的人仍然要好好地活下去。而你却不想面对这个现实，难道不是执
迷不悟吗'”老太太如梦初醒．不再想寻死。
    沉没成本对决策产生如此重大的影响，以至于很多英明的决策者都无法
自拔。很多时候，他们开始做一件事，做到一半的时候发现并不值得，或者
会付出比预想多得多的代价，或者有更好的选择。但此时付出的成本已经很
大，思前想后，只能将错就错地做下去。但实际上，做下去往往会带来更大
的损失。
    老周的婚姻是属于那种以城市户口换漂亮村姑的模式。十多年过下来，
他的老婆混得越来越不错，先在街道工厂，后在区属企业，有一次买彩票中
了50万，发达了。
    接下来老婆提出要离婚。但是．任凭她怎么说，老周就是不离。老婆说
把50万都给他，老周还是不离。老周的道理是：“我好不容易把这个睡前不
刷牙的乡村女人，调教成一个不但睡前刷牙而且刷牙后还穿睡衣的城市女人。
你说，我能舍得她吗’其实，有那50万我也不是找不到更漂亮的，只是，这
么漂亮的老婆跟我离了，那不太便宜别人了?”
    老周最终也没有便宜了别人，但是他自己也投得着便宜：现在两人不但
分床睡觉，而且他如果吃老婆做的饭菜，还得交钱。不过还好。老婆还没有
在饭菜里下老鼠药。
    失去一个人的感情，明知一切已无法挽回，却还是那么执著，而且一执
著就是好几年，还要死缠烂打。这是很多像老周一样的男女在面对变心的另
一半时的本能反应。但是其实这样一点用也没有，只是损失更多。丘吉尔说，
世上有两件事最难对付，一是倒向这边的墙，一是倒向另一边的女人。
    无论是坚持去健身运动还是坚持不离婚，都是完全错误的。在任何时候．
要不要对一项活动继续投入，关键是看它的发展前景和未来的发展。至于过
去为它花了多少沉没成本．应该尽量排除在当下的考虑范围之外。只有这样，
才髓尽量抑制和消除沉没成本对决策的破坏性影响。
    具体说来．我们怎么才能让自己摆脱沉没成本的羁绊呢?一是在进行一
项事业之前的决策要慎重，要在掌握了足够信息的情况下．对可能的收益与
1166
协和谬误：欲罢不能的困局
损失进行全面的评估；二是一旦形成了沉没成本．就必须要承认现实，认赔
服输，避免造成更大的损失。
    在很多情况下，我们就像伊索寓言里的那只狐狸，想尽了办法．费尽了
周折．但却由于客观原因最终无法吃到那串葡萄。这时，即使坐在葡萄架下
哭上一天，暴跳如雷也是无济于事，反而不如用一句“这串葡萄一定是酸的，
让馋嘴的麻雀去吃吧”来安慰自己，求得心理上的平衡。这种调整期望的落
差，转而接受柠檬虽酸却也别有滋味的事实，虽然有点据于儒、依于道而逃
于掸的味道，反而不至于伤害了自尊与自信。
    因此可以说，酸葡萄心理不失为一种让我们摆脱沉没成本的困扰、接受
现实的好方法．而且可以消除心理紧张，缓和心理气氛，减少因产生攻击性
冲动和攻击行为而造成更大的损失和浪费。从这个意义上．它又不失为一种
人生管理的方法。人生最大的效率其实在于：真正有勇气来改变可以改变的
事情，有度量接受不可改变的事情．有智慧来分辨两者的不同。
不要去看碗背面
    一位母亲让孩子拿着一个大碗去买酱油。弦子来到商店，付给卖酱油的
人两角钱．酱油装满了碗，可是提子里还剩了一些。卖酱油的人问这个孩子：
“孩子．剩下的这一点酱油往哪儿倒々…‘请您往碗底倒吧!”说着，他把装
满酱油的碗倒过来。用碗底装回剩下的酱油。碗里的酱油全洒在了地上．可
他全然不知，捧着碗底的那一点酱油回家了。孩子的本意是希望母亲赞扬他
聪明，善用碗的全部。而妈妈却说：“孩子。你真傻。”
    实际上，很多人都在扮演那个故事的弦子，自作聪明地企图把碗的全部
空间都用上．期望可以把酱油全部拿回家，最后却因小失大，捧回家的却是
一个倒扣着的碗．而碗里面酱油已洒光了。也许不是酱油这类可见的东西，
我们不知自己曾经泼洒了什么，但必定是弥足珍贵的。
    上面那个弦子打酱油的故事还有第二部分。
    他端着一碗底的酱油回到家里，母亲问道：“孩子，两角钱就买这么点酱
6’I
飘翟翟型
油吗’”他很得意地说：“碗里装不下，我把剩下的装碗底了。你着什么急呀，
这面还有呢!”说着，孩子把碗翻过来，碗底的那一点酱油也洒光了。
    古人说，人非圣贤，孰能无过。意思是说每个人都会犯错误，即使圣贤
如孔子，也还是犯过“以貌取人，失之子羽”的错误。可是做错了以后应该
如何面对，却直接关系到为错误付出的代价。
    一旦做错了一件事，这件事也就算结束了。我们在检讨过之后，就必须
全力以赴地去做下一件事。人生就像跨栏赛．我们不应该碰倒栏杆，但是少
碰倒一个栏杆也不会有额外的加分，我们只要在最短的时问内跳过去就是了。
如果一味地为碰倒的栏杆而惋惜和后悔，最终的成绩必然会大受影响。
    曾经读过这样一篇发人沉思的故事。一个年轻人离开故乡，开始创造自
己的前途。他动身前，去拜访本族的族长，请求指点。老族长听说本族有位
后辈开始踏上人生的征途，就写了三个字：不要怕。然后望着年轻人说：“孩
子，人生的秘诀只有六个字，今天先告诉你三个，供你半生受用。”
    30年后．这个从前的年轻人已是人到中年，有了一些成就，也添了很多
伤心事。回到了家乡，他叉去拜访那位族长，才知道老人家几年前已经去世。
家人取出一个密封的信封对他说：“这是族长生前留给你的．他说有一天你会
再来。”他拆开信封，里面赫然又是三个大宇：不要悔。
    既然已经错了，就不要一味地懊悔，在错误中不停地缠绵，而必须要有
“不悔”的勇气与智慧，放弃那些已经无可挽回的东西。要帮助自己做出这
样的决定。需要转换一个角度来看问题．考虑在役有付出成本或者付出成本
比较低的情况下会如何决策．是一个很有效的“药方”。
    你以每股8元买进一支股票，但现在价格是每股6元，你应该抛售吗?
做这个决策时．你要换位思考一下：假如我是以每股4元或者每股2元买人
这支股票的．我会如何决策呢，如果打算卖掉的话，就证明你对这支股票的
前景并不看好，所以最好还是抛了它。如果你看好这支股票的前景．那体现
在就不应把它出手。在一些大的项目上面，实际上也应该动用这种思维方式。
    亿万富豪张果喜原计划在海南投资两亿元，兴建果喜太酒店。在工程兴
建一半时．正赶上国家宏观政策调控．海南的旅游市场也随之不景气。张果
喜说：“当时我意识到．海南的旅游市场还需要几年的调整期，此时如按计划
116。
协和谬误：欲罢不能的困局
继续投资，定会给企业带来高额亏损。”
    当你知道已经做了一个错误的决策时，就不要再对已经投入的成本斤斤
计较，而要看对前景的预期如何。对前景的观望，使张果喜做出了一个明智
的决定：暂时放弃。
    当你知道有些酱油已经洒掉了，无法挽回了的时候，最明智的就是抑制
住把碗再翻过来的冲动。因为这种冲动，有可能把你剩在碗底的那一点酱油
也搭进去。
    为了平衡，我们既不要被太多的选择所困扰，也不要为那些做过和没有
做过的事情而难过。从我们当下所做的事，当下所在的地方寻找成功，关键
就在于端住自己的碗。不要试图去看另一面。
要考虑机会成本
    东汉陈着，字仲举，少年时期曾经在外地求学．独居一室，整天读书交
友而顾不上收拾屋子，院子里长满杂草。在一次，他父亲的朋友薛勤前来看
望他．同他：“你为什么不把院子打扫干净来迎接宾客呢?”陈蕃笑了笑说道：
“大丈夫处世．当扫除天下，安事一屋?”薛勤听了生气地反驳道：“一屋不
扫，何以扫天下，”
    一般人讲这个故事，就到此为止了，大都为了申明“做好大事就要从做
好小事开始”的道理。但是如果不知道后事如何，很容易就将陈蕃当做了反
面典型。
    事实上，陈著史称“不凡之器”，其言其行可圈可点之处很多。《世说新
语》开篇第一句话就是：“陈仲举言为士则，行为世范，登车揽誊，有澄清天
下之志。”意思是说他言谈是读书人的榜样。行为是世间的规范。而且，他后
来官至太傅．为人耿直．为官敢于坚持原则．并广为搜罗人才．士人有才德
者皆大胆起用．一时间使政事为之一新。可以说，陈蓉将天下也扫得不错，
在历史上留下了赫赫英名。
    而那位因批评陈蕃而留下“一屋不扫，何以扫天下”千古名言的薛勤．
我们反倒不知道他后来完成了什么事业。甚至．我们知道这个名字，也还是
69 I
、E√    博弈论的曲}
因为胨著，这不能不说是一种绝妙的讽刺。为什么陈蕃一屋不扫能做成一番
事业，而薛勤熟知清扫庭院的道理最终却藉藉无名呢?
    答案很简单：做任何事情都有一种机会成本，做小事所付出的机会成本
是完成大事-而做大事的机会成本是每件小事做得完美。
    在经济学上，机会成本的定义是：为选择最优方案丽放弃的次优方案的
价值。从更宽泛的角度来理解，机会成本是选择某～特定方案放弃的其他各
种可行方案的可能收益之平均值。比如说，10万元钱投资于房地产可获得刺
润20万，投资于股票市场可获得利润15万，如果把这lO万元钱投资于房地
产·那么可以从股票市场得到15万就是其机会成本，如果把这IO万元投资
于股票·那么可以从房地产投资中获得的20万就是其机会成本。
    事实上，机会成本并不会真的出现在任何财务账面上，但它是我们选择
某一方案、方向、道路时考虑重点因素之一。经济学家汪丁丁曾经说：可供
选择的机会越多，选择一个特定机会的成本就越高，因为所放弃的机会，其
所值随著机会的数量增加而增加。
    在生活中．因为资源的稀缺性。在几件事无法彼此兼容的情况下，我们
会选择一个净收益最大的事情。所谓“鱼，我所欲也；熊掌，亦我所欲也：
二者不可得兼·舍鱼而取熊掌也”。我们愿意做任何事的前提，都是认为这件
事的收益大于成本．但是这种事情很多，这时就需要做出选择。
    有些选择在生活中很常见，比如是继续工作，还是先去吃饭；是在这家
商店买衣服还是在那家；是买红色的衣服，还是蓝色的。我们都能轻松地做
出经验判断式选择，也不大去慎重考虑。同时，打扫院落还是梳妆打扮之类
的小事情t意味着收益比较小或者决策正确与失误导致的收益差别不大。考
虑太多付出精力，反而得不偿失，或者说是不经济的，用经验或直觉来选择
没有任何问题。
    但是有一些事，进对与选错的收益相差非常大，甚至关系到我们一生的
走向。正如作家柳青所说“人生的路很漫长，但紧要关头常常只有几步”。此
时-选择哪一个，放弃哪一个，就必须认真权衡。如果役有选择的机会．就
意味着没有选择的自由，就不会有机会成本。然而可供选择的道路越多．选
择某一特定道路的机会成本越大．因为所放弃的机会之数量和价值也越多了。
1170
协和谣误：欲罢不能的困局
机会成本越高，选择越困难。
    那么，在这个权衡的过程中．又应该如何计算机会成本呢’
    对于那些不愿意放弃任何东西的人来说，让他们自己选择往往是一件很
痛苦的事，他们宁愿没有选择的权利。也正因如此，他们往往会做出各种逃
避的选择，做一些顺理成章的事情，不愿意放弃很多小事情．因而也就无法
选择那些真正对人生有益的大事。
    但是任何事情，包括那些值得做和不值得做的事．都会赋予自己以生命，
从一项单纯的偶然行为，逐渐演变为有规律的活动。一段时间之后．人们会
说：“我们不应该让它消失，我们已经做这么久了。”这就像有的人明明不喜
欢自己的恋人，却还是要在一起，因为在一起很久了．习惯使人不愿再做别
的选择．更何况这份感情的机会成本会随着时间的推移而不断增加。须知，
放弃和减少对其他成功的追求是一种成本．而谢绝其他人的追求和放弃爱
其他人的念头，也是不可忽视的成本。最终，一个人要为自己做了不值得做
的事付出代价，这件事情耗时越大，牵扯面越大，“内容”越丰富，代价也就
越大。
    美国哲学家爱默生曾经说：“愚蠢的坚持是心胸狭小者的心魔，被许多小
政治家、哲学家所崇拜。一旦有了这种坚持．一颗伟大的心灵就没有什么事
可做了。”
    中国人力资源开发网曾经牵头在全国范围内开展了一次“工作幸福指数
调查”，结果如下：
    (1)超过60％的人认为自己所在单位的管理制度与流程不合理。
    (2)超过50％的人对薪酬不满意。
    (3)超过50％的人对直接上级不满。
    (4)接近50％的人对自身的发展前途缺乏信心。
    (5)接近40％的人不喜欢自己的工作。
    (6)40．4％的人对工作环境和工作关系不满意。
    (7)33 6％的人工作量不合理。
    (8)26 3％的人工作与生活发生冲突。
    (9)19．6％的人工作职责不明确。
计
    (10)16 4％的人与同事的关系不融洽。
    (】1)Il 6％的人工作得不到家人和朋友的支持。
    (12)l】5％的人对工作力不从心。
    明知道自己现在所从事的工作根本无益身心，而且价值很低，甚至会腐
蚀我们的精力与精神，但是却无法摆脱。没有什么事可做并不是说无所事事．
是因为坚持着毫无价值的事情，却付出了完成真正属于自己的事业的机会成
本。在这个世界上，难道还有比这个更高的成本吗’
有勇气咬断后腿
    丹尼斯是美国野生动物保护协会的成员．为了搜集狼的资料，他走遍
了大半个地球。他在非洲草原曾目睹了一个狼和鬣狗交战的场面，经久难
忘。
    一个极度干旱的季节，在非洲草原许多动物因为缺少水和食物而死去了。
生活在这里的鬣狗和狼也面临同样的问题。狼群外出捕猎统一由狼王指挥，
而鬣狗却是一窝蜂地往前冲。鬣狗仗着狗多势众，经常从猎豹和狮子的嘴里
抢夺食物。狼和鬣狗都属犬科动物，能够相处在同一片区域．甚至共同捕猎。
可是在食物短缺的季节里，双方也会发生冲突。
    有一次，为了争夺被狮子吃剩的一头野牛的残骸，一群狼和一群鬣狗发
生了冲突。尽管鬣狗死伤惨重．但由于数量比狼多得多，也咬死了很多狼c
最后，只剩下一只狼王与5只鬣狗对峙。显然，双方力量相差悬殊．何况狼
王还在混战中被咬伤了一条后腿。那条拖拉在地上的后腿成为狼王无法摆脱
的负担。
    面对步步紧逼的鬣狗，狼王突然回头一口咬断了自己的伤腿，然后向离
自己最近的那只鬣狗猛扑过去，以迅雷不及掩耳之势咬断了它的喉咙。其他4
只鬣狗被狼王的举动吓呆了．都站在原地不敢向前。终于，4只鼍狗拖着疲惫
的身体一步一摇地离开了怒目而视的狼王。
    当危险来临时，狼王能毅然决然咬断后腿，让自己毫无牵累地应付强敌。
这很值得人类学习。实际上在我国的历史典籍《战国策》中。也有一个与之
117。
协和谬谖；欲罢不能的困局
十分相似的“虎怒决蹯”的故事。
    在山问小路上．有一只老虎误踏进了猎人设置的索套之中，挣扎了很长
时间，都没能使自己的脚掌从索套中解脱出来。眼见着猎人一步一步逼近，
老虎奋力咬断了那条被套住的腿．忍痛离开这危机四伏的危险地带。
    面对危险境地．这只老虎懂得牺牲一条腿来保全生命．这是一个十分无
奈但是也十分聪明的选择。可是很多比老虎更为高级的人，却往往没有这样
的勇气和智慧．往往陷入“鳄鱼法则”的陷阱。
    所谓鳄鱼法则．是指假若一只鳄鱼咬住你的脚，而你用手去试图挣脱你
的脚，鳄鱼便会同时咬住你的脚与手。你愈挣扎，被咬住得就越多。实际上，
明智的做法应该是：一旦蜉鱼咬住了你的脚，你唯一的办法就是牺牲一只脚。
鳄鱼法则就是：当你发现自己的行动背离了既定的方向，必须立即止损．不
得有任何延误，不得有任何侥幸。
    老虎断了一只脚自然是很痛苦的，但是因此而保全了性命。美国通用公
司的前cEo杰克·韦尔奇曾经把许多业绩不在业界前两名的事业部门关闭．
这些都是痛苦的决定，但是为了整体的利益，他们都当机立断．拿出勇气和
魄力来进行壮士断腕式的放弃。可是很多人在生活中会下意识地“把手伸进
鳄鱼嘴里”，他们无法放弃或停止已经失去价值的事情。
    要摆脱沉收成本的羁绊，除了上面所讲的一些决策方面的知识之外．还
有一样东西是十分重要的．那就是勇气。有勇气在一些事情的沉没成本变得
不可接受之前．及时放弃它。麦肯锡资深咨询顾问奥姆威尔·格林绍说：“我
们不一定知道正确的道路是什么．但却不要在错误的道路上走得太远。”这句
话可以说是对鳄鱼法则的经典概括。
    唐代李肇的《国史补》中有这么一则故事。通往渑池的路很窄，有一辆
载满瓦瓮的车陷进了泥坑．堵塞了道路。正值天寒，冰封路滑，进退不得。
拖延到黄昏，后面积聚了数千车辆人众。这时，一位叫刘颇的商人从队伍的
后面扬鞭而至，看到瓮车的主人仍然在做着近乎无谓的努力．企图拉出在泥
坑里越陷越耀的车。刘颇上前询问车的主人：“你车上载的瓮一共值多少钱’”
主人回答说：“七八千。”刘颇马上吩咐仆从取来自己车上载的粗帛，按这个
价钱付给车的主人，然后命人登车解绳，把车上的瓮全部推落路边的崖下。
’5 I
博弈论的蘑
车辆空载以后马上出了泥坑向前行，道路也就立刻畅通了。
    当机立断，以七八千钱，解数千车辆人众困厄，此事显示出古人刘颇出
众的眼界和气魄。后来诗人元稹在《刘颇诗》赞叹说：“一言感澈士，三世义
忠臣。破瓮嫌妨路，烧庄耻属人。迥分辽海气，闲踏洛阳尘。傥使权由我，
还君自马律。”其中“破瓮嫌妨路”一句，说的就是这个典故。
生活如一袋豌豆
    有一位外国作家曾经说：生活就如一袋豌豆．说不定什么时候它会洒落
在地，但这不是什么大不了的事情。起初．你可以将那些容易看见的豌豆拢
到一起．装人口袋；此后．随着时间的推移，你会慢慢地发现那些藏身隐秘
角落、不易找到的豌豆；最后，你会把所有散落的豌豆收人袋中。
    宋代女词人李清照和丈夫赵明诚，是中国历史上有名的收藏家。他们生
活在一个江河日下、风雨飘摇的时代，太朱王朝经过168年的和平繁荣之后，
富丽堂皇的迷梦被金兵呼啸而来的马蹄踏得粉碎。
    徽、钦二帝被掠，皇亲贵族仓皇南逃，李清照夫妇也饱受国破家亡之苦．
辗转南渡，流离几千里，时间长达8个月之久。他俩穷半生之力．倾全部家
产所收藏起来的金石、书画、典籍，带不走只好忍痛任其失散。过江以后，
在兵荒马乱中．夫妻叉要分开，根据《金石录后序》记载，建炎三年，李清
照与赵明诚告别时，不得不问，世道不靖，万一碰上兵燹，该如何处理侥幸
带出来的一点东西?赵明诚告诉妻子．如果时局愈来愈紧，不得不跟着大家
一块儿逃难．为了轻便．可以先把辎重钱财丢掉．然后抛弃衣被；如果还不
得已，即将收藏中的书册卷轴扔掉；再不得已。只好牺牲古器物，唯有最后
一点金石，必须要随身携带，万不得巳时宁可抱着跳江，也不能将之失去。
    对于狼王来说，如果承受不了咬去无法救治的后腿的痛苦，那么就有失
去生命的危险!为了生命．除了抛弃身外之物，它还必须抛弃身体的一部分。
    对于人来说，当我们遇到比生命更宝贵的事物时．固然必须牺牲生命。
但是有些东西是我们牺牲生命也无法避免的损失．比如亲人突然去世。你以
为自己是世上唯一不幸的人，感到难以撑过艰难时期时，这时请记住：破碎
r
协和谬误：欲罢不能的困局
的生活只是暂时的．完整的人生还要我们继续刨造。
    除了这种生离死别的痛苦，在生活中经常会遇到的，是那些为顾全大局
而必须牺牲小处的情况。这时，我们仍然必须不断地权衡轻重得失，以决定
牺牲的分量和等级。为了工作．我们可以牺牲娱乐；为了孩子我们可以牺牲
睡眠，诸如此类，无不需要理性的权衡与牺牲。
    有一天．一个孩子看到一枚闪亮的硬币躺在路边。他把硬币拾起来紧紧
握在手里，心里充满自豪：“这枚硬币是我的了f而我什么代价也不用付出!”
    从此，这个孩子无论走到哪里，总是喜欢低着头，眼睛盯着地面，希望
发现更多的硬币。功夫不负有心人，一生中他捡到了302枚一分硬币，24枚
5分硬币、41枚一角硬币、8枚2角5分硬币、3枚5角硬币和一张破损的l
元纸币——总计12元8角2分。
    捡到这些钱，虽然他什么代价也没付出．但他为此却错过了许多人间美
景：35 127次牡丽的日落美景，327次绚丽的彩虹；上百片在秋风中摇曳的红
枫叶，卜百个在草地上蹒跚学步的儿童；在碧蓝的天空飘过的白云和擦肩而
过的陌生人对他友好的微笑
    太多的人和这个无知的孩子一样，为了几个铜板，错过了无数更有价值
的珍宝。他们的一生，都被拖人平庸与无趣的泥潭中。其中的机会成本．他
们永远也不会知道。
放弃愚蠢的坚持
    有一人在农村老家1日屋子的麦缸里，发现了一只死老鼠。经过一番勘察，
他明白了“悲剧”的前因后果。这只老鼠因为偷吃麦子，掉进了缸里爬不出
来。但这是一只坚强而有主见的老鼠，它开始在缸底咬起来，终于咬了一个
洞。但它没有想到的是，它咬透的洞正好被一根粗大的圆木顶住。于是它叉
开始咬这条粗木。可是方向却是顺着圆术的中心。它咬了二尺多深．终于叉
饿又渴，精疲力竭地退回到缸里，力竭而死。
    在为这只坚忍不拔的老鼠惋惜的同时，我们也得到一些有益的启示：有
时放弃比坚忍不拔更重要。当我们在人生的路上举步维艰时．所要做的或许
’5 I
离-譬鲨型
并不是坚持到底，一条路跑到黑；而是停下来想一想，观察一下，问一问自
己：选择的这个方向对不对，是不是已经到了应该放弃的时候?管理学家菲
尔茨曾经说：如果一开始没成功，再试一次．仍不成功就应该放弃．愚蠢的
坚持毫无益处。
    心理学研究表明，人们天生有一种做事有始有终的驱动力。请试画一个
圆圈．在最后留下一个小缺口．现在请再看它一眼，你有一种冲动要把这个
圆完成。这就是“趋合心理”．是促使人们完成一件事的内驱力的原因之一，
    1927年，心理学家蔡戈尼做了一个试验。她将受试者分为甲乙两组，让
他们同时演算相同的并不十分困难的数学题。让甲组一直演算完毕．而在乙
组演算中途，突然下令停止。然后让两组分别回忆演算的题目。结果，乙组
记忆成绩明显优于甲组。这是因为人们在面对问蹶时，往往全神贯注．一旦
解开了就会松懈下来．因而很快忘记。而对解不开或尚未解开的问题．则要
想尽一切办法去完成它，因而一直潜藏在大脑里。
    这种心态叫“蔡戈尼效应”：人们之所以会忘记已完成的工作．是因为欲
完成的动机已经得到满足；如果工作尚未完成，这种动机因未得到圆满而给
人留下深刻印象。
    对大多数人来说，蔡戈尼效应是完戚工作的重要驱动力。但是有些人会
走向极端，内驱力过强，非得一口气把事做完不可。比如被一本间谍小说迷
住了．哪怕明天早上还有一个重要会议，读到凌晨4点也手不释卷。如果是
这样，就需要调整这种过强的完成驱动力，否则就可能成为时间管理的障碍。
    一个经常不把工作做完的人，至少能够保留一定的时间和精力．可能生
活得丰富多彩；一个非把每件事都做完不可的人，驱动力过强，可能导致生
活没有规律、太过紧张和狭窄。对于后者来说，只有减弱过强的驱动力，才
可以一面做事一面享受人生。改变不傲完不罢休的态度，不仅使你能在周末
离开办公室。还有时间去应付因工作带来的问题：自我怀疑、感觉自己能力
不够或过度紧张，等等。
    我们为了避免半途而废，很可能冒着把自己封死在一份没有前途的工
作上的危险。兴趣一旦变成狂热，就可能是一个警告信号，表示过分强烈
的完成驱动力正在渐渐主宰你的生活。有人会强迫自己织完一件毛衣，结
1176
    堡塑堡堡：塑墨至矍塑堕旦l__
果虽然不喜欢那件毛衣，但却觉得非穿它不可。对于有些事，不应该害怕
半途而废。
    以下几个问题可以告诉我们是应该坚持还是放弃：可以获得更多的信皇
和帮助吗’是否有无法克服的阻力?比如我们希望在一个公司里步步高升，
但是公司里高层全部是家族成员。可能的回报是多少?我们值得为lO万元进
行一年的努力，但却不值得在一个只能创造几元钱利润的客户身上浪费三个
小时。未完成计划或维持现状需要付出多少7是否有足够的本钱等待回报?
很多人在巨大回报出现之前的那一刹那倒下，因为没有足够的资本坚持等待。
我们是否在维持一种必然没有回报的现状'如果一个同事答应帮助我们却食
言．那么就要调查一下他是否经常食言。如果是．就应该断绝这种过高代价
的关系；如果不是，那么就宽容一次。是否在参加结局早已决定的竞争々在
有些比赛和选拔中，早就有了内定人选，无论我们有多努力也投有任何机会，
那么就别在这种不诚实的竞争中“陪太子读书”。
    我们要想成功，必须学会把脱缰之马一般的完成驱动力抑制住。运用自
己的价值观标准，如果发现一个工作计划不值得做，那么就勇敢地放弃。我
们可以先从小事来训练自己．比如强迫自己在洗碗槽里留下几只碟子不洗；
看一本书的时候，尝试停一下，想想自己是否在浪费时间和精力．还要不要
继续看下去7
强迫自己去成功
    一位新移民刚到澳大利亚的时候，为了寻找一份能够糊口的工作．他骑
着一辆白行车沿着环澳公路走了数日，替人放羊、割草、收庄稼、洗碗…
一次，在一家餐馆打工时，他看见报纸上一家公司的招聘启事。他权衡了一
下．就去应聘。过五关斩六将，眼看就要得到那个年薪几万元的职位了，经
理问他：“休有车吗7你会开车吗?我们这份工作要时常外出，没有车寸步难
行。”在澳太利亚．公民普遍都有私家车，没车的人寥寥无几。可这位移民刚
到滇大利亚不久．哪里有钱买车学车呢?然而，他定了定神回答道：“我有!
我会!”经理说：“那好吧，你被录取了。四天后，开车来上班。”
彝论的落舻
    为了生存，他在一位朋友那里借了几千澳元。从旧车市场买了一辆二手
车。第一天他跟朋友学简单的驾驶技术；第二天在一块大草坪上摸索练习；
第三天歪歪斜斜地开着车上了公路；到了第四天，他居然驾车去公司报了到。
时至今日，他已是这家公司的业务主管了。
    当你面对一堵很难攀越的高墙时，不妨先把帽子扔过墙去。将帽子扔过
墙去．就意味着你别无选择，为了找回帽子，你必须翻越这堵高墙，毫无退
路可言!正是面临这种无退路的境地时，人们才会集中精力奋勇向前。不给
自己留退路．从某种意义上讲，也是给自己一个向梦想冲锋的机会。
    既然正常人通常会陷入沉没成率误区，我们也可以巧妙地利用沉没成本
谬误。上面这个故事，我们可以视为转换角度利用沉没成本，来强迫自己成
功的一个例子。
    本章谈到那么多例子，都是因为沉没成本的存在而舍不得理性地放弃。
但是碰到一些不理性的放弃冲动时，沉没成本又可以把你往理性的方向拉一
把，这时候它可以使人们的行为更加有目的性。
    很多女性都会为自己制定一个健身计划，比如每周至少去三次健身俱乐
部跳有氧操，但是大多数都不能按原锻炼计划实施。因为总是有很多事情占
用掉她们的时问。为了有计划、有规律地进行锻炼，给自己制造一个沉没成
本!在每月初甚至每个季度初把所有费用预先支付，并且不可以退费，这样
在嫌麻烦不愿意去锻炼的时候，也会因为已经付了钱而改变主意．还是去健
身。
    一旦在某个城市找到一份工作．那么，换个地方重新安置下来的代价就
会很高；一旦买了一台电脑，学会了怎样使用其操作系统．那么．再去学另
一种操作系统．其代价会变得很高；同样，参加了一家电信公司的积分计划
的人换一家公司，代价也很高。问题在于．一旦做出了类似的承诺．比如接
受了工作或结了婚，讨价还价地位就会被削弱。如果我们回顾一个沉没成本
部分，就很容易理解这一点。
    因此，如果你是公司老板，那么就可以利用员工预期的搬家成本高，向
他们支付较低薪水或降低加薪幅度。如果你是卖电脑的，那么就可以给新面
市的可兼容的外围设备标出更高的价码，因为你的顾客不会轻易转向同样是
1178
协和谬误：欲罢不能的困局
新面市但是却不兼容的技术。
    还有一个有趣的例子。一个女孩子想把男朋友永远留在自己身边，那么
她该怎么做呢7当然，她有很多的办法．但是有一个一举两得的办法是大
家都不容易想到的，就是多多地让男朋友请她吃饭，给她买东西。久而久
之，她的男朋友会觉得已经在她身上投入了太多的“成本”，就更加舍不得离
开她了。
’9 I
第1 3章
蜈蚣博弈：从终点出发的思维
回头想想心情已经停摆太欠
除了爱似乎我一无所有
不是速离不是剖意追求什么
只听见风中有声音呼唤我
——《回头想想》歌词
强盗们如何分赃
    战国时．秦宣太后曾经有过许多的情夫，而最后一位。也是最出名的一
位名叫魏丑夫。她后来生病快要死了，拟了一条遗命：“如果我死了，要用魏
丑夫为我殉葬。”
    爱可以是无私的奉献，不过一般人的爱都是自私的，更何况这种自始就
动机可疑的爱情。魏丑夫万万想不到会有这等事，马上忧愁得坐卧不宁。一
个叫庸芮的出面为魏丑夫劝说太后，庸芮说：“太后您认为人死后，冥冥中还
能知觉人间的事情吗?”太后说：“人死了当然什么都不知道了。”庸芮叉说：
“像太后这样圣明，明知道人死了不会有知觉．为什么还要平白无故地把自
己所爱的人置于死地呢9倘若死人还知道什么的话，那么先王(秦惠文王)
这几十年来，在地底下怒火不知已经积聚了多少。太后您去了阴世，补过还
来不及．哪还有机会跟魏丑夫寻欢作乐7万一让先王看见了魏丑夫，岂不是
更要惹出大麻烦来?”太后想了想，就断了用魏丑夫殉葬的念头。
蜈蚣博弈：从终点出技的思维
    庸芮的一段话之所以有说服力，是因为他假设前景，来向回推导说明将魏
丑夫殉葬的不明智。他知道太后已经被爱情烧得发昏．正常的道理是听不进去
的．只有用这种对“危险”的提示，才能让她有所醒悟。
    这种方法在博弈论上有一个名字，叫做“倒推法”。
    围棋是对奔双方一人一步的相继行动的博弈，每个参与者都必须向前展
望或预期．估计对手的意图．从而倒后推理，决定自己这一步应该怎么走。
这是一条线性的推理链：“假如我这么做．他就会那么做——若是那样，我会
这么反击……”也就是说，你怎么走棋．完全取决于对手的上一招。
    这里存在一条线性思维链：假如我这么做，我的对手可以那么做，反过来我
应该这样应对…这种博弈通过描绘博弈树，只要遵循“向前展望——倒后推
理”的法则．就能找出最佳行动方式。那么我们怎样预见相继行动的博弈结果
呢?
    大多数人基于社会常识，预测一场成功谈判的结果就是妥协。这样的好
处是能够保证“公平”。事实上．一个50 50的妥协也是倒后推理的结果。首
先．我们必须知道谁向谁提出了一个什么条件．也就是这个博弈的规则是什么；
接着，我们还要知道，假如各方不能达成一个协定，将会导致什么后果。
    如果你对自己的头脑很有自信，来分析下面这个问题。有5个海盗抢得
100枚金币，在如何分赃阀题上争吵不休。于是他们决定：
    (1)抽签决定各人的号码【1，2，3．4．5】。
    (2)由1号提出分配方案，然后5人表决，如果方案超过半数同意就被
通过．否则他将被扔进大海喂鲨鱼。
    (3)l号死后，由2号提方案，4人表决．当且仅当超过半数同意时方
案通过，否则2号同样被扔进大海。
    (4)依次类推，直到找到一个每个人都接受的方案。如果只剩下5号，
他当然接受一人独吞的结果。
    假定每个强盗都是能很理智地判断得失的“理性人”。为了避免不必要的
争执，我们还假定每个判决都能顺利执行。那么，如果你是第一个强盗，你
该如何提出分配方案才能够使自己的收益最大化7
    这道题十分复杂，很多人的答案都是错的。为了叙述方便，我们先公布
簿奔论的塘舻
答案，然后再做分析。严酷的分配规则给人的第一印象是：如果自己抽到了1
号．那将是一件不幸的事。因为作为头一个提出方案的人．能活下来的机会
都微乎其微。即使他自己一分不要，把钱全部送给另外4人，那些人可能也
不赞同他的分配方案，那么他只有死路一条。
    如果体也这样想，那么答案会大大出乎你意料：1号强盗分给3号1枚金
币．4号或5号强盗2枚，独得97枚。分配方案可写成【97，0．1．2，0减【97，
0，l，0，2】。
    只要你没被吓坏，不妨站在这四人的角度分析：显然，5号是最不合作的，
因为他没有被扔下海的风险．从直觉上说．每扔下去一个潜在的对手就少一
个；4号正好相反，他生存的机会完全取决于前面还有人活着，因此此人似乎
值得争取：3号对前两个的命运完全不关心，他只需要4号支持就可以了；2
号则需要3票才能活，那么，你…思路对头，但是太笼统了。所以，应该
按照严格的逻辑思维去推想他们的决定。
    从哪儿开始呢?前面我们提过“向前展望，倒后推理”，推理过程应该是
从后向前，因为越往后策略越容易看清。5号的策略最简单：巴不得把所有人
都进去喂鲨鱼(但这并不意味着他要对每个人投反对票．他也要考虑其他人
方案通过的情况)。来看4号：如果1～3号强盗都喂了鲨鱼，只剩4号和5
号的话．5号一定投反对票让4号喂鲨鱼。以独吞全部金币。所以．4号唯有
支持3号才能保命。3号知道这一点，会提出f100，0，0】的分配方案．对4
号、5号一毛不拔而将全部金币归为己有，因为他知道4号一无所获还是会投
赞成票．再加上自己一票他的方案即可通过。不过．2号推知3号的方案．就
会提出[98，0，l，1]的方案，即放弃3号．而给予4号和5号各1枝金币。
由于该方案对4号和5号来说比在3号分配时更为有利，因此可以得到他们
的支持。这样，2号将拿走98枚金币。不过，2号的方案会被1号所洞悉，l
号并将提出【97，0．1，2，0】或【97，O，1，0，2】的方案，即放弃2号，而给
3号l枚金币．同时给4号或5号2枚金币。由于l号的这一方案对于3号和
4号或5号来说，相比2号分配时更优，得到他们的赞成票．再加上1号自己
的票．1号的方案可获通过．97枚金币可轻松落人腰包。这无疑是1号能够
获取最大收益的方案了!
1182
簿奔论的塘舻
答案，然后再做分析。严酷的分配规则给人的第一印象是：如果自己抽到了1
号．那将是一件不幸的事。因为作为头一个提出方案的人．能活下来的机会
都微乎其微。即使他自己一分不要，把钱全部送给另外4人，那些人可能也
不赞同他的分配方案，那么他只有死路一条。
    如果体也这样想，那么答案会大大出乎你意料：1号强盗分给3号1枚金
币．4号或5号强盗2枚，独得97枚。分配方案可写成【97，0．1．2，0减【97，
0，l，0，2】。
    只要你没被吓坏，不妨站在这四人的角度分析：显然，5号是最不合作的，
因为他没有被扔下海的风险．从直觉上说．每扔下去一个潜在的对手就少一
个；4号正好相反，他生存的机会完全取决于前面还有人活着，因此此人似乎
值得争取：3号对前两个的命运完全不关心，他只需要4号支持就可以了；2
号则需要3票才能活，那么，你…思路对头，但是太笼统了。所以，应该
按照严格的逻辑思维去推想他们的决定。
    从哪儿开始呢?前面我们提过“向前展望，倒后推理”，推理过程应该是
从后向前，因为越往后策略越容易看清。5号的策略最简单：巴不得把所有人
都进去喂鲨鱼(但这并不意味着他要对每个人投反对票．他也要考虑其他人
方案通过的情况)。来看4号：如果1～3号强盗都喂了鲨鱼，只剩4号和5
号的话．5号一定投反对票让4号喂鲨鱼。以独吞全部金币。所以．4号唯有
支持3号才能保命。3号知道这一点，会提出f100，0，0】的分配方案．对4
号、5号一毛不拔而将全部金币归为己有，因为他知道4号一无所获还是会投
赞成票．再加上自己一票他的方案即可通过。不过．2号推知3号的方案．就
会提出[98，0，l，1]的方案，即放弃3号．而给予4号和5号各1枝金币。
由于该方案对4号和5号来说比在3号分配时更为有利，因此可以得到他们
的支持。这样，2号将拿走98枚金币。不过，2号的方案会被1号所洞悉，l
号并将提出【97，0．1，2，0】或【97，O，1，0，2】的方案，即放弃2号，而给
3号l枚金币．同时给4号或5号2枚金币。由于l号的这一方案对于3号和
4号或5号来说，相比2号分配时更优，得到他们的赞成票．再加上1号自己
的票．1号的方案可获通过．97枚金币可轻松落人腰包。这无疑是1号能够
获取最大收益的方案了!
1182
    难以置信，是不是?难道上面的推理真是毫无破绽吗?其实，除了无条
件支持3号之外，4号还有一个策略(这是许多专家都没有考虑到的)：那就
是提出【0，i00】的方案，让5号独吞金币，换取自己的活命。如果这个可能成
立的话(不要忘了“完全理性”的假定，既然可以得到所有钱，5号其实并不
必杀死4号)，那么3号的【100，0，0】策略就显然失败了。4号如果一文不得，
他就有可能投票反对3号，让他喂鳖鱼。
    但是作为理性人的4号为什么要做“损人不利己”的事呢'而且，这多
少还要冒可能被扔下海的风险。可是，如果大家都是理性人，5号在得钱后可
以不杀死4号．那么对4号来说，投票赞成和投票反对3号都是一样的。3号
当然不应该把希望寄托在4号的随机选择上。因为5号还是可能在不必要的
情况下杀死4号，那么4号也不该冒这个风险；同理．3号也不该冒没有必要
的风险。无论是哪种情况，他都应该给4号l枝金币，使其支持自己。这样3
号的“保险方案”就是【99，l，0l；相应的，2号的方案也要修改一点，比3
号多给4号l枚。使其支持自己，也就是【97，0．2，l】。对于1号来说，倒
是不必多掏钱．而是减少了两枚金币收买4号这一种可能性。“标准答案”只
剩下了一种。即【97．0，1，0，2】。当然，他也可以选[96，0，l，3，0】，但
是由于收买4号要比收买5号多花l枚金币．所以也就算不上最佳方案了。
人生的倒后推理
    古希腊有一则寓盲，说是一个人面对自己的命运感到非常茫然无措。他
向宙斯抱怨道：“主宰万物的神啊!我是如此虔诚地信奉着你．可为什么不幸
的命运还是会降临到我的头上?”宙斯说：“所有的人都很不幸。但最不幸的
是那些用不幸来装饰自己的人。当命运到来的时候，你无可选择．你是注定
要被命运选择的。”这人同道：“可是．当我在被选择之后．我又该做些什些
呢?”宙斯答道：“在被选择之后，你就要开始选择了。”
    曾经刨下台湾空前的震撼与模仿热潮的歌手李恕权，是唯一获得格莱美
音乐大奖提名的华膏流行歌手，同时也是“Bill board杂志排行榜”上的第一
位亚洲歌手。他在《挑战你的信仰》一书中，详细讲述了自己成功历程中的
蜈蚣博彝：从终点出发的思维
一个关键情节。
    1976年的冬天，19岁的李恕权在休士顿太空总署的太空梭实验室里工作，
同时也在休士顿大学主修电脑。纵然学校、睡眠与工作几乎占据了他大部分
时间，但只要稍微有多余的时间，他总是会把所有的精力放在音乐创作上。
    一位名叫凡内芮的朋友在他事业起步时给了他最大的鼓励。凡内芮在德
州的诗词比赛中不知得过多少奖牌。她的写作总是让他爱不释手，他们合写
了许多很好的作品。
    一个星期六的周末，凡内芮叉热情地邀请李恕权到她家的牧场烤肉。凡
内芮知道李对音乐的执著。然而．面对那遥远的音乐界及整个美国陌生的唱
片市场，他们一点门路都没有。他们两个人坐在牧场的草地上，不知道下一
步该如何走。突然间，她冒出了一句话：
    “想像你五年后在做什么。”
    她转过身来说：“嘿!告诉我，你心目中‘最希望’五年后的你在做什么，
你那个时候的生活是一个什么样子?”他还来不及回答，她叉抢着说：“别急．
你先仔细想想，完全想好，确定后再说出来。”李恕权沉思了几分钟，告诉她
说：“第一，五年后，我希望能有～张唱片在市场上，而这张唱片很受欢迎，
可以得到许多人的肯定。第二．我住在一个有很多很多音乐的地方，能天天
与一些世界一流的乐师一起工作。”凡内芮说：“你确定了吗?”他十分坚定
地回答，而且是拉了一个很长的“Yesssssss”!
    凡内芮接着说：“好，既然你确定了，我们就从这个目标倒算回来。如果
第五年．你有一张唱片在市场上，那么你的第四年一定是要跟一家唱片公司
签上合约。那么你的第三年一定是要有一个完整的作品，可以拿给很多很多
的唱片公司听，对不对，那么你的第二年，一定要有很棒的作品开始录音了。
那么你的第一年．就一定要把你所有要准备录音的作品全部编曲，排练就位
准备好。那么体的第六个月，就是要把那些没有完成的作品修饰好，然后让
你自己可以逐一筛选。那么体的第一个月就是要有几首曲子完工。那么你的
第一个礼拜就是要先列出一整个清单，排出哪些曲子需要完工。”
    最后．凡内芮笑笑地说：“好了，我们现在不就已经知道你下个星期一要
做什么了吗，”
B5 l
博弈论的蓬}舻
    她补充说：“喔，对了。你还说你五年后．要生活在一个有很多音乐的地
方，然后与许多一流的乐师一起工作，对吗?如果你的第五年已经在与这些
人一起工作，那么你的第四年照道理应该有你自己的一个工作室或录音室。
那么你的第三年，可能是先跟这个圈子里的人在一起工作。那么你的第二年．
应该不是住在德州，而是已经住在纽约或是洛杉矶了。”
    1977年．李恕权辞掉了太空总署的工作，离开了休士顿，搬到洛杉矶。
说来也奇怪，虽然不是恰好五年，但大约可说是第六年的1982年，他的唱片
在台湾及亚洲地区开始畅销起来，他一天24小时几乎全都忙着与一些顶尖的
音乐高手一起工作。他的第一张唱片专辑“回”首次在台湾由宝丽金和滚石
联合发行。并且连续两年蝉联排行榜第一名。
    这就是一个五年期限的倒后推理过程。实际上还可以延长或缩短时问跨
度，但思路是一样的。
    当你在为手头的工作而焦头烂额的时候．一定要停下手来，静静地问一
下自己：五年后你最希望得到什么’哪些工作能够帮助你达到目标?你现在
所做的工作有助于你达到这个目标吗?如果不能，你为什么要做?只有你能
清清楚楚地回答这些问题时，休才能算是具备了学习人生博弈的最基本的条
件。如果无法回答这些问题，那么就需要检讨一下自己想要成为什么样的人。
    如果你没有清晰的目标，就会被诅咒一辈子，为那些有清晰目标的人工
作，事实就是如此。当你在人力资源市场上奔渡时，所追求的不是为了达成
自己的目标，而是努力为了达成别人的目标，就是这么简单。
    人生博弈的目的是在最短时间内更好地实现想要实现的目标，你必须把
目前年度的4～10个目标写出来，找出一个核心目标．并依次排列重要性．
然后依照自己的目标设定一些详细的计划，然后要做的唯一一件事情，就是
依照计划进行。如果根本就没有这样一个目标，那么一切都是一句空话。
从墓志铭想人生
    有三个人要被关进监狱三年．监狱长同意满足他们每人一个要求。美国
人爱抽雪茄，要了三箱雪茄。法国人最浪漫，要一个美丽的女子相伴。而犹
1186
蜈蚣博弈：从终点出发的思维
太人说，他要一部与外界沟通的电话。
    三年过后．第一个冲出来的是美国人，嘴里塞满了雪茄，大喊道：“给我
火，给我火!”原来他忘了要火。接着出来的是法国人。只见他手里抱着一个
小孩子，美丽女子手里牵着一个小孩子，肚子里还怀着第三个。最后出来的
是犹太人，他紧紧握住监狱长的手说：“这三年来我每天与外界联系．我的生
意不但没有停顿，反而增长了200％。为了表示感谢，我送你一辆劳施莱斯!”
    这个故事告诉我们．决定命运的是选择，而非机会。
    如果只能活六个月，你会做哪些事情昵々会更多地做哪些事情呢?会和
谁共同度过这六个月呢，这些答案将会告诉你真正珍惜的东西，以及自己认
为真正重要的东西。
    什么样的选择决定什么样的生活，你今天的生活是由三年前所做出的选
择决定的；而今天的抉择．却将不仅决定你三年后的，更会影响你最终离开
人世时的样子。这就是人生博弈的法则。
    你每个星期有168个小时．其中56个小时在睡眠中度过，21个小时在吃
饭和休息中度过，剩下的实际上只有91个小时，由你来决定做什么——每天
13个小时。每天在这13个小时里做什么，决定了你成为什么样的人。从更宏
观的角度来看，整个人生不过是从上苍手中借的一段岁月而已，大一岁就归
还一年，一直到生命终止。所不同的是所借到的时问长短不同而已。
    那么对这段借来的时光，你准备怎样应用呢，对于这个问题．多数人是
无法回答的，因为在没到准备离开这个世界的时候，是没有人认真思考这个
问题。为了帮助有探索意识的朋友了解这个问题，可以借助于一种假设的
场景。
    假设你正在前往墓地的路上．去向一位你最亲近的人做最后的告别。到
了之后，你却发现亲朋好友齐集一堂，却是为了来向你告别。这个场景也许
会在50年以后，也许会在10年以后，但无论如何，每个人都将面对这一幕：
朋友、同事来到基地．并且默默追思你的生平事迹。
    这时，你最希望他们对你做出什么样的评价呢?你最希望人们会记住你
这一生的什么成就和事迹呢’你最希望他们用什么样的目光来送别呢?这几
个问题归结到一个最简单的问题，那就是：你希望人们在你的墓志铭上写上
。’I
飘篁譬型
怎样的文字’
    18世纪的法国启蒙运动思想家孟德斯鸠的《波斯人信札》中．有一篇十
分有趣的文章，标题是《一个法国人的墓志铭》。文章的全文是这样的：
    “此地安息着一个生前从不曾得到安息的人。他曾经追随过530队送葬
行列。他曾经庆贺过：；680名婴儿的诞生。他用永远不同的词句，祝贺友人们
所得到的年俸，总数达到260万镑；他在城市所走的道路，总长9600斯大特
(古希腊色路的长度)。他在乡村间走过的路，总长36斯大特。他言谈多逸
趣．平时准备好365篇现成的故事。此外．从年轻时候起，他从古书中摘录
箴言警旬180条．生平逢机会，即以显擢。他终于弃世长逝．享年60岁。”
    这个法国人的一生．是很多人一生的基本写照。其中或许有这样那样的
差别，但都像墓志铭中的法国人一样整天沉醉于各种无聊的事情之中，最后
却一事无成。一个不能用博弈思维管理人生的人．整天忙碌却无法取得成就
的状态是大同小异的。
    你希望你的墓志铭和他一样吗·
    伍迪·艾伦曾经说过，生活中90％的时问只是在混日子。大多数人的生
活层次只停留在为吃饭而吃、为工作而工作、为回家而回家。他们从一个地
方逛到另一个地方，事情做完一件叉一件，好像做了很多事，但却很少有时
间从事自己真正想完成的目标。就这样一直到老死。很多人临到自己垂垂
老去的时候，才发现自己虚度了大半生，剩余的日子又在病痛中一点一点地
流逝。
    那么．要怎样度过一生，才能不算虚度呢々回答这个问题，可以帮助你
把所有生活层面的东西过滤。提炼出最根本的人生目标，发掘心底最根深蒂
固的价值观，决定人生目标的最核心部分。
    在非洲有这样一个民族，他们计算年龄的方法可以说是世界上独一无二
的。在这个民族中，婴儿一生下来．马上就得到60岁的寿命，以后逐年递减，
直到零岁。这种倒计时的方法，就好比以前人们用电话磁卡打电话时，将磁
卡插入话机时，显示器立该显求出卡中的数值，随着通话时问的延长，卡中
的数值不断减少。人生其实就如同一张小小的磁卡．不过因为数值跨度较长，
你经常会忘了不断减少的读数。
1188
蜈蚣牌弈：从终点出发的思维
    如果把人生看做是休与时间进行的一场博弈的话，那么倒计时的方法，
可以让你学会从终点出发来行动的策略思维，通过对整体人生的全盘构想和
倒后推理，来进行每天的自我管理，知道每一天有哪些事情是应该做的，哪
些行动是正确的。
蜈蚣博弈的悖论
    一个人打算向邻居借斧子，但又担心邻居不肯借给他，于是他在前往邻
居家的路上不断胡思乱想：“如果他说自己正在用怎么办7…‘要是他说找不
到怎么办?”想到这些，这人自然对邻居产生了不满：“邻里之间应该和睦相
处，他为什么不肯借给我?”“假如他向我借东西．我一定会很高兴地借给他。”
“可是他不肯借斧头给我，我对他也不应该太客气”    ·
    这人一路上越想越生气，于是等到敲开邻居的门后，他没有说“请把你
的斧子借给我用一下吧”，却张嘴说道：“留着你的破斧子吧，我才不稀罕你
的东西!”
    从上面这个笑话中，可以想像一些喜欢以己度人者在生活中遇到的尴尬=
但是笺过之后，我们却发现．这个借斧头的人所运用的思维方法．居然有着
倒推法的影子。
    难道倒推法真的有什么问题吗?答案是肯定的，这种悖论在博弈论中被
称为“蜈蚣博弈悖论”。很多学者已经用科学的方法推导出：倒推法是分析完
全且完美信息下的动态博奔的有用工具，也符合人们的直觉，但是在某种情
况下却存在着无法解释的缺陷。
    如下面这样一个博弈。两个博弈方A、B轮流进行策略选择．可供选择的
策略有“台作”和“不合作”两种。规则是：A、B两次决策为一组，第一次
若A决策结束，A、B都得n，第二次若B决策结束．A得Ⅱ-1而B得n+2：
下一轮则从A、B都得n+I开始。假定A先选，然后是B。接着是A．如此
交替进行。A、B之间的博弈欢数为一有限次，比如198次。如图13一l所示。
    由于这个博弈的扩展形很像一条蜈蚣，因此被称为“蜈蚣博弈”。
    现在的问题是：A、B是如何进行策略进择的?我们用一对情侣之间的爱
。9 I
博彝论的i学舻
情博弈来说明。
合作合作    台作合作
A——B——A…·A——B——【100，100】
背叛f背叛 l 背叛背叛
    (n，n)    (n—l，Ⅱ+2)
    围13．1螟蚣博奔
    爱情就其本质来说是一种交往．人交往的目的在于个人效用最大化，不
管这个效用是金钱．还是愉快的感觉、幸福的感觉。只要追求个人效用，就
必定存在利益博弈。因而，我们的爱情交往是一个典型的双人动态博弈过程，
不过爱情的效用随着交往程度的加深和时间推移有上升趋势。
    假定小丽(女)和小冬(男)是这个蜈蚣博弈的主角．这个博弈中他们
每人都有两个战略选择．一是继续，一是分手。他们的博弈展开式如图13—2
所示。
小丽——小冬——…·——小丽——小冬——小丽——小冬——『10，10】
『0．3
【8，8】 [7，10】【9．卅【8，10】
瞄13．2爱情博弈
    在图中，博奔从左到右进行，横向连杆代表继续交往战略．竖向连杆代
表离开她(他)战略。每个人下面对应的括号代表相应的人与对方分手，导
致爱情结束后各自的爱情效用收益。括号内左边的数字代表小丽的收益，右
边代表小冬的收益。
    可以看到．小冬和小丽的分手战略分别对应的括号数字每个都不同．这
是因为爱情效用在不断增加．这里假设爱情每继续一次总效用增加l，如第一
个括号中总效用为1+l=2，第二个括号则为。十3=3，只是由于选择分手战略的
人不同，而在两人之间进行分配。由于男女生理结构和现实因素不同，小丽
分手战略只能使效用在二人之间平分．即两败俱伤；小冬选择分手战略则能
占到3个便宜。显然，分手对于被甩的一方来说是一种欺骗行为。
请看，首先，交往初期小丽如果甩了小冬，则两人各得1的收益，小丽
如果选择继续，则轮到小冬选择。小冬如果选择分手，则小丽属受骗，收益
为0．小冬占了便宜收益为3．这样完成一个阶殷的博弈。可以看到每一轮交
1190
蜈蚣博奔；从终点出发的思维
往之后．双方了解程度加深，两人爱情总效用在不断增长。这样一直博弈下
去，直到最后两人都得到10的圆满收益，为大团圆的结局——总体效益最大。
    遗憾的是这个圆满结局很难达到!因为蜈蚣博弈的特别之处是：当A决
策时，他考虑博弈的母后一步即第[00步；B在“合作”和“背叛”之间做出
选择时，因“合作”给B带来|00的收益，而“不合作”带来101的收益．
根据理性人的假定，B会选择“背叛”。但是，要经过第99步才到第100步，
在第99步．A的收益是98，A考虑到B在第100步时会选择“背叛”，那么
在第99步时。A的是优策略是“背叛”——因为“背叛”的收益99大于“合
作”的收益98……按这样的逻辑推论下去，最后的结论是令人悲伤的：在第
一步A将选择“不合作”，此时各自的收益为1 1
    把这种分析代人上面的爱情博弈当中，我们可以发现．当双方博弈到达
如果分手小丽可得收益为10的阶段，小冬是很难有动力继续交往下去，继续
下去不但收益不会增长，而且有被小丽甩掉反而减少收益的风险。小丽则更
不利，因为她从来就没有占先的机会．她无论哪次选择分手策略．都是两败
俱伤．而且还有可能被小冬欺骗而减少收益。在爱情过程中，女人总体来讲
处于不利地位。因此．每一次交往，无论小冬还是小丽都有选择分手来中止
爱情的动机，更详细的数学可以证明．爱情圆满的结局不可能达到。当然．
我们在生活中会发现，踏入婚姻殿堂的情侣数量，并不像上面的推论得出的
那样令人绝望。这是怎么回事呢?
    从逻辑推理来看，倒推法是严密的，但结论是违反直觉的。直觉告诉我
们，一开始就采取不合作的策略获取的收益只能为1，而采取合作性策略有可
能获取的收益为100。当然，A一开始栗取合作性策略的收益有可能为0，但
1或者0与100相比实在是太小了。直觉告诉我们采取合作策珞是好的。而从
逻辑的角度看，一开始A应取不合作的策略。我们不禁要问：是倒推法错了．
还是直觉错了，这就是蜈蚣博弈的悖论。
    对于蜈蚣悖论，许多博弈专家都在寻求它的解答。西方博弈论专家通过
实验发现，不会出现一开始选择“不合作”策略而双方获得收益1的情况。
双方会自动选择合作性策略。这种做法违反倒推法，但实际上双方这样做，
要优于一开始就采取不合作的策略。
    倒推法似乎是不正确的。然而我们会发现，即使双方开始能走向合作，
舻
即双方均采取合作策略，这种合作也不会坚持到最后一步。理性的人出于自
身利益的考虑，肯定会在某一步采取不合作策略。倒推法肯定在某一步．要
起作用。只要倒推法在起作用．合作便不能进行下去。
    也许下面这个观点显得更为公允：倒推法悖论的产生其实是源于其适用
范围的问题．即倒推法只是在一定的条件下和一定的范围内有效。忽略了这
一点，笼统去谈论倒推法的有效性是不科学的。
    饲推法的成立是有条件的，在一定的条件下它成立的概率比较高。由于
倒推法在逻辑上和现实性方面都是有条件成立的．因此它的分析预测能力就
有局限性，它就不可能适用于分析所有动态博弈；如果不恰当地运用了倒推
法，就会造成矛盾和悖论。同时．我们也不能因为例推法的预测与实际有一
些不符，就否定它在分析和预测行为中的可靠性。只要分析的问题符合它能
够成立的条件和要求。倒推法仍然是一种分析动态博弈的有效方法。
1192
第1 4章
分蛋糕博弈：革命就是讨价还价
明白吗谁亦想跻身这童话
无奈代价还是夹杂太多其他
给你感情的升华
全部为你没意识讨价还价
——《我在乎》歌词
创造生活的艺术
    在熙熙攘攘上的集市上，我们经常会看到这样的场景。买家看中了一件
东西，而卖家也看出买家对这件东西感兴趣。于是．一讨价还价开始了。
    “多少钱?…‘18元!…‘你想抢钱啊。2元!…‘16元!…‘还是太贵了。4
元!．’“我让一点，14元!…‘我加一点，6元!…‘最低12元．不然没钱赚了。”
“最高8元，不然我到别家去买。…‘算了．成本价给你，10元!…‘那就10元
吧．让你赚就赚吧!”
    看着他们的价位像钟摆一样，摆过来．摆过去，最后停在10元上，有人
也许会想：“为何不一开始就卖10元?两下省事。”而实际上，10元是双方博
弈后的结果．事前准叉知道10元是双方的最佳成交价呢?除非上帝现身，只
有通过讨价还价j换句话说，讨价还价具有与上帝一样神奇的力量，能够让
最佳成交价在买家与卖家之间出现。
    1960年．谢林发表了其经典著作《冲突的战略》，对讨价还价和冲突管理
理论做了非常细致的分析。
    从博弈论的角度来看．讨价还价是一个零和博弈。博弈当事人的利益是
对立的．一方效用的增加都会损害另外一方的利益。但当事人的利益也有一致
的地方．那就是都希望避免两败俱伤，希望至少达成某种协议，这样．双方就
需要在达成协议的底线和争取较优结果中进行权衡：
    通过对讨价还价现象进行分析，谢林认为：“在讨价还价的过程中．限制
自己的选择往往引致对手让步：”对此可以这样理解．当限制自己的选择后，
对方认为自己不可能做出进一步的让步时，协议就达成了。谢林还进一步描
述了能够获得和保持有利地位的三个策略．即不可逆转的约束、威胁和承诺，
同时．让步是运用这三个策略的必不可少的基础．任何一方的过于强势都不
是最优策略，
    以两国军事对抗为例。若一国先动员军队进人战备，另一国不动员战备，
则先动员一方得益为a．不动员的国家得益为c；若两国都动员军队．双方剑
拔弩张．则每国得益都为0；若两国都休战．则双方各得b。这里．a>b>c>0．
显然，如写成“2×2”矩阵．这里有三个纳什均衡：【c．a】．[a，c】与混合策
略均衡(见表14—1)。
两国军事对抗博弈矩阵
    c是对方在我方先发制人时的得益，但这里．为了让先发制人方降低动武
的概率．也需要提高对方的得益c。而提高c就是先发制人一方对对方的让步!
    理论是枯燥的．但放到生活中却是活色生香的。从买菜到买房子，讨价
还价都进行得如火如萘。在深圳等地．还出现了房屋导购人士．他们利用自
己对房地产市场的熟悉．专门帮人在买卖房产时讨价还价以牟利．
    讨价还价不仅限于商品买卖．恋爱婚姻也不能例外。
    恋爱本身具有讨价还价机制．可以形成连续博弈．如果双方能产生一个
r
一
《施
分蛋糕博奔：革命就是讨价还价
一致点，那就可以结婚了；反之，则可能是分手。所眦自由恋爱要比包办婚
姻进步，因为可以讨价还价。而婚姻因为已经形成契约，尘埃落定，没有了
讨价还价的机制。古训“男怕人错行，女怕嫁错郎”说的就是这种后果的严
重性。
    恋爱博弈的重要性还在于离婚的交易费用往往惊人。比如．有些国家只
允许男人提出离婚．但同时规定结婚时就应明确如果离婚丈夫必须付给妻子
的补偿数额；中国东北有种习俗叫“净身出户”，即在离婚时所有财产留给女
方。这些制度习俗的设计，保护了婚姻中的弱势一方，使离婚失去讨价还价
的机制，更显得结婚是一次性博弈，抉择的重要性可见一斑。
    父母和珐子之间也存在着讨价还价机制。任何一个父母都会引导孩子向
他们期望的方向前进。但孩子在父母的过分关爱之下，反而被约束，没有自
己的选择。这时讨价还价机制开始起作用，孩子通过哭泣等方式影响父母的
决定。
    萧伯纳曾经说，经济学是一门最大限度创造生活的艺术。而在很多情况
下．这种创造的基础就是讨价还价，或者说，讨价还价本身是创造生活艺术
的一种具体方法。
蛋糕在不断融化
    我们来看一个讨价还价博弈的基本模型。
    假设两个孩子商议分吃一块蛋糕．很简单的一个方法，就是一方将蛋糕
一切两半．另一方则选择自己分得哪一块蛋糕。不妨假设切蛋糕这种累活分
配蛤A．B则在两块蛋糕中选择一块。显然，A在这种切蛋糕的规则下，一定
会努力让两块蛋糕切得尽量相同大小。
    设想桌子上放着的是一个冰淇淋蛋糕，两个菝子在就分配方式讨价还价
的时候．蛋糕在不停地融化。我们假设每提出一个建议或反建议，蛋糕都会
朝零的方向缩小同样大小。
    这时，讨价还价的第一轮由A提出要求．B接受条件则谈判成功，若B
不接收条件进人第二轮；第二轮由B提出分蛋糕的条件，A接受则谈判成功，
95 I
飘翟翟型
A不接受，于是蛋糕融化，谈判失败。
    对于A来说，刚开始提出的要求非常重要，如果他所提的条件，B完全
不能接受的话，蛋糕就会融化一半，即使第二轮谈判成功了，也有可能还不
如第一轮降低条件来得收益大。因此A第一轮提出要求要考虑两点：首先要
考虑是否可以阻止谈判进入第二阶段；其次，考虑B是如何考虑这个问题的。
    首先看最后一轮，蛋糕在第二阶段只有原先的1／2的大小．因此．A在第
二阶段即使谈判大获全胜．也不过只得到l／2蛋糕，而谈判失败则什么都得不
到。从最后一轮再反推到第一轮，B知道A在第二轮时所能得到的蛋糕最多
为1／2，因此当A在第一轮时只要占据的蛋糕大于112．他都可以表示反对，
将这个谈判延续到第二轮。
    A对B的如意算盘也很清楚，经过再三考虑．他在第一阶段的初始要求
一定不会超过1／2的蛋糕大小。因此A在初始要求得到1／2个蛋糕时该谈判顺
利结束，这个讨价还价的结果则是二人双方各吃一半大小的蛋糕。
    这种具有成本的博弈最明显的特征就是，谈判者整体来说应该尽量缩短
谈判的过程．减少耗费的成本。
    我们再来看看当谈判有三个阶段时会是什么样的结果。为了便于论述，
不妨假设这个时候．蛋糕每过一个讨价还价的轮次就融化1，3大小．到最后一
轮结束时，蛋糕全部融化。
    动态博弈一般都是采用倒推法．从最后一个阶段看，即使谈判成功．A
最多只能得到剩下的1／3个蛋糕。B知道这一点，因此在第二阶段轮到自己提
要求时要求两人平分第一轮剩下的2／3个蛋糕。A在第一轮时就知道B第二轮
的想法．于是在第一阶段刚开始提要求时．直接答应给B蛋糕的1／3大小，B
知道即使不同这个条件，进人第二轮也一样是最多得到113个蛋糕．到了第三
轮几乎就分不到蛋糕，因此B一定会接受这个初始条件。这个三阶段的分蛋
糕谈判最终的结果是B分得113的蛋糕．A分得2／3个蛋糕。
    更为普遍的情况是，假如步骤数目是偶数，各得一半；假如步骤数目n
是奇数．A得到(n十1)，(2n)而B得到(n_I)，(2n)。等到步骤数目达到
101．A可以先行提出条件的优势使他可以得到51／101个蛋糕，而B得到50／101
个。
1196
飘翟翟型
A不接受，于是蛋糕融化，谈判失败。
    对于A来说，刚开始提出的要求非常重要，如果他所提的条件，B完全
不能接受的话，蛋糕就会融化一半，即使第二轮谈判成功了，也有可能还不
如第一轮降低条件来得收益大。因此A第一轮提出要求要考虑两点：首先要
考虑是否可以阻止谈判进入第二阶段；其次，考虑B是如何考虑这个问题的。
    首先看最后一轮，蛋糕在第二阶段只有原先的1／2的大小．因此．A在第
二阶段即使谈判大获全胜．也不过只得到l／2蛋糕，而谈判失败则什么都得不
到。从最后一轮再反推到第一轮，B知道A在第二轮时所能得到的蛋糕最多
为1／2，因此当A在第一轮时只要占据的蛋糕大于112．他都可以表示反对，
将这个谈判延续到第二轮。
    A对B的如意算盘也很清楚，经过再三考虑．他在第一阶段的初始要求
一定不会超过1／2的蛋糕大小。因此A在初始要求得到1／2个蛋糕时该谈判顺
利结束，这个讨价还价的结果则是二人双方各吃一半大小的蛋糕。
    这种具有成本的博弈最明显的特征就是，谈判者整体来说应该尽量缩短
谈判的过程．减少耗费的成本。
    我们再来看看当谈判有三个阶段时会是什么样的结果。为了便于论述，
不妨假设这个时候．蛋糕每过一个讨价还价的轮次就融化1，3大小．到最后一
轮结束时，蛋糕全部融化。
    动态博弈一般都是采用倒推法．从最后一个阶段看，即使谈判成功．A
最多只能得到剩下的1／3个蛋糕。B知道这一点，因此在第二阶段轮到自己提
要求时要求两人平分第一轮剩下的2／3个蛋糕。A在第一轮时就知道B第二轮
的想法．于是在第一阶段刚开始提要求时．直接答应给B蛋糕的1／3大小，B
知道即使不同这个条件，进人第二轮也一样是最多得到113个蛋糕．到了第三
轮几乎就分不到蛋糕，因此B一定会接受这个初始条件。这个三阶段的分蛋
糕谈判最终的结果是B分得113的蛋糕．A分得2／3个蛋糕。
    更为普遍的情况是，假如步骤数目是偶数，各得一半；假如步骤数目n
是奇数．A得到(n十1)，(2n)而B得到(n_I)，(2n)。等到步骤数目达到
101．A可以先行提出条件的优势使他可以得到51／101个蛋糕，而B得到50／101
个。
1196
瀚柑=譬型
    在这个典型的谈判过程里，蛋糕缓慢缩小，在全部消失之前有足够时间
让人们提出许多建议和反建议。通常情况下，在一个漫长的讨价还价过程里，
谁第一个提出条件并不重要。除非谈判长时间陷人僵持状态，胜方几乎什么
都得不到了．否则妥协的解决方案看来还是难以避免的。
    不错。最后一个提出条件的人可以得到剩下的全部成果。不过，真要等
到整个谈判过程结束，也没剩下什么可以赢取的了。得到了“全部”，但“全
部”的意思却是什么也没有。
煮了吃还是蒸了吃
    两个猎人前去打猎，路上遇到了一只离群的大雁。于是两个猎人同时拉
弓搭箭，准备射雁。这时猎人甲突然说：“喂，我们射下来后该怎么吃，是煮
了吃．还是蒸了吃7”猎人乙说：“当然是煮了吃。”猎人甲不同意煮．说还
是蒸了吃好。两个人争来争去，一直也没有达成一致的意见。来了一个打柴
的村夫，听完他们的争论笑着说：“这个很好办，一半拿来煮，一半拿来蒸，
不就可以了。”两个猎人停止争吵。再次拉弓搭箭，可是大雁早巳没影儿了。
    在很多方面．时间都是金钱。最简单的一点莫过于较早得到的10万块钱，
其价值超过后来得到的10万元钱。因为即便是排除利率或者拒率变化的因素．
较早得到的钱可以用来投资．赚取利息或红利。假如投资回报率是每年5％，
那么现在得到的lO万元等于明年此时的10 5万元。
    在现实生活的谈判中．收益缩水的方式千差万别，缩水比例也不同。但
有一点是可以肯定的，那就是任何讨价还价的过程都不可能无限延长。因为
谈判的过程总是需要成本的，在经济学上这个成本称之为“交易成本”。就
如同冰淇淋蛋糕会随着两个孩子之间的过程而融化，不妨仅简单地认为被融
化的那部分蛋糕就是这个过程的交易成本。而且商业社会一个必不可少的特
征——时间就是金钱。即便是恋人之间关于看球还是看芭蕾舞的谈判，所耗费
的时间也是有成本，而恋人之间的争执对双方心理的伤害也是巨大的，这些
成本往往远高于交易所带来的收益。
    因此．有很多谈判也和分配蛋糕一样．随着时间越拉越长，蛋糕缩水就
1198
分蛋糕博弈：革命就是讨价还价
越厉害。假如各方始终坚持不愿意妥协，暗自希望只要谈成一个对自己更加
有利的结果，其好处就将超过谈判的代价。
    英国作家查尔斯·狄更斯的《荒凉山庄》描述了一个极端的情形：围绕
贾恩迪斯山庄展开的争执变得没完没了，以至于最后整个山庄不得不卖掉，
用于支付律师们的费用。
    不同的谈判按照不同的规则进行。在超市里，卖方会标出价钱。买方的
唯一选择就是要么接受这个价格，要么到别的店里碰运气。这可以视为一个
最为简单的讨价还价法则。
    而在商业谈判中，卖家首先提出一个价码(称为发盘)，接着买家决定是
不是接受。假如不接受．他可以还一个价码(称为还盘)。或者等待卖家调整
自己要求的价码。有时候，相继行动的次序是约定俗成的．也有一些时候．
这一次序本身就具有策略意义。
    假如一场谈判久拖不决，那么卖家将会失去抢占市场的机会．而买家会
失去一次使用新产品的机会。假如各国陷入一轮旷日持久的贸易谈判．它们
就会在争吵收益分配的时候丧失贸易自由化带来的好处。在这些例子中，参
与谈判的所有各方都愿意尽快达成协议。
    事实上，罗伯特·奥曼与夏普利在1976年证明了，两人为分一块饼而讨
价还价，这个过程看似可以无限期地进行下去，但是，只要没有一个人有动
机偏离对偏离者实施惩罚的机制，也没有一个人去偏离对偏离了“对偏离者
实施打击”的轨道的人实施惩罚的机制，并且这种惩罚链不中断，则讨价还
价的谈判就会达成均衡解而结束谈判。
    马拉松式的谈判一轮轮拖而不决的原因在于，参与谈判的双方之间，还没
有就蛋糕的融化速度．或者说未来利益的流失程度达到共识。
    从数学上可以证明，分蛋糕博奔只要博弈阶段是双数时双方分得的蛋糕
将会是一样大小，博弈阶蜃是单数时，轮到最后提要求的博弈者所得到的收
益一定会好于另一方，然而随着阶段数的增加．双方收益之间的差距会越来
越小．每个人分得的蛋糕将越来越接近于一半。也就是说．向前展望、倒后
推理的方法．可能在整个过程开始之前就已经确定了最后结果。
    策略行动可能在确定谈判规则的时候就已经开始。如果预期结果是第一
99 l
博奔论的j岔舻
个条件能够被对方接受，谈判过程的第一天就会达成一致，后期阶段不会再
发生。不过．假如第一轮不能达成一致，这些步骤将不得不进行下去，这一
点在一方盘算怎样提出一个刚好足够引诱对方接受的第一个条件时非常关
键。
    由于双方向前展望．可以预计到同样的结果，他们就没有理由不达成一
致。也就是说，向前展望、倒后推理将引出一个非常简单的分配方式：中途
平分总额。
坚定不移的力量
    一位江西富商来到一个卖古玩字画的店里，看中了一套三件精美细致的
古砚，售价800两银子。富商认为价格太高，于是推说只看中了其中两件．
要店主降价。店主看了看他，要价仍是800两。富商不愿掏钱。这时店主慢
悠悠地开口说：“这样看来，你是饺有看中我这套东西。既然这样．我怎么好
意思再卖给别人呢7”说着。他随手拿起一件丢在了地上，精致的古砚马上
捧得粉碎。富商见自己喜爱的古砚被摔碎了．再也没法矜持下去．急忙阻拦．
问剩下的两件卖多少钱?店主伸手比了一下：800两。富商觉得太离谱了，叉
要求降价。店主并不答话，把另一件古砚捧在地上。富商觉得只剩下最后一
件了总该降价了吧。谁知店主面色不改。仍要800两。富商有些生气地说：“难
道一件和三件的价钱一样吗7”店主想了想，微然一笑说道：“是不应该一个
价钱，我这一件卖1000两。”富商还在犹豫．店主叉把最后一件古砚章在手
里。富商再也沉不住气了，请求店主不要再毁了，他愿意出1000两银子把这
套残缺不全的古砚买走。
    交易完成以后。看得目瞪口呆兼佩服得五体投地的小伙计问店主：“为什
么捧掉了两件，反而卖了1000两银子?”店主回答说：“物眦稀为贵。富商
喜欢收藏古砚，只要他喜欢上的东西．是绝不会轻易放掉的。我摔掉两件，
剩下的一件当然价钱就更高了。”
    在讨价还价当中，拒不妥协的态度究竟是怎样扩大了店主收益的呢?一
旦你下定决心坚守一个立场，对方只有两个选择：要么接受，要么放弃。蛋
1200
分蛋糕博弈：革命就是讨价还价
糕正在融化，对于双方都是一种无形的压力。
    比如戴高乐曾经单方面宣布要将英国拒于欧共体之外，一次是1963年，
一次是1968年；其他国家面l临两种选择，要么接受戴高乐的否决票，要么分
裂欧共体。当然，戴高乐常谨慎地衡量过自己的立场，断定这一立场会被接
受。他这么做使法国独占了大部分战利品，也剥夺了另一方重新考虑整个局
面、提出一个可被接受的相反建议的机会。
    在实践中．坚持到底、拒不妥协说起来容易做起来难．理由有二。
    第一．讨价还价通常会将今天谈判桌上的议题以外的事项牵扯进来。大
家知道你一直以来都是贪得无厌的。因此以后不大愿意跟你进行谈判。又或
者．下一次他们可能采取一种更加坚定的态度，力求挽回他们认为自己将要
输掉的东西。在个人层面上，一次不公平的胜利很可能破坏商业关系．甚至
破坏人际关系。
    第二．达到必要程度的拒不妥协并不容易。戴高乐通过他的个性做到了
这一点。不过这样做是要付出代价的。一种顽固死硬的个性可不是你想有就
有，想改变就能改变的。尽管有些时候顽固死硬的个性可能拖垮一个对立者，
迫使他做出让步，但同样可能使自己的小损失变成大损失。
单数与双数的优势
    有一个聪明的男孩，妈妈带着他到杂货店去买东西。老板看到这个可爱
的小孩，就打开一罐糖果。要他自己拿一把糖果。但是这个男孩却没有任何
动作。于是，老板亲自抓了一大把糖果放进他的口袋中。回到家中．母亲很
好奇地问儿子，为什么没有自己去抓糖果呢?小男孩回答得银妙：“因为我的
手比较小呀!而老板的手比较大，所以他拿的一定比我拿的多很多!”
    这个故事揭示了一个博弈论的小招数：一定要耐心，不要暴露某些重要
细节，让别人以为你不会出手．当对手迫不及待地想利用你的迟延时，就可
以有力回击。
    这在我们的生活中是常见现象：非常急切的买方往往要付高一些的价钱
购得所需之物；急切的销售人员往往也是以较低的价格卖出自己所销售的商
z0‘1
博奔论的j奇舻
品。正是这样，富有经验的人买东西、逛商场时总是不紧不慢，即使内心非
常想买下某种物品，也不会在商场店员面前表现出来；而富有经验的店员们
总是会以“这件衣服卖得很好，这是最后一件”之类的陈词滥调劝诱顾客。
    事实上，上述的做法都是有博弈论的依据的。在博弈理论上已经证明，
当谈判的多阶段博弈是单数阶段时，最先开价者具有“先发优势”．而双数阶
段时．第二个开价者具有“后动优势”。
    对于任何谈判都要注意，一方面尽量摸清对方的底牌，了解对方的心理．
根据对方的想法来制定自己的谈判策略。另一方面，就是耐性．谈判者中能
移忍耐的一方将获得更多的利益．我们凭借直觉就可以判断，越是急于结束
谈判的人会越早让步妥协，或做出越大的让步。在前面分冰洪琳蛋糕的博弈
中．如果考虑每一方谈判时间的价值，就可以在数学上严格地证明这一直觉
的合理性。
    这一策略完全可以转化为生活中的小诡计。设想你在公司会议上做报告。
在场的有些人与其说是同事，不如说是敌人。他们憋足了劲要对你的方案吹
毛求疵。对付他们，你可以用这个方法：在会前发的提纲里，只简述主要内
容。有意略去某些细节和解释。他们会以为你忽略了某些方面．并在那些方
面策划对你的攻击。开会时，当他们洋洋得意地把那些问题提出来后．你可以
马上打开投影仪，侃侃而谈，显得比投影屏幕都光彩夺目。于是你立刻成了大
家心目中的英雄．对手们下次发难，就得三思而行了。
    这个招数还可以用于别的情况。当你努力改变别人的看法时．比如应聘
面试、商业谈判和资格口试等，都可以先假装糊涂，然后再旁征博引，把各
种理据一一道来。
    孩子们也会利用这个招撤。他们先是“忘了”告诉你他们懂的东西，但
在你没有料到的场合，却会突然说出那方面的知识。让你称赞一番。比如，
你为儿子开生日聚会，一切都顺利，参加聚会的孩子都很乖。当大家唱完生
日教鼓掌祝贺的时候，你儿子却突然开始独唱生日歌，而且唱的是俄语!这
让你大吃一惊．叉暗自得意。你从来不知道儿子会唱俄语歌，更投有想到他
敢在大庭广众之下露一手。
    总之，在别人毫不提防的情况下，提供重要事实，或者表演绝招，都可
1202
分蛋糕博弈：革命就是讨价还价
以使你更引人注目。这是从讨价还价的博弈中引申出的智慧。
减少你的等待成本
    唐代有个叫夏彪之的人到新昌做县令。他问当地一个村官：“鸡蛋一文钱
可以买几颗?”村官答道：“三颗。”这位县令即刻掏出一万文钱来，叫村官
替他买三万颗鸡蛋。继而说：“今天我不便带走，你让各家母鸡代为孵一下吧。”
村官不敢怠慢．于是就成了三万只小鸡。过几个月，县令找到村官。命他把
寄养的小鸡都卖掉。虽然小鸡死了不少，但是村官不敢少给钱，只能按一只
30文的价钱把钱给了县令，一共90万文。
    不久，县令叉来到另一个村问当地的村官：“竹笋一文钱可以买几根?”
村官回答道：“五根。”县令于是又拿出一万文钱来，让村官帮助他买五万根，
然后对村官说：“我也不需要那么多笋，就先养在竹林里吧。”到了秋天，竹
子都长大了，一根可卖十文钱。县令命令村官帮他把竹子卖掉，又获得了50
万文。
    这140万中间．县令先期投资两万，也下了本钱。县令的狡猾和无赖之
处在于，他投有追加任何投资，而且在过程中转嫁了风险，却坐享其利。用
博弈论的语言．就是减少了自己的等待成本。
    在一场博弈当中．决定大饼切分方式的一个重要因素是各方的等待成本。
虽然双方可能失去同样多的利益，一方却可能有其他替代做法，有助于部分
抵消这个损失。
    举例来说，假定工会与管理层谈判期间．工会成员可以外出打工．每天
挣300元。于是．每次轮到管理层提出反建议的时候，出价不仅不能低于工
会将在次日得到的收人，同时当天的数目至少要达到300元。工会从：300元
开始，这是其成员在外打工可能挣到的数目。企业正常运转时每天利润为1000
元．余下只有700元可以谈判，原则是双方平均分配，即各得350元。因此，
工会得到650元，而管理层只得到350元。
    在其他情况下，管理层也有可能处于有利地位。比如，管理层一边与工
会谈判。一边发动不愿参加罢工的工人维持企业运转。不过．由于这些工人
zo。I
舻
的效率比较低或者要价更高．又或是由于开工不足，管理层每天得到的收入
只有500元：假定工会成员在外面完全没有收人。这时工会愿意尽快达成协
议，根本不会当真发动一场罢工。不过．发动不愿罢工者维持企业运转的前
景，会使管理层处于有利地位．它将因此得到每天750元的收人，工会只得
250元。假如工会成员有可能外出打工．每天挣．300元，同时管理层可以在谈
判期间维持企业运转，每天挣500元。那么，余下可供讨价还价的数目只有
区区200元。管理层最后得到600元．而工会得到400元。
    一个具有普遍意义的结论是，谁能在没有合作的情况下过得越好，谁就
越是能从讨价还价的利益大饼中分得更大一块。博弈论的观察视角为我们展
现了一个充满贴现率的世界。如果有人以为此乃平常之论，那一定是由于没
有体会过它的强大威力罢了。
    在《孙子兵法》中，我们也可以看贴现思想的影子。谋攻篇中指出：“日
费千金，然后十万之师举矣。”也就是说战争需要一个庞大的后勤消耗来支撑，
战争每进行一天，战争的得益就减少相应的数董。于是现在和未来之间达成
一种微妙的平衡，人们赋予现在一个更大的权重，博弈论用贴现享标识它。
正因如此．孙子教给我们一个战争最重要的原则：“故兵贵胜，不贵久。”
    这是理解我国历史上无数战争局势的关键所在，也是先人最擅长的智慧。
在判断一场旗鼓相当的战争时．他们首先看到的是战争双方的贴现率，也就
是双方不耐心的冲动指数，“吾故知其败”。一场力量不对称的战争中．战争
的局势厦其容易演化成一方高挂免战牌，另一方求战不得之后退兵的情形。
    三国时．刘备人川苦战几年最后攻到成都之下，这是一场微妙的战争。
刘璋的许多下属劝刘璋把成都外围的百姓迁入成都，粮食烧光，来一个坚壁
清野。刘璋没有采取这些意见．史书已载由于仁慈和懦弱刘璋选择了投降．
令后人读到这里不免叹息。
    历史并非因一个人的性格而这样发展，双方胜负的原因在于：刘备是一
个贴现率很低的对手。刘备在荆州人多地窄。没有发展土地势必会崩溃，因
而时时充满着危机感。未来价值太低。虽然刘备本人有“折而不挠”人格，
是一个非常注重未来价值的人，但是时局迫使他采取鱼死网破的策略。
    贴现率也不是一成不变的，孙子提出“因粮于敌”可以提高自身的贴现
r
分蛋糕博弈：革命就是讨价还价
率。因粮于敌后来也成为一个有名的战术。但是，“夫兵久而国利者，未之有
也”。
    讨价还价的博奔中，最终的协议会把较大份额分配给更加耐心的一方。
贴现率可视为耐心的度量，平衡着现在和未来。在这个过程中，各方必须猜
测对方的等待成本。由于等待成本较低的一方能占上风，各方符台自身利益
的做法．就是宣称自己的等待成本很低。不过，没有人对这些说法照单全收；
必须加以证明，证明白己的等待成本很低的做法是：有意主动制造这些成本，
以此显示你能支持更长时间；或者自愿承担造成这些成本的风险——较低的成
本使较高的风险变得可以接受。
保护讨价还价能力
    旅美作家刘墉在《我不是教你诈》一书中讲了这样一个小故事。
    小李搬进高搂．十几盆花无处摆放。于是请人在窗外钉花架。师傅上门
工作那天，他特别请假在家监工。张老板带着徒弟上门，他果然是老手，17
层的高楼．他一脚就伸出窗外，四平八稳地骑在窗口，再叫徒弟把花架伸出
去，从嘴里吐出钢钉往墙上钉，不一会儿工夫就完工了。
    小李不放心地问花架是否结实，张老板豪爽地拍胸口回答说，三个大人
站上去跳都撑得住．保证20年不成问题。小李闻听，马上找了张纸，又递了
支笔给张老板，请他写下来并签名。张老板看小李满脸严肃的样子，正在犹
豫．小李又说：“如果你不敢写，就表示不结实。不结实的东萏，我是不敢验
收的。”张老板只好勉强写了保证书，搁下笔。对徒弟一瞪眼：“把家伙拿出
来，出去再多钉几根长钉子!出了事咱可就吃不完兜着走了。”说完，师徒二
人叉足足忙了半个多钟头．检查了又检查，最后才离去。
    这个故事告诉我们什么呢?如果你不想陷入某种境地而从此难以脱身，
那么就应该预见到这种后果，并且赶在自己的讨价还价能力仍然存在的时候
充分运用。换句话说，如果你是买家。就要争取先验货或者试用再付款；如
果休是卖家，应该争取对方先支付部分款项再正式交货。其实这种策略不仅
能够运用到商业中，在生活中也可以灵活变通地加以应用。
2。。I
博奔论的蘑
    一天深夜，两名美国经济学家在会议结束之后，要返回酒店。他们在耶
路撒冷街头找了一辆有牌照的出租车，告诉司机应该怎么去他们的酒店。司
机几乎立即认出他们是美国客人，因此拒绝打表，并许诺会给他们一个低于
打表数目的更好的价钱。自然．两人对这样的许诺颇有点将信将疑。
    在他们表示愿意按照打表数目付钱的前提下．这个陌生的司机为什么还
要提出这么一个奇怪的少收一点的许诺呢，他们怎么才能知道自己有没有多
付车钱呢'另一方面，此前他们除了答应按照打表数目付钱之外，并没有许
诺再向司机支付其他报酬。假如他们打算跟司机讨价还价，而这场谈判叉破
裂了，那么他们就得另找一辆出租汽车。他们的思路是．一旦他们到达酒店，
他们的讨价还价地位将会大大改善。何况，此时此刻再找一辆出租车实在很
不容易。
    于是他们坐车出发，顺利到达酒店。司机要求他们支付以色列币2500谢
克尔(相当于2 75美元)。因为在以色列讨价还价非常普遍，所以美国人还价
2200谢克尔。司机生气了，不等对方说话就锁死r全部车门，按照原路段命
地开车往回走。司机开车回到出发点．非常粗暴地把他们扔出车外．一边大
叫：“现在你们自己去看看你们那2200谢克尔能走多远吧!”
    他们又找了一辆出租车。这名司机开始打表，跳到2200谢克尔的时候，
他们也回到了酒店。
    毫无疑问，花这么多时间折腾，对于两位经济学家来说还值不到300谢
克尔。但是这个故事的价值却不容忽视．因为它说明一旦面对一个不懂得讨
价还价的对手，可能会出现什么样的危验。在自尊和理性这两样东西之间，
我们必须学会权衡。假如总共只不过要多花20美分，更明智的选择可能是到
达目的地之后乖乖付钱。
    这个故事还有第二个教训。设想一下，假如两个美国人是在下车之后再
来讨论价钱问题，他们的讨价还价地位该有多大的改善。
    如果是租一辆出租车．思路应该与此完全相反。假如你在上车之前告诉
司机你要到哪里去．那么你很有可能眼雹巴看着出租车弃你而去，另找更好
的主顾。记住，你最好先上车，然后告诉司机你要到哪里去。
    这个故事还提示我们．必须学会通过改变我们与对手之间的位置，刨造
1206
    坌曼壁塑窒!兰鱼塾墨堕垃堑丝__ll■
一个对自己最佳的讨价还价的地位。
货比三家的艺术
    1999年，美国谈判专家史蒂芬斯决定建个家庭游泳池，要求非常简单：
长30英尺(9144米)、宽15英尺(4 572米)，有温水过滤设备，并且在6
月1日前竣工。史蒂芬斯在游泳池的造价及建筑质量方面是个彻头彻尾的外
行，但是这并没有难倒他。他首先在报纸上登了个建造游泳池的招商广告，
具体写明了建造要求。很快有a、b、c三位承包商前来报上了承包详细标单，
里面有各项工程费用及总费用。史蒂芬斯仔细地看了这三张标单，发现所提
供的抽水设备、温水设备、过滤网标准和付钱条件等都不一样，总费用也有
不小的差距。
    于是．史蒂芬斯约请a、b、c三位承包商到自己家里商谈。第一个约定在
上午9 00，第二个约定在9：15，第三个约定在9 30。三位承包商如约准时到
来．但史蒂芬斯客气地说，自己有件急事要处理，一会儿再与他们商谈。三
位承包商只得坐在客厅里一边彼此交谈，一边耐心等待。10：00的时候，史蒂
芬斯出来请承包商a先生进到书房去商谈。a先生一进门就介绍自己干的游泳
池工程一向是最好的，建家庭游泳池实在是小菜一碟。同时，他还顺便告诉
史蒂芬斯，b先生曾经丢下许多未完的工程。现在正处于破产的边缘。接着，
史蒂芬斯出来请b先生进行商谈。史蒂芬斯从b先生那里叉了解到，其他人
提供的水管都是塑胶管，只有b先生所提供的才是真正的铜管。最后，史蒂
芬斯出来请c先生进行商谈。c先生告诉史蒂芬斯，其他人所使用的过滤网都
是品质低劣的，并且往往不能彻底做完．而自己则绝对能做到保质、保量、
保工期。
    史蒂芬斯通过耐心的倾听和旁敲侧击的提问，基本上弄清了游泳池的建
筑设计要求．特别是掌握了三位承包商的基本情况：a先生的要价最高，b先
生的建筑设计质量最好．c先生的价格最低。经过权衡利弊，史蒂芬斯最后选
中了b先生来建造游泳池，但只给c先生提出的标价。经过一番讨价还价之
后。谈判终于达成一致。
2。’I
丫．^*女k∞
淹计
    就这样，三个精明的商人没斗过一个谈判专家。史蒂芬斯在极短的时间
内．不仅自己从外行变成了内行，而且还找到了质量好、价钱便宜的建造者。
这种所谓让卖家与卖家竞争的策略设计，其中就包含着对外部机会的巧妙算
计。
    假如您打算买辆车．那么有两种策略：一，锁定一个代理商．对他百般
纠缠，软硬兼施，要他非降价不可；二，到好几家代理商那儿转转，然后在
询问价钱的时候，漫不经心地暗示，你不仅确实要买车，而且已经看了几家
店。哪种策略较好呢?
    这是经济学家阿尔钦在他的教科书中的一道问答题。他的答案是：“多找
几家商店更好．因为卖家拿‘另有门路’的买家最没办法。与卖家竞争的，
是其他的卖家；与买家竞争的．是其他的买家；而卖家并不和买家竞争。”
    这个世界的任何商品．其价值都是因为有人争夺才产生的。阳光没人争，
市价是零；空气没人争，市价也是零；但马尔代夫的阳光和空气，有很多人
争．于是价值不菲。马尔代夫的居民就是再抠门，游客也得感谢他们为度假
多提供了一个机会。到那里旅游的高价，是游客们自己造成的。
    同样是由于市场的安排无形中造成了一种竞争的环境，英特尔和AMD都
不得不为它们生产的中央处理器(cPu)标出足够低的价格；而基金公司也不
得不提供更优惠的申购费率以吸引投资者；至于结了婚的夫妇，其对各自利
益的谋取可能会变成一场两个人玩的博弈游戏。
    在与人讨价还价的时候，要时刻记得，潜在的利益谋取者相互竞争会导
致讨价还价能力的降低。因此如果你是买主．如果不是团购的话，不要与其
他买主一起抢购某种商品；如果你是卖主，尽量不要把其他卖主的信息透露
给潜在的顾客。
外部机会的算计
    赤壁大战以后．东吴屡次向刘备讨还荆州没有成功，设计了一个利用孙
权之妹招赘并软禁刘备，要挟其交还荆州的骗局。
    建安十四年(209年)冬十月，诸葛亮特派大将赵云带领500兵卒随刘备
1208
分蛋糕博弈：革命就是讨价还价
前往东吴结亲。刘备一行到达东吴时．赵云马上根据诸葛亮的嘱咐，叫500
名兵卒披红挂彩，在全城采买猪羊果品等婚庆用品，逢人便说刘备入赘东吴，
弄得城中百姓人人皆知。随后．刘备牵羊担酒．拜访了与东吴主孙权家有联
姻之好的乔国老，叙说了前来成亲之事。
    乔国老听说以后．即刻进宫向孙权的母亲吴国太道喜称贺。吴国太闻言
大惊．派人到城中察看究竟。派出的人很快回来复命，说乔国老所言非虚，
新人已在馆驿安戢．准备成亲。
    吴国太大吃一惊，询问孙权。孙权只得如实道来。国太一听，更加怒不
可遏，她大骂周瑜说：“周瑜小子无计去取荆州，倒打起我女儿的主意。如果
真的杀了刘备，我女儿岂不成了望门寡．以后让她如何做人?这岂不误了她
的一生!”
    孙权一时语塞。吴国太怒气未消。乔国老劝说：“刘玄德乃汉朝皇室宗亲．
倒不如顺水推舟招他为婿，免得张扬出去丢丑。”于是国太发下了话：“我明
天要在甘露寺与刘备见面，亲自相亲。如不中意，任你们发落；如果中了我
的意，我就做主将女儿嫁她。”孙权心里虽然不情愿，但也无可奈何。
    第二天．吴国太、孙权、乔国老等在甘露寺会见刘备。吴国太一见刘备，
对乔国老说：“真吾婿也!”刘备与孙权之妹的婚事，就这样由国太做主当场
敲定。
    孙权的“美人计”弄假成真，刘备成功地逃过一劫。在这场博弈当中．
刘备一方是通过损害东吴方面的外部机会来达到目的的。
    在博弈中，一个参与者的外部机会越好，他能够从讨价还价当中得到的
份额也就越大。他就会寻找策略做法，希望利用他的外部机会。但是与此同
时．他还必须知道．真正影响大局的是外部机会与他的对手的外部机会的相
对关系。他即便做出一个承诺或威胁，导致双方的外部机会同时受到损害，
也还是可以得到更好的结果。前提是相比之下，他的对手的外部机会受到更
严重的损害。
    在工会与管理层谈判的例子里，假如工会成员可以外出打工，每天挣300
元．而管理层则通过由不愿参加罂工者维持企业运转，每天挣500元，那么，
讨价还价的结果是工会得到400元，管理层得到600元。
加。I
、，／    博彝论的
诡诗
    现在，假定工会成员放弃外出打工的100元，转而加强设置警戒线，阻
止任何车辆进人厂区．导致管理层每天少收人200元。于是．讨价还价一开
始，工会的起点是200元(300元减去100元)，管理层的起点则为300元(500
元减去200元)。两个起点相加得到500元，正常运转所得利润1000元当中
只余下500元用于平均分配。结果，工会得到450元，管理层得到550元。
工会加强警戒线的做法实际上等于做出要损害双方利益的威胁，只不过对管
理层的损害更大。工会为此多得50元。
    在甘露寺相亲的故事中，孙权的目标是神不知鬼不觉地把刘备扣为人质，
以索还荆州。但因为牵涉到自己的妹妹，事情进行得越是秘密，对东吴的好
处就越大。然而刘备一方看破了这一点，因此一到东吴便四处采买婚庆用品，
到处散布刘备与孙权妹妹成亲之事。可以说，声势造得越大，一旦婚事不成。
刘备固然脸面无光，但是孙权所付出的．不仅是遭到天下人嘲笑，还会背上
寡廉鲜耻的名声。也就是说，刘备这样做对孙权的外部机会损害大过自己的
损失。
    尽管在这种情况下，孙权为了夺取荆州，仍然可能铤而走险。因为脸皮
与地皮相比，地皮显然更为重要。所以，仅仅这一步是无法完全阻止孙权按
计行事的。更为关键的下一步，则在于刘备通过乔国老把信息传递给吴国太。
她是所有能够影响孙权决策的人当中，最关心孙权妹妹名誉与终生幸福的人．
因而也是最有可能使孙权无法实施明谋的威胁因素。所以等到甘露寺相亲她
拍板定下孙刘两家的婚事以后，孙权已经没有任何牌可出．只好乖乖地认输
了事。
偷梁换柱来还价
    战国时，寨王准备发兵攻打周国，秦国臣民都不赞同。于是应侯范雎对
秦昭王讲了一个故事。有一个人叫公孙弗忌，认为他的邻居老弱可欺，便决
定把他的财产弄过来。这一天，他把狐朋狗友全部召集到一起，怂恿他们去
偷盗邻居的东西。可是同伙却因为害怕而不愿意去干。第二天，他又把他们
叫来．出主意说，不妨去威胁邻居．让他把东西交出来，但是同伙中仍然有
1210
分蛋糕博奔：革命就是讨价还价
半数反对。最后，公孙弗忌终于想了一个办法，他提出与邻居去喝酒应酬，
在酒席上骗走他的财物。他的同伙一听这个建议，都兴高采烈地予以赞同。
    讲完这个故事．应侯对秦昭王说：“公孙弗忌提出的三种方式，同样是用
不道德的手段来谋夺财物，可是他的同伙却有同意不同意之分。为什么呢’
无非是害怕偷盗和胁迫的名声太坏而已。现在周天子是天下的共主．并段有
坏到像桀纣那样的地步，秦国却准备毫无理由地去攻打他，会是什么名声呢9
所以国内的臣民都不愿意啊。”
    对于本质毫无差别的几种行为，只是因为方式的不同．得到的反应就不
同。这个故事的启示就在于，如果在谈判中无法用强硬的手段得到自己想要
的，完全可以改用一种比较缓和的方式，把注意力吸引到方式的转换上，从
而策略性地达到自己的目的。
    《三十六计》第25计名为“偷梁换柱”：“频更其阵．抽其劲旅，待其白
败，而后乘之．曳其轮也。”所谓梁是房屋建筑中的水平方向的长条形承重构
件．在未结构屋架中．通常按前后方向架放在柱子上。柱是建筑物中直立的
起支撑作用的构件，用来支撑横粱。粱和柱在房屋建筑中．就像所有事物的
关键与精华部件一样，起着巨大而不可替代的作用。也正因如此．如果在博
奔中运用某种策略，暗中更换对方所追求的利益的关键部分，就可以巧妙地
改变事物的性质和内部结构，使自己轻而易举地得到对方本来会锱铢必较的
关键利益。
    美国著名的冲突管理专家、贝勒大学教授弗雷德-查特曾经代表一家公
司与工会进行谈判。在谈判中．查特教授得知该公司总裁在与工会领袖谈话
时发表了不当言论。对方勃然大怒，严正提出总裁应公开道歉。同时，总裁
也觉察到自己失言．准备公开道散。
    针对这一情况．查特对工会领袖说：“我了解公开道歉对于双方的重要性，
一定尽力去帮助你们争取，但我不能给你们什么保证。不过，如果你们希望
我去争取这件事，你们是否应该在其他事情上与我合作?”过了几天．查特
教授又把他的条件明确化，要求工会在关于增加工人工资和福利问题上做出
让步。他说：“如果我能争取到总裁的公开道歉，有关我向你们提出的工资福
利问题，你们是否同意我的看法々”工会当时只关注总裁是否愿意公开道教．
博彝论的蘑
挽回自己的面子，而对于增加工人工资和工人福利两个问题一时并未在意。
    经过进一步谈判，母后终于达成协议，公司方面由总裁公开道歉，而工
会方面却在工人工资和福利的要求上做出了重大让步。
    究竟是哪一方获得了成功，是公司呢，还是工会方面?答案不言白明。
    谈判者应该将所有有关共同利益的问题放在一起进行讨价还价．利用各
方对这些问题的重视程度的不同，达成对大家来说都更有利的结果。因为，
许多这样的问题虽然在理论上可以简化为金钱总数问题，但一个很重要的区
别在于，即各方对这些问题的重视程度可能各不相同。
    将各种问题混合起来的做法，也使得利用其中一个博弈回台为另一个回
台为提供弹药成为可能。比如，美国威胁日本说，准备结束美日军事同盟关
系，任凭日本面对人侵的风险而不顾，也许可以在迫使日本打开进口市场的
谈判中做出更大的让步。美国当然不会坐视日本遭到入侵，因为那样并不符
合它的利益；它那样说不过是一个威胁而已，目的是迫使日本在经济方面表
现得更合作一些。因此，日本可能坚持要把经济与军事分开谈判。
    在上面工会与公司的谈判中，其所以取得这样的结果．在于查特教授抓
住公司总裁向工会方面道歉这个无关紧要的问题，和总裁本人也准备满足工
会这一要求的情况，把他们打包成一揽子的解决方案，并且有意把道歉问题
看得十分重要，而把真实的企图——降低工会方面对于工资及福利的实质问题
隐藏在这个细枝末节之中，使工会方面没有看清问题的本质．从而取得了真
正的胜利。如果工会方面看破这一点，即使是十分注重道歉问题。但是坚持
把道歉与工资福利方面分开来解决，那么公司也不会这么容易获得胜利。
进二退一的策略
    前苏联时期，柯伦泰出任驻挪威的全权贸易代表。上任不久，柯伦泰为
购买鲱鱼的事跟挪威商人谈判。
    谈判一开始，柯伦泰不动声色地伸出左手一个中指：“一位数，超过这个
价．我到别的国家去买!”挪威商人蹬圆了眼珠说：“尊敬的柯伦泰女士．您
真的太能干啦。这个价格只配去买鲱鱼骨头!”柯伦泰伸出左手小指：“不，
1212
分蛋糕博弈：革命就是讨价还价
刚才我摘错了，你的鱼价格还要压低一成!”挪威商人忍不住伸出手指叩叩桌
面：”柯伦泰女士，这不是开玩笑!”柯伦泰慢慢地回答：“如果你诚心要做成
这笔生意，我可以出两位数的价钱!”
    谈判眼看要陷入僵局了．柯伦泰苦笑着说话了：“我不能伤害你们的感情。
我同意你们提出的价格。如果我们政府不批准这个价格，我愿意用自己的工
资来支付差额。不过只能分期付款。看样子可能要还一辈子债了。”为了做成
这笔生意，挪威商人只得将鲜鱼的价格降低到前苏联政府能接受的价格。
    柯伦泰在谈判中所运用的策略，可以称为进二退一，也就是在开始讨价
还价的时候，明知自己的方案必然会遭到对方的反对，于是首先提出众多条
件苛刻、不可达成的要求，极力将矛盾扩大化，使关键问题模糊化，从而引
发更广泛的争议。然后，再退一小步．做出妥协的姿态，解决一些次要的小
矛盾，牺牲一些次要的利益。展示出退一步海阏天空的“高尚”形象。这样，
表面上达成了双赢，实际上进一步蚕食了对方的利益．实现其最初要达成的
目标，最人化自己晟迫切想得到的利益。
    在生活中，我们如果放宽一下视野，完全可以运用这种转换思维，获得
事半功倍的效果。
    如果你是一位上司．某个下属看起来不会工作，接受了任务不知道如何
完成，有没有办法促使他按你的意图去做'还有，你主持的团队老是扯皮．
议而不决，有没有办法让他们早点儿做出决定?又如，你的孩子要吃巧克力，
可是你不愿意让他多吃甜的，有没有办法让他满足于更有益健康的东西?
    答案当然有。你如果用进二退一的方式就可以应付上述难题．但是前提
是必须提供不同的选择。不过与上述故事中自己进二，自己再退一的方式不
同，我们要让员工或者是孩子自己“退一”。
    我们先看明智的上司该怎么做。你无法掌握日常事务的每一个细节，因
而需要下属帮忙。你想激励他把项目的一大部分管起来．可是又不想放弃对
整个项目的指导，该用什么办法呢?
    如果能够发现这其实也是一种博弈的话，那么最好的策略之一，就是给
他们选择。比如可以对他说：“你看，我们的工作出现了一些问题，我觉得由
你处理比较合适。你看是用甲方法好．还是用乙方法好7”这里，谁是上司
2。5 I
壤
赫盏掣
呢?下属会觉得自己是上司。其实，选择是你提出的，但下属有了选择权，
就有了做主人的感觉，这种感觉会使他们更热爱工作、热爱公司，减少失职
的情况。他们虽然责任更重，但是因为有了责任感，觉得自己所选的方案是
最好的，因而也就会全力去完成。
    你的孩子闹著要吃巧克力，如果简单地拒绝．他肯定哭得更厉害。如果
在拒绝巧克力的同时。又问他：“休想吃香蕉还是草莓?”孩子会重新考虑吃
巧克力的合理性，重新估计形势。当孩子参加活动需要选择衣服时，父母也
可以用同样的方法，给他两套衣服，让他选择。但是要注意，小孩比成人更
习惯于让别人选择，所以上述方法有时可能不是那么有效。
P
第1 5章
鹰鸽博弈：进化中的路径依赖
有缘就无所谓远
是否人在旅行的时候特别想谈恋爱
惯-陛的束缚禁忌压抑让它全部解开
——《巴黎来的明信片》歌词
办公室里的高纸板
    在一间大约100平方米的办公室里，十几位白领每天按部就班地工作着。
但是平静的日子被其中一个人打破，他做出了一件让同事们看来是离经叛道
的事情：在整齐划一的办公桌之间的术隔板上，自作主张地增加了一块纸板，
比左邻右舍高出了大约20厘米。尽管他处心积虑．选择了一个夜晚来实施这
一行动．并请油漆匠将纸板漆成了和隔板一致的颜色．以肪过于显眼。但是
第二天同事们上班时，还是发现了它的存在。
    他们一致抗议．理由是在这间巨大的办公室里，这块20厘米高的纸板打
破了整个办公室的协调与统一。每个人的利益似乎都受到了程度不同的损害，
在感情上也受到了程度不同的伤害。他们认为，这20厘米高的纸板所体现出
来的独特性和个性，或者说与众不同的东西，是对周周环境的蓄意的不协调
和对整体的破坏，更是一种骨子里的自私和对于秩序的蔑视和背叛。
    单位里一位新提拔的处级干部，一大早巡视办公室，立刻发现了这一变
异。尽管他并不在这间办公室里工作，这点变化，也不在他的管辖范围之内．
飘譬篮
t}
他马上对这个人的举措表示了不满和担忧，规劝说：“年轻人，不要标新立异，
更不要别出心裁，这样是要吃大亏的!”而同办公室的一位同事则差一点勃然
大怒，竟然要越过“边界”，强行将纸板拆除。尽管那块纸板离他的座位很远，
一点也没有妨碍他。
    在以后的若干天里，人们来到办公室．都不免要议论几旬。时间一天天
过去，那块起初被视作眼中钉的纸板，渐渐地在同事们眼中习以为常。于是，
当这个人在众人面前主动将它拆掉时，也没有谁大惊小怪。因为所有人差不
多都已经忘记了那块纸板，尽管当初曾那样激烈地反对过它。
    在一间100平方米的大厅里，一块20厘米高的纸板所产生的美学破坏力，
应该说是微乎其微的。但是这块纸板却像是一个试验品，反射出社会的群体
怎样被个体冒犯以及这种冒犯要付出怎样的代价。
    从这个故事当中，我们也看到了博弈论中所说的ESS策略的影子。所谓
ESS．即进化上的稳定策略(evolutiOnRnJy stable strategy)．是指凡是种群的
大部分成员采用某种策略，而且这种策略的好处为其他策略所比不上的，这
种策略就是进化上的稳定策略或ESS。换句话讲．对于个体来说，最好的策
略取决于种群的大多数成员在做什么。由于种群的其余部分也是由个体组成，
而它们都力图最大限度地扩大其各自的成就，因而能够持续存在的必将是这
样一种策略：它一旦形成，任何举止异常的个体的策略都不可能与之比拟。
    在环境的一次大变动之后，种群内可能出现一个短暂的进化上的不稳定
阶段，甚至可能出现渡动。但是一种ESS一旦确立下来，偏离ESS的行为将
要受到自然选择的惩罚。所以，我们与其相信出淤泥而不染，倒不如相信近
墨者黑近朱者赤才是符合进化规律的!也正因如此，舜出身于一个父兄凶顽
的家庭却成为大圣人是值得推敲的。把舜的家庭看成一个种群，如果一个所
谓的圣人在那样的环境中，而他的行为准则和其他人相左，那他的策略就是
非ESS策略．他在种群中将不占优势。这样的历史如果是真的，那么在它之
前，必然发生过促使ESS策略发生变化的事件。
    在ESS策略中，往往存在着一种可以称为惯例的共同知识：因为大家都
这样做，我也应当这样做，甚至有时不得不这样做。加之，在大家都这样做
的前提下我也这样做可能最省事、最方便且风险最小。这样，ESS策略就成
1216
鹰鹤博弈：进化中的路径依赖
了社会运行的一种纽带、一种保障机制、一种润滑剂，从而也就构成了社会
正常运转的基础。
    美国经济学家奈特和莫廉对此有过明确论述：“一个人只有当所有其他人
的行动是‘可预计的’并且他的预计是正确的时候，才能在任何规模的群体
中选择和计划。显然，这意味着他人不是理性地而是机械地根据一种已确立
的已知模式来选择没有这样一些协调过程，一个人的任何实际行动，以
及任何对过去惯行的偏离．都会使那些从他过去的一种行为预计他会如此行
动的其他人的预期落空。并打乱其计划。”
栅栏上的路径依赖
    春秋时的一天，齐桓公在管仲的陪同下．来到马棚视察。他一见养马人
就关心地询问：“马棚里的大小诸事，你觉得哪一件事最难?”养马人一时难
以回答。这时，在一旁的管仲代他回答道：“从前我也当过马夫，依我之见，
编排用于拦马的栅栏这件事最难。”齐桓公奇怪地问道：“为什么呢?”管仲说
道：“因为在编栅栏时所用的术料往往曲直混杂。你若想让所选的木料用起来
顺手．使编排的栅栏整齐美观，结实耐用．开始的选料就显得极其重要。如
果你在下第一根桩时用了弯曲的木料，随后你就得顺势将弯曲的木料用到底．
笔直的木料就难以启用。反之，如果一开始就选用笔直的术料．继之必然是
直木接直木，曲木也就用不上了。”
    管仲虽然说的是编栅栏建马棚的事，但其用意是讲述治理国家和用人的
道理：如果从一开始就做出了错误的选择，那么后来就只能是将错就错，而
很难纠正过来。
    管仲的确不愧是一位伟大的政治家，他在寥寥数语之中，揭示了所谓社
会ESS策略的形成，也就是被后人称为路径依赖的社会规律：人们一旦做了
某种进择．这种选择会自我加强．有一个内在的东西在强化它，一直强化到
它被认为是最有效率最完美的一种选择。这就好比走上了一条不归之路，人
们不能轻易偏离。
    科学家曾经进行过这样一个试验，来证明这一规律。他们将四只猴子关
217 I
博彝论的蘑舻
在一个密闭房间里，每天喂食很少食物，让猴子饿得吱吱叫。然后，实验者
在房间上面的小洞放下一串香蕉，一只饿得头昏眼花的大猴子一个箭步冲向
前．可是当它还没拿到香蕉时，就触动了预设机关被泼出的滚烫热水烫得全
身是伤。后面三只猴子依次爬上去也想拿香蕉时，一样被热水烫伤。于是众
猴只好望蕉兴叹。
    几天后．实验者用一只新猴子换走一只老猴子，当新猴子肚子饿得也想
尝试爬上去吃香蕉时，立刻被其他三只老猴子制止。过了一段时间实验者再
换一只新猴子进入．当这只新猴子想吃香蕉时。有趣的事情发生了，不仅剩
下的两只老猴子制止它，连投披烫过的半新猴子也极力阻止它。
    实验继续，当所有猴子都已被换过之后，没有一只猴子曾经被烫过，上
头的热水机关也被取消了，香蕉唾手可得，却没有猴子敢去享用。
    为什么会出现这种情况呢7在回答这个问题之前．我们先来看一个似乎
与此无关的问题。大家知道现代铁路两条铁轨之间的标准距离是四英尺叉八
点五英寸(1435毫米)．但这个标准是从何而来的呢?
    早期的铁路是由建电车的人所设计的，而四英尺叉八点五英寸正是电车
所用的轮距标准。那电车的轮距标准又是从何而来的呢7这是因为最先造电
车的人以前是造马车的，所以电车的标准是沿用马车的轮距标准。马车又为
什么要用这个轮距标准呢’这是因为英国马路辙迹的宽度是四英足又八点五
英寸，所以如果马车用其他轮距．它的轮子很快会在英国的老路上撞坏。原
来，整个欧洲，包括英国的长途老路都是由罗马人为其军队所铺设的，而四
英尺又八点五英寸正是罗马战车的宽度。罗马人以四英尺叉八点五英寸为战
车的轮距宽度的原因很简单，这是牵引一辆战车的两匹马屁股的宽度。
    马屁股的宽度决定现代铁轨的宽度，一系列的演进过程．十分形象地反
映了路径依赖的形成与发展过程。
    “路径依赖”这个名词，是美国斯坦福大学教授保罗·戴维在《技术选
择、创新和经济增长》一书中首次提出的。20世纪80年代，戴维与亚瑟·布
莱思教授将路径依赖思想系统化，很快使之成为研究制度变迁的一个重要分
析方法。他指出，在制度变迁中，由于存在自我强化的机制．这种机制使得
制度变迁一旦走上某一路径，它的既定方向会在以后的发展中得到强化。即
在制度选择过程中，初始选择对制度变迁的轨迹具有相当强的影响力和制约
1218
鹰鸽博弈：进化中的路径依赖
力。人们一旦确定了一种选择，就会对这种选择产生依赖性；这种初始选择
本身也就具有发展的惯性．具有自我积累放大效应，从而不断强化自己。
    这也可以解释前文的猴子实验。由于取食香蕉的惩罚印象深刻，因此虽
然时过境迁、环境改变，后来的猴子仍然无条件服从对惩罚的解释与规则，
从而使整体进入路径依耪状态。
    路径依桢理论被总结出来之后．^们把它广泛应用在各个方面。在现实
生活中，由于存在着报酬递增和自我强化的机制．这种机制使人们一旦选择
走上某一路径，要么是进入良性循环的轨道加速优化，要么是顺着原来错误
路径往下滑，甚至被“锁定”在某种无效率的状态下而导致停滞。想要完全
摆脱变得十分困难。
胜出的未必是好的
    在很多情况下，一个方案会比另一个方案好得多。但即便如此，并不表
示更好的方案一定会被采纳。如果一个方案已经制定了很长时间。现在环境
发生了变化，即使出现了更可取的方案，这时要想改革也很不容易。
    要理解这一点，一个著名例子是电脑键盘的设计。
    键盘是电脑配件中一个非常不起眼的部件，但却是必不可步的输人设备，
无论是操作电脑还是玩游戏都得通过它来完成。近140年前的1868年，键盘
出现在斯托弗·拉思兰·肖尔斯所发明的机械打字机上，当时的键盘是由26
个英文字母顺序排列的按钮所组成。因为打字机的设计是通过人在打字时按
下的键会引动字棒打印在纸上，当人们熟习应用，打字速度加快，机动字捧
追不上人手打字速度．经常交叠在一起．而出现卡键现象．甚至互相拍打而
损坏。
    直到19世纪后期。对于打字机键盘的字母排列仍然没有一个标准模式。
1873年．克里斯托弗·肖尔斯把键拆下来，将较常用的键设计在较外边。较
不常用的放在中间，从而形成目前众所周知的Q、w、E、R、T、Y键排列在
键盘左上方的方案。这种排法也就因其左上方第一行的头六个字母而被称为
“QWERTY”排法。
2。9 I
鹰鸽博弈：进化中的路径依赖
力。人们一旦确定了一种选择，就会对这种选择产生依赖性；这种初始选择
本身也就具有发展的惯性．具有自我积累放大效应，从而不断强化自己。
    这也可以解释前文的猴子实验。由于取食香蕉的惩罚印象深刻，因此虽
然时过境迁、环境改变，后来的猴子仍然无条件服从对惩罚的解释与规则，
从而使整体进入路径依耪状态。
    路径依桢理论被总结出来之后．^们把它广泛应用在各个方面。在现实
生活中，由于存在着报酬递增和自我强化的机制．这种机制使人们一旦选择
走上某一路径，要么是进入良性循环的轨道加速优化，要么是顺着原来错误
路径往下滑，甚至被“锁定”在某种无效率的状态下而导致停滞。想要完全
摆脱变得十分困难。
胜出的未必是好的
    在很多情况下，一个方案会比另一个方案好得多。但即便如此，并不表
示更好的方案一定会被采纳。如果一个方案已经制定了很长时间。现在环境
发生了变化，即使出现了更可取的方案，这时要想改革也很不容易。
    要理解这一点，一个著名例子是电脑键盘的设计。
    键盘是电脑配件中一个非常不起眼的部件，但却是必不可步的输人设备，
无论是操作电脑还是玩游戏都得通过它来完成。近140年前的1868年，键盘
出现在斯托弗·拉思兰·肖尔斯所发明的机械打字机上，当时的键盘是由26
个英文字母顺序排列的按钮所组成。因为打字机的设计是通过人在打字时按
下的键会引动字棒打印在纸上，当人们熟习应用，打字速度加快，机动字捧
追不上人手打字速度．经常交叠在一起．而出现卡键现象．甚至互相拍打而
损坏。
    直到19世纪后期。对于打字机键盘的字母排列仍然没有一个标准模式。
1873年．克里斯托弗·肖尔斯把键拆下来，将较常用的键设计在较外边。较
不常用的放在中间，从而形成目前众所周知的Q、w、E、R、T、Y键排列在
键盘左上方的方案。这种排法也就因其左上方第一行的头六个字母而被称为
“QWERTY”排法。
2。9 I
鹰鹤博弈：进化中的路径依赖
    选择这一排法的目的是使最常用的字母之间的距离最大化。这在当时确
实是一个解决方案：有意降低打字员的速度，从而减少各个字键出现卡位的
现象。但是销售商对这种排列发生疑问，于是肖尔斯撒谎说。这是经过科学
计算后得到的一个“新的、改进了的”排列结果，可以提高打字速度。这完
全是撒谎，凡是用熟练丁，怎么排列打字速度都会快。可是当时人们就信以
为真，并且把用其他方法排列的打字机挤出了市场。
    QWERTY的设计安排并不完美，甚至可以说非常糟糕，因为设计者错误
地把问题定位为人们打字太快。但是，“快”其实不是一个问题，人们使用打
字机，时间一久便会熟能生巧，愈打愈快．这是无可避免的。而且打字机是
为了方便人们，以短时间完成文章的，所以快也是应该的。因此，设计者应
把问题定位于字棒太慢才对。然而，随着1904年纽约雷明顿缝纫机公司已经
大规模生产使用这一排法的打字机，而这种排法实际上也成为产业标准。
    随着科技的发展，后来的电子打字机已经不存在字键卡位的问题。工程
师们也发明了一些新的键盘排法，比如DSK(德沃夏克简化键盘)，能使打字
员的手指移动距离缩短50％以上。同样一份材料，用DSK输人要比用
QWERTY输人节省5％一10％的时间。但QWER'[’Y作为一种存在已久的排法，
被人类广泛利用到电子词典、电脑等地方，成为键盘的标准设计。不仅几乎
所有键盘都用这种排法，人们学习的也多是这种排法，因此不大愿意再去学
习接受一种新的排法。于是．打字机和键盘生产商继续沿用OWERTY标准。
    假如DSK标准从一开始就被采纳，今天的技术就会有更大的用武之地。
不过，鉴于现在的条件．我们是不是应该转用另一种标准?事情并不是那么
简单。在QWERTY之下已经形成了许多不易改变的惯性，包括机器、键盘以
及受过训练的打字员。这些是不是值得重新改造呢?
    从整体社会发展的角度看，答案应该是肯定的。第二次世界大战期间．
美国海军曾广泛使用DSK打字机对打字员进行再培训。结果表明，再培训的
成本只要使用新型打字机10天就能全部得到弥补。
    私营企业主愿不愿意做这个再培训的工作呢?假如他们知道这样做从经
济角度上看是合算的，大概也会这样做。但是发现DSK的好处是一件并不容
易而且要付出代价的事情。因此没有几个私营企业主愿意提供再培训服务．
22。I
博彝匏魄泥诗
却要由某个像美国海军这样的大型机构充当第一个吃螃蟹的人。随着机械打
字机被电子打字机和电脑键盘取代，即便是现有的QwERTY键盘存货也不能
像以前那样阻挠改革．因为现在各键的排法只要改变一个小芯片，或改写某
个软件就能完全实现。
    不过．事实证明我们就是跳不出那个恶性循环。没有一个个人使用者愿
意承担改变社会ESS策略的成本，个人之间的难以协调。把我们紧紧束缚在
QWERTY之上。历史上那个导致几乎100％的打字员都使用OWERTY的偶然
事故．现在看来具有使其自身永生不朽的本事，即便当初推动发明的理由早
已不存在。
    QWERTY不过是历史问题怎样影响今日选择的一个证明。在某一历史阶
段曾经必须考虑的理由，到了今天可能已经无关紧要。今天，在选择相互竞
争的技术时，类似打字机键卡位这样的问题与最终选择的得失已经毫无关系。
在历史无法重新来过的情况下，如果使这种不好的路径依赖得以改变，仍然
有可能使每一个人都从中受益。但历史上出现的偶然事故．不一定可以由今
天的市场加以修正，市场的力量在这方面没有太多用武之地。我们选择
OWERTY键盘的经历，迫使我们不得不继续使用这种相对比较差的技术。
    通过博奔论的分析我们发现，出现相对较差的标准，与其说是技术上的
问题，不如说是行为上的问题。有关的例子都有一个均衡，在那一点上．大
家一致在报税时做手脚或超速驾驶，甚至在事先约定的时间之后l小时才赶
到会议现场。若要从一个均衡转向一个更好的均衡，需要通过协调行动来进
行，最有效的办法可能是借助一场短期而严厉的运动。
    假如耍改变一个相对比较差的标准，公众政策可以引导大家协调一致地
转向。在键盘的例子里，如果多数电脑生产商一致选择一种新的键盘排法；
或者一个主要雇主(比如政府)愿意培训其职员学习一种新的键盘，就能将
这个均衡完全扭转，从一个标准转向另一个标准。
    将度量衡的英寸和英尺转为公制就是一个例子；为了充分利用日光而协
调一致转用夏时制也是一个例子。要使这种策略行动发生作用，没有必要改
变每一个人．只要改变临界数日的一部分人就可以了。只要取得一个立足点，
随大流效应就能达成一个可以自动维持下去的均衡，更胜一筹的技术就能站
1222
鹰鸽博弈：进化中的路径依赖
稳脚跟．逐步扩张自己的地盘。
孙叔敖与超速均衡
    春秋时期．楚庄王起用了一位了不起的政治家孙叔敖。孙叔敖，字艾猎。
他青年时随父亲到郢都，正碰上令尹斗越椒作乱，父亲被杀，孙叔敖回家乡
隐居。后来，楚庄王在大臣虞丘子的推荐下，派人用王荤去迎孙叔敖。庄王
同他谈了一天，发觉他很有见识，就拜他为令尹。孙叔敖治国的最大特点是
施教导民，唯实而不唯上。在想办一件利国利民的好事时．不靠脱离实际的
行政命令，而是依靠高超的政治智慧。
    随着楚国实力的增强。与中原各强国的冲突也日益增多。对于作战用的
战车的需求也相应的增加。但是楚国民俗习坐矮车，民间的牛车底座程低，
不适于在战时用做马车。楚庄王准备下令全国提高车的底座。孙叔敖说：“下
令太多，民不知所从，这不好。如果您想把车底座改高，我请求让各个地方
的城镇把街巷两头的门限升高。乘车的人都是有身份的君子，他们不能为过
门槛频繁下车，自然就会把车的底座造高了。”
    庄王听从了他的建议．没有发布政令，而是由官府机构统一放弃底座低
的矮车．而改造高车乘用，同时将大小城镇的街巷两头设一较高的门限，只
有高车才能通过，矮车就会被卡在那里，靠人推才能通行。这样过了不到三
个月．全国的牛车底座都升高了。对这件事，司马迁评价说：“此不教而民从
其化，近者视而效之，远者四面望而法之。”
    实际上，孙叔敖的这一做法，包含着很深刻的博弈论智慧在其中。要理
解这种智慧，我们需要考察一个现实生活中的博弈——超速博弈。在这个博弈
里．一个司机的选择会与其他所有司机发生互动。
    在我国，交管部门按照《中华人民共和国道路交通安全法》等法律法规
的有关规定．对车辆的行驶速度进行限定。比如在北京，二环、三环和四环
路，限速在50—80公里，，j、时；五环路的限速为50～90公里川、时；机场高速
路最高限速为120公里孙时；京津塘高速路的限速为1lO公里川、时；长安街、
两广大街、平安大街、前三门大街限速为70公里，每小时。对于超速的车辆，
挖。I
博彝论的维舻
根据情节不同处以罚款、记分直至吊销驾驶执照的惩罚。
    那么在这种规定之下，你要不要约束自己的行驶速度呢々
    假如所有的人都在超速行驶，那么你有两个理由超速。首先，驾驶的时
候与道路上车流的速度保持一致更安全。在大多数高速公路上，谁如果开车
只开到每小时55公里，就会成为一个危险的障碍物，人人都必须避开他。其
次，假如弥跟着其他超速车辆前进，那么教抓住的机会几乎为零。因为警方
根本没工夫让它们通通停到路边进行处理。只要你紧跟道路上的车流前进．
那么总体而言你就是安全的。
    假如越来越多的司机遵守限速规定．上述两个理由就不复存在。这时，
超速驾驶变得越来越危险，因为他需要不断在车流当中穿过来叉插过去，而
被逮住的可能性也会急剧上升。
    我们可以用图15．1来讨论这个问题。横轴表示愿意遵守速度限速的司机
的百分比。直线A和B表示每个司机估计自己可能得到的好处，A线表示遵
守限速的好处，B线表示超速的好处。结论是，假如谁也不肯以低于法律限制
的速度行驶(左端所示)，你也不该那样做(这时B线高于A线)；假如人人
遵守法律(右端所示)，休也应该遵守(这时A线高于B线)。
得益
遵守速度限制法律的司机的比例(％
    围15-1超速博弈
    在超速行驶的案例中，变化趋势变成朝向其中一个极端。因为跟随你的
选择的人越多，这个选择的好处就越多。一个人的选择会影响其他人。假如
有一个司机超速驾驶。他就能稍稍提高其他人超速驾驶的安全性。假如没有
r
鹰鸽罅弈：进化中的路径依赖
人超速驾驶，那就谁也不想第一个超连驾驶、为其他人带来“好处”，因为那
样做不会得到任何“补偿”。反之假如人人超速驾驶，谁也不想成为唯一落后
的人。
    交管部门若是希望鼓励驾驶者遵守限速，关键在于争取一个临界数目的
司机。这么一来，只要有一个短期的极其严格且惩罚严厉的强制执行过程．
就能扭转足够数目的司机的驾驶方式，从而产生推动人人守法的力量。均衡
将从一个极端(人人超速)转向另一个极端(人人守法)。在新的均衡之下．
警方可以缩减执法人手，而守法行为也能自觉地保持下去。
    看到这里，我们已经能够理解孙叔敖在抬高城门槛的行动中所运用的智
慧了。在他的方法中，提高门槛的高度．相当于对底座较低的矮车进行的一
种惩罚，而为高车提供的一种便利。最开始的时候，使用矮车的“君子们”
受到种种限制．产生种种不便，无法顺利通过街巷的门限。而与此同时，官
府所使用的高车又给了他们一个示范的效应。为了得到这种通行便利．改造
自己的车辆底座也就理所当然地成为一种优势策略。
    孙叔赦的做法对我们的启示在于，一个短暂而立竿见影的执法过程，其
效率不仅远远胜过无法触动现行习惯的任何行政命令，而且大大高于一个投
人同样力量进行的一个长期而温和的执法过程。
    任何法规政令，无论它的规定多么严密周详，如果无法严格执行．那么
它的存在价值不仅会大打折扣．而且还会产生一种容易被人忽视的负面作用．
那就是阻碍更新也更有效的法规的出现。
香蕉可以从两头吃
    亚太经合组织在上海开会期间。中央电视台做了一次访谈节目，一个美
国在华女投资人说了一句话：“我们美国人吃香蕉是从尾巴上剥，中国人总是
从尖头上剥．差别很大．但没有谁一定要改变谁的必要吧。”
    世界上许多事，国家间的大事．人与人之间的小事，许多都与这个“从
哪一头吃香蕉”的问题有相似的地方——各持一端．也许都有道理。一个人很
难让自己改变剥香蕉的习惯。
22。l
彝论的商}
    无论懒惰者还是勤勉者，养金鱼都投有问题。勤勉者可以每天换一次水，
懒惰者尽可以一月一换。只是如果突然改变换水的习惯．变一天为一月，或
变一月为一天，金鱼都可能莫名其妙地暴毙。勤勉者据此得出结论：金鱼必
须一天一换水：懒惰者得出完全相反的结论：金鱼只能一月一换水。
    这就如同我们剥香蕉的方式．很多人之所以急于改变，其实是出于一种
自卑与近视。如果遇到难以进行的改变，我们不妨先试试换个角度去想．它
是不是一个香蕉问题，如果是。那么既然香蕉是可以从两头吃，那么这种改
变又有什么必要呢々
    在人们的生活中，存在着种种惯例．也就是哈耶克所说的规范人们社会
活动与交往的“未阐明的规则系统”，尽管它不像种种法律法规和规章制度那
样是一种成文的、正式的、由第三者强制实施的硬性规则，而只是一种非正
式规则．一种诺思所理解的“非正式约束”，但是它巨大的影响力却是绝对不
容忽视的。
    在《制度经济学》一书中，作者康芒斯指出：“至于某些习俗，像商誉、
同业行规、契约的标准形式、银行信用的使用、现代稳定货币的办法等等这
一切都称为‘惯例’，(因此)好像习俗与惯例有一种区别似的。可是．除了
所要求的一致性和所允许的变化性的程度不同而外，并没有区别。”接着．康
芒斯还举例道，在现代社会中使用银行支票的惯例，其强迫性不下于在欧洲
中世纪佃农在领主土地上服役的习俗。一个现代商人不能自由使用现金，而
必须用银行支票．这很像佃农不能自由去跟盗侠罗宾汉人伙一样。如果一个
现代商人拒绝收付银行支票，他根本就不能继续生存。许多其他的现代惯例，
也有同样的情况。如一个工人在他人都7：00准时上班的情况下8：00才到，就
不能保住他的饭碗。
    Ess策略能提供给博弈的参与者一些确定的信息，因而它也就能起到节
省人们在社会括动中的交易费用的作用。最明显的例子是格式合同。格式合
同又称标准合同、定型化合同，是指当事人一方预先拟定合同条款，对方只
能表示全部同意或者不同意。因此，对于另一方当事人而言，要订立合同．
就必须全部接受合同条件。现实生活中的车票、船票、飞机票、保险单、提
单、仓单、出版合同等都是格式合同。在进行一项交易时，只要交易双方签了
1226
鹰鸽博奔：进化中的路径依赖
字就产生了法律效力，也就基本上完成了一项交易活动。这种种契约和合约的
标准文本．就是一种Ess策略或称惯例。
    我们可以想像，如果没有这种种标准契约和合约文本，在每次交易活动
之前．各交易方均要找律师起草每份契约或合约，并就各种契约或合约的每
项条款进行谈判、协商和讨价还价，如果是这样的话，任何一种经由签约而
完成的交易活动的交易成本将会高得不得了。
    《华尔街日报》曾经有一篇文章分析中国人中秋节互赠月饼的礼仪。若
干年以前．每块l，4磅重的月饼——最常见的馅是由莲蓉、糖、油组成的——
是贵重的礼品．稀罕的饕餮美食．人们把月饼精心地保存到寒冷的冬季．即
大多数人仅能吃上大白菜的时令。不过．居住在城市里的中国人现在富裕了，
月饼变得更像是累赘而非礼品了。就像美国的圣诞节水果蛋糕一样，蛋糕被
人们送来送去．直到节日终了——最后一个收到蛋糕的人就不得不吃了它，或
者悄悄地扔掉。
    在人们天天只能吃大白菜的时代里，月饼是一种有意义的礼品，会带来
某种受欢迎的改善。令人困惑的是，人们为什么要在收到月饼之后回赠月饼，
而不是消费自己买的或者傲的月饼?答案在于，月饼赠与是人们传递给朋友、
亲属、同事的信号，以此表明自己是良好的合作者。像其他非货币赠与一样，
月饼一方面对赠与人来说是成本高昂的，另一方面对受赠人来说叉价值不大
——它湮没在了源自人际关系的合作收益之中。
    为什么赠送月饼而不是其他什么东西成为了一种信号·
    答案是．人们今年相互赠送月饼，是因为他们去年就相互赠送月饼。在
任何时间，人们的行为必须符合摹于此前一段时间的预期。如果他们不这样
做的话，那么其他人就会开始怀疑他是否想延续某一关系。
    除了这些显性的惯例，还有一些隐性的，但是心照不宣的惯例，同样在
支配着各个领域的社会生活。著名作家吴思将其称为“潜规则”．事实上，这
三个字也是他的一本流传很广的书的名字。在《潜规则》一书中，吴思指出，
支配官僚集团行为的东西，“经常与他们宣称遵循的那些原则相去甚远。例如
仁义道德．忠君爱民，清正廉明等等。真正支配这个集团行为的东西，在更
大的程度上是非常现实的利害计算。这种利害计算的结果和趋利避害的抉择，
柳l
博彝论蝻z学胪
这种结果和抉择的反复出现和长期稳定性，分明构成了一套潜在的规矩．形
成了许多本集团内部和各集团之阃在打交道的时候长期遵循的潜规则。”
成名发财都要趁早
    斯坦福大学经济学家布赖恩·阿瑟是将数学工具加以发展运用于研究路
径依赣效应的先驱者之一。他这样描述我们选中汽油驱动汽车的缘由。
    在1890年．有三种方法给汽车提供动力：蒸汽、汽油和电力，其中有一
种显然比另外两种都更差，这就是汽油。但是历史性的转折点出现了，1895
年，芝加哥《时代先驱报》主办了一场不用马匹的客车比赛。这次比赛的获
胜者是一辆汽油驱动的杜耶尔．它是全部6辆参赛车辆当中仅有的2辆完成
比赛的车辆之一．据说是它很可能激发了R·E-奥兹的灵感，使他在1896
年申请了一种汽油动力来源的专利，后来又把这项专利用于大规模生产“曲
线快车奥兹”。汽油因此后来居上。
    蒸汽作为一种汽车动力来源一直用到1914年。当时在北美地区爆发了口
蹄疫，导致马匹饮水槽退出历史舞台，而饮水槽恰恰是蒸汽汽车加水的地方。
斯坦利兄弟花了三年时间发明了一种冷凝器和锅炉系统．从而使蒸汽汽车不
必每走三四十英里就得加一次水。可惜那时已经太晚了。蒸汽引摹再也没能
重振雄风。
    毫无疑问，今天的汽油技术远远胜过蒸汽。不过，这个比较并不公平。
假如蒸汽技术授有被废弃，而是得到了以后75年的研究和开发，现在会变成
什么样呢，虽然我们已经永远不会知道答案，但一些工程师相信蒸汽获胜的
机会还是比较大的。
    之所以选择汽油引擎而非蒸汽引擎．选择轻永核反应堆而非气冷核反应
堆，原因与其说是前者更胜一筹，倒不如说是历史上的偶然事故。
    研究路径依赖，对于我们个人的一个重要启迪在于，早日发现自己的潜
力并发挥出来，可以为明天取得成功获得更多的优势。这是因为，一旦我们
取得了足够大的先行优势，其他人哪怕更胜一筹，恐怕也难以赶上。
    1973年，美国科学史研究者默顿用这几句话来概括一种社会心理现象：
1228
鹰鹊博弈：进化中的路径依赖
“对已经有相当声誉的科学家做出的科学贡献给予的荣誉越来越多，而对那
些未出名的科学家则不承认他们的成绩。”他将这种社会心理现象命名为“马
太效应”。
    马太效应是一种让人心理不太平衡的社会现象：名人与无名者干出同样
的成绩，前者往往得到上级表扬．记者采访，求教者和访问者接踵而至，各
种桂冠也纷至沓来；而后者则无人问津，甚至还会遭受非难。实际上，这也反
映当今杜会中存在的一个普遍现象．即赢家通吃：富人享有更多资源——金钱、
荣誉以及地位，穷人却变得一无所有。日常生活中的例子也比比皆是：朋友
多的人，会借助频繁的交往结交更多的朋友。而缺少朋友的人则往往一直孤
独；名声在外的人会有更多抛头露面的机会，因此更加出名；一个人受的教
育越高，就越可能在高学历的环境里得到发展。
    马太效应，似乎可以看做是在路径依赖的作用机制下形成的一种现象。
它的启示在于：成功是成功之母。人们喜欢说失败是成功之母．这句话听起
来有一定道理．但如果一个人屡屡失败．从未品尝过成功的甜头．还会有必
胜的信心吗’还相信失败是成功之母吗?
    一本名为《超越性思维》的书曾经提出过“优势富集效应”的概念：起
点上的微小优势经过关键过程的级效放大会产生更大级别的优势累积。起点
对于整件事物的发展，往往超过了终点的意义。这就像在100米赛跑的时候，
当发令枪响起的时候，如果你比别人的反应快几毫秒，那么你就可能夺得冠
军。
    事实上，马太效应使成功有倍增效应，你越成功，就会越自信，越自信
就会使你越容易成功。成功像无影灯一样，不会给人心灵上投下阴影，反而
会满足自我实现的需要，产生良好的情绪体验，成为不断进取的加油站。
    另一方面，如果发现某项方案一旦占据支配地位，可能会带来潜在的问
题，那么就必须在全力以赴地投人之前。预留更多的空间．寻找更加多样化
的方案。也就是说，在研究什么样的方案能适应今天的需要的同时．花更多
时间考虑什么方案最能适应未来发展，那么未来就可能获得更大的收获，也
能避免更多的遗憾。
跎。I
第1 6章
脏脸博弈：共同知识的车轱辘
想爱就要爱到让你忘不了
我的热情拥抱
相信你都知道
——《只要我做得到》歌词
他们为什么会脸红
    约翰和杰克去清扫一个大烟囱。那烟囱只有踩着里面的钢筋踏梯才能上
去，杰克在前面．约翰在后面抓着扶手一阶一阶地爬上去了。下来时，杰克
依旧走在前面。于是，钻出烟囱时杰克的脸上全被烟囱里的烟灰蹭黑了，而
约翰脸上竟连一点烟灰也没有。
    约翰看见杰克的模样．心想自己一定和他一样脏．于是就到附近的小河
里去洗了叉洗。而杰克看见约翰干干净净，就以为自己也一样干净，只草草
地洗了洗手就上街了。街上的人都笑痛了肚子，还以为杰克是个疯子呢。
    杰克后来对儿子说：“其实别人谁也不能做你的镜子，只有自己才是自己
的镜子。拿别人做镜子．白痴或许会把自己照成天才的。”
    这个故事读来妙趣横生．发人深省。故事的最后一段话．固然可以说明
自我观照的重要，但是我们难道真的不能把别人当自己的镜子吗?
    在回答这个问题之前，我们先来看博弈论中一个著名模型：脏脸博弈。
假定在一个房间里有三个人，三个人的脸都很脏，但是他们只能看到别人而
脏脸博奔t麸同知识的车轱辘
无法看到自己。这时，有一个美女走进来，委婉地告诉他们说：“你们三个人
中至少有一个人的脸是脏的。”这句话说完以后，三个人各自看了一眼，没有
反应。
    美女又问了一句：“你们知道吗?”当他们再彼此打量第二眼的时候．突
然意识到自己的脸是脏的，因而三张脸一下子都红了。为什么7
    当只有一张脸是脏的时候，一旦美女宣布至少有一张脏脸，那么脸脏的那
个参与人看到两张干净的脸，他马上就会脸红。而且所有的参与人都知道，
如果仅有一张脏脸，脸脏的那个人一定会脸红。
    在美女第一次宣布时，三个人中没人脸红，那么每个人就知道至少有两张
脏脸。如果只有两张脏脸，两个脏脸的人各自看到一张干净的脸，这两个脏
脸的人就会脸红。而此时如果没有人脸红，那么所有人都知道三张脸就是脏
的，因此在打量第二眼的时候所有人都会脸红。
    即便没有美女的宣布，参与者也知道至少有～个人的脸是脏的。为什么美
女的一句看似无用的废话，三个人就都知道自己的脸是脏的呢，
    过就是共同知识的作用。共同知识的概念最初是由逻辑学家李维斯提出
的。对一个事件来说，如果所有博奔当事人对该事件都有了解，并且所有当
事人都知道其他当事人也知道这一事件，并且所有当事人都知道所有当事人
都知道这一事件，那么该事件就是共同知识。
    假定一个人群由A、B两个人构成，A、B均知道一件事实f，f是A、B
各自的知识，而不是他们的共同知识。当A、B双方均知道对方知道f，并且
他们各自都知道对方知道自己知道f¨·
    这就相当于动态博弈中的倒推法，是获得决策信息的方式。但是它与一条
线性的推理链不同，这是一个循环，即“假如我认为对方认为我认为…．1l’。也
就是说．当“知道”变成一个可以循环绕动的车轱辘时，我们就说f成了A、B
间的共同知识。因此，共同知识涉及一个群体对某个事实“知道”的结构。在
上面的博奔中．美女的“废话”所引起的唯一改变，是使一个所有参与人事先
都知道的事实成为共同知识。
    在静态博弈里，没有一个博弈者可以在自己行动之前得知另一方的整个
计划。在这种情况下．互动推理不是通过观察对方的策略进行的，而是必须
通过看穿对手的策略才能展开。
∞。I
    要想做到这一点，单单假设自己处于对手的位置会怎么做还不够。即便
你那样做了．休会发现，你的对手也在做同样的事情，即他也在假设自己处
于你的位置会怎么做。每一个人不得不同时担任两个角色，一个是自己，一
个是对手，从而找出双方的最佳行动方式。
    为了对这一点加深了解，我们来看下面这个据说来自微软的试题。
    有3顶黑帽子．2顶白帽子。让三个人从前到后站成一排。给他们每个人
头上戴一顶帽子。每个人都看不见自己戴的帽子的颜色．只能看见站在前面
那些人的帽子颜色。最后那个人可以看见前面两个人头上帽子的颜色，中间
那个人看得见前面那个人的帽子颜色但看不见在他后面那个人的帽子颜色．
而最前面那个人谁的帽子都看不见。从最后那个人开始，问他是不是知道自
己戴的帽子的颜色，如果他回答说不知道．就继续问他前面那个人。现在最
后面一个人说他不知道，中间那个人也说不知道，当问到排在最前面的人的
时候．他却说已经知道。为什么?
    这是共同知识的机制在发生作用。最前面的那个人听见后面两个人都说
了“不知道”．他假设自己戴的是白帽子，那么中间那个人看见他戴的白帽子
就会做如下推理：“假设我戴了白帽子．那么最后那个人就会看见前面两顶白
帽子，因总共只有两顶白帽子，他就应该明白他自己戴的是黑帽子。但现在
他说不知道，就说明我戴了白帽子这个假定是错的，所以我戴了黑帽子。”问
题是中间那人也说不知道．所以晟前面那个人知道自己戴白帽子的假定是错
的，所以推断出自己戴了黑帽子。
    在这个过程中，只有通过三个回合的描摩，每个人才能知道其他人眼里
看到的帽子颜色，从而判断自己头上的帽子颜色。
别人的信封更诱人
    古时候，盒陵有个姓张的药贩子。他卖药的方法很特别，在桌子上放一
个泥胎佛像．有人来看病买药．他就取些药丸放在盘子里，端到佛像的手掌跟
前，只见有些药片自动跳起来．粘到佛手上，另外一些则纹丝不动。于是张药
贩就把佛手上的药丸取下来，说：“佛给你们挑出的良药，准保能把病治好!”
r
    要想做到这一点，单单假设自己处于对手的位置会怎么做还不够。即便
你那样做了．休会发现，你的对手也在做同样的事情，即他也在假设自己处
于你的位置会怎么做。每一个人不得不同时担任两个角色，一个是自己，一
个是对手，从而找出双方的最佳行动方式。
    为了对这一点加深了解，我们来看下面这个据说来自微软的试题。
    有3顶黑帽子．2顶白帽子。让三个人从前到后站成一排。给他们每个人
头上戴一顶帽子。每个人都看不见自己戴的帽子的颜色．只能看见站在前面
那些人的帽子颜色。最后那个人可以看见前面两个人头上帽子的颜色，中间
那个人看得见前面那个人的帽子颜色但看不见在他后面那个人的帽子颜色．
而最前面那个人谁的帽子都看不见。从最后那个人开始，问他是不是知道自
己戴的帽子的颜色，如果他回答说不知道．就继续问他前面那个人。现在最
后面一个人说他不知道，中间那个人也说不知道，当问到排在最前面的人的
时候．他却说已经知道。为什么?
    这是共同知识的机制在发生作用。最前面的那个人听见后面两个人都说
了“不知道”．他假设自己戴的是白帽子，那么中间那个人看见他戴的白帽子
就会做如下推理：“假设我戴了白帽子．那么最后那个人就会看见前面两顶白
帽子，因总共只有两顶白帽子，他就应该明白他自己戴的是黑帽子。但现在
他说不知道，就说明我戴了白帽子这个假定是错的，所以我戴了黑帽子。”问
题是中间那人也说不知道．所以晟前面那个人知道自己戴白帽子的假定是错
的，所以推断出自己戴了黑帽子。
    在这个过程中，只有通过三个回合的描摩，每个人才能知道其他人眼里
看到的帽子颜色，从而判断自己头上的帽子颜色。
别人的信封更诱人
    古时候，盒陵有个姓张的药贩子。他卖药的方法很特别，在桌子上放一
个泥胎佛像．有人来看病买药．他就取些药丸放在盘子里，端到佛像的手掌跟
前，只见有些药片自动跳起来．粘到佛手上，另外一些则纹丝不动。于是张药
贩就把佛手上的药丸取下来，说：“佛给你们挑出的良药，准保能把病治好!”
r
飘譬篮
舻
    有一个叫小古谭的少年决定要把此事探个究竟。这一天，他邀请张药贩
到酒馆里喝酒。他们来到一家酒馆．伙计也不问他们要吃什么，只是一个劲
地往上端酒菜。鱼、虾、鸡、鸭摆了满满一桌子。吃喝完毕，小古谭也不跟
饭馆算账交钱，便领着张药莠叵扬长而去。酒馆的人好像没有看见他们走一样，
也不向他们要钱。第二天，小古谭又领着张药贩来到另一家酒馆，照样大吃
一顿山珍海味，一分钱不花。管账的连问也不问，好像他们根本就段吃没喝
一样。第三天．小古谭又领张药贩到第三家酒馆。这回不但大吃大喝，临走．
小古谭还从酒馆拿了两只鸡送给张药贩，酒馆的人似乎没有看到。
    张药贩惊奇得了不得，忍不住向小古谭请教这是什么法术。小古谭说：“告
诉你也可以，不过你得先告诉我，你那佛手取药是什么法术?”张药贩说：“原
来你是想学我这仙人取药啊!这好说，我是在佛手里藏了块磁铁，再在一些
药丸里和进些碎铁屑。这样，药丸一挨近佛手，带有碎铁屑的药丸，自然就
被佛手里的磁铁吸在佛手上了。”讲完以后，小古谭说道：“我的秘密也可以
告诉你，我事先把银钱付给了酒馆，约定好等我们来喝酒时．只管端来酒菜。
我们吃罢，他们叉怎么能再来要钱呢!”
    双方都在使用骗术，并且从一开始双方都知道对方在使用骗术，但是强
烈的好奇心促使他们非要知道对方的葫芦里到底卖什么药。
    这就像赌博一样。赌博必然存在的一个事实是一人所得意味着另一人所
失。因此，在参加一场赌博之前，必须从另一方的角度对这场赌博进行评估。
理由在于，假如对方愿意参加这场赌博，那一定认为自己可以取胜，同时也
就意味着他们一定认为你会输。
    那么是否存在着看起来对双方都有利的赌博昵?
    现在有两个信封，每一个都装着一定数量的钱。具体数目可能是5元、
10元、20元、40元、B0元或160元。而且大家也都知道这一点。同时，我
们还知道．一个信封装的钱恰好是另一个信封的两倍。我们把两个信封打乱
次序，一个交给A．一个交给B。
A和B把两个信封分别打开之后。按规定他们只能偷偷地散一下里面的钱
数。这时，他们得到一个交换信封的机会。假如双方都想交换，就可以交换。
    如果B打开他的信封．发现里面装了20元。他会这样推理：A得到10
r
脏脸博奔：共同知识的车轱辘
元和40元的概率是一样的。因此，假如我交换信封，预期回报等于25元(即
(10元十40元)，2)，大于20元。对于数目这么小的赌博，这个风险无关紧
要，所以，交换信封符合我的利益。
    通过同样的证明可知，A也想交换信封。如果他打开信封发现里面装的
是lO元，他估计B要么得到5元，要么得到20元，平均值为12 50元，
如果信封中有40元，他估计B要么得到20元，要么得到80元，平均值为
50元。
    这里出了问题。双方交换信封不可能使他们的结果都有所改善，因为用
来分配的钱不可能交换一下就变多了。推理过程在哪里出了错呢?两个人是
否都应该提出交换．或者说是否有一方不应该提出交换呢?假如双方都是理
性的．而且估计对方也是这样，那就永远不会发生交换信封的事情。
    这一推理过程的问题在于，它假设对方交换信封的意愿不会泄露任何
信息。我们通过进一步考察一方对另一方思维过程的看法．就能解决这个
问题。
    首先，我们从A的角度思考B的思维过程。然后，我们从B的角度想像
A可能怎样看待他。最后，我们回到A的角度，考察他怎样看待B怎样看待
A对自己的看法。这昕上去比实际情况复杂多了。可是从这个例子看．每一
步都不难理解。
    假定A打开自己的信封，发现里面有160元。在这种情况下，他知道自
己得到的数目比较大，也就不愿加人交换。既然A在得到160元的时候不愿
交换．B应该在得到80元的时候拒绝变换，因为A唯一愿意跟他交换的前提
是A得到40元，若是这种情况，B一定更想保住自己得到的80元。
    不过．如果B在得到80元的时候不愿交换．那么A就不该在得到40元
的时候交换信封．因为交换只会在B得到20元的前提下发生。现在我们已经
到达上面提出问题时的情况。如果A在得到40元的时候不肯交换，那么，当
B发现自己的信封里有20元的时候，交换信封也不会有任何好处；他一定不
肯用自己的20元交换对方的10元。
    唯一一个愿意交换的人．一定是罪个发现信封里只有5元的人，不过．
这时候对方一定不肯跟他交换。
趵。I
1天与100天的博弈
    故事发生在一个村庄，村里有100对夫妻，他们都是地道理性的逻辑学
家。
    村里有一些奇特的风俗：每天晚上，村里的男人们都围坐在篝火旁举行
会议，议题是谈论自己的妻子。在会议开始时，如果一个男人有理由相信他
的妻子对他总是忠贞的，那么他就在会议上当众赞扬她的美德。另一方面，
如果在会议之前的任何时间．只要他发现他妻子不贞的证据，那他就会在会
议上悲号，并析神灵严厉地惩罚她。再则，如果一个妻子曾有不贞，那她的
情人会立即告知村里除她丈夫之外所有的已婚男人。这真是一种奇异的风俗，
但是却为村民承认并遵守。
    事实上，每个妻子都巳对丈夫不忠。于是每个丈夫都知道除自己妻子之
外其他人的妻子都是不贞的女子．因而每个晚上的会议上每个男人都赞美自
己的妻子。这种状况持续了很多年，直到有一天来了一位传教士。传教士参
加了篝火会议，并听到每个男人都在赞美自己的妻子，他站起来宣布说：“这
个村子里至少有一个妻子已经不贞了。”在此后的99个晚上，丈夫们继续赞
美各自的妻子．但在第100个晚上，他们全都悲号起来，并向上苍祈求神灵
严惩自己的妻子。
    这是一个推理和行动的过程。在传教士做了宣布之后的第一天，如果村
里只有一个女人是不忠的话，这个女人的丈夫在传教士宣布之后就能知道。
因为，他们做了这样一个推理：如果这个女人是其他女人的话，他应当知道，
既然不知道。那么这个不忠的女人肯定就是他的妻子。因此，如果村里只有
一个女人不忠的话，在传教士宣布的当天晚上，这个女人的丈夫就会在会议
上悲哀哭泣。
    可是这样的情况在第一天晚上并没有发生．于是所有丈夫都知道了村子
里至少有两个女人不忠。如果只有两个女人不忠，那么这两个女人的丈夫第
一天都不会怀疑到自己的妻子，因为他知道另外有一个女人不忠。可是第一天
并没有一个丈夫哭泣，这两个不忠的女人的丈夫想，他只知道一个，那么另一
1256
脏脸博弈：共同知识的车轱辘
个不忠的女人肯定是他的妻子!那么第二天晚上，就会有两个丈夫因为知道妻
子不忠而哭泣。
    可是第二天仍然平安无事，于是丈夫们就都知道，至少有三个女人不忠
    这样的推理会继续99天．就是说，前99天每个丈夫都没怀疑到自己的
妻子，而当第100天的时候，每个男人都确定地推理出自己的妻子红杏出墙，
于是都开始哭泣。
    应该说．传教士对“至少一个女^是不忠的”这个事实的宣布，似乎并
没有增加这些男人对村里女人不忠行为的知识，他们其实都知道这个事实。
但为什么传教士的宣布使得他们都伤心欲绝呢?
    根源还在于共同知识的作用。传教士的宣布使得这个村子里的男人的知
识结构发生了变化，本来“至少一个女人是不忠的”对每个男人都是知识．
但却不是共同知识，而传教士的宣布使得这个事实成为“共同知识”。
    在金融市场上，这个机制有着深刻的含义。其他经济学家们以“共同知
识”为基础讨论过金融危机与金融恐慌的传导机制。为了更深刻地理解这一
点，我们来认识一位“股票奇才”格连维尔。
    格连维尔是美国金融界的奇人，在佛罗里达出版一个刊物——《格连维尔股
票市场通讯》，加上其他出版物。每年的收人就有500万美元。《格连维尔股
票市场通讯》拥有几千个订户．依托《通讯》，格连维尔叉办了一个消息预告
系统，通过电话热线，把有关股票市场的“提示”，提前告诉每一个订户。
    1981年1月，美国经济已渡过危机，进人全面复苏的前夜。所有的工商
企业都开始招兵买马，准备新一轮的发展。在这种情况下，股票当然会上涨。
但1981年1月5日，格连维尔根据自己的研究，断言股票会下跌．在通讯上
登出大标题——“格连维尔忠告客户卖出一切东西，包括股票和房地产在内”。
1月6日，恐慌袭击华尔街，许多人连看都不看显示屏上的数据，便抛掉手中
的股票。1月7日，人们继续卖出!格连维尔成了人们心中的英雄预亩家。格
连维尔说，股票市场服从地球引力定律正如纽约市的帝国大厦一样，从底级
拾级而上，要用两个半钟头才能到达顶层，但如果从顶层跳下来，8秒钟就可
到达地面了。
25’l
博彝论构锺}舻
共同知识的作用
    有两个上匪抢劫路人，抢了一大笔钱，然后就跑到荒郊野外的城隍庙里。
土匪甲对土匪乙说道：“这笔买卖让我们做成，是城隍老爷给我们发财的机会．
我们应该买些酒菜在他面前拜一拜，感激他的恩典。”乙马上同意：“这样很
好．你去买菜．我在城隍庙前等你。”
    甲走了以后，乙心里就打起了算盘。他想：“这笔钱两个人分，一人只有
一半．这一半能用多久，”想到这里．他就准备了一把斧头。甲买酒菜回来，
远远地就喊：“大哥，酒菜买回来了。”不料剐一进门，锋利的斧头一下子从
脑后砍来。
    甲死后。乙欢喜非凡。打开甲买回来的酒肉自斟自酌。吃饱喝足以后，
他刚要站起来拿着那笔钱逃之天天，忽然觉得天旋地转，腹痛如绞。他挣扎
了一会儿，就口鼻流血一命呜呼了。原来，甲也想独得那笔钱，提前在酒菜
里放了毒药。
    学者赵汀阳曾经在中央电视台的一个节目中，通过一个类似的故事来注
明“看不见的手”失灵的情况。不过，在他的案例中，假定的条件是这两个
歹徒同样聪明、同样理性、同样都是自私自利的，那么这个时候不但同时想
到：“我必须干掉对方，这个时候我能够独吞这笔巨款。”同时脑子里头叉会
迅速地进行着理性思考：“我知道他知道我怎么想，我也知道他怎么想，并且
我也知道他知道我怎么想”，这就是他们的共同知识。这时他们最好的选择就
是要抢先下手，但是因为他们两个人思考速度一样快，理性程度一样高．所
以就会同时下手，两个人就都死了。这也就叫双死的均衡。
    我们可以说，让这两个歹徒同时毙命的关键因索．就是共同知识的假设。
从这个故事中，我们可以看出共同知识的一种作用机制。事实上在生活交际
中．共同知识起着一种须臾不可或缺的作用，只不过我们并没有意识到而已。
    著名相声大师刘宝瑞先生有一个《知县见巡抚》的著名段子．说的就是
一个因为缺少共同知识而产生的笑话。
    光绪年间．浙江杭州有个茶叶铺，掌柜钱如命深通生财之道，十几年的
1258
致r
脏脸博弈：共同知识的车轱辘
工夫就开了好几个分号，还在安徽买了座茶山，坐庄收茶，大发财源。钱
越赚越多，钱如命就开始看当官比做买卖好，叉赚钱，又威风。当时做官
有两种途径：一种是科举及第，凭学问本事考中；另一种是捐班，花钱可以
买官。钱如命斗大的字认不了一箩筐，于是就花银子买了个实缺知县，走马
上任。
    钱如命做了一年多知县，官瘾越来越大，想弄个知府做做。于是他带着
大批银两到省城．托人给巡抚送了一份厚礼，另加一张一万两银子的银票。
巡抚一看礼物不轻，当时就派人传唤。钱如命换了身新官衣来到衙门，见了
巡抚，行完礼，落了座，差人献茶。
    在当时．官场上为客人献茶只是一种形式，客人并不真正喝茶，尤其是
当下属拜见上司时，即使面前有一杯茶，也绝对不能喝，当正事说完后．主人
会举起茶杯说“请喝茶”．那就是告诉你应该走啦。这时客人会识趣地赶快告辞。
因此端茶是一种送客的暗示，这实际上也是官场上的一种共同知识，无须交代。
像巡抚这样的官，只要一端起茶碗。底下的差人马上就喊“送客”，你有多重要
的事情没谈也得告辞。这个官场规矩叫“端茶送客”。
    可是钱如命是茶叶铺掌柜出身．不懂这一套，他心想：他是巡抚．我是
知县，应当主动客气。坐了一会儿，他双手捧起茶碗对巡抚说：“大帅，您喝
茶!”巡抚听了心里一愣：怎么，你跑到我这儿“端茶送客”来啦7 1你打算
把我轰哪儿去呀!钱如命看巡抚没言语，叉奉承了一句：“大帅。您这茶叶真
不错，我一尝就知道是地道的西湖龙井!”巡抚心里不高兴，脸上可没露出
来。倒不是这位巡抚大人宽宏大量，实在是看在那银票的分上．要不然早就
翻脸啦。
    没有共同知识的博弈。会给整个社会无端增加许多交易成本。
    在社会上无处不在的这类知识，当然并不仅限于端茶代表送客这样表层
的东西，这一类约定俗成的规矩在整个官场交际体系当中，甚至连皮毛也算
不上。但是通过这个笑话，我们却可以从中了解到，共同知识对于生活于社
会上的人们．具有如何重大的意义。
趵。I
第1 7章
信息不对称：买的不如卖的精
爱不爱你我不告诉你
让你猜不清楚我的心
想不想你我不要告诉你
答案就在我的荚靥里
——《我不告诉你》歌词
劣币驱逐良币效应
    明朝嘉靖时，朝廷为了维护铜币的地位，曾发行了一批高质量的铜币，
结果却使得盗铸更甚。为什么呢?原来在市场上流通的一般铜币质量远低于
这些新币．盗铸有重利可图，致罪者虽多．却无法禁绝。私铸者还往往磨取
官钱的铜屑以铸钱，使官钱也逐渐减轻，同私铸的劣币一样；而且新币会被
人收拢，熔化然后按照一般的较低的质量标准重铸．从中获利。
    可是另一方面．如果政府铸造的金属币质量过于低下的话，同样会鼓励
民间私铸。明代在15世纪中取消了对金属货币的禁令，却没有手段来保障
铜币的供给，这导致了大量伪钱占领了市场，并引发了前述劣币驱逐良币的
效应。
    对于上述现象．从博弈论的角度可以得到一种全新的解读。我们可以利
用美国经济学家乔治·阿克洛夫提出的著名的二手车市场模型。
    新古典经济理论的基础是完全竞争市场。在这样的市场中，资源能够得
    篮_旦至盟整：墨笪丕塑耋丝塑-_lll■
到最优配置，并能实现社会福利的最大化。然而现实中，完全满足上述假设
的市场几乎是不存在的。二手车市场就是这样一种信息不对称的市场。
    阿克洛夫在】970年发表了名为《柠檬市场：质量不确定性和市场机制》
的论文。在美国的俚语中．“柠檬”是“次品”或者“不中用产品”的意思。
这篇研究次品市场的论文因为浅显先后被《美国经济评论》和《经济研究评
论》两个杂志退稿，理由是数学眯太少。然而它却开创了“逆向选择”理论
的先河，他本人也于2002年获得诺贝尔经济学奖。
    假设休刚刚来到一个城市，想要买一辆二手车，于是来到二手车市场上。
    你和卖车的人之间对汽车质量信息的掌握是不对称的。卖家知道所售汽
车的真实质量；但是你只知道好车最少要卖6万元，而坏车最少要卖2万元。
要想确切地辨认出二手车市场上汽车质量的好坏是困难的，最多只能通过外
观、介绍及简单的现场试验等来获取有关汽车质量的信息。而从这些信息中
很难准确判断出车的质量，因为车的真实质量只有通过长时间的使用才能看
出．但这在二手车市场上又是不可能的。
    所以，你在把二手车买下来之前，并不知道哪辆汽车是高质量的．哪辆
又是低质量的．而只知道二手车市场上汽车的平均质量。
    假定你的时问有限，或者缺少耐心。不愿反复讨价还价。你先开价，如
果被卖家接受，就成交；否则，就拉倒。那么，你应该开价多少呢?开价6
万元显然是太高了，因为这不能保证你买到好车，如果你希望买到好车的话：
而如果你希望买到坏车，开价2万元(或者稍微多一点)，就肯定有人卖给你。
    也就是说，所有典型的买家只愿意根据平均质量支付价格，出价4万元。
结果是，二手车市场上汽车的平均质量降低，因为买家愿意支付的价格进一
步下降。在均衡的情况下，只有低质量的汽车成交。
    这样一来，质量高于平均水平的卖家就会将他们的汽车撤出二手车市场，
市场上只留下质量低的卖家。于是，高质量汽车被低质量汽车排挤到市场之
外，市场上留下的只有低质量汽车。也就是说，高质量的汽车在竞争中失败，
市场选择了低质量的汽车。演绎的最后结果是：市场成了破烂车的展览馆，
极端的情况是一辆车都不成交。在这种情况下，不论买家是否愿意，他只能
将质量较低的二手车开回家。
2训I
    篮_旦至盟整：墨笪丕塑耋丝塑-_lll■
到最优配置，并能实现社会福利的最大化。然而现实中，完全满足上述假设
的市场几乎是不存在的。二手车市场就是这样一种信息不对称的市场。
    阿克洛夫在】970年发表了名为《柠檬市场：质量不确定性和市场机制》
的论文。在美国的俚语中．“柠檬”是“次品”或者“不中用产品”的意思。
这篇研究次品市场的论文因为浅显先后被《美国经济评论》和《经济研究评
论》两个杂志退稿，理由是数学眯太少。然而它却开创了“逆向选择”理论
的先河，他本人也于2002年获得诺贝尔经济学奖。
    假设休刚刚来到一个城市，想要买一辆二手车，于是来到二手车市场上。
    你和卖车的人之间对汽车质量信息的掌握是不对称的。卖家知道所售汽
车的真实质量；但是你只知道好车最少要卖6万元，而坏车最少要卖2万元。
要想确切地辨认出二手车市场上汽车质量的好坏是困难的，最多只能通过外
观、介绍及简单的现场试验等来获取有关汽车质量的信息。而从这些信息中
很难准确判断出车的质量，因为车的真实质量只有通过长时间的使用才能看
出．但这在二手车市场上又是不可能的。
    所以，你在把二手车买下来之前，并不知道哪辆汽车是高质量的．哪辆
又是低质量的．而只知道二手车市场上汽车的平均质量。
    假定你的时问有限，或者缺少耐心。不愿反复讨价还价。你先开价，如
果被卖家接受，就成交；否则，就拉倒。那么，你应该开价多少呢?开价6
万元显然是太高了，因为这不能保证你买到好车，如果你希望买到好车的话：
而如果你希望买到坏车，开价2万元(或者稍微多一点)，就肯定有人卖给你。
    也就是说，所有典型的买家只愿意根据平均质量支付价格，出价4万元。
结果是，二手车市场上汽车的平均质量降低，因为买家愿意支付的价格进一
步下降。在均衡的情况下，只有低质量的汽车成交。
    这样一来，质量高于平均水平的卖家就会将他们的汽车撤出二手车市场，
市场上只留下质量低的卖家。于是，高质量汽车被低质量汽车排挤到市场之
外，市场上留下的只有低质量汽车。也就是说，高质量的汽车在竞争中失败，
市场选择了低质量的汽车。演绎的最后结果是：市场成了破烂车的展览馆，
极端的情况是一辆车都不成交。在这种情况下，不论买家是否愿意，他只能
将质量较低的二手车开回家。
2训I
信息不对称；墨的不如卖的精
    这违背了市场竞争中优胜劣汰的选择法则。市场。或者价格机制并没有
带来帕累托最优，实现最大的社会效率。因为平常人们都是选择好的，而这
里选择的却是差的，想买好车的人没有买到好车，想卖好车的人没有出售好
车。所以这种现象又被称为逆向选择。
    上面的这个例子尽管简单，但给出了逆向选择的基本含义：
    第一．在信息不对称的情况下．市场的运行可能是无效率的。因为有买
主愿出高价购买好车，市场——“看不见的手”并没有实现将好车从卖主手里
转移到需要的买主手中。市场调节下供给和需求是总能在一定价位上满足买
卖双方的意愿的理论失灵了。
    第二，这种“市场失灵”具有“逆向选择”的特征，即市场上只剩下次
品．也就形成了人们通常所说的“劣币驱逐良币”效应。传统市场的竞争机
制导出的结论是：“良币驱逐劣币”或“优胜劣汰”；可是，信息不对称导出
的是相反的结论：“劣币驱逐良币”或“劣胜优汰”。
    从上述分析还可以看出，产品的质量与价格有关，较高的价格诱导出较
高的质量，较低的价格导致较低的质量。逆向选择使得市场上出现价格“决
定”质量的现象。由于买者无法掌握产品质量的真实信息，这就为卖家通过
降低产品质量来降低成本从而争取低价格提供了可能，因而出现低价格导致
低质量的现象。
    我们可以知道．信息不对称是导致逆向选择的根源。由于信息不对称在
市场中是普遍存在的最基本事实，因而二手车市场模型具有普遍经济学分析
价值。
只许佳人独自知
    博弈模型都有一个前提条件，那就是博奔双方都有共同知识，也就是他
们所能采用的策略与各种可能发生的结局不仅为自己，也为其竞争对手所知。
但是这显然不符合实际。很多情况下，局中人事实上不可能清楚关于对手决
策的所有信息。有时更会产生“不识庐山真面目，只缘身在此山中”的尴尬。
在博弈中，往往会出现某一方所知道的信息而对方并不知道的情况．这种信
z厶。I
减
i越譬掣
息就是拥有信息一方的私有信息。正是因为私有信息的存在，才会出现“信
息不对称”。要理解私有信息的概念，我们可以从一首禅宗开悟诗说起。
    圆悟克勤大师是宋朝临济宗杨岐派著名僧人。克勤禀赋聪异，曾经参访
过许多著名掸师，后来投到五祖法演的门下。数年之间精进不懈，时有所悟，
并且将自己所写的诗偈呈法演印证，但师父却始终认为克勤还没有见到自性。
    后来，有一位曾在朝廷任职的吏部提刑大人，辞官返回蜀中，特来向法
演问道：“什么是祖师西来意?”法演回答说：“提刑大人，你少年时代曾读
过一首艳诗’一段风光画不成．洞房深处恼予情。频呼小玉元无事．只要檀
郎认得声。后面这两句和祖师西来意颇为相近。”陈提刑听了，心解意会，口
中频频称诺而去。
    克勤刚巧从外面回来，听到这段公案，满脸疑惑地问道：“刚刚听到师父
对提刑举一首艳诗．不知提刑会也不会々”法演回答说：“他识得声音。…‘他
既然识得声音，却为什么不能见道呢?”法演知他开悟的机缘已经成熟，遂
迅雷不及掩耳地大喝声：“什么是祖师西来意?庭前柏树子呢!”克勤豁然
开解，跑出方丈室外．看见一只公鸡飞上栏杆，正鼓翘引颈高啼，克勤笑道：
“这岂不是‘只要檀郎认得声’的声音罐!”于是，他将自己开悟的心得写成
一偈，呈给师父：
    金鸭香炉锦绣帷，笙歌丛里醉扶归。
    少年一段风流事，只许佳人独自知。
    五祖法演欣慰地说：“见性悟道是历代诸佛祖师们念兹在兹的大事，不是
小根劣器的凡夫众生所能造诣的。今天你能和诸佛声气相通，我真为你高兴『”
五祖于是对蜀中的禅门耆旧传出消息说：“我的侍者终于参禅悟道了!”
    克勤的这首诗的大意是说，悟道如热恋中的情事，只能自证自知，旁人
是无法知道个中况味的。悟境不立文字．好比少年的风流韵事，如鱼饮水，
冷暖自知。这种“只许自知”的信息，就是私有信息。
    私有信息的存在导致了信息的不对称性，也就是某些人掌握的信息要多
于其他的人。
    在生活中，我们去买东西，往往并不知道商品是否有严重缺陷的信息。
这样的信息往往只被能接近和熟悉这种产品的人观察到．多数买主却无从了
2厶厶
信息不对称：买的不如卖的精
解或难以了解。所以有旬俗话说“从南京到北京．买的没有卖的精”。之所以
出现这种状况，如果排除参与者的个体差异，而从买方和卖方两个人群来比
较，无非是因为交易商品质量高低属于卖方的私有信息．自然卖方比买方更
有主动权。
    再比如一个女孩面对好几个追求的男生．这些男生的人品、上进心等信
息对于这个女孩来说都是私有信息．女孩与追求者之间就存在着信息不对称
的现象，因此这个女孩到底选择哪一个男生往往就带有很大的不确定性。在
包装术盛行的今天，这种不确定性所带来的风险是不言而喻的。生活中有那
么多优秀的女孩子遇人不淑，也证实了这种风险的存在。
不确定性带来风险
    在前苏联解体前的一段时间里，社会经济病人膏肓，改革也屡屡失败。
总统戈尔巴乔夫便遭遇了记者的苦苦追同．在屡次解释无效后，他选择向记
者讲了个笑话：“有一个总统．拥有100个情妇，其中一个有艾滋病，不幸的
是，他找不出是哪一个：另一位总统，拥有100个保镖，其中一个是恐怖分
子．但一样不幸的是，他也不知道是哪一个。”戈尔巴乔夫顿了顿，望向记者
白嘲地说：“而戈尔巴乔夫的难题就是，他有too个经济学家．其中一个是聪
明绝顶的。但同样不幸的是，他也不晓得是哪一个。”
    上面这个故事说明：正是因为参与博弈者掌握的信息并不完全，往往有
很多私有信息的存在，其决策结果必然会有很大的不确定性。不管是对未来、
现在或过去的任何决策．只要是我们不知道确切结果的都具有不确定性。
    不确定性可分为两大类：主观不确定性和客观不确定性。主观不确定性
是指决策者由于有关资料的缺乏而不能对事物的态度做出正确的判断，而这
种判断却是其他掌握资料的人可以有的。和主观不确定性相关的信息常常具
有不对称性。对个人来说．拥有信息越多，越有可能做出正确决策。对社会
来说，信息越透明．越有助于降低人们的交易成本，提高社会效率。但是客
观现实却往往是：一小部分人垄断事物状态的信息，而另外绝大多数人则缺
乏事物状态的信息。
2‘5
博彝沧的碰}舻
    客观不确定性是指事物状态的客观属性本身具有不确定性。对此。人们
可以通过认识去把握客观规律。但是，认识本身并不能消除这种不确定性。
    当存在不确定性时，决策者的决策就具有风险。不确定性和风险有密切
的联系，但又是两个不同的概念。直观上很容易理解．一件事情可能出现的
结果越多．这件事情就越具有不确定性；结果越不明确，不确定性的存在就
越显著。最扣人心弦的不确定性，可以称为悬念。
    悬疑小说作家希区柯克曾经给悬念下过一个著名的定义：如果你要表现
一群人围着一张桌子玩牌，然后突然一声爆炸．那么你便只能拍到一个十分
呆板的炸后一惊的场面。另一方面．虽然你是表现这同一场面，但是在打牌
开始之前，先表现桌子下面的定时炸弹，那么你就造成了悬念。
    风险的必要条件是决策面临着不确定性的条件。当一项决策在不确定条
件下进行时，其所具有的风险是：从事后的角度看，事前做出的决策不是最
优的，甚至是有损失的。决策的风险不仅取决于不确定性的大小，而且还取
决于收益的性质。所以，通俗地说，风险就是从事后的角度来看由于不确定
性因素而造成的决策损失。与此相反
把各种不确定性变成相对确定的东西
这种风险对人们的影响变小。
如果我们能够通过丝丝入扣的分剥，
即便并没有降低风险，但是却可以使
    在美国有一则家喻户晓、人人皆知的征兵广告，既幽默又智慧。这则征
兵广告出台后，收效十分明显．改变了死气沉沉的征兵局面．使许多青年踊
跃应征人伍。征兵广告的内容如下：
    “来当兵吧!当兵其实并不可怕。应征人伍后你无非有两种可能：有战
争或没战争．没战争有啥可怕的?有战争后又有两种可能：上前线或者不上
前线，不上前线有啥可怕的·上前线后又有两种可能：受伤或者不受伤，不
受伤又有哈可怕的?受伤后又有两种可能：轻伤和重伤，轻伤有啥可怕的7
重伤后又有两种可能：可治好和治不好．可治好有啥可怕的?治不好更不可
怕，因为你已经死了。”
    这份别出心裁的征兵广告出自于一位著名心理学家之手。媒体记者采访
了他：“为什么这份征兵广告能深人人心，取得这么好的效果?”他回答说：
“当人们有了接受最坏情况的思想准备之后，就能应对和改善可能发生的是
r
信息不对称：买的不如卖的精
坏情况。”
    在绝大部分情况下，我们根本无法掌握影响未来的所有因素，这使得做
确定性的决策变得困难重重。信息本身的价值正在于此。信息的搜取有可能
增加决策者的收益，其价值就可以用获取信息后可能增加的收益来衡量。
信息决定博弈结果
    《郁离子》中讲了这样一个故事。楚国有一个以养猴为生的人，当地人
称他为狙公。他白天必定在庭院将猴子分成几组，让老猴子率领它们到山里
去。采摘草木的果实。猴子把果实上墩了以后．狙公只拿出1，10来喂他们。
如果有的交的数目少，还会被施以鞭杖。这些猴于因为惧怕，虽然十分痛苦．
但是却没有任何办法。有一天正在采摘果实的时候，一只小猴子突然对众猴
子问道：“山上的果实是狙公栽种的吗7”猴子们都回答说：“不是，天生的。”
小猴子接着同：“既然这样，我们为什么要被他利用，并且受他的剥削呢?”
小猴子的话还没说完，众猴子都醒悟过来。当天晚上，它们一起等狙公就寝
后，拿出狙公平日积蓄的果实，呼朋唤友地进人了树林之中，不再回去了。
一夜之间变得一无所有的狙公，终于因饥饿而死。
    在这个故事中，刘伯温把这位狙公比作玩弄权术的统治者，他评论说：“人
世间有以权术驱使民众而无道理和法度的人，就如同狙公一样吧?完全是民
众没有觉醒，一旦得到启发，权术就到头了啊。”但是，把狙公之死仅仅归结
于权术的破产是不够的。实际上，使他变得一无所有的，恰恰是由于信息不
对称状态的改变。
    谢林曾经在《冲突的战略》中，提到一个强盗的故事。
    一天，一个持枪的强盗进入了一所房子。房子的主人在听到楼下的响动
之后，同样持枪一步步向楼下走来。于是，危机和冲突发生了。
    上述危机显然会导致多种结果。最理想的结果当然是，强盗平静地空手
离开房子(一个见义勇为的读者甚至建议勇擒强盗．绳之以法)。此外．一种
可能的结果是，主人担心强盗盗窃财物而首先射击，致使强盗身亡；另一种
可能的结果是．强盗担心主人会开枪射击，而首先射击，导致主人身亡。第
2厶’I
博彝论柏i宣舻
二种可能结果的出现．显然对房子的主人而言是最糟糕的．因为他不仅失去
财物，而且还丧失了生命。
    对于各种可能的结果，其引发的原因却可能有无数种。例如．对于强盗
死亡这一结果，除了主人担心财物受损而首先开枪射击外，还可能出于对强
盗可能因恐惧而射击的担心使主人先发制人，等等。更有意思的是，主人先
发制人的动机可能是对强盗先发制人的担心，诸如此类。
    如何成功解决冲突和化解危机?按照谢林的观点，信息的把握和传递是
至关重要的。例如，如果持枪的主人经过在黑暗中静静地观察．发现强盗的
手中并没有枪；或者持枪的强盗发现主人毫无准备地冲下楼，则事态的进展
会有利于掌握更多信息的一方。但如果双方都了解对方持枪的事实，则主人
向强盗传递“只是想把他赶走”的信息(或者强盗向主人及时传递只想图财、
无意害命的信息)就变得十分重要。
    诺贝尔奖获得者罗伯特·奥曼在研究中发现，博弈的参与人对信息的掌
握通常是不对称的．如果博弈只发生一次，则无疑具有信息优势的人会获得
作为信息租的收益；但如果博弈是重复进行的，则今天利用信息寻租者必定
会在寻租过程中泄露其所拥有的信息．信息不对称程度就会减轻，这又是重
复博弈之所以会改进资源配置状态，使人与人的关系走向公平和谐的原因。
    信息披露会改变双方的资源配置情况，进而改变博弈的结局．这一点是
被无数历史事实所证明了的。
    20世纪60年代初期，在对阿尔及利亚的战争中，由于庞大的军费开支给
法国政府造成的沉重负担，戴高乐总统决定同本·贝拉领导的阿尔及利亚民
族解放阵线谈判，以便尽快结束这场战争。谈判在秘密进行了一段时间之后，
只等选择一个适当的时间正式宣布会谈正式开始。当时法国驻阿的殖民军军
官们听到这一风声后，为了阻止战争的和平结束，密谋组织兵变。
    戴高乐得知这一情况后心急如焚。但是阿尔及利亚远在非洲，所谓“将
在外君命有所不受”，一时居然没有什么良策来应付。这时，一位幕僚给戴高
乐出了个似乎不着调的主意：把几千台简易晶体管收音机发到驻阿部队中。
军官们认为，在蚊虫肆虐的热带兵营里，让士兵们听听法国流行歌曲，是一
件好事，因此也没有干涉。
    然而．在正式宣布会谈开始的那天夜里．法国士兵们从收音机里听到的
r
信息不对称：买的不如卖的精
却不是流行歌曲，而是戴高乐的声音：“士兵们!你们面临着忠实于谁的抉择。
我就是法兰西，就是她命运的工具。跟我走，服从我的命令…·”讲话的内
容和用语，同戴高乐当年流亡国外指挥反法西斯斗争时，所发表过的广播讲
话完全一样。这些士兵过去跟着戴高乐．取得了反法西斯战争的胜利，今天
自然仍跟他走。第二天早晨，军官们发现大部分士兵对事态的真相已经一清
二楚．只能放弃了兵变的图谋。
信息披露的策略
    有一位老板出差到外地．剐住进宾馆就接到女秘书打来的长途电话．报
告说老板心爱的波斯猫不小心从屋顶上捧下来死了。老板悲痛之余，狠狠地
把秘书训斥了一顿：“这么大的事你怎么可以打电话呢!你使我毫无精神准备．
你应该先拍一个电报来．说我的猫爬上了屋顶：然后再来一个电报说猫掉下
来了，已经送进了医院；然后再来一个电报说猫不幸 ·”
    过了几天，老板收到一份电报，是秘书拍过来的。
    他打开一看：“你爸爸爬上了屋顶!”
    上面这个笑话，实际上揭示了我们在社会交际中的一个普遍困境：那就
是应该如何把信息披露给应该得到它的人，才能产生最好的效果’芝加哥大
学的萨勒教授和哥伦比亚太学的约翰森教授经过研究，提出了四条如何设计
安排信息披露方式的原则：
    第一．如果体有几个坏消息要宣布，应该把几个坏消息同时公布于人。
把几个坏消息结合起来，它们所引起的边际效用递减会使各个坏消息加总起
来的总效用最小。人们常常讨厌雪上加霜、火上浇油的做法，可是真正让人
们选择去经受两次伤害还是经受一次大的伤害，在能够承受的限度内，对于
很多人来说还是快刀斩乱麻来得更加爽快一些。
    第二．如果你有几个好消息要公布，应该把几个好消息分开公布。你把
这两个好消息分两天告诉别人会让开心两次。因为分两次听到两个好消息等
于经历了两次快乐，这两次快乐的总和要比一次性享受两个好消息带来的
2厶。I
飘翟翟掣
快乐更大。双喜临门固然非常令人高兴，可是天天有喜也许能够带来更多的
欢笑。
    第三，如果你有一个大大的好消息和一个小小的坏消息，应该把这两个
消息一起告诉别人。这样的话．小小的坏消息带来的痛苦会教大大的好消息带
来的快乐冲淡，负面效应也就小得多。比如你被叫到上司的办公室，被告知说
因为工作表现突出，每个月被加薪150元。但是不巧的是，你在挤公车的时候
不小心丢了[00元钱，那么你回家该把这两个消息一起告诉你的家人。虽然丢
了100元钱，但比起加薪这个喜讯也算不了什么．你的家人一定不会在意那丢
失的100元钱的。
    第四．如果你有一个大大的坏消息和一个小小的好消息，应该分别公布
这两条消息。这样的话，小小的好消息带来的快乐不至于被大大的坏消息
带来的痛苦所淹没．人们还是可以享受好消息带来的快乐。举例来说．现
在股市不景气，你买的股票今天股价暴跌，使你损失10万元。不过，你的
运气还算不错．在超市购物时中了一盒价值50元的巧克力。你应当将这两
个消息分两天带回家，尽管爱人得知股票亏损的消息会很沮丧，说不定还
会怪你没有投资眼光，不过这并不妨碍她第二天品尝巧克力的甜美。但是，
如果你一次性把两条消息同时告诉他的话．说不定她吃起巧克力来感觉味道
也是苦的。
应该传递什么信号
    三国时．夏侯懋镇守濮阳。吕布派将领假装来降，乘机却劫持了夏侯懋，
来索取财宝．众位将领都束手无策。韩浩独自带军队屯在营门外．要求众将
领按兵不动，各个军营安定了下来。韩浩便进人夏侯懋所在之处，斥责劫持
人质的人说：“你们凶残顽劣，竟然敢劫持我们的大将军，你们还想活命吗7
我接受了命令来讨伐贼人，难道能因为一个将军被劫持就放纵你们胡作非为
吗?”接着他又哭着对夏侯懋说：“事关国法，我有什么办法呢?”说罂，他
迅速召集军队攻打劫持者。劫持者惶恐惊惧，磕头求饶．韩浩马上把他们全
捉了起来。
1250
信息不对称：买的不如卖的精
    曹操听说这件事后．十分赞赏韩浩的行为。他发布命令：从今以后，再
遇到劫持人质的人，就一定要全力攻打他们，不要顾忌被劫持的人质。从此
以后，劫持人质的事情就再也没有发生过。
    曹操之所以表扬韩浩，是因为他明白，只有采取绝不妥协的态度，才能
够最大限度地阻吓有意劫持者，打消他们通过劫持人质来索取赎金的念头。
只有这个绝不谈判的威胁是可信的，那么，劫持者才会意识到他们的行动注
定徒劳无功。
    但是其中的风险也考验着韩浩和曹操。每一次．只要遭遇劫持事件，一
旦这个威胁必须实践，拒绝妥协的态度可能使被劫持者命丧黄泉。但这种风
险也恰恰是区别一个有战略眼光的领抽和一个短视者的试金石。只有前者才
明白，屈服一次绝不仅是满足一批劫持者的要求那么简单，还会诱发更多的
劫持。
    事实上，这一思维方式是很多决策者的共识。
    1978年3月16日．意大利总理奠罗被恐怖组织红色旅绑架。奠罗是1976
年当选为天主教民主党主席并出任政府总理的。是意大利政坛举足轻重的人
物，更是年底总统竞选的最佳人选。
    红色旅原打算通过绑架莫罗来要挟政府，释放此前被捕的红色旅创始人
库乔。然而，他们的各种要求均遭拒绝。因为意大利政府的立场是坚决不同
恐怖主义分子对话，经过一段时间较量，意大利政府寸步不让。5月7日，莫
罗的尸体在一辆丢弃的汽车上被发现，身中ll枪。
    2002年10月23日晚，50多名车臣非法武装分子身绑炸药，手持冲锋枪，
闯进莫斯科轴承厂文化官内剧院，劫持了正在欣赏音乐剧的750多名观众和
100多名演职人员。恐怖分子要求俄罗斯政府立即停止车臣战争，但是俄罗斯
政府拒绝谈判，并于26日发动攻击，行动中突击队员向文化宫内施放毒气，
救出了被扣押近3天的’750多名人质，当场击毙巴拉耶夫为首的50名非法武
装分子。然而此次解教人质行动中．有118名人质遇难，大部分是因毒气窒
息而死亡。普京26日发表电视讲话就此请求公众“原谅”。
    在上面两个案例中．意大利政府和俄罗斯政府为什么拒绝使用其他手段
解救人质9要进一步理解这个问题，除了上面的所讲的“曹操式思维”，我们
25’I
飘譬盘掣
可以引用张维迎的劫机模型来分析。
    假定劫机者的目的是为了逃走．政府有两种可能的类型：人道型和非人
道型。人道政府出于对人道的考虑，为了解救人质，同意放走劫机者；非人
道政府无论任何时候总是选择把飞机击落。如果是完全信息．非人道政府统
治下将不会有劫机者，人道政府统治下将会有劫机者。但是，如果想劫机的
人不知道政府的类型，那么他仍然有可能劫机的。
    当政府为非人道政府，凡遇到劫机者一律格杀勿论的时候．如果知道政
府的类型．企图劫机者拥有完全信息．那么就不会有劫机者；如果劫机者不
知道政府的类型，那么就属于静态博弈，就会有劫机的行为。当政府为人道
政府的时候．如果劫机者知道政府是人道的，属于动态博弈的情况，那么会
有更多的劫机。
    而在劫机者不知道的情况下，就有可能怀疑政府对劫机者的态度．可能
不敢劫机。所以在政府人道的时候．最佳的选择是不要大肆宣传政府的人道。
相反在政府非人道的时候，最佳的选择是让人们都知道劫机者必死无疑。在
现实中，一般的法律都应该得到普及，让人们知道犯什么罪会得到什么样的
惩罚。
    而在某些法律有漏洞而且有人企图通过漏洞获益的时候，媒体就不应该
大肆宣传．而应该尽快向有关的法律制定部门反映，尽量解决。如果一些致
命的漏洞教罪犯集团所掌握，后果将不堪设想。比如劫机者知道人道主义政
府的立场，比他们不知道时的结果更糟糕。
    在人道主义政府中，如果有更多的企图劫机者知道政府的态度，获得完
全信息。那么劫机的次数就会增加；在非人道主义政府中，若有更多企图劫
机者知道政府的态度，那么劫机的次数将会减少。虽然采取非人道的方式在
开始阶段会对一些无辜者造成伤害．但总体来说可以减少对更多人的伤害．
同时也让更多的人了解政府的态度；另一个方面，如果被劫持人质也知道政
府是非人道的，那么就会在飞机上对劫机者做出反抗．因而可以让所有人质
一起来对付劫机者．这样应该可以降低总体的成本。
    在这场博弈中．政府最佳的选择是采取非人道主义，同时要普及法律的
教育。而企图劫机者最优的选择是不采取劫机的行动．因为在政府采取非人
1252
信息不对称：买的不如卖的精
道的态度时．他们必死无疑；而在政府采取人道态度的时候，即使是当场放
走了劫机者，过后一般都要继续缉拿。
    所以不管政府如何，一个国家耍防止犯罪的发生．仅有严厉的刑罚是不
够的，还要让人民了解那些刑罚。因为如果他不知道会面临刑罚，他就不会
约束他的行为。在我国，法盲还是很多的，许多悲剧也正是因为不了解法律
而酿成的．对于政府，普及法律的教育还是最重要的。
清官为什么被淘汰
    二手车市场模型以及“信息不对称”影响了一大批经薪学家．大家叉相
继发现了许多“柠檬市场”。比如在烟、酒等商品市场和资本市场中．假冒伪
劣产品充斥，也是因为交易双方的信息不对称，一方隐藏了信息。
    经济学家斯宾斯发现人才市场其实也是个“柠檬市场”：由于信息不对称．
雇主愿意开出的是较低的工资，除了平庸的“柠檬”之外根本不能满足精英
人才的需要，结果出现了“劣币驱逐良币”的现象。
    斯蒂格利茨发现信贷市场也是个“柠檬市场”：因为信息不对称，贷款人
只好确定一个较高的利率，结果好的本分的企业退避三舍．而坏的压根就不
想还贷的企业却蜂拥而至。这两位教授因此同阿克洛夫一同分享了诺贝尔经
济学奖。
    逆向选择的理论也说明如果不能建立一个有效的机制，那么高质量产品
的卖家和需要高质量产品的买家无法进行交易，双方效用都受到损害；低质
量的企业获得生存、发展的机会和权利，追使高质量的企业降低质量．与之
“同流合污”；买家以预期价格获得的却是较低质量的产品。这样发展下去的
必然结果．就是假冒伪劣泛滥，形成“劣币驱良币”的后果，甚至市场瘫痪。
    逆向选择在组织设计上可以给予我们很多有益的思路。一个组织岗位的
设计，必须考虑到逆向选择和道德风险。在设计官僚选拔机制的时候，必须
在要求说真话和不偷懒之间傲一个折中。比如老师让没做作业的学生举手，
如果你对举了手的学生惩罚太重，那么下次就段有人会再说真话，而如果你
惩罚太轻，又会诱使更多的人不做作业。
25。I
博彝论的薄舻
    学者吴思曾经提出过一个“淘汰清官定律”，并且从经济等角度进行了解
析。在本节中，我们可以通过《韩非子》中的一个故事来更感性地理解这个
定律。
    战国时，魏国西门豹初任酆地的县官时，为官清廉，疾恶如仇．刚正不
阿．深得民心。但因他对国君魏文侯的左右亲信官员从不去巴结讨好，所以
这伙人勾结起来．说了西门豹许多坏话。年底，西门豹政绩突出，本应受嘉
奖，却被魏文侯罢了官。
    西门豹心里明白自己被罢官的原因，便向魏文侯请求说：“过去的一年里，
我缺乏做官的经验，现在我已经开窍了，请允许我再干一年，如治理不好，
甘愿受死。”魏文侯答应了西门豹，叉将官印给了他。西门豹回到任所后，开
始疏于政事．而是重重地搜刮老百姓，并把搜刮来的东西奉送给魏文侯身边
的官员。一年过去了，西门豹回到国都述职时，魏文侯亲自迎接并向他敬礼，
对他称赞有加，奖赏丰厚。
    这时．西门豹严肃地对魏文侯说：“去年我为您和百姓做官有政绩，您却
收缴了我的官印。如今我因为注重亲近您的左右，所以印象好，您就对我大
加礼遇，可实际功劳大不如过去。这种官我不想再做下去了。”说完，西门豹
把官印交给魏文侯便走了。
    清正廉洁却被罢官，重敛行贿却名美位固，其含义发人深省。西门豹前
后判若两人，想必他对为官之道也是十分清楚的。他不想做一个谀上欺下的
“坏官”．只想做一个清明、严格、廉洁的“好官”。做“好官”难。做“坏
官”易．既然这样只有以弃官来表示自己的不满了。
    黄仁宇在《中国大历史》中对中西方的管理体制进行对比时．说中国缺
乏理性的数目化的管理。而其实．在人治集权制下，人事任免权在上级官僚
手中．而只要上级官僚对下级官僚的政绩是不完全信息的话，必然出现数字
造假，数字出官和官出数字，这说明在人治集权之下，数目化管理也是不可
能实施的。
    要减少逆向选择．就必须解决信息不对称问题。解决思路是委托人或“高
质量”代理人通过信息决策，减少委托人与代理人之间信息不对称的程度。
解决的途径有两个：其一是委托人通过制定一套策略或合同来获取代理人的
r弘
信息不对称：买的不如卖的精
信息．这就是“信息甄别”；其二是“高质量”代理人利用信息优势向委托人
传播自己的私人信息，这就是“信息传递”。
    同样的道理．一个好的政治制度，必须设计出分离均衡，使那些说真话
不偷懒的官和不说真话并且偷懒的官都有所选择，把比较差的官筛选出去。
这也是一个行政制度具有效率的必要条件。
    一个制度要有好的效率．必须让那些具有信息优势的人来监督官员。谁
具有信息优势呢，当然是那些本地的居民。俗话所说的“邻居一杆秤，街坊
千面镜”，所反映的就是本地居民的这种信息优势。反之．如果一个组织让那
些具有信息劣势的人来监督官员的话．就会产生很多是非不分、黑白颠倒的
荒唐事，而且会演变成一个鼓励官员说谎和偷懒的体制。
。55 I
第1 8章
信息传递：好酒也怕巷子深
照亮一片天空
燃亮一支火把
燃起一堆篝火
你发出的每个信号
直迭尽头我伴着你
——《风中的哨音》歌词
无法发起的总攻
    1930年5月．中原大地上爆发了蒋冯阎大战。以冯玉祥、阎锡山为一方，
以蒋介石为一方，在河南省南部摆开了战场，双方共投人了100多万兵力。
    战前．冯玉祥与闯锡山约定在河南北部的沁阳会师，然后集中兵力歼灭
驻守在河南的蒋军。但是，冯玉样的作战参谋在拟定命令时，把“沁阳”写
成了“泌阳”，多写了一撇。碰巧，沁阳和泌阳都是河南省的一个县，只不过
沁阳在黄河北岸，而泌阳却在河南南部的桐柏山下，两地相距数百公里。这
样，冯玉样的部队错误地开进了泌阳，没能和阎锡山的部队会舍，贻误了发
动总攻而聚歼蒋军的战机，让蒋介石夺得了主动权。在近半年的中原大战中，
冯阎联军处处被动挨打，“失败而告终。
    如果参谋不多写那一撇．冯阎联军顺利会师．联合对蒋军发起总攻，那
么中原大战的结局可能就得改写。这场历史性的误会，原因就在于错误的信
信息传递：好酒也怕巷子深
息传递。那么如果不存在人为的错误，类似的问题还会不会发生呢?答案是
肯定的。为了研究这个问题．学者格莱斯于1978年曾经提出过一个被称为“协
同攻击难题”的模型。
    两个将军各带领自己的部队埋伏在相距一定距离的两个山上，等候敌人。
将军A得到可靠情报说，敌人刚刚到达，立足未稳。如果趁敌人设有防备．两
股部队一起进攻的话．就能够获得胜利；而如果只有一方进攻的话．进攻将失
败。A遇到了一个难题：如何与将军B协同进攻?那时没有电话之类的通讯工
具，只有派情报员来传递消息。将军A派遣一个情报员去了将军B那里，告诉
将军B：敌人没有防备，两军于黎明一起进攻。
    然而可能发生的情况是，情报员失踪或者被敌人抓获。也就是说．将军A
虽然派遣情报员向将军B传达“黎明一起进攻”的信息．但他不能确定将军B
是否收到他的信息。而如果情报员回来了，将军A又陷人迷茫：将军B怎么知
道情报员肯定回来了，将军B如果不能肯定情报员回来的话，他也不能肯定将
军A能确定自己收到信息，那么他必定不会贸然进攻。于是将军A又将该情
报员派遣到B地。然而，他再次不能保证这次情报员肯定到了将军B那里
    这样，我们就得出了一个令人沮丧的结论：不论这个情报员来回成功地
跑多少次，都不能使两个将军一起进攻。问题就在于，两个将军协同进攻的
条件是：“于黎明一起进攻”成为将军A、B之间的共同知识。然而，无论情
报员跑多少次，都不能够使A、B之间实现这个共同知识!
    所幸的是．上面这个推论只是一个模型，现实环境中的“将军”们会有
很多方法突破这种困局。但另一方面，也许正是上面这种砥梦的阴影，才促
进了各种通讯技术在军事领域中的发展与应用。
    下面，我们要把视线从硝烟弥漫的战场上移开，投向更为广阔的社会场
景，看一看信息传递问题肘生活的影响机制是怎么样的。
信息传递的模型
    我们对信息传递机制的深人了解，不能不归功于2001年度经济学诺贝尔
奖获得者迈克·斯宾塞。他从研究二手车市场模型人手．将信息传递行为的
25’I
、，』 *#☆∞
诡{}
研究扩展到了其他领域。
    在二手车市场模型中．为好车的卖家着想，他们可以告诉买家卖的是好
车．不信的话．他们可以负担全部或者大部分费用．找专家检验汽车；或者
与买家达成一份具有法律效力的合同，规定如果是坏车则包赔一切损失，等
等。这些都可以归结为信息传递．也就是通过付出一定的成本，承诺自己卖
的车是好的。
    对此．斯宾塞进一步精确指出：“如果高质量旧汽车的卖家能够找出一种
方式，使得付出的成本低于低质量产品卖家付出的成本，那么。作为一种高
质量的信息传递，将能够从市场活动获得足够的补偿而获益。”因此，对高质
量旧车的卖家来说，只要某种发送信号方式的边际成本较低。市场将会出现
某种均衡。在这些均衡中，买家能够依据卖家发送的信号水平推测或估计产
品的质量。
    斯宾塞对信息传递模型的研究起源于在啥佛大学读博士期间，研究的结
论集中体现在他的博士论文《劳动市场信号》中。在论文中．他用一个关于
劳动力市场的模型来解释信息传递行为：“获得毕业文凭是劳动力市场上典型
的信号之一．具有较高生产效率的个人一般能以较低的成本获得文凭，因而
教育不仅增进人力资本的价值，而且对高生产效率的个人也具有重要的信息
激励效应。”
    在模型里，劳动力市场上存在着关于个人能力的信息不对称．雇员知道
自己的能力，雇主不知道。如果雇主没有办法区别高生产率与低生产率的人，
那么在竞争均衡时．不论是高能力的人还是低能力的人得到的都是平均工资。
于是，高生产能力的人得到的报酬少于他们的边际产品．低生产能力的人得到
的报酬高于他们的边际产品。这时，高能力的人希望找到一种办法，主动向雇
佣方发出信号，使他们同低能力的人分离开来．使自己的工资与劳动效率相称。
    文凭能够向雇主传递有关雇员能力的信息，原因是接受教育的成本与能
力成正比例．不同能力的人同时受教育程度不同。文凭所传递的信号因此具
有把雇员能力分离开的功能。
    斯宾塞的模型研究了用文凭作为一种可信的传递信息的工具。在他的模
型里，教育本身并不提高一个人的能力，它纯粹是为了向雇主“示意”或“发
出信号”表明自己的能力高。
1258
、，』 *#☆∞
诡{}
研究扩展到了其他领域。
    在二手车市场模型中．为好车的卖家着想，他们可以告诉买家卖的是好
车．不信的话．他们可以负担全部或者大部分费用．找专家检验汽车；或者
与买家达成一份具有法律效力的合同，规定如果是坏车则包赔一切损失，等
等。这些都可以归结为信息传递．也就是通过付出一定的成本，承诺自己卖
的车是好的。
    对此．斯宾塞进一步精确指出：“如果高质量旧汽车的卖家能够找出一种
方式，使得付出的成本低于低质量产品卖家付出的成本，那么。作为一种高
质量的信息传递，将能够从市场活动获得足够的补偿而获益。”因此，对高质
量旧车的卖家来说，只要某种发送信号方式的边际成本较低。市场将会出现
某种均衡。在这些均衡中，买家能够依据卖家发送的信号水平推测或估计产
品的质量。
    斯宾塞对信息传递模型的研究起源于在啥佛大学读博士期间，研究的结
论集中体现在他的博士论文《劳动市场信号》中。在论文中．他用一个关于
劳动力市场的模型来解释信息传递行为：“获得毕业文凭是劳动力市场上典型
的信号之一．具有较高生产效率的个人一般能以较低的成本获得文凭，因而
教育不仅增进人力资本的价值，而且对高生产效率的个人也具有重要的信息
激励效应。”
    在模型里，劳动力市场上存在着关于个人能力的信息不对称．雇员知道
自己的能力，雇主不知道。如果雇主没有办法区别高生产率与低生产率的人，
那么在竞争均衡时．不论是高能力的人还是低能力的人得到的都是平均工资。
于是，高生产能力的人得到的报酬少于他们的边际产品．低生产能力的人得到
的报酬高于他们的边际产品。这时，高能力的人希望找到一种办法，主动向雇
佣方发出信号，使他们同低能力的人分离开来．使自己的工资与劳动效率相称。
    文凭能够向雇主传递有关雇员能力的信息，原因是接受教育的成本与能
力成正比例．不同能力的人同时受教育程度不同。文凭所传递的信号因此具
有把雇员能力分离开的功能。
    斯宾塞的模型研究了用文凭作为一种可信的传递信息的工具。在他的模
型里，教育本身并不提高一个人的能力，它纯粹是为了向雇主“示意”或“发
出信号”表明自己的能力高。
1258
糍
：耋邑越譬型
    斯宾塞并且确定了一个条件，在此条件下。能力低的人不愿意模仿能力
高的人．即做出同样程度的教育投资以示意自己是能力高的人。这一条件就
是，做同样程度的教育投资对能力低的人来说边际成本更高。他证明了在这
种情况下，虽有信息不对称，市场交易中具备信息的应聘者可通过教育程度
来示意自己的能力．而雇主假定教育对生产率没有影响，但是以教育为基础
发放一示意信号便可区别开不同能力的人。
    这种模型不仅存在于雇主与应聘者之间．也存在于学校与学生之间。以
中国学生申请黄国大学的研究生为侧．美国大学首先要看的是申请者的
TOtlEL和GRE成绩，第二是他们本科成绩的平均分，第三是推荐信。大学当
然不可能知道每个中国学生能力的高低、到底适不适合所申请专业以及能否
做出成就。但是。它们必须根据中国学生所提供的材料做出录取与否的选择。
而TOF7EL和GRE成绩(以及其他材料)就起到传递申请者能力以及学习意
愿等的作用。
    信息传递模型具有普遍意义。例如，上市公司的过度分红行为。在很多
国家，政府对红利征税的税率比资本增值的税率要高，通常政府对红利征税
两次：一次对公司，一次对个人，而对资本增值只对个人征税一次。在目前，
证券市场对红利双重征税，对资本增值不征税。如果没有信息问题．利润再
投资自然比分红更符合股东利益，但很多公司仍然热衷于分红。根据信息不
对称理论，公司的管理层当然比股民更清楚地知道公司的真实业绩。在这种
情况下，业绩好的公司就采取多发红利的办法来向股民发出信号，以区别于
业绩不好的公司．而后者发不出红利。证券市场对分红这一信号的回应是股
价上升，从而朴偿了股民因为分红交纳较高的税而蒙受的损失。
标王背后的博奔
    2005年11月18日晚10时许，经过了14个小时马拉松式的拍卖．2006
年央视“黄金贷源”广告招标终于结束。当天的招标总额为58．69亿元．虽然
低于央视此前预设的60亿元目标，但仍然比2005年的52 48亿元增长了12％。
据主拍方上海拍卖行透露，去年的标王宝洁以3 49亿元总标额，再次夺得今
1260
信息传递：好酒也怕巷子探
年桂冠，但较去年的3 85亿元略有下降。
    中央电视台黄金段位广告招标会，被《华尔街日报》称为“品牌奥运会”。
从1994年开始的12年中，招标金额从33亿元飙升到2006年的58 69亿元．
每年都在高速增长。
    在很多人的眼里，企业不惜重金到中央电视台黄金时间做广告，图的就
是宣传自己的产品，以提高自己的市场份额。但是懂行的人都知道，如果仅
仅是出于这一目的，这些企业大可不必斥资数亿元来央视竞标，如果把同样
的广告费分散投放到地方电视台．起到的效果远远高于投在一家电视台。
    那么这些企业为什么还对央视的广告招标趋之若鹜呢?
    其中的醉翁之意就在于：企业投放在央视的广告不仅仅是为了达到它的
宣传效果，同时也为了显示自己的实力，同那些没有实力的厂家区分开。
    从博弈论的角度来看，广告也是一种信息传递的手段，是减少信息不对
称的非常有力的工具。卖家通过广告信息的传播．以较少的成本获得较高的
宣传效用；而消费者也可以通过非常小的成本，从卖家的广告信息中获得各
种所需的市场知识。但这种作用仅仅是第一层面的，企业重金投放广告更重
要的一个目的在于：清除掉潜在的市场模仿者，传递自身的巨大的实力信号。
言外之意是说，如果不给你们点颜色看看，你们还不知道马王爷三只眼。
    中国人有一句话说：酒香不怕巷子深。意思是说，只要质量过硬就不怕
没有市场。这话有一定的道理，当人们进行交易时，产品的质量确实是一个十
分重要的因素。但是问题在于，大多数消费者在购买产品时，并不能了解到每
种产品的具体质量．真正了解产品质量的是卖家。不同的卖家提供的产品质量
不同，那些劣质品的卖家会将产品的质量信息隐藏起来。
    对于消费者来说，如果他们无法区分产品质量的优劣．就只能根据对整
个市场的估计即平均质量来支付价格。当优质品和劣质品被消费者以同样的
方式对待时，劣质品在成本上具有优势，从而有可能在销售上占据优势；优
质品因其机会成本超过市场价格从而可能被挤出市场。
    但是，优质品的提供者不会甘心被劣质品逐出市场。为了使自己的产品
与劣质品区分开来．他们要选择适当的方式，向消费者传递自己的产品是优
质品的信息，改善信息不对称的状况．减少逆向选择的不利影响。于是，广
26l-
博奔论的蘑
告就成为达成这个目标的重要武器。
    假设有一家企业A开发出一种很有市场潜力的饮料，该产品对人的健康
确实有好处。但同时，另一家生产假冒伪劣产品的企业B也准备向市场推出
一种伪劣饮料。两个企业都会向公众宣布其产品是上乘的。但公众是理性的，
不会仅凭商业宣传就相信它们。
    但是．如果产品真的好．随着时间的推移，消费者能够识别出来。所以，
生产好饮料的的企业A对自己的市场有信心，它相信企业B生产的伪劣产品
终究会被消费者识破．顾客会跑到自己这里来，从而自己的市场会不断扩大．
销售收人及利润会不断增长。而企业B开始可以蒙骗一部分消费者，但时间
一长，产品的问题会暴露出来，市场会不断缩小，收入及未来利润都不能与
企业A相比。这样一来，企业A的未来预期收人远大于企业B。
    为了推动这一趋势，企业A决定请一位当红明星做广告，由于是当红明
星，他们做广告有很高的市场价格．这就使企业B不敢模仿。譬如，假定企
业A的预期收入为3000万元，企业B的预期收入为1000万元。当红明星做
广告的市场价格为2000万元．那么企业A可以请明星做广告而企业8就请
不起。
    消费者也明白这个道理。从而由此在一开始就识别出实力不足的企业B
并对其产生不信任。这样．企业B一开始就没有市场。当企业A请了当红明
星做广告时，企业B发现这位明星的市场价格太高，自己难以模仿．就会放
弃生产伪劣产品的计划。
    这就像武功高手劈断10块砖，就向别人发出一个信息：我的武艺高强，
你们可不是对手。这样不用打斗就能决出高下．避免了打斗带来的更大损失。
    所以，企业A通过请当红明星做广告而清除掉了潜在的市场模仿者，它
向公众传递自己实力强、产品好等信息。这种信息的价值取决于其所请来的
当红明星有着较高的出场价格，而不在乎明星在广告节目中说了什么，表演
了什么，当然更无所谓广告节目是否介绍产品价格等信息。企业A请当红明
星做广告本身，就为公众传递了它是生产好产品的企业这样一个信息。
    当然，并不是所有产品都适于做广告。对于低质量产品，消费者最多只
会购买一次，如果做广告的成本高于产品一次销售所得的利润．这时做广告
1262
信息传递：好酒也怕巷子深
就不舍算。可见，较高的广告成本将屏蔽掉一部分低质量产品。如果广告成
本高于产品第一轮销售所得的利润．叉低于多轮销售所得的利润．那么能长
销不衰的产品做广告将有利可图。
    从这个角度说，高成本广告中的产品应该是高质量产品。结果，广告作
为市场信息，传递了高质量产品的信息。或者可以说，如果不是马王爷．是
不肯把三只眼作为卖点来向市场展示的。
信息传递有成本
    在自然界当中．有很多雄鸟都长着鲜艳而厚实的羽毛以吸引雌鸟。但是，
太醒目的羽毛更容易被猎人发现，而且行动也不方便，很容易被抓获。这样
的话，为什么雌鸟要选择有缺陷的雄鸟呢?生物学家认为，鸟类世界中的雌
鸟有一种潜在的本能去寻找基因优良的雄鸟，这样他们的后代才会有优良的
基因。尽管厚重的羽毛对于生存是一个威胁或者说缺陷，但是因为只有强健
且有速度的鸟才能承受，越弱的鸟越不能负担厚重而华丽的羽毛，所以羽毛
成为雄鸟传递自身体质信息的一个可靠手段。
    因此我们可以理解，重金投人的广告，其实和雄鸟身上的羽毛一样，都
不过是传递自身实力信息的工具。但是也正如雄鸟要为这种信息传递承受更
多被捕杀的风险一样，做广告的企业也必须为信息传递付出真金白银的代价。
除了广告之外，企业采用其他方式来传递信息，同样也是要付出代价的。
    最常见的一种是质量保证和承诺．如商品包退、包换和保修等都是告诉
消费者：“买我的东西吧!没问题!”真正的优质品因质量原因退换的概率非
常小，保修期内的返修率非常低．因此从整体上不会增加多少费用，质保成
本低廉而且短期效果明显。而与此相反，劣质晶的卖家肯定提供不了这种保
证和承诺．因为这对于他们来说成本太高了。
    名牌效应作为一种信息传递方式。则更是一种长期回报十分丰厚而投入
成本也更高的手段。如小天鹅、蒙牛等品牌，本身就传递了产品是优质品的
信息。在消费者心目中。名牌代表优质。尽管不是每件名牌产品都是优质品，
但是消费者在非名牌产品中搜寻优质品的成本通常很高．而在名牌产品中搜
拍。I
博弈论的蘑舻
寻优质品的成本相对较低。因此．消费者通常会优先考虑选择名牌产品或自
己熟悉的品牌。
    信息传递是一种克服市场无效率的机制。它表明即使市场存在着信息非
对称．通过大量的信息传递，市场依然可以获得被逆向选择过程破坏的市场
效率。不过，总要为之付出一定的代价。正因为信息传递是有成本的，它才
具有甄别的效用。而且，正是因为需要传递信息的行为人在可能的信息传递之
中发生的成本不一样，才保证了信息传递的有效性。例如．只有好车的卖家才
敢请人验车，从而将车卖出，获得正的利润；卖坏车的人是绝不敢这样做的。
    现在，拿一个MBA学位似乎很流行。这样做的目的是为了升职与加薪。
例如，在公司里，老板不知道小王的确切能力，而知道自己很能干的小王为
了向老板传递这个信息，可以向老板申请停薪留职两年．去拿一个MBA学位。
等他拿到这个学位，老板很可能会给他升职、加薪。这是因为上MBA是要付
出成本的，能力低的人不敢做出这样的抉择。
    例如．如果报考某大学的两年全日制MBA，考前要参加各种各样的辅导
班，买各种各样的参考书，怎么也耍花去几千元。如果幸运地考上了，学费
是5万，6万元。之后两年吃住在学校，每个月至少要花掉2500元左右，这
样每年的花费约是3万元，两年是6万元。加上前面的费用，共计12万元。
这还不算完．因为这两年还丧失了很多收入。假定小王的年薪是5万元．那
么上MBA的机会成本就是10万元。也就是说．上一个MBA的总成本是22
万元：
    而且．这22万元还只是货币成本，是看得见的。实际上，这里还存在看
不见的成本。对于高能力的人来讲，每门课达到及格很容易；但是对低能力
的人来讲，为了及格就要花更多的时间在学习上，这无形之中增加了低能力者
发送信息的成本。如果发送信息的成本过高．就可能只有高能力者发送信息。
    发送信息的成本如果对谁都一样，就没有作用了。
    例如．如果某一个商学院为了加强MBA教育，让他们学博士课程，造成
大面积不及格，这个信息就是无效的；或者，另外一个商学院只管收钱．采
取放羊式教学，这样的MBA学位也是没有意义的。总之。信息有效的充分必
要条件是发送信息要发生成本．不同的人发送同一个信息的成本是不同的。
这是理解信息传递模型的关键。
r
第1 9章
信息甄别：分离均衡的筛子
假的兴奋
仍，q我太开心
真天真
假天真
我怕我忘了怎么区分
——《假天真》歌词
狱中的分离均衡
    清代学者方苞《狱中杂记》中曾记载着他在刑部监狱中亲眼看见的一件
事。有三个犯人被判同样的杖刑，为了少吃点苦头，事前都贿赂了行杖的差
役。第一个犯人送了30两银子，被稍微打伤一点骨头，养了一个月的伤；第
二个犯人送了一倍的银子，只打伤一点皮肉，不到一个月就好了；第三个犯
人给了180两银子，受刑后当晚就步履如常了。
    同样的棍子打下去，为什么会有这种分别?
    《官场现形记》作者李伯元在另一著作《活地狱》第九回中揭示了其中
的奥妙：衙门掌刑的皂隶用板子打人，都是要预先操练熟的。有的虽然打得
皮破血流，而骨肉不伤；有的只见皮肤红肿．而内里却受伤甚重。有人说．皂
隶预先操练这打人的法子是用一块豆腐。摆在地下．拿板子打上去．只准有响
声．不准打破；等到打完，里头的豆腐都烂了，外面依旧是整整方方的一块，
博奔论的确}舻
丝毫不动。
    练就了这样一手功夫，同样的刑罚到了行杖的差役手中，自然会有
不同的后果。有人问这差役说：“犯人有的富有的穷，既然都给你拿了钱．
又何必有拿多少作分别’”差役直截了当地回答：“没有分别，谁愿意多出
钱?”
    担任捆绑犯人职责的差役，其手段也是如此。如果他们开出的条件得不
到满足，在五花大绑时便先给犯人来个骨断筋折。每年秋决的时候，虽然皇
帝朱笔勾掉的只十分三四，留下的有十分六七，但全体囚犯都要被捆绑到西
市等待命令。其中被捆绑受伤的即便幸而留下脑袋，也必然大病几个月才能
好．甚或成为一辈子也治不好的残疾。
    方苞曾问过其中一个老差役说：“大家对受刑受绑的既没什么深仇大恨，
目的只不过希望弄点钱而已；犯人果真拿不出钱，最后叉何妨放人一马，不
也算积德吗’”老差役说：“这是因为要立下规矩以警告旁的犯人，并警告后
来的犯人的缘故。如果不这样．便人人都心存侥幸了。”
    这个令人发指的黑色幽默，固然使我们为当时的黑狱状况毛骨悚然，但
是仔细一想，却叉不能不对差役区别对待犯人的手法发出一丝苦笑。手段固
然可恨．但是却可以让我们看到一点策略思维的影子，那就是分离均衡机制
的运用。
    在上一章中已经介绍，斯宾塞提出的信息传递是解决逆向选择冲突的一
种途径。事实上还有一种解决方法，那就是曾经担任过世界银行副行长的约
瑟夫·斯蒂格利茨提出的“分离均衡”。
    在市场上，拥有信息的一方主动通过做广告等方式来发布信息，从同类
中分离出来，这样才有利可图。可是．在信息不对称的市场中不具备信息的
一方，除了信息传递．应如何建立机制来筛选有信息的一方，从而实现市场
效率昵?斯蒂格利茨是把信息不对称的概念引入保险市场和信贷市场的研
究，从而回答了这个问题。
    在保险市场上一个人去投保，其目的是为了弥补可能发生的危险的损失；
而保险公司也不可能在亏损的情况下承担保险，它要追求利润。如果这时信
息是完全的．即投保人的信息也为保险公司所知道．那么投保人应该选择完
1266
《‰
信息甄别：分离均衡的筛于
全保险，即应该使投保后和不投保的收益水平是一样的。
    比如我投了自行车的保险．那么我看管自行车的努力可能会因为投保而
发生改变。如果没有投保，丢车以后200元钱的损失我完全承担；如果花20
元钱投了保，丢车后保险公司将赔我150元，这时我的损失只有130元。而
看管自行车是要付出代价的，比如要多买一把锁，花20元。
    然而由于保险公司与投保人之问的信息不对称，保险公司难以确切地知
道投保人的真实情况。一旦和保险公司签订了保险合约，他们往往会不再像
以往那样仔细看管家中的财产了。当出门的时候，他可能不再像以前没有保
险时那样仔细地检查煤气是否关好，因为现在如果屋子着火了，他将获得保
险公司的赔偿。
    作为极端的例子，有人甚至故意造成火灾来骗取保费。在这里，保险公
司无法观察到人们在投保后的防灾行为，面临着投保人松懈责任甚至不道德
行为而引致的损失，严重的情况会关门大吉。
    这样，社会中有帕累托优化的一些交易就可能不会发生。这在信息经济
学里被称为道德风险：投保前和投保后投保人的行为无法被保险公司所观察
到。
    与之相关的逆向选择就是：每个投保人可能知道自己自行车失窃的概率，
而保险公司不一定知道这种信息；那些觉得自己的自行车被盗的概率比较大
的人会更有积极性投保；保险公司赔偿的概率也会变高．会更加容易亏损。
    这时保险公司为什么不采取提高保费的办法来获得利润呢7
    问题在于，提高保费会导致那些犹豫不决的客户选择不保险，而这部分
人往往是丢车概率比较小的人。因为丢车概率越小，他所能接受的保费就越
低。那些低风险的顾客群认为支付这笔费用不值得，从而不再投保；而高风
险类型消费者不会在意保费的提高而踊跃投保。这样一束，高风险者就把低
风险消费者“驱逐”出保险市场。
    这就是斯蒂格利菠和他的合作者在1976年的文章中的重要观点：提高保
费的措施不仅不能使保险市场的逆向选择现象消失，反而会使该来的不来，
不该来的来了。提高保费的办法对保险公司是一荆毒药，对保险市场同样难
以消受。要解决这一问题，保险公司可以通过提供不同类型的合同．将不同
26’I
风险的投保人区分开，让他们在高自赔率加低保险费和低自赔率加高保险费
两种投保方式之间选择，以防止欺诈行为。
票价为何如此低
    纽约的国立自然历史博物馆是世界上同类博物馆中的翘楚，但是收费却
出奇的低。一位作家问馆长：“这么一点门票的收入，怎么能够维持开销呢?”
馆长回答：“我们根本不靠门票的收人，这只是做个样子。”作家有些诧异地
间：“做个样子那叉何必呢?”主管回答说：“如果我们完全不收费．必然会
造成许多闲杂人员涌人，因而破坏了整个博物馆的气氛，所以我们要求象征
式的买门票，钱虽然不多，却表示了对博物馆的尊重和诚意。”
    那位作家认为．这个故事说明了人们所需要的经常并不是钱，而是那小
小几块钱后面的一点诚意、一些温情和一片真心。这种理解固然不错，但是
从博奔论的角度来看，博物馆这样做的目的．恐怕更多的还是为了通过收费
的形式，把真正的艺术爱好者与所谓的“闲杂人员”甄别开来，以更好地保
证高效服务。
    市场交易的目标就是利益的均衡。而均衡有两种模式：混同均衡和分离
均衡。所谓混同均衡是使所有人都愿意接受的选择，分离均衡则是向不同的
人提供不同的选择。上面故事中的博物馆虽然是非赢利的公共服务部门．分
离均衡的思路也是不错的。
    斯蒂格利茨证明了在竞争市场上．混同均衡是不存在的。也就是说，之
所以不存在一个使高丢车概率的人和低丢车概率的人同时选择的保单，是因
为保险市场存在竞争。
    在前面的例子里，有的人因为经常丢车，所以积极投保，哪怕要为此付
出相对较高的保费支出。不经常丢车者．就只会选择赔率较低而保费也较低
的投保合同。在这样的情况下．一份保费标准统一的合同肯定会流失一部分
客户——或者是嫌保费高的客户，或者是嫌赔率低的客户。为了在市场上更有
竞争力，保险公司一定会设计出更多的合同，吸纳不同要求的客户．而不会
使用千篇一律的标准合同。
1268
风险的投保人区分开，让他们在高自赔率加低保险费和低自赔率加高保险费
两种投保方式之间选择，以防止欺诈行为。
票价为何如此低
    纽约的国立自然历史博物馆是世界上同类博物馆中的翘楚，但是收费却
出奇的低。一位作家问馆长：“这么一点门票的收入，怎么能够维持开销呢?”
馆长回答：“我们根本不靠门票的收人，这只是做个样子。”作家有些诧异地
间：“做个样子那叉何必呢?”主管回答说：“如果我们完全不收费．必然会
造成许多闲杂人员涌人，因而破坏了整个博物馆的气氛，所以我们要求象征
式的买门票，钱虽然不多，却表示了对博物馆的尊重和诚意。”
    那位作家认为．这个故事说明了人们所需要的经常并不是钱，而是那小
小几块钱后面的一点诚意、一些温情和一片真心。这种理解固然不错，但是
从博奔论的角度来看，博物馆这样做的目的．恐怕更多的还是为了通过收费
的形式，把真正的艺术爱好者与所谓的“闲杂人员”甄别开来，以更好地保
证高效服务。
    市场交易的目标就是利益的均衡。而均衡有两种模式：混同均衡和分离
均衡。所谓混同均衡是使所有人都愿意接受的选择，分离均衡则是向不同的
人提供不同的选择。上面故事中的博物馆虽然是非赢利的公共服务部门．分
离均衡的思路也是不错的。
    斯蒂格利茨证明了在竞争市场上．混同均衡是不存在的。也就是说，之
所以不存在一个使高丢车概率的人和低丢车概率的人同时选择的保单，是因
为保险市场存在竞争。
    在前面的例子里，有的人因为经常丢车，所以积极投保，哪怕要为此付
出相对较高的保费支出。不经常丢车者．就只会选择赔率较低而保费也较低
的投保合同。在这样的情况下．一份保费标准统一的合同肯定会流失一部分
客户——或者是嫌保费高的客户，或者是嫌赔率低的客户。为了在市场上更有
竞争力，保险公司一定会设计出更多的合同，吸纳不同要求的客户．而不会
使用千篇一律的标准合同。
1268
    分离均衡与信息传递的不同之处在于：拥有不同信息的人通过信息传递，
来把自己与竞争者分离出来。而分离均衡则可以使不拥有信息的人设计出一
个机制，使具有信息的人不隐瞒信息和行为，也就是设计一个分离不同信息
的人的机制。进而提高市场效率。
    一般来说．分离均衡的实现是通过“信息甄别”的方法来达到的。由于
信息不对称，一个处于信息劣势的人有可能设计一个有效的机制．使处于信
息优势的人说真话，显示真实的偏好，从而根据选择的结果将潜藏着的信息
识别出来。这样只要某种交易能够给人们带来利益的话．人们总可以找到那
种提高自己现状的方式，来实现帕累托效率。帕集托最优是人们可能达到的
技术上的边界．只要次优水平与帕幕托最优水平之间有空间的话．总可以在
这个空间中设计出某个更好的机制，以提高目前的收益水平。
    在方苞所讲的黑狱故事当中．差役之所以要对都交了钱的犯人进行不同
的对待，就是为了创造一种比混同均衡更有生命力和竞争性的分离均衡，最
大限度地谋求自身的黑色收人。
    这样的例子在我们的现实生活中俯抬皆是。最常见的就是不同的商品有
不同的交易方式，有些商品交易是讨价还价的．有些商品是明码标价的。为
什么会这样昵?原因就在于每个交易者都会考虑到双方的逆向选择问题。它
不仅是信息传递问题，还包吉着人们用比较好的机制来区分不同类型的交易
者。比如．世界上最大、最著名的钻石公司每年会邀请世界上300名富翁去
参观选购它的钻石，规定不许讨价还价。
    商家想出办法来区分消费者的类型，可以有效地提高经营的效率。比
如说，那些买票乘飞机的人可能有不同的支付能力，因为他们中有的人收
入水平较高，或者愿意花较多的钱购买飞机票。但是．他们每一个人都不
会说出自己根有钱从而花高价买票，每一个人都宁愿飞机票价位低一点。
于是，航运公司就设计出头等舱、二等舱、三等舱等，不同的等级舱位有
不同的价码。这样．郡些支付能力高的顾客就会花较多的钱去买头等舱的
票，支付能力次之的顾客就花较步的钱买二等舱的票，支付能力还要低的
人就买三等舱的票。当然．头等舱比二等舱要舒服一些，而二等舱也比三
等舱安逸多了。
1270
信息甄别：分离均衡的筛子
    航运公司将经营成本和票价设计成如此这般，使得支付能力较高的顾客
与支付能力较低的顾客最终选择不同的舱位等级，并根据支付能力的不同而
支付不同的价格。
    高支付能力的顾客多花钱选择高等级的舱位．这样就将顾客中不同支付
能力的顾客的类型甄别出来了。尽管他们都不会说自己是高支付能力的人．
但他们的选择就等于向公司报出了自己的真实类型：他们是高支付能力的。
而公司也正好宰他一把——高等级舱位付高价钱。这样．使得公司从较高支付
能力顾客那里多收的钱大于为他们提供较高水平的服务所增加的成本，结果
是多赚r钱!
    这种分离均衡在我们身边的生活中是如此司空见惯，以至于大家没有特
别地感觉到它的存在。譬如，电影院、歌剧院中不同位置座位的票价不同，
酒店要分不同的“星级”．电信运营商也将手机卡区别为“全球通”、“神州行”
或者“如意通”等不同的种类，冰淇淋也要做成不同味道、不同大小、不同
形状…··所有的这些做法，实际上都是为了甄别出不同类型的顾客．然后确
定不同的价格，提高自己的综合赢利能力。
所罗门王的智慧
    阎王派小鬼到阳闻去找名医，并告知小鬼名医的标准是：门前没有冤鬼。
小鬼到了阳间．每过一家医生门口。总见许多冤鬼聚集在那里。小鬼找了很
久，最后终于看见一位医生的家门前只有一个鬼在那里孤独徘徊。小鬼大喜，
心中暗想：“这里住的定是名医了。”于是他走进门去，不由分说把医生拘到
阴间。可是阎王细细一问才知道，这位医生是昨天才刚刚挂牌开业的。
    阎王的错误在于，他为小鬼提供了一个失效的“信息甄别机制”。
    所谓信息甄别机制．用专业的术语来说，就是委托人事先制定一套策略
或设计多种方案，根据代理人的不同选择，将他们区分为不同的类别。与信
息传递不同，信息甄别是通过委托人的信息决策来获取代理人的信息，从而
减少信息不对称。
    这种机制发挥作用的机关，我们可以用一个“所罗门断案”的故事来说明。
2’‘I
‰．謦鲨型
    所罗门王是以色列历史上的一位伟大国王。据说他在继位登基之后，得
到上帝向他显现。上帝问他：“你要什么，你可以求。”所罗门一心挂念如何
治理百姓．于是他向上帝祈求要有智慧可以判断百姓，辨别是非。这种不出
于私心的请求，受到上帝的欢迎。上帝不但赏赐给他智慧，连他并没有祈求
的富足、尊荣也一并赐给他。
    最能体现所罗门智慧的乃是他智断二妇争子案。该案的大致情况是这样
的：有两个妓女同住一房．除了她们两个人以外，再无他人。夜间，一个妓
女在熟睡中不小心压死了自己的孩子。她们的臻子只相差三天，于是该妓女
将自己死去的孩子放在另一个妓女的怀里．并将她的孩子抱走。天亮后，另
一个妓女发现死去的那个孩子不是自己的孩子，于是告到了所罗门王面前。
两个妓女都主张活着的孩子是自己的。所罗门王寻思了一会儿，便吩咐其侍
卫拿刀来将这个孩子劈成两半，每人各得一半。此时．孩子的母亲心痛万分，
在她看来．孩子能够继续活着才是最为关键的。她恳求所罗门道：“求我主将
珐子给那妇女吧!万不可杀他!”而另一个妓女说：“这菝子也不归我．也不
归你。把他劈了吧!”于是．所罗门将这个孩子断给了恳求请孩子继续活下去
的那个妇女。
    所罗门的这种方法在博弈论中被称为“机制设计”，即设计一套博弈规则，
令不同类型的人做出不同的选择。尽管每个人的类型可能是隐藏的，别人观
察不到，但他们所做出的不同选择却可以观察到。观察者可以通过观察不同
人的选择而反过来推演出他们的真实类型。
    在商业市场上也存在同样的“机制设计”。大家都知道，客户为了自身利
益有时也会隐藏自己的私人信息，从而出现信息在买卖双方间不对称的情况。
    客户知道自己的需求，而卖家不完全知道．因为高需求客户为了以更低
的价格成交，往往会隐藏自己“具有高需求”的信息。在这种情况下，差别
定价方式可以甄别出不同需求程度的客户，从而使卖家可以获取尽可能多的
利润(对于高需求客户以较高的价格成交，对于低需求客户以较低的价格成
交)。
    比如，在推出一本新书时，通过提供精装本和平装本两种版本，出版商
可以将读者分为两大类：一类对书的评价较高，另一类对书的评价较低。在
1272
信息甄别：分离均衡的筛子
提供电信服务时，服务商可以对手机用户提供两种收费标准：一种是单位时
间通话费用较低，但需交纳一定的月租费；另一种是单位时间通话费用较高．
但不需交纳月租费。根据用户的不同选择，服务商可以将用户区分为高频率
用户和低频率用户两类。
    亨特先生被派到美国新兵培训中心推广军人保验。听他演讲的新兵100％
都自愿购买了保险，从来没人能达到这么高的成功率。培训主任很想知道他
的推销之道，于是悄悄来到课室，听他对新兵讲些什么。
    “小伙子们，我要向你们解释军人保险带来的保障。”亨特说，“假如发
生了战争，你不幸阵亡了政府将会给你的家属赔偿20万美元；但如果你没有
买保险．政府只会支付6000美元的抚恤金…·”这时．下面有一个新兵沮丧
地说：“这有什么用，多少钱都换不回我的命。”听到这里．亨特不慌不忙地
说：“你错了，想想看，一旦发生了战争，政府会先派挪一种士兵上战场’买
了保险的还是没买保险的?”
    上面的这个故事所涉及的博弈，事实上远比商业上的信息甄别更为复杂，
涉及的因素也更多。但是它仍然说明，我们要设计出有效的信息甄别机制，
或者利用甄别机制来最大限度地实现自己的利益，最关键的…点，就在于通
过对手的一系列外在表现，对其所要采取的策略有一个更为深人的预见。
老虎的信息甄别
    《黔之驴》寓言中，贵州的老虎从来没有见过驴子，不知道驴子到底有
多大本领。老虎采取的方法是不断接近驴子进行试探。通过试探，修正自己
对驴子的看法，从而根据试探的结果选择自己的策略。
    一开始，老虎见驴子没什么反应，它认为驴子本领不大；接下来老虎听
见驴子大叫，又认为驴子的本领很大；然而进一步试探，老虎却发现驴子的
最大本领只是踢踢而已；最后，通过不断试探，老虎得到关于驴子的准确信
息，确认驴子没有什么本领，就选择了冲上去把驴子吃掉的策略。
    这显然是老虎的最优策略。它所采用的方法，其实就是信息甄别的一个
典型选择。
z7。I
博奔论的崩}舻
    在不完全信息条件下．博奔的每一参与人可能知道其他人的存在，并知
道参与人的不同类型与相应选择之间的关系，但是，参与人并不知道其他人
的真实类型。
    在动态博弈中，由于行动有先后顺序，后行动者可以通过观察先行者的
行为，获得其信息，从而证实或修正自己对先行者的策略。在博葬一开始，
某一参与人根据其他人的不同类型及其所属类型的概率分布．建立自己的初
步判断。在博弈进行中，该参与人就可以根据他所观察到的其他人的实际行
动，来修正自己的初步判断，并根据这种不断变化的判断选择自己的策略。
    信息甄别是需要成本的。在上述故事中，老虎在不断试探过程中花费的
成本很小，它可以一次叉一次地试探下去，直到得到对驴子所属类型的准确
判断为止；如果这一过程花费的成本很高，老虎可能就不会轻易去试探。这
种获取信息所花费的成本归根结底是由于“黔无驴”的环境条件，也就是信
息的不完全性造成的。进一步研究表明，不完全信息可以导致博奔参与人之
间的合作。因为，当信息不完全时，参与人为了获得合作带来的长期利益，
通常不愿意过早地暴露自己的真实类型。但在这种情况下，仍然是有办法来
加以甄别的。
    约会时，每个人都想展示自己个性中最好的一面，掩盖糟糕的一面。当
然，缺点不可能一辈子隐藏，但随着关系的进展，却可以克服这些缺点，或
者希望对方将优点和缺点一同接受。因为他深知，若没有良好的第一印象，
关系就不可能取得进展．就没有第二次机会可以发展彼此的关系。
    当然。他也想了解对方的一切．包括优点和缺点。但是他也深知，如果
对方同样是个约会博弈的高手，也会同样地展示最好的一面而隐藏最糟糕的
一面。仔细思考所面临的情形。才能发现哪些迹象代表了真正的高素质．哪
些只是为了获得良好的第一印象而伪装出来的。
    最邋遢的家伙在重要的约会场合也可以摇身变得衣冠楚楚，但要整晚模仿
所有细节上的谦恭和礼貌却并非易事。鲜花是相对廉价的，赠送更贵重的礼物
也许是值得的。倒不是因为内在价值方面的原因，而是它代表了一个人乐意为
对方奉献多少的可靠证明。礼物值多少“钱”在不同背景下有显著差异。对一
个千万富翁来说，一颗钻石可能比忙里偷闲来陪你的时间牺牲来得便宜得多。
r
信息甄别：分离均衡的筛子
所以他宁愿送你钻石，而不愿陪你一起看电影。
    同时也应当意识到．约会对象同样会挑拣一番。因此必须得采取能真正
代表具有高素质的行为，而不是谁都学得来的那些行为。
    探询、隐藏和发现对方内心深处的想法，不仅在初次约会时很重要．在
整个关系发展的过程中都很重要。下面的故事说明了这一点。
    一对青年男女住在纽约，分别租住公寓。他们的关系已发展到同居的地
步，女人向男人提议放弃他租来的公寓。这位男士是一个经济学家，他向女
人解释了一个经济学原理：有较多的选择终归是比较好的，他们分手的概率
虽然很小，但是只要有分手的风险．则保留第二套廉租公寓还是有用的。然
而女人对这种说法非常反感，立刻结束了这段关系。
    用策略思维来解释，女人无法确认男人对关系的忠诚度有多高，她的提
议是发现真相的一个精明的策略机制。语言表达的爱总是很廉价的，因为每
个人都可以说“我爱你”。如果男人用行动实践诺言，放弃了廉租房，这将是
爱情忠贞的证明；而他拒绝这样做实际上是给出了负面证明，女人结束这段
关系是明智的。
    这类博奔中，关键的策略问题是对信息的操纵。传达关于你的正面信息
的策略称为信息传递；诱导对手传达关于他们私下拥有的真正信息(无论正
面或负面)的策略称为甄别机制。女人要求放弃一套公寓的提议就是一个甄
别和筛选机制，它将男士置于这样一种境地：要么放弃公寓，要么表明他缺
乏诚意。
    另外，在一种长期的关系中，一个人做好事还是做坏事，往往并不是由
他的本性所决定的，而在很大程度上取决于其他人在多大程度上认为他是好
人或坏人。坏人为了掩盖自己的真实面目．也可能在相当长的时期内做好事，
比如王莽。
2’5 I
第20章
策略欺骗：假作真时真亦假
风雨雷电海河山岩
在真与假之间
在你和我之间
距离只一线牵
——《小魔士的魔法书》歌词
善用自己的弱点
    在《三国演义》中，张飞逢酒必饮，每饮必出事端，这应该是张飞自身
的一大弱点。
    前面十几回中，张飞的这个弱点常常会给对手留下可乘之机。比如十四
回中，张飞酒后痛打曹豹。曹豹深恨张飞．回家后连夜差人赍书一封送给吕
布，劝吕布引兵来袭徐州，不可错此机会。吕布看见书信后．便带领大军迸
发徐州。张飞那时酒还未醒，不能力战吕布，只得从东门逃出，把徐州丢掉
了。
    然而到了第七十回，张飞智取瓦口隘的时候．我们却看到了另外一番景象。
    张部率兵三万进攻巴西．傍山险分别建立宕渠寨、蒙头寨和荡石寨。张
郐于三寨中各分军一半出征，留一半守寨。张飞接到探马消息，急唤雷铜商
议。雷铜说：“阈中地恶山险，可以埋伏。将军引兵出战，我出奇兵相助．邰
可擒矣。”张飞与雷铜两下央攻，大败张邰．并连夜追袭，直赶到宕渠山。
策略教骗：假作真时真亦假
    这时，张邰利用地势分兵守住三寨，多置擂术炮石．坚守不战。张飞令
军士大骂，但张部就是不出来，令张飞无计可施，双方相拒50余日。后张飞
就在山前扎寨，每日饮酒，饮至大醉．坐于山前辱骂。
    刘备得知后．同诸葛孔明商议，孔明笑着说：“原来如此!军前恐无好酒；
成都佳醣极多，可将五十瓮作三车装，送到军前与张将军饮。”玄德说：“吾
弟自来饮酒失事，军师何故反送酒与他?”孔明笑道：“主公与翼德做了许多
年兄弟，还不知其为人耶?翼德自来刚强，然前于收川之时，义释严颜，此
非勇夫所为也。今与张邰相拒五十余日，酒醉之后，便坐山前辱骂，旁若无
人：此非贪杯．乃败张邰之计耳。”
    后来，张郎果然以为张飞大意轻敢，引兵从山侧偷偷进攻张飞的营寨，
不料被张飞杀得大败。张飞夺得三寨，大获全胜。
    张飞的这一策略行动说明，他在战争中已经锻炼得成熟起来，学会了用
自己的弱点来麻痹迷惑对手。
    现实博弈与理想博弈的区别在于前者的行动中有更多的规律性，不论是
固有的偏好，或者在训练阶段和利用阶段，都会形成规律性的行动。至于规
律的简单程度和持续时间则决定于博弈参与者中弱智一方的智力，他的智力
越高．则规律越复杂．持续时间越短；极限情况就是博弈双方都是理性的人，
规律少到根本无法利用。
    在现实博弈活动中．参与者之间往往对自己和对方的优势及弱点都了如
指掌．而且往往会想方设法地加以利用，把弱点作为突破对方防线的重点。
正因如此，也就提供了策略欺骗的基础。
    一个人的特点及习惯最容易让对方形成固定的思维方式．这样的例子在
三国中有司马懿判断诸葛一生不曾用险，诸葛评价曹操虽精谋略但不识诡计
等。在一场比赛中，选手的特点几乎被对手调查得很详细，但若他在一些细
小处进行出其不意的变化，反容易赢得主动。
    在现实博弈中，参与者都会想方设法地去猜测对手的策略。以图打破平
衡。基本策略就是：先随机出正反面．维持一个平局的局面，同时尽量从对
方的行动中寻找规律，当捕捉到这种规律时就利用它。这有些像守在堡垒后
面，观察敌人动态，敌人一旦出现破绽就伺机进攻。此所谓“以静制动”，“先
27’l
博彝论的崩}舻
求不可胜，以待敌之可胜”。
    但是如果双方都采取这种保守策略，博弈将永远维持在平衡状态，必须
有一方首先走出堡垒，接某种规律行动，诱使对方也走出堡垒，这时才能开
始一场真正的斗智。其实先走出堡垒的一方只是打破了平衡，并没有什么损
失．所以博弈仍然是平衡的。这时的局面是一方攻一方守．攻的一方其实是
表面上的防守方，因为他在努力发现对手行动的规律性，而设规律的一方则
是在诱使对方走出堡垒来捕捉自己的规律，在捕捉自己规律的同时。对方的
行动就也带有规律了。
    一个善用策略行动的人，既要能有自知之明，更要能利用对手对自己习
惯及固有特点的了解，出其不意，把对手诱人局中。
被人耍弄的杨修
    世事如棋局，而棋局是可以用博奔思维加以概括的。比如过分的“骗着”，
与“本手”之间，一般都会选择本手。因为着法过分如不遇反击可能占到便
宜，如遇反击则可能亏损。因此如果棋力相当，则应考虑到对手的反击手段。
对手也同样考虑到．在追求利益中不可能占尽便宜。
    三国时期．曹操的两个儿子为了夺嫡而明争暗斗。
    曹植在文学才华上比曹丕更占优势，但是在政治和军事才能上却稍逊一
筹。两人身边智囊团的构成也不一样。曹丕的智囊是司马懿、陈群、吴质、
朱铄，《晋书》上说这四人在曹丕身边号称为“四友”。此四人中．司马懿和
陈群的谋略是众所周知的，而吴质不仅文才颇佳，心机也十分深沉。曹植的
智囊则是清一色的是文士，段有什么政治和军事经验，远不如司马懿之流老
谋深算．这样在斗争中自然就差了一截。
    有一次，曹操和众位幕僚商议，想立曹植为世子。曹丕听说了，就密请
吴质到他府中商量对策。因曹操对封侯诸子有严格禁令，不让他们与现任官
属交好。曹丕为了不被人发觉．就让吴质藏在一个大筐里，上面放些布匹。
别人阀起．就说是布匹，用马车把吴质拉进了曹丕府中密谋。
    不料，这件事偏偏被杨修知道了。杨修是曹植的智囊之一，当然希望曹
1278
策略欺骗：假作真时真亦假
植能当太子，于是就跑去向曹操告密。曹操于是决定派人到曹丕府前检查。
但是杨修没有想到，曹操周围又有人将杨修告密之事马上通报给了曹丕。曹
丕听了以后十分害怕，慌忙告诉了吴质。吴质说：“不用担心．明天用大筐装
上布匹拉到府里来，迷惑一下他们。”
    第二天，曹丕就接吴质所说的话去做了。曹操派去的人检查后发现全是
布匹，就回去把情况报告了曹操。曹操反而怀疑杨修故意陷害曹丕．对他十
分不满。
    冷战期间，苏联人和美国人谈判寻求逐渐一步步地裁军，但是．每个超
级大国的军事实力却都云山雾罩，以致双方都不确切地知谨他们所面临的局
面：他们不知道对手准备牺牲什么，也不知自己会从中捞到什么好处。例如，
由于不知道俄国人拥有多少枚导弹．所以美国人无法知道．关于拆除其中100
枚导弹的一项协议是否有意义。在这种博弈中，一位玩家如何行事能够暴露
出他都知道什么。如果苏联很快就同意削减100枚导弹。这也许表明。它的
导弹武库规模要比美国所猜测的大。抑或也许是，苏联只是想让美国这样想。
    这样的猜测同样发生在2003年美国人侵伊拉克的准备阶段。
    当时．有些国际关系学者猜测，萨达姆·侯赛因对待武器核查所奉行的
是一项与苏联人相似的战略。后来美军占领伊拉克以后进行了地藿式的搜查，
却没有发现任何实际的大规模杀伤性武器。萨达姆为武器核查人员提供的，
又似乎是最无可奈何的合作。也许，这位伊拉克独裁者企图通过这种方式，
来掩盖一个令他感到有些难以启齿的事实，即他实际上并没有什么需要隐藏
的东西。而美国即便知道这样的事实，也乐得将错就错地把自己的战略实施
到底。如果真的是这样．萨达姆执行了一个很不明智的策略，并为自己的错
误付出了惨重的代价。
    我们把目光从国家问的博奔转向日常生活当中。
    约翰到酒吧喝酒，旁边有一群人在打赌根热闹，于是他便也凑过去看看
热闹。其中有一人说：“信不信我用我的牙齿咬我的右眼睛．谁敢打100元的
赌?”很多人都表示怀疑。约翰走进人圈．拿出100元说：“好吧．我来跟你
打赌!这不可能。”可是他的话还投说完，那个人就把钱捕进口袋里，然后取
下右边的玻璃假眼．送进嘴里咬了咬。
279 I
策略欺骗：假作真时真亦假
植能当太子，于是就跑去向曹操告密。曹操于是决定派人到曹丕府前检查。
但是杨修没有想到，曹操周围又有人将杨修告密之事马上通报给了曹丕。曹
丕听了以后十分害怕，慌忙告诉了吴质。吴质说：“不用担心．明天用大筐装
上布匹拉到府里来，迷惑一下他们。”
    第二天，曹丕就接吴质所说的话去做了。曹操派去的人检查后发现全是
布匹，就回去把情况报告了曹操。曹操反而怀疑杨修故意陷害曹丕．对他十
分不满。
    冷战期间，苏联人和美国人谈判寻求逐渐一步步地裁军，但是．每个超
级大国的军事实力却都云山雾罩，以致双方都不确切地知谨他们所面临的局
面：他们不知道对手准备牺牲什么，也不知自己会从中捞到什么好处。例如，
由于不知道俄国人拥有多少枚导弹．所以美国人无法知道．关于拆除其中100
枚导弹的一项协议是否有意义。在这种博弈中，一位玩家如何行事能够暴露
出他都知道什么。如果苏联很快就同意削减100枚导弹。这也许表明。它的
导弹武库规模要比美国所猜测的大。抑或也许是，苏联只是想让美国这样想。
    这样的猜测同样发生在2003年美国人侵伊拉克的准备阶段。
    当时．有些国际关系学者猜测，萨达姆·侯赛因对待武器核查所奉行的
是一项与苏联人相似的战略。后来美军占领伊拉克以后进行了地藿式的搜查，
却没有发现任何实际的大规模杀伤性武器。萨达姆为武器核查人员提供的，
又似乎是最无可奈何的合作。也许，这位伊拉克独裁者企图通过这种方式，
来掩盖一个令他感到有些难以启齿的事实，即他实际上并没有什么需要隐藏
的东西。而美国即便知道这样的事实，也乐得将错就错地把自己的战略实施
到底。如果真的是这样．萨达姆执行了一个很不明智的策略，并为自己的错
误付出了惨重的代价。
    我们把目光从国家问的博奔转向日常生活当中。
    约翰到酒吧喝酒，旁边有一群人在打赌根热闹，于是他便也凑过去看看
热闹。其中有一人说：“信不信我用我的牙齿咬我的右眼睛．谁敢打100元的
赌?”很多人都表示怀疑。约翰走进人圈．拿出100元说：“好吧．我来跟你
打赌!这不可能。”可是他的话还投说完，那个人就把钱捕进口袋里，然后取
下右边的玻璃假眼．送进嘴里咬了咬。
279 I
燕略欺骗：假作真时真亦假
    自认倒霉的约翰刚想走，那个人又跟他说：“我给你一个回本的机会。”
约翰问：“什么机会?”那个人笑着说道：“我们再打200元的赌．信不信我
还能用牙碗我的左眼，”约翰仔细看了看，断定他不可能两只眼睛都是假的，
于是一咬牙说道：“好吧!”然后章出钱来。那个人叉立马把钱揣进口袋里，
约翰还未来得及生气，只见那个人取出嘴里的假牙咬了咬自己的左眼。
    这个例子听上去也许有些极端，当然没有人会打这么一个愚蠢的赌。
    其中的策略启示在于，其他人的行动向我们提示了他们究竟知道什么，
我们应该利用这些信息指导我们自己的行动。当然，我们应该将这些信息．
连同自己有关这个问题的信息综合起来加以利用，运用全部策略智慧，尽可
能获取整个事情的真相。
别拿别人当笨蛋
    在博弈中，存在一个从策略的角度来说十分简单的获胜机制。
    从前，有一个算命的道士，占h吉凶、推演因果很有一套。当地的许多
人有事的时候，都去他那里算上一卦。有一次，有三个书生进京赶考，路过
此地．听说此事便一同前去问h，希望得知三人谁能考中。
    那道士推演一番，向他们伸出一个手指．但却只字未说。三个考生莫名
其妙，其中一个着急地问道：“我们三人谁能考中?”那道士还是一言不发，
依旧伸出一只手指算是回答。三个考生见道士不肯开口讲话，以为是天机不
可泄露．心怀疑虑地走了。
    三个考生走后，道士身边的小童好奇地问：“师父．他们三人到底有几个
得中?”道士胸有成竹地说：“中几个都说到了。一只手指，可以是三人只有
一个中．也可以是只有一个不中，可以是三人一齐中，也可以是一个也不中。”
    正是因为道士知道自己能够用一个手势把四种可能的结局都概括了．所
以才会胸有成竹地与三个考生对赌。事实上，这种两头堵的策略是很多“未
h先知”者惯用的手法。
    虽然大家都会理解这个笑话．但是比这更重要的，是要学会在生活中运
用其中的策略。
。8。l
    明朝正德年问．福建福州府城内有个秀才叫郑堂，字汝昂．号雪樵山人。
他琴棋书画、诗词歌赋样样皆通，便在繁华的鼓渡鸡口地方开了个字画店，
生意倒也十分兴隆。
    一次，有个叫龚智远的人，拿来一幅五代名画家的传世之作《韩熙载夜宴
图》押当。郑堂十分高兴，当场付了8000两银子。龚智远答应到期愿还15000
两。可是一晃到了最后一天．也不见龚智远来赎画。郑堂取出放大镜，仔细
看才发现是幅假画。郑堂被骗去8000两银子的消息，在一夜之间不胫而走．
惊动了全城的同行。
    谁都以为郑堂吃了亏只有生气的份，谁知郑堂却在家里办起了酒席．遍
请全城士子名流和字画行家聚宴。宾客有的是抱着关切的心情来的，有的抱
着吸取教训的心情来的，有的是来看热闹的，也有一些人是抱着幸灾乐祸的
心情来的。酒饮一半，郑堂从内室取出那幅画，对大家说：“今天宴请诸位，
一方面是向大家表示郑某立志字画行业，决不因此罢休的决心；另一方面是
让我们同行共看假画，认识一下骗子以假乱真的巧妙手段。”同行看完假画后，
郏堂便把假画投进火炉，边烧边说道：“不能留此假画害人!”郑堂烧画，一夜
之间叉轰动了整个福州城。
    第二天，郑堂来到店里。却见龚智远已坐在那里等着他，说是有事而误了
银期。郑堂说：“只误三天，无妨，但需加利息。”一算，共计本息达15240两
银子。那龚智远已得知烧画之事，大大咧咧地说道：“好。兑银，请郑先生兑画!”
郑堂进内室取出那幅画．龚智远接过画打开一看．不由两腿一软。
    原来．上当受骗的郑堂为了让龚智远就范，照这幅画仿造一轴，同时设
宴毁画，给典画的幕后策划者知道，主动送来本息巨金。郑堂在宴席上烧的
画．不过是仿造的那一幅。
    阿维纳什·K·迪克西特和巴里·J·奈在《策略思维》中为我们提供了
一个类似策略的例子：在芝加哥交易所的期货合同市场中，假如一个交易者
主动提出要卖给你一份期货合同，那么就说明他只会在你损失的情况下得益。
这个交易是一宗零和博弈，就跟体育比赛一样，一方的胜利意味着另一方的
失败。因此，假如他愿意卖给你一份期贷合同，你绝对不应该买下来。
    但是人心不足蛇吞象，有太多的人愿意赌别人是傻瓜，而只有自己最聪明。
1282
策略就骗；假作真时真亦假
不要暴露了自己
    春秋时期，掌握晋国国政的几个权臣发生争斗，智伯联合韩康子、魏桓
子发动了对赵襄子的战争。
    在战争过程中，智伯决水淹了赵襄子据守的晋阳。当时．智伯巡行看水
势，魏桓子和韩康子与他同车前往。智伯说：“我今天才知道水也可以消灭一
支大军啊!”魏桓子此时触了触韩康子，韩康子用脚踩了踩魏桓子的脚背，两
人不约而同地想到，汾水可以淹灌魏桓子的都邑安邑，洚水可以淹茬韩康子
的都邑平阳。
    回来后，智伯的族人智过对智伯说：“韩、魏必定会反叛我们!”智伯说：
“您怎么知道昵?”智过回答说：“我是从今天的事情上知道的。我们领导韩、
魏一起攻赵，而赵亡．必祸及韩、魏。现在约定了胜赵后要三分其地，但在
降赵已经指日可待的时候，他二人看着水流却忧虑重重，没有一点儿欢喜的
表情，这不是要反叛还是什么呢，”
    第二天，智伯却把智过的这些话告诉了魏桓子和韩康子二人。他二人说：
“这是有人进谗言，为赵氏游说，让您怀疑我们而松懈对赵的攻伐。不然的话．
我们岂不是放弃朝夕间即可分赵氏之田的利益．而去做那些危难不可成的事情
吗?”魏桓子和韩康子二人出来后．智过进去见智伯说：“大王怎么把我说的话
告诉他们二人呢7”智伯说：“您怎么知道呢?”智过回答说：“我见他们看到
我时脸色凝重急速离去，这是他们知道我巳得知他们实情的缘故。”
    战争进行到最后关头，赵襄于岌岌可危．于是派家臣张盂谈以朝见智伯
为名私会韩、魏二人，成功说服二人联合攻智伯，并约定晚上系散守堤官兵，
放水淹智伯的军队。
    这时智伯仍蒙在鼓里。赵襄子在夜里派出军卒杀死智伯守堤之吏．决开
河堤，反使晋水冲向智伯军中。赵军从城中杀出，正面攻击智军。智军为水所
淹，巳乱作一团。韩、魏二家叉从两边夹击。赵襄子杀死智伯，尽灭智氏之族。
    战争开始的形势是对智伯有利的，因为他不仅有强大的军队和两个盟友，
还占据了地利之便。但是最后的结局却令人大跌眼镜：智伯众叛亲离而身死
2日。1
丫- 博彝论的簖舻
国灭，赵襄子不仅保住了自己的晋阳城，而且反败为胜。我们暂且不谈魏宣
子和韩康子的背叛有没有道理，仅从智伯的保密能力来看，如果不败给赵襄
子，那才叫没有天理呢!
    《周易》说：“君不密则失臣，臣不密则失身，几事不密则害成。是以君
子慎密而不出也。”强调的是守密在人与人的交往过程中的重要性。翻开中国
历史，凡是将领失败．军队覆亡，大都没有脱离孙子所说的五大原则——“将
有五危：必死可杀．必生可虏，忿速可侮．廉洁可辱，爱民可烦”。也就是说，
身为将领所面lI缶的危险从古至今不出这五种状况：抱定必死信念，很容易被
诱杀；有贪生想法的将军，注意力都往往都集中于逃生之路，很容易被诱捕；
假如很容易动怒，就可以藉激怒他来瘫痪他的战斗力；如果他很爱惜美好的
名誉，那就可以用“抹黑”的方式修理他；假如军队标榜“爱民”的话，那
体就用平民去骚扰他。
    同样的道理。在生活中，一个很爱发脾气的人很容易被别人激怒而坠人
圈套；一个极端爱惜名誉的人一旦被抹黑，一定到处向人澄清：“我不是这样
子的!”那他什么事情都不要做了，每天都去为保卫名誉而战吧。
    总而言之．一个人的深密心态绝不可完全暴露．特别是当自己有所偏执
的时候．更应了解这其中的人情危微．时时刻刻注意不暴露出来。心思意念
一旦曝光．而让对手看出来，往往成为对手攻击你的利器+包括“廉洁”、“爱
民”这些正面的品德。
    为了不暴露自己的偏执，保持开放性的思维是必要的，为了鼓舞士气．
可以让部属抱持必死的决心，但是身为主将必得有死里求生的规划。但是另
一方面．又不可有“幸生”的想法。而必须要有置之死地而后生的气度。
    器量浅狭的人易喜易怒，必须把注意力放在解决问题的策略上，而不是
个人情绪的随意宣泄，如此才不会轻易暴露自己。同时也必须知道．所谓的
“廉洁”、“爱民”这种美德重在“仰不愧于天．俯不怍于人”．如果过分标榜，
往往未蒙其利、先受其害。
    总之．在博弈中，任何信息的效用有赖于其独享性，如果一个信息被充
分共享的话，它的优势和效用就被“磨光”了。因此我们必须学会保密，不
让对手获得任何可能识破我方策略的信息。
r钆
策略欺骗的步骤
黹略欺骗：假作真时真亦假
    在古希腊智者中，有不少的诡辩木士为了战胜对手，往往违背逻辑规律
和人们判断推理的一般规则，采取各种手段以自己的“假”逻辑来对付别人
的“真”逻辑．从而常常使对手无法反驳。
    有一个著名的例子是诡辩术士普罗泰戈拉．与他的优秀学生爱瓦特尔打
的一场“诡辩官司”。
    普罗泰戈拉招收了爱瓦特尔做学生，向他传授讼诉和辩护方法。当时师
生俩订了一个合同：爱瓦特尔先交一半学费，所余的一半学费可以在他学成
当上律师，第一次出庭胜诉以后再行交付。爱瓦特尔很快就学完了全部课程．
但是却一直不肯打官司并按合同规定向老师付清学费。为此，老师决定向法
庭起诉学生。
    他对爱瓦特尔说：“如果你在我们的案件中胜诉，就应该按照合同的规定
条件交付学费．因为这是你第一次出庭，并取得胜诉；如果你败诉，那么就
必须依照法院的判决付给我学费。总之，不管你胜诉还是败诉，都得付给我
学费。”
    爱瓦特尔听罢回答说：“-芭师，你错了!恰恰相反，如果我在法庭上胜诉
了，那么根据法庭的判决，我当然不用付学费；如果我败诉了，那么我也用
不着付学费，因为我们的合同规定我第一次出庭胜诉后才付学费的呀!”
    真可谓“名师出高徒”!普罗泰戈拉自然不敢真的再到法庭去打官司了。
    事实上，普罗泰戈拉可以通过如下两步来达到自己的目的。
    第一次起诉要求爱瓦特尔偿付所余的一半学费。但在此次起诉中不能提
供任何证据，所以法官判爱瓦特尔胜诉，不必偿还所余的一半学费。
    普罗泰戈拉第二趺起诉要求爱瓦特尔偿付所余的一半学费。可提供证据：
爱瓦特尔此前的胜诉。所以法官要判普罗泰戈拉胜诉。由爱瓦特尔偿付所余
的一半学费。
    因此．普罗泰戈拉要达到爱瓦特尔偿付所余的一半学费的目的．就要进
行两次诉讼。第一次的败诉作为一个策略手段，不过是为第二次的胜诉提供
。B5 I
博彝论的簿舻
依据。以这种一环套一环的策略欺骗来对付学生的诡辩，可以说是以其治人
之道，还治其人之身，实在也不能说有什么不对。
    在三国时，东吴主孙权夺取荆州杀掉了关羽，想嫁祸于曹操，于是派人
把关羽的首级送到了许都。但是这一计谋被曹操手下识破．于是曹操一面收
下术匣，厚待东吴来使；一面迅速命工匠刻了一具沉香术的躯体，与关羽头
颅配在一起。一切具备后．曹操率领文武百官．以王侯之扎隆重为关羽送葬。
曹操还亲自在灵前拜祭，并追赠关羽为荆王，派专门官员长期守护关羽之墓。
孙权的计谋破产，刘备最终还是发兵要与孙权拼命。
    看似恳痴实则很聪明的人，往往将计就计．等骗人者相信自己已经被骗
时．反过来利用骗人者的策略。使自以为聪明的骗子反倒成了傻子。
    这里的关键在于为了赢对方而自愿增加自己的行动步骤．甚至付出暂时
的代价以诱敌深入．相当于自愿降低自己的收益来迁就对手。所以，仅从
阶段性的成果来看，他表现得像对手一样愚蠢，因而可能上当受骗并且受到
损失。
    有一个人道人陷害，被判了死罪。在执行死刑的前一天．他被带到了皇
帝面前。皇帝审查了他的案情，没有发现问题，于是章起笔来准备批准将这
个人开刀问斩。这个人急忙对皇帝说：“大王先不要杀我，因为我有特殊的本
领。”皇帝问：“你有什么特殊的本领?”这个人说：“我能让大王的马学会笆。”
皇帝和在场大臣们一听，都瞪大眼睛不相信地看着他。他接着说：“请大王给
我一年的时问进行训练，我一定能让马学会飞起来。”皇帝批准了，并且让他
选了另外一个死囚做助手。
    离开宫廷以后，他的助手仍然对这份差事到感到震惊不已。这个人笑了
笑说：“马怎么能飞起来呢?当然不能。可是我的朋友，一年里有365个日日
夜夜，每一天都有24个小时。在这几千个小时里，谁知道会发生什么事情呢7
我们可能会生病而死．皇帝也可能去世．马也可能会死掉，甚至我们的国家
也会在一场战争中灭亡。只要发生上面一种情况，我们就可以不被开刀问斩
了。况且万一马真的学会了飞呢々”
    这就是聪明人和理想人之间的差别，理想人相信对方也是理想人，所以
1286
策略欺骗：假作真时真亦假
他的表现也是理想人；聪明人相信对方是和自己一样有着种种欲望与算计的
人，并且环境中也存在着种种变数，所以他自己的表现也是近似于荒谬的。
    这种欺骗方式的关键是识破敌人的计谋和他们所想达到的目的．并且具
有放长线钓大鱼的耐心与气度。只有这样，才能在做出前期的损失之后．在
最后阶段使对手吃苦头，而且苦头还是他们自己找的。
28’l
第2 1章
承诺与威胁：胡萝卜加大棒的艺术
想起来大多数是晴天
当初相信你是真心的
渴望承诺一个永远
——《我相信你是真的》歌词
不战而胜的策略
    J853年．小刀会在上海造反．擒获上海道台吴健彰。与上海一湾之隔的
宁波顿时紧张起来．宁波知府段光清立即组建民间联防体系，安排联防队巡
夜。不久，一个地保找段光清告状，说城西有个开小店的营兵就是不肯去巡
夜。段光清来到营兵家，问他为什么不去。营兵回答段光清说：“士兵每日白
天操练，夜晚随军官巡逻，没时间参加民间巡夜。”
    段光清笑着说：“你不必对我说官话。如果营中果然是每夜都巡逻，哪里
还需要百姓巡夜'现在我劝百姓巡夜．原本就是想互相保卫，连百姓都不说
辛苦．营兵反而叫苦吗?”段光清接着说：“况且你既然吃粮当兵，白天应当
操练。夜晚则应该去巡逻捉赋．都是营兵的工作。你怎么会来城西开店呢7
我带你去见你的营官，要问一问你是真营兵还是假营兵?”
    这是一个暗示出顺杆爬对策的提问，其潜台词是：绿营的营官无须为管
理不严承担责任，我也无意追究这种责任。你可以说这营兵是冒牌的，可以
把责任完全推到这个小瘪三身上。试想，营官要害一个小兵有什么难的?叉
承诺与威胁：胡萝h加丈棒的艺术
不是自己的儿子，砍下他那颗惹麻烦的脑袋还可以吃空额呢，每月四两银子。
那个营兵当即无言应对，只好应允按规定出丁巡夜。
    在这个故事当中，段光清的第一句话，是指出看到一步棋的棋手的最佳
选择；第二句话，是指出看明白了三步棋的棋手的最佳选择。既然双方都在
他制定的规则中得到了自己的最佳选择，这局棋也就玩妥帖了。段光清在这
个过程中，把双方对抗的前景指给对手看．并顺利制服了对手．可以说是一
个娴熟无比的博弈高手。
    博弈论专家奥曼认为，人与人冲突的原因之一是相互猜疑。但是，一旦
我知道你如何算计我，你知道“我知道你如何算计我”，我知道“你知道‘我
知道你如何算计我”l_…·这种“知道”的链延伸至参与博弈的全体成员，并
且又延伸至博奔的无数个回合，则人们在一念之间就可能会停止相互猜疑与
算计，立即达成和解。在这个过程中．不可忽视的一点就是恰当的回应规则：
威胁或许诺。
    威胁是对不肯合作的人进行惩罚的一种回应规则。既有强迫性的威胁，
比如恐怖分子劫持一架飞机，其确立的回应规则是假如他的要求不能得到满
足．全体乘客都将死于非命；也有阻吓性的威胁，比如美国说，假如苏联出
兵攻击任何一个北约国家，它就会以核武器回敬。前一种威胁用意在于促使
某人采取行动，而后一种的目的在于阻止某人采取某种行动。两种威胁面临
同样的结局：假如不得不实施威胁，双方都要大吃苦头。
    许诺是对愿意合作的人提供回报的方式。为寻找证人．检察官会向一个
被告许诺说，只要他愿意成为污点证人，检举同案中的其他被告．他就会得
到宽大处理。许诺同样可以分为强迫性的和阻吓性两种。强迫性许诺的用意
是促使某人采取对你有利的行动，比如让被告摇身一变帮助公诉方作证；阻
吓性许诺的目的在于阻止某人采取对你不利的行动，比如黑帮分子许诺好好
照顾证人的家属，只要他答应保守秘密。与威胁类似．两种许诺也面临同样
的结局：一旦必须采取(或者不采取)行动．会出现说话不算数的动机。
    对上面故事中的那位营兵来说，输赢无非是熬几十天夜的问题；而对段
知府，输赢却关系到联防体系的建立和稳定．关系到维护这种稳定所必需的
权威，而这些又关系到段知府的前程甚至身家性命。
28。l
承诺与威胁：胡萝h加丈棒的艺术
不是自己的儿子，砍下他那颗惹麻烦的脑袋还可以吃空额呢，每月四两银子。
那个营兵当即无言应对，只好应允按规定出丁巡夜。
    在这个故事当中，段光清的第一句话，是指出看到一步棋的棋手的最佳
选择；第二句话，是指出看明白了三步棋的棋手的最佳选择。既然双方都在
他制定的规则中得到了自己的最佳选择，这局棋也就玩妥帖了。段光清在这
个过程中，把双方对抗的前景指给对手看．并顺利制服了对手．可以说是一
个娴熟无比的博弈高手。
    博弈论专家奥曼认为，人与人冲突的原因之一是相互猜疑。但是，一旦
我知道你如何算计我，你知道“我知道你如何算计我”，我知道“你知道‘我
知道你如何算计我”l_…·这种“知道”的链延伸至参与博弈的全体成员，并
且又延伸至博奔的无数个回合，则人们在一念之间就可能会停止相互猜疑与
算计，立即达成和解。在这个过程中．不可忽视的一点就是恰当的回应规则：
威胁或许诺。
    威胁是对不肯合作的人进行惩罚的一种回应规则。既有强迫性的威胁，
比如恐怖分子劫持一架飞机，其确立的回应规则是假如他的要求不能得到满
足．全体乘客都将死于非命；也有阻吓性的威胁，比如美国说，假如苏联出
兵攻击任何一个北约国家，它就会以核武器回敬。前一种威胁用意在于促使
某人采取行动，而后一种的目的在于阻止某人采取某种行动。两种威胁面临
同样的结局：假如不得不实施威胁，双方都要大吃苦头。
    许诺是对愿意合作的人提供回报的方式。为寻找证人．检察官会向一个
被告许诺说，只要他愿意成为污点证人，检举同案中的其他被告．他就会得
到宽大处理。许诺同样可以分为强迫性的和阻吓性两种。强迫性许诺的用意
是促使某人采取对你有利的行动，比如让被告摇身一变帮助公诉方作证；阻
吓性许诺的目的在于阻止某人采取对你不利的行动，比如黑帮分子许诺好好
照顾证人的家属，只要他答应保守秘密。与威胁类似．两种许诺也面临同样
的结局：一旦必须采取(或者不采取)行动．会出现说话不算数的动机。
    对上面故事中的那位营兵来说，输赢无非是熬几十天夜的问题；而对段
知府，输赢却关系到联防体系的建立和稳定．关系到维护这种稳定所必需的
权威，而这些又关系到段知府的前程甚至身家性命。
28。l
承诺与威胁：胡萝h加大棒的艺术
    段知府如果不肯对付这点麻烦，治一治不听使唤的人．地保就有理由不
好好干活，宁渡就可能沦陷，知府的损失就太大了。承受一点小麻烦，也是
两害相权取其轻，并不是段知府的肚量小。况且，连一个小兵都治不了．知
府的面子叉往哪里摆’小民的面子都值钱，知府的面子就更不要说了。这样
一比较，也可以说，段光清的这一胜利是建立在威胁的可信性基础上的。
    美国普林斯顿大学的古尔教授曾经在《经济学透视》杂志上发表文章，
通过深入浅出的例子说明威胁的可信性问题。
    有两兄弟老是为玩具吵架．因为哥哥老是抢弟弟的玩具。不耐烦的父亲
宣布了强硬政策：“好好去玩，不要吵我；不然的话，不管你们谁向我告状．
我把你们两个都关起来。”被关起来与没有玩具相比．情况更加糟糕。现在，
哥哥又把弟弟的玩具抢去了。弟弟没有办法，只好说：“快把玩具还给我．不
然我要告诉爸爸。”哥哥想，你真的告诉爸爸，我是要倒霉的．可是你不告状
只不过没玩具玩，告了状却要被关起来，告状会使你的境况变得更坏，所以
你不会告状。因此，哥哥对弟弟的警告置之不理。如果弟弟是会计算自己利
益的理性人．他还是会选择忍气吞声的。他的上述威胁就是不可信的。
    合作协议是否能够被双方执行，最关键的基本要素有两个。即承诺与威
胁。所谓承诺就是相互许诺，在下一次博弈时会采取使对方受益的行为；所
谓威胁，就是告知对方如果下一次博弈时其采取不合作策略．那么在下下一
次博弈时就会采取不利于对方的策略。
    合作的关键是承诺与威胁的可信度有多大。因为承诺与威胁都是在博弈
者进行策略选择之前做出的．因此它们对博弈者的约束力越小，合作的可能
性就越小。
威胁与许诺要适度
    宋仁宗时，宰相富弼采用朝士李仲昌的计策，从澶州商湖河开凿六漯渠．
将水引入横贯陇西的故道。北京(大名府)留守贾昌朝素来讨厌富弼，私下
与内侍武继隆勾结，买通司天官提出抗议．就说不应当在京城的北方开凿渠
道．这样会使皇上龙体欠安。两个司天官听从武继隆的主意向皇上上书，请
zq。I
、，一、博彝论的嶷H
皇后与皇上一起出来审议开渠一事。
    他们的奏章被呈送给宰相文彦博．文彦博看后藏在怀中，召来两个司天
官说：“日月星辰、风云气色的变异，才是你们可以说的事，因为这是你们的
职责。为什么胡言乱语干预国家大事7你们所犯的罪应当灭旗。”两个司天官
吓坏了。文彦博叉说：“你们两个真是愚昧之极，你们先下去吧，如果再犯，
一定要从重处置你们。”两个人走了后，文彦博把他们的奏章拿给同僚们看。
富弼等人说：“他们胆敢如此胡作非为．为什么不斩了他们?”文彦博说：“斩
了他们，事情就公开化了，宫中会阉得不安宁。”
    过了不久，朝廷决定派遣司天官测定六漂槊的方位，文彦博还是耀那两个
人去。这二人怕治他们的前罪，就改称六漯渠在京城东北，而不在正北。
    在博弈中，假如你打算通过威胁或许诺影响对方的行动，那么他的行动
也应该可以让你看到。否则你不可能知道他是不是选择顺从，而他也明白这
一点。
    在你做出一个许诺的时候，不应让自己的许诺超过必要的范围。很如这
个许诺成功地影响了对方的行为，就要准备实践自己的诺言。因此，代价越
小越好。意味着许诺只要达到必要的最低限度就行了。
    适度原则其实同样适用于威胁．不要让自己的威胁超过必要的范围。一
个大小恰当的威胁，应该是大到足以奏效，而又小到足以令人信服。如果威
胁大而不当．对方难以置信，而自己又不能说到做到，那就会打击确立自己
的信誉。
    博弈的参与者发出威胁的时候，首先可能认为威胁必须足够大．大到足
以阻吓或者强迫对方的地步。接下来才考虑可信度，即让对方相信，假如他
不肯从命，定逃脱不了已经明说的下场；若是在理想状况下，没有别的需
要考虑的相关因素了。假如对方知道反抗的下场．并且感到害怕，他就会乖
乖就范。那么，我们为什么还要担心若实践这个威胁，会有多么可怕的情况
发生呢’
    但问题在于．我们永远不会遇到理想状况。首先，发出威胁的行动本身
就可能代价不菲。国家、企业乃至个人都在许多不同的博弈交织之中．在一
个博弈中的行动会对所有其他博弈产生影响。其次．一个大而不当的威胁即
I。92
承诺与成胁：胡萝p加大棒的艺术
便当真实践了，也可能产生相反的作用。最后．所谓一个成功的威胁完全不
必实践的理论，只在我们绝对有把握不会发生不可预见的错误的前提下成立。
    我们来看一看法国著名女高音歌唱家玛-迪梅普莱是如何威胁那些私闯
园林的旅行者的。
    这位女高音歌唱家有一个很大的私人园林。每逢周末．总是会有人到她
的园林里采花、拾蘑菇，更有甚者还在那里搭起了帐篷露营野餐。虽然管理
员多次在园林四周围上篱笆，还竖起了“私人园林，禁止人内”的木牌，可
所有这些努力都无济于事。
    迪梅普莱知道了这种情况后，就吩咐管理员制作了很多醒目的大牌子，上
面写着“如果有人在园林中被毒蛇咬伤后，最近的医院在距此15公里处”的宇
样．并把它们立在园林四周。从那以后，再也没有人私自闯人她的园林了。
    从这个故事我们也可以理解．威胁的首要选择是能奏效的最小而叉最恰
当的那一种，不能使其过大而失去可信度，而务必要使惩罚与过错相适应。
无条件的回应规则
    春秋时期，楚国令尹孙叔敖在苟陂县一带修建了一条南北水渠．水渠叉
宽又长，足以灌溉沿渠的万顷农田。可是一到天早的时候，沿堤的农民就在
渠水退去的堤岸边种植庄稼，有的甚至还把农作物种到了堤中央。等到雨水
一多，渠水上进，农民为了保住庄稼和槊田，便偷偷地在堤坝上挖开口子放
水。一条辛苦挖成的水渠，被弄得遍体鳞伤．面目全非，因决口而经常发生
水灾，水利变为水害了。
    面对这种情形，历代苟驶县的行政官员都无可奈何。每当渠水暴涨成灾
时．便调动军队去修筑堤坝．堵塞漏洞，可说是个老大难问题。到宋代李若
谷出任知县时，也碰到了这个头疼的问题。他便贴出告示说：“今后凡是水槊
决口．不再调动军队修堤．只抽调沿渠的百姓，让他们把决口的堤坝修好。”
这布告贴出以后．再也没有人偷偷地去决堤放水了。
    在博奔中．一个策略行动的设计目的，就在于改变对方的看法和行动，
使其行动变得对自己有利。而宣布一种无条件的回应规则，刻意限制自己
29。I
的行动自由，可以成功达到这个目的。不派军队修堤坝看似可能造成所有
代价都由农民支付的后果，但是李若谷想要的就是这种后果对农民的阻吓
作用。
    也许会有人觉得，保留选择余地总归是有好处的。而且中国人的处世文
化中，退一步海阔天空是很重要的一条。但是．从博弈论的角度来看，这一
点却不成立。休虽然少了行动自由．却在策略上得了益．因为这么做改变了
对方对你以后可能反应的预期，而你可以充分利用这一点，为自己谋利。所
有人知道，只要你有行动的自由，你就有让步的自由。
    一个乍看上去可能束缚自己的策略行动．可以扭转整个局面，并使你获
得策略上的优势．抢占先机。
    回应规则必须在对方采取你打算加以影响的行动之前生效。一旦被人占了
先机，不管威胁还是许诺都将无济于事。也就是说，第一招一定要让对手观察
到或者推断到，否则就不能达到预期的策略效果。
    即便你对一个无条件的行动并未真的先行，仍然可以通过一个圊应规则．
获得类似的策略优势。回应规则把你的行为限定为对其他人行动的一种回应。
虽然你是跟在别人后面行动，但这个回应规则必须在别人开始行动之前就
宣布。
    父母对孩子说：“除非你吃掉这份蔬菜，否则不许看电视。”实际上就是
在确立一个回应规则。毫无疑问．这个规则必须在这个孩子把自己那份菠菜
喂了小狗之前就开始实施，并且明确宣布出来。
    无条件的行动是你先行且一成不变的回应规则；威胁与许诺则在你第二
个出招时实施，但两者都是有条件的行动．因为这个回应取决于对方怎样做。
    一种策略行动总是要抢占先机。回应规则必须在对方行动之前出现．这
意味着无论策略行动是什么，整个博弈都必须当做相继出招的博弈进行分析。
如果你永不妥协，那么其他人就会针对这一点做出回应。借助威胁与许诺，
你首先设立了一个回应规则，然后其他人出招，而你按照自己的回应规则采
取相应的行动。
    这样的话原本同时出招的博弈变成相继出招的博弈。同一个博弈若是按
照同时出招或者相继出招方式进行，有可能产生完全不同的结果。
I 29‘
承诺与威胁：胡萝h加大棒的艺术
    项羽于巨鹿之战中破釜沉舟，是一种断绝归路的无条件行动，这样一个
承诺使项羽获得两个好处：首先，他使自己的士兵团结起来了，每一个人都
知道他们全体都会战斗到底，因为已经没有可能中途放弃，甚至连进跑的机
会都没有了。其次．也是更重要的一点，这对敌人产生了影响。他们知道项
羽要么取胜．要么灭亡，而他们自己则有撤退到后方的选择。他们选择了撤
退，而不是跟这么一支已经横下一条心的军队拼个你死我活。
    要使这类威胁产生预期效果，光有自己一方达成一致还不够，必须让对
手对这些都有透彻的了解。因此，这个例子当中特别应该注意的是项羽的个
人威望，烧掉船只虽然是他的命令，但将士不仅知道他的目标．而且表示支
持．因为他们要推翻暴秦。
    还需要指出的是，在项羽之前．破釜沉舟对于任何一位将军来说都是疯
狂的，不可思议的。可是项羽恰恰是通过这种断绝自己后路的做法，达到了
自己的目标。一个看起来疯狂的人可能恰恰是一个超级策略家，为什么要这
么说呢?因为恰恰是这种表现．使他的威胁总是更容易使别人相信。
    博弈参与者不是使自己的支付或效用最大，而是使自己的“期望支付(或
效用)”最大。当失败的主观概率加大时．就会想办法避免。而左右判断的是
经验，一种并不太科学的“归纳法”。
    当种种迹象表明你心里最想采取的实际并不是你的最优策略时。铤而走
险的对手就会出现，当他们猜对了的时候，这种赌徒精神就会富于传奇色彩。
成功的概率无疑会比较低，所以大多数人撞过一两次南墙后就老实了。那种
一条道走到黑的二杆子精神毕竟只属于少数疯子。电影《东邪西毒》里面，
欧阳锋说“要让别人不拒绝你，你就要先拒绝别人”，欧阳锋不是疯子．但是
他被看做疯子这一点，却可以使他在博弈中更好地达到目标。
    因为同样一个威胁，如果由以疯狂闻名的人发出，就可以成功奏效．可
是如果换了一个头脑正常的人．人们就会觉得难以置信。从这个意义上讲，
明显的不合理性可以变成良好的策略上的合理性。在某些特殊情况下，甚至
可以有意培育某种名声。
。钻I
V，一    博彝论的
诡冲
保护好自己的武器
    2005年9月，印度海军参谋长阿龙·普拉卡什上将表示，印度不仅要有
可靠的二次核打击能力，而且还要确保其二次核打击具有“不可抵抗的毁灭
性”。这句话似乎说明，印度正将二次核打击视为核威慑的重中之重。他说：
“核威慑必须要根植于对手的心中。为了阻止某人，你必须让他确信，使用
核武器的后果是极其可怕和毁灭性的．以使他永远不会考虑动用核武器。”
    2006年4月13日，俄罗斯热力工程研究所负责人尤里·所罗门诺夫对美
联社记者说，俄军年内将部署首套移动型“白杨一M”导弹．潜射型“圆锤”
也将于2008年服役海军。有意思的是，所罗门诺夫专门强调俄罗斯未来的核
力量不是建立在核平衡的原则上，而是基于合理的最低限度原则。而这种所
谓的最低限度指的其实就是“二次打击能力”。
    因此，所罗门诺夫特意强调这些导弹的抗打击能力，以及它能够轻而易
举穿透任何导弹防御系统的攻击力：“这将使俄罗斯在2040年前高枕无忧。
‘白杨一M’和‘圆锤’    肯定能穿透导弹防御系统．这些新型导弹将能经受
住附近核爆炸和激光的影响，世界上没有其他导弹具有这种能力。”
    印度与俄罗斯的战略思路，与博弈论学者谢林的基本逻辑有惊人的相似
之处，尽管谢林的研究对象是冷战时期的美苏两个超级大国。按照谢林的理
论，拥有核武器的目的并不是用来先发制人，而是用来实施报复。就像在幼
儿园，一个弟弟为了避免受其他小朋友的欺负，并不会让能打架的哥哥首先
去教训所有的小朋友，哥哥的价值在于：如果遇到其他小朋友的欺负，他就
可以让哥哥出面反过来实施惩罚。因为首先教训所有小朋友的一个可能，是
可能会遇到更具报复力，比如有两个哥哥的小朋友．那就麻烦了。
    正是基于这种观点，谢林认为，核武器的作用来自于巨大的戚慑力，而
不是其先发制人的打击能力。一国防范核战争的最好措施是保护自己的武器，
而不是自己的人民。一个国家如果认为自己能够经受住一场核战争，就比较
可能会挑起核战争。所以，最好的办法是向你的敌人显示你能够在一场打击
后还击．而不是向他表明你能在打击后幸存。
1296
承诺与威胁：胡萝h加大棒的艺术
    也就是说，和平的希望不能寄托在裁军或躲避核辐射的庇护所上，而是
寄托于二次打击能力，例如把导弹安装在潜艇上。
    本节开头的两则消息清晰地表明。二次打击的核威慑概念经过谢林的推
广．目前已经成为一些核大国的基本共识。在影片《奇爱博士》中也用戏剧
化的手法，反映了谢林的这一观点。影片中的那台“末日毁灭机”是由埋藏
在地下的巨大的原子弹组成的，一旦引爆就会释放巨量辐射，足以毁灭全人
类。一旦苏联遭到入侵，这台机器就会自动引爆。当美国总统米尔顿·莫弗
利询问这么一个自动引爆装置究竟有投有可能制造出来时．奇爱博士答道：
“不仅有可能，而且不可缺少。”
    这台机器是一个绝妙的阻吓手段．它会使一切入侵变成自杀。本来，假
如苏联遇到美国人侵．银有可能犹豫，不愿意实施报复或者冒同归于尽的风
险。只要苏联还有不做反应的自由，美国就有可能冒险发动进攻。现在有了
这台“末日毁灭机”，苏联的反应将由这台机器自动做出．其阻吓的威胁也就
变得可信了。
    这种保护自己的二次打击能力的逻辑，其实也可以视为一种可以做出报
复的可信威胁。这在我们的生活中也有很多运用。作家李唯有一篇小说《腐
败分子潘长水》，里面有一段十分精彩的情节，就反映了这一策略。
    老潘和小商合谋收取巨额贿赂17万元，检察院立案审查事实清楚后，送
交法院等候判决。老刘代表单位党委依照程序来将这一决定通知老潘．并跟
老潘做了最后一次个人之间的谈话。
    老刘说：“你还记得好多年以前，‘文革’以前，有一本特别流行的小说
叫《平原枪声》，你还记不记得?”
    老潘说：“我不知道．我不看小说。”
    老刘说：“休真是不看书不看报．要不你怎么就能犯事进去了哩!那小说
里有个人物叫肖飞，是个侦察员．后来还改成快板书，叫‘肖飞买药’’”
    老刘叉说：“肖飞有两把枪．一把是明的，平时掂在手里的，是20响的
驳壳检，一把是暗的，平时藏在裤兜里不轻易掏出来的，是马牌槽子。你知
道肖飞为什么要有两把枪吗?”
    老刘接着说：“那马牌槽子是为了保护那驳壳枪的。如果肖飞的驳壳枪让
29’I
减篁鲨型型
人缴了，他马上就把暗藏的马牌槽子掏出来对准缴他枪的人，这样就能把驳
壳枪又夺回来。有马牌橹子的保护，肖飞才敢胆壮地掂着驳壳棺到处走。休
想．枪是杀人的，本身就已经够厉害的了，可枪还要用枪来保护．你想想这
里面对你有什么启发吗々”
    老刘说：“这就说到你这次搞钱，你事先有没有想过：你搞到钱后拿什么
来保护这个钱?你有什么奉事不让这个钱又被人收走还把你关进去々你有什
么能耐保证这个钱搞到手后就安安稳稳是你自己的，钱是好东西，可不是什
么人都有资格去搞的!老潘，我告诉你，现在抓出来的，都是叉想搞钱叉没
有本事去保护钱的人!真正有本事的都是抓不出来的。你没那个资格去搞钱
你搞的什么钱’抓的就是你们这些人!你可不就活该坐牢嘛!老潘，咱俩共
事这么长时间，关系不错，我才跟你这么说的，你好好想想吧。”
    然后．老刘严肃起来，正式代表单位党委通知老潘开除他的党籍。
    在竞争时，一方只要在遭受对手第一次袭击后有还手的能力，而且这种
二次打击能力足够致先进攻的一方于死地，那冲突就不会发生。因此，博弈
者通过威慑战略保护自己的耍诀，是隐藏和保护自己的武器，而不是隐藏自
己的收益。
    也正因此，就像和平的希望不能寄托在裁军或躲避核辐射的庇护所上，
而是寄托于二次打击能力一样，肖飞的马牌槽子也是为了保护那驳壳枪。至
于现实生活中的“老潘”们会不会由此变得更为狡猾，那就不在本书的讨论
范围之内了。
西点军校的规矩
    隋朝时，大将杨素带兵执法严酷．对违犯军令的人立即斩首。每当将要
与敌军对阵之时，他就搜求有过失的士卒杀掉，多的时候曾杀掉100多人，
少的时候也不下10人。杀的人多了，鲜血流到帐前，他却谈笑自若，就像没
发生任何事情。
    战斗打响时，他先命令300人冲锋，若冲破敌军防线便罢了；如果不能
攻破敌军阵地而败退回来，则不问缘由全部斩首。然后，再命令300人发起
1298
承诺与威胁；胡萝h加大棒的艺术
进攻，不胜则照杀不误。将士们受此恐吓，对他极其敬畏，作战时皆抱必死
之心，所以作战非常勇敢，没有一个人后退。
    古罗马军队也曾对进攻当中的落后者判处死刑。按照这个规定．军队排
成直线向前推进的时候，任何士兵只要发现自己身边的士兵开始落后．就要
立即处死这个临阵脱逃者。为使这个规定得到执行．未能处死临阵脱逃者的
士兵同样会被判处死刑。这么一来，哪怕一个士兵本来宁可向前冲锋蹈阵，
也不愿意回头捉拿一个临阵脱逃者，现在他也不得不那么傲，否则就有可能
赔上自己的性命。
    罗马军队这一策略精神，直到今天仍然存在于西点军校的荣誉准则之中。
西点军校的考试无人监考．作弊属于重大过失，会被立即开除。不过，由于
学生们不愿意告发自己的同学．学校规定，发现作弊而未能及时告发同样违
反荣誉准则，同样会导致开除。一旦发现有人违反荣誉准则，学生们就会举
报．因为他们不想由于自己保持缄默而同样违规。
    这几个故事的启示在于，其他人常常可以帮助我们立下可信的承诺。虽
然每个人在独立行事的时候都有可能显得弱不禁风，但是大家结合起来就可
眦形成坚定的意志，团队合作可以在社会压力的范畴外发挥作用。通过运用
一个强有力的策略．迫使我们遵守自己的许诺，这就给我们一个社交中的有
益策略：重视利用圈子来解决问题。
    圈子在当今中国是一种十分重要的文化现象，尽管世界很大。我们走上
社会以后。经过几年就会建立起一个相对固定的交往圈子，所处的地域、行
业、阶层、亲朋好友等共同构成了这个圈子，圈子就是基本的社会关系。无
论在哪个领域、哪个地方，都存在各式各样的圈子。圈中的人互相提携，互
相帮助，而不同圈子的人之间则彼此排斥和攻击。从这个角度来看，圈子似
乎是弊大于利。
    然而任何事物都有两面性。从内部人的相互关系来看，所谓的圈子，实
际上就把彼此之间的双边关系，放进了多边关系中来考虑。这样一种转变，
可以使不少问题迎刃而解。某人可以为了1000元的利益而背叛你，但着他背
叛了你一个，同时也意味着一群人不会再借钱给他的话，那么他可能就要仔
细掂量了。因而在一个圈子中．名声和信誉非常重要，这其实也是一种道德
29。I
舻
约束．其机理大大降低了个体回报的成本。
认识到这一点，在交际中将新朋友介绍给老朋友认识，是一个十分有效
的策略，将使彼此间的承诺与威胁更为有力，因而关系也就更为牢固。
策略意义的可信度
    在中国北方，流传着一个“鸣镝射马”的故事。它发生在西汉王朝初期
的漠北草原。当时。匈奴部落的单于叫头曼，前妻生子冒顿。后来，头曼所
宠爱的后妻阏氏又生了个小儿子．头曼想把小儿子立为太子，就派冒顿到月
氏王国(甘肃张掖)当人质。等冒顿去了之后，头曼发兵猛攻月氏，希望月
氏王把人质杀掉。冒顿察觉到危险，立刻夺得一匹好马逃了回来。老爹有点
懊悔，同时认为儿子很有胆识，于是分给他一万名部众。
    冒顿自有主张，不久就发明一种发射时能发声的响箭——鸣镝。他命令随
从说：“注意鸣镝．鸣镝所向，你们一齐射。”打猎时，冒顿鸣镝射向鸟兽，
有未跟着射的随从。立即斩首。冒顿叉用箭射自己的战马。有的随从一看是
单于的战马，有所迟疑，结果无一例外都被斩首。过了一些时候，冒顿用响
箭射他自己的妻子，随从中又有不敢跟射的．也被立即杀掉。最后．冒顿射
父亲的坐骑．随从都不敢不跟着射。冒顿知道已训练成功，于是把鸣镝射向
他的父亲，随从的乱箭随之，把老单于射成了刺猬。冒顿把他的继母与弟弟
杀掉，宣称自己是单于。建立了匈奴汗国。
    一项可能改变的行动在一个懂得策略思维的对手面前，根本起不了任何
作用。他知道你的言行未必一致，因而会认为这只是一种战术诈骗，而加以
轻视。建立策略意义上的可信度，意味着你必须让别人相信你确实会实践休
的无条件行动，会信守许诺。也会实践你的威胁。但是人们不会按照表面意
思领会一个承诺的内容，而要进行检验。因而为了使一个策略行动可信．你必
须采取其他附加行动，使扭转这一行动变得代价高昂乃至完全没有可能。可信
度要求对这个策略行动做出一个承诺。当冒顿的鸣镝射向鸟兽时．把没有跟射
的随从立即斩首．可以视为对下一次行动会执行处罚的承诺。
    一个跨国公司总想让新的竞争者相信，这个行业不会给它们带来好处。
r。
承诺与威胁：胡萝}加大棒的艺术
这基本上意味着，如果它们硬要进入这个市场，产品价格就会大跌，跌到不
能弥补它们成本的地步。当然了，这个跨国公司只会放出风声．说它将发动
一场冷酷无情的价格战打击一切后来者。不过，后来者为什么会相信这么一
个口头威胁呢?说到底，价格战也会使跨国公司付出重大代价的啊。
    跨国公司建设超过目前产量需要的生产设备的做法，可以使它的威胁变
得可信。一旦如此庞大的设备装配完毕，产量就能大幅度提高，新增成本也
会降低。唯一要做的是为这些设备配备人员和购买材料；主要成本已经发生，
不可挽回。价格战打起来会更容易，代价也更小，因此也更可信。
陆象先的边缘政策
    唐朝末年，有一个名为陆象先的人．他的父亲陆元方是武则天时的宰相，
所以自小受到家庭的熏陶，在青年时就气度很大，以喜怒不形于色而闻名。
    陆象先早年做同州刺史，有一次家里的仆人当街碰见他的下属参军(一
种地方军事官职)，没有下马。这在当时虽然算是一件没有礼貌的事．但也并
不过分严重。参军仅仅是刺史下属负责军事的官员，况且，刺史的仆人也未
必认识他。但是，这位参军却大发雷霆，命人鞭打仆人，血流浃背。然后，
参军到陆的官府中禀告说：“下官冒犯了大人您．请您免去我的官职。”
    对此，陆象先早已知晓事情原委．从容答复说：“身为奴仆，见到做官的
人不下马，打也可以，不打也可以。做官的人打了上司的家仆，罢官也可以．
不罢官也可以。”说完，也不再理睬这位参军，白顾自地翻开一本书看起来。
参军一时揣摩不透刺史的态度，不知如何回答，只好灰溜溜地悄然退了出去，
从此收敛了很多。
    在冲突中，为了避免因为出错而导致同归于尽的后果，人们一定都希望
找到一个刚好足够阻吓对手而又不会过火的回应方法。这种方法就是：使威
胁变得缓和一点，创造一种风险，而不是一种确定性，表明可怕的事情有可
能发生。这就是托马斯·谢林的边缘政策想法。在其著作《冲突策略》里．
他有这样的解释：边缘政策是故意创造一种可以辨认的风险，一种人们不能
完全控制的风险。这一策略在于有意将形势变得多少有点难以把握，其原因
∞l-
‰譬鲨篮窖
只是这种难以把握的形势在对方看来可能难以承受，因而被迫忍耐下来。这
等于将敌人置于一个双方共担的风险之下，对他进行干扰和威胁，又相当
于是告诉他，假如他采取敌对行动，我们可能大为不安，以至于不管我们是
不是愿意，我们都会越过边缘界线，采取行动与他同归于尽，从而对他进行
阻吓。
    “边缘”一词实际上本身就有这样的意思．它作为一种策略，可以将对
手带到灾难的边缘，迫使他撤退。肯尼迪在古巴导弹危机中采取的行动，被
普遍视为成功运用边缘政策的典范。
    边缘政策是一个充满危险的微妙策略，本质在于故意创造风险。这个风
险应该大到让你的对手难以承受的地步，从而迫使他按照你的意愿行事，以
化解这个风险。那么是不是存在一条边界线，在这一边是安全的，一旦落到
另一边就要遭受灭顶之灾?答案是否定的，并不存在这么一个精确的临界点，
人们只是看见风险以无法控制的速度逐渐增长。理解边缘政策的关键在于，
必须意识到这里所说的边缘不是一座陡峭的悬崖，而是一道光滑的斜坡．它
是慢慢变得越来越陡峭的。
    清朝名臣曾国藩手下有一员悍将，名叫陈国瑞。此人原是蒙古王爷僧格
林沁的属下大将。从未读过书，是个粗鲁莽撞之人。
    僧王死后，曾国藩接替剿捻事宜。正巧陈国瑞与刘铭任所统率的两军械
斗，曾国藩认为只有让陈国瑞真心服自己，才有可能在今后真正使用他。于
是曾国藩叫来陈国瑞．历数他的劣迹暴行。当陈国瑞灰心丧气，准备打退堂
鼓时．曾国藩话锋一转，叉表扬了他的勇敢、不好色、不贪财等优点，告诉
他是个大有前途的将才．切不可以莽撞自毁前程。然后与胨国瑞约法三章。
陈国瑞无言可辩，惟惟退出。
    但是．陈国瑞的野性难改，一回营就照样不理髁曾国藩所下命令。看到
软的不行，曾国藩马上请到圣旨，撤去陈国瑞帮办军务之职，剥去黄马褂．
责令戴罪立功。同时告诉他．如果再不昕令就要撤职查办．发往军台效力了。
陈国瑞一想到那无酒无肉、无权无势的生活，立即表示听曾太人的话，率领
部队开往指定地点。
    和其他任何策略行动一样，边缘政策的目的是通过改变对方的期望来影
r
承诺与威胁：胡萝h加大棒的艺术
响他的行动。我们普通人也可以加以运用，故意创造和操纵着一个在双方看
来同样糟糕的结局的风险，引诱对手妥协。
小步慢行的策略
    一个阿拉伯人带着一只骆驼在沙漠旅行，阿拉伯人晚上睡在一个小小的
帐篷里，骆驼睡在帐篷外面。半夜里，骆驼对主人说：“外面租冷，我可否把
我的鼻子伸到帐篷内取暖?”阿拉伯人对骆驼说：“帐篷很小，容不下你和我。”
骆驼再三恳求．一个鼻子占不了太多空间。于是主人心软了，让它把鼻子伸
进来取暖。
    过了一会儿．骆驼又再提出要求：“慈善的主人，好心点，只是一个鼻子
温暖无济于事。我的头冷，请允许我的头伸进帐篷中吧，”阿拉伯人同意了，
身子缩了一下．让出一块地方。
    没一会儿，骆驼又说：“慈善的主人，我的脖子冷，请允许我的脖子也伸
进帐篷中吧。”阿拉伯人同意了，叉蜷缩了一下身子让出了一片地方。
    一步一步，骆驼把前足、胸部、腰部，以至整个身子都慢慢地钻到了帐
篷里。待差不多占满了接个帐篷时，骆驼站起身来说：“主人，正如你所说的，
这个帐篷太小，容不下你和我。请你出去吧。”
    骆驼在这个故事中所使用的这个策略．在博奔论中有一个名称叫做“小
步慢行”策略。要渐进式地、一步步走向与对方的公开冲突，这就是说，即
使真的要进行战争，也应该让战争逐次升级，因这样每一步投人的成本都比
较小。而且，由于冲突是逐渐升级的，所以国内反对冲突升级的力量也较易
于制止冲突的升级．这就会降低内乱发生的概率。
    同样地．假如每次只要信任对方一点点，相互之间的信誉就能继续存在。
考察下面两种情况的区别：一是一次性用100万元向另一个人购买l公斤可
卡因，二是做同样数量的买卖，但分为1000次进行交易，每次交易不超过I000
元价值的可卡因。前一种情况下，假如可以赚取IOO万元，那么，铤而走险
欺骗你的“同伴”也是值得的；但在后一种情况下，欺骗你的“同伴”只能
碍到区区lOOO元，显然不足以弥补由此破坏关系的损失。
。03 1
博奔论的搪
    这就是说，如果一个大的承诺或威胁不可行，我们应该选择一个个小的
承诺和威胁．并有计划地加以运用。
    武则天曾经对著名文学家陈子昂说过一件自己在太宗身边的事，也是她
一生中使用的最重要的权术之一。当时唐太宗得到一匹好马，却野性难驯．
太宗和那些大将都无法将之驯服。时任才人的武则天自告奋勇，说只要给她
三件东西．就可驯服此马．这三样东西是鞭子、钢锥和匕首。先用鞭子抽．
如果不服就用钢锥刺，如果还敢不驯服，就用匕首杀掉。
    实际上．这三件东西也是后来武则天在政治上常用的武器。对于大臣，
除了重奖的一面，自然还有重惩的一面，就是鞭子、钢锥和匕首——政治上的三
板斧．对于重奖不能打动的人，武则天就先是用鞭子抽即贬官．待这人知道
痛了再把他调回来，一般的人就会甘心俯首了；对于比较倔强的，就用钢锥
刺．包括贬官、放逐、下狱、复职，然后再贬官、下狱、流放、再复职，把
你折腾得死去活来，尝尽痛楚，最后意识到只有归心皇上——管他大周还是大
唐，才有出路，这个人也就改造好了。如名臣狱仁杰、魏元忠就被刺得遍体
鳞伤，最后对武则天忠心耿耿。至于那些根本没有改造的可能的大臣和李氏
宗室．武则天便动用b首来诛除了。
    血淋淋的“小步慢行”策略，使武则天执掌天下达45年之久。
    再举一个例子来说，住宅的主人与承建商之间相互怀疑。房主担心提前
付款只会换来对方偷工减料或者粗制滥造；而承建商则担心一旦工程竣工，
房主可能拒绝付款。因此，承建商提出在每周结束之际按照工程进度领取报
酬。双方面临的最大损失不过是一周的劳动或报酬而已。
    就像边缘政策一样，小步前进缩小了威胁或许诺的规模．相应的缩小了
行动规模，因而也更容易实施。
r
参考文献
[美侏·弗登博格，[法】让·梯若尔著黄涛等译博弈论北京：中国
人民大学出版社．2003
罗贯中三国演义呼和浩特：内蒙古人民出版社．198l
郑惟尹主编心理学经典实验台北：佛光人文社会学院，2004
张维迎博弈论与信息经济学上海：上海人民出版社．2004
王则柯新编博弈论平话北京：中信m版社．2003
潘天群博弈生存：社会现象的博弈论解读北京：中央编译出版社，

“工作的目的是为了生存，为了更好的生活”这句话标准的英语怎么翻译？我想做一名黑客,目的是为了更好的了解电脑,而不是去做哪些坏事学习的目的是什么? 学习企业管理的目的学习计算机的目的学习八荣八耻的目的党校学习的目的学习水粉的目的怎样赢得更多的学习时间？每个学科的最终目的是什么，比如学习文史，是为了人类的幸福为了学习目的安装一些专业的软件，比如MATLAB,Protel，算不算犯法？博弈论的书籍关于博弈论的知识活着的最终目的是为了什么？商业银行的最终目的是不是为了上市同居的目的是为了什么 ? 考自考的目的是为了什么玩网络游戏的目的是为了什么？ “为了”，“目的是”的英文短语是什么？学习关系代数的目的大学生学习音乐的目的大学生学习音乐的目的学习的根本目的是什么？学习的最终目的是什么?

メイキング ラバーズ:学习博弈论的目的,不是为了赢得更好的结局,而在于享受博弈分析的过程

メイキングラバーズ:学习博弈论的目的,不是为了赢得更好的结局,而在于享受博弈分析的过程