招行信用卡逾期两个月:30天让你精通博弈

来源：百度文库编辑：偶看新闻时间：2024/04/28 22:04:50

什么是博弈？
从囚徒困境说起

田忌赛马的故事在中国妇孺皆知，说的是战国时期齐威
王和大将田忌赛马，参赛的马被分成上中下三等，齐王的马
在每一等级上都比田忌的马好。齐王原本是稳操胜券的，但
军师孙膑给田忌出了个主意，要田忌用下等马输给齐王的上
等马，然后用上等马和中等马分别赢了齐王的中等马和下等
马，三局两胜，最后是处在劣势的田忌赢了齐威王。这中间
包含的道理就是“博弈论”。

博弈论又称对策论，是研究两人或多人之间竞争合作关
系的一门科学，它使用严谨的数学模型来解决现实生活中的
各种冲突问题。

博弈论由美国数学家约翰

冯
诺伊曼（
创立，并与经济学家奥斯卡
年发表
弈论与经济行为》，把博弈论引入了经济领域。人们都把
冯

摩根斯坦合作于
诺伊曼和摩根斯坦的这部巨著看做是现代博弈理论诞生
的标志。冯
诺伊曼是当代最伟大的数学家，是现代计算机
科学和数理经济学特别是博弈论的奠基人。可惜，这位天才

的学者在

年

岁的时候就英年早逝，无缘
年开始
每年颁发的经济学诺贝尔奖。

年，数学家塔克任斯坦福大学客座教授，在给一些
心理学家做讲演时，他用两个囚犯的故事，将当时专家们正
研究的一类博弈论问题，做了形象化的解释。从此以后，类
似的博弈问题便有了一个专门名称“囚徒困境
”。借着这
个故事和名称，“囚徒困境”广为人知，在哲学、伦理学、社
会学、政治学、经济学乃至生物学等学科中，获得了极为广
泛的应用。

所谓的“囚徒困境”，大意是这样的：甲、乙两个人一起
携枪准备作案，被警察发现抓了起来。警方怀疑，这两个人
可能还犯有其他重罪，但没有证据。于是分别进行审讯，为
了分化瓦解对方，警方告诉他们，如果主动坦白，可以减轻
处罚；顽抗到底，一旦同伙招供，就要受到严惩。当然，如
果两人都坦白，那么所谓“主动交代”就不那么值钱了，在
这种情况下，两人还是要受到严惩，只不过比一人顽抗到底
要轻一些。在这种情形下，两个囚犯都可以作出自己的选择：
或者供出他的同伙，即与警察合作，从而背叛他的同伙；或
者保持沉默，也就是与他的同伙合作，而不是与警察合作。
这样就会出现以下几种情况（为了更清楚地说明问题，我们
给每种情况设定具体刑期）：

如果两人都不坦白，警察会以非法携带枪支罪而将二人
各判刑

年；

如果其中一人招供而另一人不招，坦白者作为证人将不
会被起诉，另一人将会被重判

年；
如果两人都招供，则两人都会因罪名各判
年。
这两个囚犯该怎么办呢？是选择互相合作还是互相背叛？
从表面上看，他们应该互相合作，保持沉默，因为这样他们
俩都能得到最好的结果

只判刑

年。但他们不得不仔细
考虑对方可能采取什么选择。问题就这样开始了，甲、乙两
个人都十分精明，而且都只关心减少自己的刑期，并不在乎
对方被判多少年（人都是有私心的）。
甲会这样推理：假如乙不招，我只要一招供，马上可以
获得自由，而不招却要坐牢

年，显然招比不招好；假如乙
招了，我若不招，则要坐牢
年，显然还
是以招认为好。无论乙招与不招，我的最佳选择都是招认。
还是招了吧。
自然，乙也同样精明，也会如此推理。于是两人都作出
招供的选择，这对他们两个人来说都是最佳的，即最符合他
们个体理性的选择。照博弈论的说法，这是本问题的唯一平
衡点。只有在这一点上，任何一人单方面改变选择，他只会
得到较差的结果。而在别的点，比如两人都拒认的场合，都
有一人可以通过单方面改变选择，来减少自己的刑期。

也就是说，对方背叛，你也背叛将会更好些。这意味着，
无论对方如何行动，如果你认为对方将合作，你背叛能得到
更多；如果你认为对方将背叛，你背叛也能得到更多。你背

年，招了只坐

叛总是好的。这是一个有些让人寒心的结论。

为什么聪明的囚犯，却无法得到最好的结果？两个人都
招供，对两个人而言并不是集体最优的选择。无论对哪个人
来说，两个人都不招供，要比两个人都招供好得多。

“囚徒困境
”这个
问题为我们探讨合作两人下棋，甲出子的时候，为了
是怎样形成的，提供
赢棋，得仔细考虑乙的想法，而乙出
子时也得考虑甲的想法，所以甲还得
了极为形象的解说方
想到乙在想他的想法，乙当然也知道
式，产生不良结局的
甲想到了他在想甲的想法。
原因是因为囚犯二人
都基于自私的角度开
始考虑，这最终导致合作没有产生。
如果你处于这个困境中，你将如何做呢？设想你认为对
方将合作，你可以选合作，那么你将得到“对双方合作的奖
励”。当然，你也可以选背叛，得到“对双方背叛的惩罚”。
换言之，如果你认为对方合作，那么你背叛将能得到更
多的好处。反过来，如果你认为对方将背叛，那么你也有两
个选择，你选择合作，那么你就是“笨蛋”；你选择背叛，就
会得到“对双方背叛的惩罚”。因此，对方背叛，你也背叛将
会更好些。这就是说，无论对方如何行动，你背叛总是好的。
到现在为止，你似乎知道该怎样做；但是，要知道相同的逻
辑对另一个人也同样适用。
因此，另一个人也将背叛而不管你如何做。这样，你们

将是双方背叛，只能一起坐牢很久，这比你们双方合作所能
得到的“奖励”（只需短期服刑）差很多。个体的理性导致双
方得到的比可能得到的少，这就是“困境”。

说到这里，你可能对博弈论有一个基本的了解，那么下
面我再简单讲讲博弈论的基本知识。

博弈论最基本的分类有两个：

一种分类方式是按照博弈各方是否同时决策，分为静态
博弈和动态博弈，同时决策或者同时行动的叫做静态博弈，
决策或行动有先后次序的叫做动态博弈。这里要注意的是，
即使决策或行动有先后，但是只要局中人在决策时都还不知
道对手的决策是什么，也算静态博弈。这是很容易理解的。
比方说工程招标，截止日期是

月
日，那么尽管有些投标
者在四月上旬就投了标，有些到
月下旬才投标，虽然本来
决策时间有先后，但效果与同时决策并无二致。这里，我们
当然排斥标书泄密这样违规的事情。
另一种分类方式是按照大家是否都清楚各种对局情况下
每个局中人的得益，分为完全信息博弈和不完全信息博弈。
我们已经讲过的所有博弈，都是完全信息博弈，因为博弈矩
阵已经把各种对局情况下每个局中人的得益写得非常清楚。
博弈论把完全信息这种情况，概括为“各种对局情况下每个
局中人的得益多少，是所有局中人都清楚的”。

静态和动态、完全信息与不完全信息，组合起来一共有
四大类博弈。现在世界各国的经济学教育，基本上都只是在

研究生水平才讲博弈论，典型的研究生博弈论教材就包括这
四类博弈：

完全信息动态博弈；
不完全信息静态博弈；不完全信息动态博弈。这四类
博弈一个比一个精彩，也一个比一个难。
）完全信息静态博弈；

另外一个类似囚徒困境的经典博弈案例是哈佛大学巴罗
教授提出的著名的“旅行者困境”：

两个旅行者从一个以出产细瓷花瓶著称的地方旅行回来，
他们都买了花瓶。提取行李的时候，发现花瓶被摔坏了，于
是他们向航空公司索赔。航空公

知道花瓶的价格大概在八
九十元的价位浮动，但是不知道两位旅客买的时候的确切价
格是多少。于是，航空公司请两位旅客在
元以内自己写
下花瓶的价格。如果两人写的一样，航空公司将认为他们讲
真话，就按照他们写的数额赔偿；如果两人写的不一样，航
空公司就认定写得低的旅客讲的是真话，并

原则
照这个
低的价格赔偿，同时，航空公司对讲真话的旅客奖励
元钱，
对讲假话的旅客罚款
元。
就为了获取最大赔偿而言，本来甲乙双方最好的策略，
就是都写

元。可是不，甲
很聪明，他想：如果我少写
元，这样两人都能够获赔
元，而乙会写
元，这样我将得到
元变成

元。何乐而不为？所以他准备写

元。
可是乙更加聪明，他算计到甲要算计他写

元，于是他
准备写
元。想不到甲还要更聪明一个层次，估计到乙要写
元来坑他，于是他准备写
元..大家知道，下象棋的
时候，不是说要多“看”几步吗，“看”得越远，胜算越大。
你多看两步，我比你更强多看三步，你多看四步，我比
你更老谋深算多看五步。在花瓶索赔的例子中，如果两个人
都“彻底理性”，都能看透十几步甚至几十步上百步，那么上
面那样“精明比赛”的结果，最后落到每个人都只写一两元
的地步。事实上，在彻底理性的假设之下，这个博弈唯一的
纳什均衡，是两人都写

。

巴罗教授提出这个案例旨在警世：一方面，它有启示人
们在为私利考虑的时候不要太“精明”，告诫人们精明不等于
高明，太精明往往会坏事；另一方面，它对于理性行为假设
的适用性提出了警告。

有了这个假设，我们就可以按照这个明确的比较取舍标
准来推理，但是推断出来的结论是否符合实际，依赖于应用
“理性行为”假设的程度。如果你的论证像“旅行者困境”那
样，假设当事人彻底理性，能够算计到十几步甚至几十步，
那么你推论出的结果，未必符合现实。

大家知道，理性行为假设是讨论消费者和企业这些经济
主体人的行为的基本假设。所以经济学在理性行为假设之下
得到的结论是否符合实际，还要进行另外的分析。在这个意
义上，“旅行者困境”是所有博弈论学者甚至所有经济学者必
然面对的困境。

博弈一词的英文

就有游戏的意思，而象棋、扑克是
最古老的博弈。两人下棋，甲出子的时候，为了赢棋，得仔
细考虑乙的想法，而乙出子时也得考虑甲的想法，所以甲还
得想到乙在想他的想法，乙当然也知道甲想到了他在想甲的
想法。这个“你知道我知道你知道我知道..”的博弈逻辑
在庄子和惠子的那次著名的“子非鱼”的对话中就有精彩演
绎。

现在看两个企业“价格大战”的例子。

两个企业合起来垄断或几乎垄断了某种商品的市场，经

济学把这种情形称为双寡头经济（

。双寡头经济是寡

头经济的一种，寡头可以有好几个企业，双寡头只限于两个
企业。两个企业都想打垮对手，争取更大的利润。可口可乐
公司和百事可乐公司几乎垄断了美国的碳酸饮料市场，他们
之间的争斗可以说就是这种情形的争斗。

争斗的目的，最后当然是增加自己企业的利润。可能有
的人会想，要增加利润，提高商品的价格就可以了。东西卖

得贵了，钱不就赚得多了吗？

的确，如果只有你一家企业垄断了整个市场，提高价格
可能会增加你的利润。现在存在两家相互竞争的企业，消费
者可以在两家之间选择。这时候，提价的结果不仅不能增加
利润，反而可能会使自己企业的销售和利润下降。

这里，重要的因素是市场份额。如果你提价，对方没有
提价，你的东西贵了，消费者就不买你的东西而买你对手的
东西。这样，你的市场份额会下降很多，利润也会随之下降。
这是历经市场经济洗礼的人都明白的道理。对方的价格没有
提高，生意比原来好得多，利润就可能大幅度上升。但是如
果两个企业都采取比较高的价格，消费者没有别的选择，贵
也只好买，两个企业的利润都会上升。

假定两个企业都采取比较低的价格，可以各得利润

亿
元；都采取比较高的价格，各得
亿元利润；而如果一家采
取较高的价格而另一家采取较低的价格，那么价格高的企业
的利润为
亿
元。
究竟是采用较高的价格好还是较低的价格好？
很明显，对于两个竞争企业，单方面提价都是它们的劣

势策略，所以双方价格大战的结果，是双方都采取低价各赚
亿元的情况。
许多商战的对策形势，都可以像价格大战对策那样，归
结为囚徒困境对策。这也是为什么博弈论的书通常都要从囚

亿元，价格低的企业因为多销利润将上升到

徒困境对策讲起的原因。

为什么两个企业那么蠢要进行价格大战呢？那是因为每
个企业都以对方为敌手，只关心自己一方的利益。在价格博
弈中，只要以对方为敌手，那么不管对方的决策怎样，自己
总是采取低价策略会占便宜。这就促使双方都采取低价策略。
如果清楚这种前景，双方合作起来，都实行比较高的价格，
那么双方都可以因为避免价格大战而获得较高的利润。有人
把这种合作叫做“双赢对局（。在上述企业价格大
战博弈中，如果双方联手都不降价，则将是双赢，都是对局
中的赢家。

选择

还是选择
一位教授让自己班上的名学生进行一个博弈游戏，这
是一个“事先设计好”的博弈。这个博弈会把他们带入“囚
徒困境
”。

游戏规则如下：

假设每一个学生都拥有一家企业，他必须决定自己应该
选择还是选择，选择代表着生产高质量商品来帮助维
持较高价格，选择代表着生产假货以通过别人所失换取自
己所得。

假设选可奖励元，选可奖励元。选将产
生总体收益，选将无总体收益。同时根据选的学生收益

总数，将收入分给每个学生。
例如，如果名学生都选，则每人各奖励元。同时
总体收益是元，分配给每个学生也是每人元则每个学
生实际所得为元。

假设有一个学生有了自私自利的心，私自改变主意，改
选，则有名学生选择，每人各奖励元，总体收益是

元，
元平均分配给
个学生，每人各分得
元，则
的
选择

名学生每人各得
元，选择
的一个学生可得
元，比原来多元。
假设有个学生改选，则有名学生选择，每人各
奖励元，总体收益是元，元平均分配给个学生，

元，则选择每人各分得

的
名学生每人各得
元，选择
的
个学生可得
元。
假设有
个学生改选
，则有
名学生选择，每人各
奖励
元，总体收益是
元，
个学生，
每人各分得

元平均分配给
元，则选择

的
名学生每人各得
元，选择
的
个学生可各得
元。
假设

个学生都选择
，则总体收益是
，每个学生各
奖励
元，他们的实际所得是

元。
从上面的分析可以看出，只有一个学生选择

的时候，
这个学生能获得最大收益
元，其他

名学生相对会受
损失，只能获得
元。当只有
个学生都选择
的时候，
每个人都能获得最大收益
元，选择
的学生越多，个人的
总体收益越少。
演练这个博弈的时候，一开始每个学生都被相互隔离开，
单独做选择。

结果

名学生都像囚徒困境中的囚徒，都是绝顶聪明
的理性人，个个都会算计，为了多获得
元，不约而同
地选择了

后来教授允许

个学生相互讨论，以便达成“合谋”，
结果愿意合作而选择
的学生总数从
人到
人不等。在
最后的一次带有协议的博弈里，选择
的学生总数是
人。
这个游戏比囚徒困境更深刻地揭示了人自私自利的本性。
处于困境下，各方都不知道别人的选择，因而只能猜测每个
人都是理性的人，从自己的利益出发去作出选择。他们与困
境之间，是一种不可逆转的关系，即他们无法通过自己的力
量去左右局势，只能在困境的局势下想办法尽可能让自己的
损失最小，获益最大。

这个游戏也可以看作是“非合作性博弈”的典型模式。
简言之，这一模式代表了处于相同困境状态下，不同的人面
对同样的几种选择，最后必将背叛其他人，做出最利于自己
的选择的一种情况。

如果你仅仅把这个游戏当成一个游戏或者一种博弈模型
就大错特错了，这个游戏在现实中也很有代表性。

比如，某村里有一块公共地可以放牧，每个村民只知道
增加自己养羊的数目可以增加收入，由于是公共地，没有人
会去关心草地的极限承载力，于是羊多了、草少了，最后草
没了、羊也没了，这是一个悲剧性的博弈过程。对于这样的
情况，就需要有外部干预，制定规则，从而使草地得到最好
的利用，大家才能真正得到实惠。

当你看到两位对弈者时，你就可以说他们正在玩“零和
游戏”。因为在大多数情况下，总会有一个赢，一个输，如果
我们把获胜计算为得

分，而输棋为失
分，那么，这两人
）

得分之和就是：

这正是“零和游戏”的基本内容：游戏者有输有赢，但
整个游戏的总成绩永远为零。

“零和游戏”受到关注，是因为人们发现在社会的方方面
面都存在与“零和游戏”类似的现象，胜利者的光荣背后隐
藏着失败者的辛酸和苦涩。从个人到国家，从政治到经济，
似乎无不验证了世界正是一个巨大的“零和游戏场”。这种理
论认为，世界是一个封闭的系统，财富、资源、机遇都是有
限的，个别人、个别地区和个别国家财富的增加必然意味着
对其他人、其他地区和国家的掠夺，这是一个“邪恶进化论”
式的弱肉强食的世界。

美国学者哈丁在一篇重要而具有影响力的文章里提到，
不加限制的个人选择可能给社会带来灾难。哈丁举了这样一

个具体事例：一群牧民面对向他们开放的草地，每一个牧民

都想多养一头牛，因为多养一头牛增加的收益大于其购养成

本，是合算的，尽管因平均草量下降，增加一头牛可能使整

个牧区牛的单位收益下降，但每个牧民都想尽可能多养几头

牛，这样草地将可能被过度放牧，从而不能满足牛的食量，

最终将导致所有牧民的牛均饿死。这就是公共资源的悲剧。

在一个信仰平民自由的社会，每一个人都在无限制地追

求自己的最大利益，从而毁灭将成为大家不能逃脱的命运。

他按照这一思路讨论了人口爆炸、污染、过度捕捞和不

可再生资源的消耗等问题。他的结论是，世界各地的人民必

须意识到有必要限制个人作出这些选择的自由，接受某种
“一致赞成的共同约束
”。

对公共资源的悲剧有许多解决办法，哈丁说，我们可以

将之卖掉，使之成为私有财产，也可以作为公共财产保留，

但准许进入，这种准许可以以多种方式来进行。

哈丁认为，这些意见均合理，也均有可反驳的地方，

“但是我们必须选择，否则我们就等于认同了公共地的毁灭，

只能在国家公园里回忆它们了。”哈丁说，像公共草地、人口

过度增长、武器竞赛这样的困境“没有技术的解决途径”。所

谓技术的解决途径，指“仅在自然科学中的技术的变化，而

很少要求或不要求人类价值或道德观念的转变”。

对公用地悲剧的防止有两种办法：一是制度上的，即建

立中心化的权力机构，这种权力机构可以是公共的，也可以

是私人的；第二种便是道德约束。道德约束通常与非中心化
的奖惩联系在一起。

公共品和私人品的性质很不一样。私人品是私有私用，
除了像他穿得整齐你看着也舒坦那样十分间接的效应以外，
别人很难沾什么光。公共品则不一样，不管是谁提供出来的，
许多人都可以享用。比如路灯，只要有人装了，路人都将得
到好处，哪怕他没有为此贡献过一分钱。

设想农村某地有一个只有两户人家的小居民点，由于道
路情况不好，与外界的交通比较困难。如果修一条路出去，
每家都能得到“

那么多好处，但是修路的成本相当于
“

。要是没有人协调，张三、李四各自打是否修路的小算
盘，那么两家博弈的形势如下：如果两家联合修路，每家分
，各得好处“
”，两家的纯“赢利”都是“
摊成本“

如果一家修另一家坐享其成，修路的一家付出“
”而得到
“赢利
”是
“

”，坐享其成的一家可以白赢利“
”（假
设修路的人并不能拥有路的地权，他总不能因为修了路就不
让邻居走）；如果两家都不修路，结果两家的得益都是“”
在这个博弈中，修路是张三的严格劣势策略，我们应该

把它消去；修路也是李四的严格劣势策略，所以也应该把它
消去。这样运用严格劣势策略消去法，我们就得到这个博弈
的严格优势策略均衡：两家都不动手，大家都得零。

一般来说，该地方如果张三只有李四一家邻居，李四只
有张三一家邻居，他们多半会守望相助，关系比较好。这样
的两家自然会好好商量修路的问题，一起把路修好，大家都
得到好处。

相反，两家有仇也是可能的，那就麻烦了，不是什么修
路不修路的问题，迟早要出事。但是，博弈论讨论所牵涉的
局中人，都是经济学上所讲的“理性人”，他们只为己，但是
并不刻意害人。现在城市公寓里面的不少居民在邻居关系上，
有时候差不多就是这种理性人的关系。

对于他们来说，都市化进程的一个副产品，就是即使是
近邻也形同陌路。如果没有公寓物业管理方面的制度，新公
寓家家装修一流，可是楼道却杂乱无章，路灯坏了，往往长
久没有人修理。修路灯也和修道路一样，是一个大家都袖手
旁观才是“严格优势策略均衡”的博弈。

这就是公共品供给的囚徒困境：如果大家都只从自己得
益多少考虑问题，大家都只打自己的小算盘，结果就是谁也
不作为，对局锁定在“三个和尚没水吃”的局面，排除了合
作双赢的前景。

所以，公共品问题一定要有人协调和管理。就一个国家
来说，最重要的公共品是国防、教育、基础设施等。

政府责无旁贷，要用好来自纳税人的钱，把文化教育、
社会保障、基础设施和国防公安等事情做好。机关大院、居
民小区要有专人协调管理，把身边看起来很琐碎但是弄不好
有损工作和生活环境的事情做好。

政府为社会中的个人和组织提供服务，而政府运转的经
济来源是税收。税收，它取之于民，用之于民。任何一项交
易活动都要赋税，这是税收的原则。然而，作为经济人的个
人或企业为了自身的利益会发生偷税行为，或者不自觉地发
生漏税行为，尽管这种行为不是普遍性的现象。因此，防止
偷税、漏税是政府税收部门的一项重要工作。

税务部门运用了一个防止逃税的策略：设立“发票刮奖”
活动。众所周知，企业，向消费者提供发票是企业的义务，
消费者索要发票是消费者的权力。但某些企业为了少缴税，
借各种理由不给顾客发票。许多时候，消费者索要发票的意
义（利益）不是很大，而不再要求企业提供发票。这样一来，
企业便没有向税务部门交纳它应缴纳的税。

政府监督饭店、宾馆等企业逃税的难度较大。谁来监督
更有效率？当然是顾客。有何办法才能使顾客主动成为企业
缴纳税收的监督者？“发票刮奖”制度的设立便是一个有效的
方法。政府通过宣传，告知消费者，企业不给发票是违法行
为。对于消费者来说，他索要发票是不费成本的，但存在
“可能收益”或“期望收益”：如果他幸运，他可能刮到大奖。
而对于政府来说，通过设立一些奖项将使全社会主动来监督

企业，其收益远远大于成本。政府的这个策略是成功的。消
费者在这个博弈中没有损失，只有所得；政府是最大的受益
者，通过这样的机制，税收增加了；在这个博弈中，企业只
是做了它应当做的事缴税。

在“囚徒困境”中，我们已经了解这样一个道理：如果
你总是想赢对方，结果可能得不偿失。因为对方也会全力反
击，造成“两败俱伤”的局面。
而且，敌对一旦形成，双方都难以全身而退。这个时候，
即使双方都没有继续对抗下去的意愿，可还是只能咬牙坚持。
这真是对人类理性的一大嘲弄。
即使是“一报还一报”这种有效破解“囚徒困境”的理想
策略，也难免陷入“两败俱伤”的危险。当“一报还一报”策
略纠缠在一起时，将陷入“循环报复”的局面，难以脱身。
由于“一报还一报”的核心就是对任何行为都要给予及
时有效的回报，当遭遇他人侵犯时一定会以牙还牙；当然，
这种策略的前提是“不主动侵犯他人”，这大大降低了它们相
互伤害的机会。但是，这种前提是理论性的。
在陷入“囚徒困境”中应如何表现，下面是三个简单的
建议：
不要嫉妒

人们习惯于考虑零和对局，在这种情况下，一个人赢，
另一个就输。一个很好的例子就是下棋比赛。为了能赢，一
个参赛者必须在大部分时间里比对手做得更好。

然而生活中的大多数情况都是非零和的。双方可以都做
得很好，也可以都做得很差。双方的合作是可能的，但并不
是总能实现。这就是为什么“囚徒困境”是各种各样的日常
情形的有用模型。

人们倾向于采用相对的标准，这个标准经常把对方的成
功与自己的成功对立起来。这种标准导致了嫉妒，嫉妒导致
企图抵消对方已经得到的优势。在“囚徒困境”的形式下，
抵消对方优势只能通过背叛来实现。但是背叛会导致更多的
背叛和对双方的惩罚。因此嫉妒是自我毁灭。

要求自己比对方做得好不是一个很好的标准，除非你的目
的是消灭对方。在大多数情况下，这个目的是不可能实现的。

因此在一个非零和的世界里，你没有必要非得比对方做
得更好。特别当你要和许多不同的对手打交道时更是这样。
只要你自己能做得好就没有理由去嫉妒对方的成功。因为在
长时间的“重复囚徒困境”中，其他人的成功是你自己成功
的前提。

在生意场中也是这样，一个从供应商那儿买来商品的公
司，妒忌供方的利润是完全没有意义的。任何通过不合作行
为（如不按时付账）来减少这种利润的企图，都将激起供方
的报复行动。报复行为可以采用多种惩罚形式，诸如拖延发

货、较低的质量保证、不愿意打折扣，或者不交换市场条件
变化的信息。这种报复使得嫉妒代价很大。因此对于买者来
说担心卖方的相对利润毫无意义，而可以考虑是否有其他更
好的购买策略。
不要首先背叛
只要对方合作你也合作就会有好处。当然，你可以尝试
更保险的方式，即先背叛直到对方合作，才开始合作。然而，
这实际上是一个很有风险的策略，因为你的最初的背叛就可
能引起对方的报复，并使你处于要么被占便宜要么双方背叛
的两难境地。如果你惩罚对方的报复，这种反应就会一直延
续下去。如果你宽恕了对方，你就得冒被欺负的风险。即使
你能避免这些长远问题，对你的最初背叛的当下报复会使你
希望自己从一开始就应该是善良的。

不要耍小聪明
在“囚徒困境”的情况下人们容易耍小聪明，然而复杂
的策略并不比简单的规则做得更好。事实上，这些策略的共
同问题是，使用一些复杂的方法来推断对方，而这些推断常
常是错误的。一部分问题是对方经常用试探性的背叛来表明
它不会被引诱而合作，但是问题的关键是这些策略没有考虑
到自身的行为会引起对方的变化。对方对你的行为是有反应
的，对方将把你的行为看作你是否回报合作的信号。因此，
你自己的行为将会反射到你的身上。

试图使得分最大化的策略把对方看作环境的一个不变的

部分而忽略了相互的作用，不管他们在有限的假设下所做的
计算是多么的聪明。如果你离开双方相互适应的简单原则，
那么你的聪明是不会有好结果的。

另一个过分聪明的方式是使用“永久报复”的策略，这
个策略只要对方合作它就合作，但是一旦对方背叛一次，自
己就决不合作。由于这个策略的出发点是善良的，在与其他
善良的策略相遇时，将会获得很好的结局。并且与那些完全
随机的策略相遇时也不错。但在与那些偶尔背叛但准备一旦
受惩罚就撤回的策略相比，它太快放弃了合作。“永久报复”
看起来似乎很聪明，因为它为避免背叛提供了最大的激励，
但是它为了自己的利益显得太严厉了。

当然，在许多人类事务中，一个使用复杂策略的人可以
向对方解释每一个选择的理由。然而，问题出现了：对方可
能怀疑所提供的这些理由，在这个情况下对方将认为不值得
有任何反应，对方会把一个显得不可预测的策略看作不可改
造的，结果自然是导致背叛。

另外，在零和对策（如下棋）和非零和对策（如“重复
囚徒困境”）之间有一个重要的不同。在下棋时，让你的对手
猜疑你的企图是很有用的，你的对手越是怀疑，他（或她）
的策略就越没效果。但是在非零和情况下，如此聪明不是总
有好处的。在“重复囚徒困境”中，你将从对方的合作中得
到好处。诀窍在于鼓励合作，一个好的方式就是清楚地表明
你愿意回报，这就是“一报还一报”如此有效的原因。

纳什均衡：
谁都不能改变策略

年度的诺贝尔经济学奖，授予三位对博弈论做出奠
基性贡献的学者，他们是美国普林斯顿大学数学系的纳什
教授、美国伯克利加州大学商学院的哈萨尼

教授和德国波恩大学经济学系的泽尔滕

教授。这是博弈论成为现代经济学重要内
容的一个标志。
世纪

年代初，普林斯顿大学数学系在塔
克教授的指导下，成立了一个致力于数理经济学和博弈论的
博士生小组，后来大名鼎鼎的纳什和库恩就是这个小组的学
生。现在凡博弈论著作都必须先讲的囚徒困境，就出于塔克
教授在斯坦福大学的一次讲演，他的学生纳什则从囚徒困境
发展出在博弈论中占据核心位置的“纳什均衡”。
说到纳什均衡，我们有必要讲讲纳什的传奇经历。
纳什能够在

年代末
多年以后获得诺贝尔经济学奖，主要归功
月
日
年

于他的博士学位论文的研究工作。他在

岁生日那天获得数学哲学博士学位。

纳什的妻子阿丽莎，原来是他在麻省理工学院教微积分
时的物理系学生，来自萨尔瓦多。

年当纳什到普林斯顿
高等研究院访问的时候，他们结了婚。一年后当他们回到麻
省理工学院时，纳什得到了终身职位，阿丽莎怀上了他们的
孩子。也是在这个时候，美国著名的《财富》杂志把纳什评
为美国最耀眼的科学新星。生活那么美好，那么甜蜜，却不
料在他接近

岁、学术生涯向巅峰攀升的大好年华，病魔袭
击了纳什。从
年开始，偏执型精神分裂症使他几乎成为
一个废人。上课时候，他会语无伦次，甚至做出很不像样的
举动。讲演会上，他会说一些不连贯的、毫无意义的内容。
因为实在无法继续工作，纳什辞去了在麻省理工学院的教职。
纳什完全被病魔所控制，他热衷于给政治人物写一些奇
的信，在欧洲游游荡荡差点被法国警察抓到精神病院。留
在国内的妻子以及他的同事开始收到一些奇怪的明信片，充
斥着莫名其妙的数字。他怀疑自己被跟踪、被刺杀，甚至一
度要求放弃美国公民的身份。

后来，纳什夫妇分居了，最终正式离婚。纳什回到西弗
吉尼亚州，和母亲住在一起。往后的

多年，纳什的时间是
在故乡西弗吉尼亚、精神病医院和普林斯顿度过的，后来主
要在普林斯顿。离婚以后，好心的阿丽莎还是让纳什像在普
林斯顿的时候那样和她住在一起。她再也没有结婚，依靠自
己作为电脑程序员的微薄收入和亲友的接济，照料纳什和他
们的儿子

纳什变成普林斯顿大学数学系和物理学系所在的范氏大
楼的幽灵。纳什的存在，成为普林斯顿“脑体问题”的话题。

阿丽莎坚持认为纳什应该住在普林斯顿，这是很有道理
的。纳什的妹妹马莎十分欣赏嫂子的这个意见，她说得更明
白：在别的地方如果你行为古怪，会被当做疯子，可是在普
林斯顿这个有许多人获得过诺贝尔奖的地方，如果你行为古
怪，人们会想，你可能是一个天才。毕竟，这里不仅有树林
中的爱因斯坦小道，而且人们都知道爱因斯坦为邻居小女孩
做算术题换取糖果的轶事。

纳什得病给他的普林斯顿校友很大的打击。当时，在论
著中引用纳什论著最多的博弈论专家夏皮利说，纳什得病使
大家都非常沮丧，你根本无法跟他谈话，更谈不上了解他的
思想。

回到普林斯顿以后，朋友们一再力图帮助纳什哪怕是象
征性地参加什么研究项目，但是都未能成功。夏皮利曾经为
纳什争取到一笔现金奖励，这是唯一成功的例子。后来，同
事们做出安排，使他能够使用大学的计算机，希望神奇的电
脑能够唤醒他超人的才智。普林斯顿的人们充满了爱心，但
是却越来越相信曾经做出过如此深刻的科学发现的纳什，恐
怕再也逃不出常常要被送进精神病院的命运。

想不到，医生、亲人和普林斯顿人们的爱心，终于浇育

出绚丽的花朵。大约在

年代，纳什的病情开始有
了转机。他逐渐可以与人交谈，有时候还可以讨论一点儿问
世纪

题。特别是，他终于能够使用在他被精神分裂症折磨的

年
里不断更新换代的计算机。
差不多就在这个时候，纳什成为经济学诺贝尔奖候选人，
但是最终没能获奖。当时间走近

年的时候，博弈论获奖
的形势更加有利，是瓜熟蒂落的时候了。

年没有把诺贝
尔经济学奖授予纳什，与其说因为对他的贡献的认识尚不足，
不如说人们对他当时的心智状态仍存疑虑，归根结底，纳什
因精神病而不能工作是众所周知的事实。获奖者总要到斯德
哥尔摩来，面对国王和王后向瑞典皇家科学院发表一篇通俗、
深刻、得体的答辞。纳什做得到吗？此外，虽然并没有规定
说不具有职位或已退休的人就不能获奖，但其实总还是有个
什么头衔比较说得过去。恰恰在这许多年里，纳什什么也没
有。

在这个关口，纳什读博士研究生时的同学、普林斯顿大
学数学系和经济学系著名的数理经济学家库恩教授发挥了特
殊的作用。库恩向诺贝尔委员会申明，如果因为健康状况就
剥夺纳什当之无愧的诺贝尔奖，那“实在需要过分的勇气”。
当库恩等人的坚持有了初步的然而明确的正面回应时，又是
根据库恩的建议，普林斯顿大学数学系给了纳什一个“访问
研究合作者”的身份。

在

年宣布诺贝尔经济学奖之前的几个星期，库恩
和纳什一起去医院看望他们的导师。这时，塔克教授已届
岁高龄。当告别离开的时候，库恩独自又转了回来，告诉老

师一个惊人的消息：纳什将获得诺贝尔奖，虽然他本人还未
知晓。塔克当然非常高兴。库恩之所以先知，是因为在

月
初，瑞典方面就要求库恩协助准备一份纳什的履历并提供若
干供选用的照片。
瑞典皇家科学院的公告宣布以后，普林斯顿大学举行了
新闻发布会，庆贺大学又多了一顶诺贝尔奖桂冠。校园里流
传着纳什向先前的桂冠学者请教如何组织答谢演讲的添油加
醋的故事，数学系更为有了第三次获得诺贝尔奖的纪录而兴
奋，因为数学最高奖菲尔茨奖他们固然得了许多，能够获得
不授予数学的诺贝尔奖，仍具有特殊的意义。

纳什的故事还被好莱坞搬上了银幕丽心灵》，并
且获得许多电影奖项，感兴趣的读者可以看看这部感动心灵
的好莱坞经典电影，通过电影可以对纳什有更感性的了解。

纳什均衡是博弈论中一个重量级的概念，它主要描述双
方博弈的这样一种对局形势：任何一方单独改变策略，都不
会得到好处。所以，也可以说纳什均衡状态是市场力量相互
作用的稳定结局。

为了进一步说明纳什均衡的意义，让我们看一个杂货铺
定位博弈的例子。

设想有一个小居民点，居民住宅沿着一条公路均匀地排
开。现在设想有两家杂货铺要在这个小居民点开张，他们卖
一样的东西，价格也完全一样。

现在，因为商品一样，价格也一样，居民到哪个杂货铺
买东西，就看哪个杂货铺离自己比较近。反正东西、价格都
一样，何必舍近求远呢？如果每个杂货铺都希望靠自己比较
近的居民多一些，他们设在什么地方好呢？

从下图所示也许你马上会说，把这条路从

到
分四等
分，杂货铺

设在
的位置，不就解决了吗？的确，这是一种很好的配置。按照
的位置，杂货铺

设在图所示

杂货店位

这种配置，每个杂货铺的“势力范围”都是
可是，如果杂货铺只以自己赢利为目的，是不会安于这
样的位置的。道理是：如果

向右移动一点儿到达
的位
置，那么
的地盘就扩张到
和
的中点，
的地盘就会
比
的地盘大。所以，原来位于左边的杂货铺，有向右边
移动来扩大自己地盘的激励。在杂货铺定位的博弈中，地盘
就是市场份额，地盘就是经济利益。同样，原来位于右边的
杂货铺
，也有向左边移动以扩大自己地盘的激励。可见，
原来
在
处、

在

处的配置，不是稳定的配置。

扩张后的杂货店位置

那么，哪些位置才是稳定的位置呢？在两个杂货铺定位的
市场竞争博弈中，位于左边的要向右靠，位于右边的要向左
挤，最后的结局是两家杂货铺紧挨着位于中点

的位置。
这是纳什均衡的位置。因为在这个位置，谁要是单独移开“一
点”，就会丧失“半点”市场份额，所以谁都不想偏离中点的
位置。这时候，每个杂货铺的“势力范围”仍然还是原来的

，每个杂货铺的势力范围仍然还是原来的势力范围。

纳什均衡位置

上面这样推论“只有两家杂货铺都紧挨着在中点开张”
才是稳定的“纳什均衡”结局，前提是每家杂货铺都是只关
心自己眼前商业利

益的“理性人”假
在一策略组合中，所有的参与者面
临这样的一种情况：当其他人不改变策

设。在这种情况

略时，他此时的策略是最好的。也就是

“理性人”

下，的特
说，此时如果他单独改变策略，他的收
征就是
“唯利是
益将会降低。在纳什均衡点上，每一个
图”。既然唯利是理性的参与者都不会有单独改变策略的

图，就要千方百计冲动。
挤占对方的地盘，
最终造成两家“剑拔弩张”挤在中点的结局。现在我们一些
管理不好的摊贩市场就是这样，摊贩都要往好地方挤，谁也
不肯礼让。如果上面讲的杂货铺注意树立亲民形象，不希望
居民认为他唯利是图，那么设在

和

的位置是有道
理的。但是遇上对方进逼，就难免吃亏。所以，只要承认
“理性人”假设，则两家挤在中点就是唯一稳定的策略选择和
唯一的纳什均衡。

根据我们上面的推理，假设要在一个城市一条长路上开
设一家超级市场，这家超级市场开设在这条长路中间的位置

最好，因为这样可以从总体上使顾客节省走路的时间，离商
店最远的顾客距离商店只有路程的一半。
但是如果相互竞争的两家公司

和
都想在这个“道路
城市”开设超级市场，它们会怎样选址呢？前面我们说过，
着眼于总体上节省顾客走路的时间，最理想的方案是两家超
级市场分别开设在道路
和

的地方。这样，离商店
最远的顾客距离商店只有路程的

。如果开设在

和
这两个地方，合理性就差一些，因为离商店最远的顾
客，距离商店有路程的

但是建筑项目是要报批的，两家企业都向规划部门呈报
自己的方案，规划部门要考虑到城市的整体规划，如是否阻
挡视野和采光、改变大气的流动、阻滞公共交通、反射或聚
集过多的阳光从而加剧热岛效应、破坏城市的风景线、亵渎
城市的人文景观等。

规划部门把两家企业的代表请来，作为建议，提出规划
部门心目中最佳的

的方案，供企业考虑。总部
在城市西边的

和

公司，自然倾向于离总部比较近的
的位
置，同样，总部在城市东边的

的位置。
虽然在规划部门建议的位置

公司则倾向于
之中，两家企业
心目中各有所属，但是它们并不满足。

和

公司提出，
那
个位置正好是道路瓶颈的地方，它希望往东移动一些。

公司
提出，
那个位置不宜大兴土木，它希望可以往西移动。

规划部门的官员听它们这样说，觉得颇有道理，的确不

宜选址在正好

和

这两个地方。可是他知道长路当
中从

到

这一段，即将兴建新的剧院和公共图书馆，
遂建议两个公司考虑是否不向中间移动，而是向两端移动。
未料两个公司全都反对。公司说，要是西移，不如维
持规划局原来建议的在道路

的位置，什么瓶颈不瓶颈，
管不了这许多了。同样，公司也表示，东移不能考虑，不
许西移就维持在

那个位置，施工困难也就抛诸脑后。

这不行那不行，又讨论了几种方案还是未能达成一致。
在这种方案、那种方案的探讨之中，规划局的官员悟出了一
条规律：凡是建议超级市场选址向长路的两端移动的，企业
都会找各种理由反对；而企业自己提出的方案，总是想把超
级市场的位置往中间移动。

原来，企业为超级市场选址的时候，是否有利于争取顾
客是重要的考虑因素。尽管超级市场首先应在商品的品种、
质量、价格，以及销售和售后服务方面竞争，但是如何选址
也很要紧。不是说天时地利人和吗？如果多数居民距离超级
市场

比较近而距离超级市场
比较远，企业
就会在竞争
中占据“地利”的优势。正是出于这种考虑，促使两家公司
都想把他们的超级市场往中间挤。
的确，这些规律性的行为，背后往往有我们在上面讲过
的博弈学道理。

上面的杂货铺定位的案例也许有些深奥和复杂，现在我
们来讲述现实生活中一个简单的情侣博弈的例子，通过这个
生活化的例子可以更直白浅显地把纳什均衡讲清楚。

大海和丽娟正在热恋。难得的周末又到了，安排什么节
目好呢？周末晚上，中国足球队要在世界杯外围赛中和伊朗
队做生死之战。大海是个超级球迷，国内的甲级联赛都不肯
放过，何况这是国家队的生死大战？

也正好是这个周末的晚上，俄罗斯一个著名芭蕾舞团莅
临该市演出芭蕾舞剧《胡桃夹子》。丽娟最崇尚钢琴、芭蕾这
样的高雅艺术，对斯拉夫民族的歌唱和芭蕾更是崇拜得五体

投地，她怎么肯放过正宗俄罗斯的芭蕾舞剧

桃夹子》？这

么说，一个在家里看电视直播的足球赛，一个去剧院看芭蕾
舞演出不就得了？问题在于他们是热恋中的情侣，分开各自
度过难得的周末时光，是两人最不情愿的事情。这样一来，
他们就面临一场温情笼罩下的“博弈”。

在情侣博弈中，双方都没有严格优势策略和严格劣势策

略。我们不妨这样给大海和丽娟的“满意程度”赋值：

如果大海在家看球而丽娟一个人去看芭蕾，双方的满意
程度都为

两人一起去看足球，大海的满意程度为

，丽娟的满意
程度为

两人一起去看芭蕾，大海的满意程度为

，丽娟的满意
程度为
应该不会有丽娟独自看球而大海独自去看芭蕾的可能，
不过人们还是把它写出来，设想此时双方的满意程度都是
现在，芭蕾不是大海的劣势策略，因为如果丽娟坚持
芭蕾，他选足球只得

，选芭蕾却还可得
。足球当然更不
是大海的劣势策略。所以，大海没有严格的劣势策略。同
样，丽娟也没有严格的劣势策略。这样，严格劣势策略消
去法就没有用武之地了。
但是，他们总会做出一个较好的选择，因为他们是热恋
中的情侣。

在情侣博弈中，双方都去看足球或者双方都去看芭蕾，
就是我们所说的相对优势策略的组合：一旦处于这样的位置，
双方都不想单独改变策略，因为单独改变没有好处。

准确地说，是单独改变不会带来额外的好处。比如说两
人一起看足球，大海得

如果大海单独改变去看
足球，变成双方都得
丽娟得
，没有好处；如果丽娟单独改变去看
芭蕾，也变成双方都得
，也没有好处。所以，两人一起去

看足球是稳定的结局。同样，两人一起去看芭蕾也是稳定的
结局。

因此，纳什均衡可以简单地做如下定义，在一策略组合
中，所有的参与者面临这样的一种情况：当其他人不改变策
略时，他此时的策略是最好的。也就是说，此时如果他单独
改变策略，他的收益将会降低。在纳什均衡点上，每一个理
性的参与者都不会有单独改变策略的冲动。

在囚徒困境中存在唯一的纳什均衡点，即两个囚犯均选
择“招认
”，这是唯一稳定的结果。

需要强调的是：均衡不一定是博弈的最优结果。在“囚
徒困境”中，唯一的均衡是一起招认，站在群体的角度，这
是最坏的结果。均衡只是博弈的最“稳定”结果，或者说是
最可能出现的结果。那么，这就需要我们思考一个问题：如
果这个“稳定”结果效果不佳，我们能否找到合理的策略打
破这个“均衡
”？

在博弈中纳什均衡点如果有两个或两个以上，结果就难
以预料。这对每个博弈方都是麻烦事，因为后果难料，行动
也往往进退两难。

生活中的简单案例能说明深刻的道理。在我们普通的生
活中大量充斥着充满博弈思维的事情，当遇到存在两个或两
个以上纳什均衡点的博弈局势时，如果你是个有心人的话，
懂得运用博弈思维去分析的话，局面对于你就不会是进退两
难了。

假如你正在和女友通话，电话断了，而话还没说完。这
时有两个选择，马上打给对方，或等待对方打来。注意：如
果你打过去，她就应该等在电话旁，好把自家电话的线路空
出来，如果她也在打给你，你们只能听到忙音；另一方面，
假如你等待对方打电话，而她也在等待，那么你们的聊天就
没有机会继续下去。

一方的最佳策略取决于另一方会采取什么行动。这里又
有两个均衡：一个是你打电话而她等在一边，另一个则是恰

好相反。

一个解决方案是，原来打电话的一方再次负责打电话，而
原来接电话的一方则继续等待电话铃响。这么做的好处是原来
打电话的一方知道另一方的电话号码，反过来却未必是这样。

另一种可能性是，假如一方可以免费打电话，而另一方
不可以，那么，解决方案是拥有免费电话的一方应该负责第
二次打电话。还有一种比较通常的解决方法是，由较热切的
一方来打电话，如一个煲电话粥成瘾的家庭主妇对谈话的热
情很高，而她的同伴就未必这样，这种情况下通常是她打过
去。再如恋爱中的男女遇到这种情况，通常也是由主动追求
者打电话。

假如不考虑以上因素，那么打这个电话又得用到这种
“混合策略”了：设想双方都投硬币决定自己是不是应该给对
方打电话，根据前面给出的条件，两人这种随机行动的组合
成为第三个均衡。

假如我打算给你打电话，我有一半机会可以打通（你恰
巧在等我打电话），还有一半机会发现电话占线；假如我等你
打电话，那么，我同样会有一半机会接到你的电话，因为你
有一半机会主动给我打电话。

每一个回合双方完全不知道对方将会采取什么行动，他
们的做法实际上对彼此都最理想。因为我们只有一半机会重
新开始被打断的电话聊天，我们知道我们（平均来说）要尝
试两次才能成功接通。

下面，我们用这个趣味性十足的“斗鸡博弈”来进一步
揭示纳什均衡中的纳什均衡点。
试想有两只公鸡遇到一起，每只公鸡有两个行动选择：一
是退下来；一是进攻。如果一方退下来，而对方没有退下来，
对方获得胜利，这只公鸡则很丢面子；如果对方也退下来双方
则打个平手；如果自己没退下来，而对方退下来，自己则胜利，
对方则失败；如果两只公鸡都前进，那么则两败俱伤。因此，
对每只公鸡来说，最好的结果是，对方退下来，而自己不退。
两者如果均选择“前进
”，结果是两败俱伤，两者均获得
的收益；如果一方“前进
”，另外一方“后退
”，前进的公鸡获得
的收益，赢得了面子，而后退的公鸡获收益为

，输掉了面
子，但没有两者均“前进
”受到的损失大；两者均“后退
”，两
者均输掉了面子获得
的收益。当然这些数字只是相对的值。
这个博弈有两个纳什均衡：一方前进，另一方后退。但
关键是谁进、谁退？一个博弈，如果有唯一的纳什均衡点，
那么这个博弈是可预测的，即这个纳什均衡点就是事先知道

的唯一的博弈结果。但是如果一个博弈中有两个或两个以上
的纳什均衡点，则无法预测出一个结果来。因此，我们无法
预测斗鸡博弈的结果，即不能知道谁进谁退，谁输谁赢。

从斗鸡博弈中我们可以看出，纳什均衡的意义在于，它是
关于博弈结局的一致性预测，如果所有局中人预测一个特定的
纳什均衡会出现，那么这种均衡就会出现，预测之间没有矛
盾，不会因为有的局中人认为不符合自己的利益要求而失败。

只有纳什均衡才能使每个局中人均认可这种结局，而且
他们均知道其他局中人也认可这种结局。而非纳什均衡的结
局并非一致性预测，如果局中人预测会出现非纳什均衡，那
么或者是局中人的预测相互不统一，或者是局中人在估计别
人的策略选择或极大化自己的收益预期时犯了错误。

纳什均衡最重要的性质是“自我强制性”

，如果局中人就纳什均衡结局达成协议，那么不需要任

何外力的帮助，它自身就蕴含着保障实现的力量。任何非纳
什均衡的结局要成为协定都需要外在强制力量（道德、法律
等）的帮助，否则有的局中人将会有动机背叛协定。

纳什均衡的弱点在于，它并不能保证唯一性，存在多个
纳什均衡时哪一个会在现实中出现是一个难以解决的问题。
另外，引入其他理性考虑后，有些纳什均衡并不那么合理。

在纳什均衡定义的基础上，可以进一步定义强纳什均衡，
强纳什均衡是指每个局中人对于对手的策略有唯一的最佳反
应，即为严格纳什均衡，

原则上，强纳什均衡是一个更具有说服力的均衡概念，它
具有稳定性，即使收益中出现微小的扰动，强纳什均衡仍保持不
变。而且由于局中人改变策略会使其利益受损，所以局中人有维
持均衡策略的动力。而纳什均衡中可能有的局中人会认为均衡策
略与其他策略之间是无差异的，所以并不能保证局中人一定会选
择均衡策略。强纳什均衡的弱点是，即使在混合策略意义下也不
能保证其存在性，相当多的博弈局势中没有强纳什均衡。

下面我们再用现实中的一个案例来说明。

古巴导弹危机时，面对美国的反应，前苏联面临着是将
导弹撤回国还是坚持部署在古巴的选择。而对于美国，则面
临着是挑起战争还是容忍前苏联的挑衅行为的选择？也就是
说，这两只大公鸡均在考虑采取进的策略还是退的策略？

战争的结果当然是两败俱伤，而任何一方退下来（而对
方不退）则是不光彩的事。结果是前苏联将导弹从古巴撤了
下来，做了丢面子的“撤退的鸡”。美国坚持了自己的策略，
做了“不退的鸡”。当然，为了给前苏联一点面子，同时也担
心前苏联坚持不退而发生美苏战争这是美国不愿意看到
的，美国象征性地从土耳其撤离了一些导弹。古巴导弹危机
是冷战期间美苏两霸之间发生的最严重的一次危机。

这就是美国与前苏联在古巴导弹上的博弈结果。对于前
苏联来说，退下来的结果是丢了面子，但总比战争要好；对
美国而言，既保全了面子，又没有发生战争。这就是这两只
“大公鸡”博弈的结果。

下面这个案例虽然是在讲“消去普通劣势策略”，但同时
会更清晰地说明普通纳什均衡和严格纳什均衡的差别。

这是一场老张为“豪宅”圆穹形天花板的修造与装修公
司讨价还价的博弈。老张设计了尺寸，到石膏造型装修公司
订做，装修公司说这个尺寸没有做过，需要重新做模子，因
此要价

元，这样他可以赚

元。老张嫌贵，要求
装修公司把装修存根拿给他看，装修公司最后同意了。老张
从中找出尺寸最接近的一个说，就按这个尺寸做。结果，装
修公司不能以重做模子作砝码，最终以

元的价格成交，
只赚了

元。

现在，两个局中人是老张和装修公司。老张的博弈策略
有两个，要求看存根和不要求看存根。装修公司的博弈策略
也有两个，一个是给看，一个是不给看。

看来，“不说白不说”，不要求看装修存根是老张的劣势策
略。装修公司呢？如果老张不要求看存根，无论装修公司是
否预备给他看，结果都是老张没有看存根，装修公司都可以

元，老张省了

赚

元，但是如果老张“来者不善”要求看存根，那么
着眼于这一次的交易机会，装修公司给他看存根可以赚
元，不给他看就会什么也赚不到，所以“只要老张要求，就
给他看存根”应该是优势策略，不给看应该是劣势策略。那
么，形式上运用前面讲过的劣势策略消去法，可以得到这个
博弈的一个均衡：老张要求看存根，装修公司给老张看存根，
结果老张省了

元，装修公司赚了

元。
装修公司赚了

元，虽然没有赚

元，但毕竟比
没钱赚好；老张则因为有博弈论思想，节省了

元，把事
情做得几乎一样好。

前面讲过的囚徒困境，是数据对称的博弈，即如果把甲
乙的位置对调，双方的支付数字都没有变化。这个博弈讲的
是不对称的博弈，即双方的得失数目不对称。现在，如果把
老张和装修公司的位置对调，支付矩阵就要有改变，所以是
不对称博弈。

需要说明的是，这里说的劣势策略，不是指被全面的严
格的优势策略压住的严格劣势策略。全面的严格的优势策略
要求：不论对方采取什么策略，我采取这个策略总比采取任
何别的策略都好，而且要确实显出其优势来。可是在“老张
博弈”中没有这样的严格优势策略。“要求看”不是全面的严
格的优势策略要求，因为如果对方采用“横竖不给看”策略，
老张采用“要求看”策略的博弈结局并不比采用“不要求看”
策略的博弈结局好。所以，“不要求看”不是前面讲的被全面

的和严格的优势策略压住的严格劣势策略。同样，对于装修

公司来说，“不给看”也不是前面所讲的被全面的和严格的优

势策略压住的严格劣势策略。

必须指出，这个博弈其实有两个纳什均衡。一个是：老

张不要求看存根，装修公司不给看存根。请注意，要是已经

处于这样的对局形势，那么如果老张单独改变策略变成“要

求看”，装修公司没改变策略仍然“不给看”，结果老张之所

得仍然是

，没有得到额外的好处，所以老张没有单独改变
策略的激励；如果装修公司单独改变策略变成“给看”，老张
并没有改变策略仍然不要求看，那么装修公司之所得仍然是
，也不会得到什么额外的好处，所以装修公司也没有单

独改变策略的激励。

在上面这一段的分析中，读者想必对于“单独改变不会

得到额外的好处”中“额外”二字和“没有单独改变策略的

激励”中“单独”二字的分量，有了新的体会。

无论站在老张方面还是站在装修公司方面，都没有一个

策略全面地严格地劣于另一个策略。站在老张方面，虽然

“不要求看”存根比“要求看”劣，但不是全面的劣，因为如

果对方采用“不给看”策略，那么老张不要求看和要求看存

根的赢利都是

，比不出优劣来。站在装修公司方面，虽然
“不给看”存根比“给看”存根的策略劣，但同样不是全面的
劣，因为如果老张采取“不要求看”存根的策略，装修公司
“不给看
”和“给看
”的赢利都是

，同样比不出优劣来。

这个博弈中，双方策略的选择，我们把它叫做普通劣势
策略消去法：面对乙的所有策略来比较甲的两个策略，如果
甲的一个策略的赢利总是不超过另一个策略，而且确实有一
个乙的策略使甲的这个策略的赢利小于另一个策略，就把甲
的这个策略删去。

与此类似，纳什均衡也有严格纳什均衡和普通纳什均衡
之分。普通纳什均衡只是说在均衡状态单独改变策略没有好
处，不会得到好处。但是，没有好处也不一定有坏处，不会
得到好处也不一定会得到坏处。所以在老张博弈中，装修公
司不给看、老张也不要求看的这个纳什均衡，就是一个普通
纳什均衡。严格纳什均衡则是不仅单独改变没有好处，而且
谁单独改变策略谁就要倒霉的纳什均衡。在老张博弈中，另
一个纳什均衡，即老张要求看存根、装修公司也给看的这个
纳什均衡，就是一个严格纳什均衡，因为处于这个均衡时，
老张要是单独改变策略，得益将从

，装修公司要
是单独改变策略，其得益将从
降为

降为

普通劣势策略消去法的杀伤力比较大，它可能把普通纳
什均衡删掉。但如果是严格纳什均衡，杀伤力大的普通劣势
策略消去法对它也会手下留情。你只要知道严格劣势策略消
去法和普通劣势策略消去法的区别，知道严格纳什均衡和普
通纳什均衡的区别，就很容易想清楚这个关系。

这里要解释一下何谓帕累托效率和帕累托优势。帕累托
是意大利经济学家，帕累托效率准则的含义是：经济的效率
体现于配置社会资源以改善人们的境况，主要看资源是否已
经被充分利用。如果资源已经被充分利用，要想再改善我就
必须损害你或别的什么人，一句话，要想再改善任何人都必
须损害别的人，这时候就说一个经济已经实现了帕累托效率。
相反，如果还可以在不损害别人的情况下改善任何人，就认
为经济资源尚未充分利用，就不能说已经达到帕累托效率。

设想在古代的一个村庄有两个猎人。为了简化问题，假
设主要的猎物只有两种：鹿和兔子。在古代，人类的狩猎手
段比较落后，弓箭的威力也有限。在这样的条件下，我们可
以假设，两个猎人一起去猎鹿，才能猎获

只鹿。如果一个
猎人单兵作战，他只能打到
只兔子。从填饱肚子的角度来
说，
只鹿却差不多能够解决
天的问题。这样，两个人的行为决策就可以写成以下的博弈
形式：要么分别打兔子，每人得
天，而

只兔子可以维持

要么合作，每人得

（平分鹿之后的所得）。

两个纳什均衡，就是两个可能的结局。那么，究竟哪一

个会发生呢？是一起去猎鹿还是各自去打兔子呢？这就和情

侣博弈一样，不能完全由纳什均衡本身来确定。

和（

比较（

两个纳什均衡，明显的事实

是，两人一起去猎鹿的赢利比各自去打兔子的赢利要大得多。
按照长期合作研究的两位博弈论大师美国的哈萨尼教授和德
国的泽尔腾教授的说法，甲乙一起去猎鹿得（

的纳
什均衡，比两人各自去打兔子得（
，

的纳什均衡，具有
帕累托优势。猎人博弈的结局，最大可能是具有帕累托优势
的那个纳什均衡：甲乙一起去猎鹿得（

）。
比起（
，

）来，）不仅是总额的改善，而且每

个人的收益都得到很大改善。这就是

对于

具有帕累托优势的意思。
在“猎人博弈”中，两人合作猎鹿的收益（对

具有帕累托优势。这是因为如果比较原

于分别猎兔（

）我们说境况得到了帕累
托改善。帕累托改善是各方的境况都不受损害的改善。

可是上面的情况的前提是假设双方平均分配猎物，也就
是说，两个猎人的能力和贡献差不多，但是实际上并不一定
如此。

如果一个猎人能力强、贡献大，他就会要求得到较大的

来的境况

，现在的（

或（

，但

一份，这样分配的结果就可能是（

有一点是确定的，那就是能力较差的猎人的所得，至少要多
于他独自打猎的收益，否则他就没有合作的动机。如果合作

的结果是（

，相对于分别猎兔

就没有帕累托

优势，这是因为

比
小，乙受到损害。这样，我们就不能
说境况得到了帕累托改善。虽然
比
大得多，改善了很
多，
也比

比
大很多，改善了很多，但是

小，
乙没有改善反而恶化。所以站在乙的立场，

没有原来

的

那么好。如果合作的结果如此，那么，乙一定不愿

合作。可见，帕累托改善是一种各方都认同的改善，不是要
求任何一方作出牺牲的改善。

进入

世纪，人类经历了两次世界大战、经济的高速增
长、科技的进步、全球一体化以及日益严重的环境污染之后，
“零和”观念正逐渐被“双赢”所取代，人们认识到“利己”
不一定要建立在“损人”的基础上，通过有效合作，皆大欢喜
的结局是可能出现的。“你扒我的口袋，我扒你的口袋”远不如
“你搔我的背，我搔你的背”更可取。然而，在为人类“合作
时代”欢呼的同时，“零和游戏”
我们应注意到，在人类生活的
许多领域依然适用，而且，当它可能对我们自身有利时，我们
也乐于接受它。（股市就是一个很好的例子。人们投资股市，很
少是为了获得投资的回报，而是渴望在炒买炒卖中赚取差额，
这样，当一个人在股市上赚到钱时，意味着别人因此受了损
失。）而且，如何在合作中找到各方满意的方法，并不是一件
容易的事。我们距离真正的“合作时代”，还有很长的一段路。

择优去劣：
获得最佳行动策略

博弈论著作中有一个常见的例子“笼中猪”博弈，通
过“笼中猪”博弈案例我们可以对优势策略和劣势策略有更
清晰的了解。

笼子里面有两只猪，一只比较大，一只比较小。笼子很
长，一头有一个按钮，另一头是饲料的出口和食槽。按一下
按钮，将有相当于

份的猪食进槽，但是按按钮以后跑到食
槽所需要付出的“劳动”，加起来要消耗相当于
份的猪食。
问题是按钮和食槽分置笼子的两端，按按钮的猪付出劳动跑
到食槽的时候，坐享其成的另一头猪早已吃了不少。如果大
猪先到，大猪呼啦啦吃到
份，小猪只能吃到
份；如果同
时到达，大猪吃到
份，小猪吃到
份；如果小猪先到，小
猪可以吃到
份，而大猪吃到
份。
“笼中猪”博弈的具体情况如下：
如果两只猪同时按按钮，同时跑向食槽，大猪吃进
份，
得益
份；如果小猪等待，大猪
按按钮后跑向食槽，这时小猪抢先，吃进
份，实得

份，小猪吃进

份，

份，实得

份，付出
大猪吃进

份，得益
份；如果大猪等待，小猪
按按钮，大猪先吃，吃进
份，得益
份，小猪吃进
份，
但是付出了
份，实得
份；如果双方都懒得动，双方所
得都是
比较以上数字，我们知道“等待”是小猪的优势策略，
“按按钮”是小猪的劣势策略。先把小猪的劣势策略消去。现
在来看大猪。由于小猪有“等待”这个优势策略，大猪只剩
下了两个选择：等待一份不得；按按钮得到

份。所以“等
待”就变成了大猪的劣势策略（注意，是现在才变成劣势策
略）。把它也删去，就得到“笼中猪”博弈的结局：小猪只是
坐享其成地等待，每次都是大猪去按按钮，小猪先吃，大猪
再赶来吃。

假设美国有两大杂志：《时代》和《新闻周刊》，每个星
期，两大杂志都会暗自较劲，要做出最引人注目的封面故事。
一个富有戏剧性或者饶有趣味的封面，可以吸引站在报摊前

的潜在买主的目光。因此，每个星期，《时

的编辑们一

定会举行闭门会议，商讨并选择下一个封面故事。

回到代》对

闻周刊》的例子，假定本周有两个
大新闻：一是国会就预算问题吵得不可开交；二是发布了一
种据说对艾滋病有特效的新药。编辑们选择封面故事的时候，
首要考虑的是哪一条新闻更能吸引报摊前的买主（无论采用
哪一条新闻封面故事，订户都会买这本杂志）。在报摊前的买
主当中，假设

的人对预算问题感兴趣，

的人对艾滋
病新药感兴趣。这些人只会在自己感兴趣的新闻变成封面故
事的时候掏钱买杂志；假如两本杂志用了同一条新闻做封面

故事，那么感兴趣的买主就会平分两组，一组买

，另

一组买新闻周

现在，《时代》的编辑可以进行如下推理：

“假如《新闻周

刊》采用艾滋病新药做封面故事，那么，假如我们采用预算
问题，就会得到整个‘预算问题市场’（即全体读者的

；

假如我们采用艾滋病新药，我们两家就会平分‘艾滋病新药

市场’（即我得到全体读者的

，因此，艾滋病新药为我

们带来的收入就会超过预算问题。假如

闻周刊》采用预
算问题，那么，假如我们采用同样的故事，我们会得到
的读者，假如我们采用艾滋病新药，就会得到
的读者；
这一次，第二方案同样会为我们带来更大的收入。因此，我
们有一个优势策略，就是采用艾滋病新药做封面。无论我的
对手选择采用上述两个新闻当中的哪一个，这一策略都会比
我们的其他策略更胜一筹。”

在这个博弈里，双方都有一个优势策略。

以博弈论的观点来看，各方均有一个优势策略的博弈是
最简单的一种博弈。虽然其中存在策略互动，却有一个可以
预见的结局：全体参与者都会选择自己的优势策略，完全不
必理会其他人会怎么做。

在囚徒困境中，两个参与者都有一个优势策略，只不过
这个双方都认为是最好的策略最终将他们引向了一个倒霉的
结局。这就提出了一个很有意思的问题：参与者怎样合作才
能取得更好的结果？

不是所有博弈都有优势策略，哪怕这个博弈只有一个参
与者。实际上，优势与其说是一种规律，不如说是一种例外。
虽然出现一个优势策略可以大大简化行动的规则，但这些规

则却并不适用于大多数现实生活中的博弈。这时候我们必须
用到其他原理。

一个优势策略优于其他任何策略，同样，一个劣势策略
则劣于其他任何策略。假如你有一个优势策略，你可以选择
采用，并且知道你的对手若是有一个优势策略他也会照办；
同样，假如你有一个劣势策略，你应该避免采用，并且知道
你的对手若是有一个劣势策略他也会规避。

假如你只有两个策略可以选择，其中一个是劣势，那么
另一个一定是优势策略。因此，与选择优势策略做法完全不
同的规避劣势策略做法，必须建立在至少一方拥有至少三个
策略的博弈的基础之上。

在你没有优势策略的情况下，你要做的就是剔除所有劣
势策略，不予考虑。如此一步一步做下去。

假如在这么做的过程当中，在较小的博弈里出现了优势
策略，应该一步一步挑选出来。假如这个过程以一个独一无
二的结果告终，那就意味着你找到了参与者的行动指南以及
这个博弈的结果。即便这个过程不会以一个独一无二的结果
告终，它也会缩小整个博弈的规模，降低博弈的复杂程度。

利用优势策略方法与劣势策略方法进行简化之后，整个
博弈的复杂度已经降到最低限度，不能继续简化，而我们也
不得不面对循环推理的问题。你的最佳策略要以对手的最佳
策略为基础，反过来从你的对手的角度分析也是一样。接下
来我们将会介绍解开这个循环的技巧，最终走出这个循环。

看了上面的案例，也许你认为选择最优策略很简单，当
有一个优势策略时，选择这个策略就万事大吉了，可是当你
在做选择时，你的对手也在做选择，你的对手或许还会研究
你的行动方案，然后根据你的行动方案，选择或者调整自己
的行动方案。所以，选择行动方案并不是件简单的事情，你
要了解自己同时还要了解对手。

同样我们还是以《时代》和《新闻周刊》两个媒体的较
量来说明这个问题。

当每个星期《时代》的编辑们一定举行闭门会议论讨下
一个封面故事的问题时，他们很清楚此时《新闻周刊》的编
辑们也在开会，选择下一个封面故事。反过来，《新闻周刊》

的编辑们正在做同样的事情，而

的编辑们也知道

闻周刊》的编辑们知道这一点..这

的编辑们也知道

两家新闻杂志投入了一场策略博弈。
由于《时代》与《新闻周刊》的行动是同时进行的，双
方不得不在毫不知晓对手决定的情况下采取行动。等到彼此

发现对方做了什么，再想做什么改变就太迟了。当然，这个
星期的输家下个星期很可能竭力反扑，不过，等到那时，说
不定已经出现了一个完全不同的新的故事模式，开始了一场
完全不同的博弈。

要注意这种同时进行的博弈与相继（一先一后）行动的
博弈所要用到的策略思维和行动是完全不同的。对于像下棋
这样的一人一步的相继行动的博弈，每个参与者都必须向前
展望，估计对手的意图，从而倒后推理，决定自己这一轮应
该怎么走。这是一条线性的推理链：“假如我这么做，他就会
那么做若是那样，我会这么反击”，依此类推。也就是
说，你怎么走，完全取决于对手的上一步行动。

而在同时行动的博弈里，没有一个参与者可以在自己行
动之前得知另一个参与者的整个计划。在这种情况下，互动
推理不是通过观察对方的策略进行，而是必须通过看穿对手
的策略才能展开。要想做到这一点，单单假设自己处于对手
的位置会怎么做还不够。即便你那样做了，你只会发现，你
的对手也在做同样的事情，即他也在假设自己处于你的位置
会怎么做。因此，每一个人不得不同时担任两个角色，一个
是自己，一个是对手，从而找出双方的最佳行动方式。与一
条线性的推理链不同，这是一个循环“假如我认为他认为
我认为..”，诀窍在于怎样破解这个循环。

你怎样才能看穿所有那些错综复杂而又看不见的策略呢？
首先，你不要把其他参与者的未知行动视作像天气那样，具

有与个人无关的不确定性。上班之前，你可能收听天气预报，
知道今天是否下雨，你会利用这个信息去决定要不要带一把
雨伞去上班。当然，你带不带伞，丝毫不能影响天下不下雨。
但为封面故事而做决定的博弈则完全是另外一回事。

区别在于，时

的编辑对《新闻周

有一个非常明
确的了解另一个杂志的编辑与天气不同，他们是策略的
博弈参与者，就跟《时代》的编辑自己一样。即便一个编辑
不可能真的观察到另一个杂志的决定，他也可以通过另一个
杂志的视角思考这个问题，尝试确定它现在一定在做什么。

有时候，某参与者有一个优势策略，其他参与者则没有。
例如，我们还是以《时代》与《新闻周刊》的封面故事大战
做例子。

假设全体读者略偏向于选择《时代》。假如两个杂志选择
同样的新闻做封面故事，喜欢这个新闻的潜在买主当中有
的人选择《时代》

的人选择《新闻周刊》。
对于《时代》，艾滋病新药仍然是优势策略，但对于《新
闻周

，

就不再是了，因为《时代》的优势策略是选择艾滋
病新药这个主题，如果它也做同样选择，那么只能得到
的读者，小于选择预算问题的

闻周刊》的最佳选择不再与《时代》的策略
换言之，

选择艾滋病新药作为主题，《新闻周刊》
无关。假如《时

，预算
选择预算问题就能得到更好的销量，对于《新闻周

问题市场总比新药市场要大。

的编辑们将会选

《新闻周刊》的编辑们不会知道

择什么，不过他们可以分析出来。因为《时代》有一个优势

策略，那一定就是他们的选择。因此，《新闻周刊》的编辑们

可以很有把握地假定《时

已经选了艾滋病新药，并据此
选择自己的最佳策略，即选择预算问题作为主题。

由此可见，只有一方拥有优势策略的博弈其实也非常简
单。拥有优势策略的一方将采用其优势策略，另一方则针对
这个策略采用自己的最佳策略。

讲到这里，我有必要再次向你强化一下优势策略的概念
和优势策略的两点特征。

人们很容易就会弄错，不知道优势策略的优势究竟是对
什么而言的。“优势策略”的优势是指你的这个策略对你的其
他策略占有优势，而不是对你的对手的策略占有优势，无论
对手采用什么策略。

某个参与者如果采用优势策略，就能使自己获得比采用
任何其他策略更好的结果。回顾封面大战的例子，《时

和
《新闻周刊》都有一个优势策略，但并非一定可以得到比对方

更高的销量。

另一个常见的误解在于，一个优势策略必须满足一个条

件，即采用优势策略得到的最坏结果也要比采用另外一个策

略得到的最佳结果略胜一筹。在前面讲到的例子里，所有优

势策略凑巧都满足这个条件。按照最初设定的条件，《时代》

假如采用艾滋病新药做封面故事，最坏的结果是得到

的
市场份额；他们若采用预算问题做封面故事，可能得到的最
佳结果是

的市场份额。但这并非优势策略的一个普遍特

征。

现在让我们想像一下《时

和

闻周刊》之间爆发

了一场价格战。假设每本杂志的制作成本是

美元，且售价
只有两个可能的价位选择，分别是
美元（意味着每本利润
为
美元）和
美元（意味着每本利润为
美元）。假设顾客
永远倾向于选择价格较低的杂志，且在杂志价格相同的时候
两种杂志各得一半读者。杂志定价
美元的时候，读者总数
是
万人；杂志价格降到
美元，读者总数将升到
万
人。这时，你可以轻易算出《时

在四种可能出现的价格
组合里将会获得多少利润，即如果你们都是

美元，利润都
是
万人；一方降价至

美元，独得
万人，另一方分
文不得；如果双方都降，每一方利润都是

万人。
有点像“囚徒困境”是不是？的确，在囚徒困境中，双
方的优势策略都是招供，在这里都是降价。
《时代》的优势策略是定价

美元（《新闻周刊》亦如
此）。

采用这个优势策略可能得到的最坏结果是赢利

万美元。但是，采用另外一个策略可能得到的最佳结果
将超过这一数字，达到

万美元。问题是比较这两个数字
毫无意义。

美元
的时候出现的；不过，假如这时《时代》把价格降到
万美元的数字是在两本杂志同时定价

元，
利润还会更高，达到
万美元。
我们可以把这些例子归纳为一个指导同时行动的博弈的
法则。即：假如你有一个优势策略，请照办。不要担心你的

对手会怎么做。假如你没有一个优势策略，但你的对手有，
那么就当他会采用这个优势策略，相应选择你自己最好的做
法。

提醒一句：我们已经确立了同时行动的博弈的优势策略
的概念。若是换了相继行动的博弈，采用优势策略的时候就
要格外留神。因为策略互动的本质已经改变，优势策略的概
念也会完全不同。假设我们说你有一个优势策略，无论你的
对手选择怎么做，你按照这个策略做都比采用其他策略更好。
若是相继行动，而你的对手先行，你就应该一直选择自己的
优势策略。

正如我们已经说过的那样，这是你对你的对手每一个行
动的最佳对策，因此也是对现在他选择的这个特定行动的最
佳对策。但是，假如你先行，你就不会知道你的对手将会采
取什么行动。他会观察你的选择，同时作出自己的决定，因
此你有机会影响他的行动。某些情况下，若是采用优势策略
以外的策略，你可能更有效地施加这种影响。

在实际情况中，不容易“知彼”，但容易“知己”。但在
实际博弈中，我们不一定能够做到充分了解自己。

我们在决策时，首先要知己。

所谓“知己”，在这里主要是指要熟悉我们的目标是什
么，我们有哪些可以选择的可能策略

它们构成我们的策
略空间，在对方某种策略给定的情况下，我们各个策略下的
收益是多少，以及实现这些收益的可能性（即概率）有多大。

举一个拍卖的例子。

竞价者在拍卖之前均要对被拍物品做一个估价，并给出
自己的可能的叫价区间。拍卖时，竞价者这样的行为是理性
的：如果他人对被拍卖的物品的出价不超过他的估价，他将
继续叫价；否则退出竞价。

然而在竞价时，竞价者有时被你追我赶的加价气氛所感染
（不排除不断加价的气氛可能是组织者故意烘托制造出来的这
种可能，这是拍卖方的作弊行为）。竞价者不理会自己的理性
分析而不断地加价，喊出的价格可能超出自己的理性估价。

此时，可能的是，某个竞价者最终得到该物品，他发现

自己出的价格高于他对它的估价，他后悔了。在这个拍卖过

程中，拍得拍卖品的竞价者“忘记”了自己的目标是使该物

品的估价与付出的货币量之差尽可能地大，并且这个值不能

为负值，他“忘记”了他能够叫出的价格空间。即，他没有能

够真正地“知己
”。

在实际博弈中，我们往往“忘记了”我们的目标，我们

不清楚自己想要什么；我们往往不一定清楚我们实现目标的

可用策略，不清楚某些情况下的收益有多少；在不确定情况

下

我们经常与不确定打交道我们也往往不能准确估
算各种情况下所得收益的可能性。
我们的目的是通过自己的理性计算选择合理的策略，以
达到我们的目标，然而在此之前，作为理性人，我们首先要
“知己”

对与“己”相关的各种要素做出准确把握。

然而，光“知己”是不够的，我们还要“知彼”。我们获

取多少收益，不仅取决于我们自己的策略或者行动，而且取

决于与我们处于同一个博弈之中的其他理性人的策略或者行

动（当然他人的利益也取决于我们的行动）。即，我们与他人

的利益是相互依存的。

这是博弈论的一个基本假定。这就要求我们，作为策略

家，要了解与我们进行博弈的对方的情况，与我们“玩游戏”

的对方是一个人还是多个人？他们各自的目标是什么？可能

的选择策略是什么？这就是“知彼”。

同时，“知彼”要求我们要站在“对方”的立场上设身处
地地思考。所谓设身处地地思考就是，我们要清楚，我们的
“对方”与我们一样，具有理性分析能力；并且他们有自己追
求的目标，他们也想通过自己的策略选择达到他们的目标。
当然他们也知道，他们的目标的实现也与我们的行动密切相
关。我们要将与我们一起“玩游戏”的人看作理性人。

站在对方的立场上思考就是理解对方，考虑对方基于自
己利益基础上的策略选择。如果我们只从自己的利益出发采
取策略，而不顾及对方的策略选择，那么，我们实际获得的
收益或好处将不会是我们所期望的。

站在对手立场上思考，在某些场合下，类似于我们日常
所说的“换位思考”。通过“换位”，了解他人的所思所想，
以及可能做出的相应的策略选择，从而使我们做出正确的策
略选择。

当然，站在对方的立场上思考或者换位思考，并不是说
我们要一味地“迁就”他人，而是说，我们要了解对方。当
然了解对方不是最终目的，我们的最终目的是实现我们的目
标，或者说极大化我们自己的利益。

孙子说：“知己知彼，百战不殆。不知彼而知己，一胜一
负；不知彼，不知己，每战必殆。”我们在进行策略选择时，
只知道自己的目标或者得益、自己备选的策略是不够的，还
要知道对方的目标以及对方可能的备选策略。

“知己”与“知彼”，是正确推理与计算的前提。

当策略家发现某些博弈明显不利于策略家，或者没有足
够的把握时，策略家最好的方法是退出这个博弈，即“走为
上”。所谓“走为上”策略就是，不做任何策略选择。

三十六计中将最后一计定为“走为上”，道理是深刻的。
“走为上”似乎是“最下的”策略（最后的策略），但它被看
成是“最上的”策略。这个计策告诉我们，如果前三十五计，
或其他什么计策，不能保证胜利，那么最好的策略，即“上
策”，就是保存自己的实力的策略，也就是“走”的策略。

《三国演义》中司马懿在与诸葛亮的空城计博弈中选择撤
兵，尽管在局外人看来是选择失误，但他的选择是有道理的。
司马懿面对诸葛亮这个对手，若选择“攻城”，他没有把握获
得胜利，最好的策略是退兵（即“走为上”），以保存十五万
大军不被打败。

当没有把握获得胜利的时候要能够退出，当明知某些行
动必定失败，那更要退出。所谓“留得青山在，不怕没柴
烧”，就是告诫人们，当面对绝对要输的博弈时，要能够抽身

而去，保存实力。
在战争、商业等博弈中人们进行策略选择时，存在“占
据先机”或策略和、策

“先发制人”“以静制动”“后发制人”

略之别。当局势明显地显露出即刻行动往往能够抢到先机、

将对方置于不利的位置时，策略决策者要当机立断，采取

“先发制人”。博弈参与人如果不及时做出决策，往往会延误

时机。但是如果局势不明朗，策略决策者仓促做出某种决策

往往会被对手抓住弱点，使自己处于不利的境地。此时，最

好的办法是，以静制动，等待时机。当机会来临、对手暴露

出某些缺点时，策略决策者再做出行动。这个策略可以说是
“后发制人
”。

无论是“先发制人”策略，还是“后发制人”策略，其

有效性的条件是，博弈参与人有比较大的可能获取博弈的胜

利。如果在某个博弈之中，参与人获胜的可能性比较低，或

者根本没有可能取得胜利，此时，无论是“先发制人”策略，

还是“后发制人”均不能奏效。“走为

策略，对于这样的博弈，
上”策略便是最好的策略。
有些博弈是不利的，必定是失败的，策略家要努力避免
这样的博弈。

我们通常都说“先下手为强”，的确，大量例子说明，在
有多个纳什均衡的情况下，常常是先动手先决策一方占有一
些优势。但是也有后动优势的例子。

我们来看看后动优势的出色例子

帆船比赛的故事和
轮盘赌的故事，看完这两个故事，你对后动优势就会有比较
深刻的认识。

帆船比赛的故事是这样的：

年美洲杯帆船赛决赛前
轮结束之后，丹尼斯

康纳的“自由女神号”在这项共有
轮比赛的重要赛事当中暂时以
负的成绩领先。这是
轮
胜

胜的比赛。那天早上，第
轮比赛即将开始，媒体报道
“整箱整箱的香槟被送到‘自由女神号’的甲板。而在他们的
观礼船上，船员们的妻子全都穿着美国国旗红、白、蓝三色
的小背心和短裤，迫不及待地要在她们的丈夫夺取美国人失
落

年之久的奖杯之后参加合影。”可惜由于策略运用不
当，最终事与愿违，功败垂成，没能圆

年的梦。
比赛一开始，由于“澳大利亚二号”抢在发令枪响之前起

步，不得不回头撤到起点线后面再次起步，使“自由女神号”在
这一轮一开始就获得

秒的优势。这时，落后的澳大利亚队
的船长约翰
伯特兰德决定孤注一掷，转到赛道左边，满心希
望风向可以变化，帮助他们赶上去。丹尼斯
康纳则决定将
“自由女神号”留在赛道右边。这一回，伯特兰德大胆押宝却
押对了，风向果然按照澳大利亚人的心愿偏转了
度，使“澳
大利亚二号”以
分
秒的巨大优势赢得这轮比赛。事后，
人们纷纷批评康纳，说他策略失败，没能跟随澳大利亚队调整
航向。再赛两轮之后，“澳大利亚二号”反超，最终以
：

赢
得了决赛桂冠。
这场帆船比赛给我们提供了一个很好的例子，成绩遥遥
领先的帆船，通常都会照搬落后者的策略，即一旦落后的船
只改变航向，那么成绩领先的船只也会照做不误。实际上，
即便落后的船只采用一种显然非常低劣的策略的时候，成绩
领先的船只最好也照样加以模仿。为什么？因为帆船比赛与
在舞厅里跳舞不同，在这里，成绩接近是没有用的，只有最
后胜出才算数。假如你成绩领先了，那么，维持领先地位的
最可靠的办法就是看见别人怎么做，你就跟着怎么做。

如果双方的技术实力相当，帆船比赛的输赢在很大程度
上是赌风向的比赛。在

的
场数领先的美国人又以

年的那场比赛中，当以

秒领先时候，他们就获得了后动优
势：澳大利亚人押什么风向，他们就应跟随押什么风向。这
样，他们可以做到万无一失，因为如果澳大利亚人押对了，

他们也跟着押对，尽管可能因为决策晚一点而输掉几秒，却
很难把

秒输光，同样，如果澳大利亚人押错了，那么大家
都错，那
秒的优势仍然管用。
再来看另一个类似的故事。
巴里大学毕业的时候，为了庆祝一番，参加了剑桥大学
的五月舞会，这是英国版本的大学年度正式舞会。作为庆祝
活动的一部分，节目包括了一个轮盘赌游戏。每个参加者都
得到相当于

美元的筹码，玩到舞会结束的时候，收获最大
的一位将免费获得下一年度舞会的两张入场券。到了准备最
后一轮轮盘赌的时候，纯粹是由于令人愉快的运气，巴里手
里已经有了相当于
美元的筹码，独占鳌头，而第二名是
一位拥有
美元筹码的英国女子。其他参加者所获无几，
实际上已经被淘汰出局。就在最后一次下注之前，那个女子
向巴里提出分享下一年舞会的入场券，但是巴里拒绝了。他
占有那么大的优势，怎么可能满足于得到“一半”的奖赏呢？
这里需要简单介绍一下轮盘赌的规则。轮盘赌的输赢取
决于轮盘停止转动的时候小球落在什么地方。典型情况是，
轮盘上刻有从

的

个格子。假如小球落在
处，就
算庄家赢了。玩轮盘赌最可靠的玩法就是赌小球落在偶数还
是奇数格子，分别用黑色和红色表示。这种玩法的赔率是一
赔一，比如一美元赌注变成两美元，取胜的机会是
接近二分之一。在已经
到
：

落后的情况下，如果这样赌
偶数和奇数，即便那名英国女子把全部筹码压上，也不可能

翻本。因此，她被迫选
择一种风险更大的玩法。
在许多博弈游戏里，抢占先

机、率先出手并不总是好事。因

她把全部筹码压在小球

为这么做会暴露你的意图，其他

的倍数上。这种
落在

参与者可以利用这一点占你的便
玩法的赔率是二赔一，
宜。“后发制人”，可能使你处于更
也就是说，假如她赢了，
有利的策略地位。
她的

美元就会变成
美元，但取胜的机会只有，不到

。现在，那
名女子把她的筹码摆上桌面，表示她已经下注，不能反悔。
这时候，巴里应该怎么办？

正如大家在帆船比赛案例已经知道的，巴里应该模仿

美元筹码压在小球落在

那名女子的做法，同样把

的
倍数上。这么做可以确保他领先对方

美元，最终赢得
那两张入场券。事实上，这时候他们将同赢或者同输。假如

：

取胜；假如他们都赢，巴里将
以　取胜。如果巴里清醒自己已经获得的后动优势，
坚守追随策略，那名女子根本就没有获胜的可能。即使她选
择不赌这最后一轮，她也还是要认输，因为巴里会模仿她一
样退出这一轮，照样取胜。
实际上，她的唯一希望在于巴里先行。假如巴里先在黑色

他们都输，巴里将以

美元压在红
色。把她的筹码压在黑色对她没有半点好处，因为只有巴里取

美元，她应该怎么做？她应该把她的

下注

美元，排在巴里的

胜，她才能取胜，而她将是亚军，只有

美元后面。自己取胜而巴里失败就是她唯一的反败为胜的希
望所在，这就意味着她必须反巴里之道而行之，在红色下注。

可见，假如巴里先下注，那名女子就可以选择一个具有取
胜机会的赌注。相反，如果巴里让那名女子先下注，他自己就
总是可以选择一个确保胜利的策略。其实何止是已经领先的轮
盘赌，在许多博弈游戏里，抢占先机、率先出手并不总是好
事。因为这么做会暴露你的意图，其他参与者可以利用这一点
占你的便宜。“后发制人”，可能使你处于更有利的策略地位。

结果呢？当时已经是凌晨

点，巴里已经喝了太多香槟，
再也没有办法保持头脑清醒了。结果，他把
美元压在偶
数上，心里嘀咕他输掉冠军宝座的唯一可能性就是这一轮他
输并且她赢，而这种可能性的发生几率只有

，所以形势
对他非常有利。

一个人在喝得太多的时候，自然很可能偏离理性。一方
面，也许因为觉得自己经济学已经玩得很有心得，向往“无
招胜有招”的境界，巴里竟然会漠视已经取得的后动优势；
另一方面，不愧为博弈论的高才生，他居然还知道输给对手
的几率只有

几率的事情有时也会发生，
巴里“败走麦城”就是其中的一个例子：鬼使神差，那位女
子赢得了下一年度舞会的赠券，巴里功败垂成。

值得注意的是上述以“模仿策略”实施的后动优势的适用
范围。上述两个游戏，都是所谓“赢者通吃”的比赛。如果不
是赢者通吃的游戏，而是积分比赛的游戏，情况将大相径庭。

。当然，

如果我们从一个博弈的形成与博弈参与人的关系来看，
博弈无非是两类：一类博弈是博弈参与人主动设计而成的；
另一类博弈是自动形成的，即与博弈参与人的意图无关。

社会中的大多数活动

政治的、经济的、战争的等
等尽管渗透人类的意图，但局势的形成是无法预期的，
也就是说，它们往往是自然形成的。在它们未形成之前，我
们往往无法预先知道博弈参与人以及博弈参与人的策略空间
及其支付组合。但是，有许多博弈是策略家“制造的”，此时
博弈参与人、策略空间、支付结构，乃至于结局，尽在策略
家的掌握之中，因为这样的博弈本身就是策略家设计的。“空
城计”就是诸葛亮设计的一个博弈，尽管它是诸葛亮在不得
已的情况下被动设计的一个脱身的方法。“制造博弈”就是
人们常说的“设计圈套”。制造博弈如同猎人用陷阱捕猎动
物。在社会中设“计”赢对方，就是给对方设计一个圈套将
对方套进去。参与人制造某个博弈的目的就是，通过该博弈
达到他所预想的目标，而该博弈的结果在设计者的掌握之中。

比如赌场就是庄家设的局，让赌客输掉身上的钱；股票市场
是国家设的博弈，通过股票市场，企业筹集到发展的资金，
国家获得大量的税收等等。

我们看下面这个主动设计的博弈故事。

有一个美国商人，他看到有一家制衣厂积压大量衣服。
他为该厂制定了一个销售策略。

这个美国商人让制衣厂在波士顿市中心设立一家销售店。
同时，他为该商店指定一个电视广告策略，该广告的内容是：
商品标出价格的头

天按全价格出售，从第
天起到第
；第天，降价天，降价，第天天，
降价，第天，如果还没人要，商品就送给慈善机
构。

该广告登出后立刻成了人们谈论的话题，人们想，如果
顾客等到最低价才买，或者不买，该商店不就破产了？每个
人都想到商店看一看，结果商店的商品不久销售一空。

其实，顾客之间进入了囚徒困境博弈。人们均是潜在的
消费者，看到广告的并想买衣服的顾客，均想以低价买到衣
服，并且希望以最低的价钱购买。在商家这个销售策略下，
最低价格是原价的（降价，即广告登出后的第

天时的销售价格。每个顾客均希望此时来买，但是否
所有衣服均以这个价格卖出呢？不是的！因为每个消费者都
会想到，其他消费者也会有同样的想法。这样，消费者想，
如果在广告刊登后的第天去，将很有可能买不到衣

服，尽管此时的衣服最便宜。因此，顾客不可能等到最低价
的时候去买，尽管所有顾客均等到最低价去购买，对所有顾
客均有好处，但这是不可能实现的。每个人均会提前去商店。

至于顾客何时光顾该商店、购买衣服，取决于他对衣服
的评价。如果某个顾客认为衣服的价值高于他所付出的货币，
或者比其他商店便宜，那么他将购买。这样，不会发生所有
顾客均等到衣服价格降到最低时才购买的现象。

该商人所利用的就是人们的这种策略选择心理。

通过进行博弈有可能对博弈中的所有人都是有益的，然
而，制造的博弈更多的是有利于设局者，而不利于其他参与
人。此时，如果设局者的意图为对方所知道（即“诡计”被
识破），对方或者不参与这个博弈，或者采取的办法是“将计
就计”：针对设局者而采取相应的对策，从而“破”了设局者
的目的。

计算成本：
不做得不偿失的事情

我们常常谈到成本，那么究竟什么是成本？经济学家的
定义是：为了得到某种东西而必须放弃的东西。

现在我们已经有了成本观念，下面就是应用问题了。在
做决策之前，必须经过“成本估算”：如果得大于失，就值得
做；如果得失相抵、甚至得不偿失，就不要干这种“吃力不
讨好”的事了。

“皮洛斯的胜利”讲述的是古罗马时期的一场战事。皮
洛斯是古罗马时期的一位国王。在一场血腥的战斗中，他获
得了胜利，却损失了大半精锐部队。望着尸横遍野的战场，
他感慨道：再来这样一场胜利，我就完蛋了。后来人们就用
“皮洛斯的胜利”代表代价惨重、得不偿失的胜利。

赢得战争（或避免战争）的一个有效策略就是增加对方
的战争成本，使其难以坚持，或因为得不偿失而放弃发动战
争的愿望。

《孙子兵法》的《作战》篇中，一开始并未探讨战略或战
术问题

而是算账：一次军事行动（无论胜败）的成本：

费千金”的人力、物力投入。
宋代的沈括也算过一笔细账：动用

万人的军队到远方
作战，运送辎重的兵员要占
，而后勤补给人员至少需要
万人，这样一支部队，最多只能行军

天。三个民夫供
应一个士兵，这已经是最大极限了。如果用牲畜运粮，固然
负载多而费用少，但很容易生病死亡，这样连牲畜和驮负的
物资都要白白丢弃，因此比起人力运输，利弊各半。
所以，“因粮于敌”（从敌人那里获取给养）就非常重要。
通过长途运输一份军粮，可能在路上要消耗好几份。孙子说：
“食敌一钟，当我二十钟。
”正是这个原因。

现代战争由于交通的便利，可以节省某些成本（如粮食的

运输消耗），但是其他方面（如弹药的大量消耗）的花费比古代

要昂贵多了，海湾战争中美军发射的一颗导弹动辄价值数十万

甚至上百万美元，这种高技术战争不是哪个国家都能承受的。

在古代兵法中，有“坚壁清野”，在现代军事史上，有

“焦土政策”，它们的共同点是尽可能减少对方从战争中获得

的补偿，也就是提高对方的战争成本。当然，实行这一战略，

自己的损失也很大，不过也不失为一种有效的策略。而且，

这一行动也是在向对方表明立场：我要和你干到底，为此我

宁愿作出任何牺牲，不要指望从我的屈服中获得什么好处。

战争如此，市场竞争如此，甚至我们日常行为也都面临

一个成本一效率问题。理想状态当然是以尽可能小的成本，

换取尽可能大的效用，但是现实中大多数选择并非理想。

期望效用极大化

当我们对所选策略的结果是未知时，通常会用到期望效
用极大化原理，什么是期望效用极大化原理呢？可用一个故
事来说明。

一个渔夫用网在海里捉住了一条小鱼。渔夫很失望。小
鱼对渔夫说：“我太小了。你把我放了，等我长大了，你再抓
我，不是更划算吗？”渔夫：“你的话有道理。你确实太小了。
但放了你则是愚蠢的，因为放了你之后，我怎么能够抓住你
呢？”渔夫没有把小鱼放掉。

渔夫面临两个决策：“不放走小鱼”、。

“放走小鱼
”渔夫选
择“不放小鱼”的收益是确定的，即收益为“小鱼”；而选择
“放走小鱼”的策略，收益是不确定的：或者为一无所得，或
者为获得“大鱼”。这里，当小鱼长大成为“大鱼”之后，渔
夫抓住它的可能性或概率几乎为

。小鱼诱惑渔夫放走它，
对于渔夫，放弃眼前的小利，换取未来的大利是合算的；然
而如果未来的大利是不确定的，那么放弃眼前的小利则是愚
蠢的。渔夫没有把小鱼放掉，他的决策是合理的。

渔夫进行策略选择时遵从的是期望效用极大化原理。

所谓期望效用极大化或者说期望收益极大化，是指人们

在结果的实现不确定的情况下，应当选择给他带来的“期望

效用”最大的策略。所谓期望效用就是：收益与实现该收益

的可能性（概率）的乘积。在上面“渔夫与鱼”的故事中，渔

夫选择“不放走小鱼”的期望收益为“小鱼”；而选择“放走

小鱼”的期望收益为：，

“大鱼与获得大鱼的可能性的乘积
”但
是渔夫捕获大鱼的可能性几乎为，那么，渔夫选择“放走
小鱼”的期望收益也就几乎为

。这样，渔夫就应当选择
“不放走小鱼”。

“焦土政策”是指，战争的时候，一方撤退时把本方的建
筑设施、资源等全部自行破坏，不给对方留下任何有价值的
东西。“焦土政策”有两个作用：显示自己决不妥协的立场和
增大对手的成本。不过，这里倒不是有意暗示说，这样的策
略无论成功或失败，其本身或结果都是可取的。不难想像社
会希望避免这么一种意味着巨大浪费的破坏行动的出现。我
们的目的在于解释这些策略的本质，这样你就可以更好地运
用它们，或者避免使用它们。

焦土政策只不过是被博弈论者称为策略行动做法的一个
例子。你大约已经觉得，保留选择余地终归是有好处的。不
过，在博弈论的王国里，这一点却不成立。你虽然少了自由，
却在策略上得了益。因为这么做改变了其他参与者对你以后
可能采取什么反应的预期，而你可以充分利用这一点，为自
己谋利。其他人知道，只要你有行动的自由，你就有让步的
自由。、、等成语，

“破釜沉舟”“背水一战”“置之死地而后生
”
说明的都是这个道理：只有把退路堵死，你才能奋勇向前。

为了使一个策略行动可信，你必须采取其他附加行动。
当战争中的一方威胁要饿死他的敌人，烧毁田野的行动就使
他的威胁变得非常可信。

为了达到己方预期的最优结果，同时为了防止最坏的状
态发生，博弈思维者经常要考虑的是，给对方以台阶，给对
方“指出
”一条生路。

如果说，边缘策略是要挟对方，迫使对方采取某种策略
的话，那么给对方以生路策略，则是放对方一马。无论是边
缘策略还是给对方生路都是按照我们的意志压缩对方的策略
空间，使对方按照我们的意志进行策略选择。

人们常说“狗急了会跳墙”。为了防止狗急跳墙，就要给
对方一条生路。在战争中，军事家们经常运用这个策略。在
一场战役中，军事力量强的一方的统帅会考虑，自己的军事
力量虽然强过敌方，但如果对方拼死作战，己方虽然将获得
最终的胜利，但自己的军队也将伤亡惨重。因而在决战时，
往往给敌人留个逃跑的缺口，而使对方不至于死战。通过这
种策略，军力强的一方往往能够获得有效的胜利。

军事家常常灵活运用这个策略，兵力强的时候给敌人一
条生路，兵力处于弱势的时候，则会自决后路。在某个战争

博弈中，当一方发现自己的军队处于困境，除了拼死作战而
无其他更好的逃生之法时，统帅们就会自决后路。而当士兵
们发觉除了死战而无其他生路的时候，更会奋勇杀敌。这里
最好的一个例子是，项羽与秦军交战时，项羽故意把船弄沉，
砸了自己的锅灶，使得将士没有退路，只有拼死奋战、战胜
对方才有生路，结果项羽大胜秦军。这就是所谓的“破釜沉
舟”。

当然这个策略也不能乱用。二国演

中马谡与司马懿

在街亭之战中便误用了这个策略。马谡领命驻守街亭，他不
听他人劝告，将大军屯在山上，准备与司马懿决战。马谡认

为，将大军安扎在险地，司马难以进攻；而如果被围成

“绝地”，士兵将以一当百，奋力杀敌。司马懿大军来到街亭，
迅速将马谡围困，断了马谡的汲水之道。蜀军因无水、无食，
不久即大乱。此时，并没有达到马谡预想的士兵“置之死地
而后生”。士兵们除了“死战”之路，还有“投降”之路！在
司马懿的围攻下，士兵纷纷倒戈，致使街亭失守。

将自己置于死地与给敌人一条生路，是一个道理，均是
压缩可能的选择空间。

当然，给敌人以生路是不得已的选择。如果断了敌人的
生路，可以做到斩草除根、不留后患的话，那么策略家自然
要干净、彻底地将敌人消灭。让敌人选择“生路”对敌人是
好的选择，对于策略家而言更是好的结果。

一个无条件的行动（不计代价、只要胜利）可以使这个
参与者获得策略上的优势，抢占先机，率先出招。即便你并
未真的先行，仍然可以通过对回应规则提出一个承诺，获得
与先行的一方相仿的策略优势。虽然你是跟在别人后面行动，
但这个回应规则必须在别人开始行动之前就建立。父母对孩
子说：否则不许出去玩。
实际上就是在确

“除非你做完作业，”
立一个回应规则。毫无疑问，这个规则必须在这个孩子跑出
去之前就建立，并且明确宣布。

威胁是对不肯与你合作的对手进行惩罚的一种回应规则。
既有强迫性的威胁，比如恐怖分子劫持一架客机，其确立的
回应规则是假如他的要求不能得到满足，全体乘客都将死于
非命；也有阻吓性的威胁，比如美国威胁说，假如前苏联出
兵攻击任何一个北约国家，它就会以武力回敬。强迫性威胁
的用意在于促使某人采取行动，而阻吓性威胁的目的在于阻
止某人采取某种行动。两种威胁面临同样的结局：假如不得
不实施威胁，双方都要大吃苦头。

第二大类的回应规则是许诺。这是对愿意与你合作的人
提供回报的方式。检察官会向一个被告许诺说，只要他愿意
成为公诉方的证人，检举同案中的其他被告，他就会得到宽
大处理。许诺同样可以分为强迫性的和阻吓性的两种。强迫
性许诺的用意是促使某人采取对你有利的行动，比如让被告
摇身一变成为公诉方的证人；阻吓性许诺的目的在于阻止某
人采取对你不利的行动，比如黑帮分子许诺好好照顾证人，
只要他答应保守秘密。相仿地，两种许诺也面临同样的结局：
一旦采取（或者不采取）行动，总会出现对双方都不利的情
况，如证人不保守秘密，对黑帮分子无疑是不利的，而相应
地，黑帮分子可能对其下毒手。双方对这种情况的预期，是
他们各自说话不算数的动机。

有时候，威胁与许诺的界限非常模糊。这种界限也许只
取决于你怎样称呼当前的情形。老派的歹徒会威胁说，假如
你不给他一点银子，他就要加害你。假如你没有给，他就会
动手“修理”你，从而造成一种新的情形，而在这种新的形势
下，他又会许诺说只要你给他一点银子，他就会住手。随着
形势转变，一个强迫性的威胁会变得和一个阻吓性的承诺差
不多；同样，一个阻吓性的威胁与一个强迫性的许诺的区别
也只限于当时的情况。

如果实践一个“威胁”对你有利，我们称之为警告。比
如，一位总统告诉他的国会议员们，如果国会不能通过他提
出的法案，他就要解散国会，重新举行大选。这就是一种威

胁。警告的用意在于告知其他人，他们的行动将会产生什么
影响。

如果实践一个“许诺”对你有利，我们称之为保证。孩
子不理会关于炉子顶部很热的警告，结果烫伤了，这使父母
得到某种保证，知道孩子以后再也不会这么干了。

我们强调这两对概念的区别是有理由的。威胁与许诺是
真正的策略行动，而警告与保证更多的是起一个告知的作用。
警告或者保证不会改变你为影响对方而设立的回应规则。实
际上，你只不过告知他们，针对他们的行动，你打算采取怎
样的措施作为回应。与此截然相反，威胁或者许诺一旦时机
来临，就会改变你的回应规则，使之不再成为最佳选择。这
么做不是为了告知，而是为了操纵。由于威胁和许诺表明你
可能选择与自身利益冲突的行动，这就出现了一个可信度的
问题。等到别人出招之后，你就有动机打破自己的威胁或者
许诺。为确保可信度必须做出一个承诺。

无条件的行动是你先行且行动一成不变的回应规则。威
胁与许诺则在你第二个出招时出现。两者都是有条件的行动，
因为这个回应是由取决于对方怎样做的规则所确定的。

无条件行动若是打算用来影响对方，就一定要让对方看
到，同样你打算通过威胁或许诺影响他的行动，那么他的行
动也要让你看到。否则你不可能知道他是不是选择顺从，而
他也明白这一点。

除了前面提到的三种基本的策略行动，还有更多更加复

杂的选择。这些选择包括：你可以任由别人在你做出回应之
前采取一个无条件行动；你可以等待别人发出一个威胁，然
后再采取行动；你可以等待别人提出一个许诺，然后再采取
行动。

既然是威胁，就有一个可信不可信的问题。美国普林斯

顿大学古尔教授曾经在

年的

济学透视》杂志发表文

章，提供深入浅出的例子说明威胁的可信性问题：两兄弟老
是为玩具吵架，哥哥老是要抢弟弟的玩具。不耐烦的父亲宣
布政策：好好去玩，不要吵我；不管你们谁向我告状，我都
把你们两个关起来。关起来比没有玩具玩更加可怕。现在，
哥哥又把弟弟的玩具抢去了，弟弟没有办法，只好说：“快把
玩具还给我，不然我要告诉爸爸。”哥哥想，你真向爸爸告
状，我是要倒霉的，可是你不告状只不过没玩具玩，告了状
却要被关禁闭，告状会使你的境况变得更坏，所以你不会告
状。因此，哥哥对弟弟的警告置之不理。的确，如果弟弟是
会计算自己利益的理性人，在这样的政策环境之下，还是忍
气吞声不告状为好。可见，如果弟弟是理性人，他的上述威
胁不可信。

威胁和许诺之所以存在是否可信的“可信性”问题，根
源在于信息不完全。为了说明这个关系，让我们看看家长干

涉子女婚姻的例子。

父母关心子女的婚事，乃人之常情，通常还是好事。我
们所谓干涉，不是一般的关心，而是家长不喜欢子女的心上
人，并且采用威胁和各种手段企图以自己的意愿改变子女的
选择。家长为什么反对孩子自己的选择，情况非常复杂，“理
由”千差万别，我们这里就不费笔墨了。

设想父亲不喜欢女儿嫁给她的心上人，最严重的情况，
会首先试图禁止他们来往。“再要跟他好，我就打断你的腿！”
这是文学作品上一再出现的句子。这就是威胁。这个威胁是
否可信，女儿多半心中有数，会采取相应的对策。通常，这
是父亲对女儿婚事态度的声明，父亲并不是真要打断女儿的
腿。除非父亲不近人性。事实上，我们很难想像打断女儿的
腿对做父亲的会有什么好处。

如果女儿相信父亲的话，她大概会中断与恋人的关系，
因为恋人是可以重新选择的，而父亲则无法重新选择。问题
是，假使女儿真的与恋人结婚了，父亲难道真的会走断绝父
女关系这一步吗？一般来说是不会的，因为断绝父女关系对
父亲的损害更大。这就是说，父亲的威胁是不可置信的。聪
明的女儿当然明白这一点，她知道，一旦生米煮成熟饭，父
亲只好吃下去。结果通常是女儿会勇敢地恋爱下去直到结婚，
父亲最终承认那个最初并不喜欢的女婿。

按照博弈论和信息经济学，原则上威胁只有在如果不实
行的话当事人将遭受更大的损失时，才是可信的。威胁一般

采用“如果你那样做，我就这样做”的形式。所谓更大损失，
就是说在你真的那样做的条件下我不这样做我的损失会更大。
女儿真的和那个小伙子结婚了，在这个既成事实之下，父亲
再断绝父女关系只会更加损害自己，所以父亲的威胁不可信。

许诺，就是当事人使自己的威胁变得比较可信的一种办
法。既然许诺了，但如果当事人不施行发出的威胁，他就要
为自己的失信付出代价。信誉的代价也许不能马上计算出来，
但是后果明显。

显而易见，在你作出一个许诺的时候，你不应让自己的
许诺超过必要的范围。假如这个许诺成功地影响了对方的行
为，你就要准备实践自己的诺言。这件事做起来应该是代价
越小越好，因此也意味着许诺的时候只要达到必要的最低限
度就行了。

不那么容易看到的是，适度原则其实同样适用于威胁。
你不应让自己的威胁超过必要的范围。这么做的理由相当微
妙。

为什么美国不会威胁日本说，假如日本不同意进口更多
的美国大米、牛肉和柑橘，美国就要动武呢？虽然动武的想
法有可能博得美国一些农场主和政治家的欢心，但同时却存
在以下几个理由，说明不能这么做：

效。

没有人会相信这样一个威胁，因此这个威胁不会奏

哪怕这个威胁真的管用，日本也不傻，一定会重新

揣摩美国究竟是不是它的盟友。

假如日本不肯进口更多柑橘，美国说到做到，当真
实施自己的威胁，其他国家就会谴责美国选择了一个很不恰
当的惩罚方式，日本更会怒不可遏。不过，假如美国不实施
自己的威胁，又会让自己日后的信誉大打折扣。无论是不是
实施自己的威胁美国都将遭到失败。
这个威胁由于引入了一个本来毫不相干的因素

武力而使原来的问题变得模糊不清。

上述各点的核心在于，这个威胁大而不当，对方难以置
信，而自己又不能说到做到，更别说进一步确立自己的信誉
了。

博弈的参与者发出威胁的时候，首先考虑的问题可能恰
恰相反，认为威胁必须足够大，大到足以阻吓或者强迫对方
的地步。接下来要考虑的则是可信度，即能不能让对方相信，
假如他不肯从命，一定逃脱不了威胁中假定的结果。若是在
理想状况下，就没有别的需要考虑的相关因素了。假如受到
威胁的参与者知道反抗的下场，并且感到害怕，他就会乖乖
就范。问题在于，在这个方面，我们永远不会遇到理想状况。
只要我们仔细考察美国不能威胁动武的理由，我们就会看得
更清楚，现实与理想状况究竟有什么区别。

首先，发出威胁的行动本身就可能代价不菲。国家、企
业乃至个人都参加着许多不同的博弈，他们在一个博弈中的
行动会对所有其他博弈产生影响。比如美国若是威胁对日本
动武，就会影响到美国日后与日本的关系及目前和日后与其

他国家的关系，而美国用过这样一个大而不当威胁的事情也
会留在别人的记忆里。别人在和美国打交道时就会犹豫不决，
美国则会失去许多其他贸易伙伴关系带来的好处。

其次，一个大而不当的威胁即便当真实施了，也可能产
生相反的作用。日本会惊慌失措地高举双手投降，请求世界
舆论声援，谴责美国，从而将大大推迟有关谈判的进度；美
国本来希望迫使它尽快开放国内市场，结果却适得其反。

再次，发出威胁，而威胁行动完全不必实施的情况，只
在我们绝对有把握不会发生不可预见的意外的前提下成立。
假设美国错误地判断了日本农场主的势力，而他们宁可让国
家投入战争也不愿失去自己受到保护的市场。又或者，假设
日本同意美国的条件，可是美军某指挥官想起自己当年不幸
沦为战俘的惨痛经历，就会抓住这个机会报仇雪恨..面对
发生诸如此类意外的可能性，美国应该三思而后行。

在讨论过以上几点后，我们可以看到，一个威胁可能由
于太过而丧失可信度。假如日本不相信美国当真愿意实施这
个威胁，这个威胁就不可能影响它的行动。

结论是，能奏效的最小而又最恰当的威胁应该成为美国
的首要选择，务必使惩罚与罪行相适应。如果美国希望刺激
日本多买柑橘，就应该选择一个更具互惠性质的威胁，使惩
罚与不肯多买柑橘的做法更加匹配。比如，美国可以威胁说
要削减日本汽车或者电器的进口配额。

边缘策略就是指将你的对手带到灾难的边缘，迫使他撤
退。肯尼迪在古巴导弹危机中采取的行动，被普遍视为成功
运用边缘策略的典范。

年

月，古巴导弹危机将整个世界拖到了爆发核
战争的边缘。前苏联在赫鲁晓夫的领导下，开始在古巴装备
核导弹，那儿距离美国本土只有
英里。美国总统肯尼迪随
即宣布要对古巴实施海上封锁。假如前苏联当时接受这一挑
战，此次危机很有可能升级为超级大国之间一场倾巢而出的
核战争。不过，经过几天的公开表态和秘密谈判，赫鲁晓夫
最后还是决定避免正面冲突。为挽回赫鲁晓夫的面子，美国
做了一些妥协，包括最终从土耳其撤走美国导弹。作为回报，
赫鲁晓夫则下令拆除前苏联在古巴装备的导弹，并且装运回
国。
你可以说赫鲁晓夫贸然在古巴部署导弹是鲁莽的，但不
能不说他的妥协是明智的（据说那些日子，肯尼迪紧张得几
乎崩溃，如果赫鲁晓夫不肯退让，一场核战争似乎不可避

免）；但是反过来说，既然赫鲁晓夫最终只有退让这一个明智
的选择，那么他最初的冒进就是鲁莽的。

我们普通人也会运用边缘政策，只不过不会产生那么深
远的国际影响罢了。比如买卖双方的讨价还价最终变成一场
争吵；固执己见而不能达成妥协的夫妻可能离婚；意见不一
的合作者如果不能相互协作，合作关系就会破裂。在这些案
例中，双方其实都会用到边缘政策。他们故意创造和操纵着
一个有着在双方看来同样糟糕的结局的风险，引诱对方妥协。

边缘政策是一个充满危险的微妙策略，假如你想成功地
运用这个策略，你必须深谙边缘策略的奥妙。边缘策略的本
质在于故意创造风险。这个风险应该大到让你的对手难以承
受的地步，从而迫使他按照你的意愿行事，以化解这个风险。
边缘策略行动的目的是通过改变对方的期望来影响他的行动。

实际上，边缘策略是一种威胁，只不过属于非常特殊的
类型。运用边缘策略时同样要注意发出的威胁要大而恰当。
运用边缘策略不仅在于创造风险，还在于小心控制这个风险
的程度。如果威胁过了一定的程度，就变成一个冒险经历，
把自己也带入危险的边缘。下面这个故事就很好地说明了这
个问题。

有本侦探小说叫《马耳他之鹰》，这本书里有这样的情
节：侦探藏起了那只价值连城的鸟，而歹徒则绞尽脑汁要找
出鸟藏在哪里。

侦探说：“你想要那只鸟吧，它在我的手里..假如你现

在杀了我，你又怎能找到那只鸟？假如我知道你在得到那只
鸟之前杀不了我，你又怎能指望通过威胁让我交出来？”

歹徒的回应是解释他打算怎样使自己的威胁变得令人信
服。

“我明白你的意思。这需要双方拿出最明智的判断，因为
你也知道，先生，男人若是急了，很快就会忘掉自己的最大
利益究竟是什么，那就什么事都做得出来了。”

歹徒承认他不能以处死的办法威胁侦探。不过，他可以
让侦探面对一种风险，即局势可能在僵持到极点的时候超出
控制，结果会是什么就说不准了。也就是说，“我不是存心要
杀你，可是你要找死我就没办法了。”歹徒不能承诺假如侦探
不肯招供，他就一定大开杀戒。但他可以威胁说要让侦探处
于一种境地，在这种境地下歹徒自己也不能保证是不是可以
防止侦探遇害。这种让某人了解自己遭受惩罚的概率的本事
应该足以使这个威胁奏效，假如惩罚足够吓人的话。

这么一来，侦探丧命的风险越大，这个威胁就越管用。
不过，与此同时，这个风险也会让歹徒感到越来越难以承受，
从而变得越来越难以置信。歹徒的边缘策略在并且只在一个
条件下奏效：存在一个中等程度的风险概率，它使这个风险
大到足以迫使侦探说出那只鸟的藏身之处，却又小到让歹徒
觉得可以接受。这个范围只在侦探重视自己的生命胜过于歹
徒重视那只鸟的时候存在。

其实边缘策略在生活中有很多的应用，例如我们在买东
西时，就经常有意无意地运用着边缘策略。同时边缘策略是
人们在谈判时经常用的策略。策略家如果能够恰当地运用这
个策略，在某些特殊场合如谈判中，就能够取得较理想的收
益。
讨价还价过程是人们在市场上买卖东西时经常发生的事
情。卖物品的人希望尽可能地卖出高的价钱，而买东西的人
希望以尽量低的价钱买到他想要的物品。卖东西的人在开价
时考虑的是两个方面：出一个高的价钱，如果这个价钱是买
者所预料并且在可接受的范围之内的话，对方的杀价是有限
的，这样，卖者有很大的获利空间；但是，如果给出的价格
太高，超出了买者的预期范围，对方会认为，价格太离谱，
卖者存在着欺诈行为，从而讨价还价即刻终止。

讨价还价开始于卖者给出的一个价格之后。假定这个价
格为

，并假定这个价格在买者“预期的”范围之内。这时，
讨价还价便开始了。买者往往给出一个低价，假定这个价格

为

，那么实际的成交价格（用字母
将处于这两个价格
之间，即。成交价格在谈判中形成。在讨价还价的
过程中，究竟以何价格成交，影响因素很多：如买者对该物
品实际价格的判断，卖者对利润的预期，每个人谈判的耐心，
等等。
在谈判过程中，买者所接受的价格和卖者所出的价格，
逐渐在靠拢。这个过程是一个“痛苦的”、耗费精力的过程。
过程中有时会陷入僵局，双方均不让价。此时，双方均会使
出自己的杀手锏，即双方使用“威胁”手段，即威胁要退出
谈判。比如，买者会说：“这是我接受的最高价格，否则我将
走人。
”卖者也会说：否

即发出终止的威胁。“价格不能再低，
则我要亏本。”买者和卖者均在使用边缘策略：你要接受这个
价格，如果买卖不成，责任在你。

在讨价还价中人们会不自觉地使用边缘策略，然而，这
些不一定都是有效的边缘策略。当买方不想接受对方的价格，
为了能够以合理的价格买到物品，他采取的“边缘策略”是：
“我身上只有这么多钱，你卖还是不卖？”买者甚至掏出钱包
里的钱，以示自己的话是真的。此时，卖者被逼到危险的边
缘，他的选择是：要么以买者的价格卖出该物品，要么不卖。
这是一个有效的边缘策略。

使用“边缘策略”是逼迫对手采取自己希望的行动以终
止谈判的有效方法。但是，如果对对手没有足够的了解，很
有可能的是，对方无法接受你的策略而发生两败俱伤的结果。

比如，当买者显示自己只有那么多钱而逼迫对手接受某个价
格的时候，卖者无法接受这样的价格。此时，买卖以不能成
交而终止，双方以前的谈判过程归于无效，双方均有损失。

另外的可能是，策略使用者并没有真正地将对手逼到墙
角，对手仍有回旋的余地，对手后退一步，反过来使用“边
缘策略”。比如，当买者与卖者讨价还价到一定的价格区域仍
没有达成协议时，买者对卖者说：“如果你的价格不再降低，
那么我就走人了。”买者想通过终止谈判来威胁逼迫对方让
步。但此时，卖者让了一步说：“好，我给你一个最低价。但
这是我能够接受的最低价格，你如果再不接受，你到其他地
方去买吧！”卖者让了一步，但反过来使用边缘策略，逼迫买
者接受他所给出的所谓最低价格。买者买还是不买？

我们经常在警匪片里见到这样的情节：为了破获犯罪团
伙，某个警察被派做卧底，潜入到犯罪团伙的内部。歹徒们
怀疑新来的人是警察卧底，他们往往要对被怀疑的对象进行
“检验”。一个办法是，让被怀疑对象做某种犯法的行为，比
如杀人尤其是枪杀警察。对歹徒来说，这是试金石：如果新
来的人做了，证明他不是警察，或者即使他是警察，杀了人，
也无法再回到警察那边。对于卧底警察来说，这是一个两难：
如果杀了人，自己不就真的成了犯罪分子了？既有悖自己的
职业，也有悖于道德、法律；而如果不杀人，自己将被怀疑，
既达不到卧底的目的，又使自己的身份暴露，自己的生命遭
到威胁。无疑这时的卧底警察陷入了两难境地，无论做还是
不做，都难以达到满意的结果。电影的导演们往往技巧地处
理这样的两难，以显示警察的智慧：既没有违法，又瞒过了
歹徒的眼睛。

而现实的情况通常是，如果局中人陷入两难境地，就会
骑虎难下，注定逃不脱失败的结局。有些博弈是必定要失败

的，所以应当避免。“骑虎难下”博弈便是其中之一。

有一个拍卖，规则是：轮流出价，谁的价出得最高，谁
将得到该物品，而出价少的人不仅得不到该物品，而且要按
他所叫的价付给拍卖方。

假定有两人争夺

元的物品我们说该物品值
元是指竞投者双方均“认为”它值

元。

这个博弈开始后，只要双方开始叫价，双方就进入了骑
虎难下的状态。因为，每个人都这样想，如果我退出，我将
失去我出的钱，若不退出，我将有可能得到这值

元的物
品，但是，随着出价的增加，他损失的可能性就越大。每个
人面临着两难：是继续叫价还是退出？

这个博弈有一个均衡，）或者（

，即：一

个竞投者第一次就叫出“

元”的竞投价，另外一个竞投
者不叫价，拍卖即告终止。当一个竞投者一下子叫出
元
时，另一方会发现，如果他叫出更高的价，那么无论他是否
得到该物品，他的收益均是负的；如果他不竞投，那么他的
收益为得不到该物品同时也没有损失。因此，当一方
喊出“

元”的竞投价时，另外一方在“叫价”与“不叫
价”两种策略中进行选择时，他的理性选择应当是“不叫
价
”。
但实际中，这种均衡难以达到。原因是多方面的，比如，
两位竞投人对该物品的估价不同，一方认为它值

元，另
一方认为它值

的

元的竞投人喊出

元。当认为值

竞投价时，该博弈有可能并不能终止，认为值

元的一方
可能会叫出超过

元的价。此时，叫“

元”的一方会考
虑，如果停止，他将失去

元，于是他会继续叫下去..双
方进入了骑虎难下的状态。直至一方不能忍受为止。
在实际中不会出现“原原本本”这样的拍卖。它只是一
类游戏的抽象或模型。冷战期间，美国与前苏联间的军备竞
赛就是“骑虎难下”博弈。这场“拍卖”以前苏联的解体而告
终，前苏联是“输”家。美国虽然表面上是赢家，但武器竞赛
过程中，耗费了美国大量的资源，从这一点来说，美国也是
输家。在人与人之间的关系中也经常见到这样的博弈。比如
在一个单位之中，因某种原因，两人相互为敌，谁都想战胜
对方。争斗是要耗费精力和时间的，因而，争斗的双方都是
输家。但谁都不想退让，因为退下来没有面子，然而进一步
的争斗对双方来说，都是既耗时又耗力。

“骑虎难下”博弈对双方来说均是难以忍受的。实际中有
可能发生的是这样一个博弈：对一方来说是“骑虎难下”博
弈，而对另一方来说则不是。比如，人们常常选择以“按揭”
形式来供房：房屋购买者与发展商之间确定一个购买价，然
后发展商、购房者与银行三者订立一个协议，购房者先交少
量购房款，银行将余额付给发展商，购房者分期将本和息还
给银行。这是一个三方均得益的制度。但是，在这个过程中，
购房者很有可能进入“骑虎难下”博弈。当房价跌破当初买
的价格并且没有升的希望时，购房者面临着继续按揭供楼还

是停止按揭供楼的两难选择：继续按揭供楼，就等于不断地
将钱扔进水里，而停止按揭供楼，以前的钱就等于白花了。

还有一种情况，在售房过程中，销售人员往往通过多种
手段使购买者订立合同，并先交一部分定金。购买者一不小
心便进入了“骑虎难下”博弈：若终止合同，定金便收不回
来，而如果不终止合同，将可能承受更大的损失。当然，销
售者的行为不一定是违法行为；购房者以按揭形式买房也不
一定必定陷入骑虎难下的困境。当房价在攀升时，买房者还
可以大赚一笔；只有当房价不断下跌时，买房者才会陷入骑
虎难下的博弈。

在当今的商业社会，设下“骑虎难下”博弈来进行欺骗
是常有的事情。作为策略家，最好的方法是避免进入这样的
博弈；如果因某种原因陷入了博弈，要以某种方式诱使对方
先退出这个博弈，使对方成为出第二价格的人，使对方承担
退出的损失；如果无法使对方退出，自己及时抽身为上策。

掌握的信息
越多越有利于决策

我们几乎永远都不可能掌握进入情境的全部因素。每时
每刻都会有一些新的因素进入情境，而某些旧的因素则变得
完全不重要了。于是，常常会有这种情形出现：此时做出的
一个看来明显是很愚蠢的抉择，由于情境的变换，在彼时却
俨然是最合乎逻辑和最明智的了。

因此，在实际的决策过程中，应把最大限度增大功利的
原则作为一个根本性的原则，不仅应全面地评估各个因素，
而且应对可能的因素的变化做出尽可能的预测，从而使决策
具有更普遍的意义和价值，实现功利效应的连续性。

我们来看这样一个事例。一个大学生打算买一部照相机，
他积攒了足够的钱进城去。他来到甲商店，在这里他看到了
心目中所期望的那种型号的相机，标价是

元。他觉得这
价钱可以接受，但他又想：货比三家不吃亏，最好还是再去
别的地方多转转，或许还有更便宜的价格。他的这种想法无
疑是正确的。从信息论看，多了解一些行情，才能做出最佳
选择。于是他又来到了乙商店，也找到了那种型号的相机，

可标价却是

元，整整多出了

元。显然在这里买太亏
了。他毫不犹豫地退出了这家商店，决定再去找一家看看。
他转了许久，又到了丙商店，也看到有那种型号的相机出售，
标价是
元。这标价虽不能说太高，可毕竟比甲商店里的
价格贵了
元。该怎么办呢？这时天色已晚，学生觉得又累
又饿。究竟是该忍着饥饿与疲劳到甲商店去买便宜的相机，
还是干脆买这
元的相机，早点儿回去吃饭休息？他想来
想去，觉得不值得为
元钱再跑那么多路，于是选择了后者。
第二天，他不再饥饿了，体力也完全恢复了，昨天的疲
乏消失得无影无踪。他开始后悔了，觉得昨天还是应该坚持
一下，省下那

元钱。
事隔一天，这学生的决策就完全不同了。可我们能说出
哪个决策是正确的、哪个又是错误的吗？几乎不能。也许这
学生当初的选择是对的，只不过今天情境完全不同了，他才
改变了念头。完全有这样的可能性：他昨天坚持了下来，又
跑到甲商店省

元钱买下了相机，结果他太疲劳，第二天早
上起不来，误了课，甚至有可能饿过头，闹起胃疼。那样他
就会同样后悔：昨天不该为那
元钱去奔命，何苦弄成今天
这个样子，太划不来了。
这样说来，无论他当初怎样抉择，他都终将会后悔的。
这真是所谓“此一时也，彼一时也”。其实我们许多的实际抉
择都受所面临的情境的牵制，而并非我们本身决策能力的高
低所致。

我们已知要通过决策使可能的利益达到最大限度的原则，
我们还知道，要完成这样的最优化决策需要对所有信息进行
全面的合理的评估。然而，在实际的决策中，最优化很难实
现，即使实现了，也是暂时的。原因就在于，我们并不知道
此时此地我们是否已经掌握了所有的与抉择有关的信息，或
者，我们不能确切地判断这些信息是否会随时间的推移而有
所改变。实际上，我们每时每刻都在接受着各种信息，它们
可能会对现实的问题及有关决策产生影响。如果不能对此有
充分估计，如果在决策中只注重对现有信息的处理而忽视可
能出现的变化，则很难使决策最优化，甚至每当你做出一个
选择时，你会发现它已经过时了，不再适用了。

博弈论还有一个译名就是“对策论”，我们也可以说是
“计论”。用计策来算计敌人，不仅要自己选择恰当的计策，
而且要算准对方用什么计策。这不就是博弈吗？《三国演义》
中到处都充满着“计”，什么是“计
即用策略赢对方。

“计”就是策略；用计，
下面我们用著名的空城计来解释不完全信息下的博弈。

现在让我们看《三国演义》中一个著名的“空城计”：
街亭失守，司马

引大军蜂拥而来。当时孔明身边只有一班
文官，
名军士已分一半运粮草去了，只剩

名军士
在城中。众官听得这个消息，尽皆失色。孔明登城望之，果
然尘土冲天，魏兵分两路杀来。孔明传令众将旌旗尽皆藏匿，
打开城门，每一门用

名军士，扮作百姓，洒扫街道。而孔
明羽扇纶巾，引二小童携琴一张，于城上敌楼前凭栏而坐，
焚香操琴。司马懿自马上远远望之，见诸葛亮神态自若，顿
时心生疑忌，犹豫再三，难下决断。又接到远山中可能埋伏
敌军的情报，于是叫后军作前军，前军作后军，急速退去。

司马懿之子司马昭问：“莫非诸葛亮无军，故作此态，父亲何
故便退兵？
”司马懿说：“亮平生谨慎，不曾弄险。今大开城
门，必有埋伏。我兵若进，中其计也。”

孔明见魏军退去，抚掌而笑。众官无不骇然。诸葛亮说，
司马懿“料吾生平谨慎，必不弄险；见如此模样，疑有伏兵，
所以退去。吾非行险，盖因不得已而用之，若弃城而去，必
为之所擒”。这就是为后人广为传诵的“空城计”。

当然，“空城计”不过是小说家言，就如博弈论中的游戏
一样，未必会在现实中出现。但是作为一个博弈模型，这个
故事还是很有启发性的。

在“空城计”博弈中，司马懿兵多将广，几乎所有“好
牌”都抓在手里，而诸葛亮的“好牌”只有一张：那就是
“信息”。问题的关键在于：司马懿不知道自己和对方在不同
行动策略下的支付，而诸葛亮是知道的，他们对博弈结构的
了解是不对称的。诸葛亮拥有比司马懿更多的信息，他知道
自己兵力微薄，但是司马懿并不知道。而且，为了让司马
无从了解、判断，诸葛亮还偃旗息鼓，大开城门，打起了心
理战。因此这是一个信息不对称的博弈。在这里，孔明可以
选择的策略是“弃城”或“守城”。无论是“弃”还是“守”，
只要司马懿明确知道他自己的收益，那么孔明均要被其所擒。
孔明唯一的办法就是不让司马懿知道他自己的策略结果。他
的空城计是降低司马

进攻的可能收益，使得司马认为，
后退比进攻要好。

在信息不充分的情况下，博弈参与者不是使自己的收益
或效用最大，而是使自己的“期望收益（或效用）”最大。比
如：如果让你在“有

的可能获得

元”与在“有
的可能获得

元”两者之间进行选择，你当然选前者，因

为前者的“期望所得”为：元

元，而后者为：

元。

在“空城计”博弈中，孔明了解双方的局势，制造空城
假象的目的就是让司马懿感到进攻有较大失败的可能。如果
我们用概率论的术语来说，诸葛亮的做法是加大司马懿对进
攻失败的主观概率。此时，在司马懿看来，进攻失败的可能
性较大，而退兵的期望效用大于进攻的期望效用，即：司马
懿认为进攻的期望效用低于退兵的效用。诸葛亮惟有通过这
个办法，才能让司马懿退兵。

司马

元

想，诸葛亮一生谨慎，不做险事，只有设定埋伏
才可能如此镇定自若，焚香操琴。此时，司马懿觉得“退”
比“进攻”更合理，或者说期望效用更大。于是后军变前军，
前军变后军，后退而去。结果是诸葛亮得以逃脱。
司马懿对局势的判断不是没有道理的，他对诸葛亮的判
断是基于以前的认识，这就是归纳法。归纳法是人们认识和
总结客观事物规律的一种方法。

严格来说，归纳法不很科学，例如，过去人们通过观察，
得出“所有哺乳动物都是胎生的”这个结论，可是后来发现
了鸭嘴兽，这个理论就破产了。所以一位哲人曾说：我们并

不知道明天太阳还会不会升起。司马懿因为孔明“生平谨
慎
”，就料定他“不肯弄险
”，也是一例。

在社会经济生活中，尤其在博弈局势中，谁掌握什么样
的信息对于事情的结局至关重要。因此，如何描述信息、了
解不充分的情况在博弈论中就成为一个非常重要的问题，由
此产生了不完全信息博弈理论。事实上，规范地研究不完全
信息问题，是博弈论乃至整个经济学发展的一个重要的新阶
段。

在现实生活中，不完全信息的形态纷繁多姿，这为认识
和研究其分布和变化规律带来了很大障碍。

在现实社会经济环境中，在进行策略选择时对有关信息
了解不充分的情况随处可见，可以说是现实生活中的常态。
然而在经济学中一直缺乏处理不完全信息的一般性手段，在
博弈论的早期发展历史中也是如此。这使它受到了严厉的批
评，人们认为其分析缺乏现实基础，其结论也就失去了实用
价值。这种局面直到豪尔绍尼年提出了贝叶斯博
弈理论才得以改变，从此，博弈论成为研究信息问题的重要
手段。

不完全信息博弈理论中的不完全信息具有特定含义，它
专指一种博弈局势中

局中人对其他局中人（或者他自己）与该种博弈局势有
关的事前信息了解不充分，而不是博弈中产生的与局中人实
际策略选择有关的信息。这里所谓的事前信息是指关于在

博弈实际开始之前局中人所处地位或者状态的信息，这种地
位与状态对于博弈局势会产生影响。

现实博弈中的不完全信息具有多种形式，例如，局中人
对其他局中人（或他自己）所掌握的自然资源、人力资源、
商业经验、决策能力的了解不充分，对其他局中人的偏好与
品位不完全了解，对其他局中人的可用策略不完全了解，对
处于一种博弈局势中的局中人的具体数目不完全了解，等等。

如果有一颗料事如神的水晶球，作决策就不再是一件难
事了：不但可以逢赌必赢，还可以把赢来的钱再做无风险且
高利润的投资；拥有完美的另一半，还能在完美的环境里成
功培育出完美的子女；更棒的是，绝不会搭乘可能出事的飞
机或汽车。如此一来，不但生活有保障，更能活得充实又美
妙。可惜，实际上我们无法掌握所有变因，更无力预测未来，
甚至连自己将来想要什么都不知道，所以使得作决策变得困
难重重，更别说多人决策、各持己见的状况了。

不管是对未来、过去和生命的意义，抑或是内心的渴望，
只要是我们不知道的部分，都称之为“不确定性”。不确定性
就像死亡、缴税这等事一样，是无法避免的。一般人提到不
确定性就会联想到迟缓、笨拙、优柔寡断（这一点可能就是
不确定性本身所造成的），以及懦弱等等字眼，但是这么多的
词汇，说穿了只是表示“我们有所不知”罢了。不过，话说
回来，有些事（例如某人的电话号码）可以很容易找到答案，
但有些事就像“未来”一样，本来就是不可知的，所以不必

因为不知道而觉得丢脸。因此，不管别人知不知道，只要有
你不知道的事情存在，就有可能陷入不确定的情境之中。如
果有人宣称他无所不知，这种人你最好对他敬而远之。

我们已经说过，“空城计”只是虚构的故事，不太可能在
现实里发生。你可能会想：如果换了我，尽管可能没有司马
懿那么聪明，可还是能够活捉孔明。

我们可以设想，其实司马懿完全可以派出一个小分队搞
火力侦察，探明虚实再作决断。这样即使孔明真的设下了埋
伏，他的损失也不大；如果没有埋伏，就可以进攻活捉孔明。
姑且把中计的概率看成

，在一个对等赌局中，所得大于
所失，这个风险是值得冒的。

美军攻陷巴格达就是采用了这一战术。萨达姆的共和国
卫队已经溃不成军，无法组织有效防御，可以说也是一个不
得已的“空城计”。美军也不知道这里面有什么文章，于是就
连续派出坦克分队试探进攻，几次以后，发现对方确实无力
抵抗，于是将巴格达一举占领。

成语“黔驴技穷”说的也是这个道理。老虎没见过驴这
个“庞然大物”，就

（其实毛驴并不比老虎大多少）换句话说，
是不知道对抗下的“支付”，开始有点怕这个家伙。可是长期
共处，又不得不明确双方的地位，于是就进行试探，每次进
一小步，直到摸清对方底牌“技止此耳”，于是老虎就吃掉了
毛驴。这就是一个逐渐掌握信息，并在此基础上做出判断的
过程。

再来看一个故事。有一个卖草帽的人，有一天，他叫卖
归来，到路边的一棵大树旁打起瞌睡。等他醒来的时候，发
现身边的帽子都不见了。抬头一看，树上有很多猴子，而且
每一个猴子的头上都有顶草帽。他想到猴子喜欢模仿人的动
作，于是就把自己头上的帽子拿下来，扔到地上。猴子也学
着他，将帽子纷纷扔到地上。于是卖帽子的人捡起地上的帽
子，回家去了。后来，他将此事告诉了他的儿子和孙子。很
多年之后，他的孙子继承了卖帽子的家业。有一天，他也在
大树旁睡着了，而帽子也同样被猴子拿走了。孙子想到爷爷
告诉自己的办法，他拿下帽子扔到地上。可是猴子非但没照
着做，还把他扔下的帽子也捡走了，临走时还说：我爷爷早
告诉我你这个老骗子会玩什么把戏。

有些信息可以在决策之前掌握，还有一些信息出现在决
策的过程中，这就需要某些特殊素质了，比较聪明、敏锐的
人可能在这个环节占据先机。

子兵法》说：“兵者，诡道也。故能而示之不能，用

而示之不用，近而示之远，远而示之近，利而诱之，乱而
取之，实而备之，强而避之，怒而挠之，卑而骄之，佚而
劳之，亲而离之。攻其无备，出其不意。”大意是说：用兵
打仗，离不开运用诡计让对方错误估计我方的实力，错误
判断局势。用利益诱惑敌人，用扰乱削弱敌人；敌人有实
力，我方要做好准备；敌人过于强大，我要避免作战；在
作战中要将其激怒，使其骄傲，使其疲惫，使其分裂，这

些都能削弱对方的判断力和战斗力。这样，我方的行动才
能出乎对方意料，打击对方的薄弱之处。

显然，要实现“攻其无备，出其不意”的目的，一方
面要掌握对方的真实信息，同时要防止对方掌握我方的真
实信息。

本章的目的是要探讨如何在不确定的情况下做出理性、
一致的决策，换句话说，首先必须承认自己虽然没办法做到
无所不知，但也不至于一无所知，而且应该或尽可能有效地
运用自己所知的一切。

有这样一则阿拉伯谚语：
愚蠢的人，他无知，并且不知道自己无知远离他；
单纯的人，他无知，但知道自己无知教育他；
迷迷糊糊的人，他有知，但不知道自己有知唤醒他；
睿智的人，他有知，并且知道自己有知追随他。
古希腊哲学家苏格拉底不明白自己为什么被认为是最聪

明的人，他到处与所谓有知识的人对话，通过对话他发现，

自己与其他人的不同在于，。“我知道自己无知”

子

秋水篇》中有这样一段辩论故事：
在

庄子与惠施在濠水的桥上游玩。庄子说：“白鱼在河水中
游得多么悠闲自得，这是鱼的快乐啊。”惠施说：“你不是鱼，
怎么知道鱼的快乐呢？
”“你不是我，

庄子说：怎么知道我不知
道鱼的快乐呢？
”“我不是你，你本来

惠施说：固然不知道你；
就不是鱼，你不知道鱼的快乐，”“请

是可以肯定的！
庄子说：
从我们最初的话题说起。你说‘你怎么知道鱼快乐’的话，
说明你已经知道我知道鱼快乐而在问我。我是在濠水的桥上

知道的。
”

庄子与惠施辩论的中心是，能否知道他人对事物的“知
道”情况。庄子认为“能”，惠施则认为“不能”。然而在他
们的辩论中，存在他们两人都认可的东西；这些东西如：“子
非鱼”、、。

“子非我”“我非子”这些双方均认可的东西构成庄
子与惠施辩论的前提。对于这些前提，庄子与惠施知道，并
且知道对方知道，并且知道对方知道自己知道..这些被认
可的前提是庄子与惠施之间的公共知识。

说到这里我们引出一个非常重要的概念公共知识。

公共知识（）的概念是最早由美国逻
辑学家刘易斯（提出的，经逻辑学家辛迪卡

）以及博弈论专家奥曼（

等人的发

展，今天已经成为逻辑学、博弈论、人工智能等学科里频繁
使用的一个概念。

公共知识是指某一个群体的知识。公共知识在我们日常
对话、交流中起着非常重要的作用：它是交流和对话的起
点从已知的公共知识开始，同时也是交流、对话的终
点形成新的公共知识。当然，人们的误解也往往是由于
对某些公共知识的误解的造成的将本来不是公共知识的
东西看成是公共知识。

一个群体与另外一个群体之所以不同，就在于它们拥有
不同的公共知识。
那么什么是公共知识？

假定一个人群只有两个人

构成，均知道一件
命题

是

的知识，但此时

还不是他们的公共知
识。当
双方均知道对方知道

，并且他们各自都知道对
方知道自己知道
.这是一个无穷的过程。此时我们说，
成了
之间的公共知识。
一般地，如果

是
个人组成的群体
的公共知识，意
即：群体中的每个人都知道
，并且群体中的每一个人都知
道每个人知道

下面我们用一个有趣的趣味推理故事来说明公共知识。
假设教室中有一群孩子，假定有

个孩子
脸上有泥巴。这些孩子能够看到其他孩子脸上是否有泥巴，
而看不到自己脸上是否有泥巴。老师进教室对他们说：“你们
中有人脸上有泥巴；知道自己脸上有泥巴的人请举手。”假定
孩子们之间没有信息交流，并假定他们都是逻辑学高手，能
够进行逻辑推理。当老师重复询问多少遍，才有孩子举手说
“知道”，并且有多少个孩子同时举手？这就是著名的“脸上
个，其中有
沾有泥巴的孩子”之谜（

我们假定这群孩子有

个。
在老师未说话之前，这群孩子组成的群体的公共知识有：
“每个孩子都有逻辑推理能力”，“每个孩子都听老师的话”、
“老师所说的话是真的”、

“每个人都不知道自己脸上是否有泥
巴”..当老师进入教室后说：，

“你们有人脸上有泥巴”群体
的公共知识发生了变化。“你们有人脸上有泥巴”是指，至少
有一个小孩的脸上有泥巴。老师做了这个“公布”之后，“至

少有一个小孩的脸上有泥巴”成了这群小孩之间的公共知识，
即每个人都知道它，每个人都知道其他每个人都知道它..

老师问“知道自己脸上有泥巴的人请举手”，无论有人举
手还是没有人举手，每个人都能够观察到的。也就是说，老
师问过之后，举手或不举手现象的发生都会改变公共知识。

如果这

个孩子中有
个孩子的脸上有泥巴，除了这个
有泥巴的孩子不知道外，其他人都能够看到并且知道。老师
说“你们中有人脸上有泥巴”后，群体有了一个新的公共知
识。脸上有泥巴的孩子看到其他孩子的脸上没有泥巴，他自
然会推理得出结论：他的脸上有泥巴。而其他孩子不能判断
自己的脸上是否有泥巴。因此，当老师说“知道自己脸上有
泥巴的人请举手”后，该孩子马上举手说“知道了”。
如果这

个孩子的脸上有泥巴，尽管老师
说了“你们中有人脸上有泥巴”，两个脸上有泥巴的孩子因看
到另外一个孩子的脸上有泥巴，他不能得出自己的脸上有泥
巴，其他
个孩子中有
个孩子也不能得出。因此，当老师说“知道自己
脸上有泥巴的人请举手”后，所有孩子都没有举手。这表明
这不是上述只有
个孩子的脸上有泥巴的情况。即
个孩子
当中至少有
个孩子脸上有泥巴。当第一次所有孩子都没有
举手，这两个脸上有泥巴的孩子因只看到另外一个人的脸上
有泥巴，马上推理得自己的脸上有泥巴。因此，当老师第二
次说：“知道自己脸上有泥巴的人请举手
”，脸上有泥巴的
个
孩子都举起了手。

如果这

个孩子的脸上都有泥巴，老师第
次说“知
道自己脸上有泥巴的人请举手”，这
个孩子此时便都举
起了手。

因此，这个脸上沾有泥巴的孩子之谜的答案是：假定有

个孩子的脸上有泥巴，老师第
次到
次说“知道自己
脸上有泥巴的人请举手”时，都没有学生举手（都不知道自
己的脸上是否有泥巴），当第

次说“知道自己脸上有泥巴
的人请举手
”，所有

个脸上有泥巴的孩子都举起了手。

在桥牌中，“叫约”是实力的体现，你有多大的牌，就可
以叫多大的约。但这又带来一个问题：你的叫牌会给对手提
供你这手牌的情报，比如你叫三梅花，对方就知道你的梅花
很多，至少是个七张套，而且其中有大牌点。其反面的意思
就是：你其他的牌可能不怎么样。如果他的牌也不错，就可
能叫更高的约，占据主动打击你的弱点。由此可见，打牌其
实从叫牌就开始了。双方都要通过叫牌争取定约，同时要尽
可能地迷惑对手，使之做出错误的判断。

我们已经知道，“博弈论”是由著名数学家诺曼创立的，
而这个理论正是由一个典型的关于信息的游戏开始：那就是
一个玩家在面对无懈可击的玩牌对手之时，是否要夸大其辞，
并且次数又该多频繁。

诺曼的发现非常令人感到意外，他认为即使对手明知道
你喜欢这样，有时候你还是应该这样。他研究了各类的牌戏
战术，发现“虚张”的频率一到某个程度，胜数最多，而打
老实牌和“虚张”次数过多的胜数机会较少。另外他也发现，

玩牌虚张的频率达到某种标准时可以赢钱，低于或高于某个
标准输钱的成分就比较大。

这不难理解，一个人如果适当地“吹牛”，别人就会信以
为真，如果他玩得过了火，人们就会识破，而且，一旦获得
了“吹牛者”的名声，那么他就成了那个大叫“狼来了”的孩
子，再说什么也没用了。那么什么是“适度”呢？自然是不
能过分夸张，如果一个小个子非要给人留下“斗士”的印象，
结果只能是自取其辱。

虚张声势归根结底就是要藏好自己的底牌，并因此获得
利益。这有两种情况：一是还有一定实力，通过迷惑对手，
使之出现破绽，一击致命；二是没有什么实力，只靠大张旗
鼓换取对方让步。总之，你要知道自己的目标，一切策略都
是为此服务的。

还要注意：“虚张”也是双刃剑，弄得不好反会弄巧成拙。
比如出虚张迷惑对手，却使同伴被误导。在生活中也是如此，
吹牛使诈，是为了获得人们的拥戴，可是做过了头，反会使
人反感，无端树敌。所以古人说：诈巧不如拙诚。这类手段
不得不用方用，但是也不可常用。

一个古董商发现一个人用珍贵的茶碟做猫食碗，于是假

装对这只猫十分喜爱，要从主人手里买下。猫主人不卖，为

此古董商出了大价钱。成交之后，古董商装作不在意地说：

“这个碟子它已经用惯了，就一块送给我吧。”猫主人不干了：
“你知道用这个碟子，我已经卖出多少只猫了？
”

这就是一个“信息博弈”的例子。古董商掌握“碟子是古

董
”这个信息，他认为猫主人不知道，这种“信息不对称”对他

有利；可他万万没想到，猫主人不但知道，而且利用了他“认为

对方不知道”的错误大赚了一笔。这才是真正的“信息不对称”。

信息不对称造成的劣势，几乎是每个人都要面临的困境。

谁都不是全知全觉，那么怎么办？

首先，为了避免这样的困境，我们应该在行动之前尽可

能掌握有关信息。人类的知识、经验等，都是获取信息的

“资源库”。当然，我们并不一定知道未来将会面对什么问题，

但是你掌握的信息越多，正确决策的可能就越大。

在社会经济活动中，人们常常隐瞒真实的信息。最典型
的例子，是在市场里老是听到买东西的人埋怨东西太贵，较
少听到买东西的人称赞东西便宜。同时，厂商又老是埋怨东
西卖不出好价钱。在经济学家看来，对价钱的抱怨是自相矛
盾的。如果嫌贵，你可以不买；如果嫌贱，你可以不卖。因
为在市场上，人们不是用言词，而是用行动表示出他们的爱
好。如果你自愿地同意做一笔交易，这说明你认为，虽说不
是很理想，但是做这笔交易至少比不做这笔交易要好。虽然
两块钱买一把菜你嫌贵，但是你还是认为用两块钱换回这一
把菜是值得的，不然的话你可以不买，因为没有人强迫你。

至于谈判当中隐藏自己的真实信息，常常还受到法律保
护，不然怎么会有泄露经济情报罪和盗窃经济情报罪呢？

提取和甄别信息，是博弈论面对的大问题。引用很多的一
个例子是所罗门王断案的故事。两个女人为争夺一个孩子吵到所
罗门王那里。一个女人说：我和这妇人同住一个房间。

“陛下，我
生了一个孩子，三天以后这妇人也生了一个孩子，房间里再没有

别的人。夜里这妇人睡觉的时候，把自己的孩子压死了。她半夜
醒来，趁我睡着，把我的孩子抱去，把她已经死了的孩子放在我
的怀里。天亮要喂奶的时候，我才发现怀里的孩子是死的，仔细
察看，这并不是我生的孩子。
另一个女人赶紧说：活孩

”“不对，
子是我的，死孩子才是她的。
”她俩吵得不可开交。

所罗门王喝令她们别吵，吩咐下人拿刀来，“如果她们还
吵。就把孩子劈成两半，一半给这个妇人，一半给那个妇人”。
一个女人赶紧说：“大王把孩子给那个妇人算了，万不可杀他。
”
另一个女人说：“这孩子既不归我，也不归她，劈了算了。
”所
罗门王知道心痛孩子的女人一定是孩子的亲生母亲，便吩咐下
人把孩子给她。

这是获取和甄别信息的范例，直到现在，博弈论专家还
在继续讨论和发掘所罗门王断案的故事。例如，以色列一位
教授和美国一位教授最近合写的一篇论文，就把竞标一项工
程的两个企业，看做是两个“妇人”，其中一个企业实力可
靠，另一个企业只是想夺标以后赚取转包的利益。问题是如
何设计规则和机制来获取和甄别信息。

当一个博弈是“零和博弈”或“常和博弈”时，博弈思
维者所获得的信息以及信息的真假鉴别便十分重要。

两个人玩“锤子剪刀布”的游戏是“零和博弈”：一方赢
了，另一方肯定输；或者双方是平局。如果对方确切地知道
你将出“锤子”，对方出“布”，那么对方肯定能够赢你。如
果你用一个方法让对方“知道”你将出“锤子”，对方也相信

的话，他将出“布”，而实际上你出的是“剪刀”，于是你赢
了。如果对方知道你的计谋，而将计就计的话，他将出“锤
子”，你出“剪刀”想赢对方的计谋归于失败，对方就赢了
你。即对方甄别出你发出的将出“锤子”信息是假的。

在战争中，“反间计”就是这样一个信息战策略：故意让
敌人的间谍“知道”我方将要采取的策略的情报而间谍
所知道的只是我们“想”让他们知道的，我方将根据对方将
要采取的策略制定相应的策略。

无论是在战争之中，还是在商战之中，间谍的作用是不
可替代的。百战不殆”“知彼”，往往要通过

“知己知彼，中的
间谍来完成。

通过间谍了解对方的实力和策略选择等信息是间谍的基
本作用，然而，对方也在使用间谍，也在了解我方的情况。
面对敌人的间谍活动，我们通常有两种做法：或者封锁信息，
不让对方了解我方的信息；或者将计就计，故意露出破绽，
让对方的间谍获取信息当然是虚假的信息，使对方做出
错误的策略选择。后者即为反间计。使用反间计策，即让对

中周瑜伪造蔡瑁和张允写给

方的间谍为我所用。《三国演

周瑜的信件，并故意让蒋干偷到，以报告给曹操，这便是周
瑜使用的反间计策。在敌对关系的双方较量中，反间计策往
往能够取得比较好的效果。原因是，对方能够相信自己人所
见的信息。此时，使用反间计策的一方，为了使反间计能够
达到预期的效果，一定不要让对方了解到自己的真实意图

信息的刺探和反刺探是战争、商业、外交等活动中的永
久话题。

大家知道，知情权是人们重要的社会权利之一，即人们
发布和接受信息的权利得到尊重和保护（当然要在法律的规
范内）。为什么知情权如此重要？就是因为信怠的传播有利于
人们在掌握信息之后，通过理性选择，做出正确决定。这对
社会和个人都有好处。

培根曾说：知识就是力量。的确如此，我们也可以说：
信息就是权力。在专制时代，统治者维护自身权力的一个重
要手段就是垄断信息。孔子说：民可使由之，不可使知之。
大意是：你要引导人民该怎么做，但不要让他们知道为什么
该这么做。

民众的知情权不是什么人赐予的，而是争取来的。不管
怎样，现在我们接受信息的渠道更多了，信息也更多了。但
是，我们常常很轻易地放弃了这个来之不易的权利。我们一
股脑接受来自各方面的片面信息，我们对事物的态度取决于
电视上怎么说，至于它说的对不对，有什么根据，我们并不
知道，或不感兴趣，谁是坏人。
我们就

“快告诉我谁是好人，”

像孩子那样要求一个简单快捷的答案。
对各种信息，我们需要选择：还是？

“拿来”“接受”不同
在于：“拿来”的才是你的，而“接受”的不是。即使是好东
西，也不会为你所有。

当你无所适从时，你希望得到正确的指导。从人生设计、
该不该和那个女孩结婚到填写足球彩票，都是如此。这时我
们往往会求助于专家。关于专家事实上，专家或权威也会犯
错，但还是对的时候多（否则他就不是权威了）。权威因为拥
有更多信息、更强的处理信息的能力，所以他们的意见可能
比普通人更有价值。但是并不一定正确，因为即使权威也不
可能全知全觉。这里有一个概率问题：好比某人获胜的概率
较大，并不等于胜利已经属于他。

权威只是某一方面的，一旦超出了他所擅长的范围，他
的意见并不一定比别人高明，可是我们时常忘了这一点。好
多大人物就是因为在自己并不擅长的领域轻率发言而蒙受羞
辱，如在“大跃进”时代，一位权威科学家撰文证明“亩产
万斤”是完全可能的。即使是出于真诚，这位科学家的发言
也是极不负责任的，他在自己并不了解的领域发言，可其他
人并不知道在这方面，他懂得并不比别人多。

在决定要不要听专家意见时，你还要弄明白：这个问题
有标准答案吗？如果你问怎样造一架飞机，一个技术权威会
给你最有用的忠告；可是如果你的问题是哪个队能获得世界
杯，你在专家那里得到的就只是一个参考意见。上次世界杯，

一半专家看好法国队，可是这个上届冠军在小组赛就被淘汰
了。

权威不是神，他只是比我们有更多知识或更深的理解。
但他也必须依靠足够的信息、条件来做判断，如果条件是不
充分的，也就可能出错。即使条件充分，如果我们对事物的
理解不充分，他一样可能犯错。

爱因斯坦曾说过一句名言：他不相信上帝在掷色子。他
认为在无序运动背后，一定有某种规律。他用后半生寻找这
个规律，却一无所获。当时很多顶级科学家都很为他惋惜，
但都保持了对他的尊敬。因为爱因斯坦是以严谨的科学精神
进行研究的。试想：如果他利用自己的名望，提出某种大而
无当的理论，又会让多少人迷惑？

银行担心挤兑现象。如果某个银行储户听到他存钱的银
行“破产”的消息，无论这个消息是真的还是谣言，他们都会
纷纷到银行提款。因为他们担心，如果不及时提取他们所存
的钱，而其他储户提前取走了钱，他们将无法收回他们的本
钱。这便是挤兑现象。

我们举一个简单的例子。假定一个银行只有两个储户，
每人在银行存了

元钱。由于银行经营不善，到期难以支
付给储户本金及利息。假定每个储户均“到期取款”，银行只
能给每个储户

的本钱；而如果一个储户“提前取款”，
银行可以给他本钱，即

元，而“到期取款”的另一位储
户只能得到

元；如果两个人储户均“提前取款”，银行只
能给他们每人

元。用支付矩阵表示这两个储户之间的博
弈。假定这两个储户之间的博弈是完全信息博弈。

这个博弈的纳什均衡是，甲乙均选择“提前”取款，而
这种策略选择对每个储户来说均不是有利的策略。有利的策
略是双方均“到期”取款，但是，这一结果是达不到的。

为了防止挤兑现象的发生，所有的银行均准备了一定的
准备金，以防止储户大规模取款。政府规定了银行准备金与
总的存款的比率不得低于某个数字，以抵抗因挤兑带来的金
融风险。

“控制谣言”是防止银行挤兑的有效的策略。一旦出现银
行破产的谣言，银行总会极力予以澄清。即使消息是真的，
即银行真的出现资不抵债，银行在舆论上也要让人们相信它
并没有出现破产的危机，同时银行要以实际行动让人们相信
它的实力，如千方百计满足先来取钱的储户，以实际行动使
储户重建信心。

社会中的一些现象往往会因谣言而“自我实现”。银行的
资产超过负债，但如果人们纷纷说该银行出现亏损、资不抵
债，储户纷纷去银行提款，由于银行将储户的钱用于投资、
无法及时收回，储户的挤兑行为将使银行破产，谣言于是得
以实现。控制挤兑现象的发生可以防止银行破产。一旦发生
挤兑现象，银行受损，储户更受损。政府也不愿意发生挤兑
现象，当多家银行发生挤兑现象，往往会引发整个社会的金
融危机。

控制谣言传播不仅对防止金融危机是重要的，对于其他
社会问题的防止也是重要的。

该如何做
——如何运用概率

一谈概率这个词，可能会吓退许多读者，概率内容既深
奥又复杂，而且有时还带有神秘色彩。真是这样吗？答案则
是“非也”。所以讲概率之前，我还是先讲一个有趣的推理故
事，看完故事也许你就会对概率有种亲切熟悉的感觉了。

现在有两个人，阿里与巴巴，正在花园里一边喝着酒，
一边讨论关于精灵的神话。正好有个精灵从此经过，被他们
的对话吸引。精灵认为在这个时代，还有人这样仰慕和了解
他们，值得鼓励，于是便决定给这两个人一点奖赏。他把一
笔钱放入两个信封，将信封分别给了阿里与巴巴，出于喜欢
恶作剧的个性，精灵透露，这两个信封里金额不同，其中一
个是另一个的两倍，但他没有说哪个多哪个少。然后精灵随
着一缕轻烟消失无踪。

在精灵消失后，两个人拆开信封，偷看自己拿到的那笔
钱，同时心里忖度着，自己到底拿到的是多的那份，还是少
的那份？

阿里想：这是笔意外之财，我拿到的数额已经很大了，

如果这是多的那份，巴巴就只有我的一半；不过，他也可能
很走运，拿到我的两倍。再回顾整个过程，精灵是先把钱装
好，密封之后才随机发给我们，因此这是一个对等赌局，两
人拿到大份的概率是一半对一半。所以也许我应该跟巴巴谈
个交易，互相交换。既然我赢得一倍金额和损失一半金额的
概率都是

，则仍有期待净利（参照上面故事的逻辑）。
根据决策原则，阿里认为这对他相当有利，便决定和巴巴交
换。即使阿里没有拆开信封也可以做出相同决定，因为钱的
多少并不影响整个思考逻辑。

巴巴以同样的方式思考后，也认为与阿里进行交易对自
己较有利，于是当阿里一提出交换的建议，巴巴马上欣然同
意。两人的情况完全一样，都认为自己能遵从一定的逻辑推
理规范。那么，有没有可能两人同时都是对的呢？毕竟这是
个零和游戏，阿里赢就等于巴巴输，反之亦然，既然不能双
赢，就一定有人是错的。但这两人不都是经过缜密逻辑思考
了吗？

阿里和巴巴都犯了一个重要的错误，以为中大奖的概率
在拆开信封以前或之后完全没有两样。由于精灵在分信之前
充分洗过牌，因此两人在拆开信封前得大奖的概率确实是一
半对一半，但当两人看过内容后，实在没有道理假设他们仍

认为自己得到小份金额的概率还是

元也好，
亿元也罢，他先把奖金分成不等的两份，再充分洗过，阿里

这么说吧，不论精灵的奖金是多少，

拿到任何一个信封的机会都是

，到此都没有问题。不过
在两人拆开信封查看后，情况就完全改观。
所以如果阿里打开信封并发现自己拿到

万元，就可以
推论总奖金只有两种可能：如果巴巴拿到
万元，总数就是
万元；如果巴巴拿到
万元，总数就是
万元。因此，
阿里要算的概率不是究竟自己拿到的是金额大的还是金额小
的（在信封发放前，机会应该是一半一半），而是究竟精灵给
的是
万元还是
万元，这可就是完全不同的选择了。阿
里不应该还相信两者出现概率各是
。如果他认为精灵的
财力或慷慨程度有限，那么他应该设想最坏的状况：精灵给
的是

万元，自己已得到较大笔的奖金，所以不该交换，这
个结论跟他一开始的想法正好相反。

当然，阿里也可以假设精灵非常富有，送出个

万元、
万元根本不算什么。因此，两种情况都有可能，所以结论
和先前想法一致，他应该交换。
重点是阿里不能不顾手中拿的是百万还是更多，而做相
同的假设，因为这里谈的是概率，它的基本原则为所有可能
选择方案的概率值加起来一定要等于

，不论是阿里、巴巴，
还是精灵都不能改变这一点。因此，阿里和巴巴如果要做出
理性决策，就必须估计精灵的财富到底有多少、奖金总额又
有多高；而谁根据手中的金额把奖金总额估算得越精确，就
越可能做出是否交换的最佳决策。至于手中拿到小额奖金的
人会比较倾向交换，这本来就是很合理的。

这里要说明的是：谈概率时一定要弄清楚比较的选择
方案究竟是什么。在阿里、巴巴拿到信封前，他们拿到大
额奖金的概率确实是各半，一旦信封发下来，原来的方案
就消失了，这时再谈既定事物的概率完全没有意义，也就
是概率会随事件的发展、选择的改变或消失等而有所不同。
在信封发下来后，应该考虑的方案就不再是谁拿到哪一个，
而是精灵究竟给了多少。

一般人很容易把一组选择方案的事前概率误以为是其他
方案的事后概率，其实两者根本风马牛不相及。就像赛马开
闸后，马匹风驰电掣向终点进发，这时下注站绝对不会允许
你加注。

很少有一个学科像概率论这样说明我们的直觉是多么不
可靠。我们的经验甚至常识往往和概率论所揭示的答案相悖。

很多人相信某一独立事件的概率要受到过去的影响。比
如在战争中，士兵们相信，躲在新弹坑里比较安全，因为炮
弹两次打中同一地点不大可能。这也许有一点道理：大炮每
次射击，都可能会因反作用力使炮位稍稍移动，弹着点也可
能略有偏差。但是这也只是空谈，因为毕竟不只是一门炮在
射击。

有一个故事，讲的是一个谨小慎微的人坐飞机，他很害
怕会遇上一个带着炸弹的恐怖分子，于是他就自己带了一个
炸弹（当然，炸药已经卸掉了）。他的理由是：一架飞机上有
一个带炸弹的恐怖分子的概率很小，一架飞机上有两个带炸
弹的恐怖分子的概率就更小了。他认为自己的行为减低了遇
到危险事件的可能性，可事实上，他带或不带炸弹不会影响
其他旅客带不带炸弹。

当我们发现以为“天经地义”的东西竟是错的，我们的

第一反应是不相信，第二反应是想弄明白到底怎么回事。自
然，如果没有一点概率学知识，想弄明白也不容易。

一般人一听到概率就害怕，因为这个词太莫测高深，听
来就很“数学”，而大多数人在数学方面又极不自信（这并不
全怪我们，也要怪那些把数学变成苦役的教师们）。其实，概
率与机会其实是相同的概念，不能因为数学家给它起了个拗
口的名字，就把这个有用的概念丢弃。

但是，这并不表示概率的深层意义也是粗糙的概念，也
不表示数学家或气象局在算概率时，不会用到深奥难解的数
学知识，只能说一般决策用到的概率并不需要那么高深的技
巧。生活中有许多情况，即使不了解事物的运作过程，仍可
顺利进行。许多人在工作或休闲时都会用到电脑，他们虽然
不太知道程序是怎么写出来的，也不知道电脑是怎么制造出
来的，对中央处理器、电脑内部零件等如何运作的认知，更
是少得可怜。但多数时候，他们还是可以有效地操作电脑。
汽车驾驶员、电视观众、飞行员，以及众多利用现代科技的
人，都是如此。换句话说，就算不知道事物的运作方式，也
能使用自如。

这绝不是为自己的无知辩护，相反地，愈了解这个世界，
生活就愈丰富、愈美满，也愈能顺利完成每件工作。有人曾
说他犯过很多错误，但没有一次是因为知道得太多所引起的。
其实你不必在开始之前就知道一切，如果你觉得那是必要的，
就注定会瘫痪、茫然，以致一事无成。

这么说有点过于笼统了，下面我们来更详细地说说所谓
的概率中的

和
我们面对的世界是由无数个现实的和可能的事件所构成
的。我们与这些事件之间的认知关系是用概率来刻画的：

必然事件其概率值为

（已经发生的事件当然是必
然性事件）；

不可能事件

其概率值为
或然事件

它是介于必然事件与不可能事件之间的事
件，其概率值为

与
之间的一个实数。
投掷一枚硬币，我们排除掉硬币能够站立这种可能性。
“这枚硬币或者正面向上或者反面向上”，这是一个必然发生
的事件，它的概率为

“它既不是正面朝上也不是反面朝
上”，为不可能事件，其概率为
它正面向上（或反面向
上）的事件为或然事件，其概率为
之间的一个值。
有人会认为，我们得到某个事件的非、非
与
的概率值，
意味着我们对该事件没有足够的知识。因为，如果我们知道
了我们投掷硬币的各种因素，我们就能够计算出来硬币会出
现正面还是反面，既然我们知道被投掷的硬币出现正面（或
反面）的某个可能性，表明我们对抛掷硬币的情况没有足够
的知识。确实，从理论上，如果我们知道了投掷硬币的各种
因素，我们能够确定地计算出硬币出现正面还是出现反面，
但实际上这是很难的，如果不是不可能的话。事实上，我们
用概率刻画事件，这个概率是对外部世界中的事件发生的一

个表达，它包含了某些信息。比如，当我们投掷一枚均匀的
硬币，我们说，它正面向上的概率为

。这个概率值含有丰
富的信息，它表示这枚硬币正面与反面出现的可能性一样。
我们每天均生活在“不确定”的世界之中：商人目前的
生意很好，但他知道有可能出现像“非典”这样突发事件而
使他破产；参加竞选的政客尽管从选前的情况来看对他有利，
但他不能肯定他必然当选；连战和宋楚瑜预先没有想到会有

枪击事件”；贪污犯每天都在估摸着被抓和不被抓的可
能性；保险公司的职员更是经常与不确定性打交道..正是
“不确定性”使社会丰富多彩。

人们对概率存在着三种解释：第一，概率为事件发生的
频率，如人们掷硬币时，出现正面的概率是出现正面（或反
面）的次数与总的掷出的硬币次数之比率；第二，命题之间
的逻辑关系，如：“一只天鹅是白的”对“所有天鹅是白的”
支持程度；第三，人们对外界事件发生的相信程度，如：张
三认为“明天下雨”的可能性小，如为（不下雨的可能性
为，李四认为“明天下雨”的可能性与不下雨的可能性
一样（均为

。这就是对概率的、

“频率主义
”“逻辑主义”
和“心理主义”的解释。概率的这三种解释反映了人们实际
中的三种用法。

好了，高深的理论难免会让你看的头昏脑张，我在这里
尽量避免用专业的术语来说明概率，还是先来看一个著名的
故事美女还是老虎，通过故事讲解概率会更轻松易懂一
些。

从前有个国王，在惩罚罪犯时有个古怪的习惯：把罪犯
送进竞技场，竞技场的一端有两扇一模一样的门，门后分别
关着一只凶猛的老虎和一位美女。国王惩罚犯人的方式就是
让他自己挑一扇门，如果他选中老虎，那么后果可想而知；
如果选中美女，他不但可以马上获释，还可以抱得美人归。

一天，他发现有位英俊潇洒的臣子与公主私通，一怒之
下，也把这个青年送到竞技场，处以传统的惩罚。事前，公
主已经知道哪扇门背后藏的是什么，于是相当苦恼，不知该
把爱人送入虎口，还是送到另一个女人的怀抱？

当命运攸关的这一天来临时，在别无选择的情况下，这
位臣子在竞技场上望了公主一眼，公主示意他选择右边那扇

，他打开门..故事就到此为止。它把一个悬念留给我们：

他遇到的是美女还是老虎？

如果你对佛理有一点兴趣，你可以说“美女就是老虎，
老虎就是美女”之类的漂亮话；如果你对动物学有一点兴趣，
你可能会说“大多数老虎并不吃人”。可是假如你自己陷入了
那个境地，可就没有开玩笑的心情了。两种选择的结果好坏
是明摆着的，可是指导我们选择的信息却很少，而且不可靠。
除了碰运气，我们还有没有更好的机会呢？

这个故事其实反映了一个人们熟知的概念，那就是概率。
明天会不会下雨？丢铜板会出现正面还是反面？想拿到一手
好牌吗？这些问题都涉及概率。

某种事件在同一条件下可能发生也可能不发生，表示发
生的可能性大小的量叫做概率。例如，在一般情况下，一个
鸡蛋孵出的小鸡是雌性或雄性的概率都是

按照巴特勒的说法，概率是“生活的真正指南”。概率论
已经广泛运用于科学、技术、经济和生活的各方面。要打好
做决策的基础，就得在概率方面多下点工夫。

在许多决策的问题里，决策者必须单凭些片面的信息，
甚至没有任何信息的情况下，从好几个选择方案中挑选其中
之一，这个时候，就不得不乞灵于运气了或更准确地说，
听命于概率的拨弄。那么在这种情况下，还有没有什么更可
取的策略？

决策的形成共有五个步骤，每个步骤都极其简单：

列出所有可以采取的行动，包括不采用的行动也要

列出来，而决策就是从各种可能的行动方案中选出一个来；
尽可能列出每个行动的可见后果；
尽量评估每种结果可能发生的机会（可能性和概
率），这一点常被忽略，因此应仔细加以讨论；
）试着表达你对每种结果的渴望或恐惧程度；

最后把列出来的所有因素全部放在一起考量，做出
合理的决策。
我们会逐项探讨后面三个步骤（前两项步骤会随着决策
而有所不同，故在此暂不讨论）。如果根本没办法列出选择方
案或可能的结果，那么你一定得先解决这两个问题，绝没有
第二条路可走。毕竟决策的本质就是从众多选择中，挑出一
个最好的，其目的就是要达到最佳结果。如果你连备选方案
都说不出来，更别想做出任何决策。当然，也不讳言人生的
确存在着未知的选择，也会有出乎意料的结果，但这些实际
生活中的悲剧或惊喜并非本书的主题。

究竟是概率（比如我们说的硬币哪一面朝上的可能都是
）决定了个别事件（某一次掷硬币）的结果，还是个别
事件结果的积累决定了概率？
在理论上当然是概率决定了个别事件（某一次掷硬币）
的结果，但是现实往往与理论给出的答案不相符。
比如，你可能会说：“好吧，我承认，硬币哪一面朝上的
概率都是

，可是如果我连扔

次都是正面，那么下一次
还是正面的概率就应该小于平均值，否则，整个的概率不是
就偏向正面了吗？
”
又比如某个外国人可能不相信全世界每五个人中就有一
个中国人，只因为他认识的所有人中没有一个是中国人。原
因是他的取样太少了，范围又太窄了。

《何为先

一书的作者山谬尔
巴特勒说过，只要掷的
次数够多，铜板就有一半的机会出现正面。这毕竟是因为出
现正面的概率
所造成的，或者不过是概率的定义罢了。
但是，在现实中又有谁会这么不厌其烦地掷这么多次铜

板？如果今天就得下注，你还会反反复复先去试验吗？或是
足球裁判丢一次铜板决定哪一队先开球，这第一次掷的铜板
的结果与概率又有什么关系？所谓的长期或次数够多又有什
么用？

在医院做手术之前，医生通常会告诉我们：这种手术成
功的概率是

。其实，这句话还不足以让我们高枕无忧，
成功的概率是

仅仅意味着大部分情况下手术会成功，也
有及其意外的情况下手术会失败，它失败的概率是

。但
是万一恰巧很不幸，如果遭遇手术失败，那么对这个病人来
说失败的概率就是

了。

如此看来，概率真是个有趣而又重要的课题，它在很多
方面发挥着重要的作用，我们有必要去了解概率，但是不能
迷信它，因为它有时在生活中确实派不上用场，甚至会误导
我们的想法。

现在再让我们来看一下运用贝叶斯定理进行条件概率计
算的两个“疑难”问题。

先来看“囚犯的错误
”。

非洲草原上的部落酋长抓住三个贸然闯入领地的入侵者。
他们是史密斯、琼斯和费奇。酋长决定明天将处决他们之中的
两个。究竟处决哪两个，由酋长来决定，并且已经做出决定。
谁被选中，酋长以及看守是知道的，三个囚犯在处决前是不知
道的。当地的法律规定不允许看守透露给囚犯该囚犯是否被选
中的任何信息。这三个囚犯被分别关押，彼此不通消息。

晚上，费奇恳切地询问看守，明天自己是否将被处死。
看守考虑到不管费奇是否被选中，另外两人之中的一个总要
被处决。所以看守说：“我们不能告诉你你是否被处死，但琼
斯将被处决。”在看守看来，告诉费奇“琼斯将被处决”并没
有向费奇透露任何与他有关的信息。但是，费奇听到看守说
出“琼斯将被处决”，非常高兴。他推断，他逃脱厄运的概率
已经从

提高到

对同一句话“琼斯将被处决”，费奇与看守看法出现了不
同：在看守看来，这句话对费奇没有任何信息内容，而费奇
则认为这句话里包含新的信息。事实上，这两个人的推断不
可能均正确。谁的推断有错？是费奇的还是看守的？

费奇计算了“琼斯被处决的条件下”，自己被处死的概
率，此时费奇处死的可能性确实降低了。但这里的条件不是
“琼斯将被处决”而是“看守告诉费奇‘琼斯将被处决，。这
是两个不同的条件。由于看守是守法的，看守想，琼斯和史
密斯之中必定有一个将被处死，而这也是费奇知道的，看守
认为，他只不过将费奇知道的事情告诉费奇而已。因此，错
误出现在费奇的推理中。事实上看守的话并没有增加费奇不
被处决的概率。

我们来看另外一个与此相仿的例子：抽奖者的难题。

有这样一个博弈，三个门中有一个门的后面有
一辆汽车，另外两个门的后面一无所有。现在让一个人来选，
如果他选的门后面有汽车，他将得到汽车；如果他选择的门
的后面一无所有，他将一无所得。

假定该选择者选择了一个门，比如

门。由于他所选择
的门的后面无论有无汽车，另外的两个门中的一个门的后面肯
定没有汽车。主持人知道每个门后面的情况，现在主持人打开
了另外两个门中的一个该门的后面没有汽车，比如
门。
对于主持人来说，这没有告诉选择者任何信息。现在主持人告
诉选择者还可以改变选择，即在已选择的
门和未打开的

门之间进行选择。问：选择者应不应该改变他的选择？

主持人打开其中一扇门，使得选择者原来选择的门即
门后面有汽车的概率增加了，即从

增加到

。或者，
没有增加选择者选择

门后面有汽车的概率，即选择
门后
面有汽车的概率仍为
，这样，

门后面有汽车的概率增
加了从
增加到

。哪一种看法对呢？

这里，主持人的行为增加了选择者的知识门后面
有汽车的可能性得以排除，这是确定无疑的，但是主持人的
行为增加了选择者已经选择的门（

门）的概率，还是增加
了另外一个门（
门）的概率？
这里的概率有其客观基础，而不是纯粹的心理信念。这里
的概率为
“频率”。我们设想一下，如果让选择者重复选择的
话，那么，他选中汽车的次数与总的选择次数之比为

既然
如此，在每次的选择过程之中，他应当相信，他所选的门后面
有汽车的可能性为

，而不管主持人是否打开另外的一个空
门。即，当主持人打开空门时，选择者已经选择的门后面有汽
车的可能性仍为

，主持人的行为只是增加了另外一个没有
打开的门后面有汽车的概率：由

增加到。如果问选择
者是否改变他的选择，选择者当然应当调换他的选择。这如同
你去抽奖：假定一百万张彩票中有一张有奖，你随机买了一张。
假定举办者知道哪张彩票有奖，他对你说：其他张彩票
中没有奖，你手里的一张彩票和另外一张彩票中必有一个有
奖他不说假话。规则规定你可以与另外的彩票“调换”。举

办者问你：你将继续持有你手里的这张彩票还是换另外一张彩
票？你面临着这样的选择。此时，你当然要选择“调换”：如果
选择“调换”，你中奖的可能性为“不调
换”的话，你中奖的可能性为。你信还是不信？

这两个所谓选择难题是由于人们对概率或概率的改变的
不正确理解造成的。

如果告诉你，一个硬币在平滑桌面上旋转之后，一面向
上的次数多于另一面，也许很多人会大吃一惊。其实硬币的
正反面重量分配确实不同，正面背面图案的差别，对钱币旋
转会造成一定的影响。所以，严格来说，在桌面上旋转硬币
猜正反面，并不是一个完全对等的游戏。

在某些无法确定是非的问题上，人们常犯的一个错误是
滥用“中立原理”。例如有人问你：火星上存在生命的可能性
有多大？你并不知道，但是你想：只有两种可能，有或没有，
所以，有生命存在的概率是

。如果你是这么想的，你就
犯了滥用“中立原理”的错误了。

所谓“中立原理”是由经济学家凯恩斯在他的《概率论》
一书中总结的，大致内容是：如果我们没有理由说明某事的
真假。我们就选对等的概率来表明它的真实程度。

在漫长的历史中，这个原理曾被应用于科学、哲学、经
济学和心理学等很多领域，因而声名狼藉。例如法国天文学
家、数学家拉普拉斯有一次以这个原理为基础计算太阳明天

升起的概率，答案是将近

为什么会有这么离谱的答案？拉普拉斯是如何论证的，
我们并不了解，但是可以推想。就拿“火星生命”的问题来
说吧：火星上存在生命吗？“中立原理”的回答是：有的
可能性；那么，火星上存在最简单的细胞生命吗？同样，可

能性是存在植物生命吗？还是存在低级动物生
命吗？存在哺乳动物吗？.好了，现在看看火
星上不存在以上形式生命的概率：乘乘乘

.结果是，也就是说，至少存在一种生命的可
能性达到了，这和原来我们估计的相矛盾了。

“中立原理”只能应用于客观情况是对称的这一前提。不
能因为答案是二选一，就认定两种答案的可能性都是
同样的，如果你买彩票或竞选总统，可能的结果不是赢就是
输，可惜这两个结果并非概率各半。

决策几乎都是处理单一事件，掷铜板就是单一事件，在
只能掷一次的情况下也很难看出这个铜板是不是一枚真铜板，
也许会出现正面，也许会出现反面。或许是太过天真，但我
们也只能假设铜板是公正的，依此来估计可能的概率。

因此，所谓的决策概率是指

到
之间用来测量某件事
发生可能性的数字，而这个数字可以利用各种方便的技巧来
推测。即使必须去问专家或数学家也无妨，只要记得找个高
水平的人就是了。如果要用猜的方法也可以，但千万别高估
自己的技巧，可惜这也是很多人常犯的错误。也许有人比你
更了解情况，对概率的预测也比较准确，如果能找得到这样
的人来帮你，尽管去吧。
当然，概率也不是完全随机的，在计算概率时，还是有
规则可循的，内容并不多，但很明确，主要是避免掉入自相
矛盾或无稽之谈的泥沼。譬如要计算两个独立事件都发生的
概率就是将个别概率相乘。如果一个

分钱的硬币，每两次
有一次出现正面的机会（概率为

，那么两个硬币同时掷

出正面的机会就是

，也就是概率值为

。同理，两个
硬币至少有一个出现正面的概率为

。两个硬币同时出现
反面的概率也是

。因此无论如何，只要给定概率值，就
必须严格遵守结合两事件发生的概率原则，否则会出现不一
致的现象，阻碍整个决策过程。
以下就是三项基本的概率原则：
两个完全独立事件，同时发生的概率是个别发生概
率相乘的结果，两事件以上的情形亦同。

）两事件互斥，至少一件事发生（或说两者不能同时
发生）的概率是个别概率的总和。若不是彼此互斥，情况就
稍微复杂一点。
如果某种情况注定要发生，这些个别独立事件的发
生概率总和等于一。例如足球联赛中一定有一队会获得冠军，
则所有球队获胜的概率加总起来定会等于一，而且各队获胜
也是互斥事件。
虽然这些原则看起来并不难懂，只要用到分数和小数相
加就可以了，这些常识每一个高中生都该学过。但概率问题
的复杂性还是会造成一些困难，并使很多人做出不利于自己
的错误决策。

思维的
两难境地：悖论

逻辑是一切演绎推理的基础。也许最有趣的就是像福尔
摩斯那样通过严密的推理，发现事情的真相。然而，有时你
会发现，正是你似乎无懈可击的推理和论证把你送进了死胡
同。到底什么错了？是你的推理过程出了问题，还是逻辑本
身隐伏着某种致命的缺陷？

我们不得不承认逻辑是有用的，也是有趣的，但这并不
能保证它时时刻刻都让你放心。我们都不是生活在疯人院里。
逻辑思考能力是必须具备的。可是逻辑就像牛仔手里的套索，
弄不好也会把自己套住。

有个很有趣、很简单的概念悖论（也被译作“吊
诡”），简单说就是自相矛盾的说法。即如果承认这个说法正
确，就能推出这个说法不正确，反之，如果承认这个说法不
正确，却又能推出这个说法正确。悖论问题至今仍令统计专
家与决策理论学者争论不休。

究竟什么是悖论，无需赘言，看看下面几个悖论故事，
你就一目了然。

半费之讼
在古希腊有一个著名的哲学家，叫普罗泰戈拉（他的名
言“人是万物的尺度”为我们所熟知）。他设馆收徒，教人论
辩之术。学生学成后可以帮人打官司。他收徒的规矩是先收
一半学费，等徒弟毕业“参加工作”（成为“律师

、打赢第
一场官司再付另外一半学费。
普罗泰戈拉收了一个叫欧提勒士的学生。欧提勒士学成
毕业后，迟迟不替别人打官司。普罗泰戈拉收不到另一半学
费，于是想了一个办法，他把学生告上了法庭。

普罗泰戈拉想：如果赢了，学生应当付给他剩下的一半
学费；如果输了官司，即他的学生打赢了官司，那么根据合
同，学生应当付给他一半学费。因此，无论我赢还是输，我
都应当得到剩下的那一半学费。
他的学生青出于蓝而胜于蓝。学生想：如果我输了官司，
根据合同，我就不应当付学费；如果我赢了官司，对方的要
求也就不合理，没有理由让我付学费。因此无论我赢还是输，
我都不应当付这个学费。
而一场官司不可能两个人都赢。他们谁的说法有道理？
这就是著名的“半费之讼”。如果你是法官，对这场官司如何
判决？
鳄鱼和小孩的悖论
鳄鱼抓住了一个小孩，对他说：“我会不会吃掉你？你要
答对了，我就放了你；答错了，就吃了你。”

小孩想了想，说：”

“你会吃掉我。
鳄鱼懵了，它该怎么办呢？“我要是吃了你，你就说对了，
我不该吃你；我要是不吃你，你又说错了，我该吃了你..
我晕！
”
小孩乘机跑了，鳄鱼十分沮丧：他要说我会放了他就好
了。
《堂吉诃德》悖论
《堂吉诃德》里描写了一个国家，它有一条奇怪的法律：
每个异乡人到此都要回答一个问题：你来做什么？答对了，
一切好说；答错了，就要被绞死。（当然，对错是由人家说了
算的）

一个人回答：“我来是为了被绞死。”士兵像鳄鱼一样懵
了：如果绞死他，他就对了，不该死；可是放了呢？他又错
了，该死。怎么办？
到了国王那里，他也想了好久，说：“无论怎么做都不对，
还是我法外开恩，放了他吧。”
理发师悖论
理发师悖论是由罗素提出的，罗素不但是哲学家，也是
一位数学家，他提出这个悖论是为了说明数学中的集合问题。
其大意是：某城里有一个理发师，他只给不肯自己刮脸的人
刮脸，那么，他给不给自己刮脸呢？

圣彼得堡悖论
法国数学家伯努利于
年提出这样一个问题：你与庄

家玩一个掷硬币游戏。硬币没有做过手脚，若第一次出现反
面，你就得

元，游戏终止；若第一次掷出正面，你得
元，
你继续掷硬币，若第二次掷出正面，庄家给你
（元），游戏继续，若掷出反面，游戏终止；若第三次掷出正
面，庄家给你（元），掷出反面，游戏终止..
你进行这个游戏的期望值是多少呢？

第一次出现正面的可能性为

，即得

元的可能性为
得
元的可能性为多少？得
元的条件是：第一次和
第二次均出现正面，即得
元的可能性为
获得

元的
可能性为第一次、第二次、第三次均投掷出正面，即获得
元的可能性为.这样，进行这样一个游戏的期望收益
为无穷大，这样的说明意味着，无论赌徒付给庄家多少，这
样的赌博对赌徒都是有利的，因为赌徒付给庄家是一个有限
的数字，以一个有限大的付出获得无穷大的收益是合算的。
这可能吗？
这显然违背直觉，它构成了一个悖论。

怎么样？看完上述五个悖论故事，你的思维也陷入了混

乱了吧？逻辑在这里陷入了两难境地。你可能要争辩：事实

上，没有鳄鱼肯跟你讲道理，没有一个国家会通过这么古怪

的法律，也不会有一个针对理发师的如此严格的规定..这

些都是编造出来的。你是对的，在现实中，我们的确不大可

能被这些难题困扰。但是对悖论的研究不是没有意义的，更

不是所谓“吃饱了撑的”。

悖论不是存在于现实中，而是存在于我们对现实的认识
和表述中，但这两者不可能分开。如果没有人类，世界仍然
存在，但是却没有意义，意义正是人类认识的结果。

博尔赫斯曾写过一个令人着迷的小故事。在这个故事中，
“我”得到了一把小石子，这些石子的特别之处在于：你每次
数它们，数目都不同，这一次是

，下一次就可能是
或
想想这个故事，想想故事中的疑问：如果毕达哥拉斯（古希
腊数学家，在这里代表人类的数学传统）抓起的是这样一把
石子..
这个故事暗示的是：我们的知识体系、我们对世界的认
识也许并不是建立在“唯一正确”的基础上，而在这个基础
上建立起的认知世界的方式，既是一条道路，也是一个囚笼。
问题是，没有人可以离开惯常的知识结构，只要他活着，就
必须找几条安身立命、为人处世的原则和方法，而他自己，
也就被这些原则和方法规定起来。

逻辑的悖论中有个最古老的例子，即艾毕曼德悖论，它

是

年前由一个克里特人艾毕曼德提出的。他宣称：“所有
的克里特人都是骗子。”这就是一个典型悖论。这句话究竟是
真是假？如果是真的，那就不能相信说这句话的人，因为他
自己就是克里特人，所以不可能为真。那么，难道它是谎言？
这么一来，连这个人都是骗子，又怎么能相信他的谎言和对
克里特人的批评？

聪明的读者可能会想：啊哈，这个狡猾的家伙以为可以
骗得到我，尽管这个理论已有

年的历史，但其实它是不
存在的。因为艾毕曼德悖论说所有的克里特人都是骗子，这
只能证明说这句话的人本身是个骗子，却不代表没有诚实的
克里特人存在，所以结论是这个人在说谎，是不是？

没错，这的确是跳出这个古典悖论的方法。可是如果我
们将它修改一下，假使那个人说的是：“这句话是谎言，我这
个克里特人是个骗子。”这么一来，就又绕回原来的困境，因
为这两句话有自我包容的特性，这也是该悖论的核心。或者，

你也想更进一步试试这么两句话第一句说：第二句是假
的，第二句话说：第一句是真的。所以，原来的悖论设计得
有点粗糙，但不影响其内涵。理性的决策要靠逻辑，理性思
考也不例外，悖论存在逻辑领域里，主要是挑战人类思考的
协调一致性，以确定每个螺丝都配对了螺帽。如果两个论述
互相矛盾，就不会同时为真，就像掷一枚铜板，不会同时出
现正面，又出现反面。所谓逻辑的内部一致性，就是指不论
用什么方法，都无法证明两个叙述处于绝对对立的情况。如
果想长智慧，解决自己明显的内部不一致是不二法门。

伟大的科学家爱因斯坦曾协助发现了量子力学的理论，
但又自觉不完善，故在中年花了很长的时间想找个悖论以证
明其不具一致性。爱因斯坦失败了，量子力学到今天仍然存
在，但当时悖论确实吸引了许多物理界的精英投入研究。至
今部分问题仍困扰着科学家们，而那些宣称不感困惑的绝非
专家。

不要以为悖论只存在于逻辑中，现实中不大会出现。有
些社会现象还是很有悖论色彩的。比如，藏羚羊被捕杀，是
因为“怀璧其罪
”。

藏羚羊毛在法语中被称为“莎图什”，意为“戒指披
肩
”因为一条藏羚羊毛披肩可以从指环中穿过，如此柔
顺轻暖，是制作高档毛织物的理想材料。

如此珍稀的资源，当然禁不起物欲横流的消耗，致使藏
羚羊的生存岌岌可危。政府禁止猎杀，严惩盗猎者，当然是
正确之举。可是这又引起了一个新麻烦：抬高了藏羚羊毛价
格，使盗猎成了“高风险、高收益”的生意，于是，更多的
亡命之徒加入盗猎者的行列。

怎么办？允许随便捕杀肯定不是办法，没等价格下来，
藏羚羊就被打光了。人工饲养理论上似乎可以，但是技术上
未必可行，而且，一旦允许藏羚羊交易，野生饲养又很难分
辨，可怜的野生藏羚羊还是要被捕杀。这真是一个难以解决
的问题。

在理论界也存在着悖论，比如有这样一种经济学理论，
一方面声名狼藉，另一方面却又常常被人这样那样地运用，
这就是“破窗理论”。

法国

世纪著名经济学家巴斯夏提出了“破窗理论”（但
他本人并不支持这个理论，相反，他总结它正是为了批判）：
一个小痞子砸碎了理发店玻璃窗，这一恶行对社会造成了破
坏，但是理发师不幸却是社会的福音，它将为玻璃生产商制
造出商机，生产商拿到钱后又去购买其他生产商的产品..
这样算来，他给社会造成的损害只是一次性的（只打碎那几
块玻璃），可是他给社会带来的机会却是连锁性的（玻璃生产
商、原料供应商、挖沙人、运输者等得到了工作）。结论是：
打碎一块玻璃，提供了无数金钱和就业机会，得大于失。用
前面的例子说，这个交换很“划算”。因此，不良少年是社会
的恩人，而不是罪犯。
大多数人都能指出其荒谬之处，如果破坏他人财物是好
事，那么我们为什么还要惩治这类犯罪呢？倒是应该给他们
奖励才是。如果那样，这个世界将乱成什么样子？而且，理
发师的窗户被打碎了，他需要安装一扇新的窗户，他要动用
一笔额外的费用。这笔费用本来可能是打算购买衣服的，但
是新的窗户代替了衣服，也就是说玻璃生产商得到的正是裁
缝所失去的。因此社会净福利依然没有什么增加，不良少年
依然是危险分子。

但是

很多人（包括很多经济学家）却信奉经过变形的

“破窗理论”，“假日经济”

比如我们都听过关于（节日放长假
可以拉动

上升百分之几）、（发洪水有利于扩

“洪水经济”
大内需）之类的高论，就连美国出了“

”事件，也有人

认为，这有可能成为拉动美国（甚至全球）经济复苏的机会。

“破窗理论”的谬误，根源在于不知道“资源是稀缺的”，

在一个地方没有必要地消耗资源，在另一个地方就要闹资源

短缺。你把全世界的窗户都砸掉，做玻璃的当然是发财了，

可做衣服的却都饿死了。做玻璃的没有衣服穿，早晚也得冻

死。况且，做衣服的不买粮食，食品店老板没有生意做，种

地的农民也卖不出粮食，所以也没钱买别的..换言之，你

不能计算收益时用“连锁性”，而计算成本时就忘了这一点。

理性还是非理性

有一对夫妇与一个智者对次日的天气进行打赌，但夫妇
两人对次日是否下雨有“不同看法”。丈夫认为下雨的可能性
大，妻子则认为下雨的可能性小。

丈夫对智者说：“如果明天不下雨，我给你

元，如果
明天下雨，你给我
元。
”
这个打赌是公平的，因为下雨的可能性大，丈夫赌明天
下雨。因不下雨而输的机会小，赌下雨的赌金当然要小。
而妻子认为下雨的可能性小，她对智者说：“如果明天不
下雨，你给我

元；如果明天下雨我给你
元。
”
这也是公平的打赌，因为她认为明天下雨的可能性要小，

她当然赌明天不下雨。
智者想了想，笑了笑，同意了。
看到这里，你也会哑然大笑，觉得这对夫妇的赌博很荒

唐吧？
次日无论下雨还是不下雨，智者都将必赢得

元。无
论是丈夫赢还是妻子赢，由于他们钱的来源相同，他们夫妇

总要付出元。
原因是，如果下雨，丈夫是赢了，但赢的数额为元；
但妻子输了，妻子输的数额为元，总的付出为元。

如果不下雨，妻子赢了，赢的数额为元；但丈夫输了，
输掉的金额为元，总的付出数额仍为元。即无论次
日下雨还是不下雨，智者总要赢得元。

“明天下雨”与“明天不下雨”是一个相矛盾的命题。如
果单独一个人可以是丈夫，也可以是妻子与智者进
行赌博，他或者她不会做这样的两次赌博：既赌明天下雨，
又赌明天不下雨。

这里，妻子与丈夫对次日下雨的概率存在不同的认识，
智者才钻了空子。

这就是荷兰（）赌，有人将之翻译成大弃赌。

在实际中，对于一个未明的或者说不确定的事件，一个
人一般是不会赌一个事件既可以实现，又不可以实现的。如
“明天是否下雨”、均是不确定

“随意扔下的硬币是否为正面”
的事件。人们对不确定的事件有一个确定的概率主观置
信度。随着时间的推移，人们对不确定事件的认识有了进一
步的认识，人们对它是否实现的概率即主观置信度发生变化。
如，本来某人认为次日不下雨的可能性大，但是，当他看到，
乌云渐渐增多，天慢慢地变阴，他就会改变他的看法，认为
下雨的可能性增大。如果他对次日是否下雨与他人进行打赌，
在他认为不会下雨时下了一个赌注，当他认为会下雨时，他

又下了赌注。此时他就可能遭遇到一个大弃赌无论如何
他都输钱。

我们这里不是说他一开始的打赌是不合理的，因为他有
证据认为某件事件发生的可能性要大

尽管这样的认识后
来看来是不正确的，我们不能做事后诸葛亮。当然，也不是
说，他不应当随时修改他的策略，事实上，他随时修改策略
是合理的，这样可以减少损失。但是，在这里要表明的是，
对不确定的事件进行打赌有可能遭遇到必输的尴尬，也可以
说，这是我们认识的有限性的尴尬。

由于赌场规则的特殊的设计，如果把所有的赌客当作一
个群体，赌客与赌场之间的赌博已经是一个大弃赌。

作为策略家，必定要做一个理性的人，要时刻提醒自己
避免陷入大弃赌的境地。

彩票是当今社会屡见不鲜的现象。发行彩票是社会的某
个组织为了筹集一定的资金，以高额奖项或奖金为诱饵，采
取某种随机的形式，促使人们以少量的金钱来购买的一种活
动。

我们说理性的人总是力图使自己的效益最大，如果在信
息不完全的情况下则是使自己的期望效益最大。但是这难以
解释现实中人们购买彩票的现象。

人们愿意掏少量的钱去买彩票，如福利彩票、体育彩票
等，以博取高额的回报。在这样的过程中，人们自己的选择
理性发挥不出来，而唯有靠运气。在这个博弈中，人们要在
决定购买彩票还是不买彩票之间进行选择。根据理性人的假
定，选择不买彩票是理性的，而选择买彩票是不理性的。

购买者只需少量的钱就可购买彩票，一旦中了彩，奖金
数额巨大。彩票发行者利用的就是人们这种以小搏大的心
理。

彩票的命中率低，并且命中率与命中所得相乘肯定低于

彩票购买者的付出。彩票的发行者早已计算过了，他们通过
发行彩票来获得高额回报，他们肯定赢。发行者通过发行彩
票稳赚是必然事件，而某个彩民中彩是可能事件或随机事件，
并且是个“小概率事件”。因此，购买彩票是“不理性的”：
他未使自己的期望收益最大。

理性的策略家应当避免购买彩票这样的行为。当然，你
也可以通过发行彩票来获得利益。你只需做一个简单的计算：
彩票售罄所得的总收入与你设计的奖金数额和之差是多少，
这个差值扣取彩票发行费用就是你的利润。

赌博如同买彩票一样，理性的策略家应当避免。无论是
什么形式的赌博，它充其量不过是个“零和博弈”赌博
活动不增加任何产出，甚至往往是个“负和博弈”所得
相加是个负数，因为赌博既耗费了赌博参与人的时间，也耗
费了他们的体力。如果他们不从事赌博，而从事其他经济活
动，收益之和可能是正数。

赌博可以是一群人之间或者在一群人与一个组织（庄家）
之间进行。前者往往发生在民间，并且往往是自发的；而后
者发生在赌场之中。赌博业是特殊的行业，赌场的开设必须
经过政府的允许，在中国内地赌博是非法的，而在中国澳门、
美国的某些州等则允许赌场的存在。

如果赌博是为了获取金钱收益的话，那么，赌客的赌博
行为是不理性的，无论是这样的赌博发生在几个人之间，还
是发生于赌客与赌场之间。几个人通过某个赌具进行赌博，

钱只是在这几个人之间流动，没有创造新的价值。作为理性

人，除非存在这样的情况：这种赌博需要一定的理性或者智

力，而你确信你的智力肯定胜过他人，即，你赢的概率大于

其他人。

在赌场

的赌客难以获胜的原因是，赌场与赌客之间的
赌博是“不公平的”：赌场赢的概率大于赌客赢的概率。

比如

点”是赌场惯用的赌博方式。规则是这样：赌
客和庄家比扑克牌的点数，
点最大，不能超过
点
超过了称为“爆”。赌客先翻牌，庄家后翻牌。你的点数大于
庄家且不超过
点，你就获胜，你押多少筹码，庄家赔你多
少，反之庄家收去你押的筹码。如果赌客与庄家点数相等，
平局。
在这种赌博中，庄家的优势具有“概率上”和“信息上”
的两个优势。
概率上的优势：由于是赌客先翻牌，若赌客“爆”了
（超过

点），庄家即刻收取赌客的筹码，无论庄家的点数是
否“爆，，了。
信息上的优势：庄家后翻牌，当庄家要牌时，因庄家能

够看到赌客的点数，庄家只要超过大多数赌客的点数，庄家

就能赢，而无须冒“爆”的危险了；而赌客每次选择是否要

牌时，均面临着“爆”的风险，庄家冒“爆”的风险是在赌

客的点数均很高的时候。

再比如俄罗斯轮盘赌，转盘上有

个数字，简单的玩法

是你押一个数字，赌场的转球员随机地把球发出，如果球所
对应的数字是你押的数字，赌场以“

赔
”赔你，即你押
元，赌场赔你
元；如果球所对应的数字不是你押的数
字，那么你押的钱被赌场收走。
对于这个简单的赌法，赌场的优势是两个：
第一，概率上的不公平。既然轮盘上有

个数字，赔
”才是公平的。如果是“
赔
，赌客在
个数字上均
押一个同样的筹码比如
元，赌客还是输，输的钱数为
元，
因为只有一个数字得中。我们假定，赌客对每个数字的选择
是随机的，即押任何一个数字均有相同的可能性，赌客每次
投注的收益为／
。赌场上人数很多，赌注
总量大，赌场的总收益为总赌注的
／
第二，资源上的限制。由于赌客投中的概率较低，赌客
总的赌资有限，因此很难不断地继续支撑下去。

这也是为什么赌场能够长盛不衰的原因，在赌场的背后
有“科学”支撑。作为理性的策略家，如果为了金钱收益是
不会从事赌博行为的。当然你也可以说，赌博是有益的活动，
赌博一可以“怡情
”，二可以“益智
”，三可以“交际”。可以
说这些是赌博之外的功能。如果人们希望通过赌博获得金钱
的好处，那是不理性的。

理性决策

在具体决策中有两种决策方式。一种方式是，当决策者
面临一个待决策的问题时，决策者凭直觉、主观臆断等因素
确定出一个方案来；另外一种方式是，决策者对他所面临的
各个方案进行缜密分析，计算和比较各个策略带来的后果以
及实现这些后果的可能性，从中选择出能够给决策者带来最
大好处的那个策略。前者为非理性的决策，后者为理性的决
策。

在非理性决策过程中起作用的是人的非理性因素；而在
理性的决策过程中起作用的是人的逻辑或理性，此时决策过
程是一个计算和推理的过程。在实际决策中，人们的决策有
时是理性的，有时是非理性的；有些决策中理性的成分多些，
有些决策中非理性的成分多些。

在决策过程中理性的成分越多，胜算的把握越大。在与
对手的博弈过程中，运用理性的博弈思维有助于我们成为赢
家。如何让理性思维决策在博弈中发挥最大作用呢？

总的来说，实现我们目标的途径无非有两类：第一类，

选出我们的最佳策略，或者至少不要做出错误的策略选择；

第二类，让与我们处于博弈中的对手做出有利于我们目标的

策略选择，如果对方是与我们处于如战争这样的竞争性博弈

之中，让对方做出错误的策略选择，从而对我们有利。因此，

具体地说，理性的博弈思维大体上从以下四个方面进行：

首先，增强自己的分析力，以做出正确的策略选择。博

弈思维是理性思维。直觉思维在策略选择时尽管能够起到一

定的作用，但它最多是作为理性思维的补充。在任何策略选

择时，详尽的理性分析是必须的，拍脑袋的做法不是我们提

倡的。当然，理性思维不是优柔寡断，在某些场合下，当断

则断，否则会贻误时机，但果断拍板绝不是随意的拍脑袋。

其次，进行信息战。信息是做出正确选择的关键。策略

家要做出正确的策略选择，“知彼”是必须的。同时，要让对

方“知道”自己的信息。通过发出正确的信息或虚假的信息将

会使对手做出有利于自己目标实现的策略选择。在某些时候

让对方知道自己方正确的信息，对自己有利；而在另外的时

候，让对方“知道”错误的信息，从而做出错误的判断，有

利于策略家的目标的实现。如在战争博弈中（战争至多是
“零和博弈
”），策略家往往隐藏自己的实际策略，使敌人相信

一个虚假的策略。具体的策略有多种，如三十六计中的下列

计策：声东击西、空城计、偷梁换柱、苦肉计、假痴不癫、

无中生有、暗渡陈仓、反间计、连环计、指桑骂槐等。

第三，要弱化对手的“理性判断力”。在博弈论中我们假

定了人是理性的，但在实际博弈中，人在决策时具有非理性
因素。在某些博弈比如战争中，通过某种策略使得对方的理
性能力降低，往往是有利于策略家目标实现的有效方法。三
十六计中的美人计是典型的弱化敌人理性判断能力的方法。

第四，避免做出错误的策略决策。当自己无法与敌人抗
衡，或者与敌人战争时，没有把握获得胜利时，保存实力是
最好的策略，即采用“走为上”策略。避免做出错误的策略
与做出正确的策略选择同样重要。

给对手制造犯错误的机会，对手的错误将使我们获得胜
利。人们常说“智者千虑，必有一失”，再聪明的人也有犯错
误的时候。在各种比赛如棋赛中，我们看到，即使高手有时
也会因为策略选择错误而导致失败。有时获胜并不是因为自
己水平比对手高，而是由于对手的错误使自己获得了胜利。

我们可以设计陷阱，对手如果足够谨慎，将可以躲过我
们设计的陷阱；而如果对手大意，将可能掉进陷阱之中。当
我们与他人处于竞争性博弈之中时，很可能的是，我们有时
“山重水复疑无路”，但对手的错着将使我们“柳暗花明又一
村”。因此，策略高手往往给对手制造犯错误的机会，通过对
手的错误而使自己获得胜利。

策略家运用博弈思维，方法无非是：增强自己的计算能
力，使自己做出正确的策略选择，或者让对方做出错误的策
略选择。使对手做出错误的策略选择的方法包括有信息战以
及弱化对手的理性计算能力。上面我们已经分析了策略家如
何做出正确的策略选择，以及如何利用信息迷惑对手。现在

我们来分析，策略家是如何通过弱化对手的理性，从而使自
己获得成功的。

迷惑对手即通过某种策略使对手失去理性判断力，从而
使对方做出有利于自己的策略选择。策略家利用某些手段使
对手失去判断力，在这里我们主要介绍两种手段：第一是示
弱；第二是臣服。

示弱是使对方失去判断力的一个有效方法。示弱策略与
臣服策略有共同的地方，使用者均是以某种特殊的方式“告
诉”对方，自己不会对对方造成威胁。但不同的是，臣服并
不表明策略使用者的能力低。臣服者往往表示自己忠于对方，
尽管自己在某些方面小有能力，但这只是不值一提的能力。
而示弱则表明自己没有能力，运用示弱策略意在麻痹对方。

示弱策略被古代的军事家经常运用。孙膑领着齐国的军队
进攻魏国，在攻击魏国的城池时，佯装损失惨重而撤退。在撤
退过程中，孙膑采取逐步减灶的办法。行军的灶减少表示齐军
在撤退时士兵大量死亡或大量逃跑。魏军元帅庞涓以为齐国军
队损失重大，率部队追赶，在追赶中中了孙膑的埋伏而丧命。
这里，孙膑使用“逐步减灶”的方法麻痹庞涓，就是在示弱。

另外一个大家熟知的例子是越王勾践“卧薪尝胆”而复
国的例子。吴国在伍子胥的辅助下，日益强盛。越国在与吴
国之战中不敌吴国。越王勾践面临两条路，自杀而死，或者
成为奴隶。他听从了范蠡的劝告，做了吴王的奴仆。然而他
不忘灭国之仇，睡在柴草上，每天尝食苦胆，以提醒自己别

忘复仇。但他表面上对吴王毕恭毕敬。为了显示忠心，勾践
在越国找到绝代美人西施，送给了吴王。在示弱的过程中，
越国的国力一天天强盛，终于有一天越国的军队打败了吴国，
勾践完成了复国大业。

当自己的实力不如他人时，示弱往往能够保全自己。示
弱策略的成功运用，可以使他人不会将你看成对他构成威胁
的敌人，从而放松对你的警惕。

采取示弱策略，并不代表自己真得惧怕对方。当自己的
力量比对方强大时，采取示弱策略，可以让对方的意志松懈
下来，这样自己可以以最小的牺牲取得最大的胜利；如果自
己的力量比对方弱小，采取示弱策略，可以转移对方的注意
力，给自己创造增长实力、最终战胜对方的机会。

示弱的反面是逞强。当没有足够的实力与他人对抗时，逞
强的结果将是灾难性的。逞强只能得到一时之快。即使自己的
实力足够强大，但如果一味逞强，也会有意想不到的结果出现。

迷惑他人的另一个策略是臣服。采取臣服策略的目的，
是要让你所“讨好”的人感觉到你对他没有威胁，而把你视
为“靠得住”的人。采取臣服的方法，或者让对方感觉到你
的能力不如他，或者让对方感觉到，你的能力虽然较强，但
你永远“忠于”他，永远不会成为他的敌人。

如果你想要实现你的目标，臣服策略是一个可用的策略；
当然，你也要注意的是，当你处于强势地位的时候，你周围
与你玩博弈的人很可能采取的就是这样的策略！

还记得上一章中讲的“阿里和巴巴交换信封”的故事
吗？

现在，我们把故事修改一下：假如阿里与巴巴正在说亵
渎精灵的话，而被精灵听到，精灵于是勃然大怒，要给他们
以惩罚。于是精灵写下两个数字，一个是另一个的两倍，谁
抽到其中一个，就要挨上相同数目的鞭子。在这种情况下，
两个人还要不要交换呢？

你会发现，这次两个人的选择完全不同了。阿里发现自
己抽到的是

，他当然巴不得换来一个
，可是他想：假
如巴巴抽到的是
，这么一交换就要多挨
鞭，而最好
的结果不过是少挨
鞭，权衡利弊，还是不要换了，老实挨
这
鞭吧。巴巴也会这样想，所以谁也不愿交换，即使交
换肯定对其中一人有利。
由此我们看到，在获得利益时，人们愿意承担某些风险；
但是在付出代价时，人们就倾向于回避风险。因此，在上一
个例子中，只要阿里或巴巴相信自己不至于被打得没了命，

他就不会去交换。
再来看下面几组选择：
肯定得到

／
元，还是有

的机会得到
元？
／
肯定得到

元，还是有
的机会得到
元？
肯定得到

元，还是有
的机会得到

元？

／
肯定得到

的机会得到
元，还是有
元？

元？

元，还是有

的机会得到

肯定得到

／
）肯定得到

的机会得到
万元，还是有

万元？
首先，对于每组选择的两种可能，人们是不无偏好的。
对于选择

，你一般认为是值得冒险的，即宁愿只有
的机会去得
元罢手。同样，你也
会对

元，而不愿就此拿上
元冒
险，而不愿稳当地拿到

元。你大概也会对
元冒险，而不愿只拿到
元。看样子，你一直都倾向于冒
险，表现出对大额金钱的偏好。
然而，当选择进行到一定时候，你的喜好模式肯定会颠
倒，不会再为大额金钱去冒险，而宁愿稳当地得到虽相对较
小可也仍然不算少的一笔钱。除非你对冒险的刺激赋予极高
的功利，否则你是不会不愿意稳妥地拿到

万元，而甘愿
去冒只有
／
万元的风险的。

在选择时，人们对较小的数额似乎觉得冒险的意义或者

的可能拿

随机取胜的可能性较大，于是甘愿冒险。但随着数额（即功
利价值）的增大，人们对冒险变得越来越谨慎，似乎侥幸取
胜的可能性变小了。其实，在这一系列选择中，冒险取胜的
可能性是一样的，都是

。只是由于功利变大，其对人
的重要性也增大，从而产生对机遇判断的错觉。

每一个人转变其选择的偏好模式即从冒险改为稳妥地获
取有把握的东西的转折点是不同的。这依赖于人现有的财富
和经济价值观。越是富有的人，越是敢于冒险下大赌注，因
为无论是小输还是小赢，对他来说都没有什么意义。然而，
对于街头的乞丐，对于极端贫困的人来说，他可能甚至宁愿
选择有把握拿到的

元而冒
险。因此，一个特定对象的价值既与其功利、出现的可能性
的大小有关，也还与评价者本人的特点、他的经济状况和价
值观有关。通过了解一个人在上述六组选择中的哪一组转换
其偏好模式，我们可以大致了解他的经济状况和价值态度。
这样，我们在进行决策时，就应当从功利、机遇、个人
条件三个方面展开我们的思考，若有遗漏或不慎，就难免做
出错误的决策。

当你要冒险时，务必“三思而后行”。

元，而未必会为把握不大的

下面这个案例和上章“阿里和巴巴交换信封”的故事有
些类似，这个案例说明了信息对于理性决策的重要性。
一位教授和他的两个学生

我们称他们为

和
共进午餐，兴之所至，教授提议
和
玩一个游戏：把他们
的钱包交给他，他数了数，发现其中一个装的钱正好是另一
个的两倍（但他没有告诉他们谁多谁少），然后他问他们：在
这种情况下，他们是否愿意互换钱包？
当然知道自己的钱包里有多少钱，但不知道
的，他
想：对方要么是我的
，要么是我的

倍，如果是前者，
那么就损失了一半；如果是后者，那么我增加了一倍，一倍
的收益大于一半的损失，所以这个赌是划算的。
也是这样
想，于是两个人都愿意打这个赌。
现在我们用数字更详细说明一下两人的判断：比如，

钱
包里装的是
元（于是他估计他要么得到
元，要么得到
元，前者损失了
元，后者得到
元，也就是说，在对等情况
下，他的收益比损失多
元）。我们知道，如果你和某人玩猜硬

币，正面朝上输

元，背面朝上赢
元，这个赌应该打，因为
哪一面朝上的概率相同，而收益大大多于损失，如果多玩几次，
你的所得肯定大于所失。只是恐怕没有人愿意和你这样玩。
假如

和
都是理性的，而且估计对方也是这样，那就
永远不会发生交换的事情。这一推理过程的问题在于它假设
对方交换钱包的意愿不会泄露任何信息。我们通过进一步考
察一方对另一方思维过程的看法，就能解决这个问题。首先，
我们从
的角度
想像
的角度思考
的思维过程。然后，我们从
可能怎样看待他。最后，我们回到
的角度，考察他
怎样看待
对自己的看法。其实，这听上去比实际情况复杂
多了。从这个例子看，每一步都不难理解。
假定

元，多于一般水平（比
如他装这么多钱是为了到饭馆吃一顿大餐，或者要交纳某项
费用），在这种情况下，他知道他的数目比较大，而对方钱包
里装着
知道自己的钱包里有
在
元的时候不愿交换，
元的可能性很小，也就不愿交换。既然
元的时候拒绝交换，因为
唯一愿意跟他交换的前提是
应该在他
只有
元，若是这种情况，
一定更想保住自己原来的
元。不过，如果
在
元的
时候不愿交换，那么
元的时候交换钱包，因
为交换只会在
就不该在

只有
元的前提下发生。
如果双方掌握了信息（一个人的钱包里一般情况下装多
少钱），就会做出理性的决策。

有家大型公司，虽然该公司已经上市，却还是保留了过
去的家族控制模式，董事会

名成员听命于创办人的
名孙
子、孙女。创办人早就意识到他的孙子、孙女之间会有冲突，
也预见到外来者的威胁。为了防止家族内讧和外来进攻，他
首先要求董事会各董事任职时间必须错开。这意味着，哪怕
你已经得到该公司
的股份，你也不能一下子取代整个
董事会，相反，你只能取代那些任期即将届满的董事。

名
董事各有
年任期，但届满时间各不相同。外来者最多只能
指望一年夺得一个席位。
从表面看，按照这样的制度安排，你需要至少

年时间，
才能夺得多数地位，从而控制这家公司。
创办人看得更远，因此也更担心。他担心假如一个充满
敌意的对手夺取了全部股份，他的这个任期错开的制度可能
会马上被篡改。因此，他觉得有必要附加一个条款，规定董
事会选举程序只能由董事会本身修改。当然，任何一个董事
会成员都可以提交一份建议，而无须得到另一个成员的支持。

但关键是接下来怎么做。这是一个大难题。条款规定，投票
必须以顺时针次序沿着董事会会议室的圆桌进行。一份提议
必须获得董事会至少

的选票才能通过，缺席者按反对票
计算。在董事会只有

名成员的前提下，这就意味着至少要
得到
票才能通过一份建议。要命的是，条款规定，任何人
若是提交一份建议而未获通过，不管这份建议说的是修改董
事会架构还是修改选举方式，他都将失去自己的董事席位和
股份。他的股份将在其他董事之间平均分配。同时，任何一
个向这份提议投了赞成票的董事也会失去他的董事席位和股
份。
有那么一段时间，这个十分苛刻的条款看来非常管用，
成功地将敌意收购者排除在外。可是现在，海岸公司的海贝
壳先生通过一个敌意收购举动，购买了该公司

的股份。
海贝壳先生在年度选举里投了自己一票，顺利成为董事。不
过，乍看上去，董事会失去控制权的威胁并非迫在眉睫，毕
竟海贝壳先生是以一敌四。

在第一次董事会会议上，海贝壳先生提议大幅修改董事
资格。这是董事会首次就这样一份提议进行表决。海贝壳先
生的提议不仅得到通过，更令人感到不可思议的是，这份提
议竟然是全票通过！结果，海贝壳先生随即取代了整个董事
会。原来的董事们得到一份称为“降落伞”的微薄补偿，就
被扫地出门。得到这份微薄的补偿，只能说总比什么也没有
得到强。

他怎么可以做到这种不可思议的事情？博弈论的倒后推
理，正是了解其中的奥秘的关键。

海贝壳先生为了确保自己的提议获得通过，就是从结尾
部分开始盘算的，确保最后两名投票者得到赞成这份提议的
足够激励。只要最后两名投票者赞成，这就足够让海贝壳先
生的提议获得通过了，因为海贝壳先生将以一张赞成票开始
整个表决程序。

为什么会这样呢？原来，海贝壳先生的修改提案，是一
份狡猾的“胡萝卜加大棒”的提案，“胡萝卜”是诱饵，最后
他的四个对手全部尝到了“大棒”的滋味。他的提案包含下
列三个内容：

假如这份提议全票通过，海贝壳先生可以选择一个

全新的董事会。每位被取代的董事将得到一份小小的补偿。
假如这份提议以

：

通过，投反对票的董事就要滚
蛋，不会得到任何补偿。
假如这份提议以

：

通过，海贝壳先生就会把他在
公司的
股份平分给另外两名投赞成票的董事；投反对票
的董事就要滚蛋，不会得到任何补偿。
到了这里，博弈论的倒后推理应该能够为故事画上句号。
让我们看看究竟为什么。
假定一路投票下来，双方打成平手，最后

名投票者面
对
：

的平局。假如他投了赞成票，提议就会通过，他本
人得到公司的股份。假如他不赞成，提议遭到否决，

海贝壳先生的财产（以及另外

名投赞成票的董事的股份）
就会在另外
＋

名董事之间平分，这个投票人将得到（
。两相比较，他当然会投赞成票。
所以，大家都可以通过倒后推理，预计到假如出现

：

票投下之后海贝壳先生就会取胜。
现在来看第四个投票人的两难处境。轮到他投票的时候，
可能出现以下三种情况之一：

平局的情况，最后

只有

票赞成（海贝壳先生投的）。
票赞成。
票赞成。

假如有

票赞成，提议实际上已经通过了。第四人当然
宁可得到一些好处而不是一无所获，因此他会投赞成票。

假如有

票赞成，他可以预计到哪怕自己投反对票，正
如上面分析的，最后一个人也会投赞成票。所以，无论第四
人怎么做，都无法阻止通过这个提议。因此，更好的选择还
是投靠即将取胜的一方，所以他会投赞成票。
最后，假如只有

票赞成。如果他投反对票，他固然保
住了自己的位置，但是没有别的好处；相反，如果他投赞成
票，变成
：

平局，正如上面分析过的，提案最后一定会通
过，而他因为站在胜利的一方，不仅将保住位置，而且会得
到额外的股份。所以，他愿意投赞成票，换取
：

平局。他
可以很有把握地预计到最后一个人会投赞成票，他们两人合
作得非常漂亮。

这么一来，在海贝壳先生之后最早投票的两名董事，即
第三和第二投票人可真是陷入了困境。他们可以预计到，哪
怕他们都投反对票，最后两人还是会跟他们作对，这份提议
就会通过。既然他们无法阻止这份提议通过，还是随大流换
取某些补偿比较好吧。

你看，狡猾的海贝壳先生就这样成功了。

这个案例证明了倒后推理的威力。

实际生活中，我们的确可以想像海贝壳先生的提议不能
获得通过的可能。但是，那种可能是别的因素的结果，如对
家族的忠诚等等，不是理性行为的结果。另外一种可能，就
是作为海贝壳先生的对手的那些投票人比较笨，领会不了海
贝壳先生为他们设下的诱饵。你看，这里再次出现不那么精
明反而更加高明的情况。

如果投票人彻底理性，精于为自己的私利计算和忠于为
自己的私利计算，海贝壳先生的计谋一定得逞。

如果你对自己的头脑很有自信，来看看这个分析推理问
题：

有五个强盗抢得

枚金币，在如何分赃问题上争吵不
休。于是他们决定：
）抽签决定各人的号码（；
由

号提出分配方案，然后
人表决，如果方案超
过半数同意就被通过，否则他将被扔进大海喂鲨鱼；

人表决，当且仅当超过
号死后，由

号提方案，
半数同意时方案通过，否则

号同样被扔进大海；
以此类推，直到找到一个每个人都接受的方案（当

号，他当然接受一人独吞的结果）。
假定每个强盗都是经济学假设的“理性人”，都能很理智
地判断得失，做出选择。为了避免不必要的争执，我们还假
定每个判决都能顺利执行。那么，如果你是第一个强盗，你
该如何提出分配方案才能够使自己的收益最大化？

这道题十分复杂

然，如果只剩下

很多人的答案都是错的。为了叙述方

便，我们先公布答案，然后再做分析。

这个严酷的规定给人的第一印象是：如果自己抽到了
号，那将是一件不幸的事。因为作为头一个提出方案的人，
仅仅能活下来的机会都微乎其微。即使他自己一分不要，把
钱全部送给另外

人，那些人可能也不赞同他的分配方案，
那么他只有死路一条。
如果你也这样想，那么答案会大大出乎你意料。许多人
公认的标准答案是：

号或
号强盗分给
号
号
强盗
枚金币，
枚，自己独得
枚。分配方案可写成
，，，）或（
，，。
只要你没被吓坏，你就可能站在这四人的角度分析：显
然，

号是最不合作的，因为他没有被扔下海的风险，从直
觉上说，每扔下去一个，潜在的对手就少一个；
号正好相
反，他生存的机会完全取决于前面还有人活着，因此此人似
乎值得争取；
号对前两个的命运完全不同情，他只需要
号支持就可以了；号则需要
票才能活，那么，你..
在这里我要交代一下做这道题的思路：应该按照严格的
逻辑思维去推想他们的决定。推理过程应该是从后向前，因
为越往后策略越容易看清。

号不用说了，他的策略最简单：巴不得把所有人都送
去喂鲨鱼（但要注意：这并不意味着他要对每个人投反对票，
他也要考虑其他人方案通过的情况）。来看
号：如果
至
号强盗都喂了鲨鱼，只剩

号一定投反对

号和

号的话，

票让号惟有支持号喂鲨鱼，以独吞全部金币。所以，
号才能保命。
号知道这个策略，就会提（的分配方案，

号、
对

号一毛不拔而将全部金币归为己有，因为他知道
号一无所获但还是会投赞成票，再加上自己的一票，他的方
案即可通过。
不过，

号推知到
号的方案，就会提出（
的方案，即放弃
号，而给予
号和
号各
枚金币。由
于该方案对于
号和
号来说比在
号分配时更为有利，他
们将支持他而不希望他出局而由
号来分配。这样，
号将
拿走

枚金币。不过，
号所洞悉，
号并
将提出（）或（）的方案，
即放弃

号的方案会被
号
号
枚金
币。由于
号，而给
枚金币，同时给
号或

号和

号（或
号）来说，
相比
号的这一方案对于

号的赞成票，再加上
号
自己的票，
号分配时更优，他们将投
枚金币可轻松落入腰包。
这无疑是
号的方案可获通过，
号能够获取最大收益的方案了！
在研究博弈理论的人看来，“强盗分金”其实是一个高度
简化和抽象的模型（非数理模型），但无疑以现实为基础。在
“强盗分金”模型中，任何“分配者”想让自己的方案获得通
过的关键是事先考虑清楚“挑战者”的分配方案是什么，并
用最小的代价获取最大收益，拉拢“挑战者”分配方案中最
不得意的人们。

想一想历朝历代的农民起义，想一想绵延不断的宫廷斗
争，想一想今天生活中存在的结盟与背叛，想一想企业内部
的明争暗斗，想一想办公室脚下使绊的政治，哪一个得胜者
不是采用类似“强盗分金”的办法？

还可以举出许许多多的例证来。比如，在国际政治、经
济中，各国的地位是不平等的，存在着“先发”和“后发”
的区别，正如这个游戏中每个人的顺序。

号看起来最有可
能喂鲨鱼，但他牢牢地把握住先发优势，结果不但消除了死
亡威胁，还收益最大。而
号看起来最安全，甚至还能坐收
渔人之利，却因不得不看别人脸色行事而只能分得一小杯羹。
这难道不是后发劣势的写照？

看完强盗分金的推理分析结果觉得不可思议吧？这个推
理是建立在参与者都是完全理性人的前提下，在现实中也许
会出现非理性的情况，只要有非理性的情况出现，结果就完
全不同于我们上面的推理了。

首先，现实中肯定不会是人人都绝顶聪明兼“绝对理
性”。回到“强盗分金”的模型中，只要

号、
号或
号中
有一个人偏离了绝对聪明兼绝顶理性的假设，强盗
号保不
准就会被扔到海里去了。所以，
号首先要考虑的就是他的
强盗兄弟们的聪明和理性究竟是不是靠得住，而断断不敢盲

目选择自取

颗金币的策略，拼了性命去狂赌。
现实中人们是如此的复杂，某人的神经末稍微偏离一毫，
就可能表现得对金币满不在乎而偏偏喜欢看同伙被扔进海里
喂鲨鱼。果真如此，

号自以为得计的方案岂不成了自掘坟
墓？

再回到分析推理的过程中去，假设有非理性存在，

号
还是可能在不必要的情况下杀死

号，那么

号是不该冒这

个风险的；可是同理，

号也不该冒没有必要的风险。无论
是哪种情况，他都应该给
号
枚金币，使其得到甜头，支
持自己。这样他的“保险方案”就是（
；相应地，

号的方案也要修改一点，比

号多给
号
枚，使其支持
自己，也就是（

。对于

号来说，倒是不必多掏
钱，而是减少了两枚金币收买

号这一种可能性，也就是说，
前面所说的
“标准答案”只剩下了一种，即
。当然，他也可以选（

但是由于收买

号要比收买
号多花
枚金币，所以也就算
不上“最佳”方案了。
再就是俗话所说的“人心隔肚皮”。这翻译成经济学语言
则是信息不对称。由于信息不对称，谎言和虚假承诺就大有
用武之地，而阴谋也会像杂草般疯长，并借机获益。譬如，
号完全可以对

号、
号所
提出的任何分配方案，他一定会再多加上一个金币给他们。
果真如此，结果又当如何？
还有比上述情形更复杂的。让我们试考虑分配规则变化
的情形。
通常，在现实世界中，人人都有自认的公平标准，因而
时常会嘟囔：”一旦

号、
号大放烟幕弹，假称基于
号所提方
案和其他人所想的不符合，就会有人大闹。当大家都闹将起
来的时候，
“谁动了我的奶酪？
可以料想，

枚金币毫发不损地、镇定自若地走
出去吗？最大的可能就是，强盗们会要求修改规则，然后重
号能拿着

新分配。
假如由一次博弈变成重复博弈呢，比如，大家讲清楚下
次再得

枚金币时，先由

号强盗来分，然后是
号..
“轮流坐庄”。

可能还会有比这更凶的。比如，四人会想：

号居然要
独得
枚金币，这简直是赤裸裸的剥削嘛！于是，他们立即
起来“造反
”，组成一个反
号的大联盟并制定出新规则：四
人平分金币，独将
号扔进大海..
无须更多讨论，我们或许能够同意：现实的确是太复杂

了，“强盗分金”之类的题目尽管很聪明，而且不乏启发性，

但也只能是“模型”而已。

尽管有各种非理性行为存在，但是总体而言，人们还是

懂得权衡利弊，并做出于己有利的选择。前面的例子之所以

“不合情理”，是因为经济学家或博弈论专家为了说明道理，

将理性“极端化”它们更像、之

了。“守株待兔”“郑人买履”
类的寓言，内容虽然荒诞，但内涵合理。其实，我们不必把
理性看得太理想化或者高深莫测，生活中有大量理性选择的
例子。如普通百姓常说的“胳膊拧不过大腿”、“人在屋檐下，
怎能不低头”、等等，也正是前

“吃亏是福”都是理性的表现，
面那些例子中想要说明的道理。

有一天，鬼谷子想试一试两个徒弟孙膑与庞涓的智力。
鬼谷子拿出

个饼，放在桌上，让他们两人去吃。鬼谷子说：
每人一次最多拿两个饼，并且拿的饼全部吃完后才能再拿。
鬼谷子说完后，庞涓就急切地拿了两个饼，而孙膑从容地拿
了
个饼吃起来。庞涓未吃完两个饼，孙膑已经吃完
个饼，
孙膑第二次拿了两个饼，此时桌上已经没有饼了。最后，孙
膑吃了三个饼，而庞涓吃了两个饼。
这是一个动态博弈：一人先行动，另外的行动者观察到

先行动者的行动后进行行动。
假如庞涓先拿，他有获胜的策略吗？
我们看到，如果庞涓先拿两个饼，他肯定是输家。因此，

如果庞涓先拿饼，他最好的策略是只拿

个饼。
当庞涓拿了
个饼之后，孙膑如果拿两个饼，孙膑必定
成为输家，因为剩下的两个饼将被庞涓拿走。因此，当庞涓
拿了
个饼。庞涓、孙膑各
拿

个饼后，孙膑的策略只能是取

个饼。此时就看谁吃得快了：谁吃得

个饼后，剩下了

快，谁将先拿，此时快者再拿两块，而将成为赢家。
因此，庞涓如果采取先拿

块的策略，他将不会输。至
于庞涓能否能够赢，取决于孙膑是否选择错误。如果没有发
生选择错误，那就看谁吃得快了。
假设庞涓能看得长远一些，那么吃掉

个饼的必定是他。
很不幸的是，目光短浅的庞涓一开始拿了两个饼，固然开始
占了便宜，但是最终吃了大亏。
其实，理性与非理性的区分，往往要看人们关注的目标，
或者说，是短期利益与长期利益的不同。

许多夫妻经常为了一些鸡毛蒜皮的琐事大吵大闹，这当
然可以被认为是非理性的，事过境迁，当事人可能也觉得不
值得。可是下一次还是要吵闹，为什么？除了顾及面子这类
“人性弱点”外，吵闹还有一个争夺家庭控制权或维护自身
“话语权”的微妙作用。我们都知道“小洞不补，大洞尺五”
的道理，在一些小事上退让是理智的，可是谁能保证这不会
助长对方的气焰，并最终导致自己权利的丧失？所谓“不值
得”的感觉并不是因为打架伤害感情，而是人们发现不能
“一战定乾坤”：吵了闹了，可是没什么用处，下次还是要再
交锋。

把这个问题放大看，民主政治中各种利益集团的争吵都
具有“夫妻吵架”的含义。我们时常可以看到某某国家政府、
议会间僵持不下，导致效率低下、政府更迭或解散议会的事
件，这些事件中当然有“非理性”的成分，但是比较合理的

政治不正是在各利益集团的交锋中达成的吗？

有这样一个故事：一个男孩被视为傻瓜，因为每当别人
拿一枚一角的硬币和一枚五分的硬币让他选择时，他总是选
五分的硬币拿。有一个人觉得很奇怪，就问这个男孩：“为什
么你不拿一角钱的？
”“假若我拿的是一角硬

小男孩小声回答：
币，下一次他们就不会拿钱来给我选了。”

这是目光长远的最佳例子。这个男孩选五分的硬币拿，
从短期效果看是“非理性”，但他明白这样可以长期拿下去；
选一角的硬币，只能有眼前的利益，实际上并不是好办法。

战术运用的目的是在“争取主要的策略性目标”。一旦一
个人开始将战术目标想成最后目标，那他就看不见策略目标
了。在谈判中，双方有时都会运用以进为退和以退为进的战
术，你不能因此忘掉谈判的最后目的。你有时候也可以故作
让步，把对手诱到不利位置。一位将军也许会假装败退，将
敌人诱人不利的位置而加以歼灭。

“非理性”似乎是个贬义词，可事实上，正是许多所谓
“非理性”的行为促进了人类的福利。

而且，仅仅从策略的角度说，这种拒绝合作的“非理性”
行为也是可取的，它其实有这样的意思：你受的伤害，远远
大于我受的伤害。如果你要避免这种最坏结果，你就不要伤
害我。事实上，聪明人都懂得不要把事情做得太过火，古代
的“明君”轻徭薄赋，也正是这个道理。只有那些昏君、暴
君才会横征暴敛，就是因为他们把老百姓看得太“理性”，以
为只要人民能对付活下去，就不会拼死造反。这倒也不算错。
可往往是这样：人们很难知道理性的“临界点”的确切位
置终于弄到官逼民反、玉石俱焚的地步，莫非这个结果
该怪老百姓“理性”不够吗？

有这样一个故事。

有一则广告：有一辆宝马车以一美元出售。“这是登错了
的广告，或者是愚弄人的假消息，如果卖车的人不是疯子的
话。”人们这样想，当它为笑料。谁会做这样的买卖？刊登广

告的价钱都不止一美元！可有个年轻人相信这个广告是真的，
他按地址寄去了一美元，果真，他得到了一辆宝马车，而且
几乎是新车。原来，卖车的妇人其丈夫刚去世，这辆车是丈
夫在遗嘱中吩咐留给情人的，这位妇人以一美元的价格卖掉
它，然后把车款拿给情人，以发泄心中的醋意。

博弈思维者不会相信这则广告。博弈思维的原则是，站在
对方的立场上看问题，把对方当成是理性人。但这则故事说明，
生活中的人的行为不完全是理性的，博弈思维不总是有效的。

人们进行博弈思维的基础是人具有的理性。然而，在某
些情况下，理性思维不能使自己的利益最大，甚至阻碍利益
的获得，而非理性思维反而能够获得极大的利益。

还有一个例子是
“分

元”博弈。两人分一笔总量固定
的钱，比如

元。规则是：一人提出方案，另外一人表决；如
果表决的人同意，那么就按提出的方案来分，如果不同意的话，
：

表决。提的方案是
提方案，
两人将一无所得。比如

接受这个方案，则
得
元。如果
得
元，
得
，即

不同意，则两人将什么都得不到。
元，如果
元，得

会这样想：根据
提方案时，他要猜测
的反应。
都会接受。除了
无论提出什么方案，
“理性人
”的假定，

这样极端的情况。因
元留给自己而一点不留给

将所有

接受了还有所得，而不接受将一无所获当然此时
为

一点点
的方案可以是：留给
也将一无所获。此时理性的

：

元归为己有，即方案是：

比如

分钱，而将

接受了还会有

元，而不接受将什么也没有。
如果你是

，对方考虑到你是理性人，他可能只在桌上
留下
分钱，他考虑到你会接受这个分配。此时你只有接受
这
分钱的分配。
但如果你是非理性的，分配就有所不同。
当对方给出这个分配时，如果你是“非理性的”，你会认
为这是“不公平的”，而将不接受这个分配方案。对方知道你
的这个“非理性”特点，他担心你会拒绝，为了不让你拒绝，
他不会提出只给你

分钱的方案。此时，你的所得取决于你
的“胃口”，或者取决于你的非理性的程度。
我们分析两种极端的情况，如果你是一个极度理性的人，
对方知道你的这个极度理性的特点，那么他毫不犹豫地提出

：

的方案。对于这样的分配方案，如果你不接受，
将一无所有，如果接受，还有

分钱。作为理性人，你会接受
这个分配方案。
而如果你是一个极端非理性的，一般的分配方案难以满
足你。你表示，要得到全部，否则将否决。对方知道你的这
个特点，但他是理性人。因此，对方将无奈地提出

：

分钱归自己，而将剩下的留给你。
在实际进行这个游戏时，人们均有一定程度的非理性，
并且这也是公共知识。这也是为什么实际的游戏结果并不出
现

，即

：

的分配结果。
由此可见，非理性有时会成为人们在博弈中的一个“资

或

源”。这个资源如同人们拥有的其他资源一样，可以利用它来
获取好处。俗语“会哭的孩子有奶吃”就是这个道理。在最
后通牒博弈中，你的“非理性”资源与否决权一道构成你进
行博弈的基础。

博弈思维有它的局限。时刻运用博弈思维的人即是时刻

计算的人，有些时候博弈思维并不能达到目的。正如楼

梦》里描述的王熙凤，“机关算尽太聪明，反误了卿卿性命”。

博弈思维何时无效？即它的限度体现在何处？

当他人不是理性的或者是不完全理性的时候，博弈思维
有它的限度。

我们在第一章中已经表明，我们作为策略家进行博弈思
维，其出发点就是，要时刻牢记，他人与我们一样，也是理
性人，也有自己的目标。但有些时候，人们并不表现为理性
的，此时，博弈思维不一定有效，在某些情况下，博弈思维
反而有害。博弈论难以分析或解释人的情感领域里的行为。

在人的情感领域里，人的行为是非理性的，人们的博弈
思维无法施展。如果某人在感情问题上也采取博弈思维，那
么他（她）此时的行为倒是很可怕的。

适度的非理性能够带来好处，这一点最能体现在谈判过
程之中。谈判是多方之间进行的一个博弈，其中经常发生的
是两方之间进行的谈判。谈判是一个合作性的博弈，双方
（假设只是两方进行的谈判过程）合作比不合作能够获得更大
的好处，但如何分配这个合作带来的好处？这是一个讨价还

价的过程。在这个博弈过程中，如果双方均是不可缺少的，
即任何一方均不能够抛弃另外一方而另寻其他合作伙伴时，
这个谈判结果取决于双方的“非理性”的程度，当然，这个
非理性的程度要成为双方的“公共知识”。

多人或多轮博弈：
谁将胜出

现在来看看有关三个火枪手的博弈。这是美国勃拉姆斯
教授给他的

名学生设计的博弈游戏。
勃拉姆斯教授对这
个学生说，游戏规则是这样的：假
定你们是
个决斗的枪手，每人一把枪，枪里只有一发子弹，
并假定你们的命中率为
，而你们每人的目标是，尽量
使最少人活着并且你也活着，即：最优结果是，其他两个枪
手被打死，而自己活着；次优结果是，有一个枪手活着，自
己也活着；第三优的结果是，三人同归于尽；最差结果是，
自己被打死而其他枪手一个或者两个活着。问题是：当仲裁
人说开始时，枪手开枪还是不开枪？

当勃拉姆斯教授说开始时，名学生毫不犹豫地以手代
枪瞄向对面的两个学生中的一个。
勃拉姆斯教授说，“理性的”枪手是随机选取另

个枪手
中的一个开枪，而不是不开枪。因为，自己是否活下来并不
取决于自己是否开枪，但自己如果不开枪的话，其他人活下
来的概率增加，因此，开枪是“最优的”策略。

勃拉姆斯教授又开始了第二个游戏，他对

名同学中的
一个说：“现在给你一个机会，让你先开枪，可瞄向你想射击
的目标，当然你有另一个选择，即对空中放枪。你将如何选
择？
”将手指向空中，“我选择向空中放
那个学生想了想，说：
枪。
”
勃拉姆斯教授向在座的学生解释说：“这是理性的选择。
因为，如果他选择一个人作为靶子，并开枪杀死了对方（因

为命中率是

，那么剩下的人将毫不犹豫地把他作为靶

子。结果是，他将死掉，另外两个人中的一个人将活着。”勃
拉姆斯教授说：“如果他放了空枪，其他两个枪手因他自动解
除了武装，不再构成威胁，而将枪瞄向对方。结果是后两个
枪手发生自相残杀。因此，一个理性的枪手在规则允许的条
件下，将向空中放枪。”

勃拉姆斯教授说：当第一个人朝天放枪后，后两个枪手
会预见到这个自相残杀的结果，从而建立一个约定，一起朝
解除武装的人开枪，但这个约定是无效的，因为：一旦对方
决定向解除武装的人开枪，自己朝对方开枪是“最优”策略。
当每个人均这样想时，约定便无效了。

上面的博弈是设计的博弈游戏，下面来看看带有故事情
节的

个火枪手的博弈。
在一个西部小镇上，
个枪手正在进行生死决斗，枪手
甲枪法精准，十发八中；枪手乙枪法不错，十发六中；枪手
丙枪法拙劣
十发四中。假如三人同时开枪，谁活下来的机

会大一些？

假如你认为是枪手甲，结果可能会让你大吃一惊：最可
能活下来的是丙枪法最劣的那个家伙。

假如这

个人彼此痛恨，都不可能达成协议，那么作为
枪手甲，他一定要对枪手乙开枪。这是他的最佳策略，因为
此人威胁最大。这样他的第一枪不可能瞄准丙。
同样，枪手乙也会把甲作为第一目标，很明白，一旦把
他干掉，下一轮（如果还有下一轮的话）和丙对决，他的胜
算较大。相反，如果他先打丙，即使活到了下一轮，与甲对
决也是凶多吉少。

丙呢？自然也要对甲开枪，因为不管怎么说，枪手乙到
底比甲差一些（尽管还是比自己强），如果一定要和某个人对
决下一场的话，选择枪手乙，自己获胜的机会要比对决甲多
少大一点。

于是第一阵乱枪过后，甲还能活下来的机会少得可怜将
近

，乙是

，丙是

通过概率分析，你会发现丙很可能在这一轮就成为胜利
者，即使某个对手幸运地活下来，在下一轮的对决中，也并
非十拿九稳，毕竟丙还有微弱的机会。

现在换一种玩法（我们知道，有时胜负是由规则决定
的）：三个人轮流开枪，谁的机会更大？

这里我们又要遇到琐碎的排序问题，但不管怎么排，丙
的机会都好于他的实力。至少，他不会被第一枪打死。而且，

他很可能有在第二轮首先开枪的便宜。

例如，顺序是甲、乙、丙，甲一枪干掉了乙，现在，就
轮到丙开枪了尽管枪法不怎么样，但这个便宜还是很大
的：那意味着他有将近一半的机会赢得这次决斗（毕竟甲也
不是百发百中）。如果乙幸运地躲过了甲的攻击呢？他一定要
回击甲，这样即使他成功，下一轮还是轮到丙开枪，自然，
他的成功概率就更大了。

问题来了：如果三人中首先开枪的是丙，他该怎么办？

他可以朝甲开枪，即使打不中，甲也不太可能回击，毕
竟这家伙不是主要威胁，可是万一他打中了呢？下一轮可就
是乙开枪了..

可能你会感到有点奇怪：丙的最佳策略是乱开一枪！只
要不打中任何人，不破坏这个局面，他就总是有利可图的。
（当然你可能会说，鉴于这家伙的没有准头，也许他乱开枪反
而更可能打中什么入。但那就是另外的问题了。）

这是一个很有意思的结果，枪法最准的人，他应当是最
强者，但他活下来的机会比较小，这里只有

。而活下来
机会最小的是次强者，或者说没有机会，因为他对最强者的
威胁最大。能够活下来，或者说，活下来的概率最大的是最
弱者，任何人均不把他看作有威胁的。

无论是在人与人的关系的争斗之中，还是在国与国之间
的对抗之中，我们发现，这个模型有较强的说明力。最易受
攻击的是强者的敌人，如冷战时期的前苏联，冷战后的伊拉

克；其次危险的是最强者，因为其他人均将矛头对准它；这
两者之外的则相对安全。

同时这个故事告诉我们：在多人博弈中，常常会发生一
些奇怪的事情，并导致出人意料的结局。一方能否获胜，不
仅仅取决于他的实力，更取决于实力对比造成的复杂关系。

你可能已经发现，乙和丙似乎达成了某种默契：在甲被
干掉之前，他们相互不是敌人。

这不难理解，毕竟人总要优先考虑对付最大的威胁，同
时这个威胁还为他们找到了共同利益，联手打倒这个人，他
们的生存机会都会上升。而且，从悲观的角度看，他们恐怕
也活不到需要相互拼个你死我活的时候。

但这个“同盟”也是很不牢固的，两个人都在时时权衡
利弊，一旦背叛的好处大于合作的好处，他们马上就会翻脸。

在这个“同盟”里，最忠诚的是乙

只要甲不死，他
就不会背叛；丙就要滑头多了，在前面轮流开枪的例子中，
他不朝甲开枪，从同盟者的角度说，就是没有履行义务，而
把盟友送上危险的境地，这不是因为道德水平不同，而是处
境不同。乙是甲的头号目标，这个敌人一定要向他开枪的，
完全没有回旋的余地；而丙不同，他随时愿意牺牲乙换取下
次自己的先动手之利。

除了压力较小之外，还有一个动力驱使丙背叛，那就是
一旦干掉甲后，乙的机会比他要大，他至少要保持先下手，
才可能一争高下。

我们在讲述“三个火枪手的决斗”时设立的基本前提是
每位参赛者都是理性的，而且都力图为自身利益考虑。这个
问题的一项教益在于，显而易见的策略每位参赛者都试
图除掉较强的对手并不一定是好策略。

枪战决斗的另一项教益是，几千年来，人类始终把一条
黄金法则当成行为的准则。这项法则是：种什么因，收什么
果。你种的善因或恶因，最后都会回报到你自己的身上。在
缺乏有关参赛者能否联络、共谋、进行威胁或达成有约束力
并可以实施的协议等信息的情况下，对可能的解法是不能进
行正确评估的。在对策论中，往往需要了解这样的社会学因
素。

无须试图进行严格的论证，我们就能很容易地理解，枪
战决斗可能类似于政治或经济的竞争。按照纽约大学政治学
教授斯蒂温

布拉姆斯的看法：枪战决斗的知识可以扩展到
多位候选人的政治竞选上。布拉姆斯说道：“看来这些候选人
的最佳战略，莫过于在他的部分政治势力范围内追随最强的
对手。
如果你是一个自由主义者，而且另外还有两位自由主义
者，那么你就要追随最强的一位。于是所发生的情况将是两
位最强的对手就会彼此攻击，而最弱者就会存留下来了。”

联盟与对抗

假设敌对三方正在相互作战，他们分别为，各
有

个、
个、
个单位的军队（坦克、军队、战机皆
可），现在开始射击。在蓝氏定律下，每位士兵都会向目所能
及的陌生人开火，无论其属于哪一方。当尘埃落定，军队数
少的一方定会被全面消灭，而
与
则各剩
个与
个单
位的军队。不仅军队最少的一方会成为历史，第二大势力
比起
也是损失惨重。
大约丧失一半的军力，而
不过从
减少到
，所以
可以在少量损失的状况下，轻而易举
除掉
。因此对多数的一方来说，采取随意射击是很有利的，
而
和
互射的结果就是等于间接帮了
军队。
假设
和
两军将领都知道这种状况，于是决定以结盟
的方式，联手对抗
，至于这两军如何处理他们之间的分歧，
容后再谈。于是联军共有
个单位，远远超过
军，假定
仅需要耗损联军的
军，这当然比白白
牺牲要强得多，也同时说明军事联盟这么受欢迎的主要原因。
当然，未必每次联盟都能这么成功。因为结盟双方都很清楚，
个单位即可击败

他们很快就必须摊牌，因此多会有所保留。
还有一个有待解决的问题，在

和
共同与
对决时，
彼此的相对损失如何，这会影响到下一次战斗时双方的情势。
同样地，这个数学计算太过繁琐，假定结果是双方将分别损
失
的

，因此

个单位会剩下
个单位，而
的
个单位则剩下
个单位。在联盟的情形下，成为历史的就是
与

则在共同行动中，分别失去同比例的军力。而在
接下来的战役中，
会获胜，不过损失惨重，原来
个单
位，大约只会剩下
个或是
个，所以他可能会因为损失
过大而觉得不值得和
决战。
从三方竞赛中两方结合是有利的这个原则，可引申到多
人参与的游戏当中，而人们过去的经验也证实了这一点。

三国的曹、刘、孙三家关系，就是“枪手博弈”很典型、
也很有趣的例子。

“赤壁之战”中，曹操实力最强，孙权次之，刘备最弱。
孙、刘都无法单独对抗曹操。为了抵挡最强大的曹操，孙刘
必须联合起来。孙权拥有六个郡的地盘和数万军队，而刘备
没有地盘，只有不足两万人马。用上一节中的例子来比，孙
权是乙，刘备是丙。

我们已经知道，乙是这个“暂时联盟”中较肯卖力的一
方，所以孙权不但“火烧赤壁”打败曹操，更在此后还长期
承担了对抗曹操的主要任务。而刘备虽在赤壁之战中也出了
力，但此后几年未与曹操打过大仗（也就是没有尽联盟义
务）。倒是趁此机会扫荡地方势力，扩充地盘，直至占据两
川，将曹操赶出汉中，又派关羽北伐，水淹七军，不但取代
了孙权原来的老二地位，甚至有可能击败曹操，成为新的老
大。孙权地位跌落到老三，他的策略也随之改变。

于是孙权趁关羽北伐后方空虚之机，与曹操合谋，夺取

了荆州，杀死关羽。结果是同盟破裂，刘备兴兵报仇，又被

孙权打败。蜀汉从此衰落，东吴也面临两面作战的不利局面。

如果分析一下孙权的心理，我们可能对他的背信弃义有

更多同情。赤壁之战尽管符合他的利益，但到底是他出力挽

救刘备，此后他不但把荆州长期借给刘备，还把妹妹嫁给了

这个老头子。他尽了同盟的义务，曾与曹操大战数次，不仅

损兵折将（他的大将董袭、陈武等都在战斗中阵亡），而且他

自己也险些在战争中送命。可是从收益上说，他与刘备是
“牛打江山马坐殿”，感到不平衡是正常的。

可是从对策论来看，孙权却犯了一个大错误，由于嫉妒，

他过早和刘备翻脸，致使两败俱伤。这就好比枪手丙突然翻

脸向乙开火。坐收渔利的当然是甲。虽然曹操的继任者曹丕

没能抓住机会夹攻孙权，一举消灭这两个敌手，但蜀和吴此

后已经没有可能打败魏国了。

那么，孙权的最优策略是什么？回想上节的枪手决斗就

明白了。既然已经落到丙的地位，就该以丙的策略行事。让

刘备去和曹操恶斗，自己扩充势力，养精蓄锐，随机应变。

无论两者胜负，自己都能从中渔利。

理性的人懂得运用智慧推理得出事情的真相，推理在博

弈思维中占据着重要的地位。下面我们讲三个趣味推理故事，

推理的过程充满了趣味和逻辑智慧。

小李和小王都是张老师的学生，张老师的生日是

月
天中的一天，这
天为：
月

人都知道张老师的生日是下列
日，

日；
日，

月

月
日，

日；
月

月

日，

月

日；
月

月

日，

日。
张老师把
月

日，

月
值即日期告诉了
小工，张老师问他们知道他的生日是哪一天吗。小王说：“我

不知道。
”“本来我不知道，”

值即月份告诉了小李，把
小李说：现在我知道了。
小王说：
“现在我也知道了。
”
答案是

日。
月

月

根据小王的话“我不知道”，张老师的生日不能是

日和

月
日。推理如下：
从上面这
个日期中可知，张老师的生日的日期为
日中的一天。其中，
日
各出现
日、日、日、

月
日，
月
日，
月

日和
月
日和
月

次：
日和
日只
出现
月
日；而
日，
月
日和

日和
月
日，月
日。
张老师告诉了小王张老师生日的日期即
月
次：
值
为
值。如果
日，小王马上能够确定出张老师的生日，因为这
两日只有一个可能性。因此，如果他说“知道”，表明张老师
的生日或者是
日或
日。若
值为
、
日，小王无法根据他所知道的信息推得张老师的生日，
因为这四个可能的
月
月
日或者是
值都有两个具体的日期。因此，小王说
“不知道”表明张老师的生日不可能是
月
日，否则的话，他应当说“知道”。
根据小李说的“本来我不知道，现在我知道了”，我们得
到，张老师的生日只能是

月

日或者是
日。推理如下：
小李知道张老师生日的月份，即他知道张老师的生日在
四个月中的一个确定的月份。然而，
四个月中都有两个或三个可能的日期：在

月
月
中有
月

月

日和

日三个可能的日子，在
月中有
日、

月

日两个可能的日子，在

月中可能
的日子有
日、月

月

月
日、
日，

月中可能的日子有

日、月

月

日。

月

日、

月

虽然小李知道张老师生日的月份，比如说他知道张老师
的生日在

月份，但是每个月份中有两个或两个以上的日子，
如
月
日、
月
日和
月中有
个可能的日期：
月
日，小李无法知道张老师的生日为具体的哪一天。这也是小
李说“本来我不知道”的原因。
但是小王说“不知道”排除了张老师的生日为“

月
月
日”的可能性。这样，张老师的生日的可能
日期就减少了两个，而只剩下：
月

日”和“

日；
月
日，
月
日，

月
日；

月

月
日；
月
日，

日。
这也是小李所能够分析到的。
小李听到小王说“不知道”后说“现在我知道了”表明，
此时他能够确定具体的日子即

日，

月
值。在上面
个月份中有
天，而唯有在
月
日，其
余的月份中都有两个或三个可能的日期。
若张老师的生日在

月份，只有一个可能的日期即

月、
月这三个月份，小李
是无法说他知道了张老师的生日，张老师的生日只能有在
月，小李才能说“现在我知道了”。因此，小李说“现在我知
道了”表明，张老师的生日只能在
月、

日。
小王听到小李说“知道”后说“现在我也知道了”，表明
小王根据小李给他的信息也推算出了张老师的生日。

月，即

月

在这个推理的过程开始，张老师生日的可能是上述

天
中的某一天，这是双方的公共知识，
值为小李的知识，
值为小王的知识，
值不是他们的公共知识。当小王
说“不知道”张老师的生日的之后，“张老师的生日不能是
月
值和
月
日和
日”便是他们之间的公共知识。而当小李说
“本来我不知道，现在我知道了”之后，
月
日是张老师的
生日便成了他们之间的公共知识。

如果一块冰淇淋蛋糕由“小娟和小明”两人分配，我们
还是要把博弈规则先讲清楚：第一轮由小娟提出条件，小明
可以接受，从而游戏结束，小明也可以不接受，则游戏进入
第二轮；第二轮由小明提出条件，小娟可以接受，从而游戏
结束，小娟也可以不接受，于是蛋糕完全融化，游戏同样结
束。

虽然大多数人基于“社会常识”或者说是善良的心理，
预期一半对一半的分配方案看起来最公平，其实这个博弈却
有无穷多个纳什均衡。事实上，假设蛋糕的总量是

，那么
小娟要
固然是一个纳什均衡，小娟要

、小明要

、小明也要

也是纳什均衡，甚至小娟要、小
明只要

也是纳什均衡。最“严酷”的，莫过于小娟要
、小明只能要

也是一个纳什均衡。反过来也一样。
我们说小娟要、小明只要
，甚至小娟要
、小明什么都得不到也是纳什均衡，这只是事物的一个
方面；另一方面小明当然可以因为感到这么分配太不公平而

生气，拒绝接受这一条件。

这看起来是非理性的，但是如果他着眼长远，希望建立或
者保持自己作为一个不好对付的讨价还价者的形象，从而为日
后的讨价还价奠定基础，就是理性了，因为将来的讨价还价可
能是跟小娟进行，也可能是跟其他孩子进行，他们将同样得知
今天自己的所作所为。在实际操作当中，小娟同样需要考虑到
这些问题，要向小明放出刚好足够的诱饵，比如留给他一小片
蛋糕，引诱他上钩。

但是为了使阐述过程保持简洁，我们将所有这些复杂问题
丢在一边，在一步博弈中假设小娟可以拿走她所要求的
份额。

不过，一旦出现需要第二轮谈判的情况，局势就会变化，
大大偏向小明。现在，桌子上同样放了一个冰淇淋蛋糕，但
是两轮谈判过后，整个蛋糕就会完全融化。

这里要注意，假如在第一轮小明拒绝接受小娟提出的条
件，他随后可以提出一个反建议，不过，到那个时候，桌子
上只剩下半个蛋糕了。假如在第二轮小娟拒绝接受小明的反
建议，剩下的半个蛋糕就会融化，双方都将一无所获。

面对这个两轮的博弈，小娟现在必须向前展望她最初提
出的条件会有什么后果。她知道，如果她提出的条件太苛刻，
小明可以拒绝她的条件，从而在第二轮占据有利地位，反过
来就剩下的半个蛋糕提出“接受或者放弃”的分配方案，逼
迫小娟就范。这实际上意味着小明已经将那半个蛋糕握在自

己手里。

可见，如果小娟不能阻止这一幕发生，即如果不能阻止
博弈进入第二轮，她必将一无所获。一旦看清这一点，她会
从一开始就提出与小明平分这个蛋糕，这也是说，这个方案
刚好足够引诱对方接受而又为自己保有一半收益。这样，他
们马上达成一致，形成约定，平分这个蛋糕。

“分蛋糕”的讨价还价说到这里，多轮谈判博弈的基本推
理已经非常清楚，从而我们的讨论还可以再进一步发展。问
题总是在最简单的条件下先想清楚，然后向复杂的情况推广。
面对分蛋糕的多轮博弈，现在我们要么加速谈判进程，要么
延缓蛋糕融化的速度。

但是这种推广不能把实质的东西舍弃掉。分蛋糕的多轮
博弈，最富实质性的一点是，随着谈判各方每提出一个新的
建议和反建议，蛋糕都在融化。比如三轮谈判博弈，蛋糕从
一个变成

个再变成

个，直到零，最后什么也没有
剩下。
这时在第三轮轮到小娟提出最后一个建议，而蛋糕已经
缩小到只有

，她将可以全部拥有。小明知道这一点，所
以在第二轮轮到自己提条件的时候许诺分给她

，这时蛋
糕还剩下

。这么一来，小明可以得到的最好结果就是
个蛋糕，即剩下的

的一半。小娟知道这一点，于
是在一开始就许诺分给小明

，这刚好足够引诱小明接

受，从而小娟自己得到蛋糕的
若是每次缩水

的四轮的讨价还价博弈，最后一轮将
是小明提出条件，得到这个时候桌子上剩下的

个蛋糕。
因此，小娟必须在倒数第二轮提出分给小明

个蛋糕，当
时桌子上还剩下半个蛋糕。而在此前的一轮，小明可以让小
娟接受分给她

个蛋糕的条件，这时还剩

个蛋糕。
一路这么向前推下去，我们可以知道，讨价还价一开始，小
娟就应该提出分给小明半个蛋糕，自己得到另一半。

若是五轮，小娟一开始可以提出分给小明

个蛋糕，
自己得到

。若是六步，那么分配方案又回到各得一半。
若是七步，小娟则得到

，小明得到

在这个典型的谈判过程里，蛋糕是在缓慢缩小，而且在
全部消失之前有足够的时间让人们提出许多建议和反建议。
这表明，通常情况下，在一个漫长的多轮的讨价还价过程里，
谁第一个提出条件并不重要。几乎一半对一半的解决方案看
来还是难以避免，除非谈判长时间陷入僵持状态，“胜方”大
概什么也得不到，“败方”自然也不会更好。不错，最后一个
提出条件的人可以得到剩下的全部成果。不过，真要等到整
个谈判过程结束，大概也没剩下多少值得赢取的东西了。得
到“全部”，而“全部”的意思是什么也没有，就是“赢得战
役而输掉战争”的生动例子。

我们必须看出很重要的一点：虽然我们考虑过许多可能
的建议和反建议，理性结果的关键之处却是小娟提出的第一

个条件应该能够被对方接受，而谈判过程的后期阶段只有思
维意义，实际上从来不会发生。

不过，假如第一轮不能达成一致，这些步骤将不得不走
下去；在第一轮行动的小娟盘算怎样提出一个刚好足够引诱
对方接受的条件时，这个事实非常重要。

这个推理的启示是，上述动态博弈的所谓“向前展望、
倒后推理”的原理，可能在整个博弈过程开始之前，已经确
定了博弈的最后结果。另一个启示则是，如果讨价还价的过
程真像上面阐述的那样，企业应该不会出现罢工。当然，罢
工的可能性是会影响最终达成的协议的，不过公司方面（或
者工会方面，同样适用）应该把握第一个提出条件的机会，
提出一个刚好足以引诱对方接受的条件。

但是在现实社会里，罢工还是常常发生，谈判还是常常
破裂。从理论上说，只有两个可能，一是现实生活中其他一
些更微妙或者更复杂的因素在作怪，二是讨价还价双方的行
为并不能用理性人的模式来概括。这两个因素实际上是相关
的：正是因为现实生活比模型假设复杂和微妙得多，人们并
不是彻底的理性人。

一场足球赛需要很多队员，如果是正规比赛的话，包括
守门员在内，双方各

个队员。然而在同学之间不正规的足
球赛中，双方各有
个人，一场足球赛就可进行了。在学
校往往很难组织一群人来踢足球，因为某人开始组织这样的
活动时，被游说者因对是否能组织起这么多人不抱信心而推
脱。

但有这样一个屡试不爽的方法：开始组织时，组织者告
诉被劝说的第一个人

，已经有
个人同意进行一场比赛，
就缺一个人，这样他会毫不迟疑地答应了下来；劝说第二个
人
时，组织者也告诉他已经有
个人同意进行一场比赛，
比如
已经答应了；劝说
时，组织者同样说已经有
个人
答应了，
若问有谁已经答应踢球时，组织者可以说，如
、

场足球比赛就这样组织成功了。
这里，组织者开始说已有

个人答应参加比赛，只是作
为预先的“假定”。这个假定略带“欺骗”，但这里的欺骗是
没有恶意的，但对其他人心理的影响是很大的。有了这个善

意的欺骗，一场球赛便组织起来了。

在经济、政治、文化等活动中，人们以多种方式使用与
此类似的行为。比如，某个单位要组织某个活动，邀请许多
单位或个人来参加。在组织这样的活动时，组织者往往事先
邀请了一些著名的单位或个人，随后邀请其他单位或个人来
参加，并说：某某单位或某某人已经（或可能）同意参加这
样的活动。

组织者事先在媒体上或者在给其他单位的邀请函上标明，
某某著名人物或某某单位将出席。这样，被邀请的单位或个
人在“参加该活动”和“不参加该活动”之间进行选择时，往
往倾向于选择“参加该活动”，因为参加由这些著名的单位或
名人参加的活动能够获得好处。

而事实上，这些著名的人物或单位是否已经决定参加，
只有组织者本身知道。这样的行为多少带有欺骗性质。所不
同的是，这些行为中存在“欺骗”程度不同，有“善意的”
欺骗和恶意的欺骗之分。

非子

内储说
上有一则故事：“齐宣王使人吹竿，
必三百人。南郭处士请为王吹竽，宣王说之，廪食以数百人。
宣王死，湣王立，好一一听之，处士逃。”这则故事译成白话
文，其意思是：齐国的国君齐宣王爱好音乐，每次必叫
个乐师为他吹竽。南郭先生请求为国王吹竽，齐宣王很高兴，
国君为数百人提供食物。齐宣王死后，齐湣王上台，他喜欢
听人一个一个独奏，于是南郭先生逃跑了。

齐宣王和齐湣王都喜欢听吹竽，但他们喜欢的方式不同，
齐宣王喜欢听合奏，而齐湣王喜欢听独奏。合奏的制度不能
把乐师的吹竽能力区分开来，独奏则可以。齐湣王的独奏制
度使得不会吹竽的南郭先生逃跑了。

这就是典型的搭便车的案例。

制度是分辨人的能力的途径。如果一个社会设计的制度
不好，人人都会是南郭先生。

社会体制在很大程度上是鉴别人的能力的体制。在“滥
竽充数”的故事中，大家在一起吹竿，无法分辨出吹得好的

人和吹不好的人；如果让每个人单独地吹，不会吹笛子的南
郭先生马上就露出马脚。

社会体制就是鉴别谁能够吹笛子，谁不能吹笛子，以及
将会吹笛子的人分出等级。市场机制是鉴别哪个厂商生产的
产品价格便宜、质量高的机制，即检验厂商能力的机制；考
试制度是鉴别学生的学习能力强弱的制度，把学习能力强的
学生与学习能力差的区分出来；企业的考核制度努力把对工
作能力强、企业贡献大的劳动者考核出来；职称评审制度是
给学者确定等级的制度，等等。

然而，分辨人能力的任何制度都是人设计并由人来操作
的，人总能够“超越”它，有这种制度的地方就有“超越”
这种制度的作弊行为。因而这种制度只能够做到“大致”有
效。学生考试作弊是人生作弊的开始；行贿、受贿、拍马屁
是官场上的作弊行为；各种评审制度中评审人和被评审人之
间的串通是另外一种作弊方式..

因此，分辨人能力的制度的建立是社会工程师（管理者）
的任务，这个制度一方面要真正做到将有能力的人和没有能
力的人区分开来，一方面要杜绝作弊行为。

我们再看下面一个博弈：

有一个群体，假定该群体由

个人组成，每个人有
元钱。该群体有一个投资机构，它可以使每个人投资的钱增
值到原来的
倍。但分配的方式是，将投资机构所得来的钱
在

个人中平均分配。问：每个人将向该投资机构投多少钱？

每个理性的人均会如此计算：假定他向投资机构投资
元钱，该投资机构将投资的

元钱变成
元，
倍，即变成
根据规则，这

元钱要在
元。
因他投资
个人间分配，他能得到
元，投资所得为
元！他投资
得越多，亏损得也越多，尽管其他人将从他的投资中得利。
这样一算，投资是不合算的。他没有投资的激励。
这个博弈中，每个人均不愿意投资，而希望其他人投资。
因此，这个博弈的均衡是每个人都不向这个投资机构投资钱。
我们想一想，每个人均将自己的

元，他亏损了
元向这个投资机构投
资，这是最好的结果，然而，在没有监督机构监督的情况下，
这个结果是难以达到的。

这个博弈可以看成是公共产品的供给模型。

作为理性人，人人均想贡献少或者不贡献而得到更多的
回报。公共物品是能够对所有人带来好处的物品。但每个人
均不想提供这样的物品，而希望其他人提供，自己坐享其成。
在公共物品问题上，人人均有搭便车的想法。

假定有一个村子，修一条通往村外的大路对村民的交通
有利，既能使村民行走方便，又可以有利于他们的经济活动。
但每一个村民均不想自己来承担这个任务，因为一旦有人出
资修这条路，其他人将不付成本地从中获得好处。修路人当
然也能够从中获益，但与他的付出相比，好处不大。这样，
每个村民均希望其他人来修路，他从中“搭便车”。结果是，
长期以来村子里没有一条大路通往外面。

这里，无论是“投资人”，还是“村民”，他们均是理性
的人，均具有博弈思维。一旦出现这种情况，一个公共机构
的产生便是合理的。对村子来说，村委会便是这样的公共机
构，它将可能向每一户村民集资，将集资所得用来将这条路
修好。这样，每个村民都承担了修路的成本，同时每个村民
也从中获得好处。

这些村民相当于上面的

位投资人。这
位投资人知道，
每个人均采取“不投资”策略是理性计算的结果。为了打破
这个均衡，他们达成一个协议：每个人均必须将自己的钱投
向这个机构（否则将受到惩罚）。每个投资人都知道，一旦所
有人都能够做到倾其所有来投资的话，每个人均获得好处。
如果有一个监督机构能够采取措施保证每个人均能够投资、
并有措施监督每个人的行为的话，每个人都将会做出投资决
定。这样，
个人均把自己的
元投向投资机构，每个人
的最后所得将由原来的

元变成

元！

我们看到，当群体中出现人人想“搭便车”（即从他人的
行为中获得好处）时，建立一个公共机构来协调该群体的行
为，对该群体的每一个人均是有利的。

阿罗有个著名的“不可能”定
理。阿罗认为，在非独裁的情况下，任何一个体系，若要将
人们在三个或三个以上的选择中做出一项集体抉择，不存在
任何加总社会个体成员偏好的方法。
所谓加总社会偏好，即找到一个社会偏好函数，它必须
同时满足以下几个最基本的要求：
）传递性；

斯坦福大学教授肯尼思

）非独裁性。
全体一致性；
不相关选择的相互独立性；

传递性的要求是，假如人们在

和

之间选择
，在

和
。全体

，那么人们在
之间必然选择

和

之间选择
，那么，
和
之间一致倾向于
一致性的要求是，假如在

。不相关选择之间的相互独立性的要
而非
人们就会选择

之间做的选择并不取决于是不是存在另
和
求是，人们在

。非独裁性的要求是，没有任何人可以每次都

外一个选项

得逞，因而不存在独裁的力量。
自从

年肯尼思

阿罗令人信服地论证出了这个结
论，即任何可以想得出的民主选举制度都可能产生出不民主
的结果，这一论证使数学家和经济学家感到震惊。阿罗这种
令人不安的对策论论证立即在全世界学术界中引起了评论。
阿罗的论证，称之为不可能性定理（它证明了完全民主
在事实上是不可能的），该论证帮助他于

年获得了诺贝
尔经济学奖。对策论中最早的和最惊人的成果之一，也就是
阿罗的“毁灭性发现”所产生的影响，人们至今还能感觉到。

在民主投票中所固有的不民主悖论可以用一个实例进行
很好的解释。
假定有三个候选人甲、乙、丙，民意测验表明：选
民中有

愿意选甲而不选乙，

愿意选乙而不选丙，
那么是否意味着，喜欢甲的选民一定超过喜欢丙的？

未必！如果选民的态度有三种，分别是：甲、乙、丙；
乙、丙、甲；丙、甲、乙，持三种态度的人各占总数
那么就会出现一个怪圈：

人喜欢甲超过乙，

人喜欢
乙超过丙；

人喜欢丙超过甲！

这个例子反映的道理是深刻的，如果是社会对几个方案
进行表决，如国家选举总统、某个城市让市民决定先修建哪
个公共事业工程，等等，社会投票很可能得出矛盾的结果。

和其他类型的多人博弈一样，投票当中也会出现策略问
题。投票者常常不愿表达自己的真实倾向。

无论是少数服从多数的规则，或是任何其他投票机制，

都不能解决这个问题，因为现在尚不存在一个完美无缺的体

系，可以将个人的倾向汇聚成人民的意愿。

比如，三位女郎结伴逛街，临近中午她们打算一起吃午

饭。她们都喜欢洋快餐，正好这条街上有麦当劳、肯德基和

必胜客，可是每个人的偏好不同：

喜欢麦当劳，其次是肯
德基，最不喜欢必胜客；
的偏好依次是肯德基、麦当劳、
必胜客；
的选择却又不同：必胜客、麦当劳、肯德基。假
定这三人一定要一起吃饭，那么会出现什么结果呢？
因为三个人的喜好如此不同，难于达成一致，所以她们

决定采取投票表决的方式，先在麦当劳与必胜客之间决出一

个胜者，然后再与肯德基决胜。

如果是每个人都诚实投票，那么，麦当劳将战胜必胜客
（因为

在两者之间倾向于前者），并在第二轮战胜肯德基。
但是如果
不诚实投票，结果就会大不一样。
知道其他人的偏好，而且她希望达到自己满意的结果，
于是在第一轮故意投票给必胜客，于是必胜客获胜；在第二
轮，肯德基又战胜必胜客，于是，
通过策略实现了自己的
愿望。可是这个愿望并不是符合大家的最大利益的理想
的结果应该是麦当劳，因为在三个人的综合评价中，它的分
数最高。
因此投票制的民主实在是知易行难，由于排名内部的模
棱两可，造成狡猾的候选人有极大的操弄空间，无论什么规

则都会造成公平选举遭到扭曲的结果。所有政治演说也常谈
到尊重“人民意愿”，却不容易做到。事实上，也几乎不可能
决定何者是人民的意愿。通常宣称实行民主制度，远比实际
实施民主要容易得多。显然这种决策困境亟待深入探讨。

所谓杂货铺定位问题前文已讲过，简单说就是：在一条
街道上有两家杂货铺，为了争取更多顾客，两家杂货铺都趋
向于把店铺设在街道中心点。最后的均衡是，两家杂货铺都
开设在整条街的中点，紧紧挨在一起。

杂货铺定位问题最早是由美国经济学家霍特林提出来的
（即霍特林模型）。这一模型常被运用来说明西方两党政治的
若干现象。

西方一些大国，都有相似的两党政治。在英国是保守党
和工党轮流执政，在美国则是共和党和民主党轮流坐庄。民
主党和工党一般被认为是“左派”，倾向于标榜代表劳工阶层
的利益，共和党和保守党则是“右派”，站在企业主一边。在
竞选的时候，人们可以发现，两党互相攻击越来越厉害，可
是实际政治纲领却越来越靠近。等到一个政党获胜取代对手
上台以后，选民发现，新政府较老政府并没有多少实质性的
改变。

为什么会这样呢？进一步，为什么这些西方大国都会出

现两党政治呢？

实际情况就和杂货铺定位博弈一样。工党一定要打出劳
工代言人的旗帜，所以它是站在左边的，左边是它的地盘。
但是只有左边一半的选民，还不足以保证胜出。为了在竞选
中获胜，它要想办法把中间的在两党之间摇摆的选民争取过
来。最好的办法就是使自己的竞选纲领向“右”的方向靠过
去一点，即在竞选中宣布也要照顾中产阶级的利益，甚至兼
顾企业主发财。移过去一点，地盘就可能大一点。同样，原
来立党之本是在“右”边的保守党，在竞选的过程中也要往左
边靠，以争取更多的选民。这样斗法的结果是，在漫长的竞
选过程中，虽然两党的攻击和谩骂不断升级，但是实际纲领
却不断靠近，直到两个政党在中点紧挨在一起，才是稳定的
纳什均衡。

为什么第二个政党难成气候？这是因为在上述假定条件
之下，如果三个政党的位置不相同，不在同一个点上，那么
至少有一个政党单独位于一端，它就有向内挤压的动机，道
理和前面论述的一样，所以这时候不是稳定的局面。

如果三个党都位于中点，那么谁单独跳开一点点，谁就
会取胜，所以也是不稳定的局面，这是因为从中心跳开一点
（无论向左向右）的时候，至少那一边的选民都会投他的票，
例如，向左一点，左边的选民就会选他；而另一边的选民要
由留在中点的两个政党来瓜分，这两个党各自的得票，就都
比不上跳开的那个党。

同样，如果三个政党位于同一点，但是这一点不是中点，
那么谁单独向中点稍微移动一点点，它就会占便宜，这是因
为从旁边向中点移动一点的时候，多数选民都会投他的票，
而另外两个政党则只能平分不到总数一半的选民。

三个党不在一起不稳定，三个党全在中点也不稳定，三
个党全在另外一点更不稳定，总起来一句话，就是三党政治
不会稳定。或者换一个角度理解，即纲领变化无常的政党不
会有较强的生命力。

这个政党纲领向中点移动的机制，也说明西方两党政治
的欺骗性，竞选的时候，怎样有利于拉票就怎样讲，当选以
后就可以忘得一干二净。从这个意义上说，西方国家的政治
态度不要以为哪个政党上台就会根本改变，确实很有道理。

当然，从另一个角度看，这种两党政治主张的趋同性其
实也并不完全是坏事

甚或可以说是好事，因为所谓民主
政治，就是要最大限度地照顾每个人的利益，尽管免不了有
妥协和交易，但要把不同阶级、不同政治理想和利益要求的
人组织成一个整体，这些代价也许是不得不付出的。

鱼和熊掌能否兼得
选择的智慧

年，英国剑桥有一个做马匹生意的商人名叫霍布
森，他在卖马时只要求顾客给一个低廉的价格，并且承诺：
买或是租我的马，都可以随意选。但他又附加了一个条件：
只允许挑选能牵出圈门的那匹马。其实这是一个圈套。他在
马圈里只留一个小门，大马、肥马、好马根本就出不去，能
出去的都是些小马、瘦马、懒马。显然，他的附加条件实际
上就等于告诉顾客不能挑选。大家挑来挑去，自以为完成了
满意的选择，其实选择的结果可想而知。这种没有选择余地
的所谓挑选，被人们讥讽为“霍布森选择”。

一个企业家在挑选部门经理时，往往只局限于在自己的
圈子里挑选人才，选来选去，再怎么公平、公正和自由，也
只是在小范围内进行挑选，很容易出现“霍布森选择”的局
面，甚至出现“矬子里拔将军”的惨淡情况。现在选“马”，
就要当个好“伯乐”，跳出马圈的圈子，到大草原去选“马”、
到全世界去选“马”，打开思维空间，扩大资源的配置半径，
充分利用国内国际两个市场、两种资源。一般地讲，配置资

源的半径越大，企业就越处于优势，反之，配置资源的半径
越小，企业就往往会处于劣势。只有放宽眼界，打开思维，
放眼世界，才能选到世界级的“千里马”。

在“霍布森选择”中，人们自以为做出了抉择，而实际
上思维和选择的空间都是很小的。有了这种思维的自我僵化，
当然不会有创新，所以它更是一个陷阱，让人们在进行伪选
择的过程中自我陶醉而丧失了创新的时机和动力。

“霍布斯选择”其实就是没有选择可选择。别无选择虽然
令人无奈，但是太多的选择叫人眼花缭乱。当然，这总比没
有选择要好多了，可是要从诸多选择中找到最优结果也并非
易事。

如果选择只是限于买什么样的衣服，或选择吃牛肉面还
是麦当劳之类的小问题倒也无关紧要，可是小至人生道路的
选择，企业经营战略的设定，大至国家的大政方针，都有一
个最佳策略的问题。这也正是为什么人们对此如此关注的原
因。如果别无选择，你也只能这样走下去，正如亚当只能爱
夏娃一样。这个结果也许并不理想，但至少你知道自己没做
错什么。一旦你有了选择的权利，责任也就随之而来：如果
结果不好，只能说你做得不对。

“霍布森选择”揭示的是无可选择时的选择，下面我们再
来看看“布里丹的驴子”的故事，故事揭示的是面对不相上
下的两个选择时的选择。

在一头驴子的前面有两堆草，对于这头驴子来说，这一

左一右两堆草一模一样。这头驴子尽管饿得要命，但它无法
挪动它的腿，因为一模一样的这两堆草使它无所适从，它没
有理由选择其中的一堆而放弃另外一堆。这头驴子最后在这
两堆草面前活活饿死了。

这就是被称为布里丹的驴子。布里丹是

世纪法国哲学
家，他否认人具有自由意志，人们提出的这个“驴子问题”
意在反驳他的观点。
每个人都希望有选择，而且希望做出正确选择即使
不是最好的，至少也是比较好的，那么有没有一些方法可以
帮助我们呢？

面对两个策略选择，无非是两种可能，一是其中一个好
于另外一个，二是两个策略“无差异”，即一模一样。若是前
者，作为理性人无疑应当选择给我们带来更大利益的那个策
略，而对于后者，选择那个策略都一样。

当然，在实际中由于我们不可能掌握充分的信息，我们
对两个策略下的后果不能确定，我们认为两个都一样，但实
际情况则不是如此。但是，我们无论选择其中哪个策略，都
要好于不做选择，我们为何要犹豫呢？如果驴子所面对的这
两堆草中的一堆离它距离近，或者分量多，它自然应当选择
这一堆，但当这两堆草都一样的时候，它无论选择其中哪一
堆，都会比其结果为饿死的不做任何选择要强。重要的不是
做出什么样的选择，而是要做出选择当然这是有条件的。

有四样东西一去不复返：说过的话、泼出去的水、虚度
的年华和错过的机会，机会对一个人的成功是显而易见的，
在机会面前如何选择才是正确的？也许每个人都有一套理论
为自己的选择论证。针对每个人、每件事，如何进行选择并
没有一个完美答案。

我只能通过一个个案例故事告诉你一种思维推理方法，
你进行选择时可以借鉴这些推理估算方法。

还是先来看看远在几百年前我们的哲学大师苏格拉底为
我们提供的选择策略吧。

苏格拉底的三个弟子曾向老师求教：怎样才能找到理想
的伴侣？苏格拉底没有直接回答，而是把他们带到一块麦田，
要求他们沿着田埂直线前进，不许后退，而且仅给一次机会
选摘一枝最大的麦穗。

第一个弟子走几步看见一枝又大又漂亮的麦穗，高兴地
摘下了。但是他继续前进时，发现前面有许多比他摘的那枝
大，只得遗憾地走完了全程。第二个弟子吸取了教训，每当

他要摘时，总是提醒自己，后面还有更好的。当他快到终点
时才发现，机会全错过了，只好将就着摘了一个。第三个弟
子吸取了前两位教训，当他走到

时，即分出大、中、小
二类，再走时验证是否正确，等到最后

时，他选
择了属于大类中的一枝美丽的麦穗。虽说这不一定是最大、

最美的那一枝，但他满意地走完了全程因为他知道，自
己已经尽可能争取到最好的结果了。
注意那个结果最好的弟子的策略：。为什么这是一
个比较理想的比例呢？

事实证明，选择最佳对象的最好搜寻策略，就是在冷静
地比较若干样本后，选择下一个高于他们全体的那一个，称
为约会比率与等待流程。失去最佳选择的风险约有

，但
是你已经竭尽所能了，而且你还有大约的机会在

个
当中挑中最想要的那一个。其实当你在

个人当中挑选时，
的机会已经算是不错的了（坦白说，
其实并不怎么
准确，不过在现实生活的决策里，要精准到小数点以后第
位似乎不太有意义）。所以相同的逻辑也可以套用到选择上。

苏格拉底的选择让后人回味无穷。无独有偶，下面所介
绍的“约会游戏”中的选择策略与苏格拉底的有异曲同工之
妙，或者可以说，后人借鉴了苏格拉底的选择策略，编写出
“约会游戏”这个案例来介绍博弈思维。

现在我们来看看“约会游戏”的具体内容。

假定你是个女性，决定要结婚，你身边社交圈里有
个合适的单身男子都有意追求你，你的任务就是，从他们当
中挑选最好的一位作为结婚对象。但要从这

个里面选出
最好的一个并非易事，你该怎么做才能争取到这个结果？
首先你想到的是和这

个人都接触一遍，了解每个人
的情况，将各项素质分别打分，说不定还要列出图表，经过
对比筛选，找出那个最优秀的人。
可惜在这个游戏中，条件是严格限定的：每个人你只能
约会一次，而且只能当场决定选择还是放弃，不能把他们
“冷冻”起来作为后备，一旦你选择了其中一个，你就没有机
会再约会别人了。这些条件似乎有点苛刻，其实在生活中，

大多数情况下机会是不等人的，等你左挑右选，把一切都规
划好了，人家可能早就成了别人的如意郎君。所以说，这样
限制是有道理的。

还有一个游戏规则必须遵守，约会之后一旦你决定淘汰
这个人，他就永远出局了。你可以假设他娶了别人，或者心
灰意冷出家当了和尚，甚至跳下断崖一死了之。重点就是你
不能和每个候选者约会后，再把他们贴上排名的标签，收藏
在仓库的架子上，最后才从里面挑最好的一个，也就是你不
可以把所有的候选人当货物一般存起来。统计学家称这种一
边搜集资料一边做决定的决策过程为运次决策。

那么到底什么是赢的策略呢？赢的策略就是能够给你最
大成功机会的策略。纵使无法

肯定，但是你知道自己
要的就是最大的成功机会。那么这个游戏就变得很简单了，
因为你知道你要的是什么，一切透明化，只要靠自己就可以
独立完成命运攸关的决定。

说了这么多，到底最好的选择方式存不存在呢？

当然是存在的。虽然这种方式不能给你最肯定的答案，但
是绝对可以增加达成目标的机会。而在这个游戏中，只要你策
略对头，就能取得不错的成果。现在就来场沙盘推演吧。

显然，你不应该选择第一个遇到的人，因为他在

个
当中名列第一的机会只有

。这个概率可以说是非常的渺
茫，直接把筹码放在第一个人身上，也是最糟的赌注。即使
这个人的确非常优秀，你也要忍痛割爱，因为你不知道在这

个人里，他到底排在什么位置。同样地，第二个人、第
三个人，甚至后面的人，情况都一样，每个人都只有
的
机会可以成为

个人当中的第一名。如果你真心想要找到
最好的，就不应该随机选择。

但是这里有一个问题：假如你约会的头一个碰巧是最好
的那个呢？你把他淘汰掉了，以后约会的对象“一蟹不如一
蟹”，岂不是遗憾终生吗？在我们身边，确实有些夫妻是初恋
情人，而且过得很幸福。有必要再重申一次：在这里我们谈
的是游戏中的策略问题，而不是现实中的爱情和缘分问题。

好了，现在切入正题，介绍选择策略。

一个最有效的方法是：将第一组人（比如说先取

名）
作为试验品，就好像在糖果店或面包店里的试吃品一样，之
后如果遇到比这组人更好的对象，就可以考虑嫁给他了。这
个方法既可以在候选人之间作比较，同时也不会与现实太过
脱节。你可以在日记里给每个约会对象评分，以
分为满
分，当分数高于前
人的对象出现时，他就是最后的赢家。
你要做的就是从前

个人当中获取一些经验，作为评估他人
的基础，所谓约会其实就是这么一回事。
值得注意的是，运用上述策略时，有两种情况会使你损
失惨重。第一，如果前

名刚好是全部里面最糟的，碰巧下
一个又是倒数第
名，那就算你倒霉了，你将面临一个相当
坏的选择，虽然不是最坏，不过也够糟的了，并错失选择最
好的机会。因为既然这个倒数第
名已经比前

个都要来

得好，依照上面的决策模式，选择他是不会错的，可是其实
首选对象仍在苦苦地等待着你，只不过你还处于约会初期，
绝不会知道这点。这就像是成天在一群奇怪的人周围打转，
和这些人相处的经验将扭曲你对正常人的印象。

第二种状况正好相反，就是最好的选择恰好已经在前
个当中，导致你设了一个以下无法达到的高标准，在未来的
约会中不可能再遇到和他们一样好的，最后只好在所有机会
都出现后选择第

个。而这第

名顶多只是中等标准。
那么，终其一生，你将幻想着，要不是放弃了那一个人，结
果就会如何如何。采用这个策略有大输、大赢的机会。我们
不难解释在运用此一策略的情况下，你将有

赢的机会，
也就是与最优秀的人结婚的概率达

。这当然比随机选择
好得多，但还没有十足的把握。因此，接下来，你得决定排
名第

，或第
的次佳选择。
那么是不是还有更好的决策呢？当然，在这个案例中，

由于你只从

、第
个样本，而最佳选择
刚好在样本中的机会只有
个候选人当中取了

，因此第二种错误（也就是
让最佳选择从手中溜走）的发生机会相当小。所以，在此
类错误风险不高的情况下，也许你会愿意提高抽样的数目，
这样就有更多的经验来增加自己的判断能力。因此如果运
用相同的策略，但是将样本数改为

，那又会如何？如此
一来，虽然最佳选择从手中溜走的机会将会从
增加

到

，但也会大大降低设立过低标准的可能。这是一种

交换条件，如果有一边更好，另一边就会更糟。那么如果
抽样数目是

，甚至
，又会如何？
说了这么多，你可能已经明白了一点：这是一个两难选
择，如果你抽取的“样本”太少，你得出的结论可能并不准
确；可是如果你取样太多，结论倒是准确了，可是又很有可
能错失最佳选择（他正好在取样里，被牺牲掉了）。

在现实爱情配偶的选择上，我们都希望找到最好的那一
个，但是如果你把这作为唯一目标，你可能得不偿失。在我
们面对选择时，决策的核心并不在于结果的最优，而是决策
过程的最优化，只要你的策略合理，结果当然也不会差。

一个最重要的理由是：你很难找到一种方法来保证实现

不能用、

这一理想。人不是机器，“型号”“运算速度”“行业、
标准”之类的东西衡量，人比任何机器都复杂得多。你也许
会想到考试这种方式，但即使你的考题出得很不错，也只能
反映某些素质，更不必说还有纸上谈兵和口是心非之类的不
确定因素。

按图索骥是人们常犯的毛病，好多少男少女正是以心目
中的偶像（通常是浪漫影视和大众媒体营造出的不真实的形
象）作为择偶标准。这种标准至少有两个问题：其一是似乎
认为人也像某种高档商品，是可以批量生产的；其二就更糟
糕：如果真的享受不到，就弄个假货自欺欺人。当然，我们
都希望得到高标准的，但如果你不学会降格以求，恐怕只能

孤独下去。

时间不会倒流，机会往往也是如此。如果你的标准过于
苛刻，就会丧失许多本来可以抓住的机会。有这样一个故事：
女儿年龄渐大，还是不肯结婚，父亲很是着急。女儿不以为
然，说：海里的鱼还多着呢。
父亲回答：

“没关系，”“可是鱼饵
放得太久，就没有味道了。”

在爱情问题上有许多神话，人们炮制这些神话的初衷是好
的，但是如果你信以为真，结果可能就不是好的了。最典型的
一个神话就是所谓“另一半”：这世界上的男男女女，每个人
都有属于自己的另一半，而我们恋爱的目的就是要找到那个
“另一半”。这个说法挺叫人感动，但于事无补。它的意思是：
有（而且只有）一个最佳答案。姑且先承认这一点，可是世界
上和你年龄相仿的女人或男人有好几亿，而你所能接触到的不
过一二百人，指望从这个小的范围找到那个“正确答案”，可
能性约等于买一张彩票即中大奖的概率。如果某人把改善命运
的希望完全寄托在中彩票上，我们会认为此人神经出了问题，
在爱情上，道理也是一样。

比较合理的策略可能是将各种策略综合起来，比如先画
定一个及格线，在这个及格线上选择某种素质最突出的；或
者掉过来，选择总分高，同时某个素质也不太差的。这样结
果虽然不一定最好，但一定很不错。

或者还是回到刚才提到的“约会游戏”中，我们可以避
免选到最差的，也就是说，不把追求最佳人选作为最大目标，

而是设法避免挑到最差的人选，这就称为规避风险。也就是
说，在赌博的时候（你的确是在赌博，只不过不是用一般的
筹码），你应该设法减少损失而不是一味追求高利润的报酬。
就像赌马挑品种比较好的马，就是为了规避风险。在这样的
前提下，你的策略又会有什么转变呢？

确定这个前提后，就算你认为挑中次佳人选并不可悲，
你也不必为了简化约会过程，而将约会人数从

个人降到
个人。比较好的做法是，把前
个人当做样本，然后跟
前面的做法一样，挑选下一个比他们更好的对象。这样虽然
挑到最佳人选的机会稍微降低，但是仍有高于
的机会挑
到最佳或是次佳人选。更不必到约会终了，甚至在咽下最后
一口气时选。这样做是比较合理的，依此类推，如果你认为
这

个样
本，这样你就有
个人里面的前

名都可以接受，那你只需要
的机会可以找到前

名的对象，也就是
说，只要动动脑筋，就有将近
的概率可以遇到

个人
当中的前

名。
这种比较保守的策略并不会降低挑中最佳人选的机会，
只是把比率从

，下降的幅度甚至很难察觉得出
来。你只要放弃一点点获得最大奖的机会，就能大大提高平
均成果，也把找不到合适对象的概率降低了

这个游戏有许多不同的可行策略，最适合你的策略（应该
作为个人决策的指导原则），就看你的目标订得有多清楚。你可
以说我只要最佳人选，这是第一种策略，但也必须接受可能会

降到

败得很惨的事实。或者，你可以稍微降低一下标准来减少损失。
总之，你必须事先搞清楚自己到底要找什么样的对象。因为对
于每一组清楚确认的目标而言，其相对应的策略都有不同的约
会比率与等待过程。这一点应该并不意外，因为每个人在日常
生活中都是这么做的。

其实，无论是选择爱情也好，工作也好，人生道路也好，
“正确答案”只在理论上存在。与其在这上面纠缠不清，不如
通过理性的态度，选择合理的策略，争取一个较好的结果。

某个世界著名的大公司招聘员工。公司招聘部门给应聘
者出了这样一道题：在一个雨夜里，你驾驶一辆车，经过一
个你熟悉的小镇。你看到有三个人在焦急地等车，他们是：
医生，女郎和老人。对你而言，医生曾对你有过救命之恩；
而这个女郎，你对她心仪已久，她也对你有好感，你希望与
她结识；另外一位老人则重病在身，需要去医院。此时，公
交车已经停开，漆黑的夜不可能有其他车经过，而你的车只
能捎带一人上路。你应带上他们中的哪一位？

如果你考虑到报恩，你应当捎带上这位医生；如果你考
虑到人应当有怜悯之心，你应当带上老人去医院；而如果你
考虑到自己的“私心”，你应当带上这位女郎，因为这是一次
难得与你喜欢的女郎结识的机会。当然，你选择这二种选择
中的任何一种都有损失，而不能兼顾。

“标准答案”出乎意料：你应当将车钥匙给医生，让他带
着老人去医院，而你陪着女郎在雨中散步。这是一个完美的
选择：老人在医生的陪同下去了医院，医生也离开了雨中的

小镇，而你和女郎相伴漫步在雨中，别有一番情调。
这个标准答案所给出的选择便是新策略，三种选择之外
的选择，充满了智慧而不失理性。

在生活中，我们不自觉地进行博弈思维。如果我知道某
个牌子的广告不实，我当然不买该牌子的商品。我知道我的
朋友喜欢与我一起喝酒，并海阔天高地胡侃，我为什么不选
择与之在星期天聚一聚呢？我要考虑到他是否有空，要考虑
他是否会拒绝，等等。当我十分肯定地预测到我向警察报案
说我的自行车被偷，而警察认为这只是一个小得不能再小的
案件而无动于衷时，我何必报案呢？..我们时刻都在分析
并预测他人的行为并做出行动选择。

当然，与我有关的他人也时刻在分析我的行为并进行行动
选择。我们如何在与他人一起“玩游戏”的过程中成为赢家呢？

每个人均通过自己的行动左右或影响周边的人，周边的人
也在一定程度上影响你。在人际关系中，作为策略家，进行博
弈思维的第一步是选择玩游戏的人。只有选择了玩游戏的人后，
才进行下一步：选择游戏策略。有些人喜欢找水平比自己差的
人下棋，这样，他才能够享受赢棋的快乐；有些人则喜欢找比
自己水平高的人下棋，这样，他的棋艺才能提高。每个棋手类

型不同，想法也就不同，从而决定了他找的下棋对手的类型也
不同。人际关系也一样，不同类型的人喜欢与不同的人打交道。

作为策略家，首要的是选择“下棋”的对手，尤其是经
常“下棋”的对手。这里，“下棋”的对手是指与你进行“博
弈”的人。人的一生会与很多人打交道，但有紧密联系的人
并不多。与你紧密联系的人构成你的社会关系群，它决定你
一生的命运。我们要想一想，我为什么选择这些朋友，而不
是其他？在这个朋友群中，他们如何给我定位的？我又如何
给他们定位的？这些问题关系到自己的生存状态。

你最紧密的人，并且是你可以选择的人，当然首先是你的爱
人。父母与兄弟与你的关系当然很紧密，但你无法选择，只有接
受。爱人是可以选择的。你一辈子是痛苦还是幸福，取决于你的
选择。这也就是为什么婚姻对于一个人的一生是非常重要的原因。

古希腊大哲学家苏格拉底曾说：如果你的妻子是贤惠的
女人，那么你是一个幸福的人；如果你的妻子是泼妇的话，
那么你可以成为哲学家。我们不知道妻子的撒泼程度与丈夫
成为哲学家是否有因果联系，也不知道苏格拉底是如何得出
他的结论（可能因为他的妻子是一个泼妇）的。

“假使”苏格拉底说的是对的（我是说“假使”，因为他
的话不一定对），那么，在选择妻子的时候，你就要注意了，
你想幸福地过上一生，还是想成为哲学家？如果你想幸福地
过上一生，那么选择一位贤惠的妻子；如果你想成为哲学家，
那么选择一个泼妇做你的妻子。

当然，可能的是，谁也不愿意选一个泼妇做自己的妻子，
这样的话，成为哲学家乃是纯属偶然的错误选择的结果。

与你有紧密关系的人，其次是你的朋友。人们常说，道
不同，不相为谋。从朋友那里体现了你的品行本身。俗语告
诫我们，不要交“狐朋狗友”，或者，不要交“酒肉”朋友。
这样的朋友不是真正的朋友。有饭吃、有酒喝就是朋友，当
你遭遇困难、需要帮助时，“朋友”便作鸟兽散，更为严重的
是，关键时刻“朋友”还会出卖你。我们当然不能与出卖朋
友的人作为朋友，然而我们交朋友也不是为了相互利用。

紧密联系的人群是与你进行重复博弈的参与人。你当然不
喜欢那些欺骗你或者利用你的人，如果你身边的某个人欺骗你
或者利用你，你当然要“敬”而远之，不与他进行博弈；你当
然喜欢与德行和能力均高的人建立联系。古代君王的“亲贤臣，
远小人”的用人之道对于我们每个平民百姓均有借鉴意义。

我们可以通过远离某些人，或者建立新的人际关系，以
调整与我们有紧密关系的人群。瘾君子之所以难以戒掉毒品，
其中一个很大的原因是他能够接触到提供毒品的人；许多走
出监狱的人之所以会再次走进监狱，并不是他们想犯罪，而
是他们认识犯罪的人，这些人拉他们下水。误入歧途的人要
改邪归正，首先应彻底断绝以前的紧密的人群关系，并建立
新的“健康的”人际关系。人们常说“近朱者赤，近墨者黑”
就是这个道理。“孟母二迁，择邻而居”的故事也说明了这一
点。只有不断地调整紧密的人群关系，你的事业才能成功。

参考文献

艾里克拉斯缪森博弈与信息（第二版）一博弈论
概论北京：北京大学出版社，
侯定丕博弈论导论北京：中国科学技术大学出版
社，
李杰博弈论教程北京：中国人民大学出版社，

库恩博弈论经典北京：中国人民大学出版社，

冯诺伊曼博弈论与经济行为北京：生活读
书新知三联书店，
侯光明管理博弈论北京：北京理工大学出版社，

后记

历时数月终于完成了这本书的写作，深切体会到了写作
过程中的乐趣和艰辛。当把自己日积月累的所思所得付诸笔
端的时候，体味到的是一种成就感；当自叹学识不足，向专
家和教授请教时，体味到的是学习与沟通的快乐；当和合作
伙伴为了一些歧见争得面红耳赤，当问题终于解决和合作伙
伴相视而笑时，体味到的是团队合作的重要性和工作所带来
的满足和自豪感。

在这本书的写作过程中，有很多朋友参与，可以说这本
书是他们和我共同辛劳工作的结果，他们分别是周志刚、张
德泉、李世忠、张玉英、邓青红、张万菊、战永红、许红、
张万洪、李铮、赵一安、逯宁、李石华。在这里谨向他们的
辛勤工作表示感谢。

由于实践经验所限，在编写本书的过程中难免存在疏漏，
恳请实务高手和理论专家多指正，讨论交流，欢迎致信

无处不在的博弈

博弈论的研究对象是理性人的互动。博弈论作为一门学
科已有

多年的历史。在诺伊曼、纳什等大师的努力下，博
弈论形成了较为完善的理论体系，已经成为各门社会科学力
图使用的工具。
人生处处皆博弈，在生活中，人们的博弈思维时刻在起
作用。在战争、政治、商业等竞争性的领域里，人们的策略
选择与人的生存状态密切相关，博弈思维几乎发挥到极致。
培养博弈思维可以帮助我们在竞争的领域里获得更大的成功。

我们每个人都是策略使用者。我们时刻都面临着不同的
行动选择，时刻都在计算着应当采取何种行动。这种选择不
仅体现在选择上哪所大学、学哪门专业、从事何种工作等等
这样的大事上，而且体现在买什么菜、穿什么衣服这样的小

事上。
博弈论所研究的是多个绝顶聪明的人是如何在一起玩
“游戏”的。也可以这么认为，博弈论研究绝对理性的人们如

。

何进行策略选择。因此，通过学习博弈论，学习绝顶聪明人
的玩法，我们自然会变得更加聪明，在竞争日趋激烈的今天
我们更能成功。学习博弈论有助于理性决策，有助于我们的
成功。

我们学习博弈论，可以灵活运用熟知的博弈，为我们服
务。

我们要表明的是，人们是否能够成功取决于策略的正确
使用。问题不在于，你是不是策略使用者，而在于你是蹩脚
的策略使用者还是优秀的策略使用者。优秀的策略使用
者我们称之为策略家，他们自觉和不自觉地进行博弈思
维，博弈思维贯穿于各种竞争性的活动之中，他们在人生的
各个方面都能够取得成功；而蹩脚的策略使用者往往缺乏博
弈思维，他们的策略选择往往是不合理的，他们在人生中常
常失意。“如果”你希望成功，那么你就要进行博弈思维，成
为优秀的策略家。

历史

不乏运用博弈思维的策略高手。春秋战国时期，
特殊的战争年代造就了大批策略家，他们或者以谋士的面孔
或者以军队统帅的面孔出现，如苏秦、张仪、孙子、孙膑等。
他们以成功的策略行为留存于史，同时给后人留下了不少经

典著作，如《孙子兵法》、《孙膑兵法》。东汉末年的军阀混
争，使诸葛亮及其他谋士脱颖而出，在国人看来，诸葛亮的
智慧几近于神。罗贯中的《三国演义》一般被认为是小说，
但更可看成是一本描写各路人马运用计策或策略的兵书。

博弈和策略紧密相连，精通博弈会使我们的决策达到最
优。在我们面对选择时，决策的核心并不在于结果的最优，
而是决策过程的最优化，只要你的策略合理，结果当然也不
会差。

在做决策之前，必须经过“成本估算”：如果得大于失，
就值得做；如果得失相抵、甚至得不偿失，就不要干这种
“吃力不讨好”的事了。

信息瞬息万变，等到信息完全清楚了才决策和行动，一
定会贻误战机，这就迫使人们经常要在信息不完全的情况下
做出决策，这样的决策必然带有博弈的成分。

在本书中，我们多次谈到囚徒困境博弈。囚徒困境中的
囚徒是不幸的，然而在囚徒困境中的警察则是聪明的，犯罪
分子原来是“朋友”，在警察的政策下，相互成了“敌人”。
“坦白从宽，抗拒从严”是执法机关针对罪犯的政策。当犯罪
分子面临这个政策时，他们的最好策略是选择与警察合作。

但是，博弈论在理性人假定下的结果有它的局限。它的
局限性体现在，现实中的人不是完全理性的。完全根据博弈
论的理论来行动，其结果有时会适得其反。我们在实际行动
中进行决策、运用策略时，一方面不但要自觉运用博弈论作
为指导，另一方面更要超越博弈论。

我们在编写本书的时候，尽量用通俗易懂的语言来阐述
理论和术语，同时在文中穿插了许多小故事以增加文章的可
读性。令人头疼的公式演化和数学式的推理在本书里都没有
出现，因为我们只是想让读者了解博弈思想，开拓思维模式，
在生活中养成以博弈思维处理问题的习惯，这样，当读者面
临选择，权衡得失利弊时会更理性和客观。

在哈尔滨哪里可以买到《30天让你精通心理学》？谢谢各位的帮助。与JS博弈时,如何让菜鸟看起来像大虾? 什么是博弈? 什么是博弈？博弈是什么意思监督博弈什么是博弈？？？什么是博弈? 什么是博弈？什么是“博弈” 请问如何让自己更精通网页三剑客？？何谓“博弈”？何谓“利益博弈”呢？请问博弈是什么意思，博弈分析又是什么意思？让你你怎么办？什么叫博弈？什么是重复博弈理论？谁是博弈高手？什么是博弈学？？博弈指什么博弈游戏白波博弈怎么翻译什么是博客什么是博弈? 谁来解博弈难题？？？？？？？什么是"博弈"?