读《囚徒的困境》

这是一个著名的二难推论命题:有个人同他的妻子和母亲一起过河,中途在对岸突然出现一只长颈鹿,他立刻举枪向它瞄准。后者说:“如果你开枪,你母亲就没命;如果你不开枪,你妻子就完蛋。”这个人该怎么办呢?

这则经典的二难推论故事(注意:和老妈和老婆同时掉河里救哪一个的问题有一些不同)源于达荷美的波波族。类似的稀奇古怪的故事,叫人难以作出决断的问题,在非洲民间传说中非常流行,其中许多被西方的作家和哲学家借用过。在波波族的民间传说中,长颈鹿是会说人话的,而且说一不二,说到做到。——《囚徒的困境——冯·诺伊曼、博弈论和原子弹之谜》一书就是以上面的文字开头的。作为一本博弈论的通俗读物,本书在介绍博弈论的同时穿插了这门学科的创始人冯·诺伊曼的生平、其他对博弈论有重大贡献的学者的事迹等,不仅如此,本书还对冷战期间的国际形势及历史就博弈论的视角做了一番剖析,这样的剖析是很少见到的。

博弈论和各大经典难题中,囚徒困境应该是知名度最高的,几乎所有微观经济学教材中都会提到。类似的2X2博弈一共有78种,其中的绝大部分都能顺利解决,会构成难题的一共有4种,分别是:僵局、囚徒困境、胆小鬼、围捕牡鹿。

博弈论虽然是一门比较新的学科,但人类并非在它被发明之后才开始博弈,相反,可以认为我们从还是单细胞生物起就已经开始了博弈。物种的起源与灭绝,道德的形成与堕落,所有这一切,都是相互博弈的结果。因此,可以这么说,生存到现在的我们,我们的基因中就有有利于我们在博弈中取得优势的因素。在道德学家看来,囚徒困境不应该成为一个难题,因为从道德上来讲,人应该永远选择合作,永远拒绝背叛,但在博弈论中讨论道德是没有意义的,因为道德本身是博弈的产物。当然,道德家的存在这个事实也是博弈的产物。

什么样的策略能在生存的竞争中最有优势?有一些学者使用计算机进行了这样的模拟实验,他们编写了许多程序,每一个程序有自己专有的生存策略(或说性格),有一些是好好先生(总是选择合作),有一些是极具侵略性的恶棍(总是选择背叛),有一些则完全随机地选择合作和背叛,以及除此之外的很多其它或简单或复杂的生存策略,然后将它们放在一个大环境中,让它们根据自己的策略竞争、“繁殖”,经过多个周期后,看是什么策略得分最高,最稳定,最能适应不同的环境,最能在生存的对抗及竞争中生存到最后。

最后实验的结果,最有优势的策略,不是好好先生,也不是恶棍,而是我们熟知的一报还一报(Tit for tat)。一报还一报是这样一种策略:在一开始时,它总是选择合作,然后,它在下一轮中选择的正是另一位参与者在上一轮中的选择。比如,第一轮它选择了合作,但另一参与者选择了背叛,那么第二轮时它也将选择背叛;如果第一轮中另一参与者选择了合作,那它第二轮时也将选择合作。在计算机的模拟中,这样的策略无论在与其它什么策略相处时,都能有较好的(虽然不一定是最好的)表现,并且平均得分最高。其它策略则总是有一些重大缺陷,如好好先生在与另一位好好先生博弈时,可能两人都会受益,但在和恶棍博弈时则将输得很惨;恶棍和好好先生博弈时虽然能占便宜,但和其它恶棍博弈时则将双输。当一个群体中各类人群并存时,其它策略都将逐渐被淘汰,最后一报还一报会幸存下来并保持稳定。

然而,一报还一报也并非完美无缺,甚至可以设计一些专门针对它的策略,比如,如果有一种“接近一报还一报”(Almost tit for tat)策略,它在很多方面都和一报还一报表现得一模一样,唯一的区别是,它会偶然地背叛一次,除此之外,它一直是一个坚定的一报还一报策略实行者。面对这样的参与者时,在那一次偶然的背叛之后,两人会陷入一次又一次相互背叛的死循环(冤冤相报),行为与结果类似于两个恶棍在博弈。所幸的是,对这个缺点也可以进行修正,可以设计出“另一种接近一报还一报”策略,这种策略在很多方面与一报还一报表现一模一样,唯一的区别是,面对其它参与者的背叛,它有时(按一定的概率,比如10%)会宽恕。这样,即便它在面对“接近一报还一报”时,多次博弈之后,即使中间经历了相互背叛的循环,只要它首先进行宽恕了,两人还是会进入相互合作的轨道。

可以说,评价一个博弈策略的优劣,主要就是看它在多次博弈中是否能取得优势并最终保持稳定,并且还能应付一些不时变异出来的新的策略。一开始时,一个策略可能主要是与其它不同的策略博弈,但如果它取得优势之后,它在群体中的数量将会慢慢上升,所以最终它必将主要与其它相同的策略博弈。所以,一个好的策略,不仅要在与其它策略的博弈中得高分,还要在与自己的博弈中得高分。一般来说,越是优秀的策略,相互之间越倾向于合作,而非背叛或对抗,同时,对于群体中的恶棍,它也会有一个惩罚措施。

从这个角度来讲,老子的“小国寡民”的设想就是一个不稳定的群体,因为里面都是好好先生,虽然他们之间相互博弈的结果对双方都会有利,但它不能保持群体中不会出现恶棍,并且一旦群体中出现恶棍,这群好好先生将完全无能为力,只有任其吞食的结局。

另外需要注意的是,上面讲的优秀策略有一个前提,即可以进行多次博弈。有时候,可能只有一次博弈的机会,比如核战争只能打一次,在这样的情况下,就有可能出现僵局、囚徒困境、胆小鬼、围捕牡鹿这样的困境。

纵观人类历史,有时我们觉得一些大国之间相互的行为似乎就像小朋友,似乎很幼稚很不理性,但深入思考之后我们会发现,其实这些都是博弈的结果,甚至可以说,在某些方面,的确和小朋友之间的行为没有两样。有时我们反思自身,我们会觉得虽然我们创造了灿烂的文明,却也对自己的同类犯下过累累罪行,人性究竟是善是恶,茫茫宇宙中是否会存在这样一个优秀的文明,他们自古到今都团结友爱?通过博弈论的视角,我会告诉你,人类的罪行也正是文明的产物,如果茫茫宇宙中存在其它的文明,他们的博弈和我们的博弈,不会有两样。

One Reply to “读《囚徒的困境》”

  1. 恩,不错,有时候个体之间的博弈需要考虑个体特点,综合起来博弈显得很复杂,但在大国之间,整体行为显得就很简单,因为细节被隐藏了。不过我觉得老子所说的“小国寡民”其实是他理想中的一种状态,他觉得这样状态下对全部个体都会是最有利的。这也没有错, 只是现实中这样的状态不稳定。总会有人去破坏而达到自己个人的利益最大化。既然博弈是为了利益的最大化,而生物体皆有成其私的本能,那其他文明必然也会是从掠夺和争斗开始的。

发表评论

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / 更改 )

Twitter picture

You are commenting using your Twitter account. Log Out / 更改 )

Facebook photo

You are commenting using your Facebook account. Log Out / 更改 )

Google+ photo

You are commenting using your Google+ account. Log Out / 更改 )

Connecting to %s