书城投资零和游戏
20131500000007

第7章 一个关于困境的游戏(1)

独立于对方所用策略之外的最好决策规则是不存在的。在多人对策持续进行下去,且未来充分重要时,最优的策略要取决于对方采取的策略。

曾有一个人类学家写了一个关于伊克人的故事。

伊克人从前是在乌干达北方山谷里采集、打猎的游牧民族,政府决定在那里开辟一个国家公园,于是,他们为法律所迫,不再在山谷间打猎,而成了耕种于山岭薄地的农民了。

伊克人因此把自己变成了一群不可救药的、让人讨厌的人,他们六亲不认、极端自私、毫无爱心。

这些人聚集在密集的小村子里,似乎生活在一起,但他们实际上是孤寂的、互不联系的个人,没有明显的互相利用。他们也说话,但却只是些粗暴的强求和冰冷的回绝。他们什么东西都不共享,从来不歌唱。孩子一旦能走路了,就把他们赶出家门去抢劫。

只要可能,随时都会把老年人抛弃,让他们饿死。抢劫的孩子从无能为力的老人嘴边抢走食物。

他们生儿育女时毫无爱心,甚至连粗疏的照顾都没有。他们在彼此的大门口排便。他们对邻居幸灾乐祸,只是见到别人不幸时他们才笑。他们常常笑,也就是常常有人倒霉。

伊克人完全没有意识到任由自私本性的肆虐,人类将是一无所有。伊克人因此成为文学上的一个象征,用来代表整个人类失去信心、失去人情味后,最终命运将是什么。

自从“囚犯困境”的推论被提出以来,围绕它的涵义涌现了大量的文献。其中似是而非的解释与完全错误的理解不可胜数。误解之一就是,认为囚犯悖论是自私自利的结果。如果个人做决策时多考虑别人的利益,就不会去选择损人利己的策略,如此则能避免囚犯困境。经常有人发出这样的感慨:如果人人都不自私,这世界该是多么美好!

然而尽管囚犯困境广泛存在于人类生活的各个领域,但并没有真的将人类带入极其自私的“伊克人”

社会,人们也没有深陷于霍布斯丛林中,而人类所最终信奉的道德良知依然浸润着人类社会的规范。

为什么会产生合作?

囚犯困境表明合作是困难的,但并非是不可能实行的。

试想,如果两位自私者经历这样的一件事,他们的选择会是背叛。这样,每一方所得将少于双方合作所能得到的。但被警察审问的时候并不是所有囚犯都决定出卖他们的同伙。有时尽管个别成员受到违规所带来好处的诱惑,但也能维持勾结性的协议。这是为什么呢?这也是个性自私的人们之所以会产生合作的原因。

如果双方之间的接触是一次性的,结果一定是背叛。不过,如果反复交往,即接触一次又一次的进行,结果会有所变化。连续的接触又因无限重复和有限重复而不同。

如果是无限次数的,就存在着对背叛行为的惩罚和对合作行为的回报。如果你以背叛开始,到第二次时,对方就会不信任你,而放弃与你的合作,这对双方都不利。于是人们会认识到,出于追求个人利益的行为,反而导致了双方利益的损失。接触还要进行下去,有鉴于不合作的恶果,到第三次对局时,你就会尝试着遵守游戏规则。

你投我以桃,我必报你以李,在第四次接触中对方就会信任你。反之,如果你在第四次接触中对对方第三次接触中发出的善意信号置若罔闻,则对方会在第五次中继续违约,结果大家都不能讨好,则游戏再度陷于囚犯困境的僵局。

但是,既然你们之间的接触要不断地进行下去,通过不断的惩罚与激励,最终会出现双方合作共同获益的结果。

每个人都是理性的,能够推演上述过程。于是我们会发觉,与其在第二次接触中遵守规则,还不如在第一次中遵守规则。因此结论是,对于无限连续性接触而言,每次双方都遵守规则、坚守合作是最优结局。

但是,如果你们之间的接触虽然重复进行,但次数有限,则每一次接触仍然与一次性的相同。道理很简单,既然次数有限,则一定存在着最后一次。既然是最后的接触,则不管你做什么,都不会遭受惩罚,也不会享受奖励,因为结束了。想像一下,如果一个人明天就要死去,那他今天守法的动机还会一如既往地强吗?因此说,最后一次的接触等同于一次性的。

那么倒数第二次对局又如何呢?因为最后一次对局已经确定就是囚犯困境式的结局,并不会因为倒数第二次对局的性质而更改,那就是说,倒数第二次对局不受最后一次游戏的约束。当你遵守规则时,不会在下一次受到奖励;当你违背规则时,也不存在着惩罚。因此,倒数第二次同样与一次性无异,其结果也是囚犯困境。依次类推,一直到第一次接触,都不存在着激励与惩罚机制。因此,有限连续的接触在性质上与一次性的接触相同,其每一次都是囚犯困境结局。

然而,最经常的情况是,参与者可以解决囚犯困境的原因是,他们之间的交往不是一次性的,而是无限多次的,也就是说参加者并不知道什么时候终止,上述的推理就显得不适用了。假想你正与被关在另一个屋子里的嫌疑人进行囚犯两难处境的思考。而且,再设想这种情况不是进行一次而是多次。你最后的得分是你几次同样情况被监禁的总年数。你希望使这种得分尽可能地少。你应该用什么策略?你应该从坦白还是保持沉默开始?另一个参与者的行动会怎样影响你以后的决策?

囚犯困境的游戏者清楚自己的目的,如果只是一味地背叛,自己将会很快被淘汰出局。为了个人的利益,他们理性的选择只能是合作。囚犯困境并非是一个特例或不现实的案例,相反,它适用于许多基本的社会经济交换过程。几乎所有人类之间的相互作用,都能够在囚犯困境中找到自己的影子。它表明,人们在经济、社会活动中所做出的决策是相互影响的,每个人“自私”不一定就“自利”。

一个关于囚犯困境的游戏

一位美国科学院院士、著名的行为分析和国际关系专家罗伯特·艾克斯罗德搞了一场关于重复“囚犯困境”的游戏。其目的就是要研究在无限次的“对局游戏”中:

人为什么要合作?

人什么时候是合作的,什么时候又是不合作的?

如何使别人与你合作?

在艾克斯罗德的“游戏”开始之前,他设定了两个前提:

第一、每个人都是自私的。

第二、没有权威干预个人决策。也就是说,个人可以完全按照自己利益最大化的企图进行决策。

艾克斯罗德的游戏思路非常简单:任何想参加这个计算机竞赛的人都扮演“囚徒困境”案例中一个囚犯的角色。他们把自己的策略编人计算机程序,然后他们的程序会被成双成对地融入不同的组合。分好组以后,参与者就开始玩“囚徒困境”的游戏。他们每个人都要在合作与背叛之间做出选择。