书城投资零和游戏
20131500000020

第20章 促成合作的原则(1)

如何从合作中得到好处的问题核心,在于“试错”学习的过程是缓慢和痛苦的。这样的学习过程可能对长期发展有好处,但是我们可能没有时间和耐心等待基于回报和对双方有利的策略。但如果我们更好地了解这个过程,我们就能用我们的预见加快合作的产生。

到这时,那匹马才叹息道:“唉,好重啊!刚才,我要是肯帮驴子一点忙就好了!”

一个不懂得合作与关怀的人,最终会为自己的自私付出代价。

人们因为彼此了解才容易产生合作,但在这纷繁复杂的世界中,合作并不完全要在彼此了解的情况下产生。

人类在信息缺乏的情况下,又是怎样产生的合作呢?

假设A与B各驾驶一架飞机,在同一高度互相迎面飞来。两位驾驶员为了闪避冲撞,第一个反应就是决定急速左转或右转。只有当两人同时左转或同时右转时,两架飞机才可以避免互撞的悲剧。如果一方左转而另一方右转时,两架飞机将陷于浩劫。

但是,他们并不知道对方在危急状态下会采取什么策略。不论个人采用何种策略,其报偿都非他一人所能完全决定:每个人不同的策略选择不但影响到自己也影响到别人的报偿;同时,别人所采取的策略也会影响到自己的既定策略下的报偿。于是,自然地他们在决定策略之前不免会猜测对方的策略。譬如,A若预期B会右转,他便会右转。同理,B也会对A的行动先有预期,再采取适当的策略。

然而,究竟他们如何预期对方策略则是我们所不知的。因此,我们必须做一些假设才能进一步讨论各人可能采取的策略。

我们假设每一方为了提升其效用会利用信息进行预期。于是,他当然不至于会故意做出错误的预期,因为受到伤害的将是自己。所以,任何一方都不会故意预期对方一定会采取某一特定的策略,而犯下导致对方实际采取另一策略的错误。

换言之,每个人会逐一考虑对方可能采取的各种可能策略。当A预期B会右转时,如果他采取左转策略,则预期结果是相撞。这个结果当然是他所不愿接受的。于是,在此预期下,他的策略也是右转,而得到两机互相擦肩而过的惊险。如果A预期B会左转,依上理,他也会采取左转策略。在同一时间,B也会预期A的策略,并决定自己的策略。但是,两人都只能采取一个策略。如果两人之中有一人的预期是错误的,则惨剧必然发生。

在这个例子中,两人之中有一人预期错误的概率是1/2。但在实际情况中,悲剧并不如此频繁发生。

理由之一是,两人在面临此一情况时都有一小段的调整时间。在此一小段时间内,两人会不断地修正相互的预期与策略。当A预期B会右转而右转时,若他竟然发现B实际却左转时,他知道如此下去两机必然会相撞。当然,B也会预见此一悲惨结果。于是,两人便立即调整预期及策略以避免灾难。当A预期B会右转而右转,且B也预期A会右转而右转,则A会发现B如他所预期地右转,而B也会发现A如他所预期地右转。此时两人将发现他们的预期与策略都不需要再修正。

由两人不断调整预期及策略行为的关系就是博弈。当两人的预期与策略都不再修正时,我们称此对策达到均衡。由此定义,上述对策中两人都预期对方会右转而采用右转策略是一种均衡;同样地,两人都预期对方会左转而采用左转策略也会达到另一种均衡。

两人在此一小段时间内不断地修正预期与策略是否一定会达到均衡?

在电梯门口或走廊转角处,我们时常发现两人迎面左躲右闪的情形,虽然尴尬,但相撞次数并不多。

理由是此时我们会以几乎停住的速度,在此一小段时间内,多次修正而找到不与对方相撞的均衡。但在A与B的例子里,在快速相迎的情形下,两人要在千钧一发的紧急情况下趋吉避凶并不容易。如果两人在面对此一危机时早已有历史惯例规则可循,则双方只要遵循此规则便能避免浩劫。

很幸运地,我们的社会中的车船以及飞机在危急情况下早已有约定俗成的应变方式。如:我国规定车辆右侧行驶而英国规定车行靠左;此外,飞行器也有规定的共通频道,以便利不认识的双方取得沟通。历史的惯例及规定提供给两人共同的信息以方便双方的预期,并因而与对方在不能沟通的情形下顺利达到趋吉避凶的均衡。或者说,它使不能沟通的两人达成了合作的美妙结局。

要能识别对方的行动

尽管通过一些惯例与规定能达成一定的合作,但增加接触,增进彼此的了解和信誉,才会建立稳定的合作关系。艾克斯罗德的游戏表明,只有当未来足够重要时,基于回报的合作与共生关系才能够稳定地建立。偶尔一次的接触,因为回报的可能性很小,属于“一锤子买卖”,相当于一次“囚徒困境”——其最优解就是“背叛”。这就是为什么车站或旅游地区的小贩经常“宰人”的原因。

而前苏联克格勃,策反西方的机要人员,采用的就是多次数接触,进而产生合作。他们通常从约会开始认识。然后是送花、请客、聊天,到双方兴致正浓的时候停止。第二次见面,带一瓶小香水,只谈天气。然后逐步升级,送的香水也越来越高级。以优惠价卖给对方贵重衣服,或高级汽车。终于有一天对方发现,已经离不开他了。这时候再开始第二步,在不强迫的前提下,要求提供名单,要电话号簿等。第三步,要新的导弹资料,并说明是卖给盟国,而不是卖给苏联。这些人觉得是在做有利的工作,不是叛国,当间谍,有何做不到的?从阻力最小的地方开始,接下来的目的就是获取核心情报。

从过去的接触中识别对方,并从中发现对方是否可信的能力对合作的持续是必要的。没有这些能力,一个人就不可能进行任何形式的回报,因此也就不能鼓励对方合作。

事实上,持续合作的范围取决于这些能力。例如,细菌几乎是进化阶梯底层的生物,只有很有限的识别其他生物的能力,所以它们必须通过捷径来识别,即在一个时间内只和一方(寄主)建立关系。在这种方式下,细菌环境的任何变化都可以归咎于对方。鸟类有更强的辨别力,它们可以通过鸣叫声识别邻居。这种识别力使得它们能够与其他若干的鸟建立合作关系或者至少避免过分的冲突。而人类的辨别能力已经发展到了在他们的大脑中有一个专门的部位来识别面孔的程度。这种识别曾经接触过的个体的能力使得人类可以发展比鸟类更丰富的合作关系。

然而,即使在人类事务中,合作范围的限制往往是由于不能识别其他人的特征和行为而造成的,这里的困难在于核实,即是否有足够的信息确认对方所真正采取的步骤。并非每个人都是光明正大的,这使我们在识别之时碰到了一些困难,但是我们也会承认,人的名声往往和他的真实个性相符,经过伪装的侵犯仍然是容易识别的,特别是当它一而再,再而三地施展时。

《纽约邮报》的成功策略

识别背叛什么时候发生的能力虽然不是产生成功的合作的惟一要求,但它肯定是一个重要的条件。因此,通过改善对策者的基于过去的接触而相互识别的能力和确定以前已经发生过的行为的能力,持续合作的范围可以得到扩展。

促进好的结果不仅是告诉对策者关于双方合作比双方背叛的所得更多这一事实,而且还是一个明确相互作用的特征,从而得到一个长期的稳定的合作进化的问题。

假设两个企业垄断或几乎垄断了某种商品的市场,他们都想争夺市场,击败对手,以争取更大的利润。能否避免双方彼此相残?在他们的争斗会不会存在合作可能性呢?我们用典型的“囚徒困境”案例来讨论他们之间关系的本质,可以看到,通过分析这些问题的答案是肯定的。

在这个过程中,一方对对方的可能得益完全知晓,并且各自独立做出策略选择。每一方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对自己得益的影响,因此他会根据对方两种可能的选择分别考虑自己的最佳策略。

双方在决策时都以自己的最大利益为目标,结果是无法实现最大利益或较大利益,甚至导致对各方都最不利的结局,这种情况在现实生活中具有相当的普遍性,在市场竞争、环境问题、公共资源开发利用中屡见不鲜。

设想两个大公司,例如可口可乐和百事可乐公司,或者是联合利华公司和宝洁公司,如果摆在这些公司面前的是两种拓展市场份额的选择:保持价格或降低价格,囚徒困境告诉我们这些公司会降低价格并不断重复下去。

因为“一报还一报”策略着眼于合作,从合作出发,而不是相互背叛。几轮之后,各方的策略就会明了起来,为对方所知晓和理解。

1994年《纽约邮报》的价格策略表明了它了解并运用了“一报还一报”策略。当它将邮报的价格从40美分提高到50美分时,其主要的竞争对手《每日新闻》却没有跟上提价。在将《纽约邮报》的价格降回到40美分之后,《纽约邮报》宣布有意向将邮报在staten岛这个试验市场上的价格降到25美分,此时其竞争对手《每日新闻》终于明白了对方的策略,将价格提高到50美分,没过多久,《纽约邮报》公司也将价格重新提高至50美分。

《纽约邮报》的策略是友好的,因为它从一开始就提高价格;同时它的策略也是挑衅的,在《每日新闻》没有跟着提价时,它又将价格降低;这一策略同样具有宽恕性,对《每日新闻》来说经过了两个回合就变得显而易见。由于“一报还一报”策略的运用,在这场囚徒困境式的价格战中出现了合作双赢的局面。

这也是囚犯困境的一个重要法则:你要了解竞争对手,也让竞争对手了解你。因此如果公司的策略为竞争对手所明白,并且应向竞争对手清楚地表明公司准备合作,但对背叛行为将采取以牙还牙的报复行动,那么公司最终将会赢得竞争,而竞争对手通过合作也将会大有收获。

通过运用“囚犯困境”博弈对两个势均力敌的竞争对手之间价格的分析表明,价格战是可以避免的,可以通过对竞争对手的全面了解和对其可能反应的正确判断,本着合作共享的愿望,就可以大大降低价格战这种毁灭性竞争发生的可能性。

增大未来的影响力

为了合作能稳定,未来必须有足够大的影响,这意味着相同的两个个体再次相遇的重要性要大到足以使得背叛成为一个得不到好处的策略。它要求对策双方有一个足够大的机会再次相遇,并且他们再次相遇的意义不能被打太多折扣。

使得第一次世界大战中堑壕战中的合作成为可能的是这样一个事实:无人区两边相同的小单位必须保持一个很长时间的接触,如果一方打破默契,另一方就可以报复。

如果未来相对于现在是足够重要的话,双方的合作是稳定的。因为每个对策者可以用隐含的报复来威胁对方,如果相互之间的接触能持续足够长,并使得文种威胁能够奏效的话。

这个结论强调了促进合作的第一方法的重要性,即增大未来的影响。有两个基本的方法可做到这一点:使相互作用更持久和使相互作用更频繁。

在商业上也一样,一个环境较封闭的公司只和同一地的公司做买卖。同样,任何专业化公司也趋向于限制在与少数几个公司接触以便使这种接触更加频繁。这是为什么合作在小城镇比在大城市容易出现的一个原因。在某些行业中往往存在着限制竞争的默契,这也是为什么同类行业的公司都试图排斥那些可能扰乱这种默契的新公司的原因。同样,一个巡回商人或打散工的人将更容易与那些有规律性见面的顾客建立合作关系。因此,原则总是一样的,经常接触有助于促进稳定的合作。

人们的工作专业化,把做相关工作的人组织在一起。这种组织形式增加了相互接触的频度,使工作人员更容易建立起稳定的合作关系。另外,当一个问题需要不同部门之间协调时,就把这个问题提交给更高一级的政策制定者。通过把人们束缚在长期的和多层次的游戏中,组织机构增加了未来相互接触的次数和重要性,因而促进了那些个人之间相互接触比较困难的大群体之间的合作的出现,进而导致了处理更大更复杂问题组织的进化。