书城哲学男人,一定要讲逻辑
10616300000040

第40章 什么是概率

“概率”,又称为“或然率”、“机率”、“可能性”等。我们在生活中经常遇到这个词语,它是一个在0—1之间的百分数,一般用来表示一个事件发生的“可能性有多大”。很多人因为不了解,认为概率是个“骗人”的东西,但其实概率是个严格的数学概念。

现实世界中大部分事件都并不是必然发生的,比如抛掷一枚普通的硬币会得到两种可能的结果:“正面朝上”和“背面朝上”,抛掷一个骰子则会得到六种可能的结果。受这种不确定性影响最大的是赌博业。因此研究事件发生不确定性的概率论,最早就起源于赌博问题。

17世纪的欧洲有个叫梅勒的人,他是一位军人、语言学家和古典学者,但同时也是一位很有名的赌徒。虽然他不是一个数学家,但他经常从数学的角度思考赌博中出现的一些有深度的问题。一次,梅勒提出了这样一个问题:

假设有两个赌博者甲和乙,两人各出30个金币作为赌金,然后各自选取一个点数,谁选择的点数首先被掷出3次,谁就可以赢得全部的赌金。甲选择了“5”,乙选择了“3”。在游戏进行了一会儿后,“5”出现了两次,而点数“3”只出现了一次。这时候,甲由于一件紧急事情必须离开,游戏不得不停止。他们该如何分配赌桌上的60个金币呢?

乙认为:既然掷出乙选择的“3”的次数是甲选择的“5”的一半,那么他该拿到甲所得的一半。因此他拿20个金币,甲拿40个金币。

然而甲认为:再掷一次骰子,对他来说最糟糕的事是他将失去他的优势,游戏变成平局,每人都得到相等的30个金币;但如果掷出的是“5”,他就赢了,并可以拿走全部的60个金币。换句话说,在下一次掷骰子之前,他实际上已经拥有了30个金币,并且他还有一半的机会赢得另外的30个金币。所以,他应该分得45个金币,乙分得15个金币。

梅勒无法解决这个问题,就写信把这个问题寄给了著名的数学家、物理学家帕斯卡。帕斯卡对此也很感兴趣,又写信告诉了著名的数学家费马。于是这两位伟大的法国数学家对这个问题开始了具有划时代意义的通信。在通信中,两人用不同的数学方法正确地解决了这个问题,由此创立了概率论。但关于这个起源还有另一种说法。

17世纪中叶,法国宫廷贵族里盛行着掷骰子游戏。游戏规则是玩家连续掷4次骰子,如果其中没有6点出现就算玩家赢,如果出现一次6点,则庄家赢。按照这一游戏规则,从长期来看,庄家扮演赢家的角色。后来为了使游戏更刺激,人们对游戏规则进行了一些改变:玩家用2个骰子连续掷24次,没有同时出现两个6点就算玩家赢,否则就算庄家赢。当时人们普遍认为,两次出现6点的可能性是一次出现6点的可能性的1/6,而投掷骰子的次数6倍于前一种规则,所以新规则的赢输可能性应该和旧规则相等。然而事实却并非如此,从长期来看,这回庄家处于输家的状态。

贵族们去请教帕斯卡,帕斯卡解决了这个问题,最终推动了概率论的产生。

随着现代科学的发展,人们很快注意到很多生物、物理和社会现象与赌博游戏之间有很大的相似性。于是本来只是用来解决赌博问题的概率论进入了自然科学领域,并取得了越来越大的成就。但是如何定义概率,如何把概率论建立在严格的逻辑基础上,这是概率理论发展的困难所在。

瑞士数学家伯努利建立了概率论中的第一个极限定理,阐明了事件的频率稳定于它的概率,使概率论正式成为数学的一个分支。随后,数学家拉普拉斯在总结前人工作的基础上,明确给出了概率的古典定义,并在概率论中引入了更有力的分析工具,使概率论成为了严谨的数学分支,对概率论的迅速发展起到了积极的作用。19世纪末,数学家们用分析方法建立了大数定律及中心极限定理的一般形式,科学地解释了为什么实际生活中遇到的许多随机变量近似服从正态分布。20世纪初受物理学的刺激,数学家们开始研究随机过程。现今,概率论已经成为科学大厦基础的一部分。甚至很多物理学家认为,这个世界就是由概率事件构成的。

如果我们说一件事情发生的可能性是50%,要怎么理解这个数字呢?“50%”这个数字表示事件发生的可能性大小,叫作该事件的概率。比如说“抛掷一枚硬币,正面朝上的概率是50%”。这是不是说,抛掷10次硬币,得到正面朝上的次数肯定是5次呢?不是的。事实上,抛掷硬币10次,正好5次正面朝上的概率只有不到25%;抛掷100次,正好50次正面朝上的概率只有不到8%;抛掷1000次,正好500次正面朝上的概率只有不到2.5%。因此我们说一件事情发生的概率是1/n,不是指n次事件里必有一次发生该事件,而是指此事件发生的频率接近于1/n这个数值。

如果我们把不计其数的一群猴子放在一些电脑前,让它们胡乱敲击键盘。只要时间足够长,猴子足够多,肯定会有一只猴子能打出一篇一字不差的《红楼梦》来。这是概率论里一个著名的“猴子理论”。这个故事背后要表达的是:无论一个事件发生的概率有多低,只要样本足够大,它就是能实际发生的。

这就使得我们思考这样一个问题:如果我们找到了那只打出《红楼梦》的猴子,你能肯定它下一篇会打出《西游记》来吗?当然不能肯定。可是现实生活中我们是怎么处理类似事件的呢?你认为已经完成了的业绩,对于预测未来能有多大帮助呢?做任何决策的时候,如果是以过去的业绩为根据,仅仅依赖于过去时间序列的一些属性,那么就会面临与此相同的问题。试想你是一个公司的老板,如果那只猴子带着它打出的《红楼梦》来应聘,你会因为这个“辉煌业绩”决定聘用它吗?

一般在做推论的时候会有个主要问题,就是那些以从数据中找出结论为职业的人,通常比其他人更快而且带着更强的自信落入陷阱。我们拥有的数据越多,就越有可能陷进去。在对概率法则似懂非懂的人们当中,以下面这种原则为基础来做决策的想法比较普遍:如果一个人的业绩以一种一贯的方式表现得相当出色,那么他肯定在哪些方面做得对路子,否则就是非常不可能的事。于是人们就格外看重优秀的业绩纪录,他们把这样的成功运营业绩作为判断的准绳,并且认为,如果某人过去比其他人做得好,那么在今后的日子里他比多数人做得好的可能性就很大。

我们不能否认,如果有人过去比众人都做得好,那么就可以推想他有能力在未来也做得好。但是在做决策的时候,这种推想的说服力有可能很弱。为什么呢?因为它完全取决于两个因素:他的职业中随机成分有多少,以及参与运作的“猴子”数量。初次采样的规模对结果关系极大。如果这场游戏中只有五只“猴子”,那么一个打出《红楼梦》的“猴子”应该被另眼相看;如果有数以亿计只“猴子”,那么就不用那么大惊小怪了。事实上,如果数以亿计的猴子中都没有全凭概率而打出一篇《红楼梦》,这反而是奇怪的。这个问题进入商业圈后所带来的恶果,比对其他行业更严重,因为它高度依赖随机性。从商的人数越多,就越有可能从中产生纯侥幸的大明星。但很少有人去数“猴子”的数目,以及市场中投资人的数目,以便计算出在一段市场历史和投资人数已经给定的条件下,成功运营的条件概率,而不是成功概率。

猴子问题还有其他一些方面的意义:在现实生活中,其他猴子是无法计数的,甚至有些是被隐没起来,我们无法看到的。因为败下阵去的人完全消失了,人们只看得到胜出者,所以人们看到的只是幸存者,也只有幸存者。这给人们留下了关于机遇的一种错误认识。人们就会只对概率做出反应,只对社会对概率的评价做出反应。就像我们从尼洛·杜立普身上所看到的那样,即使是受过概率训练的人,在社会的压力面前也会有不理智的反应。

下面列出的几个例子可以形象描述人们有时对概率存在的错误认识:

①买彩票。比如说双色球是33个红球中选择6个,再从16个蓝球中选择1个。计算可知一共有17721088种可能性。有人就认为,如果每次都买一个相同的号,一星期买三次,最晚可以在17721088/(3×52)=113597年后能获得头等奖。事实上这种理解是错误的,因为每次中奖的概率是相等的,中奖的可能性并不会因为时间的推移而变大。有些彩民热衷于分析以往的大奖数字,推测下一期大奖数字的可能性,这也是不懂概率论的表现。

②三门问题。这是个可以用来检验一个人是否真的懂概率的好问题。

美国某电视台举办了一个娱乐节目。在节目中,有三扇关闭的门,其中只有一扇门的后面有一辆汽车,其他两扇门后是山羊。参赛者任意选择一扇门,这扇门后面的东西就作为奖品送给参赛者。

现在参赛者已经选择了一扇门,但是主持人没有马上打开这扇门揭晓答案。主持人在没有被参赛者选择的另外两扇门中打开了一扇后面有山羊的门。现在主持人问参赛者,要不要改变主意,选择另一扇门,以使赢得汽车的概率更大一些?

如果你是参赛者,你选择换还是不换?

这个问题引发了很多人的争论。许多人认为剩下的两扇门都是1/2的概率,没有改变主意的必要;但是另一些人认为改变选择后赢得汽车的概率为2/3.双方各执一词,争论不休。正确的结论是,如果此时参赛者改变主意而选择另一扇关闭着的门,他赢得汽车的概率会增加一倍。也就是:不换,赢的概率是1/3;换,赢的概率是2/3.

实际上理解了概率,这个问题就是很简单的。当第一次选择A门的时候,A门后是汽车的概率是1/3,也就是说,奖品只有1/3的可能会在A门,2/3的可能在B门或C门。当主持人排除一个空门比如说B的时候,只剩下两个门。有些人认为A门的概率变成了1/2.实际上,剩下的C门虽然从表面上来看是1/2,实际上它会因为排除了B门而独占原来的2/3概率。

或者说,C门有两个概率,这个事件的两个阶段导致了这两个概率的产生,C门旧的概率是与B门合作的,即两门合计为2/3.而当B被排除后,C独占这个2/3的旧概率。这个问题的关键在于主持人并不是在剩下两扇门里随机打开一扇门,而是有选择地打开后面是羊的那扇门。这个人为的选择为C门提供了额外的信息。如果改变顺序,先由主持人打开一扇后面有羊的门,参赛者再在剩下的两扇门中选择,此时两扇门后有汽车的概率相等,因为主持人提供的信息由剩下的两扇门平分了。

但不懂概率论的人还是觉得无法接受这个结论。因此,人们做了很多模拟试验,得到的结果和概率理论的结果相同:选择换门的中奖概率确实是选择不换的两倍。如果你还是无法理解,试着看下面这个游戏:

在54张扑克牌里面选红桃A。你先抽了一张牌,主持人在剩下53张牌中去掉不是红桃A的52张牌。现在你选择换还是不换?

选择不换,就是赌自己一开始就抽中了红桃A;选择换,就是赌自己一开始没抽中红桃A。这两种情况哪种更可能是一目了然的。