2019年4月17日晚,我在南明教师微演讲上做了一次关于概率的科普演讲,本文根据演讲内容和PPT整理而成,略有改动。
一、什么是概率?
你应该听说过「俄罗斯轮盘赌」这个词吧?这是用一种拥有六发弹夹容量的手枪进行生死对决的游戏。在手枪内只装一发子弹,然后旋转弹夹一段时间,两个玩家轮流对着自己的脑袋开枪,直到一方最终丧命或者不敢开枪为止,坚持到最后的玩家将取得胜利。
当弹夹旋转一段时间后停下时,撞针可能对准弹夹中任何一个位置,你只有开枪后才知道当前这一发是空膛还是子弹。一般来说,大家都会尽量避免做第一个开枪的人,因为有可能第一枪对手就死了,这样自己根本不用冒风险;然而万一对手开了空枪,接下来自己的风险就会更大……游戏越到最后,死亡的可能性越高。你敢玩这样的游戏吗?
所谓概率,就是一件事发生的可能性。 不同的事件往往拥有不同的发生概率,有的概率极小,比如买了一张彩票中了头奖;有的概率偏低,比如你的手机掉到地上摔破了屏幕;有的概率相当,比如生男孩还是生女孩、扔硬币是正面还是反面;有的概率偏高,比如正在看这篇文章的你是个爱学习的人;有的概率极高,比如明天你还会活着……
了解一件事的发生概率,可以帮助我们建立正确的认识和合理的期待,并据此作出最明智的决策。
二、怎么计算概率?
根据概率的定义,最准确的计算方法应该是:把所有可能性都列举出来,检查特定的可能性在其中所占的比例。
比如说,一个骰子有六个面,如果这个骰子做工标准,没有做过手脚,扔的手法专业,那么扔出任何一个面(1 / 2 / 3 / 4 / 5 / 6)的概率应该是一样的,都是 1/6 ,大约 16.6% 左右。
然而在很多情况下,我们很难列举出所有的可能性,比如下面这个装了很多红色小球和白色小球的容器,如果我们随便拿出一个球,它是红球的概率是多少呢?
最准确的办法,当然是把所有的球拿出来数一下,然后用红色球的数量除以所有球的数量,就能算出拿到红球的概率。但这样实在太麻烦了,有没有简单点的办法呢?其实我们可以用随机抽样统计来对概率进行估算。
具体的做法是:先把小球摇匀,然后抓一把出来,数一数一共有多少球,其中多少个是红球。只要球摇得够均匀,抓的球数量够多,这样计算出来的概率就和整体的概率非常接近,完全可以替代使用。
一件事的概率可以通过穷举可能性来计算,也可以通过抽样统计来估算。那么如果有多个事件,该怎么计算概率呢?
首先,要判断这些事件是独立的,还是相互关联的:
- 独立事件:每一次概率是恒定的,不会发生变化。比如掷骰子出6就是一个独立事件,无论之前扔出了怎样的结果,每次出6的概率都是 1/6 。
- 关联事件:概率会根据之前事件的结果而不断发生变化,也就是说发生的先后次序不同,概率就可能不同。比如前面提到的俄罗斯轮盘赌,从第一枪到第六枪遇到子弹的概率分别是 1/6、1/5、1/4、1/3、1/2、1。
在明确每个事件各自的概率之后,就可以动手计算多个事件的概率了:
如果我们要提升成功发生的概率,那就要尽量减少中间的环节。比如电商漏斗模型,从展示、点击、着陆、下单……每一步都会流失很多用户,如果能把整个流程设计得简单一点,让用户少思考一点,就可以大大促进成交的概率。
如果我们想降低失败发生的概率,那就要尽量增加中间的环节。最常见的就是备份策略,重要的数据要多备份,像飞机的发动机这样的重要设备都至少有两个,重要的晚会也会有好几个主持人,这是因为所有节点同时失效的概率远远低于一个节点失效的概率。
如果我们面对的是一个独立事件重复N次的情况,那么计算就更加简单,只要把该事件的概率进行N次乘方就可以了:
还是以扔骰子为例,扔一次出6的概率是1/6 ,那么连续扔出两次6的概率就是1/6 x 1/6 = 1/36,约等于 2.8%,是一个极小概率事件。把所有可能性列出一张图表来,一看便知:
一件事要么发生,要么不发生,没有别的可能性。因此发生的概率和不发生的概率相加必然是 100%,也就是1。如果发生的概率是P,那么不发生的概率就是1 – P。所以扔一次骰子不出6的概率就是1 – 1/6 = 5/6,那么就可以算出连续两次都扔不出6的概率就是 5/6 x 5/6 = 25/36,约等于 69.4%。
当我们希望一个概率较低的事件(比如抽签中奖)发生时,往往往往会进行多次的尝试。这时我们关心的其实是一件事连续N次至少发生一次的概率。在处理此类问题时,我们特别容易犯一个错误,那就是认为N次至少发生一次的概率为P x n。
既然扔一次骰子出6的概率是1/6,那么扔两次骰子出6的概率应该是2/6,扔上六次骰子,怎么也应该出一次6吧?
等等,要这么说的话,扔上十次骰子,出6的概率就是 10/6,居然超过100%了?肯定是哪里出问题了!我们可以先把所有的可能性列出来看一下:
扔两次骰子一共有36种可能性,其中只有11种是有6的,实际概率约等于 30.4%。而我们之前估算的2/6 = 1/3 = 33.3%,虽然感觉上没差太多,但其实完全不是一回事。
事实上「扔N次骰子,至少出一次6」其实就是「扔N次骰子,每次都不出6」的对立事件。也就是说,我们应该计算连续N次不出6的概率,再用1减去它,才能得到正确的答案。
掌握了以上这些关于概率的基础知识,就能足够应付生活中绝大多数情况了。至于更复杂的条件概率、全概率公式、贝叶斯定理什么的,对普通人来说用处其实并不大,感兴趣的同学请自行查询相关资料,我就不在这里更多地消耗大家的脑细胞了。
三、用概率帮我们进行决策
生活中,我们永远面临很多的选择:找什么样的人结婚?选哪个工作?买什么手机?看什么书?买哪支股票?学什么技能?……所谓决策,就是在多个可行的选择中进行价值判断,并找出最佳选项的过程。
如果你有一天打麻将遇到了上面这个局面,你有两个听牌的选择:打二筒,或者打六条。你会怎么选呢?
- 打二筒:胡六九条。九条自己碰了三张,六条手上有两张,外面还剩下一张九条加两张六条,可胡的牌一共只有三张,而且都是生张,别人可能有搭子或对子,也有可能不敢打出来。
- 打六条:胡二三筒。二筒自己有一张,三筒别人打了一张,外面还剩下三张二筒和三张三筒,可胡的牌一共有六张,且三筒是熟张,大家提防心不强,另有两家对手已经打了一三筒,留有搭子和对子的概率不高。
血流麻将一共108张牌,四个人手里13+13+13+14=53张,再扣掉已经打在锅里的14张牌,还剩下108 – 53 – 14 = 41张牌。这样我们就可以计算出两种听法胡牌的概率了:
很明显,打六条胡二三筒的成功概率更高。如果你是在APP上玩,软件很可能会提示你每种选择可胡的牌型,甚至会提示每张牌所剩余的张数。但是如果是在牌桌上打,就只能靠自己进行计算了。如果你每次都能作出概率最高的选择,那么你的胜率肯定会比那些不假思索随手打牌的玩家明显高出一截。
如果每胡一次的收益是确定的,那么我们只需要简单地计算概率就可以了。然而在现实中,往往每个选项带来的收益各不相同,甚至还有可能导致损失。比如很多麻将规则里容易胡的牌番数很低,胡很多次都抵不上胡一把大牌;如果有点炮的规则,或者很明显某家在做大牌,那就不能只考虑自己赢了,还要考虑控制输的风险……
在面对同时存在收益和损失的可能性时,我们就应该用上面的公式计算出每个选项的期望收益,再进行决策。当然,这并不意味着你必须选择期望收益最高的那个选项。况且,很多收益和损失往往是无法进行量化和计算的,比如生命和自由。这时就只能用价值观来进行衡量了。
用概率来计算收益的意义主要在于:我们需要对一件事情的后果建立合理的期望值。如果现实超过你的预期,你就会感觉到快乐;反之,如果现实无法满足你的预期,你就会感到失望。幸福和痛苦,往往就只在一念之间。
接下来,让我们来讨论几个概率在现实生活中实际应用的案例。
相信大家都买过彩票,各类彩票中奖金最高、知名度最高、销量最大的应该就是双色球了。购买者在1-33之间选择六个数字(红球号码),再加上1-16之间选择一个数字(蓝球号码)来进行投注,开奖时按顺序随机抽出六个红球号码和一个蓝球号码,如果和你买的彩票一致或部分一致,你就中奖了。
区区2元钱的价格,就有机会赢得500-1000万的头奖,加上复式投注奖金动辙上亿元,让很多人都产生“花钱买个希望”的念头。那么,买彩票到底是不是一个明智的选择呢?我们算一算就知道了。
一等奖估算500万,中奖概率为1/17721088;
二等奖估算5万元,中奖概率为1/1181406;
三等奖3000元,中奖概率为1/109389;
四等奖200元,中奖概率为1/2300;
五等奖10元,中奖概率为1/129;
六等奖5元,中奖概率为1/16;
用各级别奖金乘以中奖概率,再加起来就能得出加权收益:0.282 + 0.04 + 0.02 + 0.08 + 0.07 + 0.31 = 0.802元。是的,你没有看错,还不到1元!别忘了,我们每张彩票的固定投入是2元,也就是说买彩票的期望收益是负的,每花2元钱买一张彩票,你就稳定亏损1.2元!
算明白了这笔帐,你就该明白「买彩票就等于交智商税」并不是一句空话了。在赌场里赌博也是一回事,因为赌场里每个游戏都设置了计算好的赔率,庄家稳赚不赔,因此你每次赌博的期望收益其实都是负的。不管你带了多少钱,只要一直赌下去,就一定会血本无归。
大家可能都在商场和游乐场玩过抓娃娃机吧?相信大家经常遇到的情况是:你明明抓住了娃娃,但是在还没移动到洞口的时候就掉下去了。其实这类机器里都有概率设定,N次中只有一次爪子的力度是足够的。除了那一次之外,根本不可能把娃娃抓出来。
假如你通过长期观察统计,发现这个娃娃机出娃娃的概率是 1%,那么你准备好100个币,是不是就能确保抓到娃娃呢?
有了之前概率计算的基础,你应该能马上判断这个认识是错误的。因为「重复N次至少发生一次」的概率并不是P x n,所以准备100个币并不能把抓到娃娃的概率从1%提升到 100%,那大概能提升到多少呢?这个不用计算器是算不出来的,你不妨先猜一个数字,再继续往下看:
答案是63.3%,也就是说100个币,也只有六成机会会抓到娃娃。那200个币呢?也只有86.6%,离十拿九稳还差得很远。500个币可以把概率提升到99%,但依然不是100%。事实上,无论你准备多少币,概率都只能逼近、而永远不可能等于100%。
概率再大的事件,都也不可能确保每次都会发生。我们需要时刻牢记,在这个世界上,绝对的确定性是不存在的。因此每当有人跟你说「绝对不会有问题」时,你就要多留个心眼了,这样的人要么是个傻子,要么是个骗子。能力越强的人,越不敢把话说死;只有不知天高地厚的人,才会作出绝对性的判断。
癌症是一种死亡率很高、治愈率很低、预后很差的疾病。一旦确诊为癌症晚期,大多数病人活不过三五年。近年来中国的癌症发病率不断增高,平均每天就有数千人死于癌症。肺癌、胃癌、结肠癌、肝癌、乳腺癌……这些词现在对我们来说,一点都不陌生了。
那么,大家有没有研究过,癌症到底是怎么一回事呢?
细胞会生长和分裂,这个大家都知道。每当我们身上有了伤口,新的细胞就会生长出来把它填充起来。细胞在分裂时会发生随机的基因突变,有极低的概率会变成癌细胞,也就是发生了癌变。
正常的细胞在分裂出足够数量之后就会停止生长,而癌细胞不会,它会无休止地分裂下去,耗尽体内所有能源,让重要脏器停止工作,直到人死亡为止。
抛开遗传的因素不谈,细胞每次分裂产生癌变的概率差不多是固定的。因此分裂的次数越多,患癌症的概率也就越高。那又是什么决定了细胞分裂次数呢?
最重要的因素你可能根本想不到,那就是:人的寿命。要知道在民国时期,中国人的平均寿命还不到35岁。那时就没几个人听说过癌症这种病,因为还没等到发生癌变,或者癌症还没到晚期,人就因为其他原因死了。
同样的原因,小孩几乎不会得那些成人常见的癌症,除非是遗传或者因怀孕期环境污染导致了突变,最常见的就是白血病。现在因为医疗技术进步和经济条件改善,人的平均寿命大大延长,癌变的可能性也就随之增加了。
接下来徘第二的因素是:损伤次数。在我们的组织受到损伤之后,需要分裂新细胞来补充死掉的细胞,这就增加了癌变的可能性。经常抽烟或呼吸污染空气损伤肺细胞,就容易得肺癌;经常喝酒损伤肝细胞,就容易得肝癌;饮食不规律损伤胃细胞,就容易得胃癌;经常嚼槟榔损伤口腔细胞,就容易得口腔癌;经常吃辛辣刺激食物损伤食道细胞,就容易得食道癌;……
概率再小的事件,如果重复足够多的次数,迟早一定会发生。单次分裂导致癌变的概率P我们无法控制,那么我们唯一能做的事就是减少n值。少抽烟,买空气净化器,雾霾天出门带口罩,少喝酒,按点吃饭,少吃刺激食物……
后话
纳西姆・塔勒布曾提出一个概念叫做「黑天鹅事件」,指的是那些发生概率很小,但一旦发生,影响十分巨大的负面事件。比如:地震、癌症、金融风暴…………
如果我们完全忽视这些小概率事件,那么一旦它们发生,很可能会给你带来灭顶之灾;相反,如果过度重视这些小概率事件,而影响了正常的生活,那么就是杞人忧天、因噎废食了。我们应该正确地认识小概率事件,在做最好的打算的同时,也要做好最坏的准备。
所谓经验,就是对小概率事件的熟悉程度。任何一个领域的初入门者,都只是掌握了使用概率最高的那些技能,并能用它们来解决出现概率最高的那些问题。他们往往会觉得自己很厉害,什么问题都能解决。而这个领域里真正的高手,则会去练习各种难得一用的奇技淫巧,去处理各种诡异的疑难杂症。然而越到后来,他们越发现自己正游向一片永远看不见尽头的大海,深知自己的渺小与无知。
所谓成熟,就是对小概率事件的接受程度。 我们应该购买和自己经济能力匹配的各种商业保险,用来对冲可能发生的各种意外风险;我们应该对重大活动中的各种紧急情况作出行动预案并进行必要的演练,把出现问题时的损失控制在最小范围;我们应该坦然面对所谓的「狗屎运」和「人品不好」,要明白这些都不过是概率相当的众多可能性之一而已。
我相信:能把这篇文章完整地读完的你,很大概率是个爱学习的人;爱学习的人,很大概率会从这篇文章中获益;读完有收获的人,很大概率会点赞;点完赞的人,很大概率会转发……
WTF,概率已经这么低了,我不能再算下去了。