北河以北

信息论和统计学思维

文/宋春林

现实中往往有这样的现象:好人做了99件好事,然后做了一件在大众眼里离经叛道的坏事就被认为是不可接受的,而坏人做了99件坏事,只要做一件好事就会被认为是浪子回头金不换,就值得点赞。类似的例子还有我的一位女生朋友告诉我的:一个大大咧咧的男生愿意包容一个任性的女生,这很让人感动;而一个本来性格温和心细的人如果做了同样的事情,却不会得到同样的感动。为什么会出现这样的现象?

我想应该不止我一个人有过这样的疑惑,于是随便在网上搜了一下,发现果壳网的一篇文章里这样解释:

这样的一个事实实际上可以用香农的信息论来解释。假如一个事物有2个状态 {S1, S2}。当它长时间处于某个状态S1时,那么它下一时刻处于S1的概率 P(S1)=p1就会很大(不妨设为0.9),而处于状态S2的概率P(S2)=p2就会很小(p2=0.1)。事件S1给人带来的信息量就为I1=-log2(p1)=0.152,S2的信息量为I2=-log2(p2)=3.322。显然I1远远小于I2。也就是说,当这个事物下一时刻仍然处于S1时,它所带来的信息很少,因而它的影响就很小,因而也就有很少人会在意这件事。相反,当其处于S2时,由于信息量极大,它的影响就很大,因而大家都会很注意这件事情。

关于香农信息论里面的信息量计算公式可以参见维基百科词条,按照公式的计算很有说服力。在坏人好人的例子里面,坏人做好事产生的信息量是他做坏事产生的信息量的log2(0.01)/log2(0.99)=458.2倍,好人做坏事同样也是这个效果。简单来说,概率越小的事情带来的信息量就越大,也就越吸引人,这真是一个令人悲伤的事实。

但是这样的现象骗不过有统计学思维的人。

从统计学的角度,好人的99件好事和一件坏事加起来看他依然是好人,而坏人的99件坏事和一件好事放在一起他依然是坏人。或者这样表达,前者在99%的情况下是好人,后者在99%的情况下是坏人。孰优孰劣,清晰可辨。但是为什么大众的态度却和事实相悖呢?为什么他们的眼中只有好人的那一件坏事和坏人的那一件好事?不是他们对好人苛刻对坏人宽容,而是因为好人做坏事和坏人做好事都是作为特例而出现。一群黑乌鸦里出现了一只白天鹅,人们的目光当然被白天鹅吸引。或者如我的一位朋友所言,一块干净的玻璃上出现了一个黑点,看到玻璃的人首先注意到的不是玻璃的其他部分而是这个黑点。这是人类认识事物的天性。

天性往往是和理性相悖的。作为有理性思维习惯的人,统计学思维是必备的。一个坏人做了99件坏事,如果以0.01为标准,他再做9801件好事才可以认为他变成了好人。这就涉及到统计学最基本的概念:假设检验。其基本前提是认为小概率事件在一次试验中不会发生。所谓的小概率事件一般是指发生概率小于0.05或0.01的事件。假如有一个人,我们事先不知道他是好人还是坏人,我们可以假设他是好人,然后把他放在一个自由的、不受干扰但是受到秘密观察的环境之下(比如就像电影《楚门的世界》里那个玻璃罩子下),他竟然做了一件坏事,那么我们就可以怀疑之前对他是好人的假设不成立,认为他是一个坏人。有人可能会说,那假如他之前做过的事都是好事呢,难道就因为这一件坏事就判定他是坏人?这种可能性很小,或者说认为不会发生。一个只做好事的人突然来做坏事的概率远小于恶贯满盈的人出于惯性做坏事的概率。所以这种假设检验的思想一般不会出错。

统计学思维还在于区分样本和总体。很简单的一个道理是以前辩论队一个学姐讲的例子:人们说中国人是勤劳勇敢的,但是作为中国人的小明实际上又懒又懦弱。这两件事矛盾么?当然不矛盾,前面是针对中国人这个整体而言的,小明只是一个样本,远远不能代表总体。如果要推翻「中国人是勤劳勇敢的」这一论断,最完美的方案是对每个中国人进行相同标准的评估,如果绝大多数(比如95%的人)和小明一样,那就可以认为「中国人是勤劳勇敢的」是假的。中国这么多人,这种方式当然不可能,更现实的方法是按照一定的规则抽样,比如按照不同的年龄段进行分层随机抽样,样本量即使远小于总体量,也认为分析的结果是可靠的。样本量过小或者只看到少数样本看不到整体就会导致判断错误。比如有人看到比尔·盖茨、史蒂夫·乔布斯都是辍学生而后获得成功,于是就动摇了上大学更容易成功这一既有观点。实际上扩大样本量就会发现,更多的成功人士还是具有大学学位的。

发表于
分类 歪理邪说  标签 心理学  统计学