如何寻找隐藏的真相

我爱看侦探 小说,看侦探小说最大的乐趣不在于知道结局,而在于侦探提出犯罪假设,到现场寻找线索,然后在脑中思考这些线索的关联和矛盾,从而建立犯 罪真相的模型,最后将线索填入模型,Bingo!得出结论的思考过程。

这个主题将分享我的5个寻找真相模型,体验成为数据侦探的乐趣。

1. 因果关联模型

我上大学时,我发现一个非常有趣的规律。周围哥们和女朋友分手的概率是和他最 近去学校小卖部的概率成正比的,我把这个叫做“超市夺妻理论”。

这个发现乍一看很令人惊讶,男人去超市的次数怎么会和与女 友分手成正比关系呢?如果这两者没有关系,为什么数字上呈现明显的正相关呢?

仔细观察后我发现,事情原来是这样的。一般人 去超市购买生活必需品的频率基本是相同的,同时一个人的生活习惯和购买习惯不会轻易改变的。但有一件东 西的购买频率是很容易改变的,就是香烟。为什么呢?因为香烟和这个人近期的心情有很大关系。除了少数见人就发烟的豪杰,大部分人的香烟都是买来供自己抽 的。

如果一个人最近抽烟数量猛增,一般只有两种可能。一是精神压力极大,这往往是因为生活上遇到了困难。例如考试考不出,工作找不到,考试 没抄着答案, 或是抄着了答案但是被发现了。这种情况下,这哥们会陷入低潮,心情失落,脾气特差,也疏忽了女友的感受,这些因素使感情产生了摩擦,导致了感情的裂缝最终 导致分手。第二种可能是喜欢上了某种上瘾的嗜好。比如麻将,打牌,网游等等。这种比较刺激的大众文化娱乐活动非常耗费体力脑力,需要一只只的香烟提神。于 是女友因为无法忍受男友的不求上进而提出分手。

上面这个例子说明了一件事情,当我们看待一个事件或者数据时,A和B同时 发生,未必代表A和B有因果关系,他们可能只是有相关性而已。

因果关联模型就是在脑中建立一个报警器,当看到两个高度相关 的事件或者数据时,敏锐的识别出他们究竟是因果关系还是仅仅只有相关性,以防止我们被表 面现象或者所谓专家举出的别有用心的数据所迷惑。

2. 第三因素模型

我们知道了AB相关并不代表因果,那么尝试进一步思考,AB究竟为何会呈现如 此高的相关性呢?背后的原因是什么?

答案是第三因素。也就是说AB之间存在一个隐藏的关系C,其实是AB和C发生因果关系。

例 如,当我们发现一个地区燕尾服的销量越高,该地区的出生率越低。为了达到农民不要生太多孩子的目的,我们是否要求农民都穿着燕尾服去种地呢?

显 然不是的。假设燕尾服的销量是A,出生率是B,那么一定存在一个经济发达指数C。当经济越发达,高级宴会等需要燕尾服的场合会相应增加,同时经济 发达也造就了更多的丁克族,从而降低了出生率。所以我们可以说C导致了A,也导致了B。所以C才是和AB发生因果关系的幕后黑手。

第 三方模型在因果关联模型的基础上提供了发现幕后驱动因素的思考方法。但是,现实生活中的第三方因素并不都像燕尾服的例子那么显而易见,我们应该如 何通过科学的方法找到并确定第三因素呢?

3. “If…So…”控制模型

我们在思考的时候可 以借鉴科学研究中常用的“控制实验法”。用最简单的语言解释“控制实验法”就是:确保其他因素不变,找到发生影响的根源。

心 理学家Harlow做过一个非常有趣的实验。(例子来自于<How to think straight about psycology>)他想回答一个困扰大众多年的问题,人们的恋母情节究竟是什么因素造成的,是因为母亲的哪方面特质是孩子迷恋母亲?当时流行的 假设是因为母亲提供了食物(乳汁),其他可能的相关因素有体温(母亲抱着孩子),舒适的触感(孩子抚摸母亲)等。

Harlow 用猴子做了实验,小猴将接触2个假的不同的母猴,经过一段时间后,看小猴更喜欢哪个母猴。实验中,他每次都保证其他变量不变,而只改变 他要测试的变量,例如母猴子都不提供食物,体温都一样,但是只有触感不同。这样他就控制了第三方变量。

Harlow发现,一段时间后,相比 起硬邦邦的电线制作的母猴子,小猴子明显偏爱触感更佳的绒线做的母猴子。然后Harlow再加入其他变量,例如 温暖的电线猴子和冰冷的绒线猴子;能提供乳汁的电线猴子和不能提供乳汁的绒线猴子。他发现小猴子依然偏爱绒线猴子。所以他得出了恋母情结是来自婴儿时期抚 摸的触感这个结论。

实验通过保证其他变量不变,而只改变要测试的量,来达到发现第三方变量的目的。

同样,当我们在思考的时 候,我们需要在脑中建立一个“If…So…”的控制模型。当其他的条件不变,如果这个情况变了,那么事情会受到什么影响。那 么我们就能辨别什么是事情的驱动因素。更重要的,一旦这个驱动因素发生了变化,我们就能最快预见到未来会发生什么。

4. 交互影响模型

但是,再一次,现实生活要比拿猴子做实验复杂的多。

例如,女人为什么会爱上某个男人?显然答案就不是 一个简单的“金钱”,“外貌”,“性格”,“幽默”能够完全解释的了。这是一个多种因素结合的结 果。这类由多种因素相互作用共同作用于结果的影响就叫做交互影响。

这个结论非常简单,但是放眼世界,我们能发现无数忽视交互影响的人。看一 下财经博客就会发现,无数自封的经济学家或者投资专家依然在仅通过通货膨胀,CPI,某项技术性指标,央行的某项措施甚至罗斯柴尔德家族的动向等单一数据/信息解释股市的走向。

在脑中建立一个交互影响的模型,就 是当看到一个数据/信息的时候,将该数据/信息放入过滤器过滤,判断是属于单一因素起决定作用,还是众多因素相互 影响共同作用。如果是交互影响,又有哪些因素共同作用,哪些作用大?哪些作用久?哪些又对其他因素产生影响?

作为数据侦探,如果没有嵌入交 互影响的思考模型,就会夸大片面数据/信息的影响,而得出错误的结论,变成屡犯错误的“毛利小五郎”。

5. 安慰剂效应模型

安慰剂效应的概念非常普及,也很便于理解。最经典的关于安慰剂的案例是,把相同病症的病患随机分成两组,一组吃最新研制的特效药,另一组吃无疗效的镇定剂;一段时间后,吃特效药和吃镇定剂的病患都认为自己的病症减轻了。

既然如此简单,那么为什么我们还需要建立一个关于安慰剂效益的模型呢?因为以上这个普及版的安慰剂概念是错误的。

为什么说是错误的呢?以上这个案例的内容结合“安慰剂”三 个字会让人产生一种误解:病症的减轻是因为镇定剂带来的心理暗示(安慰)作用,所以由这种心理暗示(安慰)作用带来的以为自己好转的现象叫做安慰剂效应。

而事实上,安慰剂效应指的是,“错误地认为自己所采取的行动对结果产生了积 极的作用,而最有代表性的例子就是服用安慰剂案例。”

在该案例中,让我们举一反三。人体本来就具有一定程度自我修复的功能,所以服用镇定剂 一组确实可能好转,而并不是心理安慰的作用。同样,服用特效药 一组的好转也可能是因为自我修复能力,而特效药可能根本是无效,是研发失败的。

安 慰剂效应模型可以帮助我们质疑看似无懈可击的错误逻辑,发现隐藏的真相。正确的理解了安慰剂效应模型,我们就能看看它对我们是多么有效了。我们带着安慰剂模型再来尝试回答下列问题:通用电气的一时繁荣,是否真的来源于杰克.韦尔奇的改革措施?美国经济指标的好转,是否真的来源于奥巴马政府的经济措 施?温室效应的日渐明显,是否真的来源于人类的污染行为?

还是因为,他们本来就会这样,即使我们什么都不做?

6. 因果方向模型

我有个朋友身高矮小,他常常后悔少年时代没有打篮球而是一直踢足球,因为他认为打篮球能帮助人长 高。他的理由是,你看NBA的人都那么高,还不是打 篮球打出来的?可是他错了。NBA的人不是因为打篮球所以长那么高,而是因为长得高,所以适合打篮球。

我们以为A导致了B 的发生,可事实上可能正好相反。我们常常犯因果倒置的错误,从而得出完全错误的结论,这就是为什么因果方向模型如此重要。

此外,因果的方向不是固定的,是可能发生互换的。比如巴菲特早期选股凭的是眼光,他挑选可能会上涨的股票;而到了晚年,巴菲特选股可以靠影响力,他挑选股票的消息本身就会造成股票上涨,因为市场相信巴菲特的眼光。

所以,我们看待一个数据/信息时,需要首先找到它的假设前提。许多假设前提都是隐藏的,但却决定了作者基于假设的观点正确与否。因果方向模型提供了 解构和质疑假设前提的一种思维方式。

正 确思考的一个重点是正确的阅读和分析数据/信息。首先需要使用因果关联模型分辨关联与因果的差异性,在这基础上使用第三方模型寻找可能的驱动因素,通过控制模型确定真正的第三方因素。然后通过交互影响模型全面的认识本质,通过安慰剂效应模型了解现象改变的真正原因。最后通过因果方向模型结构信息 的假设,从而正确认识数据/信息,形成自己的思考结论。