重磅推荐
【编辑推荐】

◎本书荣获日本《周刊钻石》杂志2017年*经济类图书第1名

◎因果推理是现代人的基本素养,已被美国列入大学课程

◎数据也会说谎,只有乘上统计方法的时光机,追溯到根源,才能找出事件背后真正的原因

◎在教育经济学和医疗经济学领域深耕多年的两位作者,教你用因果推理识破纯属偶然的伪相关和随处可见的无稽之谈,从此不再人云亦云,拒交朋友圈智商税

◎掌握逐级递进的7大工具,不但学会分析数据,更能深入解读数据分析的结果

◎按照本书归纳的5个步骤,瞬间洞察因果关系,优化利益攸关的重要决策


【内容简介】

定期接受代谢综合征体检就能长寿吗?

看电视会导致孩子学习能力下降吗?

上偏差值高的大学收入就会更高吗?

想必很多人的回答都是肯定的。

不过,经济学的相关研究已经推翻了上述全部说法。大多数此类似是而非的说法源于我们混淆了相关关系与因果关系,因果关系隐藏在杂乱无章的数据和众多似是而非的线索之中,发掘因果关系需要严谨的论证和极具针对性的技术手段。分别在教育经济学和医疗经济学领域着力半生的中室牧子和津川友介,摒弃了令人望而却步的公式和计算,广泛采用民众*关心的教育、医疗案例,独辟蹊径地解析了基本的因果分析原理,没有统计学和经济学的基础知识的读者也能轻松读懂。

书中把因果推理法归纳为极为简单的5个步骤,并提供了一系列工具,以保证推理过程的严谨,请务必严格按照本书的步骤和工具进行因果推理。

无论是身处一线城市还是十八线小城镇,因果推理思考都是不容回避的决策利器。本书可帮助读者刷新对因果关系的认知,高效实现人生目标,而不是被朋友圈的人云亦云所左右。


【作者简介】

中室牧子:庆应义塾大学综合政策学部副教授。哥伦比亚大学公共管理硕士教育经济学博士,研究领域为教育经济学。曾任职于日本银行、世界银行和东北大学其作品《学力的经济学》荣膺2016年经管类图书亚军,销量超过30万册。

津川友介:加州大学洛杉矶分校(UCLA)助理教授。哈佛大学公共卫生硕士、医疗政策学博士,研究领域为医疗政策学和医疗经济学。曾就职于圣路加国际医院、世界银行和哈佛大学。


【媒体评论】

本书汇聚了统计学和经济学的*成果。 ——西内启

本书揭示了我们是如何被误解所左右的。 ——池上彰


【目录】

1

1 如何不受无稽之谈的蒙蔽

因果推理根本的思考法 1

何谓“因果关系”和“相关关系”? 3

判断因果关系的三个要点 4

证明因果关系需要“反事实” 11

没有时光机就制造不出反事实吗? 12

“贴切的值”替换反事实 14

只有“可比较”的组才能替换 17

想象不出正确的反事实就会被无稽之谈蒙蔽吗? 18

COLUMN 1 巧克力消耗量越大,诺贝尔奖获奖人数越多? 22

2 定期接受代谢综合征体检就能长寿吗?

因果推理的理想形态——随机对照试验 25

“实验”能证明因果关系 27

原因与结果的经济学正文.indd 13 2019/4/18 星期四 上午 10:28:00

随机分组的必要性 29

“代谢综合征体检”与“长寿”是因果关系吗? 30

何谓“在统计学上具有显著性”? 31

定期接受体检并不能带来长寿 33

投入1 200 亿日元税金的代谢综合征体检 33

“医疗费用自付比例”和“健康”是因果关系吗? 35

兰德健康保险实验的结果 37

除贫困阶层以外,提高自付比例对健康状况没有影响 38

COLUMN 2 整合多项研究的“元分析” 40

3 男医生比女医生更优秀吗?

利用与实验类似的偶发现象进行自然实验43

用现有数据重现与实验类似的环境 45

“医生性别”与“患者死亡率”是因果关系吗? 47

女医生负责的患者死亡率更低 48

“出生体重”与“健康”是因果关系吗? 49

出生体重较重的婴儿更健康 50

COLUMN 3 被动吸烟会增加心脏病的患病风险吗? 52

4 工资与就业之间存在因果关系吗?

排除趋势影响的双重差分法 55

模仿实验的“准实验” 57

原因与结果的经济学正文.indd 14 2019/4/18 星期四 上午 10:28:00

前后比较毫无意义 57

不能使用实验前后测分析的两个原因 59

去年的销售额为“反事实”时,前后比较才有效 60

实验前后测设计的改良版——双重差分法 62

双重差分法成立的两个前提条件 64

“保育所数量”与“母亲就业”是因果关系吗? 67

增设认可保育所不会提升母亲的就业率 68

“工资”与“就业”是因果关系吗? 69

提高工资不会减少就业 71

COLUMN 4 “不快点睡觉,妖怪就要来了”是正确的教育方法吗? 72

5 看电视会导致孩子学习能力下降吗?

利用第三变量的工具变量法 75

广告费打折,该怎样利用 77

工具变量法成立的两个前提条件 79

“看电视”与“学习能力”是因果关系吗? 80

看电视可以提高偏差值 81

“母亲的学历”与“孩子的健康”是因果关系吗? 82

母亲上过大学,孩子更健康 83

COLUMN 5 增加女性管理层成员能促进企业成长吗? 85

6 和学霸做朋友,学习能力会提高吗?

关注跳跃的断点回归设计 89

利用“49 人店铺”与“50 人店铺”的差异 91

断点回归设计成立的前提条件 92

“朋友的学力”与“自己的学力”是因果关系吗? 93

和学霸在一起,也无法提高自己的学习能力 94

“医疗费用自付比例”与“死亡率”是因果关系吗? 95

提高老年人医疗费用的自付比例对死亡率没有影响 96

COLUMN 6 “激素替代疗法”的陷阱 99

7 上好大学收入就会更高吗?

组合相似个体的匹配法 101

找出相似的店铺 103

整合多个协变量的“倾向得分匹配法” 104

倾向得分匹配法成立的前提条件 107

“大学偏差值”与“收入”是因果关系吗? 108

上偏差值高的大学,收入也不会增长 109

COLUMN 7 商务版随机对照试验“A/B 测试” 112

8 便于分析现有数据的回归分析 115

假如现有数据都不适合用来评估因果关系…… 117

画一条表示数据的“回归线” 118

原因与结果的经济学正文.indd 16 2019/4/18 星期四 上午 10:28:00

“多元回归分析”排除混杂因素的影响 119

COLUMN 8 因果推理的发展史 122

补论1 了解分析的有效性和局限性 127

内部效度与外部效度 127

随机对照试验也有局限性 128

补论2 因果推理的五个步骤 131

135

参考文献 141


【前言】

在本书的开篇,我先请各位读者回答以下几个问题。

? 定期接受代谢综合征体检就能长寿吗?

? 看电视会导致孩子学习能力下降吗?

? 上偏差值高的大学收入就会更高吗?

想必很多人的回答都是肯定的。

不过,经济学的权威研究已经推翻了上述全部说法。

很多人之所以会做出肯定回答,是因为他们混淆了“因果关系”和“相关关系”。建议那些不假思索做出肯定回答的人务一读本书。他们读后定会收获全新的重要发现。

我们来看下面这个例子。

人们常说体力好的孩子往往学习能力也更强。图表1 体现了日本各行政区孩子的体力测试与学力测试平均值的关系。从图中可见,学生体力测试分数高的行政区,学力测试的正确率也更高。

那么,我们可否得出结论,认为他们“因为体力好,所以学习能力强呢”?换句话说,要想提高孩子的学习能力,是否应该先增强孩子的体力呢?

当然没有这回事儿。在经济学领域,“两个事件中,一方为原因,另一方为结果”的状态被称为存在因果关系。如果体力好这项“原因”会产生学习能力强的“结果”,便可以说二者之间存在因果关系。另一方面,“两个事件相互关联,但不存在因果关系”的状态被称为相关关系。在相关关系中,即使“看似是原因的事件”再次出现,也得不到期望中的“结果”。可见分清因果关系和相关关系是十分重要的。

“因为体力好,所以学习能力强”,其言下之意是“只要增强体力,(即便整天不学习)学习能力就会有所提高”。这种说法显然有问题,因此体力和学习能力的关系不是因果关系,而是相关关系。当然,即使增强孩子的体力,孩子的学习能力也不一定会提升。

这个事例教给我们一个非常重要的教训:混淆因果关系和相关关系,会导致错误判断。

在关于儿童的体力和学习能力的这个事例中,大多数人应该都能分清因果关系和相关关系。不过我们的生活中充斥着五花八门的信息,其中不乏听起来很有道理的说法。遗憾的是,很多人面对类似信息,都会不假思索地把相关关系视为因果关系。现在,让我们再回过头来思考本书开篇提出的三个问题吧。

? 定期接受代谢综合征体检就能长寿吗?

? 看电视会导致孩子学习能力下降吗?

? 上偏差值高的大学收入就会更高吗?

要让这三个说法成立,“代谢综合征体检”和“长寿”、“看电视”和“孩子的学习能力”、“大学的偏差值”和“收入”之间必须存在因果关系,而非相关关系。那么,每组事件之间的关系究竟是因果关系还是单纯的相关关系呢?下面让我们来依次探讨。

定期接受代谢综合征体检就能长寿吗?

学校或公司经常为我们安排体检,其中常见的是“代谢综合征体检”。想必很多人相信,通过代谢综合征体检掌握自己的健康状况,预防生活习惯病,或者发现潜在疾病,我们就会更长寿。

图表2 的柱状图显示,在代谢综合征体检中接受了生活习惯指导的人在第二年出现了腰围变小、体重下降、血糖或血压降低等变化。

乍一看,似乎确实可以说接受代谢综合征体检就会更健康、更长寿。

不过,请不要急于得出结论。这份数据真的可以说明“因为定期接受了代谢综合征体检,所以长寿”吗?回答这一问题的关键在于弄清代谢综合征体检和健康是因果关系还是仅为相关关系。这份数据还可以如此解读:并非“因为定期接受了代谢综合征体检,所以长寿(因果关系)”,而只不过是“关注健康、定期接受代谢综合征体检的人更长寿”(相关关系)而已。

先来公布答案。经济学的权威研究证实,代谢综合征体检和长寿之间不存在因果关系。因此,“我每年都接受体检,所以身体很健康”是一种很危险的认知。详细讲解请见第2 章。

看电视会导致孩子学习能力下降吗?

“我家孩子总是看电视”,想必不少家长都有这个烦恼。据日本厚生劳动省统计,小学六年级学生平日平均每天会在电视机前度过约2.2 小时,周末平均每天在电视机前度过约2.4 小时。

图表3 也显示,每天看电视时间超过3 小时的孩子比看电视时间少于1 小时的孩子的学力测试成绩低。光从这个数据来看,似乎看电视确实会对孩子的学习能力造成不良影响。

但是,我们必须认真思考,看电视和孩子学习能力之间的关系属于因果关系还是相关关系。也就是说,要分清是“因为看电视,所以学习能力下降”(因果关系),还是只是“学习能力差的孩子看电视时间更长”(相关关系)而已。

关于这个问题,我们也先公布答案。经济学的权威研究证实,看电视的时间和学习能力之间确实存在因果关系,但研究发现,看电视时间越长,学习能力不但不下降,反而提升。详细讲解请见第5 章。

上偏差值高的大学收入就会更高吗?

很多人坚信“考上偏差值高的大学,未来就能拿高薪”。从实际数据中也能看出,高偏差值大学的毕业生具有年收入更高的倾向。(见图表4

思考这个问题的关键依然是,大学偏差值和年收入之间是因果关系还是相关关系。或许不是“因为上了偏差值高的大学,所以收入高”(因果关系),而只是“有潜力将来获得高薪的人才多集中在偏差值高的大学”(相关关系)。

关于这个问题,我们也先公布答案。经济学的权威研究证实,大学偏差值和未来的年收入之间不存在因果关系。上偏差值高的大学并不代表步入了人生的康庄大道。详细讲解请见第7 章。

或许有人不明白,不存在因果关系又有什么影响。或许有人会认为:接受代谢综合征体检总好于不体检,控制看电视的时间总比抱着电视不放要强,而上偏差值高的大学总比上偏差值低的大学要好吧。

不过不要忘了,我们采取任何行动都需要花费可观的金钱和时间。偏信那些看似存在因果关系的“无稽之谈”,把它们作为行动依据,不仅得不到预期的成效,还白白浪费了金钱和时间。如果依据因果关系有效地把这些金钱和时间利用起来,我们获得满意的成果的概率也会更高。

理解“因果推理”,便可摆脱传统观念的束缚

两个事件之间是否真的存在因果关系?为解答这一问题,近年来经济学研究倾注了巨大的心血。我们把正确区分因果关系和相关关系的方法论称为“因果推理”。

“因果”,顾名思义,即“原因与结果”。“推理”则指“根据某个事件推导其他事件,即经过推测和推断得出结论的过程”。换句话说,就是分析并判断两个事件是否分别为原因和结果的过程。

在日常生活中,只要理解了因果关系和相关关系的差异,训练自己思考是否存在因果关系,便可以摆脱偏见或无稽之谈的束缚,做出正确的判断。本书的目的便在于用浅显易懂的方式详尽讲解因果推理根本的思维方法。读者可以把本书当作因果推理的“入门的入门”。既然是入门的入门,自然不涉及经济学的基础知识,更不会用到任何公式。

此外,本书还将用大量篇幅介绍经济学中运用因果推理与数据得出的研究成果,说明如何解读这些研究。当今社会,“大数据”已成为脍炙人口的词汇,任何人都能轻而易举地分析数据,但是这并不代表所有人都能正确解读数据分析的结果。若想在大数据时代获得一席之地,不仅要学会分析数据,更要掌握解读数据分析结果的能力。

在此请允许我们做个自我介绍。本书作者之一的中室牧子是教育经济学家,多年来一直致力于运用数据和经济学方法研究何种教育方法能提高儿童的学力及能力。她所提倡的不是基于个人经验的教育论,而是呼吁根据具有因果关系的科学依据来制定育儿及教育政策。

另一名作者津川友介是医生兼医疗政策学家,致力于运用大数据研究如何在改善医疗质量的同时抑制医疗费用的增加。津川师从美国著名医疗经济学家、任教于哈佛大学的约瑟夫·纽豪斯(Joseph Newhouse)以及早创建因果推理体系的唐纳德·鲁宾(Donald B. Rubin),从他们那里学会了因果推理的思维方法。

在美国,“因果推理”是大学的课程内容之一。商务和政治场合自不必说,日常会话中很多人也会有意识地在言谈中注意因果推理的应用。而在日本却几乎没有系统学习因果推理的机会。或许因为这个原因,电视和报纸上常有报道将一些相关关系描述成因果关系,甚至企业管理者和政策制定负责人也常把因果关系和相关关系混为一谈。

教育领域和医疗领域里充斥着无数因果关系混淆的无稽之谈。本书以生活中必不可少的教育和医疗为例,尽可能让各位读者在阅读本书后掌握因果推理的基本思维方法。

19 世纪杰出的美国思想家、作家拉尔夫·爱默生说过这样一句话:“浅薄的人相信运气,强大的人相信因果。”在这个数据泛滥的时代,“因果推理”是我们每个人的素养。


【免费在线读】

何谓“因果关系”和“相关关系”?

让我们再来看看因果关系和相关关系的概念。

如果两个事件中,前一个事件是后一个事件的原因,后一个事件是前一个事件的结果,则两个事件之间存在“因果关系”;如果一个事件变化后,另一个事件也随之发生变化,但二者不属于原因和结果的关系,则称它们之间存在“相关关系”。(见图表1-1)存在相关关系的两个事件之间虽然有关联,但不属于因果关系。

这里所说的“事件”等可以取各种值的数据称为“变量”。变量可以是年龄、身高等数值,也可以如性别等取男性或者女性等文字作为值。本书在论述时将变量分为“原因”和“结果”两大类。

两个变量的关系是否真的是因果关系?解答这个问题所需的思维方法便是“因果推理”。

判断因果关系的三个要点

判断两个变量属于因果关系还是相关关系时,可以通过以下三个问题进行质疑。

①是否“纯属巧合”?

②是否存在“第三变量”?

③是否存在“逆向因果关系”?

①是否“纯属巧合”?

如果有人提出“温室效应的加剧导致海盗数量下降”,大家肯定觉得荒唐,但如图表1-2 所示,温室效应逐渐加剧的同时,海盗数量确实在不断减少。

可是,按常理来说,很难想象温室效应的加剧会导致海盗数量下降。两个事件看似有关,其实只是“纯属巧合”。像这样,两个变量的变化趋势只是碰巧相似的现象被称为“伪相关”。

美国信息分析员泰勒·维根(Tyler Vigen)在其著作《伪相关》(Spurious Correlations)中介绍了很多“纯属巧合”的事例。例如,“尼古拉斯·凯奇一年参演电影的部数”与“泳池溺亡人数”(见图表1-3)、“美国小姐的年龄”与“因取暖设备丧命的人数”(见图表1-4)、“商业街的总收入”与“在美国获得计算机科学博士学位的人数”(见图表1-5)等之间都存在高度的相关关系。

这些例子看似非常荒唐,但不可思议的是,把两个变量做成图表比对一下就会显示出明显的相关关系。正好比“蝴蝶在亚洲扇动翅膀,南美就会刮起飓风”,不过需要留意的是,我们身边其实存在很多这种“纯属巧合”的相关关系

或许你会怀疑,真的会有人把伪相关当作因果关系吗?实际上,不少预测大盘的人都会相信纯属巧合的伪相关,把它们当作没有依据却非常灵验的经验之谈。

例如可能有人听说过“吉卜力的诅咒”。即只要日本的电视台播出宫崎骏导演领导的吉卜力工作室的电影,美国股市就会下跌。就连美国的《华尔街时报》也曾报道过这条法则并一度引起热议。这条法则正是“纯属巧合”造就的典型的伪相关。

探讨“是否存在因果关系”时,一定要先质疑两个变量之间的关系是否纯属巧合。

②是否存在“第三变量”?

其次,我们必须要质疑是否存在同时影响原因和结果的“第三变量”。用术语说就是“混杂因素”,它可以把纯粹的相关关系包装成因果关系,干扰人们判断。

我们来看一则混杂因素的具体事例。前言中曾经提到这个说法:体力好的孩子学习能力强。可能一些家长看到这种说法,就打算让孩子去锻炼身体。

然而,断定体力与学习能力之间存在因果关系还为时过早。说不定另有一个变量同时影响着孩子的体力和学习能力。(见图表1-6)比如“父母对教育的热衷程度”等。热衷教育的父母可能会让孩子学习运动项目或者注重饮食健康(对体力产生影响),同时还会督促孩子学习,因此孩子的学习能力也比较强(对学力产生影响)。这则事例中,提高孩子学习能力的不是体力,而是“父母对教育的热衷程度”。如果事实果真如此,那么一味增强孩子的体力,恐怕不会提高他们的学习能力。

探讨“是否存在因果关系”时,切记还要质疑是否存在同时影响原因和结果的“混杂因素”。

③是否存在“逆向因果关系”?

接下来需要质疑是否存在“逆向因果关系”。例如,我们来思考警察与犯罪的关系。警察多的地区,犯罪案件数量也多。但是,将警察多视为犯罪案件数量多的原因难免有些牵强(警察→犯罪)。

不如说因为某处是犯罪多发的危险地区,所以部署了大量警力,这么想可能才更合理(犯罪→警察)。本以为是原因的事件其实是结果,本以为是结果的事件其实却是原因,这种状态被称为“逆向因果关系”。 探讨“是否存在因果关系”时,还要质疑原因与结果的方向是否相反。

让我们对照图表1-7 对上述说明加以总结。

如果两个变量之间存在因果关系,当原因再次出现时,相同的结果也会出现,而不存在“纯属巧合”“混杂因素”或“逆向因果关系”。另一方面,如果两个变量的关系只是相关关系,那么就会存在“纯属巧合”“混杂因素”或“逆向因果关系”中的某一种情况。在相关关系的情况下,即使原因再次发生,也几乎不会得到相同的结果。


返回顶部