超预测: 预见未来的艺术和科学(Superforecasting: The Art and Science of Prediction)
1814年,法国数学家、天文学家皮埃尔–西蒙•拉普拉斯从逻辑上将这个梦想发挥到极致: 我们可以将宇宙的当前状态视为过去的结果和未来的成因。这种智慧将在某个时刻洞悉让大自然运转起来的一切力量,知晓它的所有组成部分的所有位置;不仅如此,如果这种智慧宽广到足以对上述数据进行分析,它能用一个公式道尽最浩瀚的宇宙和最渺小的原子的运动。对这样一种智慧而言,一切都是确定的,未来就像过去一样呈现在它的眼前。 拉普拉斯将他想象中的这种存在称为“魔”。他认为,如果“魔”对现在无所不知,它就能预测未来的一切。它将是全知全能的。
那么,现实是像钟表还是像云?未来完全可以预测还是绝对无法预测?这些问题体现了错误的二元对立思想,我们在后面还将遇到许多这样的问题。我们生活的世界像钟表又像云。我们还可以把它比喻为一大堆杂乱无章的东西。不可预测性和可预测性艰难地共存于构成人体、社会和宇宙的复杂的关联系统中。某事物的可预测性如何,取决于三个因素:我们想要预测的内容,预测的时间远近,以及在什么情况下进行预测。
“重要的评估手段对改善人类状况的意义让我震惊,”比尔•盖茨写道,“如果你树立清晰的目标,制定有助于实现目标的评估方法,你就可以获得难以置信的进步……这似乎是基本的道理,但令人吃惊的是,人们经常做不到这一点,或者很难正确执行。”8他对获得进步的方法的叙述是对的,令人惊讶的是,人们在预测时很少这么做。即使第一步—树立清晰的目标—如此简单,也没有人去做。
超级预测需要的是最低程度的智力、数学才能和世界知识,任何读过严谨的心理学著作的人都很可能具备以上先决条件。那么,到底是什么让预测升级为超级预测?正如那些在我的早期研究中表现出真正洞察能力的专业人士所显示的那样,最重要的是预测家的思维方式。我会详细论述这一点,大体而言,超级预测需要的头脑要做到思想开放、认真谨慎、求知欲强,更重要的是,要有自我批判精神。专注也必不可少。产生更优预测的思维方式离不开勤奋。只有意志坚定的人才能持续地发表合理的预测,所以我们的分析总是表明,坚持提高自我是获得良好预测成绩的最有力的保障。
它是“货物崇拜”型科学。这个带有讽刺意味的词是许久之后物理学家理查德•费曼创造的。“二战”时期美国撤销了远在南太平洋岛屿上的空军基地,切断了岛上原住民与外部世界的唯一联系,“货物崇拜”描述的就是在那之后发生的事情。之前美军飞机运来了令人欣喜的物品。原住民还想要更多。于是,他们“组织起来修建跑道,在跑道两边燃起火堆;还修建供一人坐下的木屋,这个人头上戴着两块木片,做成耳机的样子,一根竹棒像天线一样伸出去,他的角色是指挥者。他们就这样等待着飞机降落”。9可是,飞机一去不复返。所以,“货物崇拜”型科学空有科学的外衣,却缺乏科学的灵魂。
一组专家倾向于围绕大理念来组织思想,尽管他们对于哪些大理念正确或者错误没有达成一致意见。有些人是环境末日论者(“我们正在耗尽一切资源”);其他人则是繁荣论者(“对于任何资源,都能找到效益成本比不错的替代品”)。有人是社会主义者(支持对国家经济命脉实行国有控制);其他人是市场极端主义者(希望政府管制最小化)。虽然意识形态不同,但他们有一点是共通的:他们的思想深受意识形态影响。他们试图强行用自己偏好的因果关系模板来理解复杂问题,不适合这些模板的问题则被视为无关的干扰因素。因为厌恶不痛不痒的答案,他们的分析总是语不惊人死不休,有些人还会使用诸如“而且”、“此外”这样的字眼,同时堆砌理由来说明为什么他们正确、别人错误。其结果是,他们异常自信,更有可能宣称某些事“不可能发生”或者“肯定发生”。他们对自己的结论坚信不疑,不愿改变观念,甚至在他们的预测明显失败时也不肯悔改。他们会告诉我们:“等着瞧吧。”
另一个组由更加注重实际的专家组成,他们运用多种分析工具,可以根据自己所面对的特定问题来选择工具。这些专家从尽可能多的来源搜集大量信息。他们思考问题时经常转变思维,在发言中加入少量“然而”“但是”“尽管如此”“另一方面”等转折词。他们谈论的是可能性和概率,而不是确定性。虽然没有人喜欢说“我错了”,但这些专家更乐于承认自己的错误,并转变观念。
这个事实也与EPJ项目数据反映的情况一致,它揭示了名气和准确性的负相关关系:某专家越有名气,准确性越低。这不是因为编辑、制片人和公众期盼糟糕的预测家。他们盼望的是刺猬,而这些刺猬恰好是糟糕的预测家。刺猬在大理念的驱使下,讲述了一个个逻辑严密、情节简单明了的故事,抓住了观众的心。任何接受过媒体培训的人都知道,第一条规则就是“内容要简单,傻子都能看懂”。更有利的是,刺猬看起来信心满满。他们可以从特定视角进行分析,借助“而且”“此外”这样的连词,罗列出一堆理由,说明他们为什么正确,却不考虑其他视角,对令人烦恼的质疑和他人的告诫不予理会。
集体预测的效果如何,取决于预测的内容是什么。由许多一无所知的人组成的集体的预测毫无价值。略知一二的人的集体预测多少有些价值,如果这些人数量足够多,就能够产生引人注目的结果。而同样数量的博闻强记之人的集体预测才是最有效的,因为集体信息池比原来大了许多。集体预测的再集合也能产生令人印象深刻的结果。操作得当的民意调查采集了大量关于选民意图的信息,而综合调查,也就是“民意调查之调查”,将许多信息池集中到一个大信息池。这就是纳特•西尔弗、山姆•王和其他统计学家在2012年总统大选中工作的核心。
蜻蜓和我们人类相似,有两只眼睛,但是眼睛构造与我们截然不同。它的眼睛是一个巨大的、隆起的球,表面覆盖着微小的镜片。由于蜻蜓这个物种的独特性,它的单只眼睛长着30000块这样的镜片,每一块镜片的形状结构都与邻近镜片略为不同,所以具有独一无二的视角。来自数万个独特视角的信息流入蜻蜓的大脑,在那里合成超强视野,使得它可以同时看清几乎所有方向,并且图像的清晰度和精确性满足蜻蜓捕捉高速飞行昆虫的需要。 长着蜻蜓复眼的狐狸是个杂交怪物,实际中当然不存在,只是一个比喻罢了,不过,它抓住了狐狸的预见能力强于戴着绿光眼镜的刺猬的关键原因:狐狸集合各种视角。
情报高级研究计划局注资启动这项比赛时,就知道可能出现上述情形,所以我们说这样的决定如此不同寻常,原因就在于此。测试准确性的想法也许符合某些组织的利益,但是,组织是由人构成的,而人的利益各不相同,大多数人显然对现状感到满意,想要维持和加强现状。收入丰厚的知名评论员不愿冒着名声受损的风险而公开测试其预测的准确性,与他们相似的是,组织内部执掌权力的人也不太可能尝试参与预测比赛,因为这类比赛意味着他们的判断将会得到其他人的检验。在总裁办公室上班的鲍勃可不想听到(更不愿别人听到)在邮件收发室上班的戴维比他更擅长预测公司业务发展趋势的消息。
所以说,均值回归理论是检验运气对成绩的影响的必要工具。“缓慢回归现象说明该活动的结果主要是能力导致的,”莫布森评论道,“而快速回归则是因为运气占据主导地位。”
注意三件事。其一,智力和知识的大跃进出现在普通民众与预测者之间,而非一般预测者和超级预测家之间。其二,虽然超级预测家的表现强于一般预测者,可也没有达到破纪录的高度。而且他们中的大多数算不上所谓的天才,尽管天才这个概念并不明确,经常被武断地界定为人类中最顶层的1%,或者智商在135以上的人。
费米以预测准确著称。他很少处理甚至完全不处理信息,经常像这样做一些粗略的计算,然后得出某个数值。随后的评估表明,他的结果准确性非常高。在许多物理工程系,费米预测或者费米问题是课程的一部分。它们表现为一些内容古怪的测试,题目就像这样:“估算马里兰大学所有学生在一个学期内消费的比萨总面积”。
10所以,一开始就考虑内部视角的预测者面临的风险是被一个也许意义不大甚至毫无意义的数字所影响。但是如果这位预测者从外部视角入手,他的分析就会从有意义的锚开始。更好的锚赋予他明显优势。
事实上,护城河和城墙都不存在。虽然超级预测家有时确实会运用自创的易于理解的数学模型,或者借鉴他人的模型,但这种情况很少发生。他们的大部分预测仅仅是认真思考和细致判断的结果。“我可以想起几个能用到少量数学分析的问题。”莱昂内尔•列文回忆起自己做预测时的某些情景,但是,其他情况下,他依靠的是主观判断。“你知道,这完全是一种权衡。发现相关信息,并判断它的相关程度,以及它到底在多大程度上影响我的预测。”对这位数学教授来说,不借助数学工具甚至是值得骄傲的一件事。他说,人们就是会把他的成功预测归因于数学,“因此,我有点逆反心理,准备向他们证明,不用任何数学方法,我也能成为优秀的预测家”。1 不过,超级预测家几乎都是数学基础相当不错的人,这一事实不能仅仅用巧合来解释。超强的数学素养的确对超级预测家有帮助,但并不是因为他们可以从高深的数学模型中一睹未来面貌。真相更加简单、微妙,并且有趣得多。
具有概率思维的人更少受“为什么”的问题的干扰,他们关注的是“怎么样”。这绝不是语意上的吹毛求疵。“为什么”将我们引向玄学,而“怎么样”仍然与物理学有关。具有概率思维的人会说:“没错,我在那一夜遇见爱人的可能性极小,但我一定是在某处,而她也一定在某处,令人开心的是,我们俩的某处恰好是同一处。”
比尔反省了自己的错误后告诉我:“我认为我回答的其实不是‘安倍会去参拜靖国神社吗’这个问题,而是‘如果我是日本首相,会去参拜吗’。”3一语中的。后面的分析听起来应该耳熟吧:比尔认识到,他在无意识中跳入了诱惑与转换陷阱,用一个简单的问题取代原来的难题;偏离真正的问题后,比尔不再关注新信息,因为它与替代后的问题无关。
这种方法为什么有效?原因并不神秘。不会根据新信息调整预测观点的预测者将无法抓住新信息的价值,而对新信息如此敏感以至于完全根据新信息来做预测的预测者将失去旧信息的价值,而这些旧信息正是之前预测的基础。小心翼翼地在新旧信息之间寻找平衡的预测者能够抓住二者的价值,将其注入新预测中。要做到这一点,最好的方法是迈小步、勤更新。
乔治•奥威尔在其著名文章《政治和英语》的结尾重点强调了6条规则,包括“能用简短单词的地方绝不用长单词”,“能用主动语态的地方绝不用被动语态”。但是,第六条规则才是关键:“宁可违反上述规则,也不要言之无物。”
下面是正确答案。你可以说,“你所说的‘娱乐活动’指的是什么?”或者说“你认为足球流行程度下降,有什么证据?在多长时间内?”这些语意明确的问题的答案虽然不能解决问题,但是它们将揭示隐藏在结论背后的思维过程,这样就可以研究和检验结论。
“这样的现象很普遍,我想称之为打太极。”马蒂•罗森塔尔(Marty Rosenthal)回忆他在团队的第一年经历时这样说道。队友不同意某人的判断,想要对其进行检验,但是他们过于害怕得罪当事人,以至于不能直截了当地提出质疑。他们会“用各种谨慎的字眼说出自己的想法”,反复绕弯子,希望不必直接表达就能让自己的观点被当事人所理解。
团体思维方式是团队本身的自然属性,是成员之间交流模式的属性,而不是每个成员自己的思维过程所具有的特征。8一组具备开放思维但互不关心的人聚集在一起所形成的开放思维还不如个人开放思维之和。一群个性固执但可以共同努力追求真理的人聚集起来所形成的开放思维,是个人性格中顽固不化的部分之和所无法掩盖的。
再想想超级团队的运作方式。他们受到指导来组建高效率团队,不过,团队内没有任何强迫行为。没有等级关系,没有命令,没有正式的领导。这些无政府主义小细胞也许像论坛那样提供无休止的思考和再思考,这些正是超级预测家喜欢做的事,但是他们几乎算不上可以让成员聚集起来完成某项任务的组织。那样需要建立组织架构,需要一位管理组织的领导者。
国防军还明确了思考和执行的界线:一旦决策确定,思维模式就要随之变换,忘记不确定性和复杂性,全力投入行动!“如果有人希望进攻,他必须下定决心这么做。折中政策不合适。”毛奇写道。军官们必须用“冷静和自信”武装自己,以“赢得士兵们的信任”。不能有丝毫的犹疑不决。“只有力量和信心才能让部队跟随他们的脚步,并走向胜利。”聪明的军官知道,虽然战场被“不确定的迷雾”所笼罩,但是“至少有一样东西可以确定:自己的决定。军人必须坚持己见,不能被敌人的行动所动摇,除非改变决定已不可避免”。
塔勒布进一步阐述了这个观点,呼吁提升关键系统(例如国际银行业务和核武器)的“抗脆弱性”:不仅在遭受意外打击后能够恢复,而且还得到强化。原则上我同意他的观点。但有一点经常被忽视,那就是,针对意外情况的准备工作,无论是提高恢复能力还是抗脆弱性,都需要付出高昂代价。我们必须设定优先事项,这又让我们回到预测工作中来。以建筑规范为例。在东京,新建的大型建筑必须采用先进的工程标准来抵御大地震的破坏。这种措施费用很高。这样的代价有意义吗?地震时间无法精确预测,但地震学家知道通常哪些地区容易发生地震、震级可能有多大。东京位于地震多发区,因此代价高昂的工程标准是合理的。而在不太可能发生大地震的地区,特别是更加贫穷的国家,就没有太多必要采用同样的标准。
即便我们不是马克思列宁主义者,也应该承认,列宁的话有道理。自我和集体的利益的确都重要。如果我们可以用预测来增加自己的利益,那就应该这么做。按照这个观点,我们没有必要去革新和提升预测技术。它不会有任何改变,因为现在它已经很好地服务于主要目标。 不过,在放弃努力前,请记住,列宁的观点有些武断。诚然,人们希望获得权力,但是他们所珍视的不只是权力。这一点会产生重大影响。
在另一个世界的我会说,数字是好东西,并且有用,但是我们必须注意不要过分迷恋它们。“并非所有重要的事物都可以计算,”有句名言是这么说的,“也并非所有可以计算的事物都重要。”13在如今这个计算机和算法当道的年代,某些社会学家已经忘记了这段忠告。文化评论家莱昂•维泽尔蒂尔(Leon Wieseltier)在《纽约时报》上说:“那些无法被度量的现象也被设定了‘度量标准’。无法用数字描述的事物也被赋予数值。”14这种幼稚的实证主义正在四处泛滥,进入到完全无关的领域。维泽尔蒂尔用诗一般的语言评价说:“智慧待过的地方,如今皆有定量化的身影。”
关注那些辛勤付出可能得到回报的问题。不要在两类问题上浪费时间,一是“如时钟般有规律”的容易的问题,对于这类问题,简单的经验法则就可以让你接近正确答案;二是“像云一般”难以捉摸的问题,在这类问题上,即使煞费苦心的统计模型也无法击败掷飞镖的黑猩猩。集中精力处理难度适中的问题,你的努力能获得最大收益。 举个例子。“12年后的2028年,谁会当选美国总统”,这个问题现在是不可能预测的。试都不要试。你能够在1940年预测出12年后的1952年谁赢得大选吗?如果你认为你可以知道当选者是当时美国陆军中一位无人知晓的上校,名叫德怀特•艾森豪威尔,那你也许深受后视偏差的折磨,这将是心理学家记录过的最严重的后视偏差案例之一。
哈佛大学教授、财政部前部长拉里•萨默斯就是一个典型例子。他知道什么是计划谬误:当老板问雇员完成一个项目需要多长时间时,雇员往往受到两三个因素的影响而低估他们实际需要的时间。萨默斯认为自己的雇员也是这样。一位名叫格雷格•曼昆的前雇员,现在也是知名经济学家,他这样回忆萨默斯的策略:萨默斯将雇员的估计数乘以2,然后用更高一级的时间单位来表示。“这样,如果研究助理说某些任务需要耗时1个小时,到萨默斯那儿,就变成两天。如果助理说两天,就变成4个星期。”2有个书呆子们才会喜欢的笑话是这么说的:雇员们做不到用外部视角来做预测,萨默斯会予以纠正,其方法是通过外部视角来分析雇员的预测,并设计出有趣的修正系数。
大家似乎都认为,推测洋基队的首发阵容值得投入更多精力,而评估南苏丹爆发大屠杀的风险则不然。当然,棒球与政治的类比并非完美。棒球是在标准环境下进行的重复活动。而政治是一种诡异的游戏,其中的规则总是受到扭曲和争议。因此,给政治预测评分比整理棒球的统计数据要难得多。不过,“更难”不代表不可能,事实证明,它是非常有可能的。