# 贝叶斯定理
Bayes' Theorem
你去做了一次癌症筛查。检测的准确率是95%——如果你真的有癌症,它有95%的概率检出阳性;如果你没有癌症,它有95%的概率检出阴性。
结果出来了:阳性。
你觉得自己得癌症的概率是多少?
大多数人的直觉回答是95%。甚至很多医生也会这么回答。但正确答案可能让你大吃一惊——在大多数癌症筛查场景中,即使检测结果为阳性,你真正得癌症的概率可能只有不到20%。
这不是诡辩,这是数学。而理解这个数学,会从根本上改变你处理信息、更新判断的方式。
为什么你的直觉错了
让我们拆解这个问题。
假设你参加筛查的这种癌症在人群中的发病率是1%——也就是每1000个人中有10个人真的有癌症。现在用这个“95%准确率”的检测来测这1000个人:
有癌症的10个人中: 95%被检出阳性 = 9.5人(约10人)检出阳性,0.5人漏检。
没有癌症的990个人中: 95%被检出阴性,但5%被错误地检出阳性 = 49.5人(约50人)假阳性。
现在看看所有“阳性”结果:真阳性约10人 + 假阳性约50人 = 总共约60个阳性。
其中真正有癌症的:10/60 = 大约17%。
你没看错。一个“95%准确率”的检测告诉你“阳性”,你真正得病的概率只有17%。
这个结果之所以反直觉,是因为大多数人忽略了一个关键信息:基础概率(base rate),也叫先验概率。 癌症的发病率只有1%——这意味着在你做检测之前,你得病的概率就很低。检测结果“阳性”确实大幅提高了你得病的概率(从1%升到17%),但它没有高到95%,因为基础概率太低了。
这就是贝叶斯定理的核心洞见:任何新证据的意义,都必须在先验概率的背景下解读。脱离了先验概率,证据就是无根之木。
用公式来表达:
P(有病|阳性) = P(阳性|有病) x P(有病) / P(阳性)
翻译成人话:你根据新证据更新后的信念(后验概率) = 证据在假设为真时出现的概率 x 你之前的信念(先验概率) / 证据出现的总概率。
但你不需要记住公式。你只需要记住一个思维框架:
先验概率 + 新证据 = 后验概率
你对一件事已有的判断(先验),遇到了一条新信息(证据),你的判断应该更新(后验)——但更新的幅度取决于新信息的强度和你原有信念的强度。新信息很强、原有信念很弱,就大幅更新;新信息模糊、原有信念很强,就小幅更新。
这才是理性地处理新信息的方式。
芒格为什么重视这个定理
芒格没有像谈论心理学倾向那样频繁引用“贝叶斯”这个名字,但贝叶斯推理渗透在他整个思维体系的骨髓里。
他反复强调的几条核心原则——“要考虑先验概率”“不要被生动的个案冲昏头脑”“根据新证据不断校准判断”——都是贝叶斯定理的非数学表述。
考虑一下芒格的这段话:
“The right way to think is the way Zeckhauser plays bridge. It's just that simple.”
理查德-泽克豪泽(Richard Zeckhauser)是哈佛的经济学家,也是世界级的桥牌高手。桥牌的本质是什么?你先根据手上的牌和叫牌过程形成一个关于对手牌面的先验判断,然后每出一张牌就是一条新证据,你不断更新判断,调整策略。整局牌就是一个连续的贝叶斯更新过程。
芒格说“像泽克豪泽打桥牌那样思考”,本质上就是在说:像贝叶斯主义者那样生活——永远持有一个可以被证据修正的暂时信念,而不是一个要么全盘接受、要么全盘拒绝的固定立场。
这和大多数人的思维方式形成了尖锐对比。大多数人的信念系统是二元的:要么相信,要么不信。当新证据出现时,他们要么无视它(因为和现有信念矛盾),要么被它完全征服(因为太生动太有冲击力)。几乎没有人做到“根据证据强度按比例调整信念”。
投资中的贝叶斯思维:从巴菲特买IBM说起
2011年,巴菲特宣布伯克希尔买入了大量IBM股票,总投资约107亿美元。这让投资界震惊——巴菲特多年来一直说自己不投科技股,因为他不在自己的能力圈内。
巴菲特的先验判断是:IBM拥有强大的企业客户关系,转换成本极高(企业一旦使用IBM的系统,更换的成本高到令人却步),而且管理层在资本配置上表现出色(大量回购股票)。基于这些因素,他给出了一个较高的先验概率——IBM是一家能长期保持竞争优势的企业。
然后新证据开始出现。
2013-2014年,IBM的收入开始持续下滑。云计算浪潮中,亚马逊AWS和微软Azure在快速崛起,IBM的传统业务正在被侵蚀。一个季度的收入下滑是噪声,但连续多个季度的收入下滑是信号。
一个贝叶斯思考者应该怎么做?根据新证据的强度更新先验判断。收入连续下滑是一条高强度的证据——它直接挑战了“IBM能保持竞争优势”这个核心假设。后验概率应该显著下调。
巴菲特确实这么做了——但他做得比较慢。他在2017年开始减持IBM,2018年基本清仓。他公开承认这是一笔不成功的投资。但与此同时,他把资金转向了苹果——用同样的框架,但更新后的证据指向了一个更强的投资标的。
这个案例完美地展示了贝叶斯思维在投资中的运作方式:
第一,你必须有一个明确的先验。 “我认为这家公司有竞争优势,概率是X%。”没有明确先验的人,无法有意义地处理新信息——因为你不知道自己的信念该从什么基准开始更新。
第二,你必须持续监控证据。 每一份财报、每一个行业变化、每一个竞争对手的动作,都是潜在的新证据。但不是所有证据的权重相同——一个季度的收入下滑可能权重较低(噪声),但如果你看到客户续约率下降、核心产品的市场份额被蚕食,这些证据的权重就高得多。
第三,你必须愿意更新。 这是最难的部分。人类有强大的避免不一致性倾向——一旦公开承诺了一个立场(比如巴菲特公开买入IBM),改变立场的心理成本极高。贝叶斯定理是冷冰冰的数学,它不在乎你的面子。证据够强,就必须更新,即使这意味着承认错误。
医学与法律:贝叶斯陷阱的高危区
癌症筛查的例子不只是一道数学题。它是真实世界中每天都在发生的悲剧。
研究表明,大量医生无法正确解读检测结果。在一项经典研究中,研究者给160名医生呈现了以下场景:一种疾病的发病率是0.1%,检测的灵敏度为100%(有病一定检出),假阳性率为5%(没病有5%概率误报阳性)。问题:如果一个患者检测阳性,他真正有病的概率是多少?
正确答案是约2%。但大多数医生估计为95%。
这种错误的后果是真实的——不必要的活检、不必要的手术、不必要的焦虑。贝叶斯推理不是学术游戏,它直接影响到你走进医院之后的命运。
法庭上同样如此。检察官论证“嫌疑人的DNA与犯罪现场样本匹配,随机匹配概率只有百万分之一,所以嫌疑人有罪的概率是99.9999%”。这个推理犯了和癌症筛查完全相同的错误——它忽略了先验概率。如果这个城市有500万人,百万分之一的随机匹配率意味着大约有5个人的DNA会匹配。嫌疑人是那个真正的罪犯的概率是1/5 = 20%,而不是99.9999%。当然,如果还有其他证据(动机、不在场证明等),概率会继续更新——但DNA证据本身远没有听起来那么定论性。
这种错误在法律界有一个专门的名字:检察官谬误(Prosecutor's Fallacy)。它的核心就是忽略先验概率。
反直觉与边界:贝叶斯思维的陷阱
陷阱一:先验概率从哪来? 贝叶斯定理说“根据新证据更新先验”,但先验本身怎么定?如果你一开始的先验就大错特错,后续再多的更新也可能走在歧路上。这是贝叶斯方法最根本的争议。芒格的处理方式是:用多元思维模型来构建先验。一家企业的竞争优势如何?不要只从财务数据来判断——用护城河(Moat)框架、用行业结构分析、用管理层评估、用逆向思维检验。多个独立来源汇聚出的先验比单一来源的更可靠。
陷阱二:过于缓慢地更新。 避免不一致性倾向让人抱着旧信念不放,即使证据已经堆积如山。巴菲特在IBM上的经历就是例子——他承认自己更新得太慢了。对抗这个陷阱的方法是预先设定“触发条件”:如果发生X,我就将我的信念调整至少Y个百分点。把更新规则提前写好,可以减少情绪在关键时刻的干扰。
陷阱三:过于快速地更新。 与上一条相反,有些人看到一条生动的新闻就完全推翻原有判断。一个季度的业绩不好就恐慌性抛售;一条乐观的分析师报告就冲动买入。这是对弱证据的过度反应。贝叶斯定理告诉你:证据的权重取决于它的信息量(似然比),而不是它的情感冲击力。一条具体的、违反你预期的、来自可靠来源的信息,权重远高于一条模糊的、符合你预期的、来源不明的信息。
陷阱四:忽略基础概率而被“故事”绑架。 这可能是最普遍的贝叶斯错误。一个创业者给你讲了一个激动人心的故事——他的产品、他的团队、他的愿景。你被打动了。但你忽略了一个冰冷的基础概率:绝大多数创业公司会失败。无论故事多动人,你的后验概率都应该从那个沉重的基础概率开始更新,而不是被故事拉到100%然后再往下调。芒格反复强调的“先考虑基础概率”(always consider base rates),就是这个意思。
如何在日常中使用贝叶斯思维
你不需要随身带计算器。贝叶斯思维的日常应用更多是一种心态而非计算。
习惯一:任何时候形成判断,先问自己“先验是什么”。 在你听到任何新信息之前,关于这件事,基础概率是多少?大多数创业成功吗?大多数投资跑赢市场吗?大多数人确诊某种罕见病吗?从基础概率出发,而不是从故事出发。
习惯二:遇到新证据时,问“这条证据有多强”。 不是所有信息的权重相同。一个朋友告诉你“听说那家公司不行了”和你亲眼看到这家公司连续三年收入下滑,信息量完全不同。前者是弱信号,后者是强信号。用信号强度来校准你的更新幅度。
习惯三:用概率而非二元方式持有信念。 不要说“我认为这家公司好/不好”,而是说“我对这家公司有竞争优势的信心是70%”。这种表述方式让你天然地为新证据留出了更新的空间。如果你说“我确信它好”,改变立场就变成了自我否定;如果你说“我70%相信它好”,调整到60%或80%就只是正常的认知更新。
习惯四:设定预先更新规则。 在做投资决策之前写下:如果发生A(比如连续两个季度收入下滑),我将把信心从70%调到50%以下并减持。如果发生B(比如主要竞争对手退出市场),我将把信心从70%调到85%并加仓。这些预设规则是对抗情绪化决策的最好武器。
从概率到智慧
贝叶斯定理在技术上是一个250多年前的数学公式。但它的深层含义远超数学——它描述了理性思维的本质形态:始终持有可修正的暂时性信念,根据证据的质量和强度按比例调整,既不顽固地拒绝更新,也不轻率地全盘推翻。
芒格的整个智慧体系,某种程度上就是这个定理的活体示范。他读了一辈子的书,每一本书都是新证据。他经历了无数次投资决策,每一次结果都是对先验的校准。他承认自己的判断在不断演化——早年他是纯粹的格雷厄姆价值投资者,后来在芒格的影响下转向“好价格买好公司”,再后来他投资了苹果这种科技公司。这不是“善变”,这是贝叶斯更新在一个人一生中的展开。
而那些失败的投资者呢?他们的共同特征是贝叶斯更新的失败——要么死守先验拒绝更新(“我不管市场怎么变,我的分析是对的”),要么没有先验随波逐流(“专家说什么我就信什么”),要么对弱证据过度反应(“股价跌了两天,快跑”)。
学会像贝叶斯主义者那样思考,不会让你永远正确——世界太复杂了,不存在这种保证。但它会让你错得越来越少,对得越来越多。 因为你的信念不是僵死的城墙,而是一条活的河流——不断流入新证据,不断冲刷旧偏见,逐渐逼近现实的轮廓。
芒格相关原话
“The right way to think is the way Zeckhauser plays bridge. It's just that simple.”
“正确的思维方式就是泽克豪泽打桥牌的方式。就这么简单。”
“Mimicking the herd invites regression to the mean.”
“模仿羊群只会让你回归平庸。”(暗含意思:应该根据自己的贝叶斯分析行事,而非跟随大众的先验。)
“The idea of a base rate is fundamental. If you don't consider base rates, you're going to make terrible mistakes.”
“基础概率的概念是根本性的。如果你不考虑基础概率,你会犯可怕的错误。”
关联模型
实践检查清单
形成判断时:
- □我是否考虑了基础概率?这类事件/投资/诊断的总体成功率/发生率是多少?
- □我的先验判断基于什么?是多个独立来源汇聚的分析,还是单一来源的故事?
- □我是否把信念表述为概率(“我有X%的信心”)而非确定性(“我确信”)?
处理新信息时:
- □这条信息的来源有多可靠?是第一手数据还是转述?
- □这条信息有多出乎意料?越出乎意料的信息,更新幅度应该越大
- □我是否因为信息的情感冲击力而过度反应?一条生动的故事不等于一条高权重的证据
- □我是否因为信息与我现有信念矛盾而本能地抗拒?
防止贝叶斯失败时:
- □我是否预设了“更新触发条件”——如果发生X,我就调整判断至少Y个百分点?
- □我是否定期复盘自己的概率估计与实际结果的偏差?
- □面对“检测阳性”类的情境(医疗、安全、风控),我是否先问了“基础发生率是多少”?
延伸阅读
- Sharon Bertsch McGrayne,《The Theory That Would Not Die》— 贝叶斯定理250年曲折历史的精彩叙述
- Nate Silver,《The Signal and the Noise》— 将贝叶斯思维应用于预测的实践指南
- Daniel Kahneman,《Thinking, Fast and Slow》第14-16章 — 人类忽略基础概率的心理机制
- Peter Bevelin,《Seeking Wisdom: From Darwin to Munger》— 芒格思维体系中概率推理的角色
- Eliezer Yudkowsky, “An Intuitive Explanation of Bayes' Theorem” — 网上最好的贝叶斯入门文章之一