# 幸存者偏差 (Survivorship Bias)
Survivorship Bias
1943年,美国军方面临一个紧迫的问题:怎样给轰炸机加装甲才能最大程度地提高生还率?
他们收集了大量返航飞机的数据,发现弹孔主要集中在机翼和机身中部。结论似乎显而易见:应该在弹孔密集的区域加装甲板——那里是最容易被击中的地方。
军方把数据交给了哥伦比亚大学统计研究组的亚伯拉罕·瓦尔德(Abraham Wald)。瓦尔德看了数据,给出了一个与军方直觉完全相反的建议:不要在弹孔密集的地方加装甲——要在没有弹孔的地方加装甲。
他的推理无懈可击。军方看到的是返航的飞机——它们被击中了机翼和机身中部,但依然飞回来了。这说明这些部位被击中后飞机还能存活。真正的问题是:那些没有飞回来的飞机被击中了哪里?答案是:被击中了驾驶舱和发动机——那些在返航飞机上看不到弹孔的部位。因为被击中这些部位的飞机已经坠毁了,永远不会出现在你的数据样本里。
军方犯的错误是:他们只研究了“幸存者”——那些安全返航的飞机。而他们忽视了“死亡者”——那些永远不会出现在停机坪上的坠毁飞机。他们看到的数据不是“飞机容易在哪里被击中”的完整图景,而是“飞机被击中哪里之后还能活下来”的片面图景。
瓦尔德的洞察后来成为统计学史上最经典的故事之一。而它揭示的思维陷阱——幸存者偏差——是人类认知中最普遍、最隐蔽、后果最严重的偏差之一。
芒格对这个概念有深刻的理解。他用一种更直白的方式表达了同样的洞察:
“去墓地看看。”
意思是:如果你只看到站在你面前的成功者,你就永远无法理解真实的成功概率。你必须去看那些失败了的、消失了的、死去了的——他们才是多数人的命运。
沉默的数据
幸存者偏差的一句话定义:由于只观察到了通过某种选择过程后存活下来的样本(“幸存者”),而忽略了被淘汰的样本(“失败者”),从而对整体情况做出了系统性的、过度乐观的错误判断。
这个定义中有三个关键词。
第一个是“选择过程”。幸存者偏差之所以发生,前提是存在某种筛选机制——市场竞争淘汰了大多数企业、战争击落了部分飞机、时间抹去了大多数书籍和理论。这种筛选不是随机的——它系统性地消除了某类样本(弱者、失败者、不幸者),留下了另一类样本(强者、成功者、幸运者)。
第二个是“只观察到幸存者”。这不是因为你故意忽略失败者——在很多情况下,失败者根本不在你的视野中。他们已经破产了、退市了、消失了、死了。你看不到他们,不是因为你不想看,而是因为他们已经不存在了。这就是幸存者偏差特别阴险的地方:它不是在你的数据中制造了一个你可以识别的“空洞”——它让你根本不知道存在一个空洞。
第三个是“系统性的过度乐观”。幸存者偏差不是让你的判断随机偏离——它让你的判断系统性地偏向乐观方向。因为你看到的全是“成功的案例”(幸存者),你会不自觉地高估成功的概率、高估某种策略的有效性、高估自己做到同样事情的可能性。
这三个特征组合在一起,让幸存者偏差成为一种几乎不可能被直觉识别的错误。你的样本看起来很“完整”——停机坪上有大量返航的飞机,书店里有大量成功企业的传记,基金排行榜上有大量业绩优异的基金。但你看到的“完整”是幻觉。真正完整的数据集包含了你永远看不到的那部分——坠毁的飞机、倒闭的企业、关闭的基金。
成功学的致命幻觉
如果你想找一个幸存者偏差在日常生活中最广泛、最具破坏性的应用,看看你家书架上(或者畅销书榜单上)那些“成功学”书籍。
一本典型的商业畅销书是这样写成的:作者选取了10家“伟大的企业”(通常是在某段时期内表现最好的公司),然后分析它们的“共同特质”——强烈的企业文化、远见卓识的领导者、客户至上的理念、持续创新的精神。结论是:如果你的企业也具备这些特质,你也能成为伟大的企业。
这个逻辑看起来无懈可击,但实际上充满了幸存者偏差。
问题在于:那些失败的企业呢?那些同样有“强烈的企业文化”但在市场竞争中被淘汰的企业呢?那些同样有“远见卓识的领导者”但做出了灾难性赌注的企业呢?那些同样“客户至上”但因为技术颠覆而消亡的企业呢?它们不在你的样本里——因为它们已经死了。
吉姆·柯林斯(Jim Collins)的《从优秀到卓越》(Good to Great)是这类书中最有影响力的一本。他选出了11家“从优秀到卓越”的公司,分析了它们的成功要素。然而,这11家公司中,电路城(Circuit City)在2009年破产,房利美(Fannie Mae)在2008年金融危机中被政府接管。这些“卓越”公司后来的命运,生动地说明了幸存者偏差的核心问题:你在观察成功者的时刻选取了样本,然后把他们当时的特征归因为“成功的原因”——但那些特征可能和成功没有因果关系,甚至可能和后来的失败有关。
更根本的问题是方法论上的。假设有1000家企业都具备“强烈的企业文化”和“远见卓识的领导者”。其中10家成功了,990家失败了。成功学作者看到了那10家,写了一本书说“这些特质导致了成功”。但如果990家具备同样特质的企业失败了,那么这些特质显然不是成功的充分条件——它们甚至可能不是重要条件。成功可能更多地取决于运气、时机、或者某些作者根本没有关注的因素。
芒格对这种“从结果倒推原因”的方法论深恶痛绝。他曾讽刺地说过,如果你让足够多的猴子扔飞镖来选股票,其中必然有几只猴子的业绩会超过巴菲特。然后你可以为这些猴子写一本传记——《从猴子到股神:伟大投资者的七个习惯》。
基金业绩的统计魔术
如果成功学书籍是幸存者偏差的“文艺版”,那么基金业绩排行榜就是它的“金融版”——而且这个版本涉及真金白银。
一个简单的问题:过去十年业绩排名前10%的基金,真的比其他基金更有能力吗?
答案远比你想象的更令人沮丧。
首先是“消失的基金”问题。在任何十年期间,都有大量基金因为业绩太差而被关闭或合并到其他基金中。当一只基金被关闭时,它的历史业绩通常会从数据库中消失——就像那些坠毁的飞机从停机坪上消失一样。这意味着你在基金数据库中看到的“过去十年的平均回报率”,只包含了那些活下来的基金——而活下来的基金,平均而言,恰恰是业绩较好的那些。
这个效应有多大?学术研究给出了令人震惊的数字。马克·卡哈特(Mark Carhart)在他1997年的经典论文中估算,幸存者偏差每年大约让基金行业的平均业绩数据高估1个百分点。听起来不多?复利计算一下:在20年的投资期限中,1%的年化偏差意味着你对实际回报的高估超过了20%。你以为某类基金20年平均回报是200%,实际上可能只有160%。
其次是“基金公司的选择性展示”问题。一家大型基金公司同时运营几十只基金。十年后,总有几只基金碰巧业绩出色。基金公司会大力推广这几只“明星基金”的业绩,同时悄悄关闭那些业绩惨淡的基金。你在广告中看到的“我们的旗舰基金过去十年跑赢市场50%”,是经过幸存者偏差“筛选”后的结果——那些没能跑赢市场的兄弟基金,你永远不会在广告中看到。
芒格对基金行业的这种统计魔术有极其尖锐的批评。他在多次演讲中指出,大部分主动管理基金在扣除费用后跑不赢指数基金,而行业展示的业绩数据因为幸存者偏差被系统性地美化了。他的结论是:对于大多数投资者来说,低成本的指数基金是最诚实、最不受幸存者偏差污染的选择。
反直觉与边界
幸存者偏差不等于“成功纯粹是运气”。 识别幸存者偏差不意味着否定能力、努力和战略的价值。巴菲特和芒格的长期业绩不能简单归因于“幸存者偏差”——他们的回报在统计上远远超出了运气能解释的范围。幸存者偏差要提醒你的不是“成功都是假的”,而是“从成功案例中总结的规律可能不可靠”。差别在于:承认芒格是优秀投资者,和相信“模仿芒格的方法就能成为优秀投资者”,是两回事。后者忽略了大量用类似方法但失败了的人。
反转幸存者偏差:从失败中学习。 芒格反复强调“反过来想”(invert, always invert)。在幸存者偏差的语境中,反转意味着:与其研究成功者做对了什么,不如研究失败者做错了什么。失败的模式通常比成功的模式更稳定、更可预测、更有学习价值。你很难总结出一套“必然成功”的配方(因为成功涉及太多不可控因素),但你可以总结出一套“必然失败”的模式(过度杠杆、忽视风险、盲目扩张),然后避免它们。芒格说的“我只想知道我会死在哪里,然后永远不去那里”就是这个逻辑。
与概率思维与期望值的关系。 幸存者偏差的核心问题是扭曲了你对基础概率(base rate)的估计。你看到了10个成功的创业者,以为创业成功率是“相当高的”——但如果你能看到那10000个失败的创业者,你对基础概率的估计会截然不同。芒格在评估任何投资机会时,总是从基础概率出发——“在这个行业中,一家新公司十年后还存活的概率是多少?”——而不是从几个成功案例出发。
与社会认同倾向的叠加。 幸存者偏差和社会认同可以形成致命的组合。当你看到身边越来越多的人在某个领域“成功”时(比如2021年的加密货币热潮),你会觉得成功的概率很高——但你看到的“成功者”本身就是被幸存者偏差筛选过的样本。那些亏了钱的人不会在社交媒体上晒账户,不会在聚会上谈论自己的投资。你看到的是一个经过双重过滤的世界:幸存者偏差过滤掉了失败者,社会认同放大了成功者的声音。
医学中的幸存者偏差。 一个常被忽视但后果严重的领域。当人们说“我爷爷抽了一辈子烟活到90岁”时,他们犯的就是幸存者偏差——他们没有看到那些抽了一辈子烟但在60岁就死于肺癌的人,因为那些人已经不在了,不会在聚会上讲述自己的故事。对个别“幸存者”的观察,不能推翻大规模流行病学研究得出的统计结论。
如何在实践中对抗幸存者偏差
第一步:问“墓地在哪里”。 每当你看到一组“成功案例”时,问自己:那些失败的案例在哪里?它们有多少?它们和成功案例有什么不同?如果你找不到失败案例的数据——这本身就是一个危险信号,说明你正在被幸存者偏差影响。
第二步:用基础概率校准直觉。 在做任何涉及概率判断的决策之前,先查找基础概率数据。创业成功率是多少?新药通过临床试验的概率是多少?一只主动管理基金连续跑赢市场十年的概率是多少?这些冰冷的数字比任何个案故事都更能帮助你做出理性判断。
第三步:主动寻找“反面样本”。 如果你在研究一个成功的商业模式,花同样多的时间去研究使用同样模式但失败的企业。如果你在考虑一种投资策略,去找那些使用同样策略但亏损的案例。反面样本不一定容易找到(它们往往已经消失了),但寻找的过程本身就会让你更清醒。
第四步:警惕“幸存者讲的故事”。 成功者倾向于把自己的成功归因于能力和方法,而淡化运气和时机的作用。这不是因为他们在撒谎——而是因为他们也受到幸存者偏差的影响。他们不知道那些和自己做了同样事情但失败了的人,所以他们真诚地相信自己的方法是“成功的关键”。听他们的故事可以获得启发,但不要把它们当作可复制的配方。
第五步:在数据分析中主动补偿。 如果你在分析投资业绩、商业案例或任何涉及历史数据的问题,明确检查:你的数据集是否包含了那些“已经退出”的样本?如果不包含,你的结论就需要打一个很大的折扣。
去墓地看看
让我用芒格的智慧来收束。
古罗马时代,西塞罗记载了一个故事。有人带一位无神论者去神庙,指着墙上挂满的还愿牌匾说:“你看,这些都是向神祈祷后获救的水手献上的。这难道不能证明神的力量吗?”
无神论者回答:“那些祈祷之后还是淹死了的水手的牌匾,挂在哪里?”
这个两千多年前的故事,是幸存者偏差最古老的表述。
芒格把这个逻辑带入了现代投资和商业的语境。他说,如果你只参加成功人士的晚宴,你会觉得世界上的每一笔投资都赚了钱。你需要去“墓地”看看——去看那些破产的公司、爆仓的投资者、关闭的基金、失败的创业者。不是为了悲观,而是为了获得真实的概率感知。
我们生活在一个由幸存者书写的世界里。历史书记录的是胜利者的故事,商业杂志报道的是成功者的方法论,社交媒体展示的是别人生活的高光时刻。在这个高度筛选过的信息环境中,保持对“看不见的失败者”的觉察,是一种珍贵的认知纪律。
芒格一辈子都在实践这种纪律。他不是从成功案例中寻找“成功公式”,而是从失败案例中识别“失败模式”。他不是问“怎样才能成功”,而是问“怎样一定会失败,然后避免它”。
这种思维方式之所以有效,正是因为失败的模式比成功的模式更不受幸存者偏差的污染。成功者可能是因为一百种不同的原因成功的(其中很多是运气),但失败者通常是因为少数几种可预测的原因失败的。研究墓地,比研究领奖台更有用。
思想家原话
“The idea of caring about the whole sample and not just the survivors is central to good thinking.”
“关注整个样本而非仅仅关注幸存者,这个理念是良好思维的核心。”
— Charlie Munger
“I just want to know where I'm going to die, so I'll never go there.”
“我只想知道我会死在哪里,然后永远不去那里。”
— Charlie Munger (paraphrasing an old saying, applying inverse thinking to survivorship bias)
“Where are the customers' yachts?”
“客户的游艇在哪里?”
— Fred Schwed (a question Munger loved, exposing survivorship bias in the financial industry)
“The cemetery of failed businesses is full of companies that had great cultures, great leaders, and great strategies.”
“失败企业的墓地里,满是拥有优秀文化、伟大领袖和卓越战略的公司。”
— 芒格式的推论(基于其多次演讲中对幸存者偏差的讨论)
关联模型
实践检查清单
投资决策时:
- □我看到的业绩数据是否包含了那些已经关闭或合并的基金?如果不包含,数据被美化了
- □我是否因为看到几个“成功案例”就高估了某种投资策略的成功率?基础概率是多少?
- □在评估一个行业或赛道时,我是否只研究了头部企业?那些失败的竞争者告诉我们什么?
- □芒格测试:如果我去“墓地”看看——那些用同样方法但失败的投资者——我还会这么乐观吗?
商业决策时:
- □我是否在从“成功企业的共同特质”中总结规律?那些具备同样特质但失败的企业有多少?
- □我是否被某个“成功模式”吸引?在采用之前,去研究所有尝试过这个模式的企业,包括失败者
- □在制定战略时,我是否更多地在想“怎样成功”而不是“怎样避免失败”?反转思维更可靠
信息消费时:
- □这本书/这篇文章/这个演讲的结论是否基于“幸存者样本”?作者是否考虑了失败案例?
- □我在社交媒体上看到的“别人的成功”是否经过了双重筛选(幸存者偏差+选择性展示)?
- □当有人用个案来反驳统计结论时(“我爷爷抽烟活到90”),我是否能识别这是幸存者偏差?
- □去墓地测试:对于任何让我觉得“成功概率很高”的判断,我是否检查了失败案例的数量?
延伸阅读
- Nassim Taleb,《Fooled by Randomness》——对幸存者偏差在金融领域的深入分析,特别是对“幸运的傻瓜”现象的精彩讨论
- Nassim Taleb,《The Black Swan》——扩展了幸存者偏差的讨论,引入了“沉默的证据”(silent evidence)概念
- Philip Tetlock,《Superforecasting》——基础概率思维如何帮助对抗幸存者偏差
- Abraham Wald的统计分析——Jordan Ellenberg在《How Not to Be Wrong》中有对瓦尔德飞机装甲故事的精彩叙述
- Mark Carhart, “On Persistence in Mutual Fund Performance”(1997)——基金行业幸存者偏差的量化研究
- 《穷查理宝典》——芒格关于“反转思维”和“去墓地看看”的多次讨论
- Peter Bevelin,《Seeking Wisdom: From Darwin to Munger》——芒格心理学框架中幸存者偏差的定位