大数定律

# 大数定律

Law of Large Numbers

2020年春天，一位基金经理登上了金融媒体的头条。他管理的对冲基金在新冠暴跌中逆势做多，三个月内净值翻了将近三倍。财经记者争相采访，投资者蜂拥而至，管理资产从几千万飙升到十几亿美元。

两年后，这只基金清盘了。亏掉了大部分投资者的钱。

这位基金经理是骗子吗？不一定。他可能确实聪明，确实勤奋，确实有某种投资洞见。但有一个更简单的解释可以涵盖他的成功和失败：在足够短的时间窗口内，运气和能力几乎无法区分。

这就是大数定律要告诉你的事。

§ 01

硬币、赌场和你的直觉

让我们从最简单的场景开始。

你抛一枚公平的硬币。抛10次，出现7次正面、3次反面。你会觉得这枚硬币有问题吗？大概不会——10次太少了，7:3的比例虽然偏离50%，但也没什么好大惊小怪的。

但如果你抛了10000次，出现7000次正面、3000次反面呢？你几乎可以确定这枚硬币有问题。因为在10000次试验中，纯粹靠运气偏离到70%正面的概率小到可以忽略。

这就是大数定律的核心：随着试验次数增加，样本的平均结果会越来越接近真实的期望值（总体均值）。 样本越大，随机波动的影响越小，真实规律越清晰地浮现。

反过来说：样本越小，随机波动越主导结果，你看到的“规律”越可能是幻觉。

用更直觉的方式理解：大数定律说的是，真相需要足够多的数据才能显形。数据太少的时候，噪声会伪装成信号，运气会伪装成能力，巧合会伪装成因果。

赌场老板比大多数人都更深刻地理解这个定理。

拉斯维加斯的每一台老虎机、每一张赌桌，都被精心设计过，赌场在每一局中只有微小的优势——通常在2%到5%之间。这意味着在任意一手牌、一次旋转中，赌客完全可能赢。事实上赌客经常赢——如果他们不偶尔赢，就没人会去赌了。

但赌场一点都不担心。因为它知道大数定律站在自己这边。

一个赌客可能在一个晚上赢走十万美元。但赌场每天有成千上万个赌客、数百万次下注。在这个规模下，2%的优势会被大数定律“兑现”为几乎确定性的利润。单次下注的结果是随机的，但百万次下注的总结果几乎是确定的。

赌场卖的不是“赢”，而是“希望”。它把短期的随机性卖给赌客（让他们体验到赢的快感），自己留下长期的确定性（大数定律保证的统计优势）。

这也是为什么赌场最害怕的不是运气好的赌客，而是“优势赌客”——那些真正改变了概率本身的人，比如算牌的21点玩家。因为如果概率优势翻转了，大数定律同样会无情地为对方工作。

§ 02

为什么你不能从三个季度判断一个CEO

让我们把硬币换成一个真实的商业问题。

一家公司换了新CEO。三个季度过去了，收入增长了15%，利润率提高了两个百分点。董事会很满意，媒体开始吹捧“新CEO的魔力”。投资者纷纷买入。

芒格会怎么看？他大概率会说：“三个季度的数据几乎什么都说明不了。”

为什么？因为CEO的业绩是一个“信号+噪声”的混合体。信号是CEO的真实能力——战略眼光、执行力、资本配置能力。噪声则包括：宏观经济的顺风或逆风、行业周期的自然波动、前任CEO遗留项目的延迟效果、汇率变动、一次性收入或支出，等等等等。

三个季度的时间里，噪声的幅度可能远大于信号。一个平庸的CEO碰上顺风行业，业绩可以看起来非常漂亮。一个优秀的CEO碰上行业寒冬，业绩可能一塌糊涂。你需要足够多的“试验次数”——足够多的季度、足够多的商业周期——才能让信号从噪声中浮现出来。

具体需要多少？没有精确答案，但大致的经验法则是：至少需要经历一个完整的行业周期（通常5-10年），最好还包括至少一次重大逆境。因为真正的能力不是在顺风中冲浪，而是在逆风中保持航向。

芒格和巴菲特评估管理层时，几乎从不看短期业绩。他们看的是十年、二十年的轨迹——在这个时间尺度上，大数定律开始生效，运气的成分被稀释，能力的轮廓逐渐清晰。

巴菲特有句名言完美地概括了这一点：

“Only when the tide goes out do you discover who's been swimming naked.”
“只有退潮的时候，你才能发现谁在裸泳。”

退潮就是大数定律的朋友——它增加了“试验”的多样性，让那些仅仅靠运气支撑的表现暴露原形。

§ 03

投资业绩的随机性：一个令人不安的真相

这个问题值得单独展开，因为它对每一个投资者都至关重要。

假设有1000位基金经理，他们的真实能力完全相同——都和市场平均水平持平，没有任何超额收益能力。换句话说，他们的投资结果完全由随机波动决定。

在第一年结束时，大约有500位经理跑赢了市场，500位跑输了。

在连续跑赢市场五年的，大概有多少位？简单的概率计算：(1/2)^5 x 1000 = 大约31位。

31位基金经理，连续五年跑赢市场，纯粹靠运气。

如果你是一个不了解大数定律的投资者，你会看到这31个人的业绩记录，你会看到他们在财经媒体上的采访，你会听到他们头头是道的投资哲学——然后你会把钱交给他们。毕竟，连续五年跑赢市场，这不可能是运气吧？

但大数定律告诉你：在足够大的基金经理群体中，这种“连续成功”的出现几乎是必然的，即使每个人都只是在掷硬币。

这并不意味着所有优秀的投资业绩都是运气。巴菲特连续几十年跑赢市场，大数定律恰恰站在“这不是运气”这一边——几十年的样本量足够大，随机波动不可能解释如此持久的超额收益。但三年、五年的业绩？它的信息含量比大多数人以为的要低得多。

投资作家纳西姆·塔勒布（Nassim Taleb）在《随机致富的傻瓜》中讲了一个思想实验：如果把10000只猴子放在打字机前随机敲键盘，其中大概率会有一只敲出一首莎士比亚的十四行诗。你会因此认为那只猴子是文学天才吗？

在投资领域，我们每天都在犯这个错误——把打字机前的幸运猴子当成莎士比亚。

§ 04

小数定律：大数定律的邪恶双胞胎

心理学家卡尼曼和特沃斯基发现了一个深刻的人类认知偏差，他们戏称为“小数定律的信仰”（belief in the Law of Small Numbers）。意思是：人们本能地以为小样本也服从大数定律——小样本也应该反映总体规律。

但事实恰恰相反。小样本的最大特征就是不可靠。

经典案例：肾癌的发病率在美国各县之间差异巨大。发病率最高的县集中在中西部和南部的农村地区——人口稀少、传统上较贫困。一个自然的解释浮现了：是不是因为贫困、缺乏医疗、生活方式不健康？

但如果你再看一眼数据，你会发现发病率最低的县也集中在中西部和南部的农村地区——人口稀少的小县。

同样的地方既有最高的发病率又有最低的发病率？这用任何实质性的解释都说不通。唯一的解释是统计学的：小县的人口太少，样本量太小，随机波动就是大。 一个1000人的县如果碰巧有3个肾癌患者，发病率就是0.3%（远高于全国平均）。如果碰巧只有0个，发病率就是0%（远低于全国平均）。这不反映任何真实的健康差异，只反映了小样本的随机性。

芒格把这种思维错误和投资联系起来：

人们看到一只股票连涨三天就说“涨趋势确立了”，看到一个行业三个月表现好就说“风口来了”，看到一位分析师连续猜对两次就说“大神”。这些都是小数定律的信仰在作祟——从微不足道的样本中，提取出根本不存在的“规律”。

§ 05

赌徒谬误和热手谬误：两种对称的错误

大数定律还和两种著名的认知偏差密切相关。

赌徒谬误（Gambler's Fallacy）： 轮盘赌连续出了八次红色，下一次该出黑色了吧？

不。轮盘没有记忆。下一次出红色和出黑色的概率和前八次完全无关。大数定律说的是“在无限次试验后，红色和黑色的比例会趋近50:50”，但它从未说过“短期内的偏差一定会被纠正”。大数定律通过增加新的试验来稀释偏差，而不是通过让后续结果“补偿”前面的偏差。

用一个形象的说法：如果抛100次硬币，前10次出了8次正面，大数定律不是说后90次要多出反面来“补偿”。它说的是后面还有90次试验，这90次的正常结果会让8:2这个偏差在100次的总样本中被“稀释”到不显著。

1913年，蒙特卡洛赌场的一张轮盘连续出了26次黑色。赌客们在第15次左右就开始疯狂押红色——“不可能再出黑色了！”——然后一个接一个地输光了钱。赌场那一晚赚了数百万法郎。这个事件如此著名，以至于赌徒谬误有时也被称为“蒙特卡洛谬误”。

热手谬误（Hot Hand Fallacy）： 一个篮球运动员连续投中了五个球，他“手感来了”，下一球也更可能命中？

这个问题比赌徒谬误复杂得多。1985年的经典研究（Gilovich, Vallone & Tversky）发现，NBA球员的连续命中在统计上和随机序列没有显著区别——所谓的“热手”是观众和解说员脑补出来的模式。不过后续研究对此有争议，有些学者用更大的数据集发现了微弱的热手效应。

但无论热手是否真实存在，核心教训是一样的：人类的模式识别本能会在随机数据中“看到”并不存在的趋势。 这是大数定律的对立面——大脑拒绝接受“这就是随机的，没有意义”这个解释，因为寻找模式是我们祖先在非洲草原上活下来的关键能力。灌木丛中的沙沙声可能是风，也可能是豹子——把风误判为豹子代价很小，把豹子误判为风则致命。于是我们进化出了一台“模式发现机器”，它宁可看到不存在的模式，也不愿错过真实的模式。

在投资中，这台机器是你最危险的敌人之一。

§ 06

大数定律的边界在哪里

边界一：大数定律需要独立同分布。 严格来说，大数定律要求每次试验是独立的、来自同一概率分布的。但现实世界很少满足这个条件。股票市场的回报不是独立的（有波动聚集效应），也不是同分布的（2008年和2018年的市场环境完全不同）。在这种情况下，大数定律仍然是有用的指导原则，但你需要更加审慎地定义“样本”和“总体”。

边界二：大数定律不适用于一次性事件。 你只结一次婚、只选一次大学、只活一辈子。这些决策没有“大量重复试验”的空间。大数定律在这里的意义不是直接适用，而是提醒你：对于不可重复的重要决策，你不能依赖概率的长期均值来保护自己——你必须格外关注单次结果的分布和最坏情况。 这和安全边际的逻辑直接相连。

边界三：大数定律对极端分布失效。 如果底层分布是“肥尾”的——即极端事件发生的概率远高于正态分布的预测——那么你可能需要远比直觉告诉你的更大的样本量，才能让均值稳定下来。塔勒布称之为“黑天鹅”问题。一只火鸡被喂了1000天，它的“大数定律”告诉它“每天都被喂食”是真理。第1001天是感恩节。

§ 07

如何在日常中使用大数定律思维

第一，对小样本保持怀疑。 任何时候有人给你看一个基于少量数据的“趋势”或“规律”，你的第一个问题应该是：样本有多大？三个月的业绩、五个客户的反馈、两次实验的结果——这些几乎什么都证明不了。不是说它们一定错，而是说你应该给它们非常低的证据权重。

第二，增加样本量，或者等。 如果你在评估一个基金经理，不要看三年的业绩，至少看十年的，而且要包含不同的市场环境。如果你在评估一种商业策略，不要根据一次试点就全面推广，多做几次测试。如果你在评估自己的投资能力，至少追踪五年以上的记录再下结论。

第三，永远问“这可能只是随机波动吗”。 当你看到一个看似有意义的结果时，在寻找因果解释之前，先考虑一个最无聊的假设：这是不是就是正常的随机波动？只有在你可以排除这个假设之后，才值得去寻找更深层的解释。

第四，利用大数定律为自己服务。 如果你知道自己有正的期望值——比如你的投资策略长期来看有微弱的优势——那么大数定律告诉你：坚持足够长的时间，优势就会兑现为实际利润。这是一种深层的耐心。赌场从不着急，因为它知道大数定律会为它工作。如果你的“赌场优势”是扎实的分析和纪律，你也不需要着急。

§ 08

耐心是一种数学美德

让我们回到开头那位三个月翻了三倍的基金经理。

他的失败不一定证明他是个骗子或庸才。但他的成功也几乎不能证明他是天才。三个月、一次事件、一个方向性的押注——这是大数定律最不起作用的领域。在如此小的样本中，运气的噪声完全压过了能力的信号。

真正令人敬畏的投资业绩不是短期的爆发，而是长期的坚持。巴菲特的年化回报率大约是20%——这个数字在任何单一年份都不算惊人，很多人在某一年能做得更好。但他坚持了超过50年。在50年的样本量面前，大数定律给出了近乎确定性的裁决：这不是运气。

芒格在这方面的态度一以贯之。他从不追求短期的戏剧性回报。他追求的是微弱但可持续的优势——正确的思维方式、正确的信息来源、正确的心态——然后让大数定律在足够长的时间里把这些微弱优势兑现为巨大的复利。

某种意义上，大数定律的终极启示是一种伦理教导：不要追求侥幸，不要被短期结果诱惑或吓倒，专注于做大概率正确的事，然后给时间以时间。

耐心不只是一种品格美德。它是一种数学美德。

§ 09

芒格相关原话

“In the short run the market is a voting machine, but in the long run it is a weighing machine.”
“短期来看，市场是投票机；长期来看，市场是称重机。”——格雷厄姆（芒格多次引用）

这句话本质上就是大数定律的股市版本：短期价格由情绪投票决定（小样本的噪声），长期价格由企业价值的实际重量决定（大样本下的均值回归）。

“It is remarkable how much long-term advantage people like us have gotten by trying to be consistently not stupid, instead of trying to be very intelligent.”
“像我们这样的人，通过持续地避免愚蠢而非试图变得非常聪明，获得了多么大的长期优势，这真是令人惊叹。”

持续避免愚蠢 = 每一次决策的期望值微正。大数定律做剩下的事。

§ 10

关联模型

贝叶斯定理 — 先验概率的可靠性取决于支持它的样本量
决策树理论 — 决策树中的概率估计在大样本下更可靠
回归均值 — 大数定律的直接推论：极端表现倾向于回归平均水平
复利效应 — 大数定律保证了微弱但持续的优势会在长期中指数放大
安全边际 — 对于不可重复的单次决策，大数定律无法保护你，安全边际是替代方案
自视过高的倾向 — 人们把小样本中的好运归因于自己的能力
社会认同倾向 — 大众容易被短期业绩的“明星”带偏
奖励和惩罚超级反应倾向 — 短期业绩激励机制与大数定律的要求直接冲突

§ 11

实践检查清单

评估他人或事物时：

□这个结论基于多大的样本？三个数据点和三百个数据点的可靠性天差地别
□有没有可能这只是随机波动？在寻找因果解释之前，先排除“纯噪声”假设
□这个“优秀业绩”经历了多少种不同的市场环境？只在牛市中表现好不算数
□是不是“幸存者偏差”？你只看到了成功案例，而忽略了同期失败的大量案例

评估自己时：

□我最近的成功中有多少是能力、多少是运气？诚实地估计
□我的投资记录是否覆盖了足够长的时间和足够多样的市场环境？
□我是否在小样本的成功后变得过度自信？

做决策时：

□如果我有正的期望值，我是否有耐心让大数定律生效？还是在追求短期的戏剧性结果？
□如果这是一次不可重复的重要决策（没有“大样本”的保护），我是否为最坏情况留了足够的安全边际？
□在评估一个新策略/产品/投资之前，我是否设定了“最少需要多少数据才下结论”的标准？

§ 12