回归均值

# 回归均值

Regression to the Mean

1980年代初，美国职业橄榄球联盟出现了一个令人困惑的现象。

每年都有那么几支球队表现得异常出色，赢得远超预期的比赛场次。球迷们欣喜若狂，评论员们分析出一套又一套的“成功秘诀”——新教练的战术革命、球员的化学反应、更衣室文化的蜕变。赛季结束时，这些球队被各种体育杂志评为“年度最佳”，登上封面，成为众人追捧的对象。

然后下一个赛季开始了。那些封面球队中的大多数，表现显著下滑。

球迷们愤怒了。评论员们又开始分析：球员骄傲自满了、教练被成功冲昏了头脑、球队管理层做出了错误的人事决定。一切看起来都有因有果、有理有据。

但有一个更简单、更深刻、也更令人不安的解释：那支球队上个赛季的表现中，有很大一部分是运气——伤病的幸运避免、关键比赛中几个幸运的判罚、几个偶然因素碰巧同时朝有利方向倒——而运气不会持续。当运气消退时，表现自然回落到更接近真实水平的地方。

这就是回归均值。

它不是命运的惩罚，不是成功的诅咒，不是任何神秘力量的作用。它是一个纯粹的统计事实：任何包含随机成分的极端结果，在下一次观测中都倾向于靠近长期平均值。

§ 01

高尔顿的发现：身高不会无限极端

回归均值最早被系统地识别出来，是在一个你可能想不到的领域——遗传学。

1886年，弗朗西斯·高尔顿（Francis Galton）研究了928对父母及其成年子女的身高数据。他发现了一个看似矛盾的现象：

特别高的父母，他们的孩子平均来说仍然高于常人，但没有父母那么高。特别矮的父母，他们的孩子平均来说仍然矮于常人，但没有父母那么矮。

换句话说，子女的身高“回归”向了总体的平均值。

高尔顿最初把这个现象叫做“向平庸的回归”（regression toward mediocrity）。这就是统计学中“回归”（regression）这个术语的词源——它最初的意思不是“回归分析”的那种技术含义，而是字面意义上的“退回到平均”。

这个发现初看之下令人困惑。如果高个子的后代总是比父母矮一些，矮个子的后代总是比父母高一些，那么按照这个趋势，人类的身高不应该最终收敛到一个点吗？所有人都变成一样高？

不会。因为回归均值只描述了条件期望——给定父母是极端值，子女的期望值更接近均值。但身高的整体分布并没有在缩窄。每一代中，都有一些人因为遗传和环境因素的幸运组合而成为新的极端值。分布的形状保持稳定，但具体哪些家庭处于极端位置在不断洗牌。

这就像大海的波浪。每一个具体的浪头终将落下（回归均值），但大海永远不会变成平静的水面（分布不会消失）。

§ 02

为什么你会被回归均值骗到

回归均值之所以是一个如此强大的思维工具，是因为人类大脑有一种根深蒂固的倾向：为每一个变化寻找因果解释，即使那个变化纯粹是统计性的。

丹尼尔·卡尼曼在《思考，快与慢》中讲述了一个改变了他学术生涯的故事。

1960年代，卡尼曼在以色列空军教授飞行教官心理学课程。他向教官们讲解了正强化（表扬好表现）比负强化（批评差表现）更有效的心理学研究结论。一位资深教官站起来反驳：

“教授，我的经验恰恰相反。每次一个学员飞得特别好，我表扬他，他下次几乎总是飞得更差。每次一个学员飞得特别差，我狠狠批评他，他下次几乎总是飞得更好。所以批评有效，表扬有害。”

卡尼曼回忆说，那一刻他意识到了某件深刻的事情。

那位教官的观察是完全准确的——表扬之后表现通常变差，批评之后表现通常变好。但他的因果推理是完全错误的。表现变差不是因为被表扬了，表现变好也不是因为被批评了。无论教官做什么——表扬、批评、还是什么都不做——极端表现之后都会向均值回归。

一个学员某次飞得特别好（远高于他的平均水平），下一次最可能的结果就是飞得更接近平均水平——也就是“更差”。一个学员某次飞得特别差，下一次最可能的结果也是更接近平均水平——也就是“更好”。这和教官的反馈完全无关。

但人类大脑拒绝接受“什么都不做也会发生同样的变化”这个解释。它必须找到一个原因。于是，一个纯粹统计性的现象被包装成了因果性的人生哲理：“严师出高徒”“棍棒底下出孝子”“表扬会让人骄傲”。

卡尼曼后来写道：

“这是我在职业生涯中获得的最重要的洞见之一。”

他之所以把回归均值看得如此重要，是因为它揭示了人类认知中一个系统性盲区：我们在统计噪声上编织因果故事的能力，几乎是无限的。

§ 03

《体育画报》封面魔咒

回归均值最广为人知的案例可能是“《体育画报》封面魔咒”（Sports Illustrated Cover Jinx）。

从1954年《体育画报》创刊以来，人们观察到一个诡异的模式：运动员登上封面之后，表现往往显著下滑。棒球手打不出安打了，橄榄球队开始连败了，高尔夫球手排名暴跌了。

迷信的解释层出不穷。有人说是“evil eye”——被太多人关注会带来厄运。有人说是“压力”——上了封面之后心理负担太重。有人说是“分心”——媒体曝光让运动员无法专注训练。

这些解释可能各有一定道理，但最根本的解释比所有这些都简单：运动员之所以上封面，是因为他们最近的表现异常出色。异常出色的表现中包含了大量的运气成分。运气不会持续。所以他们的后续表现会回归到更接近真实水平的地方。

如果《体育画报》有一个“最差运动员”封面，选出每月表现最差的运动员，你会看到完全对称的“魔咒”——登上“最差封面”之后，这些运动员的表现往往显著改善。但没有人会说这是“幸运封面”的魔力，大家会说“哦他们终于恢复正常了”。

人类只在一个方向上感受到回归均值——从好到差的方向。从差到好的回归被视为“自然的”，从好到差的回归被视为“需要解释的”。 这种不对称的感知，是大量错误因果推理的根源。

§ 04

企业利润率：竞争是回归均值的执行者

芒格和巴菲特对回归均值最深刻的应用，在于他们对企业利润率的判断。

在自由竞争的市场中，超高利润率是一个信号。它向全世界的企业家和资本说：“这里有钱赚，快来。”于是竞争者蜂拥而入——模仿你的产品、压低价格、挖你的人才、争夺你的客户。随着竞争加剧，利润率被逐渐侵蚀，最终回归到行业的长期平均水平。

反过来也成立。极低的利润率意味着行业中最弱的参与者在流血。他们会退出、倒闭、被收购。随着竞争者减少，留下来的企业利润率会逐渐改善，回归到可持续的水平。

在资本主义体系中，竞争就是回归均值的物理执行机制。超额利润吸引竞争，竞争消灭超额利润。亏损驱逐参与者，参与者减少恢复利润。

这就是为什么华尔街分析师在预测企业未来利润时系统性地犯一个错误：他们倾向于把当前的利润率外推到未来。一家公司今年利润率是25%，分析师预测明年还是25%或更高。但回归均值告诉你：25%的利润率极有可能在未来几年下降，因为它太高了——高到足以吸引大量竞争。

巴菲特和芒格的投资框架可以用回归均值来理解。他们寻找的“护城河（Moat）”，本质上就是抵抗回归均值的力量。品牌、网络效应、专利、转换成本、规模经济——这些竞争优势的作用不是创造超额利润，而是保护超额利润不被竞争侵蚀，延缓甚至阻止回归均值的发生。

一家拥有强大护城河的企业，它的超额利润可以持续数十年而不回归。可口可乐的品牌、苹果的生态系统、Visa的网络效应——这些护城河让竞争者无法简单地通过模仿和压价来瓦解超额利润。

但芒格同时警告：没有永恒的护城河。技术变革、监管变化、消费者偏好的迁移，都可能摧毁看似坚不可摧的竞争优势。当护城河消失时，回归均值会以加速度到来——积蓄了多年的竞争压力一旦找到突破口，利润率可以在几年内从卓越跌至平庸甚至亏损。

柯达、诺基亚、西尔斯百货——它们的故事都是延迟了数十年的回归均值终于爆发的案例。

§ 05

市场情绪的钟摆：人性驱动的回归

如果说竞争是企业利润率回归均值的执行者，那么人性的钟摆就是市场情绪回归均值的发动机。

霍华德·马克斯在《周期》中将市场情绪描述为“钟摆在两个极端之间摆动，但几乎从不在中点停留”。极度恐惧压低了资产价格，使预期回报变得诱人，吸引逆向投资者进场，价格开始修复。极度贪婪推高了资产价格，使预期回报变得微薄甚至为负，最终需求枯竭，价格回落。市场情绪总是过度反应，然后回归，然后再过度反应向另一个方向。

罗伯特·席勒的CAPE比率（周期调整市盈率）提供了一百多年的实证证据。当CAPE比率极高时——比如1929年、2000年——随后十年的市场回报率几乎总是令人失望。当CAPE比率极低时——比如1932年、1982年——随后十年的回报率几乎总是令人振奋。

理解个人表现中的回归均值同样重要。任何一次极端表现都是技能加运气的组合。运气的成分越大，回归就越猛烈。卡尼曼在《思考，快与慢》中指出了一个关键区分：在运气成分大的活动中（比如投资年度业绩），均值回归非常强烈；在技能主导的活动中（比如国际象棋），均值回归较弱。理解你所处领域中技能与运气的比例，是正确应用回归均值的前提。

§ 06

逆向投资的统计基础

回归均值可能是逆向投资（contrarian investing）最坚实的统计基础。

逆向投资的核心逻辑是：买入被市场过度悲观定价的资产，卖出被市场过度乐观定价的资产。为什么这种策略长期来看往往有效？因为市场的极端情绪——无论是狂热还是恐慌——本质上就是一种“极端值”，而极端值倾向于回归均值。

2009年3月，全球金融危机的最低点，市场的恐慌程度达到了历史极端。人们相信金融体系将永久崩溃，银行股几乎一文不值，连蓝筹股都被抛售到了荒谬的价格。在那个时刻买入，需要对抗巨大的心理压力。但回归均值的逻辑非常清晰：这种程度的恐慌是不可持续的。情绪会回归，估值会回归，价格终将回归到更接近内在价值的水平。

巴菲特在那个时期大举买入——他在2008年10月公开写了一篇专栏文章，标题是“Buy American. I Am.”（买美国。我正在买。）。他在文中说的本质上就是回归均值：极度恐慌是暂时的，经济会恢复，企业的利润会恢复，市场的估值会恢复。

同样的逻辑在另一个方向上也成立。1999年互联网泡沫的高峰期，市场的狂热程度达到了历史极端。公司只要在名字后面加一个“.com”，股价就能翻倍。没有收入的公司市值达到数百亿美元。芒格和巴菲特在那时几乎没有买入任何科技股，被嘲笑为“过时的老头”。但回归均值站在他们这边：那种程度的狂热同样是不可持续的。

逆向投资之所以有效，不是因为逆向本身有什么魔力，而是因为它和回归均值站在同一边。 当你在别人恐慌时买入，你是在赌“恐慌会消退”——也就是说，你是在赌回归均值。当你在别人疯狂时卖出，你是在赌“疯狂会结束”——同样是在赌回归均值。

当然，逆向投资有一个关键的前提：你必须区分“暂时的极端”和“永久的改变”。 回归均值假设底层的“均值”本身是稳定的。但如果基本面发生了结构性变化——行业被新技术颠覆、公司的竞争优势永久丧失——那就不是回归均值，而是均值本身在移动。柯达的股价从高点暴跌，不是“回归均值”后还会反弹的暂时现象，而是均值本身已经从几十美元移到了零。

区分这两种情况，是逆向投资者最核心的能力。而这种区分能力，需要对企业和行业的深度理解——这就回到了芒格反复强调的能力圈概念。

§ 07

日常生活中的回归均值陷阱

回归均值的影响远不限于投资。它渗透在日常生活的每一个角落，制造着无数错误的因果推理。

医疗领域： 你感冒了，吃了一种新的保健品，三天后好了。你相信那个保健品有效。但大多数感冒本来就会在3-7天内自行痊愈——你的“好转”很可能只是回归均值（自然病程的结束），和保健品毫无关系。这就是为什么医学研究需要安慰剂对照实验——你必须把“服药后好转”和“不服药也会好转”区分开来。大量“有效”的替代医学疗法，在严格的对照实验中被证明不比安慰剂好，因为它们依赖的“疗效”其实只是回归均值。

教育领域： 一个学生某次考试考得特别差，家长请了昂贵的家教，下次考试成绩提高了。家长相信家教很有效。但如果那次考得特别差有运气成分（身体不适、题目恰好是弱项、考试当天心情不好），那么即使不请家教，下次成绩也很可能改善。当然，家教可能确实有帮助，但你不能从单次“差成绩后请家教、成绩改善了”来证明因果关系。

管理领域： 一家公司业绩特别差的一年，董事会决定换CEO。新CEO上任后，业绩改善了。新CEO因此被视为“拯救者”。但你需要问：如果不换CEO，业绩是否也会改善？如果那一年的差业绩中有大量的临时因素（宏观经济衰退、一次性减值、行业周期低谷），那么回归均值几乎可以保证下一年会好一些——无论谁坐在CEO的位子上。

芒格把这种思维陷阱总结为人类的一种核心弱点：我们总是需要一个“英雄”或“恶棍”来解释每一个结果，即使那个结果根本不需要英雄或恶棍来解释。

§ 08

回归均值的边界在哪里

边界一：回归均值需要一个稳定的“均值”。 如果底层系统正在发生结构性变化，历史均值就不再是可靠的参照。气候变化意味着历史平均温度不再是未来的好预测指标。技术革命意味着传统行业的历史平均利润率可能再也回不来了。在使用回归均值进行预测之前，你必须先判断：均值本身是否在移动？

边界二：回归均值的速度不确定。 均值回归不告诉你“什么时候”会发生。一个被高估的市场可以继续被高估很多年。凯恩斯的名言——“市场保持非理性的时间可以比你保持偿债能力的时间更长”——就是对这个问题的经典警告。知道“最终会回归”在战略上有价值，但在战术上可能让你过早行动而承受巨大的短期损失。

边界三：回归均值不适用于“有记忆”的系统。 回归均值假设每次观测是相对独立的。但有些系统有正反馈循环——成功带来更多成功，失败导致更多失败。一个城市一旦成为经济中心，就会吸引更多人才和资本，进一步巩固其地位（马太效应）。一家社交平台一旦达到临界用户规模，网络效应会让它越来越强。在这些系统中，极端值不一定会回归——它可能是一个新均衡的开始。

边界四：幸存者偏差会伪装回归均值。 如果你只观察“活下来的”样本，你可能误判回归均值的方向。那些业绩从优秀“回归”到平庸的基金经理你能看到；那些业绩从平庸“回归”到破产的基金经理你看不到——因为他们消失了。在有幸存者偏差的数据中，回归均值的真实幅度可能比你观察到的更大。

§ 09

如何在日常中使用回归均值思维

第一，对极端表现保持冷静。 无论是你自己的、你员工的、你投资标的的、还是你孩子的——任何一次极端好或极端差的表现，在得出因果结论之前，先问自己：这里面有多少是回归均值可以解释的？

第二，在“改变之后好转”的场景中格外警惕。 人们天然地把“改变”和“好转”建立因果联系——换了药就好了、换了教练就赢了、换了策略就盈利了。但如果改变发生在极端低谷之后（通常如此，因为人们倾向于在最差的时候做改变），那么好转的很大一部分可能只是回归均值。

第三，用回归均值来校准预期。 如果一家公司过去五年的平均利润率是15%，今年突然达到了25%，你对明年的最佳估计不是25%，而是更接近15%的某个值。除非你有强有力的证据表明基本面发生了持久的改变（新的护城河、结构性的行业变化），否则回归均值应该是你的默认预期。

第四，逆向运用回归均值。 当市场对某个资产极度悲观时（价格远低于长期均值），问自己：驱动这种悲观的因素是暂时的还是永久的？如果是暂时的，回归均值就是你的朋友——它预测价格最终会回升。但你必须有耐心等待，并且确保自己在等待期间不会被迫出局（这就是为什么芒格和巴菲特如此强调不用杠杆）。

第五，区分“回归均值”和“趋势逆转”。 这是最难的部分。股价从高点下跌10%，可能是回归均值（此前涨多了），也可能是一个下行趋势的开始（基本面恶化了）。你需要其他思维模型——护城河（Moat）分析、贝叶斯定理的证据更新、对行业结构的理解——来做这个区分。回归均值本身不告诉你答案，它只告诉你一个统计上的默认预期。

§ 10

耐心和谦逊的统计学基础

回归均值的终极启示可能是关于人类自身的。

我们太急于寻找英雄和恶棍，太急于在每一个结果中发现因果，太急于把运气包装成能力、把巧合解释为必然。回归均值像一盆冷水，浇在所有急切的因果叙事上：很多你以为需要解释的事情，其实不需要解释。它们只是统计噪声在向均值回归。

这并不意味着因果关系不存在。教练的战术确实重要，CEO的能力确实重要，药物确实能治病。但在判断一个具体案例中因果关系有多强之前，你需要先扣除回归均值能解释的部分。只有扣除之后剩下的，才是真正需要因果解释的信号。

芒格的投资风格——极度耐心、极少交易、长期持有——本身就是对回归均值的深刻理解的体现。他知道短期业绩中噪声太多、信号太少。他知道极端好的时期不会持续，极端差的时期也不会持续。他知道自己不需要对每一个波动做出反应——因为大部分波动只是在回归均值。

这种理解带来的不是消极的宿命论，而是一种深沉的清醒：把精力放在你能控制的事情上（分析质量、决策纪律、风险管理），而不是在你不能控制的事情上（短期运气、市场情绪、随机波动）寻找虚假的意义。

§ 11

芒格相关原话

“Mimicking the herd invites regression to the mean.”
“模仿羊群只会让你回归平庸。”

“Over the long term, it's hard for a stock to earn a much better return than the business which underlies it earns. If the business earns 6% on capital over 40 years and you hold it for that 40 years, you're not going to make much different than a 6% return even if you originally buy it at a huge discount.”
“长期来看，一只股票很难获得比其底层业务更好的回报。如果一家企业40年来的资本回报率是6%，你持有它40年，即使你当初以很大的折扣买入，你的回报也不会和6%差太远。”——巴菲特（芒格多次引用）

这段话就是回归均值在投资中的终极表述：短期内股价可以偏离企业价值很远，但长期来看，股价回报必然回归到企业的实际资本回报率。

“The iron rule of nature is: you get what you reward for. If you want ants to come, you put sugar on the floor.”
“自然的铁律是：你奖励什么就得到什么。如果你想引来蚂蚁，就在地上撒糖。”

超额利润就是地上的糖。竞争者就是蚂蚁。回归均值就是这条铁律的统计学表述。

§ 12

关联模型

大数定律 — 回归均值是大数定律的直接推论：样本越大，极端值的影响越被稀释
正态与非正态分布 — 正态分布解释了为什么极端值稀有且不可持续
护城河（Moat） — 护城河是企业对抗利润率回归均值的防御工事
安全边际 — 安全边际是投资者利用回归均值（买入被低估的资产）的操作框架
概率思维与期望值 — 回归均值提醒你：单次极端结果的信息含量远低于长期期望值
贝叶斯定理 — 极端表现之后，贝叶斯更新应该将你的信念向均值方向调整
自视过高的倾向 — 人们把回归均值中的好运归因于自己的能力
避免不一致性倾向 — 即使证据指向回归均值，人们也不愿放弃“因果叙事”
进化论 — 竞争导致的利润率回归均值，是经济领域的自然选择
逆向思维 — 逆向投资的统计学基础正是回归均值
Lollapalooza倾向 — 多种极端因素叠加后的回归可能同样极端
临界质量与相变 — 结构性变化可以永久改变“均值”本身，使回归失效
网络效应 — 处于正反馈循环中的网络效应，在达到临界质量前可能抵御回归

§ 13

实践检查清单

评估表现时：

□这个极端表现中，有多少可以被回归均值解释？在寻找因果之前，先扣除统计噪声
□我是否因为表扬/批评和后续表现的时间巧合，而建立了虚假的因果关系？
□我是否在“封面魔咒”的陷阱里——因为某人/某公司最近表现极好就期望这种表现会持续？

做投资决策时：

□这家公司当前的利润率/增速是否远高于行业长期平均水平？如果是，回归均值是默认预期
□有什么力量（护城河）能阻止回归均值发生？这些力量有多持久？
□我是在买入被短期悲观情绪压低的“回归均值”机会，还是在买入一个均值本身正在下移的“价值陷阱”？

区分暂时波动和永久变化时：

□驱动当前极端表现的因素是暂时的（经济周期、一次性事件）还是结构性的（技术革命、竞争格局重塑）？
□我是否有足够的耐心等待回归均值发生？我在等待期间是否能承受短期的逆向压力？
□“均值”本身是否在移动？历史平均水平是否仍然是合理的参照？

日常判断时：

□“改变之后好转”是否可能只是回归均值，而非改变本身的效果？
□我是否在一次极端好/差的经历后做出了过度的战略调整？

§ 14