MUNGER MODELS
数学与统计学 · ★★★★☆

幂律分布

Power Laws
§ 00

幂律分布揭示了极少数事件贡献绝大部分影响的不均匀世界——从风投回报到地震能量,理解帕累托法则背后的数学结构是正确配置资源的关键。

# 幂律分布

Power Laws

2004年,硅谷最有影响力的风险投资人彼得·蒂尔做了一件违反直觉的事:他把几乎全部赌注押在了一家还在宿舍里运营的社交网站上。当时Facebook只有几百万用户,估值不到5亿美元,而蒂尔已经通过PayPal赚得盆满钵满,完全可以把钱分散到几十个“看起来不错”的项目里。

他没有。他在Facebook的A轮投了50万美元,后来又追加投资。到Facebook上市时,这笔投资变成了超过10亿美元。

这不是运气好。蒂尔后来在《从零到一》中写道:“风投行业最大的秘密是,一个基金中最成功的投资,其回报等于或超过其余所有投资的总和。”他不是在夸张。这是一个数学事实,而支撑这个事实的数学结构叫做幂律分布。


§ 01

一个不公平的宇宙

让我们从一个最简单的对比开始。

你已经了解了正态与非正态分布——那条优美对称的钟形曲线。在正态分布的世界里,大部分数据聚集在均值附近,极端值非常罕见,任何单一个体对整体的影响可以忽略不计。把姚明放进一个一千人的房间,平均身高只上升零点几厘米。

现在想象另一个房间。一千个普通美国人坐在里面,他们的平均净资产大约50万美元。然后杰夫·贝佐斯走了进来。一瞬间,房间里的平均净资产从50万跳到了大约1.5亿。一个人拉动了整个分布。

这就是幂律分布的世界。

幂律的数学表达非常简洁:事件的频率与其规模的某个负幂次成反比。翻译成人话就是——小事件极其常见,大事件非常罕见,但大事件一旦发生,其规模会大到令人难以想象。 更关键的是,这种“大到难以想象”不是像正态分布那样以指数速度衰减的——它衰减得慢得多,尾巴拖得又长又厚。

帕累托在1896年首先注意到了这个模式。他研究意大利的土地分配,发现大约80%的土地归20%的人口所有。后来人们发现这个“80/20法则”几乎无处不在:80%的销售额来自20%的客户,80%的bug来自20%的代码,80%的犯罪来自20%的罪犯。

但帕累托法则只是幂律分布的一个特例,一个方便记忆的近似。幂律的真正含义比“80/20”深刻得多。在很多系统中,分布的不均匀程度远超80/20——更像是99/1。1%的地震释放了99%的地震总能量。1%的论文获得了超过一半的学术引用。1%的风投项目创造了基金几乎全部的回报。


§ 02

风投的数学:一个项目抵一百个

让我们深入看风投的故事,因为它是幂律在商业世界中最纯粹的体现。

硅谷传奇风投Horowitz基金的联合创始人本·霍洛维茨曾经分享过这样一个数据:在一个典型的风投基金中,前两三个最成功的投资贡献了基金总回报的绝大部分——通常超过所有其他投资的总和。这不是偶尔如此,而是风投行业几十年来反复验证的铁律。

Andreessen Horowitz的早期基金投了Instagram、GitHub、Airbnb等公司。但如果你剥离掉少数几个最成功的项目,基金的整体回报将变得平庸。这不是因为其他项目“很差”——很多项目给出了不错的回报——而是因为在幂律分布下,“不错”和“顶尖”之间的差距是数量级的。

Y Combinator创始人保罗·格雷厄姆把这种现象描述得更极端。他说YC孵化的公司中,Dropbox和Airbnb两家的价值就超过了其余数千家公司的总和。注意,YC不是投了一堆垃圾公司——它投的是经过严格筛选的创业公司。即便如此,回报分布依然呈现出惊人的幂律特征。

这意味着什么?意味着风投的核心策略不是“避免失败”,而是“确保你在赢家的名单上”。如果你管理一个风投基金,投了100个项目,其中95个亏损或打平、4个赚了几倍、1个赚了100倍——你的基金表现可能非常出色。但如果你因为害怕风险而错过了那个100倍的项目,即使其余99个都小赚,你的整体回报仍然平庸。

蒂尔把这个逻辑推到了极致。他认为风投不应该“分散风险”,而应该竭尽全力找到那一两个有可能成为幂律赢家的公司,然后全力下注。这和传统的投资组合理论完全相反——后者建立在正态分布的假设上,建议你通过分散来降低风险。但在幂律的世界里,分散的代价是你几乎必然错过那个改变一切的极端事件。


§ 03

幂律无处不在

风投只是幂律的一个缩影。一旦你学会了识别幂律分布,你会发现它在自然和社会系统中无处不在。

城市规模。 世界上绝大多数城市是小城镇,几千到几万人。但少数几个超级大都市——东京、上海、纽约——容纳了数千万人。城市人口的分布遵循齐普夫定律(Zipf's Law),这是幂律的一种表现形式:一个国家最大城市的人口大约是第二大城市的两倍、第三大城市的三倍,以此类推。

财富分布。 全球最富有的1%的人拥有全球约一半的财富。最富有的前10人的财富总和超过了最贫穷的40亿人的总和。这不是“不公平”的道德问题,而首先是一个数学现象——财富积累的机制(复利、网络效应、赢家通吃)天然产生幂律分布。

地震。 古登堡-里克特定律告诉我们,地震的能量释放服从幂律。每天全球发生数以千计的微小地震,几乎无人感知。但偶尔——2004年印度洋海啸、2011年东日本大地震——一次地震释放的能量超过了此前数年所有小地震的总和。

互联网流量。 全球前10个网站的流量超过了其余数十亿网站的总和。维基百科、谷歌、YouTube这样的超级节点吸走了绝大部分注意力,而长尾中的数十亿小网站分享剩余的碎屑。

词汇使用。 齐普夫最初发现他的定律就是在语言学领域:英语中最常用的词“the”的出现频率大约是第二常用词“of”的两倍,是第三常用词的三倍。少数几个词构成了我们日常语言的绝大部分。

为什么幂律如此普遍?因为产生幂律的机制在自然和社会中极其常见,至少有三个核心发生器:

第一,优先连接(Preferential Attachment)。 当新的资源、连接或机会被分配时,已经拥有更多的个体更容易获得更多。巴拉巴西在研究互联网结构时发现,新网页更倾向于链接到已经有很多链接的网页。这个简单的“富者更富”规则运行足够长的时间后,就会自然产生幂律分布。同样的机制在城市增长、科学引用和财富积累中都在运作。

第二,乘法效应。 正态分布通常产生于加法过程——很多独立小因素加在一起。幂律分布则常常产生于乘法过程——一个因素的影响不是“加上”另一个因素,而是“乘以”另一个因素。企业的成功就是一个乘法过程:产品质量×市场时机×管理能力×资本实力×运气。每个因素独立看差异不大,但相乘之后差异就被指数级放大了。

第三,自组织临界性(Self-Organized Criticality)。 物理学家佩尔·巴克在1987年提出:许多复杂系统会自发地演化到一种“临界状态”,在这种状态下扰动大小服从幂律分布。想象一堆沙子:你一粒一粒地往上加,沙堆会自发地达到一个临界坡度。在这个坡度上,加一粒沙子可能什么也不发生,也可能引发大规模沙崩。崩塌大小的分布就是幂律的——没有人“设计”了这种分布,它是系统自发组织的结果。这个概念深刻地关联着自组织临界性模型。


§ 04

芒格为什么集中投资

理解了幂律,芒格的投资风格就从“特立独行”变成了“数学上的必然”。

芒格和巴菲特的投资组合极度集中。在伯克希尔的股票投资组合中,前五大持仓通常占据了总价值的70%以上。苹果一只股票在某些年份占了组合的近50%。这和华尔街主流的“充分分散”哲学截然相反。

但如果你相信商业世界的回报服从幂律分布——而大量的实证数据表明确实如此——那么集中投资就不是冒险,而是顺应数学规律。

芒格的逻辑是这样的:在一个幂律世界里,少数极其优秀的企业创造了绝大部分的长期价值。如果你把资金分散到50个“还不错”的公司,你得到的是一个平庸的加权平均。但如果你能识别出那几个处于幂律右端的极端赢家,然后把重注押上去,你的回报将远超任何分散策略。

“The idea of excessive diversification is madness. Wide diversification, which necessarily includes investment in mediocre businesses, only guarantees ordinary results.”

“过度分散投资的想法是疯狂的。广泛的分散投资必然包括投资于平庸的企业,只能保证平庸的结果。”
— Charlie Munger

当然,这有一个残酷的前提:你必须真的有能力识别那些极端赢家。如果你没有这个能力,分散反而是更安全的策略(这就是为什么芒格同时建议普通投资者买指数基金)。集中投资是幂律思维的实践应用,但它要求极高的判断力——你必须知道自己在做什么。

这也解释了芒格为什么如此强调能力圈的概念。在幂律世界里,做对一个大决策比做对一百个小决策重要得多。但“做对一个大决策”的前提是你真正深刻地理解了那个领域。芒格一生中只做了不超过二十个重大投资决策,但这二十个决策创造了他几乎全部的财富。


§ 05

反直觉与边界:幂律在哪里不适用

幂律是一个强大的透镜,但和所有模型一样,它有边界。

第一,不要在正态分布的领域里使用幂律思维。 如果你在管理一个工厂的质量控制,螺丝的直径服从正态分布,你不需要担心“一根螺丝的误差会毁掉整个批次”。在正态世界里,分散和平均化是完全合理的策略。问题是很多人分不清自己处在哪个世界。

第二,幂律不意味着“只关注头部,忽略长尾”。 克里斯·安德森在《长尾理论》中指出,虽然单个长尾项目的价值很小,但长尾的总量可能非常可观。亚马逊的大量利润来自那些每年只卖几十本的冷门书籍的总和。幂律告诉你分布是不均匀的,但不意味着你应该只关注头部。

第三,幂律分布的指数(幂次)很重要。 不是所有幂律都同样极端。当幂次接近1时(如齐普夫定律),分布的不均匀程度极大,均值甚至可能不存在。当幂次较大(比如3或4)时,分布虽然仍然比正态分布有更厚的尾巴,但不均匀程度温和得多。笼统地说“这服从幂律”而不关注具体参数,可能导致错误的决策。

第四,幂律的产生机制可以被打破。 反垄断法、监管政策、技术颠覆——这些都可以中断“富者愈富”的正反馈循环。历史上无数“赢家通吃”的垄断者最终被打破,不是因为幂律的数学错了,而是因为产生幂律的底层机制被改变了。


§ 06

如何用幂律思维做更好的决策

第一,识别你所在领域的分布类型。 在做任何战略决策之前,先问:结果在这个领域是正态分布的还是幂律分布的?如果你在做人事管理,员工的能力差异大致正态——不需要把所有资源押在一个“天才”上。但如果你在做风投或内容创业,结果是幂律的——一个爆款可能抵一百个平庸作品。策略必须匹配分布。

第二,在幂律领域里,把精力集中在寻找极端赢家上。 不要花同等时间评估每一个机会。帕累托法则的实操含义是:找到那20%真正重要的东西,然后把80%的精力放在上面。在企业管理中,识别那20%创造80%利润的客户、那20%产生80%价值的员工、那20%贡献80%增长的产品线。

第三,接受大量“失败”是幂律世界的常态。 如果你在做创新或创业,大部分尝试会失败——这不是你的问题,而是幂律分布的数学性质。关键不是提高每次尝试的成功率(这往往意味着只做安全的事),而是确保你在游戏中待得足够久,有足够多的“抽签机会”来碰到那个极端事件。

第四,警惕用均值来描述幂律系统。 “平均”在幂律世界里几乎没有意义。“一个风投基金平均回报率是15%”这句话隐藏了关键信息——可能80%的基金亏损,而20%的基金赚了足以拉高整体平均的超额回报。在评估任何幂律系统时,看中位数比看均值有意义得多,而看分布的形状比看任何单一统计量都重要。


§ 07

少数决定多数

物理学家杰弗里·韦斯特(Geoffrey West)在他的著作《规模》中揭示了一个惊人的统一性:从生物体的新陈代谢到城市的创新产出,从企业的寿命到河流的分支结构,幂律以令人不安的一致性统治着自然和社会系统。他写道:“幂律是大自然用来组织复杂性的基本语法。”

这意味着我们生活在一个本质上不平等的宇宙里。不是道德意义上的不平等,而是数学意义上的——极少数事件、节点、个体、决策占据了绝大部分的影响力。正态分布描述了一个“公平”的世界,每个个体的贡献大致相当;幂律分布描述了一个“极端”的世界,少数决定多数。

芒格的整个投资哲学都建立在对这个数学事实的直觉理解上。他不追求“每次都对”,他追求“在关键时刻做出正确的大决策”。他不分散到五十个平庸的机会中,而是等待少数几个极其确定的大机会然后重仓出击。他理解在一个幂律主导的世界里,少做多对远比多做少错重要。

“It is remarkable how much long-term advantage people like us have gotten by trying to be consistently not stupid, instead of trying to be very intelligent.”

“像我们这样的人,仅仅通过努力保持不犯蠢而非努力变得非常聪明,就获得了多大的长期优势,这一点令人惊叹。”
— Charlie Munger

在幂律的世界里,避免灾难性错误(不去碰那些可能让你归零的事),同时确保自己在少数真正重要的机会面前不缺席——这就是芒格式智慧的数学基础。


§ 08

芒格相关原话

“The idea of excessive diversification is madness.”

“过度分散投资的想法是疯狂的。”

“The wise ones bet heavily when the world offers them that opportunity. They bet big when they have the odds. And the rest of the time, they don't. It's just that simple.”

“聪明人在世界给他们机会时下重注。当胜算站在他们这边时,他们大赌。其余时间,他们不赌。就这么简单。”

“Our experience tends to confirm a long-held notion that being prepared, on a few occasions in a lifetime, to act promptly in scale, is an important, uncommon quality.”

“我们的经验印证了一个由来已久的观点:在一生中少数几个时刻,准备好迅速且大规模地行动,是一种重要且罕见的品质。”


§ 09

关联模型

  • 正态与非正态分布 — 正态分布与幂律分布是理解世界的两面镜子,知道现象属于哪个分布是正确分析的前提
  • 复利效应 — 复利是产生幂律分布的核心机制之一;“富者愈富”的正反馈循环驱动复利式增长
  • 网络理论 — 无标度网络中的节点度分布服从幂律,少数超级节点连接了大部分节点
  • 概率思维与期望值 — 在幂律分布下计算期望值需要特别小心,因为极端事件主导了期望
  • 不对称性与凸性 — 幂律分布天然具有不对称性;理解上行和下行的不对称是利用幂律的关键
  • 乘法系统思维 — 幂律分布往往产生于乘法过程而非加法过程
  • 涌现性 — 幂律分布本身是系统动力学的涌现产物
  • 自组织临界性 — 自组织临界系统自然产生幂律分布的事件规模
  • 临界质量与相变 — 系统在临界点附近的行为呈现幂律特征
  • 脆弱性与反脆弱性 — 幂律世界中的尾部风险要求反脆弱的系统设计
  • 能力圈 — 在幂律世界中,把注意力集中在少数真正理解的领域远比分散更有价值

§ 10

实践检查清单

识别层面:

  • 我面对的系统中,结果是大致均匀分布的,还是少数极端值主导的?
  • 这个领域是否存在“赢家通吃”或“富者愈富”的正反馈机制?
  • 当有人给我“平均值”时,我是否追问了分布的形状?中位数和均值差距大吗?

决策层面:

  • 在幂律领域,我是否把足够多的资源集中在了最有潜力的少数机会上?
  • 我是否因为追求“分散风险”而错过了可能的极端赢家?
  • 我是否接受了大量“失败”是幂律世界的常态,而不是因此畏缩不前?

投资层面:

  • 我的投资组合中,是否有少数几个我深度理解、有极大上行空间的重仓位?
  • 我是否在用正态分布的风控逻辑来管理一个幂律世界的投资组合?
  • 我是否为“一个正确的大决策抵一百个小决策”留出了足够的弹药?

§ 11

延伸阅读

  • Peter Thiel,《Zero to One》— 幂律分布在风投和创业中的深刻含义
  • Nassim Taleb,《The Black Swan》— 极端事件如何主导幂律世界
  • Geoffrey West,《Scale》— 幂律如何统一解释从生物到城市到企业的规模法则
  • Albert-László Barabási,《Linked》— 网络科学揭示幂律分布的普遍性
  • Chris Anderson,《The Long Tail》— 幂律长尾的商业价值
  • Vilfredo Pareto,《Manual of Political Economy》— 帕累托法则的原始来源
  • Philip Anderson, “More Is Different” (1972) — 理解规模如何改变分布的性质
  • Mark Newman, “Power laws, Pareto distributions and Zipf's law” (2005) — 幂律分布的系统性学术综述