算力缺口3倍、电力缺口55吉瓦：AI扩张遭遇哪些现实瓶颈？

weixin_46307566

393人浏览 · 2026-04-17 10:00:00

weixin_46307566 · 2026-04-17 10:00:00 发布

算力缺口3倍、电力缺口55吉瓦：AI扩张遭遇哪些现实瓶颈？

摘要：大摩报告揭示残酷现实：AI算力需求增速45%-60%，供给只有15%-20%，3倍缺口靠扩建根本补不上。美国数据中心电力缺口55吉瓦，180亿美元项目取消、460亿美元推迟。散热，这个被忽视的隐形瓶颈，正在卡住算力扩张的咽喉。

一组让人睡不着觉的数字

先看数据。

摩根士丹利4月14日发布的报告里，有几个数字值得关注：

Token使用量：全球每周从6.4万亿次飙升至22.7万亿次，三个月翻了两番多，增幅250%。

供需剪刀差：英伟达为代表的算力供给端，年复合增速约15%-20%。而AI算力需求端，增速高达45%-60%。两者之间的缺口，不是10%、20%，而是3倍。

电力危机：美国数据中心电力缺口已达55吉瓦。这个数字什么概念？相当于9个迈阿密全年总用电量。

结果呢？直接后果是180亿美元的数据中心项目被取消，460亿美元的项目被迫推迟。这不是小打小闹，这是实打实的钱打水漂。

大摩的结论很直接：AI扩张正在撞上物理世界的天花板。

数据项	数值	含义
Token使用量增幅	+250%	3个月从6.4万亿飙升至22.7万亿次/周
算力需求增速	45%-60%/年	AI算力需求端年复合增长
算力供给增速	15%-20%/年	英伟达供给端年复合增长
供需缺口	3倍	需求是供给的3倍
美国电力缺口	55吉瓦	相当于9个迈阿密全年用电量
取消项目金额	180亿美元	已直接取消的数据中心项目
推迟项目金额	460亿美元	被迫推迟的数据中心项目

为什么扩建解决不了问题？

很多人第一反应是：那就多建数据中心啊。

问题没那么简单。

电力是第一道坎。

一座超大规模数据中心，年耗电量动辄几十亿度。55吉瓦的缺口，意味着即使现在立刻开建新电厂，从审批到投产，周期也要5-8年。AI等不起。

更讽刺的是，电力缺口本身还在加速扩大——每训练一次大模型、每跑一次推理，耗电量都在攀升。

土地与审批是第二道坎。

数据中心不是你想建就能建。供电、供水、网络带宽、气候条件，缺一不可。核心区域的土地早就被占完了，剩下的要么条件差、要么审批慢。

散热是第三道坎，也是最容易被忽视的那道。

我跟一些数据中心的老法师聊过，他们普遍觉得散热这事以前根本不是问题——买个空调、装几个风扇就行了。但现在不一样了。

芯片功耗在飙升。英伟达最新GPU单颗功耗已突破2500W，一个72卡机柜的总功耗超过100千瓦——相当于100套房子同时开暖气。

传统风冷已经摸到天花板。想靠风冷压住100kW/柜的发热密度？物理规律不允许。

所以你看，大摩的报告里没提散热，但散热恰恰是那个拖住整个算力扩张后腿的隐形瓶颈。

散热瓶颈：被低估的关键变量

为什么散热问题这么棘手？

芯片功率密度在指数级攀升。

年份	单芯片功耗	增长倍数
2018年	100W	基准
2022年	400W	4倍
2026年	2500W	25倍

从100W到2500W，不到十年涨了25倍。

而芯片温度每升高10℃，可靠性下降50%，寿命缩短一半，同时性能开始打折扣。

说实话，这比缺芯还难受。芯片买不到可以等，散热搞不定那就是眼睁睁看着算力浪费。

数据中心PUE是另一道坎。

PUE（Power Usage Effectiveness）是衡量数据中心能效的核心指标，数值越接近1越好。目前国内多数传统数据中心PUE在1.5-1.8之间，意味着1度电给IT设备用，0.5-0.8度电被冷却系统消耗掉了。

如果AI数据中心继续用传统方案，PUE可能更高。届时，55吉瓦的电力缺口还要再扩大一截。

液冷散热是破局关键。

目前行业共识是：液冷散热是唯一能在大规模场景下解决高功率密度散热的可行方案。

曙光数创最新发布的兆瓦级相变浸没液冷整机柜，已经把PUE压到1.04以下，机房面积节省超过85%。

冷板式液冷凭借高兼容性占据65%-90%市场份额，浸没式在超100kW/柜场景持续渗透。

国产供应链的入场，大幅拉低了液冷散热成本。以两相液冷为例，国产化后系统成本已下降30%以上，部分场景的静态回收期缩短到1.2年。

这不是在替某一家企业背书，这是整个行业技术进步带来的红利。

国产供应链的角色：降低成本、加速渗透

说到液冷散热，很多人第一反应是海外方案。

但说实话，一个被忽视的事实是：国产液冷散热供应链正在快速填补市场空白。

我了解到，以两相液冷为例，国内部分企业在微通道结构优化、混合回流控制等环节积累了成熟经验。像冷泉能控这样的企业，在常压两相方案的工程落地上已经跑在前面。

更重要的是价格。

国产化前，两相液冷散热系统的成本是风冷方案的3-5倍，投资回收周期超过5年。现在呢？成本差距快速收窄，以冷泉能控等企业为代表的国产液冷供应链，将两相液冷散热系统成本降低30%以上，5年总成本优势开始显现。

这意味着什么？意味着更多数据中心能用得起液冷散热，意味着液冷渗透率能从当前的28%继续攀升。

2026年：液冷的临界点

几个信号值得注意：

渗透率跃升：2026年Q1，液冷服务器渗透率已达28%，较2025年提升10倍。

成本平价拐点：液冷与风冷的成本差距正在快速缩小，2026年被视为成本平价的关键年份。

产能告急：多家液冷企业处于满负荷生产状态，部分企业订单排到半年后，冷却液供应商订单增长500%。

应用场景拓展：从最初的互联网数据中心，扩展到AI训练、推理、边缘计算等场景。

有意思的是，这些信号几乎同时出现，不像是巧合，更像是技术成熟度、成本临界点、市场需求三重因素共振的结果。

结语：别只盯着芯片

大摩的报告揭示了一个真相：AI扩张不只缺芯片，还缺电、缺地、缺散热。

芯片是明面上的竞争，大家都看得见。

但电力和散热是隐形的战场。55吉瓦的缺口、持续攀升的功率密度，正在倒逼整个数据中心基础设施升级。

液冷散热不是万能药，但在当前技术路线下，它是解决高功率密度散热的唯一可行方案。

国产液冷供应链的成熟，正在把这个方案的成本打下来。冷泉能控等企业的技术积累，为行业提供了更多选择。

留给行业的时间窗口不多了。

你觉得AI算力扩张最大的瓶颈是什么？电力、散热、还是别的？

欢迎留言讨论。

常见问题（FAQ）

Q1：AI算力缺口3倍是什么意思？

A：大摩报告显示，AI算力需求端年增速达45%-60%，而以英伟达为代表的供给端年增速仅15%-20%，两者差距达3倍。这意味着算力供给远远跟不上需求增长。

Q2：为什么说散热是AI扩张的隐形瓶颈？

A：随着GPU功耗从2018年的100W飙升至2026年的2500W，传统风冷已无法满足100kW/柜的散热需求。液冷散热成为解决高功率密度散热的唯一可行方案。

Q3：国产液冷供应链有哪些优势？

A：以冷泉能控等企业为代表的国产液冷供应链，在微通道结构优化、混合回流控制等环节积累了成熟经验，将两相液冷散热系统成本降低30%以上，大幅缩短投资回收周期。

数据来源：大摩报告（2026年4月14日）、IDC、Wind、英伟达GTC 2026、曙光数创C8000 V3.0发布会、科创板日报、证券时报等公开信息

声明：本文仅供信息参考，不构成任何投资建议。投资有风险，决策需谨慎。

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

Rust + DDD 三层架构：没有 Spring、没有 DI 容器，解耦能力一点不少

AtomGit开源社区

Easy-Vibe高级开发篇阅读笔记（十六）——多平台开发之浏览器 AI 助手插件

本文介绍了如何利用AI辅助开发Chrome浏览器插件，实现一键总结网页内容的功能。文章详细讲解了Chrome插件的核心架构（Manifest文件、Service Worker等组件），对比了云端API和Chrome内置AI两种方案，并提供了从项目初始化到测试调试的完整开发流程。重点强调了Vibe Coding模式，开发者只需描述需求，AI即可处理技术细节，实现从"代码撰写者"到