引言:被忽视的“物理定律墙”

2026年,AI大模型竞赛进入白热化。但比起模型能力的比拼,物理世界的限制也许才是决定AI产业上限的关键变量。在GTC和OFC 2026大会上,光互联技术甚至取代了传统算力成为主角——以1.6T/3.2T高速光模块、CPO(共封装光学)先进封装、硅光集成为代表的技术路线密集亮相,每一项都直指AI算力发展的核心痛点。

如果把AI比作一个正在极速发育的“超级大脑”,那么算力芯片(CPU/GPU)就是它的神经元,而数据中心则是承载这个大脑的“躯体”。算力、电力和互联,构成了AI基础设施的三根核心支柱。但在很长一段时间里,行业的目光过度聚焦在“算力”这一根柱子上,以至于另外两根柱子正在承受它这个年纪不该承受的压力。

本文将带你深入这场AI算力基建的底层革命,看懂制约AI发展的物理极限在哪里,以及光互联——尤其是MPO/MTP光纤跳线——如何成为这场风暴中“闷声发大财”的隐形霸主。

一、AI算力的“野蛮生长”:从万卡到十万卡,数据中心扛不住了

1.1 算力军备赛:全球狂飙的“芯”竞赛

全世界都在押注AI。

高盛在其研报中指出,AI基础设施在2026年预计需要约7650亿美元的投入,到2031年将攀升至1.6万亿美元,2026至2031年间的累计投资总额将达到近7.6万亿美元。在中国,算力规模从2022年的180EFLOPS增长至2025年的300EFLOPS,年均增速接近30%。而据国家数据局披露的最新数据,仅截至2026年3月底,全国智能算力总规模即已达到188万PFLOPS。

这组数据背后是一条清晰的逻辑链:大模型参数从千亿迈向万亿甚至百万亿级别,倒逼GPU集群从千卡到万卡、再到十万卡规模跃迁。随之而来的直接挑战是:芯片功耗的暴涨。

单颗高端AI GPU功耗已经突破1000W,下一代AI加速器功耗还将进一步提升。AI芯片的热设计功耗从H100时代的700W,一路上升至新一代GPU的1200W级别。反映到整机柜层面:从H100时代单柜约30-80kW,到GB200/GB300突破100kW,再到新一代Rubin机柜迈入200kW甚至更高水平——算力的提升已经不是单颗芯片的故事,而是整机柜功率与发热水平的同步飙升

1.2 电力告急:GPU机柜功率的单路狂飙

当数据中心单机柜功率从传统的4-8kW,急剧膨胀到智算中心的20-60kW甚至100kW以上时,电力便不再是后台的支持部门能独立消化的课题,而是决定项目能否上马的核心变量。

根据国际能源署(IEA)发布的《能源与人工智能》报告,2024年数据中心约占全球电力需求的1.5%(415太瓦时),预计到2030年将翻倍至约945太瓦时——略高于日本目前的全国用电总量。其中,AI专用数据中心的电力消耗在2025年猛增了50%。

在中国,2025年AI数据中心能耗预计达到777亿千瓦时,电力约束日益严峻。中国信通院数据显示,2019年至2024年,我国数据中心用电量年均复合增速达到15.0%,这一趋势仍在加速。

更严峻的是供电体系本身:传统48V供电架构已接近极限。为一个1MW的AI机柜供电,仅铜材就可能需要接近450磅。英伟达由此引领数据中心设计迈向800V高压直流(HVDC)架构,其核心逻辑是“让高电压尽可能靠近功耗终端”——电压越高,电流越小,铜损越低。

一句话总结:AI的瓶颈已从“算不快”变成了“供不上电”。

1.3 散热失控:风冷失灵,液冷上位

与电力问题相伴生的是散热。即使PUE(电能利用效率)已经降到了1.05的极限水平,2026年全球AI数据中心的耗电量仍将达到580TWh,占全球发电量的2.3%。

随着单芯片功耗突破1000W大关,传统风冷技术已彻底失灵。液冷从“增效选项”转变为AI数据中心的“必选项”。集邦咨询预测,2026年AI芯片的液冷渗透率将达到47%。微软甚至提出了芯片封装层级的微流体冷却技术,让冷却液直达芯片表面。

电力与散热,构成了AI算力基建的第一道“物理定律墙”。但这道墙的背后,还藏着一个同样致命却更不为人知的第二道墙——互联瓶颈。

二、互联之殇:为什么铜缆正在成为AI集群的“隐形绊脚石”?

2.1 铜墙铁壁:铜缆的物理极限已至

传统数据中心内部,铜缆凭借成本低、技术成熟等优势,长期主导机架内的短距互联。行业甚至有句老话:“能用铜就用铜,不行才用光”。但在AI算力的指数级冲击下,铜缆正一步步暴露其无法逾越的短板。

首先是带宽上限的桎梏。 铜缆的传输带宽受自身物理特性限制,单通道带宽最高仅能达到224G,即便多通道聚合也难以突破1Tbps的门槛。而随着GPU集群从万卡向十万卡级跨越,单链路1.6T、3.2T已是标配,铜缆在物理上已无法胜任。

其次是传输距离的“天花板”。 在速率超过112Gbps PAM4之后,铜缆的可用距离急剧缩短。在1米以上的距离,铜缆已不实用。这意味着在AI集群中,GPU跨机柜互联几乎全部依赖光纤。

第三是部署刚性问题。 现代AI架构中,单个机柜排可能包含256条设备电缆跨接。如果使用直连铜缆,一旦需要升级换代,所有线缆必须全部更换,造成昂贵的停机时间和大量电子垃圾。

2.2 能耗陷阱:铜互联功耗是光纤的5-20倍

黄仁勋在GTC 2026上说出了一句让整个光纤产业沸腾的话:“下一代AI基础设施将需要大量的光学连接,因为计算需求正迅速增长,铜线已无法满足需求。我们将以前所未有的规模扩大光学产品——坦白说,这是任何光学公司都从未达到过的规模。”

这绝非危言耸听。AI数据中心本身已是高能耗场景,而铜缆的传输功耗是光纤的5-20倍。在万卡级AI集群中,仅铜缆互联产生的能耗就占整个数据中心能耗的30%以上。更糟糕的是,大量铜缆密集部署会形成恶性循环:铜缆自身发热→机房温度升高→需要额外散热系统→进一步推高运营成本→缩短设备使用寿命。

2.3 带宽饥渴:从800G到1.6T的“高速公路”扩容战

回顾过去几年的光模块代际更迭,可以看出这条赛道的迭代速度有多快:

  • 2024年:400G为主流,800G开始上量;

  • 2025年:800G全面爆发,LightCounting数据显示,800G PAM4芯片组出货量翻了近三番,销售额同比翻番;

  • 2026年:800G出货量将再增长一倍以上,1.6T正式进入大规模商用阶段。预计1.6T光模块出货量将增长至数千万端口量级,对应的1.6T芯片组销售额在2026年将突破20亿美元;

  • 2027-2029年:3.2T光模块进入验证期甚至商用初期,下一代速率正在路上。

打个形象的比方:如果400G是“四车道高速”,800G就是“八车道”,1.6T则是“十六车道”——而如今这条高速上的车流量(AI数据)正以指数级增长。

当传统电互联(铜缆)在功耗、距离、带宽密度上全面触及物理极限,大规模引入光互联就成了唯一可行的技术路径。这就是“光进铜退”的底层逻辑。而在这个以光纤为血管的数据中心网络架构里,MPO/MTP光纤跳线是连接一切的基础颗粒。

三、光进铜退:光纤光互联——AI算力的“神经网络”

3.1 产业爆发:英伟达与康宁的超70亿美元大单

资本不会说谎。2026年,光连接产业迎来了历史级别的密集投资:

  • 2026年5月,英伟达与康宁签署多年期战略合作,英伟达拟投入最高32亿美元,推动康宁在美国本土将光连接制造产能提升10倍、光纤产量扩大50%以上,并新建三座先进制造工厂。

  • 2026年3月,英伟达分别与Coherent、Lumentum签署各20亿美元的光互联协议。

  • 短短两个月内,英伟达在光连接领域的承诺投资已超过70亿美元

  • 此前,Meta已与康宁签署高达60亿美元的长期光缆协议。

  • 四大北美云厂商2026年资本开支合计规划高达7250亿美元,同比增长77%。

在中国,亨通光电等龙头厂商也在加速扩产。亨通光电明确将AI数据中心业务列为“最核心的战略方向之一”,其光纤光缆产品已大批量应用于国内外数据中心,并开发了高密度MPO光缆、MPO光缆组件等系列产品。公司计划对内蒙古基地光棒产能在现有基础上提升1.5倍,以满足头部AI数据中心客户的长协订单需求。

高盛的研究报告直接给出了一个惊人的预测:光互联可寻址市场将从当前的约150亿美元,扩张至2027-2028年的约1540亿美元,增幅近10倍

3.2 核心器件:MPO/MTP如何撑起高密度光互联?

如果说光纤是AI数据中心的“神经网络”,那么MPO/MTP连接器就是这个网络中最重要的“突触节点” 。它不是附属品,而是决定互联密度和信号完整性的物理极限边界。

MPO(Multi-Fiber Push-On)连接器是一种将多根光纤集成于单一紧凑单元的高密度连接方案,物理尺寸与一个RJ45网口相当,却能承载单根传统双工LC跳线数倍甚至十数倍的通道密度。

在AI数据中心从400G向800G乃至1.6T过渡的过程中,MPO/MTP接口规格的升级轨迹清晰地刻画了这一产业的进化方向:

网络速率 使用芯数 主流接口方案 推荐光纤等级
100G SR4 8芯(12芯连接器) MPO-12 OM4
400G SR8 16芯全开(8发8收) MPO-16 OM4/OM5
800G SR8 16芯全开 单MPO-16 或 双MPO-12 OM5
1.6T(下一代) 32芯或双16芯聚合 双MPO-16 / MTP-Pro OM5 / 单模OS2

在800G SR8场景下,光模块可使用单MPO-16连接器或双MPO-12连接器,在OM4多模光纤上支持最长50米的传输距离。为确保链路稳定,行业要求每对连接线的损耗控制在≤0.35dB,连接器极性错误或端面灰尘污染都会导致链路直接中断。

MTP与MPO的性能差异在AI集群等高要求场景中尤为关键。MTP是US Conec的注册商标,代表了MPO的增强版本:标准MPO的插入损耗典型值为0.3-0.5dB,而MTP Elite可低至0.1-0.2dB,在高频插拔和机械载荷条件下可靠性显著更优。

在物理部署层面,当前采用预端接MPO主干缆和模块化配线架的光纤结构化布线方案,已经实现了“一次布线、多代升级”的目标。当需要从400G升级到800G或1.6T时,操作人员只需更换两端的收发器模块,而无需触碰布线基础设施,整个升级过程可以做到分钟级完成。单机架即可轻松支持上百条高密度链路,这是传统铜缆时代完全不可想象的能力。

延伸阅读:关于MPO/MTP光纤跳线的完整选型链路(芯数、模式、极性、公母端面),可参阅《MPO/MTP光纤跳线选型实战:芯数、极性、模式一个都不能错——从100G到800G数据中心高密度布线全指南》

3.3 演进方向:CPO、LPO、硅光与全光交换

如果说MPO/MTP是“当前战场”的核心武器,那么CPO(共封装光学)、硅光集成和OCS(全光交换) 则代表了下一场战争的演进方向。

CPO(共封装光学) 是近年来最受关注的前沿技术。它的核心逻辑是将光引擎与交换芯片封装在同一基板上,把光互连的距离从传统的10-20厘米缩短至1-2厘米,从而将信号衰减降到极致。这一设计带来的收益是革命性的:带宽密度较传统方案提升5倍,传输延迟降低80%,每Gbps功耗从0.5W降至0.1W。在OFC 2026上,从1.6T到3.2T的商用方案均已浮出水面,部分厂商甚至展出了面向未来12.8T的架构。

硅光技术则是CPO的底层使能器。它利用CMOS工艺在硅基衬底上制造光学器件,将光模块的成本大幅降低。OFC 2026上,国内首家薄膜铌酸锂光芯片量产代工线MRT正式推出PDK,标志着这一技术从验证走向规模量产。

Molex莫仕在OFC 2026期间推出了CPO+OCS全栈方案,其VersaBeam EBO背板连接器将多达192根光纤整合到一个紧凑接口中,可将部署时间缩短高达85%,密度提升50%。配合高基数OCS(光电路交换)平台,AI基础设施运营商能够动态重新配置网络拓扑结构,而无需高功耗的光-电-光转换。

需要特别指出的是,当前LPO(线性驱动可插拔光学) 方案凭借100%沿用现有供应链和开放生态体系、1-2年即可规模起量等优势,被认为是1.6T时代商用场景的中坚主力;而CPO在维持极高密度、极低能耗上独具优势,是中长期核心方向,两者将长期共存而非相互替代。

四、算电协同:破解能源“紧箍咒”的新基建战略

AI算力基建面临的电力瓶颈,不仅是一个技术问题,更是一个政策和战略问题。

2026年中国政府工作报告首次明确提出实施超大规模智算集群、算电协同等新基建工程,标志着“算电协同”正式上升为国家顶层战略。国家数据局局长刘烈宏透露,全国一体化算力网建设已纳入国家“十五五”规划109项重大工程项目。

更具体的要求是:国家枢纽节点新建算力设施绿电应用占比须达到80%以上。在部分地方,新建大型算力中心必须实现绿电供应与储能配套,不达标项目直接不予备案、不予电网接入。一个更为直观的定位是:5月国务院常务会议明确提出“加强水网、新型电网、算力网、新一代通信网……等规划建设”,将算力网正式放在了与水网、电网同等重要的公共基础设施地位

腾讯云已在布局绿电直供的算电协同模式,让风电、光伏等清洁能源不经公共电网中转,直接输送到数据中心,实现算力与电力的精准匹配。“以电强算、以算促电”的良性循环正在成为行业共识。

为什么光互联在算电协同中如此重要? 因为光纤本身的低功耗特性直接贡献于PUE的降低——在相同的带宽容量下,光纤互联的功耗仅为铜缆的1/5到1/20。这意味着,在绿电供给总量受限的情况下,优先采用光互联的数据中心可以“省出”更多的电力分配给GPU计算,从而在同样的电力配额下跑出更高的算力效率。光互联不仅是通信基础设施,更是算电协同战略中的关键能效杠杆。

五、万亿级大赛道:AI算力基建的未来展望

从算力芯片到数据中心,从铜缆到光纤再到全光交换,AI算力基建正在经历一场从“能用”到“好用”、从“蛮力堆叠”到“精细化设计”的范式跃迁。

几个值得关注的趋势:

  1. 光进铜退不可逆:铜缆在1米以上、224Gbps以上的场景中已全面出局,光纤将逐步渗透至机柜内甚至芯片间的短距互联。

  2. 1.6T成为新战场:2026年是1.6T光模块大规模商用的元年,全球市场规模有望达到约167亿美元(同比增长29%),而下一代3.2T产品的产能也已进入筹备阶段。

  3. 算电协同一体化:新建数据中心不仅要看算力密度,还要看PUE和绿电占比。电力将取代算力成为AI基础设施的第一约束条件。

  4. CPO、LPO、XPO将长期共存:高速互联领域不会出现“赢家通吃”,可插拔模块在Scale-Out场景具有较长的生命周期,将长期与NPO/CPO协同并存。

  5. 物理基础设施的价值回归:当光互联市场规模向千亿美元级别迈进,光纤、光模块、MPO连接器这些“管道工”的角色,正从幕后走到台前,成为决定AI集群算力释放效率的关键瓶颈。正如国家数据局局长刘烈宏所言:“算力设施建设正催生自信息革命以来的又一个万亿级投资周期。”


本文由塔基信息(www.tajiidc.com)技术团队整理。数据参考自LightCounting、中国信通院、IEA、高盛、集邦咨询、国家数据局等公开报告,以及GTC 2026、OFC 2026大会信息。塔基信息作为AI数据中心光互联基础器件提供商,拥有全系列高密度MPO/MTP光纤跳线(8~48芯,单模OM3/OM4/OM5,插入损耗≤0.35dB)及光模块产品。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐