引入

通过前三章的学习,我们已经分别认识了云计算、边缘计算以及为什么需要从云计算走向边缘计算。但一个常见的误解是:边缘计算会取代云计算。事实上,真正发挥两者最大价值的做法不是“二选一”,而是“协同”。边缘计算负责快速响应本地的任务,云计算负责全局统筹与复杂分析,二者融合形成“云-边-端”一体化架构。本章将介绍云边协同的基本思想、典型模式、核心优势,以及当前面临的主要挑战。 

一、为什么需要云边协同

随着5G和物联网时代的到来,传统云计算中心集中存储、计算的模式已经无法满足终端设备对于时效、容量、算力的需求。将云计算的能力下沉到边缘侧、设备侧,并通过中心进行统一交付、运维、管控,将是云计算的重要发展趋势。如今,5G网络的全面商用为海量数据的接入奠定了坚实基础,例如截至2026年3月底,全国5G基站总数已达495.8万个,5G-A(5G演进网络)也已覆盖330个城市。据IoT Analytics统计,到2025年底全球活跃的物联网设备数量已达到211亿台,预计到2035年将超过500亿台。随着海量终端连接和场景化应用的兴起,未来将有超过75%的数据会在边缘侧产生和处理。此外,边缘AI技术也已迎来重大突破,例如2025年Google I/O大会上推出的端侧AI模型Gemma 3n,体积进一步缩小,使得在无需持续联网的情况下,在智能手机等资源受限边缘设备上运行先进的多模态AI成为可能。在实际系统中,很多任务既要求低延迟,又需要全局智能——例如在“车路云一体化”的智慧交通系统中,路侧边缘单元可实现毫秒级识别闯红灯等本地事件,而中心云则负责全城信号灯的协同调度与全局优化,这种云边协同的架构正是该领域的核心方案。单靠云或边都无法完美解决现实世界中的复杂难题,只有两者协同才能兼顾效率与智能。

二、什么是云边协同

云边协同是云计算和边缘计算的融合,旨在实现数据的高效处理和传输。云计算通常指将数据和应用程序存储在远程数据中心的服务器上,通过网络提供服务;而边缘计算则是将数据处理推向距离数据源更近的边缘设备,如传感器、嵌入式系统等。云边协同将云计算的弹性和边缘计算的实时性相结合,以便更好地满足不同场景下的需求。具体而言,云边协同是指将云计算与边缘计算有机融合,形成“云 – 边 – 端”三层协作的计算体系:端(终端设备,如摄像头、传感器、手机)负责数据采集与简单执行;边(边缘节点,如边缘网关、边缘服务器、AI盒子)负责实时处理、本地决策、数据过滤;云(云端数据中心)负责全局模型训练、大数据分析、设备管理、策略下发。协同的本质是分工合作:边缘做“快而浅”的事,云做“慢而深”的事,两者通过网络高效配合。

三、云边协同的优势

云边协同的主要优势包括低延迟、带宽优化、隐私与安全、断网容错、资源高效利用以及多场景应用。低延迟方面,将部分计算任务下沉到边缘设备,减少数据传输到云端的时间,显著降低延迟,对工业自动化、智慧交通等实时性要求高的场景尤为重要。带宽优化方面,边缘设备对数据进行初步处理,仅将必要的摘要数据上传至云端,减少数据传输量,优化带宽利用率,尤其适用于大规模物联网设备场景。隐私与安全方面,允许敏感数据在本地边缘设备上处理,避免将隐私信息传输到云端,例如人脸识别和推荐系统可在边缘端完成部分训练,减少隐私泄露风险。断网容错方面,边缘设备具备独立处理能力,即使网络中断也能继续运行关键任务,在医疗健康、工业控制等领域尤为关键。资源高效利用方面,结合云计算的强大算力和边缘计算的实时性,能够根据任务需求动态分配资源,例如复杂深度学习任务在云端完成,实时决策由边缘设备处理。多场景应用方面,云边协同广泛应用于智慧城市、自动驾驶、虚拟现实、智能家居等领域,如在智慧交通中,边缘设备负责实时分析路况,云端进行全局优化和决策。通过云边协同,云计算和边缘计算的优势得以互补,不仅提升了系统整体性能,还为数据隐私保护和实时性需求提供了有效解决方案。随着5G和物联网的发展,云边协同将在更多领域发挥重要作用。

四、云边协同的几种主要模式

云边协同可从数据、智能、业务编排、应用管理、服务、资源等多个维度进行模式划分。数据协同指边缘对数据进行过滤、聚合、脱敏后上传云端,云端下发元数据或规则到边缘,例如工业传感器数据在边缘过滤噪声,云端仅接收异常波形。智能协同强调实时性任务由边缘处理,非实时或复杂任务卸载到云端,例如智能家居中门锁响应本地执行,家庭用电分析上传云端。业务编排协同指云端训练大模型,边缘部署轻量化模型进行本地推理,边缘将难例回传云端再训练,例如人脸识别模型在云端训练,门禁边缘侧推理,识别失败的照片回传优化。应用管理协同指云端统一管理数千边缘节点,包括应用部署、配置变更、监控告警,例如连锁超市的云端管理平台统一更新所有门店边缘设备的促销算法。服务协同指边缘节点按照云端策略实现部分边缘计算即服务(EC-SaaS),通过EC-SaaS与云端SaaS的协同实现面向客户的按需服务,云端主要提供SaaS服务在云端和边缘节点的服务分布策略,以及云端承担的SaaS服务能力,例如边缘防火墙拦截攻击,云端分析攻击模式并更新所有边缘规则。资源协同指边缘节点提供计算、存储、网络、虚拟化等基础设施资源,具有本地资源调度管理能力,同时接收并执行云端的资源调度管理策略,云端则提供设备管理、资源管理以及网络连接管理等策略。

五、云边协同的典型架构

一个简化的端-边-云三层架构如下:

终端设备采集数据并执行简单动作;边缘节点(通常部署在靠近终端的位置,如基站旁、工厂车间、楼宇弱电间)负责实时处理和本地决策;云端数据中心负责全局分析与模型训练。云端与边缘之间通过标准协议(如MQTT、HTTP、gRPC等)交互,实现任务卸载、模型同步和设备管理。

六、相比纯云/纯边的优势

从多个维度对比:在延迟方面,纯云计算较高(受网络影响),纯边缘计算较低,云边协同同样低(边缘处理实时任务)。在全局视野方面,纯云计算有,纯边缘计算无,云边协同有(云端汇聚分析)。在算力上限方面,纯云计算极高,纯边缘计算有限(受边缘节点性能约束),云边协同几乎无限(云+边互补)。在带宽消耗方面,纯云计算极高(所有数据上传),纯边缘计算低,云边协同低(边缘预处理后上传)。在模型更新能力方面,纯云计算可实时在线更新,纯边缘计算难(孤立节点手工更新),云边协同可自动同步(云端训练→边缘下发)。在单点失败风险方面,纯云计算网络中断则完全不可用,纯边缘计算节点故障仅影响局部区域,云边协同容错性强(边缘可独立运行,云恢复后自动同步)。在隐私保护方面,纯云计算弱(数据集中存储),纯边缘计算强(数据本地留存),云边协同强(敏感数据不出边)。

七、典型应用场景

智慧城市视频监控与分析:边缘各路口盒子实时检测违停、打架、拥堵,并立即报警或调节信号灯;云端汇聚全市事件数据,进行轨迹追踪、热力图分析、警力调度。自动驾驶与车路协同:车载边缘单元处理紧急刹车、障碍物避让,路侧边缘单元提供超视距感知(如前方事故预警);云端提供高精地图动态更新、全局路径规划、车队调度。工业互联网预测性维护:边缘采集设备振动、温度、电流数据,实时判断是否超过阈值并就地报警;云端利用历史大数据训练剩余寿命预测模型,并将模型下发到产线边缘网关。云游戏/AR/VR:边缘渲染画面,降低用户操作到显示的时间;云端负责复杂场景生成、用户进度存档、多人交互协调。

八、面临的挑战

尽管云边协同前景广阔,但在实际落地中仍面临不少挑战。任务卸载与调度决策复杂:一个任务应该放在边缘执行还是卸载到云,需综合考虑延迟、带宽、能耗、边缘负载、云端成本等多因素,动态环境下(如移动设备)决策更加困难;现有策略多基于规则或启发式,缺乏高效的自适应在线优化算法。异构资源与标准不统一:不同厂商的边缘设备(x86、ARM、GPU、NPU)、不同的操作系统和协议,导致云边协同开发困难,应用移植成本高;虽然出现了KubeEdge、OpenYurt等开源框架,但全面统一的标准尚未形成。网络不稳定性与断网容错:云边之间依赖网络通信,一旦网络断连,协同会受影响;边缘节点需具备断网自治能力,但完全独立运行又会失去全局优势;如何在保证边缘自治的同时,在网络恢复后实现数据与状态的无缝同步是重要挑战。安全与隐私的多维风险:边缘节点分布广泛,物理防护较弱,易被入侵,攻击者可能篡改边缘上的模型或数据,进而污染上传到云的信息;需要设计轻量级的边缘可信执行环境、数据加密、模型完整性校验机制。模型分割与协同训练效率:理想的“云训练‑边缘推理‑难例回传”在实践中会遇到通信开销、数据异构、边缘算力有限等问题,例如回传大量难例可能抵消带宽节省的优势;需设计高效的分层联邦学习、压缩回传机制以及边缘侧增量学习算法。运维与监控成本高:云边系统中边缘节点可能成千上万,分布在不同位置,手动升级、故障排查、性能监控的复杂度远高于纯云系统;需要配套的云端运维平台实现边缘节点的自动注册、配置下发、日志采集和远程恢复。

总结

云边协同并非简单地将云计算与边缘计算拼接,而是通过数据、任务、模型、管理等多维度的协同,构建一个兼顾低延迟、全局智能、高安全、低成本的计算生态。它已成为工业互联网、智慧城市、自动驾驶等领域的核心技术架构。然而,任务调度、异构标准、断网容错、安全隐私、协同训练和运维等挑战依然待解决。理解这些挑战,不仅有助于我们正确使用现有云边平台,也为未来设计和优化更智能的协同系统指明了方向。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐