百度开源“文心大模型4.5系列模型”,从业务场景实测ERNIE-4.5-VL-28B-A3B-Paddle

一、前言:

百度文心大模型4.5系列的开源是其技术发展的重要里程碑,该模型结合原生多模态架构与高效性能,在多个领域表现突出,此次开源选择了GitCode作为国内首发平台,全球开发者可免费下载使用,同时模型也在GitCode社区、飞桨星河社区、HuggingFace等平台同步上线。

在这里插入图片描述

2025年6月30日,百度正式开源文心大模型4.5系列模型,涵盖10款不同参数规模的模型,包括激活参数为47B和3B的混合专家(MoE)模型(最大总参数量达424B),以及0.3B的稠密参数模型。

文心大模型4.5是百度于2025年3月16日发布的自研新一代原生多模态基础模型,其核心技术包括:

  • ①. 多模态异构专家架构‌:通过跨模态参数共享机制实现文本、图像、音频和视频的协同优化,支持模态间知识融合,同时保留单一模态专用参数空间,显著提升多模态理解能力。

‌- ②. 高效训练框架‌:基于飞桨深度学习平台,模型FLOPs利用率达47%,在训练和推理中实现高性能与低延迟。


二、文心大模型4.5系列模型:

文心大模型是百度自主研发的产业级知识增强大模型,以创新性的知识增强技术为核心,从单模态大模型到跨模态、从通用基础大模型到跨领域、跨行业持续创新突破,构建了模型层、工具与平台层,大幅降低人工智能开发和应用门槛,加快人工智能大规模产业化进程并拓展人工智能技术边界。

这次“文心大模型4.5系列模型”开源超22款模型,其中涉及包含激活参数为 47B、3B 的混合专家(MoE)模型,以及参数规模为 0.3B 的稠密型模型。

Logo

旨在为数千万中国开发者提供一个无缝且高效的云端环境,以支持学习、使用和贡献开源项目。

更多推荐