当大多数企业还在为"到底该选哪个大模型"纠结时,微软已经悄悄把重点转向了一个更深层次的问题——如何让选好的模型真正跑起来、跑得稳、跑得起

2026年3月11日,微软宣布AI推理平台 Fireworks AI 以公共预览形式正式接入 Microsoft Foundry(国际版)。这不是简单地在 Azure 上多了几个可调用的模型接口,而是意味着企业第一次可以在一个统一平台上,同时完成开放模型的评估、部署、定制、治理与持续运营

换句话说,开放模型不再只是"试一下"的玩具,而是正式拥有了进入企业生产环境的高速通道。

企业为什么越来越离不开开放模型?

2025年底到2026年初,开源大模型迎来了一波"神仙打架"。DeepSeek V3.2、Kimi K2.5、GLM-5、MiniMax M2.5——几款重量级开放模型在短短几个月内密集发布,性能直逼甚至超越闭源模型。

与此同时,企业对开放模型的态度也在发生根本性转变。过去很多企业选择闭源模型,图的是省心、稳定。但现在情况变了——开放模型在成本控制、数据隐私、定制灵活性上的优势越来越明显。越来越多的团队发现,与其把所有业务绑在一个闭源模型上,不如根据不同工作负载选择最合适的开放模型架构,既降低供应商锁定风险,又能更好地匹配业务需求。

但问题也随之而来。当一家企业同时使用多个开放模型时,现实往往是:评估模型用一套工具,部署模型用另一套基础设施,定制和治理又要对接第三个平台。这种碎片化的体验不仅拖慢了创新节奏,也让后续的扩展和维护变得异常痛苦。

这正是 Microsoft Foundry 想要解决的问题。

Microsoft Foundry:从"模型市场"到"企业AI操作系统"

很多人对 Microsoft Foundry 的印象还停留在它最初的名字——Azure AI Foundry。事实上,在2025年11月的 Microsoft Ignite 大会上,微软已经把 Azure AI Foundry 正式更名为 Microsoft Foundry。去掉"Azure"前缀是一个重要信号:它不再只是 Azure 的一项 AI 服务,而是升级为贯穿 Microsoft 365、Teams 及整个企业技术栈的统一智能体 AI 层

现在的 Microsoft Foundry 是什么定位?简单说,它是企业级AI的统一控制平面。无论你用的是 OpenAI 的闭源模型、Anthropic 的 Claude、还是来自 Fireworks AI 的开放模型,都可以在同一个平台里完成模型发现、评估、部署、调用和持续运营。

平台核心能力覆盖了企业AI的完整生命周期:

  • 智能体服务——支持托管式智能体、自动扩缩容和多智能体工作流编排,适合构建复杂的多步骤AI应用。
  • 知识系统(Foundry IQ)——多源检索增强生成(RAG),支持 Azure 数据、SharePoint、Fabric、公共网络等多种数据源,让AI真正理解企业的业务上下文。
  • 工具生态(Foundry Tools)——统一工具注册表,支持 MCP 协议集成第三方工具,内置文件处理、代码执行、图像分析、Bing 搜索等能力。
  • 治理与安全——基于角色的访问控制(RBAC)、组织策略管理,与 Microsoft Purview 合规体系深度集成,满足企业级安全要求。

这些能力不是独立散落的,而是整合在一个统一的开发和管理体验中。对于开发者来说,意味着不需要在不同平台之间反复横跳;对于企业来说,意味着AI投入终于可以形成可持续的能力沉淀。

Fireworks AI 是什么来头?

如果你对 AI 推理赛道不太熟悉,可能会好奇微软为什么选择 Fireworks AI 而不是其他平台。

Fireworks AI 成立于2022年,创始团队来自 PyTorch 核心开发团队,在 Meta 拥有丰富的大规模 AI 基础设施建设经验。公司专注于AI推理,核心产品是一个高性能推理云平台,为企业提供生产级的AI推理基础设施。

几个关键数据可以说明它的实力:

  • 估值40亿美元,2025年10月完成2.5亿美元C轮融资,总融资额超过3.27亿美元,投资方包括红杉资本、Benchmark、英伟达、AMD等。
  • 日处理超过13万亿个token,峰值吞吐量约18万个请求/秒,大型模型上推理速度超过每秒1,000个token。
  • 服务超过 10,000家企业客户,包括 Samsung、Uber、DoorDash、Notion、Shopify、Upwork 等,年化收入已超过2.8亿美元。
  • 代表客户声称,相比其他推理服务提供商,Fireworks 的推理速度快达40倍,成本降低8倍。

这些数据已经在 Artificial Analysis 等独立基准测试中得到验证。而如今,这种经过互联网级场景检验的推理能力,已经可以在 Microsoft Foundry 上直接使用。

这次合作到底意味着什么?

Fireworks AI 接入 Microsoft Foundry 的核心价值可以用一句话概括:让开放模型拥有与闭源模型同等的企业级基础设施支持

具体来说,释放了四个层面的企业价值。

第一,统一控制平面。 开发者不再需要分别登录不同平台来管理不同来源的模型。通过 Foundry 的统一门户,可以浏览模型目录、查看模型卡片、一键部署和测试。所有开放模型和闭源模型在同一个入口下管理,大幅降低了工具碎片化带来的运营负担。

第二,企业级运营闭环。 过去企业使用开放模型,最大的痛点不是模型本身不够好,而是缺乏配套的治理体系。现在通过 Foundry,开放模型的评估、部署、定制、监控和治理都被纳入同一套平台体验中,与现有的 Azure 安全治理边界无缝衔接。

第三,灵活的部署方式。 团队可以根据业务阶段选择不同的部署模式。在实验和开发阶段,可以使用无服务器(Serverless)模式,按 token 量付费,随用随开,无需管理底层基础设施。当应用进入生产阶段后,可以切换到预配吞吐量单位(PTU)模式,获得可预测的稳定性能,更适合对延迟有严格要求的生产级工作负载。

第四,支持自定义模型导入。 企业可以使用 BYOW(Bring Your Own Weights)功能,上传自己微调或量化过的模型权重,直接通过 Fireworks 的推理引擎进行部署。这意味着企业可以在 Foundry 平台上运行针对自身业务场景深度定制过的开放模型,而不需要重建推理基础设施。

首批可用的五大开放模型

目前,开发者通过 Microsoft Foundry 上的 Fireworks AI,可以访问以下开放模型:

DeepSeek V3.2——2025年12月发布,685B参数的混合专家模型,每次推理仅激活37B参数。引入了 DeepSeek Sparse Attention(DSA)机制,长上下文推理成本降低约50%。在 SWE-bench Verified 上得分70%,AIME 2026 数学竞赛得分94.2%,还拿下了国际数学奥林匹克金牌。性价比极高,输入每百万token仅需0.62美元。

Kimi K2.5——2026年1月由月之暗面发布,万亿参数多模态MoE模型。最大亮点是 Agent Swarm 功能,可以将复杂任务分解为最多100个并行子代理同时处理。支持256K上下文窗口,在多步骤网页研究基准 BrowseComp 上超越了 GPT-5.2 Pro。提供即时(3-8秒)、深度思考(8-25秒)、智能体和智能体群四种运行模式。

GLM-5——2026年2月由智谱AI发布,744B参数,每次激活40B。采用 DSA 机制和异步强化学习框架"Slime",专为复杂系统工程和长周期智能体任务设计。SWE-bench Verified 得分77.8%,在衡量长期运营能力的 Vending Bench 2 基准上开源模型排名第一。

MiniMax M2.5——2026年2月由 MiniMax 发布,四款中参数量最小(230B,激活仅10B),但展现出"架构级"规划行为——倾向于在执行前先分解和规划任务。SWE-bench Verified 得分80.2%,为四款最高,完成任务速度比前代快37%。最大优势是性价比高,可在消费级多GPU设备上自托管。

OpenAI gpt-oss-120b——OpenAI 的开放权重模型,输入价格最低(每百万token 0.17美元),适合对成本敏感的大规模应用场景。

所有模型均支持基于 OpenAI/v1 API 的聊天补全调用,开发者无需额外学习新的接口规范。

对开发者和企业的实际影响

从实际角度来看,这次合作降低了企业采用开放模型的门槛。

对于开发者来说,好处是显而易见的。不需要自己搭建和维护复杂的推理基础设施,在 Foundry 的模型目录中选择模型、查看卡片、选择部署方式、开始调用,整个流程在一个平台上完成。如果已经有自己微调的模型,通过 BYOW 功能上传即可,Fireworks 的推理引擎会负责优化运行。

对于企业决策者来说,最大的价值在于"可治理性"。开放模型的性能已经不输闭源模型,但企业一直担心的安全、合规、审计等问题,现在可以通过 Foundry 的企业级治理能力来覆盖。RBAC 权限控制、内容过滤、审计日志、与 Purview 的合规集成——这些原本只服务于闭源模型的企业级能力,现在开放模型也能享受。

对于正在评估AI方案的技术团队来说,Foundry + Fireworks 的组合提供了一个灵活的试验场。可以用 Serverless 模式快速低成本地测试不同模型的效果,确定最佳方案后再切换到 PTU 模式进行规模化部署。这种"先试后买"的路径,大幅降低了技术选型的风险。

写在最后

2026年开年不到三个月,国产大模型已经炸了四波——DeepSeek、Kimi、GLM-5、MiniMax 轮番登场,每一家都在性能上带来了实质性的突破。开放模型的能力已经不再是问题,问题变成了如何让这些能力真正落地到企业的生产系统中

Microsoft Foundry 与 Fireworks AI 的这次合作,本质上是在回答这个问题。它不是在推销某一个模型,而是在搭建一套基础设施——让企业在享受开放模型带来的灵活性、成本优势和定制能力的同时,也能获得企业级的安全保障、统一治理和可持续运营能力。

对正在推进AI转型的企业来说,这或许是一个值得认真关注的信号:开放模型上云的"最后一公里",正在被打通。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐