开放模型也能享受“企业级待遇“了，Fireworks AI 正式入驻Foundry！

Leinwin

324人浏览 · 2026-03-27 17:00:43

Leinwin · 2026-03-27 17:00:43 发布

当大多数企业还在为"到底该选哪个大模型"纠结时，微软已经悄悄把重点转向了一个更深层次的问题——如何让选好的模型真正跑起来、跑得稳、跑得起。

2026年3月11日，微软宣布AI推理平台 Fireworks AI 以公共预览形式正式接入 Microsoft Foundry（国际版）。这不是简单地在 Azure 上多了几个可调用的模型接口，而是意味着企业第一次可以在一个统一平台上，同时完成开放模型的评估、部署、定制、治理与持续运营。

换句话说，开放模型不再只是"试一下"的玩具，而是正式拥有了进入企业生产环境的高速通道。

企业为什么越来越离不开开放模型？

2025年底到2026年初，开源大模型迎来了一波"神仙打架"。DeepSeek V3.2、Kimi K2.5、GLM-5、MiniMax M2.5——几款重量级开放模型在短短几个月内密集发布，性能直逼甚至超越闭源模型。

与此同时，企业对开放模型的态度也在发生根本性转变。过去很多企业选择闭源模型，图的是省心、稳定。但现在情况变了——开放模型在成本控制、数据隐私、定制灵活性上的优势越来越明显。越来越多的团队发现，与其把所有业务绑在一个闭源模型上，不如根据不同工作负载选择最合适的开放模型架构，既降低供应商锁定风险，又能更好地匹配业务需求。

但问题也随之而来。当一家企业同时使用多个开放模型时，现实往往是：评估模型用一套工具，部署模型用另一套基础设施，定制和治理又要对接第三个平台。这种碎片化的体验不仅拖慢了创新节奏，也让后续的扩展和维护变得异常痛苦。

这正是 Microsoft Foundry 想要解决的问题。

Microsoft Foundry：从"模型市场"到"企业AI操作系统"

很多人对 Microsoft Foundry 的印象还停留在它最初的名字——Azure AI Foundry。事实上，在2025年11月的 Microsoft Ignite 大会上，微软已经把 Azure AI Foundry 正式更名为 Microsoft Foundry。去掉"Azure"前缀是一个重要信号：它不再只是 Azure 的一项 AI 服务，而是升级为贯穿 Microsoft 365、Teams 及整个企业技术栈的统一智能体 AI 层。

现在的 Microsoft Foundry 是什么定位？简单说，它是企业级AI的统一控制平面。无论你用的是 OpenAI 的闭源模型、Anthropic 的 Claude、还是来自 Fireworks AI 的开放模型，都可以在同一个平台里完成模型发现、评估、部署、调用和持续运营。

平台核心能力覆盖了企业AI的完整生命周期：

智能体服务——支持托管式智能体、自动扩缩容和多智能体工作流编排，适合构建复杂的多步骤AI应用。
知识系统（Foundry IQ）——多源检索增强生成（RAG），支持 Azure 数据、SharePoint、Fabric、公共网络等多种数据源，让AI真正理解企业的业务上下文。
工具生态（Foundry Tools）——统一工具注册表，支持 MCP 协议集成第三方工具，内置文件处理、代码执行、图像分析、Bing 搜索等能力。
治理与安全——基于角色的访问控制（RBAC）、组织策略管理，与 Microsoft Purview 合规体系深度集成，满足企业级安全要求。

这些能力不是独立散落的，而是整合在一个统一的开发和管理体验中。对于开发者来说，意味着不需要在不同平台之间反复横跳；对于企业来说，意味着AI投入终于可以形成可持续的能力沉淀。

Fireworks AI 是什么来头？

如果你对 AI 推理赛道不太熟悉，可能会好奇微软为什么选择 Fireworks AI 而不是其他平台。

Fireworks AI 成立于2022年，创始团队来自 PyTorch 核心开发团队，在 Meta 拥有丰富的大规模 AI 基础设施建设经验。公司专注于AI推理，核心产品是一个高性能推理云平台，为企业提供生产级的AI推理基础设施。

几个关键数据可以说明它的实力：

估值40亿美元，2025年10月完成2.5亿美元C轮融资，总融资额超过3.27亿美元，投资方包括红杉资本、Benchmark、英伟达、AMD等。
日处理超过13万亿个token，峰值吞吐量约18万个请求/秒，大型模型上推理速度超过每秒1,000个token。
服务超过 10,000家企业客户，包括 Samsung、Uber、DoorDash、Notion、Shopify、Upwork 等，年化收入已超过2.8亿美元。
代表客户声称，相比其他推理服务提供商，Fireworks 的推理速度快达40倍，成本降低8倍。

这些数据已经在 Artificial Analysis 等独立基准测试中得到验证。而如今，这种经过互联网级场景检验的推理能力，已经可以在 Microsoft Foundry 上直接使用。

这次合作到底意味着什么？

Fireworks AI 接入 Microsoft Foundry 的核心价值可以用一句话概括：让开放模型拥有与闭源模型同等的企业级基础设施支持。

具体来说，释放了四个层面的企业价值。

第一，统一控制平面。 开发者不再需要分别登录不同平台来管理不同来源的模型。通过 Foundry 的统一门户，可以浏览模型目录、查看模型卡片、一键部署和测试。所有开放模型和闭源模型在同一个入口下管理，大幅降低了工具碎片化带来的运营负担。

第二，企业级运营闭环。 过去企业使用开放模型，最大的痛点不是模型本身不够好，而是缺乏配套的治理体系。现在通过 Foundry，开放模型的评估、部署、定制、监控和治理都被纳入同一套平台体验中，与现有的 Azure 安全治理边界无缝衔接。

第三，灵活的部署方式。 团队可以根据业务阶段选择不同的部署模式。在实验和开发阶段，可以使用无服务器（Serverless）模式，按 token 量付费，随用随开，无需管理底层基础设施。当应用进入生产阶段后，可以切换到预配吞吐量单位（PTU）模式，获得可预测的稳定性能，更适合对延迟有严格要求的生产级工作负载。

第四，支持自定义模型导入。 企业可以使用 BYOW（Bring Your Own Weights）功能，上传自己微调或量化过的模型权重，直接通过 Fireworks 的推理引擎进行部署。这意味着企业可以在 Foundry 平台上运行针对自身业务场景深度定制过的开放模型，而不需要重建推理基础设施。

首批可用的五大开放模型

目前，开发者通过 Microsoft Foundry 上的 Fireworks AI，可以访问以下开放模型：

DeepSeek V3.2——2025年12月发布，685B参数的混合专家模型，每次推理仅激活37B参数。引入了 DeepSeek Sparse Attention（DSA）机制，长上下文推理成本降低约50%。在 SWE-bench Verified 上得分70%，AIME 2026 数学竞赛得分94.2%，还拿下了国际数学奥林匹克金牌。性价比极高，输入每百万token仅需0.62美元。

Kimi K2.5——2026年1月由月之暗面发布，万亿参数多模态MoE模型。最大亮点是 Agent Swarm 功能，可以将复杂任务分解为最多100个并行子代理同时处理。支持256K上下文窗口，在多步骤网页研究基准 BrowseComp 上超越了 GPT-5.2 Pro。提供即时（3-8秒）、深度思考（8-25秒）、智能体和智能体群四种运行模式。

GLM-5——2026年2月由智谱AI发布，744B参数，每次激活40B。采用 DSA 机制和异步强化学习框架"Slime"，专为复杂系统工程和长周期智能体任务设计。SWE-bench Verified 得分77.8%，在衡量长期运营能力的 Vending Bench 2 基准上开源模型排名第一。

MiniMax M2.5——2026年2月由 MiniMax 发布，四款中参数量最小（230B，激活仅10B），但展现出"架构级"规划行为——倾向于在执行前先分解和规划任务。SWE-bench Verified 得分80.2%，为四款最高，完成任务速度比前代快37%。最大优势是性价比高，可在消费级多GPU设备上自托管。

OpenAI gpt-oss-120b——OpenAI 的开放权重模型，输入价格最低（每百万token 0.17美元），适合对成本敏感的大规模应用场景。

所有模型均支持基于 OpenAI/v1 API 的聊天补全调用，开发者无需额外学习新的接口规范。

对开发者和企业的实际影响

从实际角度来看，这次合作降低了企业采用开放模型的门槛。

对于开发者来说，好处是显而易见的。不需要自己搭建和维护复杂的推理基础设施，在 Foundry 的模型目录中选择模型、查看卡片、选择部署方式、开始调用，整个流程在一个平台上完成。如果已经有自己微调的模型，通过 BYOW 功能上传即可，Fireworks 的推理引擎会负责优化运行。

对于企业决策者来说，最大的价值在于"可治理性"。开放模型的性能已经不输闭源模型，但企业一直担心的安全、合规、审计等问题，现在可以通过 Foundry 的企业级治理能力来覆盖。RBAC 权限控制、内容过滤、审计日志、与 Purview 的合规集成——这些原本只服务于闭源模型的企业级能力，现在开放模型也能享受。

对于正在评估AI方案的技术团队来说，Foundry + Fireworks 的组合提供了一个灵活的试验场。可以用 Serverless 模式快速低成本地测试不同模型的效果，确定最佳方案后再切换到 PTU 模式进行规模化部署。这种"先试后买"的路径，大幅降低了技术选型的风险。

写在最后

2026年开年不到三个月，国产大模型已经炸了四波——DeepSeek、Kimi、GLM-5、MiniMax 轮番登场，每一家都在性能上带来了实质性的突破。开放模型的能力已经不再是问题，问题变成了如何让这些能力真正落地到企业的生产系统中。

Microsoft Foundry 与 Fireworks AI 的这次合作，本质上是在回答这个问题。它不是在推销某一个模型，而是在搭建一套基础设施——让企业在享受开放模型带来的灵活性、成本优势和定制能力的同时，也能获得企业级的安全保障、统一治理和可持续运营能力。

对正在推进AI转型的企业来说，这或许是一个值得认真关注的信号：开放模型上云的"最后一公里"，正在被打通。

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

大模型在多核CPU上的推理优化：线程亲和性与NUMA感知

AtomGit开源社区

【信息科学与工程学】【数据科学】五十篇运营、销售、产品、舆论及利益链条治理方面的核心规则模型10

申请A（优先级9，需100核），B（优先级7，需80核），C（优先级5，需120核）。结合成本，给出建议。根据历史用量和业务预测，自动化计算应在何时、购买何种类型（标准/可转换）、何种期限（1年/3年）、何种付款选项（全预付/部分预付/无预付）的RI或SP，以及购买多少数量，在满足业务需求的前提下最小化总拥有成本（TCO）。：规则从简单的账单汇总（R-FIN-01），演进到主动的购买优化（R-FI

AtomGit开源社区

Laravel 7.x 核心特性全解析

Laravel 7.x带来多项重要改进：路由模型绑定支持自定义键名和解析逻辑；新增流畅的HTTP客户端简化外部API调用；允许自定义模型类型转换；增强多用户认证功能；引入密码确认中间件提升安全性。测试方面优化了路由缓存、支持并行测试，改进HTTP和数据库测试工具。其他亮点包括邮件模板设计、Eloquent子查询增强、CORS支持等。该版本要求PHP≥7.2.5，为后续版本升级奠定了基础，重点提升了