蚂蚁灵光详细报告:为什么做这个 + 布局是什么

写这篇之前先讲个画面。

2025 年 11 月 18 日早上,蚂蚁集团杭州总部园区。一位戴白色鸭舌帽、穿黑色休闲装的老人低调走进园区,旁边是蚂蚁集团董事长井贤栋和 CEO 韩歆毅。这人是马云。

那一天蚂蚁正式发布了全模态通用 AI 助手"灵光"。

但这不是简单的产品发布会。马云亲自到访这件事本身就说明——灵光对蚂蚁来说不是一个 to C 的实验产品,是马云退休后蚂蚁集团 AGI 战略的代表作

而蚂蚁团队最初汇报"灵光年底达 20 万用户"的目标时,马云直接当面打回去——“这个目标太低了,要往前冲第一!”

后面的故事大家都看到了——灵光上线 4 天破 100 万下载,6 天破 200 万,这个数字超过 ChatGPT 首周 60.6 万、Claude 15.7 万、Sora2 五天破百万的速度。截至 2025 年 12 月 26 日用户已经创建了 1200 万个"闪应用"

这是过去三年中国 AI to C 产品里最快的一次起跑。

但灵光真正的故事不是"破百万有多快"。是蚂蚁这家原本以金融科技为底色的公司,为什么突然在 11 月这个时间点发了一款看起来跟支付宝完全无关的通用 AI 助手——而且把它当成"换底牌"级别的战略

下面把这件事完整拆开。

DeepSeek R1:让蚂蚁决定 All in AGI 的那一晚

故事的真正起点不是 11 月 18 日,是 2025 年 1 月。

那天 DeepSeek R1 发布。蚂蚁集团 CTO 何征宇后来回忆这件事用了三个词——“兴奋、紧迫感、羞愧”

兴奋是因为 R1 用极小资源做出了世界一流的模型——证明 AGI 不一定是几百亿、上千亿美金才能玩的游戏。

紧迫感是因为蚂蚁意识到——自己一直在做 AI,但没有做出像 R1 这样的产品级影响力

羞愧是因为——“同样是金融科技出身,相关能力也不差,但速度却落后了”

何征宇的原话——“AGI 原来是几百亿、上千亿美金的传说,DeepSeek 用很小的资源投入就把它做出来了,这给了我们极大的信心。我们也在反思,以往我们很多的技术积累,没有把它很好地表达出来,整合到一起,让用户直接能感受到价值。”

这段话翻译过来是——蚂蚁有技术,但没把技术翻译成用户能感受到的产品

R1 之后蚂蚁集团内部启动了一个动作。春节后立刻拉团队、立项

3 月——成立独立 AGI 组织 “Inclusion AI”(普惠 AI)。这是一个 200 多人的"探索小组",不是传统研发部门,是 Research(研究)+ Engineering(工程)+ Producting(产品)三位一体的组织——对标谷歌的 DeepMind

何征宇直接领头。蚂蚁副总裁张俊杰、灵光 App 负责人蔡伟带产品团队。

4 月 25 日——蚂蚁推出 “Plan A” AI 人才专项计划——面向全球一流高校招募顶尖 AI 人才。何征宇原话——“对于顶级人才我们只有 plan A,没有 plan B”

6 月——发布 AI 健康应用 AQ(基于 2024 年 9 月的"AI 健康管家"升级)。这是蚂蚁第一个真正面向 C 端的独立 AI 应用,首月 MAU 突破千万——是首个月活破千万的行业专业级 AI 应用。

10 月 14 日——蚂蚁百灵团队发布两款万亿参数大模型——Ling-1T(万亿参数通用大语言模型)+ Ring-1T(万亿参数思考模型)。蚂蚁正式跻身万亿参数模型阵营。

11 月 18 日——灵光发布

整条时间线压得非常紧。从 R1 出现到灵光发布只用了 10 个月。这 10 个月里蚂蚁做了人事重组、组织架构调整、人才招聘、模型训练、产品研发——把一个不算前沿的金融科技公司硬转成 AGI 第一梯队玩家。

三大功能:灵光对话 + 灵光闪应用 + 灵光开眼

灵光首期上线了三大核心功能。每个功能背后都有不同的战略意图。

第一,灵光对话——多模态信息呈现的革命

传统 AI 聊天的体验是——你问一句,AI 回一大段密密麻麻的文字。灵光把这个范式改了。灵光的回答不是 Markdown 文字流,是基于全代码生成的多模态内容呈现——图表、3D 模型、动画、卡片、动态布局全部即时生成。

举个例子——询问"什么是 ETF",传统 AI 给一段文字。灵光给的是带配图、带动态图表、带交互组件的"知识卡片"——视觉效果像精心设计的 PPT。

询问"糖醋小排怎么做"——灵光直接产出图文并茂的分步教学,每一步配上动作示意图。

询问"松江新城到人民广场不同路线的通勤成本"——灵光会同时生成自驾、打车、地铁三种方案,把油费、地铁票价、打车价格全算出来,还配上路线图。

这不是用模板填充——所有这些组件都是模型根据对话情境即时生成的原创代码

第二,灵光闪应用——首个消费级 Coding Agent

这是灵光最具有破坏性的能力。用户用一句自然语言,30 秒内生成一个完整的可交互、可编辑、可分享的小应用

举几个真实例子——

  • “做一个倒计时器”——30 秒生成
  • “做一个像素画板,64x64”——30 秒生成
  • “做一个减脂食谱抽签器”——30 秒生成
  • “做一个英语单词打卡工具”——30 秒生成
  • “做一个家务分配应用”——30 秒生成
  • “做一个球队球员数据榜单”——30 秒生成

注意几个关键点——

灵光的闪应用不是静态前端页面——是真正能调用大模型后端能力的完整应用。比如你做一个"AI 旅行规划器",它真的会调用模型生成行程,不是预先写死的内容。

灵光的闪应用可以分享——分享后别人也能直接使用、二次编辑。

灵光的闪应用可以保存——像真正的 App 一样存在用户的"应用集合"里,随时打开使用。

这个功能本质上把"开发应用"这件事的门槛降到了零。过去开发一个应用需要会编程、会设计、要花几天到几周时间。现在普通用户用一句话、30 秒能拿到一个能用的应用

蔡伟在采访里讲——“灵光闪应用是新一代消费级 Coding Agent”。这个定位很关键——Coding Agent 在过去都是面向程序员的(Claude Code、Cursor、GitHub Copilot),灵光是第一个把 Coding Agent 做成 to C 形态的产品。

第三,灵光开眼——通向具身智能的入口

灵光开眼是一个视觉助手。用户可以——

  • 上传图片让 AI 识别
  • 实时拍照让 AI 解读
  • 通过摄像头实时观察物理世界

应用场景——

  • 旅游时对准建筑,灵光实时讲解
  • 超市看到没见过的水果,扫一下知道产地、营养、吃法
  • 修家电时拍下故障点,AI 给修理建议

但灵光开眼背后的真正意图比"AI 视觉助手"深得多。

何征宇在采访里讲过一句话——“AGI 不应该只在数字世界里面,它最后还是会回到物理世界里面。'灵光开眼’未来也可能是机器人的眼睛。”

这句话点出了灵光开眼的真正定位——为蚂蚁旗下的具身智能公司"灵波科技"做技术铺垫。"灵波"是蚂蚁投资的具身智能创业公司,做的是单场景服务机器人 Robbyant-R1。当机器人需要看懂物理世界的时候,需要的是灵光开眼这套技术栈

简单说——灵光开眼今天是手机视觉助手,明天是机器人的眼睛。这是蚂蚁押注下一代计算平台的关键一步。

蚂蚁的三大 AI 产品矩阵:AQ + 灵光 + 蚂小财

讲完灵光本身,得讲它在蚂蚁 AGI 矩阵里的位置。

蚂蚁不是在做一个 AI 产品,是在做三个——

AQ:AI 健康管家。垂直医疗健康场景。首月活破千万,是行业首个月活破千万的专业级 AI 应用。绑定支付宝医保码、电子处方、医院挂号等真实医疗资源。

灵光:通用 AI 助手。覆盖效率工具、信息获取、应用创造、视觉理解四个核心场景。

蚂小财:AI 理财管家。垂直金融场景。何征宇的原话——“想让每个人都有一个数字巴菲特”

这三个产品形成了**"通用 + 健康 + 财富"的三元矩阵**——覆盖中国普通人最高频的三个生活痛点:日常工具、健康管理、理财投资。

何征宇在采访里讲了一个非常关键的话——“AGI 目前不管是技术还是市场都空间巨大、充满不确定性,排兵的逻辑好比在沙漠找水,一定不会把所有人都派到一个方向上。”

意思是——蚂蚁不知道哪个方向会成为"AGI 时代的支付宝",所以同时押三个赛道。AQ 押的是垂直健康。蚂小财押的是垂直金融。灵光押的是通用助手。哪个先跑通,蚂蚁就把全部资源往哪个方向倾斜

这是一个非常蚂蚁式的打法——不下注单一方向,多路并行,让产品自己证明自己

“蚂蚁系” vs “阿里系”:南阿里、北字节背后的真实定位

讲到这里得讲一个特别微妙的事——灵光跟阿里千问的关系

11 月 18 日那天发生了两件事——

  • 蚂蚁发灵光
  • 前一天 11 月 17 日,阿里发千问 App 公测版

两个产品同期发布——这在中国互联网里非常少见。两家关联企业(阿里持有蚂蚁 33%)在同一周发同类产品,外面看起来像内部赛马。

何征宇主动出来回应了这件事——

第一,“双方并没有提前约好时间,只是巧合”。

第二,“千问跟灵光是共赴 AGI 的战友和兄弟”——千问是通用生活服务 + 入口型助手(要做 AI 时代的支付宝),灵光是垂直场景工具创造(30 秒做应用 + 30 秒生成知识 + 30 秒解读图像)。

第三,何征宇用了一个特别有力的比喻——“沙漠中找水分多路一起去”。意思是阿里跟蚂蚁不知道 AGI 终极入口长什么样,所以双线并行——千问做"通用入口",灵光做"垂直工具",两个方向同时验证。

这个解释其实很硬核——它承认了一件事,没有人知道 AGI 时代的"超级 App"是什么样子,所以必须双线下注

更深一层——这种双线打法实际上让阿里系在跟字节系(豆包、即梦、扣子)的竞争里占据了"全面对抗"的位置。

百度百科上有一段非常精准的描述——“当前阿里系与字节系形成’南阿里、北字节’的差异化路径:前者基于民生服务基建打造生产力入口,后者聚焦内容生态延伸”

意思是——阿里 + 蚂蚁系的 AI 战略是把 AI 嵌入"民生服务基建"(千问做生活入口、灵光做生产力工具、AQ 做医疗、蚂小财做理财)——而字节系的 AI 是"内容生态延伸"(豆包做陪伴、即梦做创作)

两条路径有根本差异。阿里蚂蚁系是"AI 帮你办事",字节系是"AI 陪你打发时间"

灵光在这个矩阵里的位置——生产力工具的核心

代码膨胀率 5-6 倍:灵光的真实技术挑战

讲完战略讲技术。何征宇在采访里透露了一个非常关键的数据——“相比纯文本输出,代码的膨胀率大概是 5-6 倍”

这话什么意思?

普通 AI 聊天,模型生成一段文字回答,比如 200 个字符。

灵光生成一个闪应用,背后需要生成的是完整的可执行代码——前端 HTML/CSS/JavaScript、后端逻辑、模型调用接口、数据存储——加起来可能 1000-1200 个字符。5-6 倍的膨胀率

这个膨胀率对模型来说意味着什么?

第一,token 消耗成本暴涨。生成一个闪应用消耗的算力是普通对话的 5-6 倍。

第二,生成速度要求更高。用户说要 30 秒内出应用——这要求模型必须高速生成代码,对推理优化要求极高。

第三,准确性要求更严。普通对话错一两个字用户能容忍。代码错一行可能整个应用就跑不起来

蚂蚁怎么解决这个问题?答案是——自研 + 1+N 模型生态

灵光底层不是单一模型,是"1 个自研基座 + N 个第三方模型"的混合架构。

1(自研基座):百灵大模型(Ling-1T 万亿参数通用语言模型 + Ring-1T 万亿参数思考模型)。负责核心代码生成、应用架构推理。

N(第三方模型):阿里千问、其他开源模型。负责特定任务(图像理解、视频生成等)。

不同任务路由到不同模型,保证灵光在各种任务上的最优性能。这种架构跟 OpenClaw 这种多模型路由网关思路其实是一致的——没有一个模型能在所有任务上最优,必须靠路由层做智能调度

老年用户友好:灵光最反直觉的设计选择

讲一个很多人没想到的事——灵光的设计特别照顾老年用户

蚂蚁百度百科上记录了几个真实案例——

安徽潘姥姥:用灵光生成摆摊宣传海报和食谱,单日收入近千元

南京苏老超老年球队:用灵光生成球员数据榜单,球队管理变得专业化。

杭州社区老人:用一句话指令创建家务分配应用。

北京东湖彩虹模特队:用灵光开发 AI 训练日志应用。

灵光在产品设计上做了几个具体优化——

  • 长按和滑动交互——而不是只靠键盘输入
  • 支持自然对话实现零代码开发——不需要懂任何技术词汇
  • 多模态展示——文字+图片+动画,避免老年人因为字小看不清

为什么蚂蚁这么重视老年用户?

第一,蚂蚁过去 10 年靠支付宝建立了中国最大的"非互联网原住民"用户群——大量四五十岁以上的人通过支付宝第一次接触移动互联网。这是蚂蚁最稳的用户盘。

第二,蚂蚁的产品哲学是"普惠"——降低门槛让普通人也能用。这跟字节"年轻人优先"、OpenAI"专业用户优先"的逻辑完全不同。

第三,老年用户群在 AI 时代被严重忽视——其他 AI 产品几乎都做不到让老人用得起来。蚂蚁如果能把这块吃下来,就吃下了一个 8 亿+ 的中老年用户市场——这个数字比所有其他 AI to C 产品的目标用户加起来还大。

第四,老年用户用 AI 创造价值的故事最动人——潘姥姥单日近千元、模特队、老年球队这些案例自带传播效应。老年用户是灵光最好的免费广告

1 亿创作激励 + 灵光圈社区:构建闪应用生态

灵光不只是一个 App,是一个想搭建生态的平台。

1 亿创作者激励金计划——

  • 每天最高 10000 优秀作品发 100 元
  • 每周最高 100 优质创作者每人 10000 元
  • 累计 1 亿元规模

这是给应用创作者的真金白银。让创作者有动力持续在灵光上做高质量闪应用

灵光圈——业内首个"0 代码手搓应用分享社区"。用户可以——

  • 浏览别人创建的精选闪应用
  • 直接 fork 别人的应用进行二次创作
  • 把自己的应用分享到圈子里
  • 关注其他创作者

全民手搓灵光闪应用大赛——蚂蚁定期举办的官方比赛。鼓励普通用户、老年人、学生、设计师、产品经理跨界参与。

精选作品展示机制——优秀闪应用会被官方推荐到首屏,给创作者带来流量。

把这些机制加起来——蚂蚁在做的不是一个 AI 工具,是一个"应用创造者经济"

类似抖音的逻辑——抖音不是"视频播放器",是"短视频创作者经济平台"。灵光不是"AI 助手",是"零代码应用创作者经济平台"

如果这个生态跑通——未来每个普通人都能成为"应用开发者",每个创作者能靠创作闪应用赚钱,平台靠应用流量货币化。

战略野心:AGI 时代的二维码

何征宇在采访里讲了一句对蚂蚁 AGI 战略最准确的描述——“如果用一句话概括蚂蚁的 AGI 策略,也许是要做 AGI 时代的二维码。”

这句话背后的逻辑特别深。

二维码不是蚂蚁发明的。日本人 1994 年发明的。但支付宝把二维码用在支付场景,让它成为中国人日常生活里最高频的交互方式。每天有 10 亿+ 中国人扫二维码——付钱、加好友、点餐、登录、查信息。

二维码改变了中国人的生活。但二维码本身只是一个简单技术——黑白点阵编码。

蚂蚁的洞察是——AI 也是这样。OpenAI、Anthropic、DeepSeek、Google 已经把 AI 模型本身做出来了。但真正让 AI 像二维码一样"渗透到每个人日常生活"的产品形态还没出现

灵光想做的就是这件事——用最小的成本,找到 AI 的 PMF(产品市场契合)

何征宇原话——“二维码不是我们发明的,但我们是推广最广泛的,把它应用于支付场景。今天的 AI 应用也面临这样的难题。”

这种定位非常聪明——蚂蚁不跟 OpenAI、Anthropic 争"做最强模型",而是争"做最普惠应用"。前者是技术战,后者是产品战。蚂蚁选择了后者。

升级路线:从 AI 助手到 AGI 入口

灵光发布后两个月里持续升级。

12 月 9 日——推出网页版。支持浏览器直接访问,电脑端生成/编辑/管理对话和闪应用。聚焦职场和教育场景——这是把灵光从"个人工具"扩展到"职场工具"的关键一步。

12 月 10 日——新增科普动画生成功能。可以自动生成多学科领域(物理、化学、生物、数学)的原理模拟动画。

12 月 26 日——用户创建闪应用突破 1200 万个。覆盖娱乐、日常工具、教育、健康管理、生活五大场景。

2026 年 2 月——正式推出"上传图片生应用"和"桌面小组件"两大全新能力。意味着灵光的应用生成能力扩展到了图片输入。

2026 年 4 月 27 日——宣布上线"体验世界模型"功能。这个功能跟 Genie/Sora2 这种世界模型方向呼应——让灵光开始具备生成可交互世界的能力。

升级节奏每两周一次。这种节奏在中国 AI to C 产品里是顶级速度——蚂蚁的工程团队完全是按"互联网迭代"逻辑在跑 AI 产品

灵光面临的真实挑战

讲完优势讲挑战。灵光不是没有问题。

挑战一:商业化路径不清楚。灵光至今没公布商业化方案。蔡伟说"当一个互联网产品能够创造足够的用户价值、黏性达到一定水准,实现商业化就是水到渠成的事情"——这话听着对,但具体什么时候、怎么收钱、收谁的钱都没说。对比同期发布的阿里千问已宣布免费开放——蚂蚁灵光看起来没有更清楚的方案。

挑战二:底层模型能力不是断代领先。灵光底层用的是百灵大模型 + 阿里千问 + 第三方开源模型混合。在底层能力上并没有超越 GPT-5 或 Claude Opus 4.7。竞争优势更多在产品形态(多模态展示、闪应用、开眼)。

挑战三:竞品反应快。阿里千问、百度秒哒、字节豆包、OpenAI ChatGPT 都在做"输入指令生成应用"。这个赛道会越来越拥挤。

挑战四:用户增长是工具产品的根本难题。Chatbot 是工具产品,不是内容产品。工具产品的用户黏性天然低——用户用完就走。如何让用户长期回来用,是所有 AI 助手的共同难题。

挑战五:闪应用生态需要时间积累。1200 万闪应用看起来很多,但里面真正有用的、被反复使用的可能只是少数。生态成熟需要时间

这事对中国 AI 创业者的启示

讲三个具体启示。

第一,“消费级 Coding Agent” 是一个新赛道。过去 Coding Agent 都是给程序员用的——Cursor、Claude Code、Copilot。灵光证明了 to C 形态的 Coding Agent 也能跑——普通用户对"我也能造应用"有真实需求。这个赛道在国内还有大量空白——做特定垂直场景的"Coding Agent"(小红书博主用的、小学生用的、宠物主用的)都有机会。

第二,多模态展示比文本回答更有差异化。灵光把"AI 回答"从"文字流"升级成"图文动画混合"。用户的反馈非常正面——“每个截图都像杂志一样”。这给所有 AI to C 产品提了一个醒——当模型能力差不多的时候,谁能把回答呈现得更好,谁就赢

第三,OpenClaw 这种多模型路由网关在 to C 场景有真实价值。灵光自己用的就是"1+N 模型混合架构"——百灵大模型 + 阿里千问 + 第三方开源模型。这个架构跟 OpenClaw 的思路一致——不同任务路由到不同模型,保证最优性能国产 AI to C 产品要做大,必然走多模型混合路线——OpenClaw 这种基础设施层产品在 2026 年的需求会暴涨。

最后说一个观察

灵光这件事最深的启示其实不是"破百万有多快",是蚂蚁这家公司在 R1 之后做的一次完整战略重置

R1 之前,蚂蚁是金融科技公司。
R1 之后,蚂蚁变成 AGI 公司。

10 个月时间——从"AI 是一个业务"变成"AI 是公司战略"

何征宇那段"兴奋、紧迫感、羞愧"的话非常诚实。中国大公司里很少有 CTO 公开说自己"羞愧"——羞愧不是公关辞令,是真实情绪。蚂蚁在 R1 之后认真反思了自己,发现自己有能力但没把能力变成产品,所以决定 All in AGI。

这个决心是花真金白银做出来的——2024 年蚂蚁研发投入 234.5 亿元,主要投向 AI 和数据要素技术——增长 10.67%。Plan A 全球招聘、200 多人 Inclusion AI 团队、万亿参数大模型 Ling-1T/Ring-1T、AQ + 灵光 + 蚂小财三产品矩阵——这些动作加起来是几十亿到上百亿的投入。

马云那句"目标太低了,要往前冲第一" 是这场战略重置的灵魂。

支付宝当年从一个"线上担保支付工具"做成中国最大的金融基础设施,蚂蚁知道怎么做"国民级应用"。灵光可能是支付宝之后蚂蚁的第二个国民级应用——也可能不是,因为 AI 行业的不确定性太大。

但有一件事是确定的——蚂蚁这一次是真的在赌 AGI

不是 to B 解决方案、不是垂直行业 SaaS、不是企业级 AI 平台——是直接做 to C 产品,跟豆包、Kimi、ChatGPT 正面竞争

沙漠里找水的逻辑——蚂蚁同时往 AQ、灵光、蚂小财三个方向派人。哪个先打到水,资源就往哪个方向倾斜。

灵光今天破百万只是开始。真正的考验在 2026-2027 年——能不能把"30 秒生应用"做成"国民级日常工具",能不能把闪应用生态变成"应用创造者经济",能不能把灵光开眼接到机器人产品上。

如果这些都跑通——蚂蚁就完成了从"金融基础设施"到"AGI 基础设施"的世代级转型

如果跑不通——也至少证明了一件事——中国大公司里第一个敢真正 All in AGI 的不是字节、不是百度、不是阿里集团本身,是蚂蚁

R1 给所有人的"兴奋、紧迫感、羞愧",蚂蚁是少数把这三个情绪转化成真实行动的公司。

灵光这件事的真正主角不是产品本身,是这种"敢转型"的决心


参考资料

  • 灵光官网: https://lingguang.antgroup.com
  • 灵光百度百科: https://baike.baidu.com/item/%E7%81%B5%E5%85%89/67003380
  • 量子位灵光报道: https://www.qbitai.com/2025/11/355767.html
  • 量子位 330 万闪应用报道: https://www.qbitai.com/2025/12/358023.html
  • 36 氪灵光深度: https://eu.36kr.com/zh/p/3566906740931716
  • 每经网灵光报道: https://www.nbd.com.cn/articles/2025-11-21/4153176.html
  • 财经客户端蚂蚁 AI 助手报道: https://news.caijingmobile.com/article/detail/559327?source_id=40
  • 中国日报网灵光 4 天破百万: http://cn.chinadaily.com.cn/a/202511/24/WS69241737a310942cc49930d2.html
  • 观察者网灵光体验: https://www.guancha.cn/economy/2025_11_19_797522.shtml
  • 人人都是产品经理灵光分析: https://www.woshipm.com/ai/6298612.html
  • CSDN 火山引擎社区灵光详解: https://adg.csdn.net/694cf4135b9f5f31781aa51c.html

#蚂蚁集团 #灵光 #灵光AI #LingGuang #马云 #何征宇 #蔡伟 #InclusionAI #普惠AI #AGI #百灵大模型 #Ling1T #Ring1T #AQ #蚂小财 #千问 #DeepSeek #闪应用 #灵光开眼 #CodingAgent #多模态 #支付宝 #AI助手 #AI前沿 #深度分析

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐