大模型“六小龙”变“四小强”：一场被DeepSeek加速的行业大逃杀

烟雨AC

574人浏览 · 2026-03-28 09:31:01

烟雨AC · 2026-03-28 09:31:01 发布

一、“AI六小龙”是谁？

“AI六小龙”（又称“AI六小虎”）指的是中国大模型创业浪潮中最受瞩目的六家公司：

公司	成立时间	创始人背景	核心特点
智谱AI	2019年	清华KEG实验室	学院派代表，GLM系列模型，B端/G端深耕
MiniMax	2021年	商汤系	多模态能力强，海外C端市场表现出色
月之暗面（Moonshot）	2023年	清华系（杨植麟）	Kimi长文本能力独树一帜
阶跃星辰（StepFun）	2023年	微软系（姜大昕）	多模态技术领先，印奇2026年入主
百川智能	2023年	搜狗系（王小川）	医疗AI垂直赛道
零一万物	2023年	创新工场（李开复）	轻量化模型，行业解决方案

这六家在2023-2024年备受资本追捧，估值普遍达到数十亿美元，被视为中国“追赶OpenAI”的希望。

二、为什么“六小龙”变成了“四小强”？

在这里插入图片描述

📉 外部冲击：DeepSeek与巨头入场

2025年春节期间，DeepSeek的横空出世彻底改变了行业格局：

开源且免费：DeepSeek证明了强化学习具备更高上限，将开源模型能力提升到比肩世界顶尖水平
动摇估值锚点：既然有现象级的开源模型可以“拿来即用”，投资人和客户开始质疑：为什么还要烧钱自己做基础模型？
大厂全面入场：字节跳动的豆包凭借短视频场景迅速成长为C端“用户之王”，阿里携“千问”“灵光”强势入场，腾讯元宝投入10亿元春节营销

🎯 内部转型：资本理性与商业压力

资本退潮：2025年模型层公司仅完成22笔融资，全年融资额94.16亿元，较上一年腰斩
预训练成本激增：万亿参数模型训练成本高达数千万甚至上亿美元，创业公司难以承受
C端变现困难：用户对C端AI产品的付费意愿有限，获客成本高而生命周期价值低

📊 格局演变：六家走上殊途

公司	2025-2026年战略选择	当前状态
智谱AI	坚持通用模型，深耕B/G端	✅ 2026年1月8日上市，市值579亿港元
MiniMax	坚持通用模型，发力海外C端	✅ 2026年1月9日上市，市值1054亿港元
月之暗面	坚持通用模型，聚焦Agent研发	✅ 2025年底完成5亿美元融资
阶跃星辰	坚持通用模型，押注“AI+终端”	✅ 2026年1月完成超50亿元B+轮融资
百川智能	放弃通用模型，聚焦医疗AI	⚠️ 战略转型，30亿资金储备
零一万物	放弃通用模型，转向行业应用	⚠️ 战略收缩，核心人才流失

因此，只有坚持自研基础模型的四家——智谱、MiniMax、月之暗面、阶跃星辰——被市场称为“AI四小强”。

三、“AI四小强”的差异化路径

🏛️ 智谱AI：B/G端深耕者

核心优势：清华KEG实验室基因，GLM系列模型，国产芯片适配（寒武纪、摩尔线程等40多款）
商业模式：MaaS平台+私有化部署，服务政务、金融、能源等央企客户
最新动态：2026年1月8日以“全球大模型第一股”登陆港交所，市值579亿港元

🌍 MiniMax：海外C端突围者

核心优势：多模态能力强，混合注意力架构降低推理成本
商业模式：C端产品Talkie、海螺AI驱动，70%收入来自海外
最新动态：2026年1月9日上市，市值1054亿港元，获14家基石投资者27.23亿港元认购

📝 月之暗面：技术理想主义者

核心优势：Kimi长文本能力，专注基础模型研发
战略调整：2025年停止大规模品牌投流，回归底层模型训练
最新动态：2025年底完成5亿美元融资，2026年1月发布Kimi2.5模型

📱 阶跃星辰：AI+终端押注者

核心优势：多模态技术强，印奇入主后深度绑定吉利
商业模式：手机（OPPO、荣耀等60%头部品牌，装机量超4200万台）+汽车（吉利银河M9等）
最新动态：2026年1月完成超50亿元B+轮融资，刷新赛道单笔纪录，计划年内港股上市

四、转型派：百川智能与零一万物的选择

🏥 百川智能：All in 医疗

战略转向：放弃通用模型竞争，全力聚焦医疗AI
产品落地：AI儿科医生、AI全科助手已在多家三甲医院落地
资金状况：仍有30亿元资金储备，计划2026年上半年发布AI医疗产品

🔧 零一万物：行业解决方案商

战略转向：放弃万亿参数超大模型，专注轻量化、可私有化部署的行业方案
商业模式：万智平台+“超级员工”Agent，聚焦能源、游戏、法律等垂直领域
面临挑战：核心人才流失（7位高管离职），融资进度不明

五、格局演变的本质：从“技术理想”到“商业现实”

这场从“六小龙”到“四小强”的演变，本质上是中国大模型行业的一次大浪淘沙：

技术门槛提升：预训练成本激增，只有少数玩家能留在牌桌
开源模型普及：DeepSeek等开源模型让“重新造轮子”变得不再必要
资本回归理性：投资人不再为“技术信仰”买单，只看商业化落地
巨头全面入场：字节、阿里、腾讯的生态优势难以撼动

智谱董事长刘德兵对此的总结颇为精辟：

“国内AI行业收敛至少数几家拥有自研能力的厂商，专注基础模型研发，其他公司专注于分发和行业应用。这种收敛并非退步，而是意味着客户和市场如今更加看重大模型能否在真实业务场景中解决实际问题。”

六、未来展望：2026年的关键战役

2026年将是“四小强”真正的分水岭：

关键变量	影响
智谱	上市后能否实现盈利，B端护城河能否持续
MiniMax	海外市场增长能否延续，C端变现能否突破
月之暗面	Agent研发能否转化为商业价值
阶跃星辰	“吉利牢笼”能否突破，能否拓展更多客户

正如北京商报的评论所言：“AI足够大，无论是坚守通用大模型还是深耕垂直赛道，赢家待定。”

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

扣子编程实战：3天零代码搭出企业级自动化系统

AtomGit开源社区

【负荷预测】基于LSTM-KAN的负荷预测研究（Python代码实现）

LSTM-KAN模型结合了LSTM和注意力机制的特点。LSTM是一种特殊的循环神经网络（RNN），通过引入记忆单元和门控机制（遗忘门、输入门、输出门），有效解决了传统RNN在处理长序列数据时存在的梯度消失或梯度爆炸问题，能够捕捉时间序列数据中的长期依赖关系。而注意力机制则能够模拟人类在处理信息时的注意力分配过程，通过为不同时间步的输入数据分配不同的权重，突出重要信息对预测结果的影响。