一、神秘登场:没有首发,却踢翻了排行榜

2026年4月7日,全球最权威的AI模型比赛平台人工分析的视频竞技场(Video Arena)上,突然出现了一个陌生的名字——HappyHorse -1.0

没有官方发布会,没有PR稿,没有CEO站台,甚至连开发者身份都以“匿名(化名)”标注。

然而,它所取得的成绩却让整个人工智能圈为之震惊:

体育类别 HappyHorse-1.0 Elo 排名 与第二名差距
文本转视频(无音频) 1375 🥇第一 领先者约100分
图片转视频(无音频) 1409(历史记录) 🥇第一 领先超过50分
文本转视频(含音频) 约1333 🥇第一 领先约59分
图片转视频(含音频) - 🥈第二 接近种子2.0

要知道,人工分析的视频竞技场排名机制,是数千名真实用户在完全不知情的情况下对两段AI生成视频进行盲测对比,得出的ELO积分体系——这意味着,快乐马的胜出,完全靠真实用户的眼球投票。

在AI领域,ELO外侧50分通常被定义为“明显优势”,外侧100分“断层碾压”。而HappyHorse-1.0在文本转视频中,对第二名Seedance 2.0的领先幅度超过100分——从第二名到第十名,总共也不过才差50分左右,这个分差是多少,自己感受一下。


二、揭秘身份:阿里的“秘密武器”,克林之父操刀

这匹神秘的“欢乐马”到底是谁家养的?

社区第一时间炸开锅,猜测一波一波:谷歌的秘密项目?元的新实验?还是某个草台班子的惊天逆袭?

最终,谜底于4月10日正式揭晓。

HappyHorse-1.0出自阿里巴巴。

坦白说,是阿里宣布淘天集团成立了新成立的ATH AI创新业务部(Alibaba Token Hub,ATH),核心团队是淘天集团的“未来生活实验室(Future Life Lab)”。

更关键的是带队人:张迪

这个名字在AI视频圈人数极重——他是原快手副总裁、可灵AI(Kling AI)的技术负责人。2024年他离开快手,2024年11月重新加入阿里,随即带队投入快乐马项目,历时数月,一朝出鞘,即是爆款。

人才这样的流动规律,足以让字节跳动和快手的人喝一壶了。

有意义的是,HappyHorse的技术基础并非凭空而来。根据多方技术分析,该模型与Sand.ai和**上海人工智能实验室(GAIR Lab)**开源的daVinci-MagiHuman项目存在技术关联,将于2026年3月开源。这也解释了为什么一个“新”的模型,能在这么短的时间内达到架构水平。


三、技术拆解:这匹马到底强在哪里?

1. 150亿配件的“三明治”架构

HappyHorse-1.0采用了一个被称为**统一单流变压器(Unified Single-Stream Transformer)**的架构:

  • 规模:150亿参数(15B)
  • 深度:40层自注意力Transformer
  • 结构:“三明治”设计——首尾各4层模态特定层(处理特定输入输出),中间32层共享参数层(同时处理文本、图像、视频、音频token)
  • 融合:人头门控机制,实现无缝多模态融合

本设计的核心价值在于:文本、图像、视频、音频在同一个序列里联合建模,而不是分别跑几个模型再拼接。这就避免了传统模拟架构中各模块之间信息传递的纹理和不协调问题。

相比之下,ByteDance Seedance 2.0 采用的是“双分支扩散变压器(Dual-Branch Diffusion Transformer)”——一个分支处理视频帧,一个分支处理音频波形,通过交叉连接。两个路线各有中心,从表格表现来看,HappyHorse 在纯视觉质量上前面,Seedance 在含音频中继箭头边缘。

2. 间歇音视频同步生成:不是事后配音

大多数AI视频模型的工作流程是:先生成无声视频,然后单独跑TTS或音效模型,最后合并。这种拼接方式,往往会导致口型不同步、环境音不自然。

HappyHorse-1.0的杀手锏,是原始音视频联合生成——视频帧和音频波形之一在同一次推理中同时产生,天然同步,无需后期处理。

支持语言包括:英语、普通话、粤语、日语、韩语、德语、法语,共7种语言,并且号称超低词错率(WER)唇形同步。

3.极速推理:38秒出1080p

借助DMD-2附加技术(Distribution Matching Distillation),HappyHorse-1.0步去噪即可完成生成,在单张NVIDIA H100上,约38秒即可输出1080p视频。

这个速度在市场上属于第一梯队。

4.开源完全,Apache 2.0协议

这一点至关重要:HappyHorse-1.0宣布完全开源,Apache 2.0,允许商业许可证使用。完整模型权重、后续版本、超分模块和推理代码均在GitHub发布。

这意味着任何开发者、创业公司、内容平台都可以免费获取、部署、二次开发这个目前全球排名第一的视频生成模型。


四、竞争格局:大力招标,真的是王者吗?

与Seedance 2.0的正面交锋

字节跳动的Seedance 2.0是HappyHorse最直接的对手。

从排行榜数据看,两者的差距并没有想象中那么悬殊:

  • 无音频交互:HappyHorse 明显领先
  • 含音频演绎:Seedance 2.0反超或持平
  • 图生视频:HappyHorse以历史最高分领跑

但Seedance 2.0有一个HappyHorse暂时无法匹敌的优势:平台生态。Seedance 2.0已嵌入抖音、CapCut(剪映)、极萌等平台,拥有亿级用户日常使用产生的真实反馈数据。而HappyHorse目前API尚未全面开放,仅处于内测阶段,企业级API有望通过阿里云向客户提供。

OpenAI Sora 黯然退场

颇为耐人寻味的是,就在HappyHorse登顶的同期,OpenAI已宣布关闭Sora的网络/应用程序入口,理由是战略调整,将算力资源集中于编程工具、企业客户和AGI研究。曾经万众瞩目的Sora,如今在人工智能分析排行榜上已滑落至第20名

另一方面,字节跳动的 Seedance 2.0 也正因与好莱坞主要制片公司和流媒体平台的版权纠纷而被迫暂停部分地区的推出。

乔丹同时受到挫败,给了HappyHorse一个绝佳的窗口期。

中国AI视频的集体崛起

值得一提的是,在人工分析转视频排行榜前五名中,有四个来自中国团队的文本:HappyHorse、字节跳动Seed(Seedance)、昆仑万维(Skywork AI)、快手(可灵Kling)。

这不是偶然,而是一种趋势。中国AI视频生成能力,正在从“有对比”走向“一个领先地位”。


五、争议与疑问:这匹马能跑多远?

当然,并不是所有的声音都是喝彩的。社区中也存在一些值得关注的问题。

质疑一:基准测试是否存在边界优化?

部分分析人士指出,HappyHorse-1.0的迅速崛起可能部分得益于对评估场景的特定优化,尤其是人像生成类别在盲测样本中最重要。这是否意味着模型在其他场景下的表现会有所回落,得待更多真实世界测试验证。

质疑二:没有平台支撑,能走多远?

知乎上有一个颇为犀利的观点:AI视频模型再牛,没有平台就是“真空里放纸飞机”。Seedance及时能一战成名,检测抖音庞大的内容分发生态。HappyHorse的母公司阿里虽然有淘宝、优酷等平台,但在短视频前沿一条,与字节的体量相互间隔。

质疑三:API何时全面开放?

目前HappyHorse-1.0的生成API仍然显示“即将推出(Coming Soon)”,尚未向公众全面开放。对于需要集成到产品中的开发者而言,这本身就是最大的否定。

但另外——还有一个耐人寻味的细节:

HappyHorse背后的团队,是在没有抖音/TikTok级别的平台数据加持下,训练培养了一个能够在盲测中把多人玩家摁在地面难度的模型。这是否意味着,在视频生成领域,算法架构和工程能力的权重,正在超越训练数据规模的城河?

如果这个判断成立,那么视频模型扩建的竞争壁垒,可能比所有平台玩家想象的都要低——这个结论,会让很多人夜不能寐。


六、产业影响:这枪打在哪里?

HappyHorse-1.0的出现,至少在以下几个维度产生了冲击:

1.开源正在寻求竞争规则 一个完全开源、商业可用的顶级模型,让“闭源=护城河”的逻辑受到挑战。Sora曾经引以为傲的封闭性,在开源势力面前日益发展脆弱。

2.中美AI视频格局正在重写 过去的一年,美国OpenAI、Google的Veo系列是公认的领跑者。而现在,全球视频模型排行榜前五,中国队掀起了四位主席。这不是一次偶然的超越,而是系统能力的释放。

3.阿里的AI战略悄然转向 阿里CEO吴泳铭将AI定为集团最优先战略。HappyHorse的出现,配合阿里云连续十个季度的AI产品增长三倍,以及中国云市场超40%的市场份额,显示阿里的AI布局正从语言大模型向多模、视频生成纵深扩展。

4.视频生成市场进入红海 AI视频生成市场预计2028年价值超过100亿美元。HappyHorse的加入,配合其开源策略,将进一步压缩商业闭源模型的定价空间,整个市场的价格战恐怕在所难免。


七、总结:王者还是黑马?

回到最初的问题:HappyHorse-1.0能否成为AI视频生成模型领域的新王者?

从目前的数据来看,它已经坐上了全球排行榜的头把交椅,这是不争的事实。

但“排行榜第一”和“行业王者”之间,还隔着:API的全面开放、平台生态的构建、持续迭代的能力、以及来自字节跳动、Google、甚至OpenAI未来反扑的考验。

可以确定的是:HappyHorse-1.0的出现,已经改变了传染病的规则。它证明了一个前电商平台的实验室团队,能够在没有平台级数据、没有大规模突发的情况下,用开源的方式打破了世界严格闭源模型。

这匹马跑得有多远,重点要看阿里接下来如何运营这张牌——是把它收入云服务的版本图,还是开放生态让其自由奔跑?

不管怎样,AI视频生成的战局,因为一匹“欢乐马”的横空出世,变得更加精彩了。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐