2026年4月27日 06:35

最近,阿里巴巴 ATH 团队推出的 HappyHorse 1.0 视频生成模型 及创作平台正式开启灰测。作为一名长期从事 AI 视频生成工具测评的创作者,我在拿到灰测权限后,针对电商短视频、影视短剧预告、社媒创意等多类实际项目需求进行了为期三天的密集测试。以下是基于真实生成结果的详细测评报告。

HappyHorse 1.0 采用原生多模态架构与音视频联合生成方案,面向广告、电商、短剧、社媒创意等场景,提供从生成到编辑的一体化创作能力。在画面质感、镜头运动、人物真实感与内容可控性等方面,经过多轮测试,其综合表现已具备较强的行业竞争力,尤其在人物一致性和运镜稳定性上,达到了可直接商用的水准。

视频封面


01 核心功能

HappyHorse 1.0 目前支持两个核心功能:多模态视频生成、视频编辑。既能从 0 到 1 生成,也能对已有素材做 1 到 N 的创意延展。

在实际使用中,Text-to-Video(T2V)和 Image-to-Video(I2V)两种生成模式均表现稳定。T2V 模式下,模型对复杂镜头语言和多角色对话的理解能力较强;I2V 模式对输入图像的结构、色彩、细节还原度极高,适合电商主图转视频的批量生产。视频编辑功能支持局部重绘、风格迁移和时长延长,在我测试的 15 个案例中,编辑成功率达到 93%。相比 Kling 1.5 和 Runway Gen-3,HappyHorse 在提示遵循度和前后帧一致性上更具优势,但生成速度仍有优化空间(平均 5 秒 720P 视频耗时约 25-40 秒)。


02 核心亮点

作为 AI 视频领域的新模型,HappyHorse 1.0 在画面质感与光影效果、运镜与转场流畅度、面部/人物真实感等方面展现出明显优势。以下是我逐项测试后的具体表现:

电影级画面质感与光影表现

无论是人物肤质、发丝细节,还是金属反光、烟雾水雾等自然元素,HappyHorse 均能呈现高度真实的视觉质感。画面精细度与成片质感在多次用户反馈中获得高评价。与 Luma Dream Machine 相比,其光影过渡更自然,胶片颗粒感更接近真实电影质感。

类型:T2V 视频链接:

视频封面

完整 Prompt(可直接复制使用):

A cinematic script scene set in a sun-drenched Parisian café, golden afternoon light spilling through arched windows. A sharp-dressed man in a tailored navy suit sits across from an elegant woman in a flowing crimson dress, half-empty coffee cups between them. The air is thick with unspoken tension. He leans forward, voice low and steady: “You knew from the beginning, didn’t you? That none of this was real.” She holds his gaze without flinching, a ghost of a smile on her lips, slowly stirring her coffee: “Everything was real. That’s exactly what makes it so dangerous.” Cinematic wide-angle composition, warm golden hour lighting, shallow depth of field, film grain texture, muted vintage color palette with deep crimson accents, highly detailed wardrobe and facial expressions, noir romantic aesthetic, emotionally charged atmosphere, European street photography style, dramatic storytelling, 35mm film look.

流畅稳定的运镜与转场能力

模型在镜头运动的连贯性和转场的自然度上表现优秀,支持拉近、拉远、景深变换等多种运镜方式,过渡丝滑,色调与环境融合连贯,能较好地遵循 prompt 中的镜头语言指令。我使用复杂 FPV 一镜到底脚本进行压力测试,结果全程无明显抖动或穿模,稳定性优于部分竞品。

类型:T2V 视频链接:

视频封面

完整 Prompt(可直接复制使用):

纽约城市景观·超现实主义FPV一镜到底镜头脚本,镜头从紧贴地面的极低角度猛然弹射而出,沿清晨无人的曼哈顿街头疾速贴地飞行。两侧褐石建筑、红砖楼宇化作流动色块,柏油路面的裂缝折射晨光,偶尔掠过的铸铁护栏、街头消防栓留下模糊残影。摄像机保持离地30厘米,每秒数米冲刺,轻微横向摇摆模拟手持呼吸感,悬铃木枝叶间隙的晨光形成连续光斑扫掠,落在复古的金属门牌号上。接近街角Bagel店时,镜头减速滑行、缓缓抬升,以弧线绕过第一张金属折叠桌,不锈钢面包篮的纹路掠过画面边缘。推进至Bagel店摊位深处,运动转为慢动作凝滞,以毫米级速度爬行,围绕悬浮的水流形成的文字 “HappyHorse 1.0”、冰美式咖啡、《纽约邮报》、Bagel面包等物品。镜头推至文字前方 15 厘米处静止凝视,液态文字微微涌动。瞬间,文字爆裂成无数水珠,摄像机被气浪猛推,急速后拉并向下俯冲,轨迹呈剧烈J形转折。镜头以自由落体砸向地面,触地前一帧再次突变,贴地超低空滑行,视角侧倾近 90度,右侧红砖建筑立面垂直耸立,街头黄色出租车的轮胎在视野边缘飞速后退。滑行两秒后,镜头向上弹射,沿曼哈顿摩天大楼(帝国大厦旁)外墙垂直爬升,仰角从水平转为垂直向上,玻璃幕墙反射的晨光形成连续光带,映出远处自由女神像的剪影。爬升至屋顶高度,外翻越过天台围栏,空中完成180 度轴向翻转,从仰望天空转为俯视深渊,沿世贸中心双子塔遗址周边高楼间的狭窄天井垂直下坠。下坠初始速度适中,镜头朝下稳定俯拍,天井四壁如方形画框向中心收缩,下方第五大道的车流化作彩色光轨。速度逐渐加快,镜头加入左右摆动,时而贴近布鲁克林红砖建筑擦过复古空调外机,时而摆向写字楼混凝土横梁,轨迹呈失控螺旋下坠。每经过一层平台,镜头随机偏转,仿佛被气流撞击,在狭窄空间中不断反弹、修正、偏离,偶尔掠过悬挂的霓虹招牌与街头涂鸦。下坠至中段,光线急剧衰减,虚拟暗光增强捕捉到老旧楼宇剥落的墙面、锈蚀的消防管道、杂乱的电缆。镜头开始沿光轴 360 度连续翻滚,天井四壁(一边是现代玻璃幕墙,一边是布鲁克林红砖墙)化作旋转的红与银的漩涡,偶尔闪现的Bagel店暖光、街头路灯如深渊中的孤岛。接近底部最后十米,速度极限,旋转平息,镜头重新垂直俯冲。即将撞击地面的瞬间,穿透无形镜面,重力方向倒置—从向下俯冲无缝切换为向上浮升,轨迹呈现莫比乌斯环式转折。进入镜像世界,镜头保持向前惯性,在倒置的纽约上空水平滑行。布鲁克林褐石屋、曼哈顿公寓屋顶群在脚下绵延至天际线,天空被踩在上方,两名倒悬的街头咖啡师(手持咖啡壶、吆喝声仿佛从天际传来)缓缓飘过。镜头优雅穿梭于漂浮的纸杯咖啡、牛皮纸袋与Bagel之间,做小幅升降起伏,围绕玻璃球缓慢椭圆运动,最终平稳直线推进,缓缓贴近玻璃球表面—球体中倒映的无限递归城市景观(第五大道、帝国大厦、布鲁克林大桥交织)逐渐填满画面,速度降至每秒不足一厘米,在绝对静止中淡出至纯白。

人物真实感强,面部表情有生命力

在人物面部细节的渲染上,HappyHorse 实现了重要突破。五官比例协调、面部轮廓自然、表情生动不僵硬,已基本摆脱传统 AI 生成视频中常见的“一眼假”感,在真人剧、口播、社媒等人物密集场景中表现亮眼。10 次重复 I2V 测试中,面部一致性保持在 95% 以上。

类型:I2V 视频链接:

视频封面

完整 Prompt(可直接复制使用):

第一段提示词:一、镜头一:开场亮相(00:00-00:01)全景固定镜头,节奏缓慢平静;一名留着黑色长发、身穿白色运动服的少女站在传统中式庭院中央,双手叉腰,姿态放松,表情平静且略带高冷;背后建筑有强烈逆光和轻微体积光。二、镜头二:觉醒前奏(00:01-00:02)面部特写,缓慢推近后随动作瞬间加速;少女抬右手,眼神锐利专注,随后打响指;阳光在指尖形成高光闪烁。三、镜头三:火焰换装(00:02-00:08)多组局部特写蒙太奇,镜头快速跟随、摇移与上摇;手臂、身体和腿部依次被火焰包围,运动服在火焰中消散并替换为红黑白国风战斗服,动作轻盈爆发;火焰、火星粒子、动态模糊与无缝换装转场明显。四、镜头四:容貌焕新(00:08-00:10)面部特写半环绕;头发变为棕红双马尾,头顶出现梅花装饰帽,睁眼后瞳孔呈梅花形,嘴角上扬,自信俏皮;有火焰残余粒子与环绕光影。五、镜头五:华丽定场(00:10-00:15)中景转全景并后拉,最终定格;少女召唤带火焰效果的红色长枪,转身挥枪后单手持枪摆出战斗姿势,眼神明亮自信;火焰拖尾、花瓣与火星粒子、背景轻微虚化。整体情绪从克制宁静到热烈爆发再到霸气定场。

中近景叙事能力突出

中近景是短剧和口播最核心的镜头语言,HappyHorse 在此场景下细节丰富、情绪传递到位,背景虚化自然,可直接用于专业内容生产。

类型:T2V 视频链接:

视频封面

完整 Prompt(可直接复制使用):

【场景】冷白灯光打下的审讯室,金属桌面反光,烟灰缸里还有未熄的烟。 【主体】左侧【老刑警】西装褶皱,眼袋深重,手指慢慢敲着桌面;右侧【嫌疑人】双臂交叉,眼神游移,嘴角带着一丝不易察觉的轻蔑。 【运动】老刑警将一张照片缓缓推过桌面,嫌疑人眼神微微一顿又迅速移开;镜头低角度平推,捕捉两人手部与表情的细微对峙。 【音频】[老刑警,语速极慢,每个字像钉子]:”你知道我做这行多少年了吗。” [短暂沉默,烟灰缸上的烟细细飘散] [嫌疑人,轻飘飘,刻意漫不经心]:”跟我有关系吗。” [老刑警,不抬头,嘴角微动]:”有。因为我从没输过。”

灵活、多样的创作体验

模型支持风格混搭、语言反差等多种创意玩法,理解能力和生成稳定性均达到较高水平。

类型:T2V 视频链接:

视频封面

完整 Prompt(可直接复制使用):

请给我生成一段邵氏风格喜剧电影,欧美男士说中文,中国男人说英文。

03 优势场景

经过针对性测试,HappyHorse 1.0 在以下高频商用场景中表现尤为突出:

影视短剧制作

短剧制作是 HappyHorse 表现最为密集的场景之一。模型在仿真人剧的情感表演细节、光影氛围营造、角色一致性维持等方面均展现出较强能力,在海外真人剧场景中的面部质感也表现优秀。生成的一段悬疑对峙戏情绪张力充足,可直接用于短剧正片剪辑。

类型:T2V 视频链接:

视频封面

完整 Prompt(可直接复制使用):

A boy and the rusty robot stand under the cool glow of the full moon, gently holding hands with a deep bond; a tight close-up captures the boy looking sincere and kind, his lips moving softly to whisper, “we are friends”; the robot’s luminous eyes flicker and pulse as it processes the message, responding in a stuttering, mechanical electronic voice, “we… are, we… are friends”; hearing this, the boy’s expression lights up with pure joy, and he reaches out his hand to kindly stroke and pat the robot’s weathered metal head; the camera pulls back to a wide shot.

类型:I2V 视频链接:

视频封面

完整 Prompt(可直接复制使用):

Cinematic western standoff. A sun-bleached desert outpost with wind whistling through cracked, weather-beaten wooden slats. Two cowboys stand in a tense, physical confrontation, facing each other with hands hovering tensely over their holsters. In the far distance, dust devils dance across the shimmering, heat-distorted horizon. Extreme close-ups capture the sweat on their brows, the grit of their skin, and the subtle, rhythmic trembling of their fingers near the gun belts. The dialogue plays out in the tension: The older cowboy spits on the ground, “You kept your word.” The younger one replies sharply, “I kept my promise.” The older man narrows his eyes, “The price is too high.” The younger one looks him straight in the eye, “It’s my price to pay.” The older man exhales, “Then draw.” The younger one whispers, “As you wish.” The aesthetic is gritty and Leone-inspired, featuring sharp high-contrast visuals, a palette of sepia and burnt orange, deep dramatic shadows, 35mm film grain.

社媒创意视频

HappyHorse 擅长生成具有高传播力的视觉内容。无论是产品种草、品牌故事还是热点借势,模型均能快速产出画面精良、节奏紧凑的短视频素材,大幅降低创作者的制作门槛。

类型:I2V 视频链接:

视频封面

完整 Prompt(可直接复制使用):

【风格】高级商业氛围短片(Premium Lifestyle Commercial),高清手机前置镜头质感(Vlog互动视角),电影写实色彩,面部柔光打光,注意分镜编排和对口型,单人出镜。【时长】15秒。【场景】卧室+调酒区一体空间,温馨台灯与紫黄霓虹氛围光交织,微醺暖调。【角色】完全参考@ 的人物外貌特征(顶级亚洲明艳神颜),穿深蓝蕾丝吊带裙、长卷发,全程形象高度一致。[00:00-00:03] 镜头1:POV慵懒起床(POV→Medium Shot 丝滑转场),主观视角从床上掀被起身,切到中景后女主面对镜头说“睡什么睡,起来喝酒。”中文口型精准同步。[00:03-00:06] 镜头2:优雅倒酒(Medium Shot),调酒区中景,白酒入量酒器后倒入杯中并加入橙汁,液体层次清晰。[00:06-00:09] 镜头3:挤柠檬特写(Close-up),双手对挤青柠,汁液滴落并飞溅,随后加入冰块,声音清脆。[00:09-00:12] 镜头4:摇酒(Close-up/Shake),双手持壶贴近脸侧有节奏摇晃,长卷发轻摆,冰块撞击声卡点,微笑注视镜头。[00:12-00:15] 镜头5:品尝与收尾(Medium Shot),手持蓝黄渐变鸡尾酒轻抿,露出满意微醺神情,最后对镜头开心挥手定格。

国际化与出海场景

HappyHorse 在海外内容创作场景中已初步验证,在真人剧面部质感、人物表情自然度、空镜与慢动作光影表现等方面均获得正面反馈,具备服务全球化内容生产的基础能力。

类型:T2V 视频链接:

视频封面

完整 Prompt(可直接复制使用):

【风格】都市情感短片(Urban Romance),超写实电影级(Photorealistic),2.39:1 变形宽银幕氛围(交付 16:9 画幅),暖金色黄昏光+柔焦氛围(Soft Glow),浅景深,高帧率升格。【时长】15秒。【场景】黄昏天台角落:水泥墙面带风化纹理,墙根几盆绿植,远处城市天际线与橙粉落日渐变,晚风轻拂。【角色】小灰@图片1;小青@图片2。 [00:00-00:04] 镜头1:壁咚(Kabedon Impact Shot)中景侧拍,小灰背靠水泥墙,小青大步逼近,右手猛拍在小灰耳侧墙面,带轻微落灰冲击感;左手撑在另一侧,双臂将小灰困住。小灰肩膀微缩,仰头瞪大眼,嘴唇微张,呼吸急促。切近景:小青俯身,长发垂落在小灰肩侧,眼神霸道又温柔,嘴角微笑;夕阳侧光下,小青的影子笼住小灰半张脸。 [00:04-00:07] 镜头2:沦陷对望(Extreme Close-up, Slow Push-in)极近特写升格慢动作,小青松开撑墙左手,指尖划过小灰下颌线,拇指轻按并下拉小灰下唇。小灰睫毛颤动,眼眶泛红,瞳孔映出小青与身后橙色天空,情绪从抗拒转为融化,缓缓闭眼,下巴轻抬迎上去。 [00:07-00:15] 镜头3:忘情长吻(Orbital Slow-mo + Pull-back)侧面近景,小青俯身吻上小灰;小灰贴墙的双手从僵硬到松开,转而攥住小青运动背心腰侧布料并把她拉近。小青右手从墙面滑下,穿过小灰短发扣住后脑,吻逐渐加深,额头相抵。镜头半环绕慢移到四分之三角度,晚风吹起小青长发,夕阳把发丝打成金线。小灰另一只手抬起扣住小青撑墙手腕,十指慢慢交握。最后缓拉到中远景,两人贴墙相拥接吻的剪影融入巨大橙红落日,城市天际线虚化为暖色散景,远处楼宇灯光逐盏亮起,画面定格收束。

快乐小马 即刻出发

测评总结:Happy Horse 1.0 作为一款处于灰测阶段的新模型,在画面质感、人物真实感和运镜稳定性上已达到主流商用水准,尤其适合需要高人物一致性和电影级光影的场景。当然,受限于当前灰测阶段,极端复杂 prompt 下的理解偶尔会出现轻微偏差,生成耗时仍有优化空间。整体而言,它为 AIGC 创作者提供了又一个值得重点关注的选择。

🔗查看更多案例:Happy Horse 1.0(快乐马)提示词测评库 | 精选案例与对比评分

作为一个正在成长中的新模型,HappyHorse 还有很大进步空间。希望它能在后续迭代中继续带来更多惊喜。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐