今天,阶跃星辰开放平台正式上线 Step Image Edit 2。

图像生成速度一直是开发者接入时的隐形门槛:一张图十几秒,批量调用时成本和延迟同步放大,实时交互场景几乎无从落地。

Step Image Edit 2 的答案是:3.5B 参数,2 秒单图生成,综合编辑评分在同量级中排名第一,并在通用编辑场景下超越了多个参数量达其 5~6 倍的开源模型


模型亮点

1.轻量级图像编辑模型王者

在 6B 以下同量级模型中,综合编辑能力排名第一。

公开学术榜单 KRIS-Bench 评测结果,Overall 得分 66.16 排名第一,三个评测维度表现如下:

  • Factual(事实性知识)67.34,全榜第一:考察模型对图像中直接可观察属性的感知与操作能力,包括数量、颜色、位置、尺寸等

  • Conceptual(概念性知识)70.44,全榜第一:考察模型是否理解现实世界的运行规律,包括自然科学常识、社会规范等

  • Procedural(程序性知识)56.99:考察模型执行多步推理和复杂逻辑的能力,是三个维度中难度最高的

KRIS-Bench 榜单:https://github.com/mercurystraw/Kris_Bench

2.极致智能密度,跨量级超越

3.5B 参数规模,综合评分超越12B-20B 级开源图像编辑大模型,是兼顾高质量编辑与模型容量的“效能王者”。

这背后有两个技术支撑:

  • 多专家驱动的自演化学习(Multi-Expert Self-Evolution Learning):通过从基座模型衍生多个细分任务专家分支实现差异化训练探索,再通过迭代式自蒸馏将专家知识聚合回基座模型,突破轻量化模型的表征能力瓶颈

  • 分布匹配强化学习(DARL):将强化学习的优化目标转化为模型输出分布与基准分布的流形对齐问题,解决传统强化学习奖励信号稀疏且方差大的问题,在复杂任务中具有更强的收敛稳定性。

3.秒级响应,重塑交互边界

Step Image Edit 2 凭借轻量化架构设计,实现推理响应质的飞跃,单次生图/编辑任务 2s 内即可完成。这种近乎零延迟的执行效率,彻底打破了传统模型在“实时交互修图”上的性能瓶颈,定义了即时创作的新标准。具体速度如下:

模型 文生图耗时 图像编辑耗时
Step Image Edit 2 0.7s 1.6s
旧版模型 Step1x-Edit 11s 22s
Qwen Image Edit + 4-steps lora 3s 6s
Qwen Image Edit 18s 37s
Seedream 5.0 Lite* 7s 15s

*表示闭源模型,耗时采用 API 平均测速结果,其余模型采用H800平均推理耗时结果,测试分辨率统一为 1024 × 1024 图像。


场景与效果

专业创作:IP 创作 & 日常运营、海报设计、梗图制作、漫画

输入prompt

输出图

画一张复古版画风格但带现代奢侈反差的海报,底色依然为高饱和橙色,画面主体是一位穿西装的年轻男性坐在低矮木凳上,双手正在“塑形”一只正在旋转的透明奢侈手提袋,袋体为半透明结构,内部整齐摆放卷心菜、柠檬与胡萝卜,所有物品像陶器一样被“塑造”。 左侧仍然摆放传统陶罐,但其中一个被替换为高端手袋造型,形成视觉冲突;整体依旧使用黑色雕刻线条表现,但在袋子与蔬菜部分加入更细腻的高光刻画,让其显得“更贵”。 顶部标题「LUXURY DAILY」使用粗体大写字母,居中占据上方空间;底部副标题「CRAFTING VALUE FROM NOTHING」居中排列;右侧竖排文字「日常即奢侈」,右下角大字「物」强化概念。

收藏版史诗海报,人物侧脸剪影中生长出完整世界观与经典场景。整体偏电影海报+梦幻水彩插画风,安静、宏大、神圣、怀旧,带纸张颗粒、轻雾感、飞白刷痕与高级留白

日常修图:人像美颜、旅游修图、写真照

输入prompt

输入图

输出图

请去除图像中的反光

衣服换成汉服,头上戴着精致的发簪


价格与接入

API 定价:0.02 元/张。Step Plan 用户可直接使用,额度复用现有体系。公测期(4.28 ~ 5.5 期间)限免。

接入:模型 ID 为 step-image-edit-2,文生图调用 /v1/images/generations,图像编辑调用 /v1/images/edits。详细参数说明参考下方 API 文档。


体验入口

阶跃星辰开放平台(API文档):

https://platform.stepfun.com/docs/zh/guides/models/step-image-edit-2

Step Plan:

https://platform.stepfun.com/docs/zh/step-plan/integrations/image-api

在线体验:

https://platform.stepfun.com/console-tools

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐