24 小时、三个算子、挑战多芯片极限性能。

AI 算力进入智能体时代,多芯片统一优化正成为开发者必破难题。

继巴黎 2026 GOSIM 上全球挑战赛燃爆全场后,由 FlagOS 社区主办的基于KernelGen 产品开发的 24 小时算子双金挑战赛再度重磅回归! 5 月 28 日 - 5 月 29 日,FlagOS 24 小时算子赏金挑战赛・天津站正式开启,作为 2026 世界智能产业博览会同期重磅活动,大赛面向全球开发者发起 AI 算子极限优化挑战,用 Triton/Triton-TLE实力破局,赢现金大奖!

01 为什么这场挑战赛与众不同?

过去一年,随着 Triton、Compiler、Kernel Fusion、多芯适配等方向快速发展,“算子优化”已经从少数底层工程师的专属技能,逐渐成为 AI 系统开发的重要能力。尤其在 Agent 与大模型推理场景中:推理吞吐决定系统上限 、Kernel 性能影响整体时延、编译器能力影响多芯部署效率,算子优化正在成为 AI 基础设施竞争力核心。

而这场挑战赛,是一场面向 AI 系统开发者的真实算子优化挑战。我们希望把这些真实工程问题,直接搬到比赛现场。

参赛者需使用 Triton / Triton-TLE,基于 FlagOS 开源软件栈中的 FlagTree 统一编译器,编写多芯片通用算子代码。FlagTree 支持「一次开发,多芯运行」,代码将在沐曦、天数智芯、海光、基础芯片 4 款 AI 芯片平台上完成统一评测。

24小时极限优化,排行榜实时更新

本次比赛的起止时间为 2026 年 5 月 28 日 15:00(北京时间)至 2026 年 5 月 29 日 15:00,现场赛事结果将在天津智博会同期活动“开放计算赋能智能体”专场进行官方颁奖,全球奖项将于比赛结束并完成官方验证后,于官方社群线上公布。

挑战赛期间,参赛者的每一次提交,都会改变排行榜。分数跳动之间,是开发者与对手、与硬件、与极限性能的反复博弈。

本次挑战赛共设 6 个获奖名额,总奖金池 3000 元!优秀方案将有机会被官方算子库收录,作为官方优化案例展示。

  • 现场最佳奖 ×3(现场颁发)

  • 全球最佳奖 ×3(赛后官方验证,线上社群公布)

正确性与加速比双重考核

  • 正确性测试:参赛代码须通过正确性校验,校验合格方可参与性能成绩核算及最终排名。未通过正确性测试的代码,不予纳入排名序列。

  • 加速比测试:以 Speedup(加速比) 为核心性能指标,综合沐曦、天数智芯、海光、基础芯片 4 款芯片平台的平均加速比进行排名。加速比的基准(baseline)为官方给出的 reference implementation。

  • 评测维度:按正确性测试通过的芯片数量,从高到低排序(全芯片优先);通过数量相同时,按平均加速比从高到低排序。

  • 严格反作弊:严禁通过 try-catch 异常捕获、分支判断等方式,在 Triton 执行失败时兜底调用 PyTorch 内置算子。若代码实际执行路径未运行 Triton 自定义算子,全程仅使用 PyTorch 内置算子,不计成绩,不参与排名;若采用异常捕获、条件分支等手段规避 Triton 执行、fallback 至 Torch 原生算子,一经判定为作弊,直接取消参赛成绩与排名资格。

  • 特殊情况:分数一样者,看提交时间,提交时间在前面的获奖。

02 参赛与报名指南

报名方式:

👇点击链接或扫描下方二维码报名

https://jwolpxeehx.feishu.cn/share/base/form/shrcnhrfevVd60wrSx1hicUvl7e

图片

参赛选手交流渠道:

图片

24 小时、三个真实算子、多芯统一评测。

欢迎来到这场真正面向 AI 系统优化的挑战赛。5 月 28 日15:00,代码提交通道将正式开启,你将有 24 小时,在 Triton / Triton-TLE 的世界里,与四款 AI 芯片深度对话。我们天津见!

👇点击阅读原文链接,马上报名!报名网址:https://kernelgen.flagos.io/challenge?lang=zh

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐