24 小时极限竞速｜FlagOS 算子赏金挑战赛来袭，天津智博会同期开战！

FlagOS智算系统软件栈

319人浏览 · 2026-05-29 13:47:11

FlagOS智算系统软件栈 · 2026-05-29 13:47:11 发布

24 小时、三个算子、挑战多芯片极限性能。

AI 算力进入智能体时代，多芯片统一优化正成为开发者必破难题。

继巴黎 2026 GOSIM 上全球挑战赛燃爆全场后，由 FlagOS 社区主办的基于KernelGen 产品开发的 24 小时算子双金挑战赛再度重磅回归！ 5 月 28 日 - 5 月 29 日，FlagOS 24 小时算子赏金挑战赛・天津站正式开启，作为 2026 世界智能产业博览会同期重磅活动，大赛面向全球开发者发起 AI 算子极限优化挑战，用 Triton/Triton-TLE实力破局，赢现金大奖！

01 为什么这场挑战赛与众不同？

过去一年，随着 Triton、Compiler、Kernel Fusion、多芯适配等方向快速发展，“算子优化”已经从少数底层工程师的专属技能，逐渐成为 AI 系统开发的重要能力。尤其在 Agent 与大模型推理场景中：推理吞吐决定系统上限、Kernel 性能影响整体时延、编译器能力影响多芯部署效率，算子优化正在成为 AI 基础设施竞争力核心。

而这场挑战赛，是一场面向 AI 系统开发者的真实算子优化挑战。我们希望把这些真实工程问题，直接搬到比赛现场。

参赛者需使用 Triton / Triton-TLE，基于 FlagOS 开源软件栈中的 FlagTree 统一编译器，编写多芯片通用算子代码。FlagTree 支持「一次开发，多芯运行」，代码将在沐曦、天数智芯、海光、基础芯片 4 款 AI 芯片平台上完成统一评测。

24小时极限优化，排行榜实时更新

本次比赛的起止时间为 2026 年 5 月 28 日 15:00（北京时间）至 2026 年 5 月 29 日 15:00，现场赛事结果将在天津智博会同期活动“开放计算赋能智能体”专场进行官方颁奖，全球奖项将于比赛结束并完成官方验证后，于官方社群线上公布。

挑战赛期间，参赛者的每一次提交，都会改变排行榜。分数跳动之间，是开发者与对手、与硬件、与极限性能的反复博弈。

本次挑战赛共设 6 个获奖名额，总奖金池 3000 元！优秀方案将有机会被官方算子库收录，作为官方优化案例展示。

现场最佳奖 ×3（现场颁发）
全球最佳奖 ×3（赛后官方验证，线上社群公布）

正确性与加速比双重考核

正确性测试：参赛代码须通过正确性校验，校验合格方可参与性能成绩核算及最终排名。未通过正确性测试的代码，不予纳入排名序列。
加速比测试：以 Speedup（加速比）为核心性能指标，综合沐曦、天数智芯、海光、基础芯片 4 款芯片平台的平均加速比进行排名。加速比的基准（baseline）为官方给出的 reference implementation。
评测维度：按正确性测试通过的芯片数量，从高到低排序（全芯片优先）；通过数量相同时，按平均加速比从高到低排序。
严格反作弊：严禁通过 try-catch 异常捕获、分支判断等方式，在 Triton 执行失败时兜底调用 PyTorch 内置算子。若代码实际执行路径未运行 Triton 自定义算子，全程仅使用 PyTorch 内置算子，不计成绩，不参与排名；若采用异常捕获、条件分支等手段规避 Triton 执行、fallback 至 Torch 原生算子，一经判定为作弊，直接取消参赛成绩与排名资格。