110万美元悬赏!AMD发起全球战书:谁能打破DeepSeek与Kimi的推理速度极限?
在 DeepSeek-R1 和 Kimi K2.5 等顶级开源模型确立了万亿参数的工业基准后,真正的极限性能压榨才刚刚开始。谁能在极高并发下打破内存墙?谁能用最优雅的代码实现最高效的算子重构?在当下的 AI 战场,速度即是正义,吞吐量决定生死。由 AMD 与 GPU MODE 联合发起的极客巅峰对决,正式向全球发榜:2026 线上黑客松:AMD E2E Model Speedrun 正式吹响集结号!
- 在这里,你将直接操控 AMD 专为大模型打造的顶配云端 GPU 阵列
- 在这里,没有纸上谈兵的 PPT,只有硬核的绝对速度与吞吐量。
- 在这里,你的极限优化不仅能赢取巨额美金,更将直接合入主流开源框架,定义下一代 AI 推理的工业标准!
作为本次活动的战略社区合作伙伴,CSDN 将全程见证这场智力与算力的巅峰对决。
你,敢来迎战吗?

立即报名:AMD x GPU MODE - E2E Model Speedrun · Luma
百万美金奖池,凭实力“拿钱”
本次挑战赛设立了高达 110 万美元的总奖金池!只要你的技术够硬,名与利双丰收。
决赛入围奖:只要从预选赛杀出重围,跻身 Top 10,每支队伍保底斩获 10,000 美金!
Track 1 赛道桂冠 (DeepSeek-R1-0528):$350,000 独揽!
Track 2 赛道桂冠 (Kimi K2.5 1T FP4):$650,000 独揽!
注:两大赛道完全独立,有实力的团队完全可以双线作战,包揽百万美金!
赛制硬核,分秒必争的“大逃杀”
■ 比赛绝非易事,本次大赛将采用“底层算子突围 + 端到端决赛大考”的双阶段赛制。能留到最后的,注定是地表最强的性能架构师。
■ 预选赛 —— 底层内核的绝对厮杀
所有参赛者需对三大核心 GPU 算子进行极限打磨:
1️⃣ MXFP4 MoE (最高 1500 分)
2️⃣ MLA Decode (最高 1250 分)
3️⃣ MXFP4 GEMM (最高 1000 分)每个内核问题的得分= 最大分值 × [1 -(排名分值/20)]。排名按顺序所对应分值= 0,1,2,…18,19。总分为三项内核问题得分之和,采用上述方法。只有排名前 20 的算子才能获得积分,总分排名前 10 的战队/个人,方可拿到通往决赛的门票。
总决赛 —— 真实世界的端到端狂飙
Top 10 选手将获得 AMD 提供的单节点 8 卡云端 Instinct™ GPU 集群。你们需要在极致并发下,挑战两大明星模型:
■ 赛道 1:DeepSeek-R1-0528 FP4 + MTP
■ 赛道 1 评判标准
在 4、32、128 三种并发度下,你不仅要保证极高的吞吐量 (Token Throughput),还要死守低延迟的交互性 (Interactivity),更要确保模型精度不能掉(本赛道要求 GSM8K ≥ 0.93)。性能门槛(三个并发级别必须同时达标):

■ 赛道 2:Kimi K2.5 1T FP4
■ 赛道 2 评判标准
评分:Token Throughput per GPU(最高 600 分)+ Interactivity(最高 400 分),三个并发级别满分 3000 分。
跑分不是终点
我们寻找的不是为了跑分的“特供版代码”,而是能真正造福全人类 AI 社区的工业级优化。终极必杀规则:代码必须可 Merge!所有具备获奖资格的团队,其提交的代码必须在赛后 2-4 周内,在 AMD 工程师的指导下,成功向 AMD 官方仓库(AMD ATOM / vLLM / SGLang)发起 Pull Request 并完成合并。让你的名字,永远镌刻在推动大模型时代前行的开源主分支上!
决战时刻表 (北京标准时间)
- 报名&预选赛截止时间:4 月 7 日 2:59 PM(TOP 10 诞生)
- 决赛排位战:4 月 8 日 0:00 AM —— 5 月 16 日 2:59 PM
- 全球颁奖典礼: 5 月 19 日
如何加入这场算力狂欢?
无论你是 AI 底层优化老兵、CUDA/Triton 极客,还是系统架构师、开源社区贡献者,只要你对 AI 系统性能工程充满狂热,这里就是你的主场!(支持个人或至多 3 人组队参赛)
第一步:加入 AMD AI Developer Program,获取官方弹药库。
第二步:查阅预选赛参考 kernels,使用 Popcorn CLI 准备你的提交。🔗 预选赛入口及工具库:https://github.com/gpu-mode/reference-kernels别一个人战斗!立刻加入 GPU MODE Discord 社区 及 微信比赛专属群,与全球顶尖开发者同频共振,获取实时赛事更新与官方技术支持!
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐


所有评论(0)