大家好,我是KDD Cup 2026的宣传人。

如果你关注数据挖掘领域,一定知道KDD Cup的分量——作为国际数据挖掘与知识发现大会(KDD)的官方旗舰赛事,它被誉为世界数据挖掘领域的“世界杯”。每年,全球顶尖的学界泰斗、工业界极客和高校学子都会在这个舞台上同台竞技。

今天,我非常荣幸地向各位CSDN的技术同仁正式介绍KDD Cup 2026的两场重磅挑战。无论你是深耕推荐系统多年的算法工程师,还是对LLM与数据自动化充满想象力的研究者,这里都有一个舞台等你来战。


挑战一:腾讯“统一推荐”挑战赛(Tencent Uni-Rec Challenge)

腾讯主办的这场挑战赛,总奖金高达88.5万美金,直指推荐系统领域一个存在了近二十年的“结构性问题”。

1. 赛题背景:为什么是“统一”?

过去二十年,推荐系统的研究主要沿着两个分支演进:

  • 特征交互模型:专注于处理高维度的多领域分类特征和上下文特征(如用户性别、物品类别)

  • 序列模型:通过用户行为序列(如点击、购买历史)捕捉用户兴趣的动态演变

这两个分支各自取得了巨大成功,但在工业级应用中,它们往往是“各自为政”的。这种分离导致了系统架构复杂、优化目标不一致、扩展性受限等问题。随着模型规模和序列长度不断增长,这种“碎片化”架构的效率越来越低。

2. 挑战目标:构建“大一统”架构

本次比赛的核心命题是:“走向大规模推荐的统一序列建模与特征交互”

参赛者需要开发一种统一的Token化方案和一个同质的、可堆叠的骨干网络,在一个单一架构中同时联合建模“序列用户行为”和“非序列多领域特征”,用于CVR(转化率)预测。

简单来说,就是让推荐模型既能理解用户的静态属性,又能读懂他的行为脉络,而不是分裂成两个“各说各话”的模块。

3. 奖金与荣誉:不止于排行榜

这场比赛的诚意,首先体现在88.5万美金的总奖金池上,但这还不是全部。

双赛道设计

  • 学术赛道(总奖金54万美金):面向全球在校学生(含博士后),冠军奖金高达30万美金

  • 工业赛道(总奖金25.5万美金):面向所有从业者、研究机构和企业,冠军奖金15万美金,4-10名也有Apple iPad Air作为奖励

两大独立创新奖(各4.5万美金):

  • 统一模块创新奖:奖励提出最具启发性、最强大的统一建模模块的团队

  • 尺度定律创新奖:奖励在推荐模型尺度定律(Scaling Law)探索上最严谨、最具洞察力的团队

划重点:这两个奖项独立于排行榜排名!评委将根据技术报告的新颖性和洞察力进行评选。这意味着即使你的AUC(评价指标)不是最高,只要思想足够深刻,依然可以获得顶级认可。

4. 数据与实战:来自真实世界的日志

比赛将提供基于真实广告日志构建的大规模工业级数据集,包含匿名的用户行为序列和多领域特征。你需要直面严格的推理延迟限制——你的模型不仅要准,还要快,因为这是工业界的生命线。

数据集包含两大核心组件:

  • 用户行为序列:用户与物品的交互事件(曝光、点击、转化等),附带时间戳和动作类型等边信息

  • 非序列多领域特征:包括用户属性、物品属性、上下文信号和交叉特征

所有稀疏特征均已匿名化为整数ID,稠密特征以定长浮点向量形式提供,确保公平性和隐私保护。

5. 隐藏福利:腾讯绿色通道

优胜者将有机会获得腾讯提供的极具竞争力的全职或实习Offer。这是一张直通顶级互联网公司的门票。

重要时间节点

  • 比赛开始/发布Demo数据:2026年3月15日

  • 全球报名:3月19日 - 4月23日

  • 第一轮比赛:4月24日 - 5月23日

  • 第二轮比赛:5月25日 - 6月24日

  • 获胜者公布:7月15日

  • KDD 2026正式公布:8月9日

官网地址https://algo.qq.com/


挑战二:复杂数据分析的“数据智能体”挑战赛(Data Agents for Complex Data Analysis)

清华大学与香港科技大学(广州)联合主办的这场比赛,总奖金约3万美金,聚焦于由LLM驱动的下一代数据科学范式——数据智能体

1. 赛题背景:让AI学会“动手分析”

当前的数据+AI系统虽然能优化特定任务,但整个分析流程依然严重依赖人类专家来“指挥”。用户问一个复杂问题,AI可能需要人类帮忙拆解步骤、选择工具、汇总结果。这成了阻碍数据分析规模化的瓶颈。

2. 挑战目标:打造真正的“数据科学家”智能体

比赛要求你构建一个真正自主的AI智能体,它必须具备以下核心能力:

  • 任务分解与规划:将一个高层次分析问题,自主拆解成多步可执行的计划

  • 工具选择与调用:在每一步推理中,知道是该写Python脚本、执行SQL查询,还是调用API

  • 多源异构数据推理:能同时理解结构化表格、非结构化文档(PDF)、图表甚至多模态数据

  • 结果综合:将多个步骤的中间结果汇总,得出最终答案

3. 更广泛的影响

强大的数据智能体有潜力彻底改变我们与数据的交互方式。它们能够:

  • ** democratize 数据科学**:让非专业人士也能通过自然语言进行复杂分析

  • 提升企业效率:自动化数据分析和数据库管理的工作流,带来巨大的效率提升

  • 推动研究进展:刺激智能体架构、规划算法、工具使用和自我反思等方向的新研究

4. 基准测试:DataAgent-Bench

比赛提供了全新的DataAgent-Bench基准。每个任务都像一个微型的数据科学项目:智能体会收到一个包含多种数据源(如SQLite数据库、PDF报告、JSON文件、PNG图表等)的“数据包”,以及一个高层的自然语言问题。

任务示例
智能体需要根据区域市场分析报告,找出同比增长最强的区域,然后从数据库中提取该区域特定品类的销售额,再与图表中的季度目标进行比较,最终计算出百分比差异。

这模拟了真实世界中非线性的、包含分支与合并的复杂推理拓扑。智能体可能需要并发处理多个子任务,最后再汇总结果——这正是现实数据分析的常态。

难度级别
比赛设置了多个难度级别,从简单的线性链任务,到需要分支合并的复杂任务,再到需要循环迭代的博士级难题,确保不同水平的参赛者都能找到适合自己的挑战。

5. 评分机制:严惩“幻觉”

评价体系非常严格,采用两阶段评分:

评分标准

  • 完美:正确完整回答问题,无幻觉内容

  • 可接受:提供有用答案,可能有轻微无害错误

  • 缺失:智能体诚实地回答不知道

  • 错误:提供错误或不相关信息,惩罚幻觉

两阶段评估

  • 阶段1:自动评估,实时反馈,在隐藏测试集上打分

  • 阶段2:人工评估,最终前十名由专家评委人工评审,确保答案质量和现实价值

这种评分机制鼓励开发值得信赖、可靠且诚实的智能体——在不确定时承认不知道,远比胡乱编造更有价值。

6. 奖金与荣誉

  • 总奖金池约3万美金(具体分配待公布)

  • 顶级曝光:获胜团队将有机会在KDD 2026的KDD Cup Workshop上展示方案,并获得正式颁奖典礼的认可

  • 社区认可:在KDD顶级会议上向全球顶尖企业和研究机构展示你的能力

重要时间节点

  • 样本数据与基线发布:2026年3月15日

  • 比赛正式开始/全量数据发布:4月1日

  • 第一阶段(公开赛):4月1日 - 5月15日

  • 第二阶段开始:5月20日

  • 报名截止:5月31日

  • 最终提交截止:6月30日

  • 获胜者通知:7月15日

  • KDD 2026正式公布:8月9日

官网地址https://dataagent.top/


为什么你应该参加KDD Cup 2026?

作为CSDN的技术同仁,我相信你一直在寻找能够真正挑战自我、提升技术视野的机会。KDD Cup 2026能给你带来什么?

1. 技术的巅峰对决

这里是检验你算法实力的最公平、最权威的试金石。你将与全球顶尖高手过招,在解决真实工业级难题的过程中飞速成长。无论是腾讯的海量数据,还是清华/港科大的复杂智能体任务,都能让你的技术栈得到质的提升。

2. 思想的深度交流

两场比赛都设立了超越单纯指标的创新奖项。这意味着你的灵感、洞察力和对技术方向的思考同样宝贵。对于追求技术深度的研究者来说,这是展示思想的最佳平台。

3. 职业的黄金跳板

无论是腾讯的直接Offer机会,还是在KDD顶级会议上向全球顶尖企业和研究机构展示你的能力,这都是简历上无法替代的亮点。许多往届KDD Cup的优胜者,如今都已成为各大公司的技术骨干。

4. 推动领域发展的使命感

无论是“推荐系统大一统”还是“自主数据智能体”,都是决定未来五到十年技术走向的关键课题。你的每一次尝试、每一行代码,都在为整个领域的发展贡献力量。


常见问题解答

Q1:我可以同时参加两个比赛吗?
A:是的,只要符合各赛道的参赛资格要求,你可以同时报名参加两个比赛。

Q2:团队规模有限制吗?
A:腾讯比赛每队1-3人;数据智能体比赛暂未明确限制,建议参考官网最新信息。

Q3:我不是学生,可以参加学术赛道吗?
A:腾讯比赛的学术赛道仅限学生,工业界人士请选择工业赛道。数据智能体比赛对所有人群开放。

Q4:比赛需要提交代码吗?
A:是的,两个比赛都需要提交代码和技术报告,创新奖项的评审尤其看重代码实现和技术洞察。

Q5:腾讯的延迟限制有多严格?
A:具体延迟阈值将在比赛开始后公布,但可以肯定的是,你的模型需要在保证精度的同时具备高效的推理性能。

Q6:数据智能体比赛对硬件有什么要求?
A:比赛主要关注智能体的算法设计,具体硬件要求请参考官网发布的基线系统和环境配置。


2026年的夏天,让我们相约韩国济州岛,在KDD的舞台上,见证新的传奇诞生。

如果你准备好了,请立即访问官网注册,加入这场数据智能的盛宴!

KDD Cup 2026,等你来战!

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐