从入门到工业落地:生成式推荐系统学习路线 + 论文合集
·
目录
本篇属于生成式推荐系统专栏开篇,接下来会围绕下面的论文进行讲解,希望和大家能一起,跟上生成式推荐领域发展的进程。
概述
推荐系统正经历从判别式检索排序到生成式序列创造的根本性范式跃迁。传统多阶段级联架构(召回 - 粗排 - 精排 - 重排)支撑了过去十年工业级规模化落地,但也面临语义割裂、阶段目标冲突、特征工程依赖重、长尾与冷启动能力弱等固有瓶颈。
生成式推荐以大模型与序列生成为核心,将推荐重构为用户行为序列 → 物品 Token / 语义 ID的端到端生成任务,统一检索、排序、推理与内容生成,兼具强语义理解、跨域泛化、可解释与可交互能力,成为下一代推荐系统的核心方向。
一、生成式推荐:宏观技术全景
1. 核心定义与范式变革
生成式推荐不依赖对候选集逐点打分,而是基于用户历史行为、偏好描述、多模态内容,直接生成物品 ID、语义序列、推荐理由、交互内容,实现从 “匹配” 到 “创造” 的升级。
核心优势:
- 端到端统一:消解召回 - 排序链路割裂,单模型完成全链路
- 语义与知识赋能:借助 LLM 世界知识,突破协同过滤的数据依赖
- 灵活泛化:零 / 少样本适配冷启动、跨域、对话式推荐
- 可解释与可控:支持自然语言指令、约束与理由生成
2. 技术演进三阶段
- 生成式协同过滤:VAE/GAN 建模用户 - 物品分布
- LLM 驱动生成推荐:提示、微调、对齐,融合行为与语义
- 工业级统一生成框架:语义 ID、大序列模型、偏好对齐、端到端部署
3. 核心技术分支
LLM 指令对齐、语义 ID 与生成式检索、端到端工业框架、扩散生成、高效推理、推荐 Agent、多模态生成推荐。
二、经典论文全景清单(按路线学习)
路线 0:传统序列推荐 & 判别式精排(必读基础)
为理解生成式革命,先掌握经典判别式范式。
- SASRec(ICDM 2018)序列推荐里程碑https://arxiv.org/abs/1808.06473
- BERT4Rec(CIKM 2019)双向序列建模标杆https://arxiv.org/abs/1904.06690
- HyFormer(SIGIR 2022)高效混合注意力序列模型https://arxiv.org/abs/2207.05782
- HSTU(ICML 2024)超长序列大模型与缩放定律https://arxiv.org/abs/2406.00355
- RankMixer(2025)工业级高效精排架构https://arxiv.org/abs/2502.04866
路线 1:LLM 指令与对齐(生成式推荐奠基)
- Recommendation as Instruction Following(2023)https://arxiv.org/abs/2305.07001
- TALLRec(RecSys 2023)轻量对齐范式https://arxiv.org/abs/2305.00447
- LLMs are Zero-Shot Rankers(ECIR 2024)https://arxiv.org/abs/2305.08845
- RecLM(ACL 2025)指令微调统一框架https://arxiv.org/abs/2412.19302
- DPO4Rec(ICME 2025)偏好对齐入门https://arxiv.org/abs/2410.05939
- RLHF4Rec(2026)人类反馈对齐https://arxiv.org/abs/2601.03721
路线 2:语义 ID 与生成式检索(核心架构)
- TIGER(NeurIPS 2023)语义 ID 开山之作https://arxiv.org/abs/2305.05065
- Better Generalization with Semantic IDs(2023)https://arxiv.org/abs/2306.08121
- GRID(2025)语义 ID 工业原型https://arxiv.org/abs/2507.22224
- Generating Long Semantic IDs in Parallel(KDD 2025)https://arxiv.org/abs/2506.05781
- Semantic ID Transformer(ICLR 2026)https://arxiv.org/abs/2603.09217
路线 3:端到端工业生成框架(落地核心)
- OneRec(快手 2025)首个规模化端到端生成推荐https://arxiv.org/abs/2502.18965
- OneRec Technical Report(快手 2025)工程部署https://arxiv.org/abs/2506.13695
- OneRec-V2(快手 2025)低成本高效架构https://arxiv.org/abs/2508.20900
- Incremental Learning for LLM-Rec(CIKM 2024)https://arxiv.org/abs/2312.15599
路线 4:扩散生成 & 高效推理(效率突破)
- Diffusion Recommender Model(SIGIR 2023)https://arxiv.org/abs/2306.02487
- Softmax DPO for Recommendation(NeurIPS 2024)https://arxiv.org/abs/2409.12592
- ThinkRec(WWW 2026)推理链可解释推荐https://arxiv.org/abs/2505.15091
路线 5:推荐 Agent & 多模态(2026 前沿)
- AgentRec(2025)交互式推荐智能体https://arxiv.org/abs/2511.03278
- Multi-Modal Generative Rec(CVPR 2026)https://arxiv.org/abs/2603.08155
路线 6:综述与体系(入门必读)
- Generative Recommendation: A Survey(2025)最全综述https://arxiv.org/abs/2510.27157
- LLMs for Generative Recommendation: A Survey(2024)https://arxiv.org/abs/2309.01157
- Preference Alignment Survey(2026)https://arxiv.org/abs/2601.02749
三、阶梯式学习路径(直接照做即可)
阶段 0:前置基础(1 周)
- 学习:SASRec、BERT4Rec、HyFormer、HSTU、RankMixer
- 目标:理解序列建模、精排、传统多阶段架构
阶段 1:生成式入门(1–2 周)
- 学习:2 篇综述 + Instruction Following + TALLRec
- 目标:建立生成式推荐全局认知
阶段 2:核心架构(3–4 周)
- 学习:语义 ID(TIGER/GRID)+ 偏好对齐(DPO 系列)
- 目标:掌握两大主流技术路线
阶段 3:工业落地(4–6 周)
- 学习:OneRec / OneRec-V2 全套
- 目标:端到端训练、对齐、部署、线上迭代
阶段 4:前沿创新(长期)
- 方向:扩散、Agent、多模态、推理链、低延迟部署
四、2026 关键发展方向
- 高效生成与超低延迟推理
- 多模态统一语义 ID 与表示
- 可信生成(去幻觉、可解释、公平性)
- Agent 化交互、反思、工具增强推荐
- 端边云协同与超大规模训练部署
结语
生成式推荐不止是技术升级,更是推荐系统的范式革命:从被动匹配走向主动创造,从数据驱动走向知识 + 数据双轮驱动。
如果你也在研究生成式推荐、LLM 对齐、语义 ID、端到端架构,欢迎一起交流。
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐


所有评论(0)