最近春招开始了,不过时间还是太短了。

节前,我们邀请了一些互联网大厂朋友、今年参加社招和校招面试的同学。

针对新人如何快速入门算法岗、如何准备面试攻略、面试常考点、大模型项目落地经验分享等热门话题进行了深入的讨论。

总结链接:《大模型面试宝典》(2026版) 正式发布!

喜欢本文记得收藏、关注、点赞。更多实战和面试交流,文末加入我们星球


感谢星主邀请,我是来自 985 高校的应届生,秋招拿到拼多多的 offer。

在做出最终选择前,我也认真了解过公司的工作节奏,清楚这里业务压力大、强度高,对于加班和高强度工作,我确实有过担心和犹豫。

但经过慎重考虑,我还是坚定地选择加入。一方面,拼多多给出的薪资待遇对我而言非常有吸引力;另一方面,我非常看重公司务实的业务氛围和硬核的技术场景。

目前我已做好了适应高压节奏、认真投入工作的准备,会以积极的心态面对挑战,踏实做事,快速成长。如果你有问题需要咨询,欢迎与我沟通。

一面

  1. 请3-5分钟自我介绍

  2. 你负责大模型训练全流程的哪个环节(预训练/SFT/RLHF/推理优化/多模态融合)?遇到的最大技术难点是什么?如何解决的?

  3. 讲解RLHF、RLAIF、DPO等大模型对齐技术的原理,对比各类技术的优劣,适合电商客服、导购场景的对齐技术是什么?为什么?

  4. 详细讲解Transformer架构的核心原理,Encoder和Decoder的结构差异,自注意力机制的计算过程,为什么Transformer成为大模型的核心架构?

  5. 深入剖析主流大模型(GPT系列、Qwen、DeepSeek等)的技术架构差异,Decoder-only架构的优势是什么?

  6. 有监督微调(SFT)的核心流程、训练目标、数据集构建原则,SFT阶段容易出现的过拟合、知识遗忘问题如何解决?

  7. 大模型训练日志、指标如何监控?如何判断模型训练是否收敛?遇到训练崩溃如何快速定位问题?

  8. 大模型幻觉问题产生的核心原因,针对电商商品信息生成、智能导购场景,有哪些实用的缓解方案?

  9. 电商场景下多模态大模型需要处理商品图、短视频、语音等数据,模态融合过程中会遇到哪些技术难点?

  10. 你日常使用的大模型开发工具栈、训练框架、推理加速工具,以及熟练掌握的编程语言。

  11. 大模型训练中的分布式训练技术:数据并行、张量并行、流水线并行的原理与适用场景,如何结合使用提升训练效率?

  12. 针对长上下文(Long Context)技术,目前主流解决方案有哪些?电商场景下商品详情、客服对话、订单日志等长文本场景,如何优化大模型长文本理解能力?

  13. 题目:二叉树中的最大路径和

二面

  1. 请介绍一个你最有代表性的大模型项目,你在项目中最核心的技术贡献是什么?

  2. 如果让你重新做这个项目,你会如何优化?

  3. 你在大模型训练Pretrain、SFT、RLHF / DPO中做的哪一块?

  4. SFT 和 RLHF 的本质区别是什么?

  5. 是否有使用到大模型并行训练方式?

  6. Megatron-LM 是如何实现Tensor Parallel的?

  7. ZeRO 的三个阶段分别解决什么问题?

  8. 如果你只有8 张 A100,如何训练一个30B模型?

  9. FlashAttention 为什么更快?

  10. 为什么 LoRA 可以减少训练参数?LoRA 中 rank r 的选择会影响什么?

  11. 题目:无重复字符的最长子串

  12. 题目:LRU Cache

设计一个 LRU 缓存:

class LRUCache {

    LRUCache(int capacity)

    int get(int key)

    void put(int key, int value)

}

要求:

  • get / put 时间复杂度 O(1)

三面

  1. 自我介绍

  2. 你的大模型项目用的数据量级大概是多少?

  3. 数据预处理全流程你是怎么设计的?

  4. 项目中有没有遇到脏数据、低质数据、重复数据、敏感数据问题?具体是什么问题,你用什么技术方案解决的?解决后数据质量提升了多少?

  5. 如果是垂直领域(比如电商、搜索、客服)项目,你是怎么做领域数据适配和数据蒸馏的?有没有构建专属领域指令集?

  6. 你的项目用到了什么基座模型?为什么选这个开源基座?

  7. 训练框架用的是PyTorch、DeepSpeed、Megatron-LM还是Transformers原生方案?有没有做框架层面的二次修改?★

  8. 训练过程中遇到的最棘手的技术故障是什么?

  9. 针对上述问题,你是怎么排查定位根因的?用了哪些调试手段、监控工具?最终优化方案是什么?优化后有什么量化提升?

  10. SFT阶段的指令数据集是怎么构建的?标注规则、样本量级、正负样本比例怎么设计?如何避免指令微调后的知识遗忘问题?

  11. 我看项目涉及多模态,多模态训练过程中,图文不匹配、模态信息失衡问题怎么解决?电商商品图+文案的多模态生成,你有没有相关项目经验?

  12. 你项目里用了哪些客观评估指标?比如PPL、BLEU、ROUGE、MMLU、C-Eval、领域专属准确率,指标结果分别是多少?★

  13. 除了客观指标,有没有做人工主观评估?评估维度、打分规则是什么?怎么降低人工评估的偏差?

  14. 模型训练完后,效果未达预期的情况有没有遇到?

  15. 如果重新做这个项目,你会优化哪些环节?哪些技术选型是踩坑的,下次会更换?

  16. 前沿方向比如Agent-RL、长上下文、高效推理,你在项目中有没有尝试过?

  17. 题目:最长回文子串

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐