还得是拼多多,算法岗薪资给的真多啊
最近春招开始了,不过时间还是太短了。
节前,我们邀请了一些互联网大厂朋友、今年参加社招和校招面试的同学。
针对新人如何快速入门算法岗、如何准备面试攻略、面试常考点、大模型项目落地经验分享等热门话题进行了深入的讨论。
喜欢本文记得收藏、关注、点赞。更多实战和面试交流,文末加入我们星球
感谢星主邀请,我是来自 985 高校的应届生,秋招拿到拼多多的 offer。
在做出最终选择前,我也认真了解过公司的工作节奏,清楚这里业务压力大、强度高,对于加班和高强度工作,我确实有过担心和犹豫。
但经过慎重考虑,我还是坚定地选择加入。一方面,拼多多给出的薪资待遇对我而言非常有吸引力;另一方面,我非常看重公司务实的业务氛围和硬核的技术场景。
目前我已做好了适应高压节奏、认真投入工作的准备,会以积极的心态面对挑战,踏实做事,快速成长。如果你有问题需要咨询,欢迎与我沟通。
一面
-
请3-5分钟自我介绍
-
你负责大模型训练全流程的哪个环节(预训练/SFT/RLHF/推理优化/多模态融合)?遇到的最大技术难点是什么?如何解决的?
-
讲解RLHF、RLAIF、DPO等大模型对齐技术的原理,对比各类技术的优劣,适合电商客服、导购场景的对齐技术是什么?为什么?
-
详细讲解Transformer架构的核心原理,Encoder和Decoder的结构差异,自注意力机制的计算过程,为什么Transformer成为大模型的核心架构?
-
深入剖析主流大模型(GPT系列、Qwen、DeepSeek等)的技术架构差异,Decoder-only架构的优势是什么?
-
有监督微调(SFT)的核心流程、训练目标、数据集构建原则,SFT阶段容易出现的过拟合、知识遗忘问题如何解决?
-
大模型训练日志、指标如何监控?如何判断模型训练是否收敛?遇到训练崩溃如何快速定位问题?
-
大模型幻觉问题产生的核心原因,针对电商商品信息生成、智能导购场景,有哪些实用的缓解方案?
-
电商场景下多模态大模型需要处理商品图、短视频、语音等数据,模态融合过程中会遇到哪些技术难点?
-
你日常使用的大模型开发工具栈、训练框架、推理加速工具,以及熟练掌握的编程语言。
-
大模型训练中的分布式训练技术:数据并行、张量并行、流水线并行的原理与适用场景,如何结合使用提升训练效率?
-
针对长上下文(Long Context)技术,目前主流解决方案有哪些?电商场景下商品详情、客服对话、订单日志等长文本场景,如何优化大模型长文本理解能力?
-
题目:二叉树中的最大路径和
二面
-
请介绍一个你最有代表性的大模型项目,你在项目中最核心的技术贡献是什么?
-
如果让你重新做这个项目,你会如何优化?
-
你在大模型训练Pretrain、SFT、RLHF / DPO中做的哪一块?
-
SFT 和 RLHF 的本质区别是什么?
-
是否有使用到大模型并行训练方式?
-
Megatron-LM 是如何实现Tensor Parallel的?
-
ZeRO 的三个阶段分别解决什么问题?
-
如果你只有8 张 A100,如何训练一个30B模型?
-
FlashAttention 为什么更快?
-
为什么 LoRA 可以减少训练参数?LoRA 中 rank r 的选择会影响什么?
-
题目:无重复字符的最长子串
-
题目:LRU Cache
设计一个 LRU 缓存:
class LRUCache {
LRUCache(int capacity)
int get(int key)
void put(int key, int value)
}
要求:
- get / put 时间复杂度 O(1)
三面
-
自我介绍
-
你的大模型项目用的数据量级大概是多少?
-
数据预处理全流程你是怎么设计的?
-
项目中有没有遇到脏数据、低质数据、重复数据、敏感数据问题?具体是什么问题,你用什么技术方案解决的?解决后数据质量提升了多少?
-
如果是垂直领域(比如电商、搜索、客服)项目,你是怎么做领域数据适配和数据蒸馏的?有没有构建专属领域指令集?
-
你的项目用到了什么基座模型?为什么选这个开源基座?
-
训练框架用的是PyTorch、DeepSpeed、Megatron-LM还是Transformers原生方案?有没有做框架层面的二次修改?★
-
训练过程中遇到的最棘手的技术故障是什么?
-
针对上述问题,你是怎么排查定位根因的?用了哪些调试手段、监控工具?最终优化方案是什么?优化后有什么量化提升?
-
SFT阶段的指令数据集是怎么构建的?标注规则、样本量级、正负样本比例怎么设计?如何避免指令微调后的知识遗忘问题?
-
我看项目涉及多模态,多模态训练过程中,图文不匹配、模态信息失衡问题怎么解决?电商商品图+文案的多模态生成,你有没有相关项目经验?
-
你项目里用了哪些客观评估指标?比如PPL、BLEU、ROUGE、MMLU、C-Eval、领域专属准确率,指标结果分别是多少?★
-
除了客观指标,有没有做人工主观评估?评估维度、打分规则是什么?怎么降低人工评估的偏差?
-
模型训练完后,效果未达预期的情况有没有遇到?
-
如果重新做这个项目,你会优化哪些环节?哪些技术选型是踩坑的,下次会更换?
-
前沿方向比如Agent-RL、长上下文、高效推理,你在项目中有没有尝试过?
-
题目:最长回文子串
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐


所有评论(0)