还得是拼多多，算法岗薪资给的真多啊

我爱Python数据挖掘

560人浏览 · 2026-03-18 14:14:08

我爱Python数据挖掘 · 2026-03-18 14:14:08 发布

最近春招开始了，不过时间还是太短了。

节前，我们邀请了一些互联网大厂朋友、今年参加社招和校招面试的同学。

针对新人如何快速入门算法岗、如何准备面试攻略、面试常考点、大模型项目落地经验分享等热门话题进行了深入的讨论。

总结链接：《大模型面试宝典》(2026版) 正式发布！

喜欢本文记得收藏、关注、点赞。更多实战和面试交流，文末加入我们星球

感谢星主邀请，我是来自 985 高校的应届生，秋招拿到拼多多的 offer。

在做出最终选择前，我也认真了解过公司的工作节奏，清楚这里业务压力大、强度高，对于加班和高强度工作，我确实有过担心和犹豫。

但经过慎重考虑，我还是坚定地选择加入。一方面，拼多多给出的薪资待遇对我而言非常有吸引力；另一方面，我非常看重公司务实的业务氛围和硬核的技术场景。

目前我已做好了适应高压节奏、认真投入工作的准备，会以积极的心态面对挑战，踏实做事，快速成长。如果你有问题需要咨询，欢迎与我沟通。

一面

请3-5分钟自我介绍
你负责大模型训练全流程的哪个环节（预训练/SFT/RLHF/推理优化/多模态融合）？遇到的最大技术难点是什么？如何解决的？
讲解RLHF、RLAIF、DPO等大模型对齐技术的原理，对比各类技术的优劣，适合电商客服、导购场景的对齐技术是什么？为什么？
详细讲解Transformer架构的核心原理，Encoder和Decoder的结构差异，自注意力机制的计算过程，为什么Transformer成为大模型的核心架构？
深入剖析主流大模型（GPT系列、Qwen、DeepSeek等）的技术架构差异，Decoder-only架构的优势是什么？
有监督微调（SFT）的核心流程、训练目标、数据集构建原则，SFT阶段容易出现的过拟合、知识遗忘问题如何解决？
大模型训练日志、指标如何监控？如何判断模型训练是否收敛？遇到训练崩溃如何快速定位问题？
大模型幻觉问题产生的核心原因，针对电商商品信息生成、智能导购场景，有哪些实用的缓解方案？
电商场景下多模态大模型需要处理商品图、短视频、语音等数据，模态融合过程中会遇到哪些技术难点？
你日常使用的大模型开发工具栈、训练框架、推理加速工具，以及熟练掌握的编程语言。
大模型训练中的分布式训练技术：数据并行、张量并行、流水线并行的原理与适用场景，如何结合使用提升训练效率？
针对长上下文（Long Context）技术，目前主流解决方案有哪些？电商场景下商品详情、客服对话、订单日志等长文本场景，如何优化大模型长文本理解能力？
题目：二叉树中的最大路径和

二面

请介绍一个你最有代表性的大模型项目，你在项目中最核心的技术贡献是什么？
如果让你重新做这个项目，你会如何优化？
你在大模型训练Pretrain、SFT、RLHF / DPO中做的哪一块？
SFT 和 RLHF 的本质区别是什么？
是否有使用到大模型并行训练方式？
Megatron-LM 是如何实现Tensor Parallel的？
ZeRO 的三个阶段分别解决什么问题？
如果你只有8 张 A100，如何训练一个30B模型？
FlashAttention 为什么更快？
为什么 LoRA 可以减少训练参数？LoRA 中 rank r 的选择会影响什么？
题目：无重复字符的最长子串
题目：LRU Cache

设计一个 LRU 缓存：

class LRUCache {

    LRUCache(int capacity)

    int get(int key)

    void put(int key, int value)

}

要求：

get / put 时间复杂度 O(1)

三面

自我介绍
你的大模型项目用的数据量级大概是多少？
数据预处理全流程你是怎么设计的？
项目中有没有遇到脏数据、低质数据、重复数据、敏感数据问题？具体是什么问题，你用什么技术方案解决的？解决后数据质量提升了多少？
如果是垂直领域（比如电商、搜索、客服）项目，你是怎么做领域数据适配和数据蒸馏的？有没有构建专属领域指令集？
你的项目用到了什么基座模型？为什么选这个开源基座？
训练框架用的是PyTorch、DeepSpeed、Megatron-LM还是Transformers原生方案？有没有做框架层面的二次修改？★
训练过程中遇到的最棘手的技术故障是什么？
针对上述问题，你是怎么排查定位根因的？用了哪些调试手段、监控工具？最终优化方案是什么？优化后有什么量化提升？
SFT阶段的指令数据集是怎么构建的？标注规则、样本量级、正负样本比例怎么设计？如何避免指令微调后的知识遗忘问题？
我看项目涉及多模态,多模态训练过程中，图文不匹配、模态信息失衡问题怎么解决？电商商品图+文案的多模态生成，你有没有相关项目经验？
你项目里用了哪些客观评估指标？比如PPL、BLEU、ROUGE、MMLU、C-Eval、领域专属准确率，指标结果分别是多少？★
除了客观指标，有没有做人工主观评估？评估维度、打分规则是什么？怎么降低人工评估的偏差？
模型训练完后，效果未达预期的情况有没有遇到？
如果重新做这个项目，你会优化哪些环节？哪些技术选型是踩坑的，下次会更换？
前沿方向比如Agent-RL、长上下文、高效推理，你在项目中有没有尝试过？
题目：最长回文子串

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

企业知识库：AI到底怎么“喂”出来的？

AtomGit开源社区

使用 OpenCLAW 重写 CUDA 内核：从传统 CUDA 到高性能异构计算的迁移指南

# 5. 从 CUDA 到 OpenCLAW：语法与 API 映射实战 - **内核函数签名**：`__global__` → `__claw_kernel`。- **线程组织模型**：`blockIdx.x`, `threadIdx.x` → `claw_get_group_id(0)`, `claw_get_local_id(0)`。- **内存空间**：`__shared__`, `__co