是时候准备面试和实习了。

不同以往的是,当前职场环境已不再是那个双向奔赴时代了。求职者在变多,HC 在变少,岗位要求还更高了。

最近,我们又陆续整理了很多大厂的面试题,帮助一些球友解惑答疑,分享技术面试中的那些弯弯绕绕。

喜欢本文记得收藏、关注、点赞

在这里插入图片描述


岗位:京东-算法工程师(大模型方向)

工作地点:北京/上海

bg:末尾985硕

薪资

京东校招算法岗采用20 薪结构,年包按照级别浮动比较大:

  • 本科(白菜):18–21K / 月 → 年固定:21.6–25.2 万
  • 硕士(白菜):21–24K / 月 → 年固定:25.2–28.8 万
  • 硕士(SP):25–28K / 月 → 年固定:30–33.6 万
  • 硕士(SSP / 大模型):29–33K / 月 → 年固定:34.8–39.6 万
  • 博士(TGT / 顶尖计划):40–60K / 月 → 年固定:48–72 万

一面

  1. 自我介绍
  2. 请简述大模型微调(Fine-tuning)的核心思路,对比全参数微调、LoRA、QLoRA等微调方法的优缺点,以及你在项目中选择某种微调方法的依据和实践效果。
  3. 大模型的上下文窗口长度对模型性能有什么影响?如何突破上下文窗口的限制,提升模型对长文本的处理能力?
  4. 请解释大模型的对齐(Alignment)技术(如RLHF、RLAIF),说明其核心目的和实现流程,你在项目中是否有相关实践?
  5. 京东大模型涉及商品理解、图像/视频生成等场景,请说明你对这些场景中核心技术(如图像/文本跨模态建模、商品语义抽取)的理解,以及相关技术的难点和解决方案。
  6. 大模型推理过程中,如何提升推理速度和降低显存占用?请说明你使用过的优化技术(如量化、剪枝、推理加速框架)及实践效果。
  7. 京东大模型需要处理亿量级数据,请说明你在项目中是如何处理大规模数据(数据清洗、预处理、高效加载)的?遇到过哪些问题,如何解决的?
  8. 请描述一个你参与的大模型工程化落地项目,包括模型训练、推理部署的完整流程,如何保证系统的稳定性、高可用性和可扩展性?
  9. 在大模型部署过程中,如何处理高并发请求?你使用过哪些部署工具(如TensorRT、vLLM),请说明其核心原理和使用体验。
  10. 如果大模型在业务场景中出现性能下降(如生成质量变差、推理延迟升高),你会如何排查和解决问题?
  11. 在你的大模型相关项目中,你有哪些创新点(如算法改进、模型优化、场景创新等)?请详细说明创新思路、实现过程和最终效果。
  12. 结合你做过的大模型项目,说明你是如何将大模型与具体业务场景(如推荐、检索、语义理解等)结合的?
  13. 题目:二叉树的层序遍历(LeetCode 102)。要求:给定一个二叉树,返回其按层序遍历得到的节点值(即逐层地,从左到右访问所有节点),请用你熟悉的编程语言实现,并说明时间复杂度和空间复杂度。

二面

  1. 在你的项目中,你认为那个项目最能体现你的付出和能力的,请详细介绍
  2. 你在项目中用过哪些大模型推理优化工具?
  3. 请对比RLHF、RLAIF、DPO、IPO、KTO的核心原理、训练流程、优缺点,以及电商场景选型建议。
  4. 大模型强化学习中,奖励函数如何设计?针对京东商品对话/推荐场景,你会如何构建高质量奖励信号?
  5. 强化学习训练大模型时常见不稳定性、模式崩溃问题,你有哪些解决策略?
  6. 离线强化学习(Offline RL)如何应用于大模型?适合京东的哪些业务场景?
  7. 面向京东电商场景(商品咨询、订单处理、退货咨询、多轮检索),你会如何设计一个专属智能体?包含工具、记忆、规划模块。
  8. 大模型智能体的工具调用(Tool Use)原理是什么?如何提升工具调用成功率与准确率?
  9. 智能体的长期记忆、短期记忆如何设计?海量用户对话场景下如何高效存储与检索记忆?
  10. 多智能体协作(Multi-Agent)在电商生态中的应用价值是什么?可能的落地方向有哪些?
  11. 大模型位置编码(RoPE、ALiBi)的核心原理与长文本建模优劣对比。
  12. 请说明MoE架构的核心设计、训练难点,以及在京东亿级数据场景的价值。
  13. 大模型幻觉(Hallucination)产生的原因,在电商商品场景如何系统性抑制?
  14. 面向京东高并发场景,大模型+智能体服务如何做到低延迟、高吞吐、
  15. 模型监控中,你会关注哪些核心指标?
  16. 如何用大模型智能体提升京东生成式推荐、商品理解的效果?你有那些思路。
  17. 题目:合并K个升序链表,给你一个链表数组,每个链表都已经按升序排列。请你将所有链表合并到一个升序链表中,返回合并后的链表。要求:最优解法实现,说明复杂度。
Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐