本文分享了作者作为AI大模型应用开发者的面试经验,涉及多家知名企业(如阿里、腾讯)。等文章指出面试难度相对较低,重点考察实际项目经验和对技术的理解,而非高深的理论知识。关键内容包括掌握微调原理、部署大模型、理解RAG、Prompt和Agent等概念。作者还强调了面试准备的重要性,如简历润色、技术文章阅读和面试技巧等。此外,文章还提供了一套完整的学习路线图,帮助读者系统学习AI大模型开发知识。


大模型应用开发面经(5年经验)

岗位:AI大模型应用开发

面过的公司:阿里、腾讯、美团、字节、快手、同程、京东、360、keep、滴滴、印象笔记、作业帮、昆仑万维、数驱互动、Authing.…

先说总结

面试内容&难度:

个人觉得,在LLM应用的面试题上,没有太多复杂、高深的问题,不像上来让你说一下分布式锁怎么设计然后死扣设计细节或是描述一下MVCC原理这种偏高难度的八股文问题

究其原因以下几点:

  • 一是大模型应用目前仍没有很成熟且被广泛接纳的方案,都还在探索;
  • 二是很多公司今年刚开始all in Al(我司 all进去的比较早点),面试官也懂得不多。

例如RAG这个东西,大部分的面试题无非是“你觉得RAG中最难的是什么?(文档切割喽)”、“你是怎么解决幻觉问题的?”,“微调和 RAG的区别是啥?”等等。如果你做过RAG加上你经常看技术文章结合你的“侃侃而谈”,基本面试官都觉得ok。

但这里着重说一下我觉得当前非常重要且极大概率提升面试通过率的的一个技术点!

就是掌握微调原理并且做过动手做过微调工作再加上动手部署过大模型。

算法题:一半是DP问题,还有一部分难度是easy的问题,总体上都是“老熟人”,但是,你即使写出来,面试不一定就能过,有的干脆就不考算法题。八股文:明显比之前少很多,这个和面试的岗位有关系,LLM应用的岗位更偏实践,所有很多一面就是leader面,直接问项目,除非一面也不懂LLM的东西,就会考八股文。

但总的来说,八股少了,但是绝对不可以不准备,好几次挂在这上面,别小瞧它。

offer:如果你期望薪资比较高,对方说要在等等,基本上凉了。大部分涨幅基本是不到20%的,但我的期望是30%左右,最后还是拿到了(要有一点点耐心,还要有一定的运气)。

不要眼高手低,先拿一个低于自己预期的offer,再慢慢谈,前提是公司想要你。

规划好时间,集中面试,集中对比,时间线不要拉的过长,统筹安排好了自己才不会乱了阵脚。

二次总结一下重点:

  • 每次面完都要复盘,没答好的问题,一定要重新梳理答案。
  • 没把握问题的可以直接说不会,别给个你自己都听不懂的答案。
  • 简历可以让Al帮你润色,但自己要check一遍,别吹过头了。
  • 多看技术文章,扩展技术视野,提高二面面试官对你的印象。
  • 表达一定要流畅清晰,不要断断续续的,面试官会觉得你思路不清晰。

项目效果评估是个很重要的问题,不管你的技术多炫酷,终究还是要看效果,看落地效果。面试题(有印象的部分)

LLM基础:

  • 大模型是怎么训练出来的?
  • Transform 的架构,Encoder和Decoder是什么?
  • Function Call是怎么训练的?
  • 微调的方案有哪些?自己做过没有?
  • 大模型分词器是什么?
  • Embedding是什么?你们用的那个模型?

Lib:

  • 介绍一下 langchian·介绍一下 autogen
  • 有没有用过大模型的网关框架(litellm)
  • 为什么手搓 agent,而不是用框架?
  • mcp是什么?和Function Call有什么区别?有没有实践过?
  • A2A了解吗?

Prompt:

  • ReAct是啥?怎么实现的?
  • CoT是啥?为啥效果好呢?有啥缺点?
  • Prompt Caching 是什么?
  • 温度值/top-p/top-k分别是什么?各个场景下的最佳设置是什么?

RAG:

  • 你介绍一下RAG是什么?最难的地方是哪?
  • 文档切割策略有哪些?怎么规避语义被切割掉的问题?
  • 多路召回是什么?
  • 文档怎么存的?粒度是多大?用的什么数据库?
  • 为啥要用到图数据库?
  • 向量数据库的对比有没有做过?Qdrant性能如何?量级是多大?有没有性能瓶颈?
  • 怎么规避大模型的幻觉?
  • 微调和 RAG的优劣势?
  • 怎么量化你的回答效果?例如检索的效果、回答的效果。

workflow:

  • 怎么做的任务拆分?为什么要拆分?效果如何?怎么提升效果?
  • text2sql怎么做的?怎么提高准确率?
  • 如何润色query,目的是什么?
  • code-generation 是什么做的?如何确保准确性?
  • 现在再让你设计你会怎么做?(replan)

Agent:

  • 介绍一下你的Agent 项目
  • 长短期记忆是怎么做的?记忆是怎么存的?粒度是多少?怎么用的?
  • Function Call是什么做的?·你最大的难题是什么?你是怎么提高效果的?怎么降低延迟的?
  • 端到端延迟如何优化的?
  • 介绍一下 single-agent、multi-agent的设计方案有哪些?
  • 如何看待当下的LLM
  • 应用的趋势和方向

系统设计题:

  • 短链系统
  • 分布式锁的设计
  • 结合线上问题快速定位项目工程代码有问题的地方
  • 有很多结构化和非结构化数据,怎么分析,再怎么得出我要的结论

八股:

  • go的内存分配策略、GMP、GC
  • python 的内存分配策略、GC
  • redis 用过那些?mget 底层什么实现的?、zset 怎么实现的?
  • mysql索引怎么设计最好?数据库隔离级别?mvcc是怎么实现的?
  • 分布式锁是什么实现的?
  • kafka 的 reblance是什么?会产生那些问题?怎么保证数据不丢?
  • go中 net/http 如何处理的 tcp 粘包问题
  • http2是什么?比http1.1有什么优势?

2026年AI行业最大的机会,毫无疑问就在应用层

字节跳动已有7个团队全速布局Agent

大模型岗位暴增69%,年薪破百万!

腾讯、京东、百度开放招聘技术岗,80%与AI相关……

如今,超过60%的企业都在推进AI产品落地,而真正能交付项目的 大模型应用开发工程师 **,**却极度稀缺!

落地AI应用绝对不是写几个prompt,调几个API就能搞定的,企业真正需要的,是能搞定这三项核心能力的人:

✅RAG:融入外部信息,修正模型输出,给模型装靠谱大脑

✅Agent智能体:让AI自主干活,通过工具调用(Tools)环境交互,多步推理完成复杂任务。比如做智能客服等等……

✅微调:针对特定任务优化,让模型适配业务

目前,脉脉上有超过1000家企业发布大模型相关岗位,人工智能岗平均月薪7.8w!实习生日薪高达4000!远超其他行业收入水平!

技术的稀缺性,才是你「值钱」的关键!

具备AI能力的程序员,比传统开发高出不止一截!有的人早就转行AI方向,拿到百万年薪!👇🏻👇🏻

图片

AI浪潮,正在重构程序员的核心竞争力!现在入场,仍是最佳时机!

我把大模型的学习全流程已经整理📚好了!抓住AI时代风口,轻松解锁职业新可能,希望大家都能把握机遇,实现薪资/职业跃迁~

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

在这里插入图片描述

⭐️从大模型微调到AI Agent智能体搭建

剖析AI技术的应用场景,用实战经验落地AI技术。从GPT到最火的开源模型,让你从容面对AI技术革新!

大模型微调

  • 掌握主流大模型(如DeepSeek、Qwen等)的微调技术,针对特定场景优化模型性能。

  • 学习如何利用领域数据(如制造、医药、金融等)进行模型定制,提升任务准确性和效率。

RAG应用开发

  • 深入理解检索增强生成(Retrieval-Augmented Generation, RAG)技术,构建高效的知识检索与生成系统。
  • 应用于垂类场景(如法律文档分析、医疗诊断辅助、金融报告生成等),实现精准信息提取与内容生成。

AI Agent智能体搭建

  • 学习如何设计和开发AI Agent,实现多任务协同、自主决策和复杂问题解决。
  • 构建垂类场景下的智能助手(如制造业中的设备故障诊断Agent、金融领域的投资分析Agent等)。

图片

如果你也有以下诉求:

快速链接产品/业务团队,参与前沿项目

构建技术壁垒,从竞争者中脱颖而出

避开35岁裁员危险期,顺利拿下高薪岗

迭代技术水平,延长未来20年的新职业发展!

……

那这节课你一定要来听!

因为,留给普通程序员的时间真的不多了!

立即扫码,即可免费预约

「AI技术原理 + 实战应用 + 职业发展

「大模型应用开发实战公开课」

👇👇

在这里插入图片描述

👍🏻还有靠谱的内推机会+直聘权益!!

完课后赠送:大模型应用案例集、AI商业落地白皮书

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐