2026大厂大模型/Agent面试题
2026大厂大模型/Agent面试题目汇总
前言:
1题目不是很全,因为不都是笔者的面试,都是笔者各个渠道(牛客,脉脉,boss直聘)刷到的,然后随缘汇总,帮助自己复习,也帮助大家复习。
字节大模型算法岗面经简略版
1.项目介绍
2.在参数高效微调中,为什么优先微调 Attention 层的 Q/K/V/O,而不是 FFN 层?
3.RAG 和 GraphRAG 在处理多跳推理时的根本?
4.RAG 的整体流程
5.GraphRAG 系统整体流程
6.RoPE 为什么能实现相对位置编码?
7.Transformer 中因果注意力和双向注意力的区别
8.手撕代码题:最长连续递增子序列(LeetCode 674)
——作者:算法打工人阿旺,牛客网
阿里 Agent开发一面 校招
1.实习拷打
2.项目拷打
3.处理查询文档里的异构数据(如图片)时,具体的处理流程是什么?解析成纯文字后如何进一步加工?这样只返回文字给用户,图片信息不会丢失吗?
4.你们是通过人工打标建立图片和文本的对应关系吗?文档量很大的情况下,打标工作能完成吗?
5.如何保证大部分图片异构数据解析后回答的正确性?若回答错误,怎么识别问题?后续要验证回答准确性,你有什么方案?
6.用于评测的另一个大模型,如何构造问题、分析文字并进行对比?这个大模型的正确率以及模型自我一致性怎么确定?
7.你们的模型基于哪些异构图像做增强?模型会不会产生幻觉,生成文档外的内容?
8.若用户的问题不在文档里,你们会怎么处理?是调用其他模型吗?大模型回答不了时,会提示用户补充问题吗?用户补充后仍无法解决该怎么办?模型如何判断何时需要让用户补充提问?
9.你们有框架编排这些流程吗?用的是什么框架?
10.怎么理解检索召回率?这些指标具体包含哪些评价项?什么是忠实度?召回率的分子分母是怎么定义的?
11.你之前那段实习的具体工作内容是什么?针对设备故障叙述报告这类复杂文本,模型如何理解?是做了相关检测吗?大模型是怎么实现术语解释的?
12.请讲一下LoRA技术,除了减少参数量,它还有什么优点?你做的LoRA相关工作,后续有落地应用吗?
13.你写代码主要用Python吗?会不会用Java?了解Java的多线程、双亲委派模型以及消息中间件吗?有没有做过Java相关项目?
14.你用过LangChain吗?如何用它解决大模型的幻觉问题?若不熟悉LangChain,还能通过什么方法做AI能力增强?
- 作者:Tackle4_Star
- 来源:牛客网
字节跳动-Agent开发实习生 一面(45分钟):
一. 你们使用的什么模型?
二. 你们这个项目多少人?
三. 为什么选择用ElasticSearch
四. 常见的向量数据库有哪些知道吗?
五. 常见的Embedding模型有哪些
六. 如果从ES切换向向量检索,哪些能力会下降,哪些能力会提升?
七. 讲一下 React agent 的架构跟工作原理
八. 模型是怎么选择调用哪个工具的?
九. 讲一讲 Middleware
十. 限制工具调用怎么做?
十一. 那你刚才讲到这个过程中的压缩啊,你压缩方案是啥(三级压缩)
十二. 为什么是五轮?
十三. 什么是SDD(规范驱动开发)
十四. 什么是Spec-kit
十五. 什么是OpenSpec
十六. OpenSpec 和Spec-kit 的区别?
十七. 什么是Harness Engineering
十八. Harness的五个核心模块
十九. 这个Recall@5怎么做到91.2%的?
二十. 怎么防止过拟合的?
二十一. 评测集有么有更新过呢?
二十二. 还有什么优化策略
- 作者:手撕HelloWorld
- 来源:牛客网
蚂蚁agent暑期一面面经
1.实习拷打
1·实习项目的背景?
2·有没有遇到agent不适配其他手机机型的情况?怎么处理的?
3·交并日志处理这里为什么会是并发的?
2.项目拷打
3.自己用langgraph搭的agent
1·用claude code的时候为什么使用时间越长响应就越慢?
2·项目里vl模型和文本模型的分工?
3·向量库检索相似度计算的优化?
4·有了解哪些比较火的agent?
5·agent的harness能力有哪些体现?
6·claude code和hermes agent在创建skill时候的区别?
7·你认为现在哪些agent可能被淘汰?新兴的agent应具备哪些能力?
8·场景题:让豆包和cluade code进行对话需要怎么设计?增加哪些模块?
- 作者:笔试超常发挥
- 来源:牛客网
字节AI产品二面面经
1.“豆包”作为一个独立的AI对话产品,面对ChatGPT、Kimi等强大对手,你认为其长期存活并发展的关键是什么?是必须寻求技术突破,还是可以走一条不同的差异化道路?请描述你设想中这条道路的图景。
2.假设我们要在抖音全面推广你设想的“AI辅助影视解说”功能,预计日调用量将达数亿次。请设计这个功能从用户发起、AI生成、到内容审核、最终分发的全链路产品与系统架构。
3.AI功能的“不确定性”是其固有特性。请为一个拥有亿级日活的产品设计一套“AI功能风险管理”的整体框架,覆盖从功能上线前评估、线上实时监控到事后应急响应的全流程。
4.你提到要关注不同阶段的数据。现在,如果一个AI功能的长期数据表现不佳,但短期数据很好,你的深度分析框架是什么?如何区分问题是出在“用户预期管理”、“功能价值本身”还是“市场环境变化”?
5.当多个AI功能同时上线,且共享同一个流量入口或用户心智时,如何设计一套分析体系,来科学地评估每个功能的独立贡献,以及它们之间是协同还是互斥的关系?
6.AI Native和AI Empowered,哪种模式更有可能在字节体系内率先跑通大规模的商业模式?为什么?
7.面对竞争对手快速跟进而导致的“功能同质化”,除了追求技术领先,我们的AI产品在“生态构建”上可以有哪些作为?例如,如何设计一个开发者平台或创作者计划,让外部力量帮助我们构建护城河?
8.如果你来负责一条AI产品线,面对公司要求“半年内打造一个行业标杆功能”的压力,你会如何制定产品路线图?请描述你规划前90天具体行动的思路。
- 作者:_Maple_Leaf_Muse
- 来源:牛客网
字节豆包大模型算法一面-攒人品中
1.项目拷打
2.风控预测怎么做的?
3.实习拷打
4.你详细地聊一下你们构建知识库以及基于知识库的召回,然后作答的一个流程。
5.这个知识库的文档是只有PDF这一块吗?多路召回的话,是几路?
6.那这整个一套系统,它会有一套评估吗?你比如说你用了这个召回,是只用一路召回它的精度或者回答效果更好,或者是用多路(两路或者三路)的召回效果更好,会有一个评估吗?
7.那你们这个系统的话是基于一个已有的框架去构建的,比如说LangChain,还是说从零到一搭建的?
8.那这里面(LangChain框架)基本上用到的有几个节点?
9.那你们实现的时候是LangChain里面把这个知识库这个流程搭建起来,然后后面再加一个大模型的evoke?
10.其他的agent的搭建框架有了解过吗?
11.比如说像知识库召回的话,它多路召回在策略里面会有权重吗?还是说都是一样的?
作者:面面俱到神
来源:牛客网
字节AI产品校招面经-
1)火山引擎在客服Agent介绍中强调智能客服是"工作台+lIM Bot/语音Bot+工单+质检+策略"的端到端系统,而不是单一智能体。如果让你负责从0到1规划一套"对话机器人+人工协同+工单闭环+质检"的最小可行系统,你会怎么拆模块、定边界与优先级?
2)抖音开放平台提供多种客服能力,并支持在会话中透传商品/订单等上下文信息。假设你要在抖音小程序/电商场景落地AI客服,你如何设计入口、路由与会话态,确保"转化率/解决率/体验"同时可控?
3)Coze覆盖Bot创建、插件开发、工作流编排、知识库管理与多端部署等能力。如果要求你用这些能力在2-3周内验证一个客服Agent MVP(能处理高频问题+能触发业务动作),你会如何定义MVP范围、验收口径与Go/No-Go门槛?
4)豆包大模型强调在多业务场景的规模化实践。假设你要在客服场景落地(高并发、低延迟、强约束),你如何做模型选型(大/小模型、是否多模态、是否需要精调)并同时把成本、延迟、效果三者拉齐?
5)火山方舟提供训练、推理、评测、精调等能力。如果你要建立一套"上线前评测+上线后回归"的客服对话评测体系,如何设计数据集、指标、红队与回归机制,确保每次迭代不倒退?
6)客服体系里存在服务工单处理机制,强调时效与逾期影响。如果让AI从对话中自动生成工单(包含分类、优先级、关键信息抽取、建议处理方案),你如何设计字段标准、触发条件与审核机制,避免"自动化制造噪音"?
7)客服Agent方案往往要求"效果可度量、可持续优化"。如果你要定义这类产品的指标体系(体验+效率+风险+成本),你会怎么搭北极星与分层指标,避免被单一"机器人解决率"误导?
8)Coze支持知识库管理、工作流编排等能力。假设你接手一个已上线的AI客服,命中率上不去、幻觉偶发、且业务规则经常变。你如何设计"数据闭环":采集标注/纠错知识库更新策略/提示词/工作流迭代回归验证?
9)在客服系统里,转人工不是简单兜底,而是体验与效率的关键策略。你会如何设计"转人工策略+坐席辅助+事后学习",让整体解决率提升而不是堆人?
10)书机器人支持消息推送、简单交互,并可用于系统集成。如果你要把客服Agent能力做成"企业内协作"的形态(如工单协同、质检抽检、升级审批都在书里跑),你如何设计权限、审计、消息风暴控制与协作流转?
11)面向对话式AI的音视频互动方案强调低延迟与"可打断"的实时通话体验,并整合ASR/TTS/LLM/知识库/工具调用等能力。如果要把客服从文本升级到语音(甚至带图/视频举证),你会如何重构交互、指标与风险控制?
12)市面上也存在"客服大模型机器人/智能体平台"类解决方案。如果让你做一份"客服Agent赛道对标",你会如何选对标对象、拆维度(能力/交付/成本/生态/合规/运维)并产出"能指导路线图"的结论?
作者:Magnus
来源:牛客网
字节豆包算法岗面经
✅一面
1.自我介绍,问实习和论文
2.看你实习微调过Qwen2,说说Qwen2的模型结构吧,Qwen2相比Qwen1做了哪些改进
3.为什么现在 Decoder - only 成为大模型的主流架构,相比于 Encoder - Decoder 的架构好在哪里
4.讲一下 RoPE 吧,目前常用的位置编码还有哪些, RoPE 有什么优点(相对位置、外推性……),如何进一步外推
5.为什么有了 SFT 之后还需要 RLHF
6.PPO和 DPO 的主要思想是什么, DPO 相比 PPO 的 RLHF 做了哪些改进,除此之外还知道哪些 RL 算法,知道 DeepSeek 的 GRPO 吗
7.代码:23.合并 K 个升序链表
一面整体来说还是比较基础的,都是一些八股的知识,没有考什么自由发挥的题。不过力扣还是难的,出了一道 hard
✅二面
1.自我介绍,选一个做的好的实习或者论文讲一下,这里问的比较细,动机是什么,为什么用当前的方案
2.了解 KV cache 吗, GQA 的思想是什么
3.讲一下 FlashAttention 的思想和做法
4.除了刚刚说到的这些,还了解过哪些模型训练推理优化的方法( DeepSpeed ,数据并行,张量并行,流水线并行……
5.开放题:如果要提升大模型的多轮对话能力,你有哪些可以改进的点
6.代码:刚刚提到了 GQA ,写一下 GQA 吧
二面更偏底层优化,没有过多的问一些大模型结构方面的东西,应该是考虑到一面都问过了。整体的考察比较灵活一些
✅三面:
1.自我介绍,过实习和论文,这里面试官会穿插问一些八股的知识,比如了解 Qwen 的结构吗,微调的数据配比是怎样的
2.大模型的灾难性遗忘问题怎么解决
3.了解 RAG 吗, GraphRAG 的做法
4.场景题:目前有一些专业领域知识,比如医疗知识或者法律条文,准备做一个智能助手,要让你搭建一个 RAG 链路,会怎么做
5.开放题:用过豆包吗,觉得目前豆包还存在什么问题
6.代码:416.分割等和子集
三面一些八股还是问的比较常规的,但是自由发挥的题目有点多,感觉有点难答,不过好在面试官会进行启发,抛出一些小问题来引导回答
作者:算法打工人小旺
来源:牛客网
字节抖音搜推大模型算法面经分享
1.项目深挖
2.做了哪些优化?
3.数据不均衡的话,对f1 score,acc这些指标有什么影响
4.LoRA的原理。
5.有用过qwen系列的模型吗?
6.你认为decoder only的模型在分类等任务上有可能比encoder only的做得更好吗
7.如果loss下降了,但f1等指标不涨,如何排查和解决?
8.手撕:由01组成的二维矩阵,返回全由1组成的最大正方形的面积
- 作者:刷题坚持到底啦
- 来源:牛客网
大模型算法面经分享-阿里暑期
继续来分享下最近的面经~欢迎友好讨论,信息共享
1.项目背景
2.要解决的问题
3.要解决问题的难点
4.技术方案选型
5.最终如何确定技术方案
6.Qwen3-VL embedding 是怎么做的
7.是怎么提取图片的
8.用的什么提取器
9.最终怎么嵌入到文本里
10.怎么定义 DPO 训练集是高质量的
11.DPO 训练数据量是怎么确定的
12.数据量确定是拍脑袋,还是有原则
13.为什么不用 SFT
14.SFT 数据质量要求高体现在哪些方面
15.如果现在用 SFT 去解决这个问题,从理论上能不能解决
16.为什么不用 GRPO 解决,而是选择 DPO
- 作者:debug 上岸两不误
- 来源:牛客网
腾讯日常实习大模型算法面经分享
1.介绍一下项目
2.Rope介绍
3.GQA介绍
4.GQA为什么性能和MHA相差不大
5.介绍一下项目(minimind)中哪些部分对模型影响最大
6.介绍一下项目(minimind)中遇到的难点
7.有没有做过业务一点或者性能提升一点的项目
8.介绍第二个项目
9.介绍一下最近看过的论文
10.如果把这篇论文的技术运用到业务中会遇到什么难点。
- 作者:智能助力拿 offer5
- 来源:牛客网
腾讯Teg大模型暑期算法面经
1.自我介绍
2.介绍主流 Transformer-based 模型架构
3.讲一下 LoRA 原理
4.为什么 SFT 之后还要进行后训练
5.讲一下 DPO 的损失函数怎么计算
6.讲一下 GRPO 原理
7.使用 GRPO 时,构造数据要符合什么要求
8.熟悉哪些 Agent 框架
9.如果要设计一个好的 Agent,除了大模型,还会设计哪些部分
10.怎么构造高质量训练集
11.Dense 模型和 MoE 模型有什么区别
12.量化发挥作用的原理是什么
13.讲一下 ZeRO-1、ZeRO-2、ZeRO-3
14.如果显存有限,会选择哪个方案训练
15.算法题:
LeetCode 56 合并区间
- 作者:算法打工人小旺
- 来源:牛客网
字节抖音风控大模型算法一面
1.自我介绍
2.深挖横向项目工作 具体方向是代码生成
提问:我的解决方案是怎么做的?
3.什么时机引入验证器迭代反馈
4.grpo相关 grpo的reward怎么设计的
5.DeepSeek v4 report相关内容
6.机器学习八股 MSE 交叉熵
7.pytorch 简单问了两个api
8.最后是一个手撕,无重复字符的最长子串
- 作者:算法打工人小旺
- 来源:牛客网
美图北斗大模型算法岗面经
1️⃣一面
- 介绍第一篇论文,reward model怎么设计。
- 过程监督的信号具体是怎么设计的。过程监督的信号还能应用在哪些地方。
- 如何保证强化学习的训练效率(平衡效率和稳定),grpo训练过程中出现了全0或者全1怎么解决。
- 混合推理是怎么做的(OpenAI GPT-5),大模型在增强推理的时候如何保证通用数据不遗忘。
- 现在大模型还有那些能力值得增强。
- 介绍第二篇论文
- 介绍第一段实习,介绍落地的场景。
- 写题,非hot100的模拟
2️⃣二面
- 介绍第二段实习,中间会打断提问,问看过qwen2.5‑vl的报告了吗,问具体业务细节,强化学习数据集的构建方法,问部门几个人
- 介绍第一段实习,主包这一段实习是基座的,问了很多部门的情况,包括后训练、预训练、数据生成等等
- 介绍第一篇论文,介绍背景和方法
- 面试官感觉很真诚,共享屏幕介绍他们组的业务
- 作者:算法打工人小旺
- 来源:牛客网
蚂蚁智能体与大模型应用 一面
自我介绍
如何解决大模型幻觉?
问题2中说到了模型的微调,面试官问对模型微调那些算法了解吗?
项目的skills是怎么实现的?你是怎么写skills的?
Spring AI框架的skills调用更像Claude Code还是其他Harness agent?
你说看过Claude源码,Claude Code学习经验总结?
Claude Code是给模型用grep检索,没有用RAG检索,这俩有什么区别?为什么没用rag?
讲讲RAG的混合召回
url解析过程
tcp三次握手、四次挥手
mysql的数据结构,讲讲B+树
Spring的控制反转、AOP
你平时用什么做ai coding?
- 作者:lyn260410
- 来源:牛客网
美团大模型实习面经 凉凉
- 先answer后cot和先cot后answer,做SFT有什么区别?是否对比过效果?
- 怎么确保人工标注的数据准确率符合预期?
- 如何选择合理的SFT的checkpoint,用于后续的RL?
- 图片怎么输入模型的,一张图片有多少token?
- 你觉得RL和SFT有什么区别?
- 为什么不只做RL,而选择SFT then RL?
- 重要性采样是什么,为什么RL中要加入CLIP机制?
- On-policy和Off-policy有什么区别?
八股 - Transformer的decoder中为什么要用自回归因果掩码?
- 缩放点积注意力为什么要除以 d k \sqrt d_k dk?
- 作者:心有所梦
- 来源:牛客网
腾讯后台一面
手撕
链表倒数第k个节点
右视图
数组中能组成三角形边的数量
自我介绍
挑一个项目讲
Oncall agent
工具获取的日志很多怎么办,大模型上下文窗口有限
大模型压缩的话,那会不会把重要信息丢掉,怎么办
如何你有很多个服务,很多告警信息你如何处理(不可能所有都处理)(消息队列解耦,优先级处理)
实习经历
反问
- 作者:求个offer吧a
- 来源:牛客网
美图北斗大模型算法岗面经
1️⃣一面
- 介绍第一篇论文,reward model怎么设计。
- 过程监督的信号具体是怎么设计的。过程监督的信号还能应用在哪些地方。
- 如何保证强化学习的训练效率(平衡效率和稳定),grpo训练过程中出现了全0或者全1怎么解决。
- 混合推理是怎么做的(OpenAI GPT-5),大模型在增强推理的时候如何保证通用数据不遗忘。
- 现在大模型还有那些能力值得增强。
- 介绍第二篇论文
- 介绍第一段实习,介绍落地的场景。
- 写题,非hot100的模拟
2️⃣二面
- 介绍第二段实习,中间会打断提问,问看过qwen2.5‑vl的报告了吗,问具体业务细节,强化学习数据集的构建方法,问部门几个人
- 介绍第一段实习,主包这一段实习是基座的,问了很多部门的情况,包括后训练、预训练、数据生成等等
- 介绍第一篇论文,介绍背景和方法
- 面试官感觉很真诚,共享屏幕介绍他们组的业务
- 作者:算法打工人小旺
- 来源:牛客网
快手大模型面经 - 2025
- 自我介绍 + 项目问题 + 之前在快手的实习
八股: - 大模型预测token的损失计算方式?常见的损失函数
- 讲一下大模型的思维链技术。
- 讲一下Transformer。它的优势是什么?Transformer 的位置编码及改进。ROPE。Transformer 文本到token是怎么做的呢?
- Lora 微调八股:矩阵A,B的初始化方式,B为什么初始化为0,A 可以吗?什么是矩阵的秩?
- Bert 和 GPT 的区别,大模型时代小模型的用处。
- 讲一下MHA 及其改进。讲解一下deepseek的MLA。
- MOE加在了什么地方呢?分别从训练和推理的角度分析一下MOE的好处。
- 你的提示词设计的范式。
- 两个命题,判断是否是真命题:已知增量权重矩阵可以分解为 A x B 的形式,那么可以说这个矩阵是满秩的吗?已知增量权重矩阵可以分解为A x B 的形式,那么可以说这个矩阵是信息冗余的吗?
算法题:二叉树的层序遍历。(队列)
——来源:脉脉
百度 百度AIDU大模型算法面经
一面,聊了论文相关的内容
二面,依旧是聊论文的内容,比较细致
交叉面连续3小时,第一次这么久的面试,换了三波,依旧是讨论论文和项目相关的,每场快一个小时。
大概是6轮面试,整体体验感很好,对项目和论文的交流也比较深入,感觉对自己提升比较大
——来源:脉脉
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐


所有评论(0)