2026大厂大模型/Agent面试题

SiYuanFeng

285人浏览 · 2026-06-06 03:01:46

SiYuanFeng · 2026-06-06 03:01:46 发布

前言:

1题目不是很全，因为不都是笔者的面试，都是笔者各个渠道（牛客，脉脉，boss直聘）刷到的，然后随缘汇总，帮助自己复习，也帮助大家复习。

字节大模型算法岗面经简略版

1.项目介绍
2.在参数高效微调中，为什么优先微调 Attention 层的 Q/K/V/O，而不是 FFN 层？
3.RAG 和 GraphRAG 在处理多跳推理时的根本？
4.RAG 的整体流程
5.GraphRAG 系统整体流程
6.RoPE 为什么能实现相对位置编码？
7.Transformer 中因果注意力和双向注意力的区别
8.手撕代码题：最长连续递增子序列（LeetCode 674）

——作者：算法打工人阿旺,牛客网

阿里 Agent开发一面校招

1.实习拷打
2.项目拷打
3.处理查询文档里的异构数据(如图片)时，具体的处理流程是什么?解析成纯文字后如何进一步加工?这样只返回文字给用户，图片信息不会丢失吗?
4.你们是通过人工打标建立图片和文本的对应关系吗?文档量很大的情况下，打标工作能完成吗?
5.如何保证大部分图片异构数据解析后回答的正确性?若回答错误，怎么识别问题?后续要验证回答准确性，你有什么方案?
6.用于评测的另一个大模型，如何构造问题、分析文字并进行对比?这个大模型的正确率以及模型自我一致性怎么确定?
7.你们的模型基于哪些异构图像做增强?模型会不会产生幻觉，生成文档外的内容?
8.若用户的问题不在文档里，你们会怎么处理?是调用其他模型吗?大模型回答不了时，会提示用户补充问题吗?用户补充后仍无法解决该怎么办?模型如何判断何时需要让用户补充提问?
9.你们有框架编排这些流程吗?用的是什么框架?
10.怎么理解检索召回率?这些指标具体包含哪些评价项?什么是忠实度?召回率的分子分母是怎么定义的?
11.你之前那段实习的具体工作内容是什么?针对设备故障叙述报告这类复杂文本，模型如何理解?是做了相关检测吗?大模型是怎么实现术语解释的?
12.请讲一下LoRA技术，除了减少参数量，它还有什么优点?你做的LoRA相关工作，后续有落地应用吗?
13.你写代码主要用Python吗?会不会用Java?了解Java的多线程、双亲委派模型以及消息中间件吗?有没有做过Java相关项目?
14.你用过LangChain吗?如何用它解决大模型的幻觉问题?若不熟悉LangChain，还能通过什么方法做AI能力增强?

作者：Tackle4_Star
来源：牛客网

字节跳动-Agent开发实习生一面（45分钟）：

一. 你们使用的什么模型？
二. 你们这个项目多少人？
三. 为什么选择用ElasticSearch
四. 常见的向量数据库有哪些知道吗？
五. 常见的Embedding模型有哪些
六. 如果从ES切换向向量检索，哪些能力会下降，哪些能力会提升？
七. 讲一下 React agent 的架构跟工作原理
八. 模型是怎么选择调用哪个工具的？
九. 讲一讲 Middleware
十. 限制工具调用怎么做？
十一. 那你刚才讲到这个过程中的压缩啊，你压缩方案是啥（三级压缩）
十二. 为什么是五轮？
十三. 什么是SDD（规范驱动开发）
十四. 什么是Spec-kit
十五. 什么是OpenSpec
十六. OpenSpec 和Spec-kit 的区别？
十七. 什么是Harness Engineering
十八. Harness的五个核心模块
十九. 这个Recall@5怎么做到91.2%的？
二十. 怎么防止过拟合的？
二十一. 评测集有么有更新过呢？
二十二. 还有什么优化策略

作者：手撕HelloWorld
来源：牛客网

蚂蚁agent暑期一面面经

1.实习拷打
1·实习项目的背景？
2·有没有遇到agent不适配其他手机机型的情况？怎么处理的？
3·交并日志处理这里为什么会是并发的？
2.项目拷打
3.自己用langgraph搭的agent
1·用claude code的时候为什么使用时间越长响应就越慢？
2·项目里vl模型和文本模型的分工？
3·向量库检索相似度计算的优化？
4·有了解哪些比较火的agent？
5·agent的harness能力有哪些体现？
6·claude code和hermes agent在创建skill时候的区别？
7·你认为现在哪些agent可能被淘汰？新兴的agent应具备哪些能力？
8·场景题：让豆包和cluade code进行对话需要怎么设计？增加哪些模块？

作者：笔试超常发挥
来源：牛客网

字节AI产品二面面经

1.“豆包”作为一个独立的AI对话产品，面对ChatGPT、Kimi等强大对手，你认为其长期存活并发展的关键是什么？是必须寻求技术突破，还是可以走一条不同的差异化道路？请描述你设想中这条道路的图景。

2.假设我们要在抖音全面推广你设想的“AI辅助影视解说”功能，预计日调用量将达数亿次。请设计这个功能从用户发起、AI生成、到内容审核、最终分发的全链路产品与系统架构。

3.AI功能的“不确定性”是其固有特性。请为一个拥有亿级日活的产品设计一套“AI功能风险管理”的整体框架，覆盖从功能上线前评估、线上实时监控到事后应急响应的全流程。

4.你提到要关注不同阶段的数据。现在，如果一个AI功能的长期数据表现不佳，但短期数据很好，你的深度分析框架是什么？如何区分问题是出在“用户预期管理”、“功能价值本身”还是“市场环境变化”？

5.当多个AI功能同时上线，且共享同一个流量入口或用户心智时，如何设计一套分析体系，来科学地评估每个功能的独立贡献，以及它们之间是协同还是互斥的关系？

6.AI Native和AI Empowered，哪种模式更有可能在字节体系内率先跑通大规模的商业模式？为什么？

7.面对竞争对手快速跟进而导致的“功能同质化”，除了追求技术领先，我们的AI产品在“生态构建”上可以有哪些作为？例如，如何设计一个开发者平台或创作者计划，让外部力量帮助我们构建护城河？

8.如果你来负责一条AI产品线，面对公司要求“半年内打造一个行业标杆功能”的压力，你会如何制定产品路线图？请描述你规划前90天具体行动的思路。

作者：_Maple_Leaf_Muse
来源：牛客网

字节豆包大模型算法一面-攒人品中

1.项目拷打
2.风控预测怎么做的?
3.实习拷打
4.你详细地聊一下你们构建知识库以及基于知识库的召回，然后作答的一个流程。
5.这个知识库的文档是只有PDF这一块吗?多路召回的话，是几路?
6.那这整个一套系统，它会有一套评估吗?你比如说你用了这个召回，是只用一路召回它的精度或者回答效果更好，或者是用多路(两路或者三路)的召回效果更好，会有一个评估吗?
7.那你们这个系统的话是基于一个已有的框架去构建的，比如说LangChain，还是说从零到一搭建的?
8.那这里面(LangChain框架)基本上用到的有几个节点?
9.那你们实现的时候是LangChain里面把这个知识库这个流程搭建起来，然后后面再加一个大模型的evoke?
10.其他的agent的搭建框架有了解过吗?
11.比如说像知识库召回的话，它多路召回在策略里面会有权重吗?还是说都是一样的?

作者：面面俱到神
来源：牛客网

字节AI产品校招面经-

1)火山引擎在客服Agent介绍中强调智能客服是"工作台+lIM Bot/语音Bot+工单+质检+策略"的端到端系统，而不是单一智能体。如果让你负责从0到1规划一套"对话机器人+人工协同+工单闭环+质检"的最小可行系统，你会怎么拆模块、定边界与优先级?
2)抖音开放平台提供多种客服能力，并支持在会话中透传商品/订单等上下文信息。假设你要在抖音小程序/电商场景落地AI客服，你如何设计入口、路由与会话态，确保"转化率/解决率/体验"同时可控?
3)Coze覆盖Bot创建、插件开发、工作流编排、知识库管理与多端部署等能力。如果要求你用这些能力在2-3周内验证一个客服Agent MVP(能处理高频问题+能触发业务动作)，你会如何定义MVP范围、验收口径与Go/No-Go门槛?
4)豆包大模型强调在多业务场景的规模化实践。假设你要在客服场景落地(高并发、低延迟、强约束)，你如何做模型选型(大/小模型、是否多模态、是否需要精调)并同时把成本、延迟、效果三者拉齐?
5)火山方舟提供训练、推理、评测、精调等能力。如果你要建立一套"上线前评测+上线后回归"的客服对话评测体系，如何设计数据集、指标、红队与回归机制，确保每次迭代不倒退?
6)客服体系里存在服务工单处理机制，强调时效与逾期影响。如果让AI从对话中自动生成工单(包含分类、优先级、关键信息抽取、建议处理方案)，你如何设计字段标准、触发条件与审核机制，避免"自动化制造噪音"?
7)客服Agent方案往往要求"效果可度量、可持续优化"。如果你要定义这类产品的指标体系(体验+效率+风险+成本)，你会怎么搭北极星与分层指标，避免被单一"机器人解决率"误导?
8)Coze支持知识库管理、工作流编排等能力。假设你接手一个已上线的AI客服，命中率上不去、幻觉偶发、且业务规则经常变。你如何设计"数据闭环":采集标注/纠错知识库更新策略/提示词/工作流迭代回归验证?
9)在客服系统里，转人工不是简单兜底，而是体验与效率的关键策略。你会如何设计"转人工策略+坐席辅助+事后学习"，让整体解决率提升而不是堆人?
10)书机器人支持消息推送、简单交互，并可用于系统集成。如果你要把客服Agent能力做成"企业内协作"的形态(如工单协同、质检抽检、升级审批都在书里跑)，你如何设计权限、审计、消息风暴控制与协作流转?
11)面向对话式AI的音视频互动方案强调低延迟与"可打断"的实时通话体验，并整合ASR/TTS/LLM/知识库/工具调用等能力。如果要把客服从文本升级到语音(甚至带图/视频举证)，你会如何重构交互、指标与风险控制?
12)市面上也存在"客服大模型机器人/智能体平台"类解决方案。如果让你做一份"客服Agent赛道对标"，你会如何选对标对象、拆维度(能力/交付/成本/生态/合规/运维)并产出"能指导路线图"的结论?

作者：Magnus
来源：牛客网

字节豆包算法岗面经

✅一面
1．自我介绍，问实习和论文
2．看你实习微调过Qwen2，说说Qwen2的模型结构吧，Qwen2相比Qwen1做了哪些改进
3．为什么现在 Decoder - only 成为大模型的主流架构，相比于 Encoder - Decoder 的架构好在哪里
4．讲一下 RoPE 吧，目前常用的位置编码还有哪些， RoPE 有什么优点（相对位置、外推性……)，如何进一步外推
5．为什么有了 SFT 之后还需要 RLHF
6.PPO和 DPO 的主要思想是什么， DPO 相比 PPO 的 RLHF 做了哪些改进，除此之外还知道哪些 RL 算法，知道 DeepSeek 的 GRPO 吗
7．代码：23．合并 K 个升序链表
一面整体来说还是比较基础的，都是一些八股的知识，没有考什么自由发挥的题。不过力扣还是难的，出了一道 hard
✅二面
1．自我介绍，选一个做的好的实习或者论文讲一下，这里问的比较细，动机是什么，为什么用当前的方案
2．了解 KV cache 吗， GQA 的思想是什么
3．讲一下 FlashAttention 的思想和做法
4．除了刚刚说到的这些，还了解过哪些模型训练推理优化的方法（ DeepSpeed ，数据并行，张量并行，流水线并行……
5．开放题：如果要提升大模型的多轮对话能力，你有哪些可以改进的点
6．代码：刚刚提到了 GQA ，写一下 GQA 吧
二面更偏底层优化，没有过多的问一些大模型结构方面的东西，应该是考虑到一面都问过了。整体的考察比较灵活一些
✅三面：
1．自我介绍，过实习和论文，这里面试官会穿插问一些八股的知识，比如了解 Qwen 的结构吗，微调的数据配比是怎样的
2．大模型的灾难性遗忘问题怎么解决
3．了解 RAG 吗， GraphRAG 的做法
4．场景题：目前有一些专业领域知识，比如医疗知识或者法律条文，准备做一个智能助手，要让你搭建一个 RAG 链路，会怎么做
5．开放题：用过豆包吗，觉得目前豆包还存在什么问题
6．代码：416．分割等和子集
三面一些八股还是问的比较常规的，但是自由发挥的题目有点多，感觉有点难答，不过好在面试官会进行启发，抛出一些小问题来引导回答

作者：算法打工人小旺
来源：牛客网

字节抖音搜推大模型算法面经分享

1.项目深挖
2.做了哪些优化？
3.数据不均衡的话，对f1 score，acc这些指标有什么影响
4.LoRA的原理。
5.有用过qwen系列的模型吗？
6.你认为decoder only的模型在分类等任务上有可能比encoder only的做得更好吗
7.如果loss下降了，但f1等指标不涨，如何排查和解决？
8.手撕：由01组成的二维矩阵，返回全由1组成的最大正方形的面积

作者：刷题坚持到底啦
来源：牛客网

大模型算法面经分享-阿里暑期

继续来分享下最近的面经~欢迎友好讨论，信息共享
1.项目背景
2.要解决的问题
3.要解决问题的难点
4.技术方案选型
5.最终如何确定技术方案
6.Qwen3-VL embedding 是怎么做的
7.是怎么提取图片的
8.用的什么提取器
9.最终怎么嵌入到文本里
10.怎么定义 DPO 训练集是高质量的
11.DPO 训练数据量是怎么确定的
12.数据量确定是拍脑袋，还是有原则
13.为什么不用 SFT
14.SFT 数据质量要求高体现在哪些方面
15.如果现在用 SFT 去解决这个问题，从理论上能不能解决
16.为什么不用 GRPO 解决，而是选择 DPO

作者：debug 上岸两不误
来源：牛客网

腾讯日常实习大模型算法面经分享

1.介绍一下项目
2.Rope介绍
3.GQA介绍
4.GQA为什么性能和MHA相差不大
5.介绍一下项目（minimind）中哪些部分对模型影响最大
6.介绍一下项目(minimind)中遇到的难点
7.有没有做过业务一点或者性能提升一点的项目
8.介绍第二个项目
9.介绍一下最近看过的论文
10.如果把这篇论文的技术运用到业务中会遇到什么难点。

作者：智能助力拿 offer5
来源：牛客网

腾讯Teg大模型暑期算法面经

1.自我介绍
2.介绍主流 Transformer-based 模型架构
3.讲一下 LoRA 原理
4.为什么 SFT 之后还要进行后训练
5.讲一下 DPO 的损失函数怎么计算
6.讲一下 GRPO 原理
7.使用 GRPO 时，构造数据要符合什么要求
8.熟悉哪些 Agent 框架
9.如果要设计一个好的 Agent，除了大模型，还会设计哪些部分
10.怎么构造高质量训练集
11.Dense 模型和 MoE 模型有什么区别
12.量化发挥作用的原理是什么
13.讲一下 ZeRO-1、ZeRO-2、ZeRO-3
14.如果显存有限，会选择哪个方案训练
15.算法题：
LeetCode 56 合并区间

作者：算法打工人小旺
来源：牛客网

字节抖音风控大模型算法一面

1.自我介绍
2.深挖横向项目工作具体方向是代码生成
提问：我的解决方案是怎么做的？
3.什么时机引入验证器迭代反馈
4.grpo相关 grpo的reward怎么设计的
5.DeepSeek v4 report相关内容
6.机器学习八股 MSE 交叉熵
7.pytorch 简单问了两个api
8.最后是一个手撕，无重复字符的最长子串

作者：算法打工人小旺
来源：牛客网

美图北斗大模型算法岗面经

1️⃣一面

介绍第一篇论文，reward model怎么设计。
过程监督的信号具体是怎么设计的。过程监督的信号还能应用在哪些地方。
如何保证强化学习的训练效率（平衡效率和稳定），grpo训练过程中出现了全0或者全1怎么解决。
混合推理是怎么做的（OpenAI GPT-5），大模型在增强推理的时候如何保证通用数据不遗忘。
现在大模型还有那些能力值得增强。
介绍第二篇论文
介绍第一段实习，介绍落地的场景。
写题，非hot100的模拟

2️⃣二面

介绍第二段实习，中间会打断提问，问看过qwen2.5‑vl的报告了吗，问具体业务细节，强化学习数据集的构建方法，问部门几个人
介绍第一段实习，主包这一段实习是基座的，问了很多部门的情况，包括后训练、预训练、数据生成等等
介绍第一篇论文，介绍背景和方法
面试官感觉很真诚，共享屏幕介绍他们组的业务

作者：算法打工人小旺
来源：牛客网

蚂蚁智能体与大模型应用一面

自我介绍
如何解决大模型幻觉？
问题2中说到了模型的微调，面试官问对模型微调那些算法了解吗？
项目的skills是怎么实现的？你是怎么写skills的？
Spring AI框架的skills调用更像Claude Code还是其他Harness agent？
你说看过Claude源码，Claude Code学习经验总结？
Claude Code是给模型用grep检索，没有用RAG检索，这俩有什么区别？为什么没用rag？
讲讲RAG的混合召回
url解析过程
tcp三次握手、四次挥手
mysql的数据结构，讲讲B+树
Spring的控制反转、AOP
你平时用什么做ai coding？

作者：lyn260410
来源：牛客网

美团大模型实习面经凉凉

先answer后cot和先cot后answer，做SFT有什么区别？是否对比过效果？
怎么确保人工标注的数据准确率符合预期？
如何选择合理的SFT的checkpoint，用于后续的RL？
图片怎么输入模型的，一张图片有多少token？
你觉得RL和SFT有什么区别？
为什么不只做RL，而选择SFT then RL？
重要性采样是什么，为什么RL中要加入CLIP机制？
On-policy和Off-policy有什么区别？
八股
Transformer的decoder中为什么要用自回归因果掩码？
缩放点积注意力为什么要除以 $\sqrt d_k$ ？

作者：心有所梦
来源：牛客网

腾讯后台一面

手撕
链表倒数第k个节点
右视图
数组中能组成三角形边的数量
自我介绍
挑一个项目讲
Oncall agent
工具获取的日志很多怎么办，大模型上下文窗口有限
大模型压缩的话，那会不会把重要信息丢掉，怎么办
如何你有很多个服务，很多告警信息你如何处理（不可能所有都处理）（消息队列解耦，优先级处理）
实习经历
反问

作者：求个offer吧a
来源：牛客网

美图北斗大模型算法岗面经

1️⃣一面

介绍第一篇论文，reward model怎么设计。
过程监督的信号具体是怎么设计的。过程监督的信号还能应用在哪些地方。
如何保证强化学习的训练效率（平衡效率和稳定），grpo训练过程中出现了全0或者全1怎么解决。
混合推理是怎么做的（OpenAI GPT-5），大模型在增强推理的时候如何保证通用数据不遗忘。
现在大模型还有那些能力值得增强。
介绍第二篇论文
介绍第一段实习，介绍落地的场景。
写题，非hot100的模拟

2️⃣二面

介绍第二段实习，中间会打断提问，问看过qwen2.5‑vl的报告了吗，问具体业务细节，强化学习数据集的构建方法，问部门几个人
介绍第一段实习，主包这一段实习是基座的，问了很多部门的情况，包括后训练、预训练、数据生成等等
介绍第一篇论文，介绍背景和方法
面试官感觉很真诚，共享屏幕介绍他们组的业务

作者：算法打工人小旺
来源：牛客网

快手大模型面经 - 2025

自我介绍 + 项目问题 + 之前在快手的实习
八股：
大模型预测token的损失计算方式？常见的损失函数
讲一下大模型的思维链技术。
讲一下Transformer。它的优势是什么？Transformer 的位置编码及改进。ROPE。Transformer 文本到token是怎么做的呢？
Lora 微调八股：矩阵A,B的初始化方式，B为什么初始化为0，A 可以吗？什么是矩阵的秩？
Bert 和 GPT 的区别，大模型时代小模型的用处。
讲一下MHA 及其改进。讲解一下deepseek的MLA。
MOE加在了什么地方呢？分别从训练和推理的角度分析一下MOE的好处。
你的提示词设计的范式。
两个命题，判断是否是真命题：已知增量权重矩阵可以分解为 A x B 的形式，那么可以说这个矩阵是满秩的吗？已知增量权重矩阵可以分解为A x B 的形式，那么可以说这个矩阵是信息冗余的吗？
算法题：二叉树的层序遍历。（队列）