系统性构建Agent全栈能力的AI公司。逐层拆解:
一、Agent核心算法层(4个角色)

  1. Agent Harness 系统算法专家
维度 内容
核心职责 设计和实现Agent运行时框架——Agent的生命周期管理、工具调用协议、多轮对话状态机、错误恢复/回退机制、多Agent编排
核心技能 Python/异步编程(asyncio)、状态机设计、Function Calling/MCP协议、流式推理管线、沙箱安全隔离
对标 OpenAI Swarm/Agents SDK 的系统架构师,负责"Agent怎么跑起来"
  1. Agent 基模后训练算法专家
维度 内容
核心职责 将通用基座模型通过SFT+RLHF/DPO微调成Agent专用模型——工具调用能力注入、指令遵循增强、多步推理链训练
核心技能 SFT数据构建、RLHF/DPO/GRPO、Rejection Sampling、工具调用格式对齐、benchmark评估(BFCL/τ-bench)、分布式训练
对标 把DeepSeek-V3训成能稳定调用工具、执行多步任务、自我纠错的Agent模型
  1. Code & Search Agent 算法专家
维度 内容
核心职责 专攻代码生成/搜索增强两类Agent——代码Agent的repo级理解+多文件编辑+测试驱动修复,搜索Agent的多轮检索+信息综合+引用溯源
核心技能 SWE-bench优化、AST/代码图谱、RAG架构、多跳检索、幻觉抑制、长上下文推理、Terminal/Sandbox集成
对标 Devin/Claude Code/Cursor背后的Agent逻辑,和Perplexity/Google Deep Research的搜索Agent
  1. Agent 数据引擎算法专家
维度 内容
核心职责 构建Agent训练数据的生产管线——真实用户交互→数据清洗→轨迹标注→轨迹筛选(挑出高质量推理链)→反哺训练
核心技能 数据飞轮设计、轨迹质量评估、自动化标注pipeline、困难样本挖掘、合成数据生成(用强模型生成弱模型训练数据)、数据去重去噪
对标 OpenAI的"数据飞轮"负责人——Agent每多一个用户,模型就更强一点

二、预训练 & 通用后训练层(2个角色)
5. 预训练数据引擎算法专家

维度 内容
核心职责 负责大模型预训练数据的全生命周期——数据源发现→爬取清洗→质量过滤→去重→配比策略→数据混合(不同领域/语言的比例优化)
核心技能 大规模数据pipeline(TB-PB级)、MinHash/SimHash去重、质量分类器训练、数据配比实验(Dolma/DCLM/FineWeb方法论)、多语言处理、版权合规
对标 DeepSeek的"为什么用这么多中文数据"、Llama 4的"数据配比决定模型能力边界"——这个角色决定模型的上限
  1. 通用后训练算法专家
维度 内容
核心职责 负责基座模型→对齐模型的全流程:SFT数据策略+RM训练+RL对齐+能力均衡(推理/创作/安全/指令遵循的trade-off),不限于Agent方向
核心技能 SFT数据合成与筛选、Reward Model设计、PPO/DPO/GRPO、红蓝对抗、能力退化检测、多目标优化(helpfulness vs safety)、MoE路由与后训练的交互
对标 Anthropic的RLHF团队——让模型"聪明但不失控"

三、系统 & 推理层(2个角色)
7. AI Infra 后端开发工程师

维度 内容
核心职责 构建Agent服务的后端基础设施——高并发推理网关、Agent会话管理、工具执行环境、消息队列、模型路由与负载均衡
核心技能 Go/C++/Rust高性能后端、K8s/容器编排、流式协议(SSE/WebSocket)、Redis/消息队列、API网关设计、多租户隔离、GPU资源调度
对标 OpenAI/Anthropic API背后的infra团队——让百万Agent同时跑起来
  1. 大模型训练系统专家
维度 内容
核心职责 大规模分布式训练的基础设施——千卡/万卡集群训练效率优化、故障自动恢复、3D并行策略调优、checkpoint/弹性训练
核心技能 PyTorch FSDP/DeepSpeed/Megatron、NCCL优化、CUDA性能调优、GPU集群管理、训练稳定性(loss spike诊断)、混合精度、FlashAttention
对标 Meta/Mistral/DeepSeek的训练系统团队——让万卡训练效率从40%提到60%,节省几千万美元
  1. 推理框架负责人
维度 内容
核心职责 负责模型推理引擎——推理加速(量化/投机解码/KV-cache优化)、多模型服务编排、显存管理、延迟-吞吐trade-off
核心技能 vLLM/TensorRT-LLM/SGLang深度定制、CUDA kernel优化、量化(GPTQ/AWQ/FP8)、投机解码、PD分离架构、GPU显存管理
对标 vLLM核心维护者/DeepSeek推理系统负责人——让千token成本从$0.01降到$0.001

🧩 整体架构图

预训练数据引擎 ──→ 通用后训练 ──→ Agent基模后训练
       │                  │                │
  大模型训练系统       推理框架        Agent Harness系统
       │                  │                │
  AI Infra后端 ──────────┴──→ Code&Search Agent
                                 │
                          Agent数据引擎(飞轮)

核心逻辑:预训练数据 → 通用模型 → 后训练注入Agent能力 → Harness系统跑起来 → 用户交互产生数据 → 数据引擎回灌训练 → 模型变强 → 循环。

Reference

AI Infra 后端开发工程师 — 学习路线
推理框架负责人 — 学习路线
Agent Harness 系统算法专家 — 学习路线

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐