参与大语言模型(LLM)开发,而不是简单调用API做应用,那么岗位大致分成5条路线,每条路线需要的技能差异很大。

1. LLM应用工程师(最容易进入)

这是目前招聘最多的岗位。

主要工作:

  • 调用模型API
  • Agent开发
  • RAG知识库
  • Prompt Engineering
  • 工作流编排
  • MCP工具调用
  • 企业AI应用开发

典型技术栈:

  • Python
  • FastAPI
  • LangChain
  • LangGraph
  • LlamaIndex
  • MCP
  • 向量数据库

例如:

需要掌握:

Python
REST API
数据库
向量数据库
Embedding
RAG
Agent
Prompt
部署

数学要求:

很多公司实际上招的就是这个。


2. Agent工程师(非常适合你)

未来两年需求可能增长最快。

工作内容:

  • 多智能体系统
  • Agent规划
  • Tool Use
  • Memory
  • 长任务执行
  • 工作流优化

例如:

AutoGPT
OpenManus
DeepResearch
Claude Code
Cursor Agent

核心知识:

强化学习

包括:

  • MDP
  • POMDP
  • 策略优化
  • 多智能体协同

规划算法

A*
MCTS
GOAP
HTN


世界模型

Yann LeCun 提出的世界模型路线。


3. LLM算法工程师(门槛高)

这是真正训练模型的人。

主要工作:

  • 预训练
  • 微调
  • RLHF
  • Alignment
  • 模型优化

需要:

数学

  • 线性代数
  • 概率论
  • 信息论
  • 优化理论

深度学习

  • Transformer
  • Attention
  • Position Encoding
  • MoE

例如:

Transformer(核心论文:Attention Is All You Need)


4. 大模型基础设施工程师

很多人忽略这一块。

工作内容:

  • 分布式训练
  • 推理加速
  • GPU集群
  • KV Cache
  • 推理服务

技术栈:

CUDA
PyTorch
NCCL
DeepSpeed
vLLM
TensorRT

例如:

这个方向工资通常很高,因为懂GPU的人很少。


5. LLM研究员(最难)

这类岗位一般出现在:

工作内容:

研究:

  • 推理能力
  • 长上下文
  • 世界模型
  • Agent
  • RLVR
  • Alignment

要求:

顶会论文
科研能力
数学能力
代码能力

通常博士居多。


如果你只有6个月时间来学

我建议按下面顺序学习:

第一阶段(1个月)

掌握:

  • Python高级开发
  • PyTorch

推荐:

PyTorch Tutorials


第二阶段(2个月)

掌握:

  • Transformer
  • Attention
  • LLM原理

重点复现:

nanoGPT

你会第一次真正看懂模型训练。


第三阶段(2个月)

掌握:

  • RAG
  • Agent
  • MCP
  • LangGraph

做项目


第四阶段(1个月)

阅读:

  • ReAct
  • Toolformer
  • Voyager
  • Deep Research
  • OpenAI Agent论文

做多Agent系统

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐