大语言模型开发的工作岗位都有哪些?
·
参与大语言模型(LLM)开发,而不是简单调用API做应用,那么岗位大致分成5条路线,每条路线需要的技能差异很大。
1. LLM应用工程师(最容易进入)
这是目前招聘最多的岗位。
主要工作:
- 调用模型API
- Agent开发
- RAG知识库
- Prompt Engineering
- 工作流编排
- MCP工具调用
- 企业AI应用开发
典型技术栈:
- Python
- FastAPI
- LangChain
- LangGraph
- LlamaIndex
- MCP
- 向量数据库
例如:
需要掌握:
Python
REST API
数据库
向量数据库
Embedding
RAG
Agent
Prompt
部署
数学要求:
低
很多公司实际上招的就是这个。
2. Agent工程师(非常适合你)
未来两年需求可能增长最快。
工作内容:
- 多智能体系统
- Agent规划
- Tool Use
- Memory
- 长任务执行
- 工作流优化
例如:
AutoGPT OpenManus DeepResearch Claude Code Cursor Agent
核心知识:
强化学习
包括:
- MDP
- POMDP
- 策略优化
- 多智能体协同
规划算法
A*
MCTS
GOAP
HTN
世界模型
Yann LeCun 提出的世界模型路线。
3. LLM算法工程师(门槛高)
这是真正训练模型的人。
主要工作:
- 预训练
- 微调
- RLHF
- Alignment
- 模型优化
需要:
数学
- 线性代数
- 概率论
- 信息论
- 优化理论
深度学习
- Transformer
- Attention
- Position Encoding
- MoE
例如:
Transformer(核心论文:Attention Is All You Need)
4. 大模型基础设施工程师
很多人忽略这一块。
工作内容:
- 分布式训练
- 推理加速
- GPU集群
- KV Cache
- 推理服务
技术栈:
CUDA
PyTorch
NCCL
DeepSpeed
vLLM
TensorRT
例如:
这个方向工资通常很高,因为懂GPU的人很少。
5. LLM研究员(最难)
这类岗位一般出现在:
工作内容:
研究:
- 推理能力
- 长上下文
- 世界模型
- Agent
- RLVR
- Alignment
要求:
顶会论文 科研能力 数学能力 代码能力
通常博士居多。
如果你只有6个月时间来学
我建议按下面顺序学习:
第一阶段(1个月)
掌握:
- Python高级开发
- PyTorch
推荐:
第二阶段(2个月)
掌握:
- Transformer
- Attention
- LLM原理
重点复现:
你会第一次真正看懂模型训练。
第三阶段(2个月)
掌握:
- RAG
- Agent
- MCP
- LangGraph
做项目
第四阶段(1个月)
阅读:
- ReAct
- Toolformer
- Voyager
- Deep Research
- OpenAI Agent论文
做多Agent系统
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐



所有评论(0)