本文为初学者提供了一个详尽的指南,旨在帮助读者从零开始创建自己的AI Agent。文章首先介绍了Agent的工作原理,包括核心循环、增强型LLM的功能(工具、检索、记忆)以及工作流与Agent的区别。接着,文章通过实例演示了如何构建自己的Agent,并探讨了工具使用、记忆添加、实现动态工作等关键步骤。对于想要了解AI编程和自动化,并希望为特定需求创建实用Agent的程序员来说,本文提供了宝贵的资源和清晰的步骤指导。

直接开始吧。

图片

Agent 如何工作

首先得知道这些,不然你根本不知道为什么要用一个 Agent……

这是所有 Agent 共享的核心循环:

用户输入 → LLM 思考 → LLM 决定(回复或调用工具)→ 如果调用工具:执行它,把结果返回 → 重复

LLM 是"大脑",负责推理。工具是"手",执行动作(计算器、网页搜索、文件读写等)。记忆是"记事本",记录到目前为止发生了什么。不管你用 LangGraph、CrewAI、Anthropic 的 SDK 还是 OpenAI 的 Agents SDK,框架只是把这个循环包装起来,但本质不变。

增强型 LLM

普通的 LLM 输入文本输出文本。增强型 LLM 增加了三个能力:

  • 工具:模型可以调用的函数(计算器、数据库、API、文件操作等)。Anthropic 和 OpenAI 通过 JSON schema 暴露工具。

  • 检索:从外部来源(搜索引擎、文档、向量数据库)拉取相关信息的能力。

  • 记忆:通过消息历史或其他持久化存储,在多次交互中保留信息的能力。

工作流 vs 真 Agent

选方案时,工作流和 Agent 的区别很重要。

  • 工作流是确定性的,你的代码控制执行,同样的输入永远走同样的路径。适合步骤固定的明确任务,成本更低。

  • Agent是动态的,LLM 决定下一步,可能反复调用工具。适合开放性任务,但成本更高。

找自己需不需要创建 Agent 的过程,应该从用简单工作流开始,然后看能不能"毕业"变成自治 Agent。

因为说真的,大部分问题其实不需要完全自治就能解决。

img


五种工作流模式

Anthropic 记录并广泛采用的这五种模式,覆盖了常见场景。每个模式都依赖增强型 LLM。

模式一:提示链

做什么:把任务拆成顺序步骤。每个 LLM 调用处理前一个的输出。在步骤之间加编程"门"来验证质量。

什么时候用:任务能干净地分解成固定的子任务。用速度换准确性,让每个 LLM 调用更简单。

例子:生成营销文案然后翻译它。写大纲,验证它覆盖了关键主题,然后写完整文档。

模式二:路由

做什么:把输入分类,然后发到专门的处理器。每个处理器有自己的优化提示。

什么时候用:不同类别的输入需要完全不同的处理方式。客服分流是经典例子。

模式三:并行化

做什么:同时运行多个 LLM 调用。分段把任务分成独立的子任务并行处理。投票运行同样的任务多次,聚合结果获得更高置信度。

什么时候用:子任务相互独立的时候(分段),或者需要在关键决策上达成共识的时候(投票)。

模式四:编排者- workers

做什么:一个中心 LLM(编排者)动态分解任务,委托子任务给 worker LLM。不像并行化,子任务不是预定义的,编排者运行时决定。

什么时候用:复杂任务,无法提前预测结构的情况。跨多文件的代码生成、研究任务、写报告。

模式五:评估-优化器

做什么:一个 LLM 生成输出,另一个评估它并提供反馈。如果评估失败,反馈循环回去。重复直到满足质量标准。

什么时候用:存在明确的评估标准,且迭代优化能带来可衡量价值的情况。翻译、代码生成、写作任务。

img


构建你的 Agent

这才是你来的目的那部分……直接看:

怎么把"我想要一个 Agent 做 XYZ"变成真的东西?

最简单的思路:

  1. 写下这个工作
  2. 决定它需要什么工具
  3. 告诉模型怎么表现
  4. 用 5 个真实例子测试
  5. 只有失败了才加更多复杂性

不需要掌握五个框架才能构建你的第一个 Agent。对我和来说,最好的起点是:

  • 如果你想要一个能像能干的操作员一样工作的 Agent,有工具、文件、shell 命令、网页操作和强编码工作流,选 Anthropic

  • 如果你想要一个干净的开发者 SDK,有托管工具、切换、guardrails 和简单的生产路径,选 OpenAI

本指南主要聚焦这两个。

最简单的思维模型

构建 Agent 时,先回答这四个问题:

  1. 结果是什么? Agent 到底要产出什么?
  2. 它需要什么信息? 需要网页搜索、文件、数据库、表格、CRM,还是只需要用户的消息?
  3. 它应该能做什么动作? 只能回答?能搜索?能编辑文件?能发邮件?能写代码?能调用你自己的函数?
  4. 它必须遵守什么规则? 语气、格式、约束、安全规则、不确定时怎么做、"好"的标准是什么。

如果能清楚回答这四个问题,通常一天之内就能构建出第一个版本的 Agent。

一个快速技巧(稍后会深入讲),你可以把你的想法给 LLM,让它帮你回答上面所有问题。

用 AI 本身来设计 Agent

一个非常实用的做法是,在编码前用 Claude 或 ChatGPT 帮你定义 Agent。

粘贴类似这样的:

I want to build an AI agent.

My goal:
[描述你想要它做什么]

用户会问类似:
[加 5 个现实的例子]

Agent 应该能访问:
[网页搜索 / 文件 / 计算器 / 自定义 API / 别的没有]

它必须始终:
[列出不可商量的规则]

它永远不能:
[列出边界]

请转化为:
1. 一个清晰的 Agent 规格
2. 一个系统提示
3. 一个工具列表
4. 一个第一版路线图
5. 10 个测试用例

这一个提示就能帮新手把模糊的想法变成可构建的计划。

一个新手友好的 Agent 设计公式

每次用这个结构:

Agent = 角色 + 目标 + 工具 + 规则 + 输出格式

例子:

  • 角色:加密项目的研究助手

  • 目标:找到准确信息并清晰总结

  • 工具:网页搜索、文件搜索、计算器

  • 规则:注明来源、不猜测、标记不确定性

  • 输出格式:总结、风险、机会、最终结论

这是大多数有用 Agent 的基础。

从这五种新手 Agent 类型开始

如果是新手,别一开始就去构建多 Agent swarm。从这五个开始:

1. 研究 Agent

当你想让 Agent 收集信息并总结时用。

例子:

  • “研究脚踝扭伤的最佳康复练习”

  • “找一个加密协议的最新更新”

  • “对比三款笔记本电脑”

需要:网页搜索、如果你想让它用你自己的文件还需要文件搜索、清晰的输出格式。

2. 内容 Agent

当你想让 Agent 写、重写、总结或转换内容时用。

例子:

  • “把我的笔记变成新闻简报”

  • “用我的品牌声音重写这个”

  • “总结这个会议记录”

需要:通常只需要一个强的系统提示、可选的文件访问、你偏好风格的例子。

3. 工作流 Agent

当你想让 Agent 遵循一个可重复的商业流程时用。

例子:

  • “分类支持工单”

  • “把线索路由到正确类别”

  • “检查表单提交并创建回复草稿”

需要:清晰的类别、规则、有时需要自定义工具或 API 调用。

4. 个人知识 Agent

当你想让 Agent 用你的文档回答问题时用。

例子:

  • “只用我的 PDF 回答”

  • “搜索我的笔记并解释这个主题”

  • “找所有这个客户的引用”

需要:文件搜索或 RAG、清晰的指令让它紧扣提供的材料。

5. 操作 Agent

当你想让 Agent 在一个环境中执行动作时用。

例子:

  • “读这些文件然后编辑它们”

  • “搜索网页,收集发现,然后保存报告”

  • “运行 shell 命令帮我调试代码”

需要:工具、权限、强的安全边界。


Anthropic:构建第一个 Agent 的最简单方式

Anthropic 的 Agent 工具特别有帮助,尤其是当你想要模型使用工具并在一个环境中操作时。Claude Code 在 2025 年 2 月推出,Claude Code SDK 后来在 2025 年 9 月改名为 Claude Agent SDK。2026 年 3 月 GitHub 上的最新版本是 v0.1.50。

什么时候选 Anthropic

优先选 Anthropic 如果你想要一个 Agent 应该:

  • 读、写、编辑文件

  • 使用 shell 命令

  • 搜索网页

  • 使用 MCP 工具

  • 适合编码和技术任务

  • 感觉像一个能干的助手,一步步操作

用 Anthropic 实际上在做什么

在新手层面,你在做三件事:

  1. 给 Claude 一个工作
  2. 给 Claude 工具
  3. 让 Claude 循环直到任务完成

就这些。

新手例子:研究-总结 Agent

假设你想要:

“一个研究某个主题并给我写一份干净报告的 Agent。”

你的构建计划是:

  • 角色:高级研究助手

  • 目标:找到准确信息并清晰总结

  • 工具:网页搜索,可能还有文件访问

  • 规则:注明来源,说不确定时保持简洁

  • 输出:要点总结 + 关键风险 + 结论

这就变成了你的系统提示:

SYSTEM_PROMPT = '''
You are a careful research assistant.

Your job is to help the user research topics accurately.
Use tools when needed.
Do not guess.
If information is uncertain or incomplete, say so clearly.
Always produce:
1. Summary
2. Key findings
3. Risks or uncertainty
4. Final conclusion
'''

现在用户可以问:

  • “研究最新的 AI agent SDK”

  • “对比 Anthropic 和 OpenAI 对于构建新手 agent”

  • “找三个强来源并总结”

这就已经是一个真正的 Agent 了。

新手例子:基于文件的写作 Agent

也许你想要:

“读我的笔记然后用我的声音重写成干净的 文章。”

你的设计变成:

  • 角色:写作助手

  • 目标:把粗糙笔记变成精炼写作

  • 工具:文件读,可能还有文件写

  • 规则:保留意义、提升清晰度、匹配语气

  • 输出:最终文章 + 可选标题建议

这比做一个模糊的"内容 Agent"容易得多。


OpenAI:构建第一个 Agent 的最简单方式

OpenAI 在 2025 年 3 月 11 日推出了 Agents SDK,同时还有 Responses API 和用于网页搜索、文件搜索、计算机使用的内置工具。Python 包 openai-agents 在 2026 年 3 月是版本 0.13.1。

什么时候选 OpenAI

优先选 OpenAI 如果你想要:

  • 一个非常干净的 Agent API

  • 简单的自定义函数工具

  • 内置托管工具

  • 专家 Agent 之间的切换

  • guardrails 和追踪

  • 从原型到生产的平滑路径

用 OpenAI 实际上在做什么

在新手层面,构建是:

  1. 创建一个 Agent
  2. 给它指令
  3. 需要时加工具
  4. 用真实用户请求运行它

就这些。

新手例子:支持分流 Agent

假设你的目标是:

“读进来的支持请求,决定它们是账单、技术还是销售。”

变成:

  • 角色:支持分流助手

  • 目标:正确分类请求

  • 工具:没有,之后可能加 CRM 工具

  • 规则:只选一个类别,简要解释

  • 输出:类别 + 原因

看起来像这样:

from agents import Agent, Runner

agent = Agent(
    name="Support Triage Agent",
    instructions="""
You classify customer requests.
Choose exactly one category:
- billing
- technical
- sales

Reply with:
1. Category
2. One sentence explaining why
""",
)

result = Runner.run_sync(agent, "I was charged twice for my subscription this month.")
print(result.final_output)

这已经是一个有用的 Agent 了。

新手例子:加一个自定义工具

现在假设你想要:

“当需要时为用户计算值。”

from agents import Agent, Runner, function_tool

@function_tool
def calculate(expression: str) -> str:
    import math
    allowed = {k: v for k, v in math.__dict__.items() if not k.startswith("__")}
    return str(eval(expression, {"__builtins__": {}}, allowed))

agent = Agent(
    name="Math Helper",
    instructions="Help the user solve maths problems. Use the calculator tool when needed.",
    tools=[calculate],
)

result = Runner.run_sync(agent, "What is compound growth on 10000 at 5 percent for 8 years?")
print(result.final_output)

现在这个 Agent 不仅仅是在聊天了,它通过工具执行动作。

新手例子:使用托管工具

OpenAI Agents SDK 也支持托管工具,比如网页搜索、文件搜索和代码解释器。新手可以把这些想成你附加给 Agent 的"预建能力",而不是从零写所有东西。

这意味着你可以构建像这样的 Agent:

  • “从网上研究这个主题并总结”

  • “搜索我的文件并从中回答”

  • “运行代码分析这个数据”


自定义你的 Agent 让它真的做你想要的

这是新手通常会做错的地方。他们构建了一个通用助手而不是一个具体的 Agent。

用这个检查清单:

1. 把工作做窄

  • 烂:“帮处理业务 stuff”

  • 好:“把销售通话总结成行动要点”

  • 好:“把线索分类为热、温、冷”

  • 好:“研究加密项目并输出风险、催化剂和判断”

2. 定义输出格式

  • 烂:“给我一个答案”

  • 好:“返回:总结、证据、风险、下一步”

  • 好:“返回带 category、confidence、explanation 的 JSON”

  • 好:“返回 5 个标题下的要点列表”

3. 给出例子

如果你想要语气、结构或分类质量,例子帮助很大。

告诉模型:

  • “这里有 3 个好输出的例子”

  • “这里有 5 个如何分类请求的例子”

  • “用这个精确风格写”

4. 只在需要时加工具

如果任务只是重写笔记,别加网页搜索。如果答案应该只来自提示,别加文件访问。每个额外工具都增加复杂性。

5. 用真实提示测试,而不是理想的

用真实用户会打的乱提示。

不要只测试:

  • “请分类这个技术问题”

也要测试:

  • “我的账户坏了而且一直被扣钱到底怎么回事”

这才是你真正会学到 agent 实际上做什么的方式。

你的构建路径

第一步:用一句话描述 agent

例子:“我想要一个把我粗糙笔记变成干净周报的 agent。”

第二步:问 Claude 或 ChatGPT 把它变成:

  • 一个 agent 规格

  • 一个系统提示

  • 一个工具列表

  • 10 个测试提示

第三步:构建最小工作版本

不要多 agent 设置。不要复杂记忆。不要 RAG除非需要。

第四步:用 10 个真实例子测试

第五步:一次改善一件事

  • 提示

  • 输出结构

  • 例子

  • 工具

  • 记忆

  • 检索

那个顺序很重要。别被全部东西拖累。

避免这个错误

最大的错误是尝试构建一个"全能超级 Agent"。

别从这些开始:

  • 网页搜索

  • 文件搜索

  • 数据库访问

  • 记忆

  • 多 agent 切换

  • 复杂 guardrails

  • 自定义仪表盘

  • 20 个工具

从这里开始:

  • 一个工作

  • 一个 agent

  • 一个清晰提示

  • 最多一两个工具

  • 五到十 个真实测试用例

这就是你会成功的方式,不要把自己搞得太复杂。


工具的使用

这里新手最容易犯的错。

他们觉得:更多工具 = 更聪明的 Agent

错了。

更好的工具 = 更聪明的 Agent。更少的工具 = 更可靠的 Agent。

工具的最简单理解

一个工具只是:AI 自己做不到的事情

例子:

  • 计算数字

  • 搜索网页

  • 读你的文件

  • 发邮件

  • 查数据库

第一步:问自己"这需要工具吗?"

加任何东西前先问:

  • 模型只用推理能回答这个吗?

  • 还是它需要真实世界的数据或动作?

不需要工具的例子:

  • “重写这封邮件”

  • “总结这段文字”

  • “解释这个概念”

需要工具的例子:

  • “现在天气怎么样?”

  • “搜最新新闻”

  • “计算复利”

  • “从我的表格拉数据”

👉 规则:如果需要外部数据或动作 → 用工具;如果没有 → 别加

第二步:用 AI 帮你设计工具

我正在构建一个 AI agent。

我的目标:
[描述目标]

我认为 agent 需要做到:
[列出动作]

这些哪些需要工具?
我应该创建什么工具?
保持简单最小化。

返回:
1. 工具列表
2. 工具描述
3. 每个工具需要的输入

这会省你很多时间。

第三步:保持简单

烂工具:

manage_files(action, file, destination, overwrite, format, permissions)

好工具:

read_file(path)
write_file(path, content)
delete_file(path)

👉 规则:一个工具 = 一个清晰的活

第四步:告诉 Agent 什么时候用工具

这是大多数人会失败的地方。

烂:“计算器工具”

好:“当需要数学时使用这个工具。永远不要猜测计算。”

第五步:让 Agent 失败然后修复

用真实测试运行:

  • “2^16 是多少”

  • “7% 增长 10 年怎么算”

如果它:

  • 没用工具 → 修复描述

  • 用错了 → 修复输入

  • 幻觉了 → 让规则更严格

img


给你的 Agent 加上记忆

人们把这个想得太复杂了。

你只需要理解:有两种记忆

1. 短期记忆(对话)

这只是:到目前为止说了什么

你默认就有这个。

2. 长期记忆(外部知识)

这是:Agent 以后可以查的东西

例子:

  • 你的笔记

  • PDF

  • 文档

  • 数据库

什么时候真的需要记忆?

问:

  • Agent 需要跨消息记住东西吗?→ 是 → 短期

  • 它需要用外部文档吗?→ 是 → 长期

  • 否则 → 你可能不需要

第一步:让 AI 帮你决定是否需要

我正在构建一个 AI agent。

我的目标:
[目标]

这个 agent 需要:
1. 对话记忆?
2. 外部知识(RAG)?

如果需要,解释为什么。
如果不需要,解释为什么不。

保持简单。

第二步:你有三个选项……

选项 A:不需要记忆(从这里开始)

  • 对大多数新手最好

  • 70% 的用例都这样

选项 B:对话记忆

  • 大多数 SDK 已经处理了

  • 别重置消息就行

选项 C:基于文件的记忆(简单的 RAG)

  • 上传文档

  • 用文件搜索工具

第三步:别做得太过头

大错:

  • 加向量数据库

  • embeddings

  • 复杂 pipeline

在你知道自己是否需要之前

👉 规则:如果你的 Agent 没有记忆也能工作 → 别加

img


让你的 Agent 真正工作起来

这里 Agent 要么很棒,要么很烂。很多很烂是因为:

  • 烂提示

  • 没测试

  • 不切实际的期望

所以……

第一步:用 AI 创建测试用例

我构建了一个 AI agent,目标是:
[目标]

创建 15 个现实的用户输入:
- 乱的
- 模糊的
- 真实世界风格

还要包括:
- 边界情况
- 让人困惑的输入
- 烂输入

第二步:像真实用户一样测试

别测试:

  • “请分类这个技术问题”

测试:

  • “我的账户坏了而且一直被扣钱到底怎么回事”

这才是你真正会学到 agent 实际上做什么的方式。

第三步:一次只修一件事

当它失败时,问:

  • 提示不清楚?

  • 输出格式模糊?

  • 缺工具?

  • 缺规则?

第四步:用 AI 调试你的 agent

这是我的 agent:

我问了:
[输入]

输出是:
[输出]

哪里出问题了?
怎么修?
具体点。

第五步:别太早发疯

别加:

  • 多个 agent

  • 复杂工作流

  • 自动化 pipeline

直到:

  • 你的简单版本稳定工作

img


多个 Agent

这里你很容易完全走偏。

人们觉得:更多 agent = 更强

错了。

从一个 agent 开始。

只有当:

  • 任务明显能分开

  • 一个 agent 做不来

  • 角色非常不同

才加更多。

你需要多个 Agent 的三种情况

1. 不同技能

  • 研究 agent

  • 写作 agent

2. 清晰管道

  • 输入 → 分析 → 写 → 输出

3. 不同权限

  • 一个 agent 可以读数据

  • 一个 agent 可以执行动作

第一步:用 AI 决定是否需要多个 agent

我构建了一个 AI agent。

工作:
[描述]

这应该是:
1. 单个 agent
2. 多个 agent

如果是多个:
- 什么角色?
- 为什么?

保持简单。

最安全的模式

Supervisor 模型

用户 → 主 agent →(如果需要调用其他的)

别从:

  • swarm

  • 完全自治的多 agent 系统

开始。

它们很容易坏。

第二步:保持角色简单

烂:“带动态认知分层的 AI 策略 agent”

好:“研究 agent”、“写作 agent”

第三步:慢慢加 agent

从:

  • 1 个 agent

然后:

  • 最多 2 个

只有当:

  • 看到真正好处才扩展

总结

这个指南最重要的洞察是:Agent 概念上简单,但操作上要求高

核心循环——LLM 思考、调用工具、重复——50 行 Python 就能写下来。真正的工作在于工具设计、错误处理、评估,以及知道什么时候简单的模式(提示链、路由)会比自治 agent 更好。

三个可执行的建议

1. 先从零构建 Agent

理解原始循环让每个框架不再是魔法而是透明的。你会更快 debug 问题,更明智地选工具。

2. 从最简单的模式开始

提示链能处理大多数多步任务。路由模式能处理大多数分类后执行的工作流。只有当你需要 LLM 动态决定执行路径时,才升级到自治 agent。

3. 及早投资工具设计和评估

设计良好的工具,有清晰的名字、精确的描述、结构化的错误信息,比换模型或框架更能提升 agent 性能。20 个好的测试用例比大量手动测试能 catch 更多 bug。

这个领域变化很快,MCP 一年内就成了通用标准,两个主要厂商都发布了 Agent SDK,新框架每月都出现。但这个指南的基础是稳定的:agentic 循环、五种工作流模式、好工具设计的原则,以及从简单开始的纪律。掌握这些,你就能适应任何接下来出现的东西。

现在你可以构建一个 Agent 了。

最后

对于正在迷茫择业、想转行提升,或是刚入门的程序员、编程小白来说,有一个问题几乎人人都在问:未来10年,什么领域的职业发展潜力最大?

答案只有一个:人工智能(尤其是大模型方向)

当下,人工智能行业正处于爆发式增长期,其中大模型相关岗位更是供不应求,薪资待遇直接拉满——字节跳动作为AI领域的头部玩家,给硕士毕业的优质AI人才(含大模型相关方向)开出的月基础工资高达5万—6万元;即便是非“人才计划”的普通应聘者,月基础工资也能稳定在4万元左右

再看阿里、腾讯两大互联网大厂,非“人才计划”的AI相关岗位应聘者,月基础工资也约有3万元,远超其他行业同资历岗位的薪资水平,对于程序员、小白来说,无疑是绝佳的转型和提升赛道。
图片
图片
对于想入局大模型、抢占未来10年行业红利的程序员和小白来说,现在正是最好的学习时机:行业缺口大、大厂需求旺、薪资天花板高,只要找准学习方向,稳步提升技能,就能轻松摆脱“低薪困境”,抓住AI时代的职业机遇。

如果你还不知道从何开始,我自己整理一套全网最全最细的大模型零基础教程,我也是一路自学走过来的,很清楚小白前期学习的痛楚,你要是没有方向还没有好的资源,根本学不到东西!

下面是我整理的大模型学习资源,希望能帮到你。

图片

👇👇扫码免费领取全部内容👇👇

在这里插入图片描述

最后

1、大模型学习路线

img

2、从0到进阶大模型学习视频教程

从入门到进阶这里都有,跟着老师学习事半功倍。

在这里插入图片描述

3、 入门必看大模型学习书籍&文档.pdf(书面上的技术书籍确实太多了,这些是我精选出来的,还有很多不在图里)

在这里插入图片描述

4、 AI大模型最新行业报告

2026最新行业报告,针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估,以了解哪些行业更适合引入大模型的技术和应用,以及在哪些方面可以发挥大模型的优势。

img

5、面试试题/经验

img

【大厂 AI 岗位面经分享(107 道)】

img

【AI 大模型面试真题(102 道)】

img

【LLMs 面试真题(97 道)】

img

6、大模型项目实战&配套源码

img

适用人群

在这里插入图片描述

四阶段学习规划(共90天,可落地执行)
第一阶段(10天):初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。

  • 大模型 AI 能干什么?
  • 大模型是怎样获得「智能」的?
  • 用好 AI 的核心心法
  • 大模型应用业务架构
  • 大模型应用技术架构
  • 代码示例:向 GPT-3.5 灌入新知识
  • 提示工程的意义和核心思想
  • Prompt 典型构成
  • 指令调优方法论
  • 思维链和思维树
  • Prompt 攻击和防范
第二阶段(30天):高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。

  • 为什么要做 RAG
  • 搭建一个简单的 ChatPDF
  • 检索的基础概念
  • 什么是向量表示(Embeddings)
  • 向量数据库与向量检索
  • 基于向量检索的 RAG
  • 搭建 RAG 系统的扩展知识
  • 混合检索与 RAG-Fusion 简介
  • 向量模型本地部署
第三阶段(30天):模型训练

恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。

到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?

  • 为什么要做 RAG
  • 什么是模型
  • 什么是模型训练
  • 求解器 & 损失函数简介
  • 小实验2:手写一个简单的神经网络并训练它
  • 什么是训练/预训练/微调/轻量化微调
  • Transformer结构简介
  • 轻量化微调
  • 实验数据集的构建
第四阶段(20天):商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。

  • 硬件选型

  • 带你了解全球大模型

  • 使用国产大模型服务

  • 搭建 OpenAI 代理

  • 热身:基于阿里云 PAI 部署 Stable Diffusion

  • 在本地计算机运行大模型

  • 大模型的私有化部署

  • 基于 vLLM 部署大模型

  • 案例:如何优雅地在阿里云私有部署开源大模型

  • 部署一套开源 LLM 项目

  • 内容安全

  • 互联网信息服务算法备案

  • 👇👇扫码免费领取全部内容👇👇

    在这里插入图片描述

3、这些资料真的有用吗?

这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理,现任上海殷泊信息科技CEO,其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证,服务航天科工、国家电网等1000+企业,以第一作者在IEEE Transactions发表论文50+篇,获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的技术人员,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。
在这里插入图片描述
在这里插入图片描述

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

在这里插入图片描述

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐