收藏！一文掌握ReAct Agent：从传统编程到智能体的跃迁之路

上马定江山

370人浏览 · 2026-03-14 11:40:52

上马定江山 · 2026-03-14 11:40:52 发布

本系列文章基于 Lynxe 作者沈询的实战经验，深入浅出解析 ReAct Agent 的核心原理与工程价值，帮助开发者快速掌握从“写流程”到“造智能体”的关键跃迁。

所以想把这些内容总结出来，是因为这个项目本身核心目的就是探索Agent的前沿最佳实践，目前已经有所小成，Lynxe能解决我自己面对的80%以上的问题了，所以我觉得值得把我实验下来有效的东西写出来，方便大家快速入门。

你可以访问 Lynxe(菱科斯)阅读详细源码来学习agent的一些最佳实践。这是一个非常完善的产品级的 Func-Agent框架。

https://github.com/spring-ai-alibaba/Lynxe

系列计划

什么是 ReAct Agent？ (本篇)
深入了解智能体工作流核心：Agent vs 传统编程 vs Workflow 的本质区别
深入解析Function Calling、MCP和Skills的本质差异与最佳实践
上下文管理的一些实践
并行执行的最佳实践与我走过的弯路

核心思想：观察-思考-行动

ReAct 这个名字听起来挺高大上，其实拆开看就明白了：Reasoning（推理）+ Acting（行动）。说白了，就是让 AI 一边想一边做，而不是想完了再做。

ReAct Agent 的工作方式其实挺像人类解决问题的过程。它不是一次性把整个流程都规划好，而是在有一个整体目标的前提下，走一步看一步。具体来说，它会先观察当前的情况，然后思考下一步该做什么，接着执行这个动作，再观察结果，根据结果决定下一步。这个过程会一直循环，直到任务完成。

打个比方，传统的方式就像你出门前把整个路线都查好，然后严格按照路线走。而 ReAct 更像是你出门后，走一段路，看看周围环境，再决定下一步往哪走。比如你要去一个没去过的咖啡店，传统方式是你提前查好所有路线，ReAct 则是你走到路口，看看路牌，再决定左转还是右转，边走边找。

实际例子

再举个更具体的例子。假设你要让 AI 帮你查"北京今天天气怎么样，适合穿什么衣服"。用 ReAct 的方式，AI 会这样工作：

1.观察：看到用户的问题，历史上下文为空

2.思考：“我需要知道北京今天的天气”（思考是可选输出,就跟人的思考是内化发生的一样）

3.行动：调用天气查询工具，查询 “北京今天天气”

4.观察：获取到天气数据：温度 25°C，晴天，湿度 60%，风速 3m/s

5.思考：“现在我知道天气了，需要查询穿衣建议知识库来获取具体的穿衣建议”（思考是可选输出）

6.行动：调用穿衣建议知识库查询工具，查询 “25度晴天适合穿什么衣服”

7.观察：获取到穿衣建议：25度晴天建议穿短袖 T 恤或薄长袖，可以带一件薄外套以防早晚温差，建议戴帽子和涂防晒霜

8.思考：“我已经获取了天气和穿衣建议，应该将这些信息写入文件保存”（思考是可选输出）

9.行动：调用 writeToFile 工具，将完整建议写入文件

10.观察：建议已写入到文件 weather_suggestion.md

整个过程是观察-思考-行动-再观察的循环，而不是一开始就把所有步骤都定死。每一步都会根据当前的历史上下文和环境信息，动态决定下一步该做什么。

为什么需要 ReAct？

你可能会问，为什么要这么麻烦？直接写个固定流程不就行了吗？问题在于，很多现实任务其实没那么简单。你可能会遇到各种意外情况，比如 API 返回错误、数据格式不对、或者需要根据中间结果调整策略。ReAct 的优势就在于它能根据实际情况灵活应对，而不是遇到意外就卡住。

当然，这种灵活性也带来了一些代价，比如行为可能不那么可预测，有时候 AI 可能会"犯傻"。但总的来说，在处理复杂、不确定的任务时，ReAct 这种边想边做的方式还是很有优势的。

ReAct 是怎么实现的？

关键要素

ReAct 的实现其实离不开几个关键要素：

历史上下文（History）ReAct 会维护一个对话历史，记录之前所有的思考、行动和观察。这样 LLM 在做决策时，可以参考之前发生了什么，避免重复操作或者走错路。
观察当前环境信息（Current Environment Information）这是 Agent 在当前时刻接收到的外部信息，比如用户的输入、系统的状态、或者其他需要处理的数据。这些信息会作为 LLM 推理的输入，帮助决定下一步该做什么。
语言模型（LLM Thinking）这是 ReAct 的"大脑"，负责推理和决策。每次需要思考下一步该做什么时，LLM 会根据当前的历史上下文、环境信息和观察结果，生成下一步的行动计划。（后续表格里这个think是隐藏的，最终表现形式就是toolcall）
工具/动作（toolcall）这是 ReAct 的"手脚"，用来执行具体的操作。比如搜索、查询 API、读写文件等等。每个工具都有明确的输入输出，Agent 可以调用这些工具来完成实际工作。
观察结果（toolcall结果）每次执行动作后，都会得到一个观察结果。这个结果会被反馈给 LLM，作为下一轮推理的依据。观察结果可能包括成功的数据、错误信息、或者需要进一步处理的内容。

执行流程示例

下面用一个完整的例子，看看 ReAct 是怎么一步步解决问题的。假设任务是：“帮我查一下北京今天天气怎么样，适合穿什么衣服。”


轮次	历史上下文	当前环境信息	当前轮次提示词	行动(toolcall)	观察结果(toolcall结果)
Round 1	无	空	已知：当前历史上下文：&{历史上下文} 当前环境信息：&{当前环境信息} 用户目标：“帮我查一下北京今天天气怎么样，适合穿什么衣服。” 做出下一步的决策 . 你必须最少使用一个工具来实现该决策	天气查询工具调用：查询 “北京今天天气”	天气查询工具返回：获取到天气数据：温度 25°C，晴天，湿度 60%，风速 3m/s
Round 2	已获取北京天气数据（25°C，晴天，湿度 60%，风速 3m/s）	天气工具：无额外环境信息	同上，提示词不会变化	穿衣建议知识库查询工具调用：查询 “25度晴天适合穿什么衣服”	穿衣建议知识库查询工具返回：25度晴天建议穿短袖 T 恤或薄长袖，可以带一件薄外套以防早晚温差，建议戴帽子和涂防晒霜
Round 3	天气数据（25°C，晴天，湿度 60%，风速 3m/s）；已获取穿衣建议：25度晴天建议穿短袖 T 恤或薄长袖，可以带一件薄外套以防早晚温差，建议戴帽子和涂防晒霜	天气工具：无额外环境信息、穿衣知识库工具：无额外环境信息	同上，提示词不会变化	writeToFile工具调用：内容为"北京今天天气：25°C，晴天，湿度 60%。建议穿短袖 T 恤或薄长袖，可以带一件薄外套以防早晚温差，建议戴帽子和涂防晒霜"	writeToFile工具返回：建议已写入到文件 weather_suggestion.md

从这里我们也可能看到，核心其实就是

已知：

当前历史上下文：&{历史上下文}

当前环境信息：&{当前环境信息}

用户目标：“帮我查一下北京今天天气怎么样，适合穿什么衣服。”

做出下一步的决策：

你必须最少使用一个工具来实现该决策。

最终输出：建议已经写入到文件 weather_suggestion.md，你可以通过打开这个文件来看到具体建议。

从这个例子可以看出，ReAct 不是一开始就知道所有步骤，而是根据每轮的观察结果，动态决定下一步该做什么。如果 Round 1 搜索失败了，它可能会尝试其他搜索关键词，或者换一个策略。这种灵活性正是 ReAct 的核心优势。

伪代码

下面是一个 round 的执行流程伪代码，展示了核心的执行逻辑：

函数 执行一个轮次(用户目标, 历史上下文):
// 1. 获取当前环境信息
当前环境信息 = 获取当前环境信息()
// 2. 构建提示词（替换占位符）
提示词模板 = "已知：\n当前历史上下文：${历史上下文}\n当前环境信息：${当前环境信息}\n用户目标：\"${用户目标}\"\n\n做出下一步的决策\n\n你必须最少使用一个工具来实现该决策"
完整提示词 = 替换占位符(提示词模板, {
历史上下文: 历史上下文,
当前环境信息: 当前环境信息,
用户目标: 用户目标
})
// 3. 调用 LLM 进行推理（思考过程隐藏，直接输出 toolcall）
工具调用结果 = 调用语言模型(完整提示词, 历史上下文)
// 4. 解析工具调用
工具名称 = 解析工具名称(工具调用结果)
工具参数 = 解析工具参数(工具调用结果)
// 5. 执行工具调用
观察结果 = 执行工具(工具名称, 工具参数)
// 6. 更新历史上下文
新历史上下文 = 追加到历史上下文(历史上下文, {
行动: 工具调用结果,
观察结果: 观察结果
})
// 7. 返回结果
返回 {
观察结果: 观察结果,
新历史上下文: 新历史上下文
}
结束函数
// 主循环
函数 执行ReAct流程(用户目标):
历史上下文 = 空
当前轮次 = 1
最大轮次 = 10
当 当前轮次 <= 最大轮次 且 未完成任务:
结果 = 执行一个轮次(用户目标, 历史上下文)
历史上下文 = 结果.新历史上下文
如果 判断任务已完成(结果.观察结果):
中断循环
当前轮次 = 当前轮次 + 1
结束循环
返回 历史上下文
结束函数

最后唠两句

为什么AI大模型成为越来越多程序员转行就业、升职加薪的首选

很简单，这些岗位缺人且高薪

智联招聘的最新数据给出了最直观的印证：2025年2月，AI领域求职人数同比增幅突破200% ，远超其他行业平均水平；整个人工智能行业的求职增速达到33.4%，位居各行业榜首，其中人工智能工程师岗位的求职热度更是飙升69.6%。

在这里插入图片描述

AI产业的快速扩张，也让人才供需矛盾愈发突出。麦肯锡报告明确预测，到2030年中国AI专业人才需求将达600万人，人才缺口可能高达400万人，这一缺口不仅存在于核心技术领域，更蔓延至产业应用的各个环节。

那0基础普通人如何学习大模型？

深耕科技一线十二载，亲历技术浪潮变迁。我见证那些率先拥抱AI的同行，如何建立起效率与薪资的代际优势。如今，我将积累的大模型面试真题、独家资料、技术报告与实战路线系统整理，分享于此，为你扫清学习困惑，共赴AI时代新程。

我整理出这套 AI 大模型突围资料包【允许白嫖】：

✅从入门到精通的全套视频教程
✅AI大模型学习路线图（0基础到项目实战仅需90天）
✅大模型书籍与技术文档PDF
✅各大厂大模型面试题目详解
✅640套AI大模型报告合集
✅大模型入门实战训练

这份完整版的大模型 AI 学习和面试资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

在这里插入图片描述

①从入门到精通的全套视频教程

包含提示词工程、RAG、Agent等技术点

在这里插入图片描述

② AI大模型学习路线图（0基础到项目实战仅需90天）

全过程AI大模型学习路线

在这里插入图片描述

③学习电子书籍和技术文档

市面上的大模型书籍确实太多了，这些是我精选出来的

在这里插入图片描述

④各大厂大模型面试题目详解

在这里插入图片描述

⑤640套AI大模型报告合集

在这里插入图片描述

⑥大模型入门实战训练

在这里插入图片描述

如果说你是以下人群中的其中一类，都可以来智泊AI学习人工智能，找到高薪工作，一次小小的“投资”换来的是终身受益！

应届毕业生‌：无工作经验但想要系统学习AI大模型技术，期待通过实战项目掌握核心技术。

零基础转型‌：非技术背景但关注AI应用场景，计划通过低代码工具实现“AI+行业”跨界‌。

业务赋能 ‌突破瓶颈：传统开发者（Java/前端等）学习Transformer架构与LangChain框架，向AI全栈工程师转型‌。

👉获取方式：
有需要的小伙伴，可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

在这里插入图片描述

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

【昇腾】基于昇腾适配的GPToss大模型性能优化实操指南

AtomGit开源社区

国内有哪些AI新闻网站？2026值得关注的人工智能资讯平台

随着人工智能技术的快速发展，越来越多开发者、产品经理和投资者开始关注 **AI行业资讯网站** 。AI领域每天都会出现：* 新模型发布 * 开源项目爆火 * AI产品上线 * 创业公司融资因此，选择合适的 **AI资讯平台** 可以帮助你快速了解行业变化。本文整理了目前国内比较值得关注的 **AI新闻与AI趋势网站** 。# 国内有哪些值得关注的AI资讯网站？目前国内比较常

AtomGit开源社区

探究 Linux 系统组成与基本命令操作实验报告

本次实验围绕 Linux 系统组成与基本命令操作展开，通过理论结合实操的方式，完成了实验目标。实验过程中，不仅掌握了 Linux 终端的特性和核心命令的使用方法，更深刻理解了 Linux 与 Windows 操作系统的本质区别。Linux 作为开源的类 Unix 操作系统，其命令行操作的高效性、权限管理的精细化、系统架构的灵活性，使其在服务器、嵌入式开发等领域占据重要地位。