大模型入门-应用篇4-Deep Research

草帽-路飞

566人浏览 · 2026-05-14 00:50:46

草帽-路飞 · 2026-05-14 00:50:46 发布

Deep Research 深度研究：AI Agent 的新范式与开源框架解析

大型语言模型（LLM）虽然展现出了强大的生成与推理能力，但其知识储备往往受限于训练语料，在面对时效性强或高度专业领域的新信息时，常常显得力不从心。

为了解决这个问题，业界最初推出了 RAG（检索增强生成） 方案，让模型通过检索外部文档来扩充知识。然而，传统 RAG 更多是被动地“享用”检索结果，缺乏主动探索和深度推理的能力。随后，随着智能体（Agent）在规划和工具使用上的进化，Deep Search（深度搜索） 应运而生，它允许智能体一步步进行网页检索和阅读，直到获取所需信息。

但是，真正的“科研”不仅是收集信息，更需要将零散的证据系统化整合并结构化表达出来。基于此，Deep Research（深度研究） 概念正式诞生——它将检索探索、结构化分析与报告生成完美结合，让 Agent 能够把零散信息转化为连贯、事实可靠且贴合研究目标的长篇分析报告。

核心架构：Deep Research 的标准三步走

根据 OpenAI 提供的 Deep Research 指导文档，目前主流框架的核心思想是：不要试图用一个超长的提示词让模型一次性完成所有研究 。相反，应该将复杂的研报任务分解为清晰、模块化的三个步骤：

规划 (Plan)：
让一个高级（最新的）大模型将用户的主问题分解成一系列具体的、可独立研究的子问题。
执行 (Execute)：
并行地对每个子问题进行研究，调用搜索 API 获取信息，并让模型对单个信息源进行初步总结。
合成 (Synthesize)：
将所有子问题的答案汇总，交给高级模型，由其撰写成一篇连贯、完整的最终报告。

💡 算力分配技巧：在“规划”和“合成”阶段，由于需要强大的逻辑组织和长文本生成能力，建议使用能力最强的模型（决定了报告的上限）；而在“执行”阶段对单个网页进行初步总结时，可以使用更便宜、更快的模型来降本增效。

主流开源框架大盘点

目前开源社区已经涌现了多个优秀的 Deep Research 框架，它们在架构设计上各有千秋。

1. ByteDance / DeerFlow

项目地址：github.com/bytedance/deer-flow

DeerFlow 采用的是模块化的多智能体（Multi-agent）协同模式，系统内包含多个各司其职的角色：

协调器 (Coordinator)：工作流的入口和管理者，负责接收请求、启动流程并委派任务。

规划器 (Planner)：策略师。负责将复杂问题分解为可执行步骤，并评估何时开始生成报告。

研究团队 (Research Team)：具体任务的执行小组。包含执行网络搜索、调用 API 的 研究员 (Researcher)，以及负责执行 Python 代码、进行数据分析的 程序员 (Coder) 。

报告员 (Reporter)：最后一环。负责汇总信息并生成多格式报告（如 Notion 文档、播客或 PPT）。
在这里插入图片描述

2. LangChainAI / OpenDeep_Research

项目地址：github.com/langchain-ai/open_deep_research

该项目模仿了人类专家的研究方法，核心理念可概括为 Plan（规划） -> Search（搜索） -> Reflect（反思） -> Write（撰写） 。

特别亮点 - 反思 (Reflect)：在收集初步信息后，智能体会自我评估知识是否存在空白。如果信息不足，系统会生成更精确的查询词进入下一轮迭代，直到信息足够全面。
在这里插入图片描述

它提供了两种实现方式：

图状工作流 (Graph-based Workflow)：基于 LangGraph 构建，节点清晰可追溯，强调人机协作（Human-in-the-Loop），允许用户在关键节点审查反馈，适合高要求场景。

在这里插入图片描述

多智能体迭代循环 (Iterative Loop)：分为跳过初始规划的 简单模式 (Simple)（适合具体问题）和包含全局规划与并行研究器的 深度模式 (Deep)（适合宽泛主题）。

3. SkyworkAI / Deep_ResearchAgent

项目地址：github.com/SkyworkAI/Deep_ResearchAgent
在这里插入图片描述

SkyworkAI 采用了明确的 双层 (Two-Layer) 架构 ：

第一层：顶层规划智能体 (Top-Level Planning Agent)：负责理解、拆解任务，规划整体工作流，并动态协调各底层智能体。

第二层：专业化底层智能体 (Specialized Lower-Level Agents)：

深度分析器 (Deep Analyzer)：分析输入信息，提取核心见解。

深度研究员 (Deep Researcher)：检索整合高质量信息，自动生成摘要。

浏览器应用智能体 (Browser Use)：实现浏览器自动化操作与数据收集。

MCP 管理智能体 (MCP Manager Agent)：管理模型上下文协议（MCP）工具，支持本地与远程工具的动态注册执行。

通用工具调用智能体：提供 API 接口执行特定任务。

4. jina-ai / node-DeepResearch

项目地址：github.com/jina-ai/node-DeepResearch

该框架展示了一个高度循环优化的逻辑链条：接收 Query 后，在预算超支前不断在 Search（搜索）、Read（阅读）和 Reason（推理）之间进行循环迭代，最终输出 Answer（答案）。
在这里插入图片描述

结语

从 RAG 到 Deep Search，再到如今的 Deep Research，AI 处理信息的能力正在从“词汇匹配”向真正的“结构化知识生产”演进。对于开发者而言，理解这些多智能体协同工作的架构，合理拆解任务并分配不同算力模型，是构建下一代超级 AI 研究助手的关键所在。在这里插入图片描述

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

人员异常行为检测YOLO格式检测数据集

AtomGit开源社区

如果 HTML 成为大模型标准输出格式，训练体系需要怎么变？

摘要随着AI代理系统越来越多地采用HTML作为标准输出格式，大模型训练体系面临根本性变革。评估指标需新增渲染正确性、视觉质量等维度；训练数据需从互联网低质量HTML转向语义化、响应式的高质量代码；对齐方法需升级标注员能力并开发AI评估工具；Tokenizer需优化HTML编码效率；模型架构可能演进为专用HTML生成器或多模态闭环系统。这一转变将重塑从数据准备到模型评估的整个训练流程，并可能最终影

AtomGit开源社区

AI Native 应用的 UI 层该怎么设计？从 AG-UI 到 Agent 直出 HTML 的思考

AI Native 应用的 UI 层设计正处于一个关键的分叉点。AG-UI 和 A2UI 代表的结构化协议路线提供了安全性、一致性和跨平台能力，Agent 直出 HTML 路线提供了灵活性和无限表达力。三者并非对立，而是服务于不同场景的互补方案。未来最可能的演进方向是分层融合：固定框架提供稳定性，结构化协议（AG-UI/A2UI）处理标准交互和跨平台需求，沙箱 HTML 释放 Agent 的全部表