图片

 

最近,一个开源金融交易智能体框架在 GitHub 上快速出圈。

项目名叫 TradingAgents,来自 TauricResearch,定位是:

Multi-Agents LLM Financial Trading Framework 多智能体大模型金融交易框架

截至目前,该项目在 GitHub 上已经超过 70k Star,Fork 数超过 13k,热度非常高。项目官方介绍中也明确提到,TradingAgents 试图模拟真实交易机构中的协作流程:基本面分析师、情绪分析师、新闻分析师、技术分析师、交易员、风险管理团队、投资组合经理,共同完成一次交易决策。(GitHub[1])

开源项目地址:TauricResearch / TradingAgentsGitHub 搜索:TauricResearch TradingAgents

这件事值得测试开发、AI 工程、金融科技从业者关注的地方,不是“AI 能不能帮你炒股赚钱”,而是:

金融交易这种高风险、高噪声、高不确定性的复杂决策场景,正在被拆成一套可编排、可追踪、可复盘的 Agent 工作流。


目录

  1. TradingAgents 到底是什么

  2. 为什么它不是普通量化策略

  3. 多智能体投研流程是怎么跑起来的

  4. 核心架构拆解

  5. 它为什么能爆火

  6. 对测试开发和 AI 工程的启发

  7. 这类系统真正难测在哪里

  8. 普通开发者该怎么学习这个项目


01 TradingAgents 到底是什么?

先说结论:

TradingAgents 不是一个简单的“AI 炒股脚本”,而是一个用多智能体模拟金融投研团队的框架。

传统的金融分析系统,通常是这样的:

图片

这个流程看起来很完整,但它有一个问题:

所有信号最后往往会被压缩进一个模型或者一个规则系统里。

模型会输出结果,但你很难知道:

  • 为什么它看多?

  • 为什么它看空?

  • 它有没有考虑风险?

  • 它有没有参考新闻?

  • 它有没有被短期情绪误导?

  • 它有没有做过反方论证?

TradingAgents 的思路不是让一个大模型直接给答案,而是把交易决策拆成多个角色:

图片

 

这就更像一个真实投研会议:

有人看基本面,有人看技术面,有人看新闻,有人专门唱反调,有人负责风控,最后由投资组合经理拍板。

这也是它最有意思的地方:

TradingAgents 把“交易决策”从一次模型推理,变成了一场结构化的智能体协作。


02 它为什么不是普通量化策略?

很多人看到 TradingAgents,第一反应可能是:

“这不就是量化交易吗?”

不完全是。

传统量化系统更强调:

  • 价格序列

  • 因子模型

  • 技术指标

  • 统计套利

  • 回测收益

  • 风控参数

  • 策略执行

而 TradingAgents 更偏向于:

  • 多角色推理

  • 投研过程模拟

  • 多观点辩论

  • 风险评审

  • 决策可解释

  • 交易结论复盘

可以这么理解:

对比维度

传统量化策略

TradingAgents

决策核心

规则 / 模型 / 因子

多智能体协作

输入信息

行情、因子、指标

行情、新闻、情绪、财报、技术指标

推理过程

多数时候偏黑盒

多角色分工、讨论、评审

风险控制

通常由策略参数控制

由风险管理 Agent 参与评估

可解释性

依赖日志和因子解释

具备自然语言推理链路

工程形态

策略系统

Agent 工作流系统

TradingAgents 的价值不在于替代所有量化交易系统,而在于提供了一种新的工程范式:

用 Agent 模拟真实投研组织,把复杂决策流程拆成多个可组合节点。

这对金融场景很重要。

因为金融决策不是简单分类问题。

它既要看数据,也要看事件; 既要看趋势,也要看风险; 既要有进攻,也要有防守; 既要有结论,也要能解释为什么得出这个结论。


03 多智能体投研流程是怎么跑起来的?

根据项目 README,TradingAgents 内部主要包含几类角色:分析师团队、研究员团队、交易员、风险管理团队、投资组合经理。项目官方文档明确提到,它会让基本面、情绪、新闻、技术分析等不同 Agent 协同评估市场条件,并通过讨论来帮助形成交易策略。(GitHub[2])

可以把它拆成五层。


第一层:分析师团队

分析师团队负责采集和解释不同类型的信息。

1. 基本面分析师

关注公司财务、经营状况、业绩表现、潜在风险。

它更像是在回答:

这家公司本身值不值得买?

2. 情绪分析师

关注市场情绪、社交媒体、舆论变化、短期市场心理。

它更像是在回答:

市场现在是不是过度乐观或过度悲观?

3. 新闻分析师

关注宏观事件、行业新闻、公司公告、政策变化。

它更像是在回答:

最近有没有影响股价的外部事件?

4. 技术分析师

关注 MACD、RSI 等技术指标,用于识别价格趋势和交易信号。项目 README 中也提到了技术分析师会利用 MACD、RSI 这类指标检测交易模式。(GitHub[3])

它更像是在回答:

从价格走势看,现在是不是一个合适的位置?


第二层:研究员团队

分析师给出信息后,并不会直接下单。

TradingAgents 还引入了研究员团队。

这里有一个很关键的设计:

看多研究员和看空研究员会进行结构化辩论。

这一步非常像真实投研会议。

一个人说:

基本面改善,新闻偏利好,技术面突破,应该买入。

另一个人说:

估值已经偏高,市场情绪过热,波动率上升,应该谨慎。

这类“正反方辩论”比单模型直接输出结论更有价值。

因为金融市场最大的风险之一,就是模型只看到自己想看的证据。


第三层:交易员 Agent

研究员讨论之后,交易员 Agent 会综合前面的分析结果,形成交易建议。

它不只是说“买”或者“不买”,而是要判断:

  • 是否交易

  • 交易方向

  • 交易理由

  • 交易时机

  • 仓位大小

  • 风险点

  • 是否需要等待更明确的信号

项目 README 中提到,Trader Agent 会整合分析师和研究员报告,并基于综合市场信息做交易决策。(GitHub[4])


第四层:风险管理团队

这一层是很多 AI 交易项目容易忽略的部分。

真实交易里,很多时候不是“看对方向”就能赚钱。

你还要控制:

  • 最大回撤

  • 仓位暴露

  • 波动率风险

  • 流动性风险

  • 黑天鹅事件

  • 连续错误决策

TradingAgents 中的风险管理团队会持续评估投资组合风险,并把评估报告提交给 Portfolio Manager。(GitHub[5])

这也是它更接近“投研组织”的地方。

交易不是只要聪明,交易还需要克制。


第五层:投资组合经理

最后,Portfolio Manager 负责审批或拒绝交易提案。

这一步很重要。

因为它让整个系统形成了一个相对完整的决策闭环:

图片

这不是简单的“LLM 给个建议”。

它更像是:

用 Agent 工作流复刻一套小型投研决策系统。


04 核心架构拆解:TradingAgents 真正火在哪里?

TradingAgents 的爆火,不只是因为它套上了“金融 + AI + Agent”这几个热门词。

更重要的是,它踩中了当前 AI 工程里的一个关键趋势:

从单 Agent,走向多 Agent 协作。


1. 单 Agent 的问题:很聪明,但容易“一锤定音”

很多 AI 应用早期都是单 Agent:

图片

这个结构简单,但问题明显:

  • 容易自信地给错答案

  • 缺少反方检查

  • 缺少过程评审

  • 缺少角色分工

  • 难以承担复杂任务

在金融场景里,这个问题会被放大。

因为金融决策本身就是高噪声、高不确定性、高风险的。

让一个模型直接回答“买不买”,风险非常大。


2. 多 Agent 的价值:让复杂任务变成组织协作

TradingAgents 的核心设计,是把一个复杂交易任务拆成多个角色:

图片

每个角色只负责一个相对明确的任务。

这带来几个好处:

第一,职责更清楚

基本面 Agent 不需要判断所有事情。 技术分析 Agent 也不需要理解所有新闻。 风险 Agent 不需要负责寻找机会。

每个 Agent 做自己最擅长的一块。


第二,过程更可追踪

如果最终交易建议有问题,可以反查:

  • 是新闻分析误判?

  • 是技术指标解释错误?

  • 是看空研究员没有充分参与?

  • 是风控没有拦住?

  • 是投资组合经理审批逻辑太激进?

这对测试和工程落地非常关键。

因为可追踪,才可能复盘; 能复盘,才可能优化。


第三,更接近真实业务流程

很多企业落地 AI,失败的原因不是模型不够强,而是系统设计太简单。

真实业务不是一个问题一个答案。

真实业务往往是:

  • 多部门协作

  • 多数据源输入

  • 多轮判断

  • 多级审批

  • 多角色制衡

TradingAgents 的设计恰好体现了这个方向。


05 技术实现:LangGraph、多模型、多 Provider

从项目 README 看,TradingAgents 使用 LangGraph 构建,以增强流程编排的灵活性和模块化能力;同时支持 OpenAI、Google、Anthropic、xAI、DeepSeek、Qwen、GLM、OpenRouter、Ollama、Azure OpenAI 等多种模型提供方。(GitHub[6])

这说明它不是只绑定某一个模型。

它更像一个可替换模型底座的 Agent 工作流框架。

简化来看:

图片

这类设计对开发者很友好。

因为你可以根据实际需求调整:

  • 使用哪个模型

  • 哪些 Agent 开启

  • 辩论轮次多少

  • 是否使用本地模型

  • 是否增加新的分析角色

  • 是否接入新的数据源

项目 README 中还给了 Python 调用方式,可以通过 TradingAgentsGraph 初始化对象,并调用 .propagate() 返回决策结果。(GitHub[7])

示例逻辑大致是:

from tradingagents.graph.trading_graph import TradingAgentsGraph
from tradingagents.default_config import DEFAULT_CONFIG

ta = TradingAgentsGraph(debug=True, config=DEFAULT_CONFIG.copy())

_, decision = ta.propagate("NVDA", "2026-01-15")

print(decision)

这段代码背后的意义是:

开发者不是在调用一个“炒股 API”,而是在触发一整套 Agent 投研流程。


06 为什么 TradingAgents 会爆火?

我认为主要有四个原因。


原因一:金融天然适合多 Agent

金融交易本来就是多角色协作。

真实机构里不会只有一个人拍脑袋决定买卖。

通常会有:

  • 行业研究

  • 宏观分析

  • 技术分析

  • 风险控制

  • 投资经理

  • 交易执行

  • 合规审核

所以 TradingAgents 的多智能体设计,并不是为了炫技,而是和金融业务结构天然匹配。

这也是它比很多“套壳 Agent 项目”更有讨论价值的地方。


原因二:它把“投研过程”显性化了

很多模型系统只给结果。

TradingAgents 更强调过程:

  • 谁分析了什么

  • 谁提出了看多观点

  • 谁提出了看空观点

  • 风控如何评价

  • 最终为什么批准或拒绝

这类过程显性化,对金融、医疗、法律、测试等高责任场景都很关键。

因为这些场景里,用户不是只要答案。

用户更关心:

这个答案是怎么来的? 有没有经过验证? 有没有考虑风险? 出错了能不能追责和复盘?


原因三:Agent 工程正在从玩具走向流程系统

过去很多 Agent Demo 是这样的:

给 AI 一个目标,让它自己完成任务。

听起来很酷,但落地很难。

因为真实系统需要:

  • 状态管理

  • 中间结果保存

  • 多步骤恢复

  • 多角色协作

  • 失败重试

  • 决策日志

  • 可观测性

  • 权限控制

TradingAgents v0.2.4 中已经引入了 structured-output agents、LangGraph checkpoint resume、persistent decision log、Docker 等能力。(GitHub[8])

这说明它正在从一个研究框架,逐步往工程化方向演进。


原因四:它让“AI + 金融”的想象空间更具体

过去谈 AI 金融,很多表达都很虚:

  • AI 帮你选股

  • AI 自动赚钱

  • AI 替代基金经理

  • AI 颠覆投资行业

这些说法听起来刺激,但不够工程化。

TradingAgents 更具体。

它告诉你:

AI 不是直接替代交易员, 而是可以先替代一部分投研流程节点; AI 不是一个万能大脑, 而是一组可以协作、辩论、复盘的任务角色。

这就比“AI 炒股”更值得研究。


07 对测试开发来说,这类系统真正难测在哪里?

TradingAgents 这类项目,对测试开发同学其实很有启发。

因为它不是传统 CRUD 系统,也不是普通自动化脚本。

它属于典型的 AI Agent 工作流系统

这种系统的测试难点,主要有六类。


1. 输出不稳定

同样的股票、同样的日期、同样的数据,模型可能因为:

  • temperature

  • 模型版本

  • 提示词变化

  • 上下文变化

  • 数据源变化

输出不同结论。

所以测试不能只写:

assert decision == "BUY"

而应该测试:

  • 输出格式是否稳定

  • 决策理由是否完整

  • 风险字段是否存在

  • 是否引用了必要数据

  • 是否经过风控节点

  • 是否生成可复盘日志


2. 多 Agent 链路很长

TradingAgents 的链路可能包含:

图片

链路越长,问题越难定位。

一个错误结论可能来自:

  • 上游数据缺失

  • 某个 Agent 没有执行

  • 中间报告格式异常

  • 风控节点被绕过

  • 最终汇总逻辑错误

所以测试要关注 链路可观测性

每个节点都应该有:

  • 输入

  • 输出

  • 状态

  • 耗时

  • 错误信息

  • 关键决策字段


3. 金融数据有时效性

金融系统最怕数据错位。

比如:

  • 用了未来数据

  • 回测日期和行情日期不一致

  • 新闻时间晚于交易时间

  • 财报发布时间被错误处理

  • 时区转换错误

TradingAgents v0.2.3 中提到过 backtesting date fidelity,也就是回测日期准确性相关增强。(GitHub[9])

这说明金融 Agent 系统里,时间一致性是非常关键的测试点。


4. 风控不是附加功能,而是核心路径

很多 AI Demo 最大的问题是:

只展示“生成建议”,不展示“拒绝建议”。

但在交易场景里,风控必须是核心路径。

测试时要重点验证:

  • 高波动时是否降低风险偏好

  • 信息不足时是否倾向保守

  • 风控 Agent 是否一定执行

  • 风控意见是否影响最终决策

  • Portfolio Manager 是否可能拒绝交易

一个只会喊“买入”的系统,不是智能交易系统。

它只是一个风险放大器。


5. 需要测试“反方观点是否充分”

TradingAgents 中 Bull / Bear 研究员的设计很关键。

这意味着测试不只要看最终结论,还要看:

  • 是否存在看多理由

  • 是否存在看空理由

  • 看空观点是否只是形式化

  • 双方是否基于数据争论

  • 最终结论是否吸收了反方风险

这类测试已经不是传统功能测试,而是 推理质量测试


6. 不能把回测收益当作唯一质量指标

很多人测试交易系统,只看回测收益。

但 AI Agent 交易系统还要看:

指标类型

示例

决策稳定性

同样输入下输出波动是否可控

风险控制

最大回撤、风险暴露、拒绝机制

可解释性

是否能说明决策依据

数据一致性

是否存在未来函数、时间错位

运行稳定性

Agent 节点失败是否可恢复

成本控制

多 Agent 调用 Token 成本是否可接受

合规安全

是否误导用户进行投资

这类系统的测试,不能只测“能不能跑”。

更要测:

它是不是以一种可控、可解释、可复盘的方式跑。


08 普通开发者该怎么学习 TradingAgents?

如果你是测试开发、后端开发、AI 工程师,我建议不要一上来就想着“拿它实盘交易”。

更合理的学习路径是:


第一阶段:先看架构,不看收益

重点看:

  • 它有哪些 Agent

  • 每个 Agent 的职责是什么

  • Agent 之间如何传递信息

  • 哪些节点负责决策

  • 哪些节点负责风控

  • 最终输出如何形成

你要先理解它的系统设计,而不是盯着收益曲线。


第二阶段:本地跑通 CLI 或 Python 调用

项目支持安装后通过 CLI 运行,也可以在代码中引入 tradingagents 包进行调用。README 中提供了 clone、安装、Docker 运行和 Python 调用方式。(GitHub[10])

建议先做最小化实验:

  • 固定一个股票代码

  • 固定一个分析日期

  • 固定一个模型

  • 固定一轮辩论

  • 观察完整输出

不要一开始就接复杂数据源,也不要一开始就追求自动交易。


第三阶段:重点观察中间报告

你真正要看的不是最终一句:

BUY / SELL / HOLD

而是每一层 Agent 的中间报告:

  • 基本面怎么判断?

  • 新闻怎么判断?

  • 技术面怎么判断?

  • 看多方说了什么?

  • 看空方说了什么?

  • 风控怎么评价?

  • Portfolio Manager 为什么批准或拒绝?

这才是 Agent 系统真正有价值的地方。


第四阶段:尝试加一个自己的 Agent

比如你可以新增一个:

  • 财报质量 Agent

  • 黑天鹅风险 Agent

  • 行业政策 Agent

  • 舆情异常 Agent

  • 估值对比 Agent

  • 测试评估 Agent

这一步可以帮助你理解:

Agent 不是越多越好,而是职责边界越清楚越好。


09 TradingAgents 对 AI 应用落地的真正启发

TradingAgents 爆火背后,其实反映了一个更大的趋势:

AI 应用正在从“聊天框”,走向“组织化工作流”。

过去我们用 AI,更多是:

图片

未来很多复杂场景会变成:

图片

金融交易只是一个典型案例。

类似思路也可以迁移到:

  • 软件测试

  • 代码审查

  • 安全评估

  • 需求分析

  • 故障诊断

  • 质量管理

  • 企业知识库问答

  • 自动化运维

比如测试场景中,也可以设计一套多 Agent 测试团队:

图片

这才是 TradingAgents 给我们的真正启发:

不是每个行业都要做 AI 炒股,而是每个复杂业务流程,都可以重新思考如何被 Agent 化。


10 也要冷静:它不是投资神器

最后必须强调一点。

TradingAgents 官方 README 中明确说明:该框架是为研究目的设计的,交易表现会受到模型、温度参数、交易周期、数据质量和非确定性因素影响,不构成金融、投资或交易建议。(GitHub[11])

这句话非常重要。

因为很多人看到金融 AI 项目,容易直接联想到:

  • 自动赚钱

  • 自动交易

  • 稳定盈利

  • 替代基金经理

  • 普通人也能量化致富

这些理解都太危险。

TradingAgents 更适合被当成:

  • 多 Agent 架构学习项目

  • 金融 AI 研究框架

  • 投研流程模拟系统

  • Agent 工作流工程案例

  • AI 系统测试研究样本

而不是一个可以直接拿去实盘梭哈的工具。

真正值得学习的是它背后的工程思想:

把复杂决策拆成角色, 把单点推理变成协作, 把最终答案变成可追踪过程, 把模型能力放进可控流程里。


结语:AI 不是替你下注,而是重构决策流程

TradingAgents 的爆火,说明市场对“金融 + Agent”的关注正在升温。

但它真正值得看的,不是“AI 会不会炒股”,而是:

AI 正在从一个回答问题的工具,变成一个能参与复杂业务流程的协作系统。

在这个系统里,模型不再只是输出答案。

它可以扮演分析师、研究员、风控、交易员、审批人。

每个角色都有边界,每次决策都有过程,每个结果都可以复盘。

这才是 Agent 时代真正有价值的地方。

对于测试开发和 AI 工程从业者来说,TradingAgents 是一个非常好的观察样本:

它让我们看到,一个复杂 AI 系统,不是靠一个更大的模型解决所有问题,而是靠:

  • 更清晰的角色设计

  • 更可控的流程编排

  • 更完整的风险评审

  • 更强的可观测性

  • 更严格的测试验证

未来很多企业级 AI 应用,都会走向类似的方向。

不是一个 AI 单打独斗, 而是一组 Agent 像团队一样协作。

这也许才是 TradingAgents 真正爆火的原因。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐