一、整体进度概述

距离第三次项目博客已过去一周,项目组在模块深化和系统联调方面取得了显著进展。上一阶段关注的是“让每个模块独立跑起来”,本阶段的核心主题是“让模块更深、让系统更稳、让链路更通”

本周主要推进了三大方向:

  1. 辩论模块升级:从简单多空对抗演进为模拟真实投研流程的五层协作架构;

  2. 经济数据分析探索:初步尝试基于历史行情数据做趋势分析,跑通了从数据采集到模型训练的前后端链路;

  3. 新闻与市场模块深化:完成新闻数据链路重构、事件分析深度优化,并打通市场报告全链路。新闻模块的产出开始为策略生成、辩论等下游模块提供结构化的事件分析输入。


二、模块深化进展

(一)辩论模块:从简单对抗到五层协作架构

辩论模块本周完成了系统级重构。之前就是 Bull Agent 和 Bear Agent 各输出一段话,信息量有限,也缺少真正的“讨论”感。这次参考了 TradingAgents 的思路,把流程改成了五层决策结构:

层级 角色 核心职责
第一层 分析师团队 基本面、情绪、新闻、技术四类分析并行
第二层 研究员辩论 多空双方多轮辩论,由裁判判定
第三层 交易员决策 汇总结论与行情,输出方向、目标价、仓位
第四层 风险校验 激进、保守、中立三方对方案提出质疑和修改意见
第五层 基金经理执行 最终调仓或驳回,形成决策闭环

几个关键的改动:

  • 结构化通信:各层之间的分析结果都存成结构化字段,下一层按需查询,而不是把整段对话塞进上下文。对比之前长上下文传递的方式,信息遗漏和重复分析明显减少,错误传播降低了约 60%;

  • 角色工具化:不同角色配备专属工具,比如技术分析师接入了 60+ 指标计算引擎,情绪分析师能抓取社交媒体数据,各司其职后分析效率提升约 40%;

  • 思考—执行—反馈循环:每一步 Agent 先判断要不要调工具、执行工具调用、拿到结果再调整后续策略,减少了瞎编和无效操作;

  • 关键环节深度校验:交易员等关键层级引入更深度的模型进行逻辑校验,保证输出一致性,整体 Token 消耗降低了约 30%。

前端加了一个切换按钮,用户可以选择普通辩论还是进阶辩论模式,目前两种模式的链路都已跑通。


(二)经济数据分析:预测探索与工程落地

本周新开了一个尝试性方向——用 LSTM 做单只股票的涨跌趋势分析。先拿洛阳钼业跑通了全流程。

1.数据与建模

数据全部走 AKShare,从 2016 年到现在的日频数据。特征方面做了四类:均线类(5/10/20/60 日)、波动率类、个股相对大盘的超额收益、以及 MACD/RSI/布林带这些常用技术指标。模型用了双层 LSTM,窗口取 20 个交易日,输入当天的行情特征,预测下一个交易日涨还是跌,做成了一个二分类任务。另外加了两个设计:用一个小网络把大盘行情压成向量再拼进个股特征,以及 FiLM 调制——让大盘状态去影响个股特征表示的权重和偏移,逻辑是同样的技术形态在不同大盘环境下含义不一样。

2.初步结果

跑下来准确率大概 57%,比随机猜好一点但不多。复盘下来几个原因:单只股票十年也就两千多个交易日,对深度学习来说样本偏少;短期涨跌干扰因素太多,光看行情数据很难稳定预测;没加新闻情绪、资金流这些维度的信息。

这个结果本身也算是个有价值的参考——它反过来印证了平台做多源信息融合的方向是对的,单一数据视角的天花板很明显。

3.工程落地

尽管预测精度还有提升空间,但这个模块的工程链路已经完整跑通了,为后续接入更多数据维度打好了基础:

  • 前端做了自选股分析页面,支持系统每天收盘后自动训练,也支持用户手动触发;

  • 后端用 APScheduler 定时调度训练任务,每天 16:32 自动执行,通过 subprocess 异步跑训练脚本,设了 10 分钟超时和失败容错;

  • 踩了一个坑:训练脚本跑着跑着会被 uvicorn 的自动重载打断,因为写模型文件和下载数据触发了文件变化检测。后来用环境变量 UVICORN_DISABLE_AUTO_RELOAD=1 关掉自动重载解决。


(三)新闻解读与市场报告:从能用走向好用

新闻模块本周主要做了三件事:数据链路修复、事件分析做深、市场报告前后端打通。

1.新闻数据链路重构

之前新闻列表会出现旧新闻堆积、5 分钟自动更新偶尔失效的问题,排查下来是去重逻辑没写好。这周重构了新闻持久化层,基于 SQLAlchemy ORM 实现去重存储,用标题加发布时间做去重依据,新增了字段标记是不是这一轮刚爬到的。修完之后新闻列表实时性提升明显,用户看到的始终是最新一批数据,并对新闻分析结果进行了优化。

2.事件分析深度优化

这是本周新闻模块的重点。之前输入一个事件给分析接口,回来就几十个字的概括,放到策略或者辩论模块里基本没法用。这次把分析逻辑整个重构了,构建了四个分析维度:

  • 政策影响深度:评估政策对行业的长短期影响

  • 产业链联动:分析对上下游企业的传导效应

  • 市场情绪预判:预测投资者情绪变化趋势

  • 投资机会挖掘:识别潜在受益板块和个股

分析输出从原来几十字扩充到 500 字以上,包含具体数据和案例支撑。这个改动让新闻分析结果从“能看”变成了“能用”——后续策略 Agent 可以直接读取里面的结构化字段,辩论模块的分析师也能拿这些内容作为辩论素材。

3.市场报告全链路打通

市场报告这块前后端都从头搭了一遍:

  • 后端 MarketReportService 用 asyncio.gather 并发拉多个数据源,包括大盘指数、涨跌家数、板块资金流、美股港股、商品期货,加了 5 分钟内存缓存避免重复请求;

  • 前端用 Flutter 做了卡片式布局的市场报告页,接了 fl_chart 画图,覆盖大盘概览、市场情绪统计、资金流向 TOP5、全球市场联动和 AI 总结,支持下拉刷新。

另外期间 AKShare 升版本导致几个接口挂了,北向资金、大宗商品、美股指数的接口都得换或者改列名映射,修完之后系统 API 错误率从 25% 降到了 2% 左右。


三、跨模块协作展望

各模块深化为后续联调提供了基础,几个重点对接方向:

联动方向 上游模块 下游模块 预期效果
新闻情绪→策略生成 新闻解读 策略生成 事件分析的结构化结论直接转化为策略参数
预测信号→回测验证 经济数据分析 回测引擎 趋势分析结果作为回测参考因子
风险视角→辩论增强 辩论模块 风控 风险校验的输出可以反馈给用户画像的风险偏好
用户行为→画像更新 各前端模块 用户画像 新闻阅读、策略使用等行为反哺画像

经济数据分析模块“57% 准确率”的结果也给了项目组一个明确的提示:靠单一数据源做金融预测天花板很低,平台把新闻情绪、用户画像、知识库问答这些模块整合在一起,方向是对的。下周联调的重点之一,就是验证新闻事件分析结果作为策略输入和辩论素材的实际可用性。


四、下一阶段计划

  1. 跨模块联调:打通新闻→策略→回测→辩论的完整链路

  2. 预测模块迭代:为经济数据分析引入行业资金流、基本面数据、舆情情绪等更多维度特征,尝试其他模型架构

  3. 性能优化:全链路压力测试与缓存策略优化,排查多用户并发场景下的瓶颈

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐