4.【项目博客】模块深化与系统集成攻坚

2501_90361469

300人浏览 · 2026-05-05 23:19:58

2501_90361469 · 2026-05-05 23:19:58 发布

一、整体进度概述

距离第三次项目博客已过去一周，项目组在模块深化和系统联调方面取得了显著进展。上一阶段关注的是“让每个模块独立跑起来”，本阶段的核心主题是“让模块更深、让系统更稳、让链路更通”。

本周主要推进了三大方向：

辩论模块升级：从简单多空对抗演进为模拟真实投研流程的五层协作架构；
经济数据分析探索：初步尝试基于历史行情数据做趋势分析，跑通了从数据采集到模型训练的前后端链路；
新闻与市场模块深化：完成新闻数据链路重构、事件分析深度优化，并打通市场报告全链路。新闻模块的产出开始为策略生成、辩论等下游模块提供结构化的事件分析输入。

二、模块深化进展

（一）辩论模块：从简单对抗到五层协作架构

辩论模块本周完成了系统级重构。之前就是 Bull Agent 和 Bear Agent 各输出一段话，信息量有限，也缺少真正的“讨论”感。这次参考了 TradingAgents 的思路，把流程改成了五层决策结构：

层级	角色	核心职责
第一层	分析师团队	基本面、情绪、新闻、技术四类分析并行
第二层	研究员辩论	多空双方多轮辩论，由裁判判定
第三层	交易员决策	汇总结论与行情，输出方向、目标价、仓位
第四层	风险校验	激进、保守、中立三方对方案提出质疑和修改意见
第五层	基金经理执行	最终调仓或驳回，形成决策闭环

几个关键的改动：

结构化通信：各层之间的分析结果都存成结构化字段，下一层按需查询，而不是把整段对话塞进上下文。对比之前长上下文传递的方式，信息遗漏和重复分析明显减少，错误传播降低了约 60%；
角色工具化：不同角色配备专属工具，比如技术分析师接入了 60+ 指标计算引擎，情绪分析师能抓取社交媒体数据，各司其职后分析效率提升约 40%；
思考—执行—反馈循环：每一步 Agent 先判断要不要调工具、执行工具调用、拿到结果再调整后续策略，减少了瞎编和无效操作；
关键环节深度校验：交易员等关键层级引入更深度的模型进行逻辑校验，保证输出一致性，整体 Token 消耗降低了约 30%。

前端加了一个切换按钮，用户可以选择普通辩论还是进阶辩论模式，目前两种模式的链路都已跑通。

（二）经济数据分析：预测探索与工程落地

本周新开了一个尝试性方向——用 LSTM 做单只股票的涨跌趋势分析。先拿洛阳钼业跑通了全流程。

1.数据与建模

数据全部走 AKShare，从 2016 年到现在的日频数据。特征方面做了四类：均线类（5/10/20/60 日）、波动率类、个股相对大盘的超额收益、以及 MACD/RSI/布林带这些常用技术指标。模型用了双层 LSTM，窗口取 20 个交易日，输入当天的行情特征，预测下一个交易日涨还是跌，做成了一个二分类任务。另外加了两个设计：用一个小网络把大盘行情压成向量再拼进个股特征，以及 FiLM 调制——让大盘状态去影响个股特征表示的权重和偏移，逻辑是同样的技术形态在不同大盘环境下含义不一样。

2.初步结果

跑下来准确率大概 57%，比随机猜好一点但不多。复盘下来几个原因：单只股票十年也就两千多个交易日，对深度学习来说样本偏少；短期涨跌干扰因素太多，光看行情数据很难稳定预测；没加新闻情绪、资金流这些维度的信息。

这个结果本身也算是个有价值的参考——它反过来印证了平台做多源信息融合的方向是对的，单一数据视角的天花板很明显。

3.工程落地

尽管预测精度还有提升空间，但这个模块的工程链路已经完整跑通了，为后续接入更多数据维度打好了基础：

前端做了自选股分析页面，支持系统每天收盘后自动训练，也支持用户手动触发；
后端用 APScheduler 定时调度训练任务，每天 16:32 自动执行，通过 subprocess 异步跑训练脚本，设了 10 分钟超时和失败容错；
踩了一个坑：训练脚本跑着跑着会被 uvicorn 的自动重载打断，因为写模型文件和下载数据触发了文件变化检测。后来用环境变量 UVICORN_DISABLE_AUTO_RELOAD=1 关掉自动重载解决。

（三）新闻解读与市场报告：从能用走向好用

新闻模块本周主要做了三件事：数据链路修复、事件分析做深、市场报告前后端打通。

1.新闻数据链路重构

之前新闻列表会出现旧新闻堆积、5 分钟自动更新偶尔失效的问题，排查下来是去重逻辑没写好。这周重构了新闻持久化层，基于 SQLAlchemy ORM 实现去重存储，用标题加发布时间做去重依据，新增了字段标记是不是这一轮刚爬到的。修完之后新闻列表实时性提升明显，用户看到的始终是最新一批数据,并对新闻分析结果进行了优化。

2.事件分析深度优化

这是本周新闻模块的重点。之前输入一个事件给分析接口，回来就几十个字的概括，放到策略或者辩论模块里基本没法用。这次把分析逻辑整个重构了，构建了四个分析维度：

政策影响深度：评估政策对行业的长短期影响
产业链联动：分析对上下游企业的传导效应
市场情绪预判：预测投资者情绪变化趋势
投资机会挖掘：识别潜在受益板块和个股

分析输出从原来几十字扩充到 500 字以上，包含具体数据和案例支撑。这个改动让新闻分析结果从“能看”变成了“能用”——后续策略 Agent 可以直接读取里面的结构化字段，辩论模块的分析师也能拿这些内容作为辩论素材。

3.市场报告全链路打通

市场报告这块前后端都从头搭了一遍：

后端 MarketReportService 用 asyncio.gather 并发拉多个数据源，包括大盘指数、涨跌家数、板块资金流、美股港股、商品期货，加了 5 分钟内存缓存避免重复请求；
前端用 Flutter 做了卡片式布局的市场报告页，接了 fl_chart 画图，覆盖大盘概览、市场情绪统计、资金流向 TOP5、全球市场联动和 AI 总结，支持下拉刷新。

另外期间 AKShare 升版本导致几个接口挂了，北向资金、大宗商品、美股指数的接口都得换或者改列名映射，修完之后系统 API 错误率从 25% 降到了 2% 左右。

三、跨模块协作展望

各模块深化为后续联调提供了基础，几个重点对接方向：

联动方向	上游模块	下游模块	预期效果
新闻情绪→策略生成	新闻解读	策略生成	事件分析的结构化结论直接转化为策略参数
预测信号→回测验证	经济数据分析	回测引擎	趋势分析结果作为回测参考因子
风险视角→辩论增强	辩论模块	风控	风险校验的输出可以反馈给用户画像的风险偏好
用户行为→画像更新	各前端模块	用户画像	新闻阅读、策略使用等行为反哺画像