最近要毕业了,一直在忙着找工作,所以没时间推进论文阅读,当然还有就是前段时间论文中稿了,估摸着是最后一篇论文不用再找创新点了,也就没再看了。CVPR2026,点云方向的,具体是啥就不打广告了,哈哈哈。之前那些文章是测试MCP工具自动发的。然后这篇文章主要是推荐一个Agent项目,JAVA的,用的SpringAi,确实是我目前见到的市面上最完整的Agent项目,虽然有些地方还略显粗糙。但学完找到一份Agent开发的工作绰绰有余了,然后在Issue的提问作者也会看,没错,第一条issue就是我提的。而且看起来还在继续更新。所以给大家推荐一下。网址如下
https://github.com/pengmoubuaixuexi/TAgent
贴上Readme,如果大家关于点云方面有什么想讨论的或者需要推荐申博的也可以私信我。

TAgent

TAgent 是一个基于 Java 17、Spring Boot、Spring AI 和 DDD 分层构建的 AI Agent 工程实践项目。

它不是只封装一次模型调用,而是覆盖了一次 Agent 请求从接入、路由、运行时装配、规划执行、RAG、记忆、MCP 工具治理、人工审批、执行中干预,到 SSE 流式输出和全链路观测的完整过程。

本仓库是脱敏后的公开版本,不包含真实密钥、运行日志、历史对话、临时报告、数据库备份和个人文件。

系统总览

在这里插入图片描述

主链路:

用户请求
  -> Filter / SSE Controller
  -> UnifiedAgentRouter
  -> Fixed / Auto / Flow
  -> Advisor + LLM
  -> MCP 工具执行
  -> SSE 流式响应

主链之外还有两条关键控制链:

  • 动态工具补充:路由判断缺失能力,PgVector 从工具目录中匹配真实 MCP 工具,再与 Agent 常驻工具合并。
  • 执行中干预:用户可以发送 steer 重做当前步骤,或发送 answer_now 跳过剩余步骤并进入 finalize。

项目亮点

能力 实现
三种 Agent 模式 Fixed 单步直答、Auto 分析执行闭环、Flow DAG 编排
数据库驱动装配 Agent、Client、Model、Prompt、Advisor、RAG、MCP 关系由数据库配置
统一 Agent 路由 一次模型调用选择 Agent,并输出可能缺失的工具能力
动态 MCP 工具 工具目录中文化、意图扩写、PgVector 语义匹配、按请求临时补挂
MCP 自愈 懒探活、失败重试、超时重连、dead-client 重建、冷却与熔断
工具治理 非执行步禁工具、未知工具纠正、参数提示、轮次预算、跨 MCP 并行
Agentic RAG SIMPLE、HyDE、FUSION、DECOMPOSE 四种查询策略
四层记忆 Working、Chat、Long-Term、Episodic Memory
流式干预 Auto、Flow、Fixed 均支持立即回答与引导
人机协同 高风险工具调用通过 SSE 请求人工批准或拒绝
可解释输出 工具进度、RAG evidence、Memory evidence、步骤状态
全链路观测 Prometheus、ELK、Jaeger、event_log、LLM 成本与 MCP 健康页

端到端请求流程

1. 接入与 SSE 建连

请求进入 POST /api/v1/agent/auto_agent 后依次经过:

  1. MdcTraceFilter:写入 request、trace、user、tenant、session 等上下文。
  2. RateLimitFilter:按用户、会话或 IP 进行限流。
  3. IdempotencyFilter:同步请求支持幂等,SSE 长连接端点直接放行。
  4. AiAgentController:创建 ResponseBodyEmitter、注册审批通道并立即发送 ack
  5. Controller 组装 ExecuteCommandEntity,交给 Dispatch 异步执行。

ack 会携带干预能力是否开启,前端据此决定是否显示“引导”和“立即回答”按钮。

2. 统一路由与懒装配

AgentDispatchDispatchService 负责:

  • 用户未指定 Agent 时,调用 UnifiedAgentRouter 选择最合适的 agent_id
  • 用户已经指定 Agent 时,跳过 Agent 选择,但仍可推断缺失工具能力。
  • 路由结果同时返回 missing_tool_descs,用于后续动态补工具。
  • 首次使用 Agent 时通过 Armory 懒加载 ChatClient、Model、Advisor 和 MCP callback。
  • 从数据库读取 Agent 的 strategy,分派到 Fixed、Auto 或 Flow。

运行时装配关系主要来自:

  • ai_agent
  • ai_client
  • ai_client_model
  • ai_client_api
  • ai_client_system_prompt
  • ai_client_advisor
  • ai_client_tool_mcp
  • ai_client_rag_order

数据库配置在 Armory 装配后会进入 Bean 缓存,修改核心模型、Prompt 或工具关系后建议重新装配或重启应用。

三种执行模式

Fixed

适合直接问答或单轮工具任务:

准备上下文 -> 注入 Advisor -> 合并工具 -> LLM 流式生成 -> 保存记忆 -> 输出

Fixed 也支持:

  • MCP 工具调用
  • RAG 与长期记忆
  • steer 中断后重新生成
  • answer_now 基于已有半截输出立即收尾

Auto

适合目标明确但需要自主分析、执行和检查的任务:

步骤 职责 是否开放工具
Step1 分析任务、判断完成度
Step2 执行具体任务
Step3 质量检查与 Reflexion
Step4 汇总最终结果

Auto 会循环执行,直到任务完成或达到 maxStep。当 Step3 判断失败时,可携带结构化 critique 返回 Step2 修正。

Flow

适合可拆解、存在依赖关系的复杂任务:

步骤 职责 是否开放工具
Step1 分析需要的工具能力
Step2 生成带 DEPENDS_ON 的步骤计划
Step3 将计划解析为 DAG -
Step4 按依赖关系并行执行并最终整合

Flow 的并行边界不是无限并发:

  • DAG 中依赖已经满足的步骤可以并行。
  • 不同 MCP Server 的工具可以并行。
  • 同一个 MCP Server 复用同一连接时保持串行,避免传输层并发损坏。

动态 MCP 工具补充

固定给每个 Agent 挂大量工具,会增加上下文、工具幻觉和选错工具的概率。TAgent 将工具拆成“常驻工具”和“按请求动态补充工具”。

流程如下:

UnifiedAgentRouter
  -> missing_tool_descs
  -> 每条能力描述生成 embedding
  -> PgVector 查询 mcp_tool_vector
  -> 每类能力取 Top-K
  -> 相对距离阈值过滤
  -> 多类结果并集去重
  -> 懒创建或复用 MCP callback
  -> 常驻工具 + 动态工具
  -> 注入本次请求

工具资产由两部分组成:

  • MySQL ai_mcp_tool_catalog:真实工具名、MCP、原始描述、中文描述和中文意图。
  • PgVector mcp_tool_vector:用于语义检索的工具向量。

当前工具匹配采用 embedding-only,不回退 BM25 或 LLM rerank。向量服务不可用时宁可跳过动态补挂,也不盲目匹配无关工具。

相关迁移:

  • V041__create_mcp_tool_catalog.sql
  • V042__add_mcp_tool_description_zh.sql
  • V046__add_mcp_tool_intent_zh.sql
  • V047__create_mcp_tool_vector_pg.sql

MCP 工具治理与自动重连

MCP 调用不是直接执行裸 callback,而是经过 MeteredToolCallbackRobustToolCallingManagerMcpClientRegistry 三层治理。

McpClientRegistry

Registry 维护 MCP Client、工具与 MCP 的映射、重建工厂、最近成功时间、连续失败次数和熔断状态。

自愈路径包括:

  1. 工具调用前按需进行懒探活。
  2. 首次调用失败后执行有限重试。
  3. 超时后再次探活,判断连接仍存活还是已经死亡。
  4. dead-client 或发送失败时重建 MCP Client。
  5. 重建成功后刷新旧 MeteredToolCallback 内部 delegate。
  6. 同一 MCP 设置 10 秒重连冷却,避免连续抖动和重连风暴。
  7. 连续失败进入熔断状态时跳过无意义重连。

重连后对模型暴露的 ToolDefinition 保持稳定,因此工具参数提示不会因 callback 切换而丢失。

MeteredToolCallback

每次真实工具调用会处理:

  • 工具输入规范化与参数约束提示
  • 首次失败、重试、恢复和最终失败统计
  • 超时探活与重连
  • 高风险工具审批
  • 工具结果清洗与长度截断
  • tool_call_starttool_call_endtool_call_error SSE 事件
  • 同 MCP Server 的进程级发送锁

RobustToolCallingManager

工具循环层负责:

  • 非执行步骤不向模型暴露真实 tools schema
  • 工具名大小写纠正
  • 未知工具返回可用工具列表,让模型自我修正
  • 单 Client 串行工具轮次上限
  • 同轮不同 MCP Server 工具并行 fan-out
  • 工具响应按原顺序合并

MCP 观测

访问:

http://localhost:8099/observe-mcp.html

可以查看:

  • Client 状态:alivedeadreconnect_cooldowncircuit_open
  • 最近业务成功、探活成功和重连时间
  • 首败、恢复、重试、重连失败和冷却命中
  • 工具调用次数、延迟、错误率与最近错误样本

Advisor 链

Advisor 由数据库配置,并按 order 参与请求:

Advisor 作用
Semantic Cache 相似问题命中后直接短路后续链路
Long-Term Memory 注入长期画像和语义记忆,结束后异步抽取新记忆
Episodic Memory 注入当前会话或跨会话摘要
Prompt Injection 检测潜在提示词注入
PII Mask 对输入或输出中的敏感信息进行处理
Agentic RAG 判断是否检索以及选择查询策略
Rag Answer 执行混合检索、rerank、父子文档替换和引用组装
Chat Memory 只读历史上下文,完整回答由应用层写入
CoVe 对回答声明进行检索核验与观测

自定义 Advisor 重建 Prompt 时会保留 request options,避免动态工具、maxTokens 和 toolContext 在链路中丢失。

Agentic RAG

RAG Router 会先判断是否需要检索,再从四种策略中选择:

策略 说明
SIMPLE 重写原始查询后直接检索
HYDE 先生成假想文档,再用其语义进行检索
FUSION 生成多个查询变体,并通过 RRF 融合结果
DECOMPOSE 将多跳问题拆成多个子查询并行检索

检索链路:

Query Planning
  -> PgVector 语义召回
  -> Elasticsearch BM25
  -> RRF 融合
  -> Cross Encoder / LLM Rerank
  -> Child 命中替换为 Parent Document
  -> 注入编号引用
  -> rag_evidence SSE

动态工具匹配与 RAG 文档检索是两条不同链路:

  • 动态工具:PgVector embedding-only。
  • RAG 文档:PgVector + BM25 + RRF + rerank。

四层记忆

记忆层 存储 用途
Working Memory Redis 保存 Auto/Flow 步骤中间产物,支持步骤间读取和断线后的完成态回放
Chat Memory MySQL + Redis Cache 保存多轮聊天历史和滚动摘要
Long-Term Memory MySQL Meta + PgVector 保存用户画像、技能、偏好、计划和情况,支持语义召回
Episodic Memory MySQL 保存会话阶段性摘要和近期经历

长期记忆包含:

  • 固定画像槽位
  • 情景记忆语义召回
  • exact match 与语义去重
  • 单值覆盖、累加记忆合并
  • 冲突判断
  • 访问热度继承与冷记忆归档
  • 同一轮多步骤共享召回快照

当 RAG 或记忆真正召回内容时,前端会收到 rag_evidencememory_evidence 事件。

执行中干预

Auto、Flow、Fixed 三种模式均完成了 steeranswer_now 支持。

引导 steer

POST /api/v1/agent/steer
Content-Type: application/json

{
  "sessionId": "session_demo_001",
  "idea": "请重点从工程落地和风险控制角度分析"
}

行为:

  • 中断当前正在生成的流,而不是等待步骤自然结束。
  • 保留当前 reasoning、半截输出和已有步骤结果。
  • 将新想法合并到有效用户问题。
  • 重做当前步骤,并将引导继续传递到后续步骤。
  • agent.steer.max-rounds 限制单步骤最大重做轮数。

Flow 进入 Step4 DAG 工具执行后会忽略新的 steer,避免已经启动的并行任务被无意义切断。

立即回答 answer_now

POST /api/v1/agent/answer_now
Content-Type: application/json

{
  "sessionId": "session_demo_001"
}

行为:

  • 中断当前流式调用。
  • 跳过剩余分析或规划步骤。
  • 基于已有中间结果和半截输出进入各模式 finalize。
  • 可继续保留必要工具完成最后事实查询。
  • 对支持关闭推理的模型可注入 no-thinking 参数。
  • 正常保存 Chat、Long-Term 和 Episodic Memory。

对应收尾步骤:

  • Auto:step4_answer_now
  • Flow:flow_step4_answer_now
  • Fixed:fixed_answer_now

人工审批

高风险工具可配置为执行前审批:

  1. 后端发送 human_approval_required SSE 事件。
  2. 前端显示工具名、参数和审批原因。
  3. 用户调用审批接口。
  4. 批准后执行,拒绝或超时则向模型返回结构化错误。
POST /api/v1/agent/approval
Content-Type: application/json

{
  "approvalId": "approval-id-from-sse",
  "approved": true
}

SSE 事件

事件 用途
ack 确认连接建立并返回干预开关
step_start / step_end 展示 Agent 当前步骤
token 逐 token 渲染回答
tool_call_start / tool_call_end / tool_call_error 展示工具进度
human_approval_required 请求人工审批
rag_evidence 展示知识库引用依据
memory_evidence 展示记忆召回依据
data 返回步骤结果或最终结果

可观测性

TAgent 同时记录模型、工具和 Agent 步骤:

  • LlmObservationRecorder:模型、耗时、Token、缓存 Token、billing scope。
  • ai_event_log:步骤输入输出、路由、工具、干预和最终结果。
  • Prometheus:LLM 与 MCP 指标。
  • ELK:结构化日志与 MDC 上下文。
  • Jaeger:跨 Controller、Step、LLM 和工具调用 Trace。
  • WireTraceRecorder:在不消费下游响应体的前提下记录流式 wire 信息。

页面:

  • 系统观测:http://localhost:8099/observe.html
  • MCP 观测:http://localhost:8099/observe-mcp.html

技术栈

  • Java 17
  • Spring Boot 3.4.3
  • Spring AI 1.1.7
  • MCP SDK 0.18.2
  • MyBatis、MySQL
  • PostgreSQL + pgvector
  • Redis
  • Elasticsearch
  • Resilience4j
  • Reactor、SSE
  • Micrometer、Prometheus、Grafana、Jaeger、ELK

项目模块

模块 说明
ai-agent-station-study-api 接口、DTO 和统一响应
ai-agent-station-study-app Spring Boot 启动、配置、静态页面和 Mapper XML
ai-agent-station-study-domain Agent 路由、执行策略、RAG、记忆、MCP 与安全治理
ai-agent-station-study-infrastructure DAO、Repository、缓存和外部存储适配
ai-agent-station-study-trigger HTTP Controller、管理接口和任务触发
ai-agent-station-study-types 通用类型、异常和任务调度组件
docs/dev-ops Docker、SQL 迁移、Grafana、Prometheus 和 MCP 配置
mcp-server-hmdp / mcp-servers MCP Server 示例

本地运行

外部依赖

默认地址:

服务 地址
MySQL 127.0.0.1:13306
PostgreSQL + pgvector 127.0.0.1:15432
Redis 127.0.0.1:16379
Elasticsearch 127.0.0.1:9200
Logstash 127.0.0.1:4560
Jaeger OTLP 127.0.0.1:4318

环境变量

LLM_BASE_URL=https://your-openai-compatible-endpoint
LLM_API_KEY=your-llm-key
LLM_MODEL=your-model

EMBEDDING_BASE_URL=https://your-embedding-endpoint
EMBEDDING_API_KEY=your-embedding-key
EMBEDDING_MODEL=BAAI/bge-m3

MYSQL_USERNAME=root
MYSQL_PASSWORD=your-mysql-password
PGVECTOR_USERNAME=postgres
PGVECTOR_PASSWORD=your-postgres-password

按需设置 MCP 和观测凭据:

GITHUB_PERSONAL_ACCESS_TOKEN=your-github-token
GRAFANA_API_KEY=your-grafana-key
CSDN_API_COOKIE=your-csdn-cookie
WEIXIN_API_APP_SECRET=your-weixin-secret

数据库迁移

增量脚本位于:

docs/dev-ops/sql-migrations

新环境应按版本顺序执行。动态工具功能至少需要 V041V046V047

构建

mvn "-Dmaven.test.skip=true" package

项目包含依赖外部服务和账号环境的集成测试。普通本地构建可跳过测试,验收时再运行指定测试类。

启动

java -jar ai-agent-station-study-app/target/ai-agent-station-study-app.jar

默认端口:8099

  • 对话页:http://localhost:8099/index.html
  • Agent 配置:http://localhost:8099/agent-config.html
  • 健康检查:http://localhost:8099/actuator/health

流式请求示例

POST /api/v1/agent/auto_agent
Content-Type: application/json
Accept: text/event-stream
{
  "aiAgentId": "3",
  "message": "总结当前系统的 Agent、RAG、记忆和 MCP 能力",
  "sessionId": "session_demo_001",
  "userId": "user_demo",
  "maxStep": 5
}

关键配置

agent:
  intervention:
    enabled: true
  steer:
    enabled: true
    max-rounds: 3
  answer-now:
    finalize-tools: true

  mcp:
    disable-tools-on-nonexec-steps: true
    tool-call:
      max-attempts: 2
      retry-delay-ms: 1000
      parallel-enabled: true
      max-serial-rounds-per-client: 3

  dynamic-tools:
    infer-on-selected-agent: true
    per-need-top-k: 2
    max-extra-tools-per-request: 6
    match-cache-ttl-ms: 600000

安全说明

公开仓库中不应提交:

  • API Key、Access Token、Cookie、私钥
  • .local-config、浏览器状态和本地凭据
  • 运行日志、压测报告和临时调试文件
  • 个人对话、简历和面试资料
  • 数据库备份和生产数据

更新记录见 CHANGELOG.md

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐