Agentic BI的技术架构：衡石如何构建AI代理的“感知-思考-行动”闭环？

C资讯

346人浏览 · 2026-03-23 19:00:00

C资讯 · 2026-03-23 19:00:00 发布

在传统BI的世界里，数据分析遵循着一个固定的剧本：用户提出问题，系统返回答案。这个剧本已经上演了数十年，但它有一个根本性的缺陷——用户必须知道要问什么。

现实中，大多数业务问题并不是以“问题”的形式出现的。它们隐藏在数据的细微波动里，潜伏在指标的异常变化中，只有当问题已经造成影响后，用户才会意识到“应该问点什么”。这时候，往往已经错过了最佳干预时机。

衡石科技的Agentic BI试图改写这个剧本。它的核心是一个具备感知、思考、行动能力的AI代理。这个代理不等待用户提问，而是持续监控数据、主动发现异常、深入分析原因、自动推送洞察，并在需要时触发行动。本文将深入解密这一AI代理的技术架构，揭示“感知-思考-行动”闭环的实现原理。

一、整体架构：三层一体的代理大脑

衡石Agentic BI的AI代理采用三层一体的架构设计：

┌─────────────────────────────────────────────────────────────┐ │ 行动层（Act） │ │ (洞察推送、行动建议、API调用、工作流触发) │ └─────────────────────────────────────────────────────────────┘ ↑ ┌─────────────────────────────────────────────────────────────┐ │ 思考层（Think） │ │ (意图理解、任务规划、归因分析、决策生成) │ └─────────────────────────────────────────────────────────────┘ ↑ ┌─────────────────────────────────────────────────────────────┐ │ 感知层（Sense） │ │ (数据监控、异常检测、上下文捕获、用户行为分析) │ └─────────────────────────────────────────────────────────────┘ ↑ ┌─────────┴─────────┐ │ 数据源与语义层 │ │ (指标仓库、数据连接) │ └───────────────────┘

这三层形成一个完整的闭环：感知层持续捕获信号，思考层进行深度处理，行动层输出价值。同时，行动的结果又会反馈回感知层，形成持续优化的学习循环。

二、感知层：AI代理的“感官系统”

感知层的任务是让AI代理能够“看见”和“听见”业务世界的变化。它由四个核心模块组成：

2.1 实时数据监控

AI代理需要持续监控企业核心指标的变化。衡石的实时监控引擎基于流处理架构构建：

数据接入：通过Kafka或类似消息队列，实时接入业务系统的数据流
窗口计算：使用Flink等流处理框架，维护滑动窗口内的指标聚合
基线维护：为每个指标建立历史基线，包含趋势性、周期性等特征

监控引擎的性能指标：

单节点可监控10万+指标序列
端到端延迟控制在5秒以内
支持秒级、分钟级、小时级多粒度监控

2.2 智能异常检测

监控只是收集数据，真正的挑战是识别什么值得关注。衡石的异常检测模块采用集成算法策略：

算法一：统计方法（3-sigma、IQR）

计算历史数据的均值和标准差
将超出均值±3倍标准差的数据点标记为异常
适用于分布相对稳定的指标

算法二：时间序列分解（STL）

将时间序列分解为趋势项、季节项和残差项
在残差项上检测异常，排除周期性和趋势性波动
适用于有明显周期性的指标（如日周期、周周期）

算法三：机器学习模型（孤立森林）

对于分布复杂、无明显规律的指标，采用无监督学习
通过随机切割特征空间，识别容易被“孤立”的点
适用于高维度和复杂分布场景

算法四：预测偏差检测（Prophet）

先用Prophet模型预测指标当前值
如果实际值超出预测区间，则触发异常
适用于有较强趋势性和季节性的指标

集成策略：多种算法并行运行，采用加权投票机制决定是否触发异常。算法权重根据历史准确率动态调整。

2.3 上下文捕获

异常本身只是一个信号，要理解异常的意义，需要结合上下文。衡石的上下文捕获模块持续收集：

业务上下文：当前时间、季节、业务周期（如大促期间）
用户上下文：谁在关注这个指标？他们的角色和权限？
关联上下文：哪些其他指标也在发生变化？
历史上下文：过去类似异常的处理结果？

这些上下文信息会与异常信号一起，传递给思考层进行深度处理。

2.4 用户行为分析

除了数据监控，AI代理还需要理解用户的行为模式：

用户经常查看哪些指标？
在什么时间查看？
收到洞察后是否采取行动？
对哪些类型的预警反馈“有用”？

这些行为数据用于构建用户画像，指导后续的推送策略和个性化服务。

三、思考层：AI代理的“大脑”

感知层收集了原始信号，思考层的任务是理解这些信号并决定如何应对。这是整个架构中最复杂的部分。

3.1 意图理解

当感知层触发一个异常事件，或用户主动发起提问时，思考层首先需要理解“发生了什么”。衡石的意图理解引擎基于大语言模型构建，但针对分析场景进行了专门优化：

实体识别：从问题或事件中提取关键实体

指标实体：“销售额”、“客单价”、“活跃用户”
维度实体：“华东区”、“手机产品线”、“新客户”
时间实体：“上个月”、“去年同期”、“最近7天”
条件实体：“超过10%”、“排名前5”、“低于平均值”

意图分类：判断用户或事件想要什么

查询类：“销售额是多少？”
对比类：“和上个月比怎么样？”
归因类：“为什么下降？”
预测类：“下个月会怎样？”
行动类：“需要做什么？”

歧义消解：处理业务术语的模糊性

“客户”可能指“成交客户”或“潜在客户”
“销售额”可能含税或不含税
系统结合用户画像和历史行为进行消歧，必要时主动反问确认

3.2 任务规划

理解意图后，代理需要规划如何实现目标。衡石的任务规划引擎采用分层规划策略：

宏观规划：将复杂任务分解为多个子任务

例如：“分析销售额下降原因”分解为：
- 计算总销售额变化
- 多维度下钻（区域、产品、渠道）
- 相关性分析（广告、库存、竞品）
- 因果推断
- 生成报告

微观规划：为每个子任务选择最优执行路径

哪些计算可以下推到数据库？
哪些需要调用算法模型？
哪些可以复用缓存结果？

动态调整：根据中间结果实时调整后续规划

如果维度下钻发现主要问题在华东区，后续分析聚焦华东
如果相关性分析发现高度相关的指标，深入探索该指标

3.3 归因分析

归因是思考层的核心能力。衡石的归因分析引擎综合运用多种技术：

多维度下钻

系统自动遍历所有相关维度，计算每个维度组合对整体异常的贡献度
输出贡献度排名，定位主要问题所在

相关性分析

计算异常指标与其他指标的相关性系数
识别高度相关的指标，提供潜在原因的线索

因果推断

采用格兰杰因果检验，判断指标间的时序因果关系
结合业务知识图谱，优先考虑已知的业务因果关系
输出最可能的因果路径，如“广告预算缩减 → 广告点击率下降 → 流量下降 → 销售额下降”

同期群分析

对于用户行为类指标，构建异常发生前后的同期群
对比不同群体的行为差异，定位问题是否集中在特定用户群体

3.4 决策生成

归因分析得出“为什么”，决策生成回答“怎么办”。衡石的决策引擎基于规则和模型的混合架构：

规则库：预定义业务规则

“当库存低于安全线时，建议补货”
“当客户活跃度连续下降时，创建跟进任务”
规则可由业务人员通过可视化界面配置

模型推荐：基于历史数据训练推荐模型

学习过去类似场景下哪些行动最有效
输出带有置信度的行动建议

风险评估：评估每个行动的风险等级

高风险行动（如大额折扣）需人工确认
低风险行动（如发送提醒）可自动执行

最终输出的决策包包含：

洞察结论（发生了什么、为什么）
行动建议（建议做什么）
置信度评分（有多确信）
可解释信息（为什么这样建议）

四、行动层：AI代理的“手脚”

思考完成后，代理需要将决策转化为行动。行动层负责执行和反馈。

4.1 洞察推送

洞察不是简单的文本，而是结构化、可交互的智能卡片：

{ "insight_id": "insight_12345", "title": "客户流失风险预警", "summary": "客户'XX科技'近30天登录次数下降80%，3个售后工单未解决", "severity": "high", "confidence": 0.92, "details": { "metrics": ["登录次数", "工单数"], "dimensions": ["时间", "客户"], "attribution": "主要原因是近期系统故障导致用户体验下降" }, "actions": [ { "label": "创建跟进任务", "type": "api_call", "endpoint": "/api/tasks", "payload": { "type": "customer_followup", "customer_id": "c12345", "priority": "high" } }, { "label": "查看详细分析", "type": "navigation", "url": "/analytics/customer-risk/c12345" } ] }

推送支持多通道：

产品内通知：在工作台、看板顶部展示
即时通讯：通过钉钉、飞书、企业微信推送
邮件：生成每日/每周洞察摘要
移动推送：通过App推送重要预警

4.2 行动执行

当用户点击行动按钮，或系统触发自动执行时，行动层负责：

API调用：调用SaaS产品的业务API

创建任务、发送通知、调整配置
支持动态参数注入（如自动填充客户ID）

工作流触发：启动预定义的业务流程

审批流程、采购流程、挽回流程
与BPM系统深度集成

指令下发：向其他系统发送指令

调整广告出价、触发弹性扩容、锁定风险账户

4.3 反馈收集

行动的终点不是执行，而是学习。衡石的反馈收集模块记录：

用户是否查看了洞察？（隐式反馈）
是否点击了行动按钮？（采纳率）
行动后的结果如何？（效果评估）
用户是否标记了“有用”/“无用”？（显式反馈）

这些反馈被持续用于优化：

异常检测阈值调整（减少误报）
归因算法权重优化（提高准确率）
推送时机和渠道优化（提升转化率）
个性化模型更新（更好地理解用户偏好）

五、闭环的生命周期：从感知到学习的完整循环

让我们通过一个具体案例，追踪AI代理完成一次“感知-思考-行动”闭环的全过程：

场景：某电商SaaS平台的AI代理监控着数千家店铺的销售数据。

第一阶段：感知

凌晨2点，感知层监测到店铺A的“支付转化率”在1小时内从5%骤降到2%
异常检测模块确认：偏离基线超过4倍标准差，置信度95%
上下文捕获：今天是工作日，没有大促活动，店铺A是重点客户
事件触发，传递给思考层

第二阶段：思考

意图理解：这是一个“异常归因”任务
任务规划：
- 计算总转化率变化
- 按渠道、设备、地域等多维度下钻
- 相关性分析（广告、流量、竞品）
- 生成归因报告
归因分析：
- 维度下钻发现：下降主要集中在“来自今日头条广告的流量”
- 相关性分析：广告点击率同步下降85%，高度相关
- 因果推断：广告系统接口超时，导致落地页加载失败
决策生成：
- 洞察结论：转化率下降由广告系统故障导致
- 行动建议：切换广告渠道、发送预警通知
- 置信度：92%

第三阶段：行动

系统生成洞察卡片，通过企业微信推送给店铺运营经理
卡片附带两个行动按钮：“查看详细分析”、“暂停头条广告”
运营经理点击“暂停头条广告”，系统自动调用广告平台API暂停投放
同时生成“故障复盘”任务，指派给技术团队

第四阶段：反馈

系统记录：洞察被查看、行动被采纳
1小时后，监测到转化率逐步恢复，记录“行动有效”
将这次事件的完整数据存入案例库，用于未来优化模型

六、技术挑战与解决方案

6.1 实时性与深度分析的平衡

挑战：实时监控需要低延迟（秒级），但深度归因需要复杂计算（可能需要秒到分钟级）。

解决方案：

分层计算：实时层做轻量级检测，只识别“可能异常”；深度层异步计算，结果缓存复用
流批一体：采用Lambda架构，流处理保障实时性，批处理保障深度分析
优先级调度：重要客户的请求优先处理，普通请求排队执行

6.2 误报控制

挑战：过于敏感的异常检测会产生大量误报，导致用户“狼来了”效应。

解决方案：

集成算法：需要多种算法一致判定才触发告警，降低误报率
动态阈值：根据用户反馈自动调整检测阈值
分级预警：设置提示级、警告级、严重级，只有严重级才推送

6.3 因果推断的准确性

挑战：相关性不等于因果性，错误归因可能误导决策。

解决方案：

多证据融合：结合维度贡献度、相关性、因果检验、业务规则等多重证据
置信度评分：标注归因结果的置信度，让用户知道哪些结论可靠
可解释设计：展示推理过程，用户可以验证和质疑

6.4 大规模并发

挑战：当监控的指标达到百万级，同时有大量用户在线时，系统可能过载。

解决方案：

水平扩展：无状态设计，支持横向扩展
缓存策略：多级缓存，热点数据内存缓存，次热点Redis缓存
服务降级：高负载时，优先保障核心客户的监控质量

七、未来演进：从单代理到多代理协同

衡石对Agentic BI的下一阶段想象是多代理协同：

专业分工：不再是一个通用代理，而是多个专业代理协同工作

销售代理：专注于客户、商机、业绩数据
客服代理：专注于工单、满意度、服务时效
供应链代理：专注于库存、采购、物流

跨域协作：代理之间可以相互对话

销售代理发现业绩下滑，主动询问营销代理：“最近渠道流量有异常吗？”
营销代理回复：“广告点击率下降20%，可能影响”
两者共同生成综合报告，推送给运营总监

自主决策：对于确定性高、风险可控的场景，代理可以自主执行

“检测到服务器资源使用率持续超过90%，已自动触发弹性扩容”
“识别到恶意刷单行为，已自动锁定账户并发送通知”

这种多代理协同架构，将让AI代理从“单个助手”进化为“整个团队”，为企业提供全方位的智能决策支持。

八、结语：从“工具”到“伙伴”的进化

Agentic BI的“感知-思考-行动”闭环，标志着数据分析从“工具”到“伙伴”的进化。它不再是等待指令的被动工具，而是能够主动观察、深入思考、果断行动的智能伙伴。

对于SaaS厂商而言，这意味着可以为自己的产品注入真正的“智能基因”。当产品中的AI代理能够7×24小时守护客户的业务，在问题发生的第一时间发现、分析、解决，产品就从“记录工具”进化为“决策伙伴”，从“功能平台”进化为“智能环境”。

衡石科技的Agentic BI架构，正在让这一愿景成为现实。通过构建完整的“感知-思考-行动”闭环，衡石让AI代理真正具备了“看见”业务、“理解”问题、“推动”行动的能力。而这，正是智能分析的下一个十年。

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

建堆方法及其效率讲解

摘要：本文分析了两种建堆方法的时间复杂度。向上调整算法建堆时间复杂度为O(NlogN)，通过从最后一层开始逐层向上调整实现，但效率较低。向下调整算法建堆时间复杂度为O(N)，从倒数第一个非叶子结点开始向下调整，最后一层结点无需处理。比较发现，向下调整法因"少结点少调用次数"特性更优，是实际应用中的首选方法。文中提供了两种算法的代码实现，并通过满二叉树模型详细推导了时间复杂度。