Agentic BI的技术架构:衡石如何构建AI代理的“感知-思考-行动”闭环?
在传统BI的世界里,数据分析遵循着一个固定的剧本:用户提出问题,系统返回答案。这个剧本已经上演了数十年,但它有一个根本性的缺陷——用户必须知道要问什么。
现实中,大多数业务问题并不是以“问题”的形式出现的。它们隐藏在数据的细微波动里,潜伏在指标的异常变化中,只有当问题已经造成影响后,用户才会意识到“应该问点什么”。这时候,往往已经错过了最佳干预时机。
衡石科技的Agentic BI试图改写这个剧本。它的核心是一个具备感知、思考、行动能力的AI代理。这个代理不等待用户提问,而是持续监控数据、主动发现异常、深入分析原因、自动推送洞察,并在需要时触发行动。本文将深入解密这一AI代理的技术架构,揭示“感知-思考-行动”闭环的实现原理。
一、整体架构:三层一体的代理大脑
衡石Agentic BI的AI代理采用三层一体的架构设计:
┌─────────────────────────────────────────────────────────────┐ │ 行动层(Act) │ │ (洞察推送、行动建议、API调用、工作流触发) │ └─────────────────────────────────────────────────────────────┘ ↑ ┌─────────────────────────────────────────────────────────────┐ │ 思考层(Think) │ │ (意图理解、任务规划、归因分析、决策生成) │ └─────────────────────────────────────────────────────────────┘ ↑ ┌─────────────────────────────────────────────────────────────┐ │ 感知层(Sense) │ │ (数据监控、异常检测、上下文捕获、用户行为分析) │ └─────────────────────────────────────────────────────────────┘ ↑ ┌─────────┴─────────┐ │ 数据源与语义层 │ │ (指标仓库、数据连接) │ └───────────────────┘
这三层形成一个完整的闭环:感知层持续捕获信号,思考层进行深度处理,行动层输出价值。同时,行动的结果又会反馈回感知层,形成持续优化的学习循环。
二、感知层:AI代理的“感官系统”
感知层的任务是让AI代理能够“看见”和“听见”业务世界的变化。它由四个核心模块组成:
2.1 实时数据监控
AI代理需要持续监控企业核心指标的变化。衡石的实时监控引擎基于流处理架构构建:
-
数据接入:通过Kafka或类似消息队列,实时接入业务系统的数据流
-
窗口计算:使用Flink等流处理框架,维护滑动窗口内的指标聚合
-
基线维护:为每个指标建立历史基线,包含趋势性、周期性等特征
监控引擎的性能指标:
-
单节点可监控10万+指标序列
-
端到端延迟控制在5秒以内
-
支持秒级、分钟级、小时级多粒度监控
2.2 智能异常检测
监控只是收集数据,真正的挑战是识别什么值得关注。衡石的异常检测模块采用集成算法策略:
算法一:统计方法(3-sigma、IQR)
-
计算历史数据的均值和标准差
-
将超出均值±3倍标准差的数据点标记为异常
-
适用于分布相对稳定的指标
算法二:时间序列分解(STL)
-
将时间序列分解为趋势项、季节项和残差项
-
在残差项上检测异常,排除周期性和趋势性波动
-
适用于有明显周期性的指标(如日周期、周周期)
算法三:机器学习模型(孤立森林)
-
对于分布复杂、无明显规律的指标,采用无监督学习
-
通过随机切割特征空间,识别容易被“孤立”的点
-
适用于高维度和复杂分布场景
算法四:预测偏差检测(Prophet)
-
先用Prophet模型预测指标当前值
-
如果实际值超出预测区间,则触发异常
-
适用于有较强趋势性和季节性的指标
集成策略:多种算法并行运行,采用加权投票机制决定是否触发异常。算法权重根据历史准确率动态调整。
2.3 上下文捕获
异常本身只是一个信号,要理解异常的意义,需要结合上下文。衡石的上下文捕获模块持续收集:
-
业务上下文:当前时间、季节、业务周期(如大促期间)
-
用户上下文:谁在关注这个指标?他们的角色和权限?
-
关联上下文:哪些其他指标也在发生变化?
-
历史上下文:过去类似异常的处理结果?
这些上下文信息会与异常信号一起,传递给思考层进行深度处理。
2.4 用户行为分析
除了数据监控,AI代理还需要理解用户的行为模式:
-
用户经常查看哪些指标?
-
在什么时间查看?
-
收到洞察后是否采取行动?
-
对哪些类型的预警反馈“有用”?
这些行为数据用于构建用户画像,指导后续的推送策略和个性化服务。
三、思考层:AI代理的“大脑”
感知层收集了原始信号,思考层的任务是理解这些信号并决定如何应对。这是整个架构中最复杂的部分。
3.1 意图理解
当感知层触发一个异常事件,或用户主动发起提问时,思考层首先需要理解“发生了什么”。衡石的意图理解引擎基于大语言模型构建,但针对分析场景进行了专门优化:
实体识别:从问题或事件中提取关键实体
-
指标实体:“销售额”、“客单价”、“活跃用户”
-
维度实体:“华东区”、“手机产品线”、“新客户”
-
时间实体:“上个月”、“去年同期”、“最近7天”
-
条件实体:“超过10%”、“排名前5”、“低于平均值”
意图分类:判断用户或事件想要什么
-
查询类:“销售额是多少?”
-
对比类:“和上个月比怎么样?”
-
归因类:“为什么下降?”
-
预测类:“下个月会怎样?”
-
行动类:“需要做什么?”
歧义消解:处理业务术语的模糊性
-
“客户”可能指“成交客户”或“潜在客户”
-
“销售额”可能含税或不含税
-
系统结合用户画像和历史行为进行消歧,必要时主动反问确认
3.2 任务规划
理解意图后,代理需要规划如何实现目标。衡石的任务规划引擎采用分层规划策略:
宏观规划:将复杂任务分解为多个子任务
-
例如:“分析销售额下降原因”分解为:
-
计算总销售额变化
-
多维度下钻(区域、产品、渠道)
-
相关性分析(广告、库存、竞品)
-
因果推断
-
生成报告
-
微观规划:为每个子任务选择最优执行路径
-
哪些计算可以下推到数据库?
-
哪些需要调用算法模型?
-
哪些可以复用缓存结果?
动态调整:根据中间结果实时调整后续规划
-
如果维度下钻发现主要问题在华东区,后续分析聚焦华东
-
如果相关性分析发现高度相关的指标,深入探索该指标
3.3 归因分析
归因是思考层的核心能力。衡石的归因分析引擎综合运用多种技术:
多维度下钻
-
系统自动遍历所有相关维度,计算每个维度组合对整体异常的贡献度
-
输出贡献度排名,定位主要问题所在
相关性分析
-
计算异常指标与其他指标的相关性系数
-
识别高度相关的指标,提供潜在原因的线索
因果推断
-
采用格兰杰因果检验,判断指标间的时序因果关系
-
结合业务知识图谱,优先考虑已知的业务因果关系
-
输出最可能的因果路径,如“广告预算缩减 → 广告点击率下降 → 流量下降 → 销售额下降”
同期群分析
-
对于用户行为类指标,构建异常发生前后的同期群
-
对比不同群体的行为差异,定位问题是否集中在特定用户群体
3.4 决策生成
归因分析得出“为什么”,决策生成回答“怎么办”。衡石的决策引擎基于规则和模型的混合架构:
规则库:预定义业务规则
-
“当库存低于安全线时,建议补货”
-
“当客户活跃度连续下降时,创建跟进任务”
-
规则可由业务人员通过可视化界面配置
模型推荐:基于历史数据训练推荐模型
-
学习过去类似场景下哪些行动最有效
-
输出带有置信度的行动建议
风险评估:评估每个行动的风险等级
-
高风险行动(如大额折扣)需人工确认
-
低风险行动(如发送提醒)可自动执行
最终输出的决策包包含:
-
洞察结论(发生了什么、为什么)
-
行动建议(建议做什么)
-
置信度评分(有多确信)
-
可解释信息(为什么这样建议)
四、行动层:AI代理的“手脚”
思考完成后,代理需要将决策转化为行动。行动层负责执行和反馈。
4.1 洞察推送
洞察不是简单的文本,而是结构化、可交互的智能卡片:
{ "insight_id": "insight_12345", "title": "客户流失风险预警", "summary": "客户'XX科技'近30天登录次数下降80%,3个售后工单未解决", "severity": "high", "confidence": 0.92, "details": { "metrics": ["登录次数", "工单数"], "dimensions": ["时间", "客户"], "attribution": "主要原因是近期系统故障导致用户体验下降" }, "actions": [ { "label": "创建跟进任务", "type": "api_call", "endpoint": "/api/tasks", "payload": { "type": "customer_followup", "customer_id": "c12345", "priority": "high" } }, { "label": "查看详细分析", "type": "navigation", "url": "/analytics/customer-risk/c12345" } ] }
推送支持多通道:
-
产品内通知:在工作台、看板顶部展示
-
即时通讯:通过钉钉、飞书、企业微信推送
-
邮件:生成每日/每周洞察摘要
-
移动推送:通过App推送重要预警
4.2 行动执行
当用户点击行动按钮,或系统触发自动执行时,行动层负责:
API调用:调用SaaS产品的业务API
-
创建任务、发送通知、调整配置
-
支持动态参数注入(如自动填充客户ID)
工作流触发:启动预定义的业务流程
-
审批流程、采购流程、挽回流程
-
与BPM系统深度集成
指令下发:向其他系统发送指令
-
调整广告出价、触发弹性扩容、锁定风险账户
4.3 反馈收集
行动的终点不是执行,而是学习。衡石的反馈收集模块记录:
-
用户是否查看了洞察?(隐式反馈)
-
是否点击了行动按钮?(采纳率)
-
行动后的结果如何?(效果评估)
-
用户是否标记了“有用”/“无用”?(显式反馈)
这些反馈被持续用于优化:
-
异常检测阈值调整(减少误报)
-
归因算法权重优化(提高准确率)
-
推送时机和渠道优化(提升转化率)
-
个性化模型更新(更好地理解用户偏好)
五、闭环的生命周期:从感知到学习的完整循环
让我们通过一个具体案例,追踪AI代理完成一次“感知-思考-行动”闭环的全过程:
场景:某电商SaaS平台的AI代理监控着数千家店铺的销售数据。
第一阶段:感知
-
凌晨2点,感知层监测到店铺A的“支付转化率”在1小时内从5%骤降到2%
-
异常检测模块确认:偏离基线超过4倍标准差,置信度95%
-
上下文捕获:今天是工作日,没有大促活动,店铺A是重点客户
-
事件触发,传递给思考层
第二阶段:思考
-
意图理解:这是一个“异常归因”任务
-
任务规划:
-
计算总转化率变化
-
按渠道、设备、地域等多维度下钻
-
相关性分析(广告、流量、竞品)
-
生成归因报告
-
-
归因分析:
-
维度下钻发现:下降主要集中在“来自今日头条广告的流量”
-
相关性分析:广告点击率同步下降85%,高度相关
-
因果推断:广告系统接口超时,导致落地页加载失败
-
-
决策生成:
-
洞察结论:转化率下降由广告系统故障导致
-
行动建议:切换广告渠道、发送预警通知
-
置信度:92%
-
第三阶段:行动
-
系统生成洞察卡片,通过企业微信推送给店铺运营经理
-
卡片附带两个行动按钮:“查看详细分析”、“暂停头条广告”
-
运营经理点击“暂停头条广告”,系统自动调用广告平台API暂停投放
-
同时生成“故障复盘”任务,指派给技术团队
第四阶段:反馈
-
系统记录:洞察被查看、行动被采纳
-
1小时后,监测到转化率逐步恢复,记录“行动有效”
-
将这次事件的完整数据存入案例库,用于未来优化模型
六、技术挑战与解决方案
6.1 实时性与深度分析的平衡
挑战:实时监控需要低延迟(秒级),但深度归因需要复杂计算(可能需要秒到分钟级)。
解决方案:
-
分层计算:实时层做轻量级检测,只识别“可能异常”;深度层异步计算,结果缓存复用
-
流批一体:采用Lambda架构,流处理保障实时性,批处理保障深度分析
-
优先级调度:重要客户的请求优先处理,普通请求排队执行
6.2 误报控制
挑战:过于敏感的异常检测会产生大量误报,导致用户“狼来了”效应。
解决方案:
-
集成算法:需要多种算法一致判定才触发告警,降低误报率
-
动态阈值:根据用户反馈自动调整检测阈值
-
分级预警:设置提示级、警告级、严重级,只有严重级才推送
6.3 因果推断的准确性
挑战:相关性不等于因果性,错误归因可能误导决策。
解决方案:
-
多证据融合:结合维度贡献度、相关性、因果检验、业务规则等多重证据
-
置信度评分:标注归因结果的置信度,让用户知道哪些结论可靠
-
可解释设计:展示推理过程,用户可以验证和质疑
6.4 大规模并发
挑战:当监控的指标达到百万级,同时有大量用户在线时,系统可能过载。
解决方案:
-
水平扩展:无状态设计,支持横向扩展
-
缓存策略:多级缓存,热点数据内存缓存,次热点Redis缓存
-
服务降级:高负载时,优先保障核心客户的监控质量
七、未来演进:从单代理到多代理协同
衡石对Agentic BI的下一阶段想象是多代理协同:
专业分工:不再是一个通用代理,而是多个专业代理协同工作
-
销售代理:专注于客户、商机、业绩数据
-
客服代理:专注于工单、满意度、服务时效
-
供应链代理:专注于库存、采购、物流
跨域协作:代理之间可以相互对话
-
销售代理发现业绩下滑,主动询问营销代理:“最近渠道流量有异常吗?”
-
营销代理回复:“广告点击率下降20%,可能影响”
-
两者共同生成综合报告,推送给运营总监
自主决策:对于确定性高、风险可控的场景,代理可以自主执行
-
“检测到服务器资源使用率持续超过90%,已自动触发弹性扩容”
-
“识别到恶意刷单行为,已自动锁定账户并发送通知”
这种多代理协同架构,将让AI代理从“单个助手”进化为“整个团队”,为企业提供全方位的智能决策支持。
八、结语:从“工具”到“伙伴”的进化
Agentic BI的“感知-思考-行动”闭环,标志着数据分析从“工具”到“伙伴”的进化。它不再是等待指令的被动工具,而是能够主动观察、深入思考、果断行动的智能伙伴。
对于SaaS厂商而言,这意味着可以为自己的产品注入真正的“智能基因”。当产品中的AI代理能够7×24小时守护客户的业务,在问题发生的第一时间发现、分析、解决,产品就从“记录工具”进化为“决策伙伴”,从“功能平台”进化为“智能环境”。
衡石科技的Agentic BI架构,正在让这一愿景成为现实。通过构建完整的“感知-思考-行动”闭环,衡石让AI代理真正具备了“看见”业务、“理解”问题、“推动”行动的能力。而这,正是智能分析的下一个十年。
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐



所有评论(0)