在传统BI的世界里,数据分析遵循着一个固定的剧本:用户提出问题,系统返回答案。这个剧本已经上演了数十年,但它有一个根本性的缺陷——用户必须知道要问什么。

现实中,大多数业务问题并不是以“问题”的形式出现的。它们隐藏在数据的细微波动里,潜伏在指标的异常变化中,只有当问题已经造成影响后,用户才会意识到“应该问点什么”。这时候,往往已经错过了最佳干预时机。

衡石科技的Agentic BI试图改写这个剧本。它的核心是一个具备感知、思考、行动能力的AI代理。这个代理不等待用户提问,而是持续监控数据、主动发现异常、深入分析原因、自动推送洞察,并在需要时触发行动。本文将深入解密这一AI代理的技术架构,揭示“感知-思考-行动”闭环的实现原理。

一、整体架构:三层一体的代理大脑

衡石Agentic BI的AI代理采用三层一体的架构设计:


┌─────────────────────────────────────────────────────────────┐ │ 行动层(Act) │ │ (洞察推送、行动建议、API调用、工作流触发) │ └─────────────────────────────────────────────────────────────┘ ↑ ┌─────────────────────────────────────────────────────────────┐ │ 思考层(Think) │ │ (意图理解、任务规划、归因分析、决策生成) │ └─────────────────────────────────────────────────────────────┘ ↑ ┌─────────────────────────────────────────────────────────────┐ │ 感知层(Sense) │ │ (数据监控、异常检测、上下文捕获、用户行为分析) │ └─────────────────────────────────────────────────────────────┘ ↑ ┌─────────┴─────────┐ │ 数据源与语义层 │ │ (指标仓库、数据连接) │ └───────────────────┘

这三层形成一个完整的闭环:感知层持续捕获信号,思考层进行深度处理,行动层输出价值。同时,行动的结果又会反馈回感知层,形成持续优化的学习循环。

二、感知层:AI代理的“感官系统”

感知层的任务是让AI代理能够“看见”和“听见”业务世界的变化。它由四个核心模块组成:

2.1 实时数据监控

AI代理需要持续监控企业核心指标的变化。衡石的实时监控引擎基于流处理架构构建:

  • 数据接入:通过Kafka或类似消息队列,实时接入业务系统的数据流

  • 窗口计算:使用Flink等流处理框架,维护滑动窗口内的指标聚合

  • 基线维护:为每个指标建立历史基线,包含趋势性、周期性等特征

    监控引擎的性能指标:

    • 单节点可监控10万+指标序列

    • 端到端延迟控制在5秒以内

    • 支持秒级、分钟级、小时级多粒度监控

      2.2 智能异常检测

      监控只是收集数据,真正的挑战是识别什么值得关注。衡石的异常检测模块采用集成算法策略

      算法一:统计方法(3-sigma、IQR)

      • 计算历史数据的均值和标准差

      • 将超出均值±3倍标准差的数据点标记为异常

      • 适用于分布相对稳定的指标

        算法二:时间序列分解(STL)

        • 将时间序列分解为趋势项、季节项和残差项

        • 在残差项上检测异常,排除周期性和趋势性波动

        • 适用于有明显周期性的指标(如日周期、周周期)

          算法三:机器学习模型(孤立森林)

          • 对于分布复杂、无明显规律的指标,采用无监督学习

          • 通过随机切割特征空间,识别容易被“孤立”的点

          • 适用于高维度和复杂分布场景

            算法四:预测偏差检测(Prophet)

            • 先用Prophet模型预测指标当前值

            • 如果实际值超出预测区间,则触发异常

            • 适用于有较强趋势性和季节性的指标

              集成策略:多种算法并行运行,采用加权投票机制决定是否触发异常。算法权重根据历史准确率动态调整。

              2.3 上下文捕获

              异常本身只是一个信号,要理解异常的意义,需要结合上下文。衡石的上下文捕获模块持续收集:

              • 业务上下文:当前时间、季节、业务周期(如大促期间)

              • 用户上下文:谁在关注这个指标?他们的角色和权限?

              • 关联上下文:哪些其他指标也在发生变化?

              • 历史上下文:过去类似异常的处理结果?

                这些上下文信息会与异常信号一起,传递给思考层进行深度处理。

                2.4 用户行为分析

                除了数据监控,AI代理还需要理解用户的行为模式:

                • 用户经常查看哪些指标?

                • 在什么时间查看?

                • 收到洞察后是否采取行动?

                • 对哪些类型的预警反馈“有用”?

                  这些行为数据用于构建用户画像,指导后续的推送策略和个性化服务。

                  三、思考层:AI代理的“大脑”

                  感知层收集了原始信号,思考层的任务是理解这些信号并决定如何应对。这是整个架构中最复杂的部分。

                  3.1 意图理解

                  当感知层触发一个异常事件,或用户主动发起提问时,思考层首先需要理解“发生了什么”。衡石的意图理解引擎基于大语言模型构建,但针对分析场景进行了专门优化:

                  实体识别:从问题或事件中提取关键实体

                  • 指标实体:“销售额”、“客单价”、“活跃用户”

                  • 维度实体:“华东区”、“手机产品线”、“新客户”

                  • 时间实体:“上个月”、“去年同期”、“最近7天”

                  • 条件实体:“超过10%”、“排名前5”、“低于平均值”

                    意图分类:判断用户或事件想要什么

                    • 查询类:“销售额是多少?”

                    • 对比类:“和上个月比怎么样?”

                    • 归因类:“为什么下降?”

                    • 预测类:“下个月会怎样?”

                    • 行动类:“需要做什么?”

                      歧义消解:处理业务术语的模糊性

                      • “客户”可能指“成交客户”或“潜在客户”

                      • “销售额”可能含税或不含税

                      • 系统结合用户画像和历史行为进行消歧,必要时主动反问确认

                        3.2 任务规划

                        理解意图后,代理需要规划如何实现目标。衡石的任务规划引擎采用分层规划策略:

                        宏观规划:将复杂任务分解为多个子任务

                        • 例如:“分析销售额下降原因”分解为:

                          • 计算总销售额变化

                          • 多维度下钻(区域、产品、渠道)

                          • 相关性分析(广告、库存、竞品)

                          • 因果推断

                          • 生成报告

                          微观规划:为每个子任务选择最优执行路径

                          • 哪些计算可以下推到数据库?

                          • 哪些需要调用算法模型?

                          • 哪些可以复用缓存结果?

                            动态调整:根据中间结果实时调整后续规划

                            • 如果维度下钻发现主要问题在华东区,后续分析聚焦华东

                            • 如果相关性分析发现高度相关的指标,深入探索该指标

                              3.3 归因分析

                              归因是思考层的核心能力。衡石的归因分析引擎综合运用多种技术:

                              多维度下钻

                              • 系统自动遍历所有相关维度,计算每个维度组合对整体异常的贡献度

                              • 输出贡献度排名,定位主要问题所在

                                相关性分析

                                • 计算异常指标与其他指标的相关性系数

                                • 识别高度相关的指标,提供潜在原因的线索

                                  因果推断

                                  • 采用格兰杰因果检验,判断指标间的时序因果关系

                                  • 结合业务知识图谱,优先考虑已知的业务因果关系

                                  • 输出最可能的因果路径,如“广告预算缩减 → 广告点击率下降 → 流量下降 → 销售额下降”

                                    同期群分析

                                    • 对于用户行为类指标,构建异常发生前后的同期群

                                    • 对比不同群体的行为差异,定位问题是否集中在特定用户群体

                                      3.4 决策生成

                                      归因分析得出“为什么”,决策生成回答“怎么办”。衡石的决策引擎基于规则和模型的混合架构:

                                      规则库:预定义业务规则

                                      • “当库存低于安全线时,建议补货”

                                      • “当客户活跃度连续下降时,创建跟进任务”

                                      • 规则可由业务人员通过可视化界面配置

                                        模型推荐:基于历史数据训练推荐模型

                                        • 学习过去类似场景下哪些行动最有效

                                        • 输出带有置信度的行动建议

                                          风险评估:评估每个行动的风险等级

                                          • 高风险行动(如大额折扣)需人工确认

                                          • 低风险行动(如发送提醒)可自动执行

                                            最终输出的决策包包含:

                                            • 洞察结论(发生了什么、为什么)

                                            • 行动建议(建议做什么)

                                            • 置信度评分(有多确信)

                                            • 可解释信息(为什么这样建议)

                                              四、行动层:AI代理的“手脚”

                                              思考完成后,代理需要将决策转化为行动。行动层负责执行和反馈。

                                              4.1 洞察推送

                                              洞察不是简单的文本,而是结构化、可交互的智能卡片

                                              
                                              

                                              { "insight_id": "insight_12345", "title": "客户流失风险预警", "summary": "客户'XX科技'近30天登录次数下降80%,3个售后工单未解决", "severity": "high", "confidence": 0.92, "details": { "metrics": ["登录次数", "工单数"], "dimensions": ["时间", "客户"], "attribution": "主要原因是近期系统故障导致用户体验下降" }, "actions": [ { "label": "创建跟进任务", "type": "api_call", "endpoint": "/api/tasks", "payload": { "type": "customer_followup", "customer_id": "c12345", "priority": "high" } }, { "label": "查看详细分析", "type": "navigation", "url": "/analytics/customer-risk/c12345" } ] }

                                              推送支持多通道:

                                              • 产品内通知:在工作台、看板顶部展示

                                              • 即时通讯:通过钉钉、飞书、企业微信推送

                                              • 邮件:生成每日/每周洞察摘要

                                              • 移动推送:通过App推送重要预警

                                                4.2 行动执行

                                                当用户点击行动按钮,或系统触发自动执行时,行动层负责:

                                                API调用:调用SaaS产品的业务API

                                                • 创建任务、发送通知、调整配置

                                                • 支持动态参数注入(如自动填充客户ID)

                                                  工作流触发:启动预定义的业务流程

                                                  • 审批流程、采购流程、挽回流程

                                                  • 与BPM系统深度集成

                                                    指令下发:向其他系统发送指令

                                                    • 调整广告出价、触发弹性扩容、锁定风险账户

                                                      4.3 反馈收集

                                                      行动的终点不是执行,而是学习。衡石的反馈收集模块记录:

                                                      • 用户是否查看了洞察?(隐式反馈)

                                                      • 是否点击了行动按钮?(采纳率)

                                                      • 行动后的结果如何?(效果评估)

                                                      • 用户是否标记了“有用”/“无用”?(显式反馈)

                                                        这些反馈被持续用于优化:

                                                        • 异常检测阈值调整(减少误报)

                                                        • 归因算法权重优化(提高准确率)

                                                        • 推送时机和渠道优化(提升转化率)

                                                        • 个性化模型更新(更好地理解用户偏好)

                                                          五、闭环的生命周期:从感知到学习的完整循环

                                                          让我们通过一个具体案例,追踪AI代理完成一次“感知-思考-行动”闭环的全过程:

                                                          场景:某电商SaaS平台的AI代理监控着数千家店铺的销售数据。

                                                          第一阶段:感知

                                                          • 凌晨2点,感知层监测到店铺A的“支付转化率”在1小时内从5%骤降到2%

                                                          • 异常检测模块确认:偏离基线超过4倍标准差,置信度95%

                                                          • 上下文捕获:今天是工作日,没有大促活动,店铺A是重点客户

                                                          • 事件触发,传递给思考层

                                                            第二阶段:思考

                                                            • 意图理解:这是一个“异常归因”任务

                                                            • 任务规划:

                                                              • 计算总转化率变化

                                                              • 按渠道、设备、地域等多维度下钻

                                                              • 相关性分析(广告、流量、竞品)

                                                              • 生成归因报告

                                                            • 归因分析:

                                                              • 维度下钻发现:下降主要集中在“来自今日头条广告的流量”

                                                              • 相关性分析:广告点击率同步下降85%,高度相关

                                                              • 因果推断:广告系统接口超时,导致落地页加载失败

                                                            • 决策生成:

                                                              • 洞察结论:转化率下降由广告系统故障导致

                                                              • 行动建议:切换广告渠道、发送预警通知

                                                              • 置信度:92%

                                                              第三阶段:行动

                                                              • 系统生成洞察卡片,通过企业微信推送给店铺运营经理

                                                              • 卡片附带两个行动按钮:“查看详细分析”、“暂停头条广告”

                                                              • 运营经理点击“暂停头条广告”,系统自动调用广告平台API暂停投放

                                                              • 同时生成“故障复盘”任务,指派给技术团队

                                                                第四阶段:反馈

                                                                • 系统记录:洞察被查看、行动被采纳

                                                                • 1小时后,监测到转化率逐步恢复,记录“行动有效”

                                                                • 将这次事件的完整数据存入案例库,用于未来优化模型

                                                                  六、技术挑战与解决方案

                                                                  6.1 实时性与深度分析的平衡

                                                                  挑战:实时监控需要低延迟(秒级),但深度归因需要复杂计算(可能需要秒到分钟级)。

                                                                  解决方案

                                                                  • 分层计算:实时层做轻量级检测,只识别“可能异常”;深度层异步计算,结果缓存复用

                                                                  • 流批一体:采用Lambda架构,流处理保障实时性,批处理保障深度分析

                                                                  • 优先级调度:重要客户的请求优先处理,普通请求排队执行

                                                                    6.2 误报控制

                                                                    挑战:过于敏感的异常检测会产生大量误报,导致用户“狼来了”效应。

                                                                    解决方案

                                                                    • 集成算法:需要多种算法一致判定才触发告警,降低误报率

                                                                    • 动态阈值:根据用户反馈自动调整检测阈值

                                                                    • 分级预警:设置提示级、警告级、严重级,只有严重级才推送

                                                                      6.3 因果推断的准确性

                                                                      挑战:相关性不等于因果性,错误归因可能误导决策。

                                                                      解决方案

                                                                      • 多证据融合:结合维度贡献度、相关性、因果检验、业务规则等多重证据

                                                                      • 置信度评分:标注归因结果的置信度,让用户知道哪些结论可靠

                                                                      • 可解释设计:展示推理过程,用户可以验证和质疑

                                                                        6.4 大规模并发

                                                                        挑战:当监控的指标达到百万级,同时有大量用户在线时,系统可能过载。

                                                                        解决方案

                                                                        • 水平扩展:无状态设计,支持横向扩展

                                                                        • 缓存策略:多级缓存,热点数据内存缓存,次热点Redis缓存

                                                                        • 服务降级:高负载时,优先保障核心客户的监控质量

                                                                          七、未来演进:从单代理到多代理协同

                                                                          衡石对Agentic BI的下一阶段想象是多代理协同

                                                                          专业分工:不再是一个通用代理,而是多个专业代理协同工作

                                                                          • 销售代理:专注于客户、商机、业绩数据

                                                                          • 客服代理:专注于工单、满意度、服务时效

                                                                          • 供应链代理:专注于库存、采购、物流

                                                                            跨域协作:代理之间可以相互对话

                                                                            • 销售代理发现业绩下滑,主动询问营销代理:“最近渠道流量有异常吗?”

                                                                            • 营销代理回复:“广告点击率下降20%,可能影响”

                                                                            • 两者共同生成综合报告,推送给运营总监

                                                                              自主决策:对于确定性高、风险可控的场景,代理可以自主执行

                                                                              • “检测到服务器资源使用率持续超过90%,已自动触发弹性扩容”

                                                                              • “识别到恶意刷单行为,已自动锁定账户并发送通知”

                                                                                这种多代理协同架构,将让AI代理从“单个助手”进化为“整个团队”,为企业提供全方位的智能决策支持。

                                                                                八、结语:从“工具”到“伙伴”的进化

                                                                                Agentic BI的“感知-思考-行动”闭环,标志着数据分析从“工具”到“伙伴”的进化。它不再是等待指令的被动工具,而是能够主动观察、深入思考、果断行动的智能伙伴。

                                                                                对于SaaS厂商而言,这意味着可以为自己的产品注入真正的“智能基因”。当产品中的AI代理能够7×24小时守护客户的业务,在问题发生的第一时间发现、分析、解决,产品就从“记录工具”进化为“决策伙伴”,从“功能平台”进化为“智能环境”。

                                                                                衡石科技的Agentic BI架构,正在让这一愿景成为现实。通过构建完整的“感知-思考-行动”闭环,衡石让AI代理真正具备了“看见”业务、“理解”问题、“推动”行动的能力。而这,正是智能分析的下一个十年。

                                                                                Logo

                                                                                AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

                                                                                更多推荐