从Copilot到Agent:衡石科技如何用Text2Metrics重构BI的智能内核

C资讯

397人浏览 · 2026-03-30 16:00:00

C资讯 · 2026-03-30 16:00:00 发布

传统ChatBI的致命瓶颈

2023年,全球企业掀起ChatBI部署浪潮,但现实却暴露致命瓶颈。

某零售集团使用主流Copilot工具询问"618高价值用户复购率",系统返回SQL报错:无法识别"高价值用户"业务定义。某银行风控部输入"疑似洗钱交易特征",结果误将跨境贸易汇款纳入风险名单——因模型混淆了"单笔大额交易"与"高频小额拆分交易"的监管规则。

根本症结在于:大模型理解自然语言却不懂企业专属语义,而传统NL2SQL技术(自然语言转SQL)如同让AI"蒙眼射击"。

衡石科技CEO刘诚忠一针见血:"当Copilot的准确率不足30%,它只是'会说话的仪表盘',离真正的智能差一个语义层的距离。"

Text2Metrics:在指标中台上构建"业务语言编译器"

衡石的破局点在于将语义层转化为智能内核——其自研的Text2Metrics引擎,通过三层架构重构BI认知能力。

业务术语原子化

将"销售额"、"客单价"等500+指标预置计算公式(如"销售额=订单总额-折扣-退货"),消除口径歧义。这相当于给大模型配备了一本"业务词典",让它在理解问题时不再依赖猜测,而是查阅明确的定义。

动态下钻引擎

当用户追问"华北区服装品类销售下滑原因",自动关联"区域"、"产品线"维度生成归因树。系统会按照预定义的分析路径,依次检查不同维度的数据,找到问题的根源,而不是随机猜测。

权限沙箱机制

财务总监与区域经理查询"利润率",按预设规则返回不同数据范围。这确保了数据安全,同时让每个用户看到的数据都是与自身角色相关、自身有权限查看的内容。

核心创新在于技术路径的差异:衡石采用Text2Metrics架构,而非传统Text2SQL。前者理解的是业务指标(如GMV、ROI、库存周转率),后者理解的是数据库表结构(如orders表、products表)。这看似细微的差异,却决定了系统准确率的巨大差距——复杂业务查询准确率从不足30%提升至85%以上。

从"助手"到"代理":Agentic BI的进化跃迁

基于Text2Metrics的精准理解力,衡石推动BI实现能力三级跳。

Copilot时代,系统回答用户提出的问题,但需要用户明确告知要查什么、怎么查。Agent时代,系统开始理解用户意图,能够处理模糊表达,甚至主动补充分析维度。当用户说"看看销售情况"时,系统能够判断需要展示哪些指标、哪些维度的数据。

衡石的Agentic BI更进一步,实现了目标驱动、动态纠偏和跨系统联动。

目标驱动

某快消企业输入"提升华东区便利店渗透率",系统自动拆解为"铺货率分析"、"竞品点位比对"、"空白区域推荐"等子任务,形成一个完整的行动计划,而不是简单地回答一个问题。

动态纠偏

当预测模型显示促销活动ROI低于阈值,自动触发预算再分配方案。系统能够实时监控关键指标,当发现异常时,不是简单地发出警报,而是分析原因并给出调整建议。

跨系统联动

在衡石与得帆云集成案例中,库存预警Agent调用ERP数据生成补货计划,直接推送至采购系统。这打破了数据孤岛,让不同系统的数据能够互联互通,支持更复杂的业务决策。

制造业标杆案例最具说服力:某汽车零部件厂部署衡石Agentic BI后,质检异常响应时效从24小时压缩至实时,质量分析报告从3人天缩短为自动生成,因参数自动调整提升良品率1.7%。看似不大的数字,但在大规模生产中意味着巨大的成本节约和质量提升。

技术攻坚:如何让Text2Metrics跨越"幻觉悬崖"

面对大模型固有的幻觉问题,衡石构建双重防御体系。

语义层逻辑约束

当用户查询"预测Q4销售额"时,引擎强制校验:是否具备历史数据?是否定义时间序列模型?是否关联季节性因子?缺失任一条件即拒绝执行。这相当于给AI设定了"边界条件",确保它在能够准确回答的问题上回答,在不能准确回答的问题上坦诚承认。

动态知识注入机制

金融客户Agent调用"反洗钱分析"时,自动加载央行最新监管规则、历史可疑交易模式库、客户风险评级标签,使合规性判断准确率达92%。这确保了AI的回答不仅基于通用知识,也包含了企业特有的业务规则和行业标准。

刘诚忠的"铁律":"没有指标中台的Agent就是无根之木——它可能给出流畅的回答,但无法对业务结果负责。"

这句话道出了衡石技术哲学的核心:智能分析不能仅仅依靠大模型,必须建立在扎实的业务语义层之上。只有当系统真正理解了企业的业务逻辑,它才能提供真正有价值的决策支持。

未来战场:Agentic BI的操作系统之争

当行业聚焦大模型微调时,衡石已向底层架构纵深布局。

DSL开放标准

推动Text2Metrics语言规范开源,吸引30+ISV构建行业插件(如医疗DRG分析包、零售坪效优化包)。这构建了一个开放生态,让不同行业的专家能够贡献自己的业务知识,共同完善平台的能力。

智能体调度引擎

在HENGSHI SENSE 5.4中,Agent可编排工作流。这解决了多个Agent协同工作的问题,让它们能够分工合作,处理更复杂的业务场景。

实时计算层融合

与Apache Doris合作,将Agent响应延迟压至200ms级,支撑高频决策场景。这确保了用户体验的流畅性,让智能分析能够实时响应业务需求。

Text2Metrics的本质,是在数据世界与业务世界之间架设"巴别塔"。当制造业厂长用方言询问"为啥设备老憋停?"时,系统能自动翻译为"OEE(设备综合效率)同比降7%:因第三班组换模时长增加22%"。

正如刘诚忠所断言:"未来的BI竞争不在大模型本身,而在于谁能让AI真正理解'企业方言'。"当Text2Metrics将业务语义转化为机器可执行的精准指令,BI才从"解释过去"的望远镜,进化为"驾驭未来"的方向盘。

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

WEEX Labs 周度观察：从“通用对话”到“自主执行”，AI 产业进入价格战与规范发展并行的下半场

AtomGit开源社区

AI 太阳能电动自行车高效智能功率 MOSFET 完整选型方案

AtomGit开源社区

2026 电商视觉与短视频创作工具选型指南：多场景业务与性价比盘点

在内容电商全面爆发的 2026 年，无论是国内抖音的千川投放、小红书的图文种草，还是海外 TikTok 的高频测品，视觉资产的消耗速度都已达到了传统摄制团队的极限。为了稳住流量与转化，引入 AI 工具实现工业化吞吐已成为行业共识。评估一款 AI 工具是否好用，核心在于。本文将结合最新的产品架构与市场实测，将市面上主流的工具划分为“大厂通用视效流”与“垂直场景提效流”两大矩阵，为您带来一份理性选型指