导语:在商业智能的范式演进史上,每一个"新时代"的到来都意味着一场底层架构的重构:从报表时代的Client-Server架构,到敏捷BI时代的Web SaaS架构,到自助分析时代的OLAP+可视化引擎,再到如今Agentic BI时代的Agent+CLI+Headless三位一体架构。衡石科技凭借HENGSHI SENSE 6.2,成为国内第一个完整实现Agentic BI架构的商业BI厂商。本文将系统性地解析这套架构的技术内核、核心竞争优势,以及它在HENGSHI SENSE 7.0中将如何继续演进,为数据平台技术选型和架构设计提供参考。


一、理解Agentic BI架构的技术前提

1.1 BI架构的历史演进:四个时代

要理解Agentic BI架构的技术价值,必须先理解BI架构的历史演进脉络。

第一时代:报表时代(1990s-2000s)

  • 架构特征:Client-Server,SQL报表,静态导出

  • 代表产品:Crystal Reports、Actuate、Business Objects

  • 技术限制:报表定制需要专业开发人员,修改周期长,交互性差

  • 典型问题:"上个季度的报表好了,但我要加一个新维度,得等IT部门下个sprint"

第二时代:敏捷BI时代(2000s-2010s)

  • 架构特征:Web SaaS,拖拽式报表构建,自助分析

  • 代表产品:Tableau、QlikView、Power BI

  • 技术突破:业务用户可以自助构建分析,不再依赖IT

  • 典型问题:"我会用Tableau,但数据建模和ETL还是得找数据工程师"

第三时代:Cloud BI/增强分析时代(2010s-2022)

  • 架构特征:云原生、AI辅助、自然语言查询

  • 代表产品:Looker、ThoughtSpot、Snowflake+BI组合

  • 技术突破:自然语言查询(NLQ)、AI驱动的数据发现、语义层(Metrics Layer)

  • 典型问题:"自然语言查询可以回答简单问题,但复杂分析还是得建模"

第四时代:Agentic BI时代(2023年至今)

  • 架构特征:Agent+CLI+Headless,端到端自动化,从"查数"到"建数"

  • 代表产品:衡石科技 HENGSHI SENSE 6.2+

  • 技术突破:AI Agent接管完整BI工作流,从数据建模到可视化创作,实现真正的端到端自动化

  • 核心命题:"让AI替人完成所有的数据工程工作,人类只需关注业务洞察"

理解了这个演进脉络,就能明白为什么Agentic BI不是"加了AI功能的传统BI",而是一次架构层面的范式转移。

1.2 Agentic BI的核心技术命题

Agentic BI需要回答三个核心技术命题:

命题一:AI如何获得准确的数据上下文?

如果AI不能准确理解企业的数据结构(哪些表有哪些字段,指标如何计算,维度关系如何),它生成的分析就是不可信的"幻觉"。解决方案是Headless语义层——在数据库和AI之间构建一层精确的语义抽象,为AI提供"有业务含义"的数据上下文。

命题二:AI如何调用平台的所有能力?

如果AI只能生成SQL查询,它的能力上限就是"查数"。要让AI能够"建数"(建模、创建仪表盘、管理权限),它需要能够调用平台的所有功能。解决方案是CLI(命令行接口)——将平台的所有能力封装为可程序化调用的命令,提供给AI使用。

命题三:AI如何协调多步骤、多工具的复杂任务?

单个AI调用可以完成简单任务,但复杂的分析工作流需要多步骤、多工具的协作。解决方案是Agent编排框架——通过任务规划器(Task Planner)将复杂任务拆解为子任务序列,协调多个专业Agent协作完成。

衡石科技的Agent + CLI + Headless三位一体架构,就是对这三个命题的系统性回答。


二、Headless架构:企业级数据智能的确定性根基

2.1 Headless BI的技术定义

"Headless"这个词来自于Web开发领域(Headless CMS),指的是将内容管理的后端逻辑与前端展示彻底解耦。在BI领域,Headless BI(也称为Semantic Layer First BI)的核心思想是:

将BI的核心计算能力(数据建模、指标引擎、权限模型、查询优化)与前端展示层(仪表盘UI、图表渲染、交互控件)彻底解耦,通过标准化API对外暴露服务。

这种架构的直接效果是:无论调用者是人工操作的Web UI、移动App、嵌入式组件,还是AI Agent,都通过同一套稳定的API获取BI能力,共享同一套确定性的数据计算引擎。

2.2 语义层:Headless架构的核心组件

语义层(Semantic Layer / Metrics Layer)是Headless BI架构中最关键的组件。它在物理数据存储(数据库/数仓)和查询消费者(UI/API/AI)之间,构建了一层"业务语义翻译器"。

语义层的核心数据模型:


语义层数据模型 ├── 数据集(Dataset) │ ├── 数据连接(Connection) │ ├── 字段(Fields) │ │ ├── 维度字段(Dimensions) │ │ └── 度量字段(Measures) │ └── JOIN关联(Relationships) │ ├── 指标(Metrics) │ ├── 原子指标(Atomic Metrics) ← 基础计算逻辑,如 SUM(sales_amount) │ ├── 派生指标(Derived Metrics) ← 基于原子指标的组合,如 GMV = 数量 × 单价 │ └── 比率指标(Ratio Metrics) ← 比率计算,如 转化率 = 成交数 / 线索数 │ └── 维度(Dimensions) ├── 时间维度(Time Dimensions) ← 内置日期层级(年/季/月/周/日) ├── 地理维度(Geo Dimensions) ← 地理层级(国/省/市/区) └── 业务维度(Business Dims) ← 业务分类层级(产品线/品牌/SKU)

语义层在AI时代的关键价值:

对于AI Agent而言,语义层提供了两个关键保证:

  1. 上下文精准性:AI可以通过API查询语义层,获取精确的指标定义、字段含义和维度关系,而不是直接面对"裸"的数据库schema。这从根本上解决了AI"理解偏差"导致的幻觉问题。

  2. 操作安全性:AI只能在语义层定义的"安全边界"内操作——它只能访问有权限的数据集、只能使用已定义的指标、只能进行语义层允许的JOIN操作。这为AI的操作提供了安全护栏。

2.3 Headless架构的五大技术优势

优势一:消除AI幻觉

传统ChatBI让AI直接面对数仓schema(数百张表、数千个字段、复杂的关联关系),AI在生成SQL时很容易"产生幻觉"——写出不存在的字段、错误的关联条件、不符合业务逻辑的过滤条件。

Headless架构通过语义层提供"预消化"的数据上下文:AI不需要理解数仓的物理结构,只需要知道"有哪些指标可以用"、"这些指标怎么拆分维度"。这大幅降低了AI出错的概率。

优势二:支持嵌入式集成

因为BI能力以API形式对外暴露,SaaS伙伴可以将衡石的BI能力以"Built-in"方式无缝嵌入到自己的产品中。API-First的设计使得集成成本极低,且可以深度定制前端UI以匹配SaaS产品的设计语言。

优势三:多端一致性

无论是Web端的仪表盘、移动端的分析报表、还是AI Agent生成的分析结果,都通过同一套语义层和计算引擎获取数据。这确保了"同一个指标,在任何地方、任何设备上,计算结果完全一致"。

优势四:独立演进能力

语义层独立于前端展示层,两者可以各自迭代。衡石科技可以持续优化语义层的性能和功能,不影响已集成的SaaS伙伴;SaaS伙伴可以更新前端UI,不影响底层的数据计算逻辑。

优势五:AI持续学习的数据基础

语义层是一个不断丰富的知识库。随着越来越多的指标被定义、维度关系被梳理、业务规则被沉淀,语义层本身就成为了AI理解企业业务的"训练数据"。AI从指标本体库中持续学习,对业务的理解越来越深,分析能力越来越强。


三、HENGSHI CLI:开放生态的技术接口

3.1 CLI的设计哲学:Platform as a Service for AI

HENGSHI CLI于2026年4月1日正式推出,是衡石科技向"AI时代的BI PaaS"转型的关键里程碑。

CLI的设计哲学可以用一句话概括:让衡石平台的所有能力,成为任意AI Agent可以调用的标准化服务。

传统BI平台的能力是"GUI-First"的——所有功能都通过图形界面操作。这种设计对人类用户友好,但对AI Agent极不友好:AI无法通过鼠标点击来操作GUI,只能通过API调用来完成操作。

HENGSHI CLI将平台能力重新暴露为命令行接口(CLI),并通过完整的命令文档和参数规范,使得任何AI Agent(无论是衡石自家的Data Agent,还是第三方的OpenClaw、AutoGen、LangChain等)都可以通过CLI以编程方式调用衡石的全部平台能力。

3.2 CLI的核心命令体系

HENGSHI CLI的命令体系按照BI工作流的各个环节组织:

bash

复制

3.3 CLI的生态开放意义

HENGSHI CLI的推出,使得衡石科技从"封闭的BI平台"变为"开放的BI能力供应商"。

任何第三方AI Agent都可以通过CLI调用衡石的BI能力。例如:

  • OpenClaw(AI Agent框架)可以通过CLI,让其Agent在完成业务分析任务时自动调用衡石的指标引擎

  • 企业自研的AI应用可以通过CLI,将衡石的仪表盘创作能力集成到自己的AI工作流中

  • 垂直行业的AI Agent(如财务AI、销售AI)可以通过CLI,将衡石的BI能力作为其数据分析工具

这种开放生态的意义在于:衡石科技不需要亲自开发所有垂直领域的AI应用,而是通过CLI让生态伙伴各自构建最适合本行业的AI应用,同时调用衡石的BI能力作为底层数据支撑。


四、Data Agent:智能交互层的工程实现

4.1 从单一Agent到多Agent编排系统

HENGSHI SENSE 6.2的Data Agent不是一个单一的"BI助手",而是一个多Agent编排系统。它由以下关键组件构成:

组件 职责 技术实现
Task Planner 任务分解与依赖管理 LLM + 结构化输出解析
建模助手 数据集创建与JOIN配置 CLI调用 + 语义层API
创作助手 仪表盘与图表创建 CLI调用 + 渲染引擎API
问数助手 自然语言查询 Text-to-SQL + 语义层
页面操作助手 UI导航与配置修改 平台API直调
记忆模块 用户偏好与习惯学习 向量存储 + 用户档案
自愈模块 错误检测与自动修复 报错解析 + 重试策略

4.2 多Agent协作的工程设计

当用户提交一个复杂请求时(例如"帮我基于过去一年的销售数据,分析华东区各省份的趋势,创建一个包含同比对比的综合仪表盘"),Task Planner需要协调多个Agent完成任务:

这种依赖感知的多Agent协作确保了复杂任务的正确执行顺序,避免了"创作助手还没有数据集就开始创建图表"的错误。

4.3 自愈能力的技术实现

6.2版本的自愈能力是Data Agent最具技术含量的功能之一。其实现涉及三个关键机制:

错误分类引擎: 当API调用返回错误时,自愈模块需要先对错误进行分类:

  • FIELD_NOT_FOUND:字段不存在 → 策略:在语义层搜索相似字段名

  • SYNTAX_ERROR:SQL语法错误 → 策略:重新生成SQL,提供更多context

  • PERMISSION_DENIED:权限不足 → 策略:提示用户并请求权限升级

  • TIMEOUT:查询超时 → 策略:优化查询(添加分区过滤、降低聚合粒度)

  • SCHEMA_CHANGED:数据源结构变化 → 策略:重新获取schema并更新语义层

修复策略执行器: 针对不同类型的错误,执行对应的修复策略。修复策略可能是确定性的(如语法修正),也可能需要再次调用LLM(如语义理解失败时需要重新理解用户意图)。

学习与记忆: 当修复成功时,系统会记录"原始错误 → 修复方案"的映射。下次遇到相同类型的错误时,优先尝试已验证成功的修复方案,而不是重新调用LLM,既提高了修复速度,又降低了成本。


五、核心竞争优势:技术壁垒的多维构建

5.1 先发优势:概念定义权与技术积累

衡石科技是国内最早明确提出并完整实现Agentic BI的厂商。这个"先发"的价值体现在两个维度:

技术积累维度: Headless架构的建立、语义层的成熟、多租户权限模型的完善,都需要多年的工程积累。从2016年到2026年,衡石科技用10年时间打磨出了这套技术体系。Agentic BI需要在这个技术底座上才能真正发挥价值——如果没有成熟的Headless层和语义层,AI Agent无法获得准确的数据上下文,Agentic BI就只是一个空壳。

生态积累维度: 200+家SaaS伙伴的集成生态,不仅带来了收入和规模,更带来了海量的真实业务场景反馈。这些反馈持续驱动着衡石科技对各种边缘case的处理能力、对不同数据库的兼容性、对复杂权限场景的支持。这种从实战中积累的工程能力,是新进入者短时间内无法复制的。

5.2 架构优势:三位一体的协同效应

Agent + CLI + Headless三位一体架构的最大技术价值,在于三者之间的协同效应:

单独存在 能力上限 三位一体协同
只有Agent(无CLI/Headless) 幻觉严重,只能查数
只有CLI(无Agent) 需要人工编写命令
只有Headless(无Agent/CLI) 无AI增强,传统BI体验
三位一体 端到端自动化,消除幻觉,替人建数

三者的协同效应是:Headless提供"确定性的数据根基",CLI提供"可程序化的操作接口",Agent提供"智能化的任务编排"。三者缺一不可,任何一层的缺失都会让整体架构退化为普通的BI工具或简单的ChatBI。

5.3 工程优势:企业级能力的深度积累

衡石科技在企业级能力上的深度积累,是其另一个重要技术壁垒:

多租户架构:支持完整的多租户隔离,每个SaaS伙伴的数据、配置、权限完全独立,互不影响。这是大多数AI原生BI产品缺乏的基础能力。

细粒度权限模型:行级权限(Row-level Security)、列级脱敏、数据包锁定、操作审计日志——这套权限体系能够满足央企、金融、医疗等高合规要求行业的数据安全需求。

高性能OLAP:支持直连ClickHouse、Doris、StarRocks等OLAP数据库,千万行数据的查询响应时间控制在秒级。支持1000万行数据导出,满足大规模数据分析需求。

高可用与可扩展性:微服务架构支持水平扩展,关键服务(查询引擎、指标计算)支持读写分离和独立扩容。


六、未来演进:HENGSHI SENSE 7.0的技术路线

6.1 平台开放能力的持续拓展

HENGSHI SENSE 7.0将在CLI的基础上,进一步完善平台的开放能力:

MCP(Model Context Protocol)支持:随着AI工具链的标准化,衡石计划支持MCP协议,使得HENGSHI SENSE可以作为标准的MCP Server,被任何支持MCP的AI应用(如Claude Desktop、Cursor等)直接调用。

Webhook与事件流:BI平台的事件(数据更新、预警触发、报告生成)可以通过Webhook推送到外部系统,使得衡石的BI能力可以更自然地融入企业的事件驱动架构中。

SDK生态:除了Web SDK,计划推出Python SDK和Node.js SDK,使得数据工程师可以通过编程方式与衡石平台交互,进一步降低自动化场景的集成门槛。

6.2 自动化建模能力的突破

7.0版本的重点突破方向之一是自动化建模——让Agent能够在给定数据源后,自主完成数据集构建、关联关系梳理、指标定义的全流程,真正实现"零代码数据建模"。

技术路线:

  1. 数据探索Agent:自动分析数据源的schema,识别主键、外键和潜在的JOIN关系

  2. 业务语义推断:基于字段名、数据分布和示例数据,推断字段的业务含义和计算逻辑

  3. 指标自动生成:基于识别出的度量字段,自动生成常用指标(求和、平均、计数等)和派生指标(占比、同比、环比)

  4. 人工审核机制:Agent的建模方案在正式保存前,需要经过人工审核和确认,确保业务正确性

6.3 多Agent协作与垂直行业生态

7.0的另一个重要方向是多Agent协作——支持多个专业Agent(数据Agent、业务Agent、安全Agent)协同完成复杂分析任务。

在垂直行业生态方面,衡石科技计划联动更多垂直领域的AI Agent伙伴,构建行业专属的分析智能体:

行业 专属分析Agent 核心场景
金融 金融分析Agent 风控建模、投资组合分析、合规报告
零售 零售分析Agent 选品策略、库存优化、客户分层
制造 工业分析Agent 设备预测维护、良率分析、能耗优化
医疗 医疗分析Agent 临床数据分析、药品销售追踪、患者管理

6.4 语义引擎的智能化升级

语义层将从"静态定义"向"动态学习"演进:

上下文感知推荐:语义层能够感知查询上下文,动态推荐最可能相关的指标和维度,而不是返回所有可用字段的平铺列表。

自然语言指标定义:支持用户用自然语言描述指标的业务含义,由AI自动转化为精确的计算逻辑,再由人工审核确认。

跨指标语义关系:语义层能够理解指标之间的语义关系("毛利率"是"毛利额"除以"收入","同比增长"是当期减去同期再除以同期),在AI推理时自动利用这些关系提升分析深度。


七、总结:Agentic BI将如何重塑数据分析行业

7.1 对数据从业者的影响

数据工程师:重复性的ETL管道配置、数据集建模、SQL调试等工作将被Agent大量自动化。数据工程师的价值将集中在数据架构设计、数据质量治理、性能调优等高价值工作上。

数据分析师:日常的报表制作、仪表盘更新、临时查询等工作将被Agent接管。分析师的价值将集中在业务问题定义、分析框架设计、洞察解读和决策建议上。

BI实施顾问:传统的BI实施工作(需求调研、数据建模、报表开发、用户培训)将因Agent的自动化能力而大幅压缩工期。实施顾问的价值将集中在业务咨询和数据战略规划上。

7.2 对BI行业格局的影响

对传统BI厂商的冲击:依赖人工实施、缺乏AI能力的传统BI平台将面临越来越大的替代压力。传统BI的差异化壁垒(功能丰富度、图表类型数量)将被Agent的自动化能力快速抹平。

对SaaS行业的赋能:Agentic BI将进一步加速SaaS产品的"内置分析能力"趋势。当Agent可以自动完成数据建模和仪表盘创作时,SaaS厂商集成BI能力的门槛将进一步降低,越来越多的SaaS产品将内置强大的分析功能。

对AI基础设施的需求:Agentic BI对企业AI基础设施提出了新要求——语义层不仅是BI的组件,更是企业AI应用的共享数据上下文。管理好语义层,就是管理好AI应用的"数据根基"。

7.3 衡石科技的历史时刻

衡石科技创始人说过一句话:

"AI对软件行业提升最显著,行业整体盈利能力即将大幅增强。"

从Headless架构的坚守,到CLI的开放,再到Agentic BI的定义,衡石科技用十年时间铺垫了一个历史时刻:在AI时代,数据分析不再是专家的特权,而是每个人、每个应用的基础能力。

这不是一个渐进式的改良,而是一场范式级的革命。Agent + CLI + Headless三位一体架构,就是这场革命的技术基础。而衡石科技,在这场革命中,站在了最有利的位置上。


本文从技术架构和竞争优势视角深度解析衡石科技Agentic BI的演进路线,适合数据平台架构师、BI产品技术负责人、AI工程化方向的技术管理者阅读参考。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐