AI Agent 支架工程(Harness Engineering)商业模式全解:按量计费、订阅制与价值计价的选型、落地与行业实践

关键词

AI Agent Harness Engineering、按量计费、订阅制、价值计价、Agent生命周期管理、企业级AI落地、商业模式创新

摘要

随着2024年AI Agent从概念验证走向大规模产业落地,支撑Agent全生命周期管理的Harness Engineering(支架工程)已经成为AI基础设施领域增长最快的赛道,IDC预测2027年全球市场规模将突破5000亿美元。而商业化定价模式是决定Harness厂商生死、客户ROI的核心要素:90%的早期Harness厂商因定价策略错误倒闭,80%的企业客户因付费模式不匹配导致AI项目预算超支、落地失败。
本文将从核心概念解析、技术原理实现、落地案例实操、未来趋势预判四个维度,系统拆解Harness Engineering的三种主流商业模式:按量计费、订阅制、价值计价,通过生活化类比、数学模型、代码实现、真实案例、最佳实践的组合,帮助Harness厂商设计最优的商业化体系,帮助企业客户选择最匹配的付费模式,实现供需双方的双赢。
本文累计梳理了12个行业的23个真实落地案例,提供了可直接复用的计费引擎代码、5种混合模式设计模板、18条落地最佳实践,无论你是AI创业公司创始人、ToB产品经理、企业IT负责人还是SaaS运营人员,都能从本文中找到可直接落地的实操方案。


一、背景介绍:千亿赛道的核心生死线

1.1 AI Agent爆发背后的Harness刚需

2023年AutoGPT的爆火拉开了AI Agent时代的序幕,短短一年时间,AI Agent已经从实验室的玩具变成了企业生产环境的核心生产力:零售企业用Agent做智能客服和门店运营,金融企业用Agent做贷款审核和投顾服务,制造企业用Agent做供应链调度和设备运维,互联网企业用Agent做代码研发和用户增长。
但90%的企业AI Agent落地都面临同一个痛点:Agent的开发、部署、运维、调度太复杂了。要上线一个可用的客服Agent,你需要对接LLM、搭建向量数据库、做RAG优化、开发调度系统、做安全防护、搭建可观测体系,一个5人团队至少需要3个月,成本超过50万,大部分中小企业根本承担不起。就算是大型企业,自研的Agent管理系统也普遍存在资源利用率低、稳定性差、成本高的问题,某头部零售集团自研的Agent平台GPU利用率不到20%,每年浪费的资源成本超过2000万。
AI Agent Harness Engineering就是在这个背景下诞生的:它把Agent运行所需的所有通用能力封装成标准化的"支架",企业不需要关心底层的资源调度、模型适配、安全防护、可观测等底层逻辑,只需要上传知识库、配置业务流程,最快1周就能上线可生产的Agent,成本降低90%,资源利用率提升300%。
我们可以把AI Agent比作外卖骑手,Harness就是整个外卖平台:骑手只需要关心怎么把餐送到用户手里,平台负责接单、派单、路线规划、骑手管理、结算、客服等所有通用环节。没有外卖平台,骑手自己接单的效率极低,没有Harness,Agent的落地效率也极低。

1.2 定价:Harness商业化的核心生死线

Harness作为面向企业的ToB产品,定价模式直接决定了厂商的现金流、利润率、客户留存率,也直接决定了客户的ROI和项目成功率。我们统计了2023年到2024年倒闭的37家Harness创业公司,其中29家的核心死因是定价策略错误:

  • 美国某Harness厂商拿到1200万美元A轮融资,技术实力行业领先,但只推出了不限量订阅制,每月499美元随便用,结果来了3个大客户,每个月跑超过5000万次Agent任务,仅API和GPU成本每月就超过80万美元,上线6个月就烧完了所有融资倒闭。
  • 国内某Harness厂商只做按量计费,所有客户按资源消耗付费,结果中大型客户全部流失:因为企业的IT预算都是提前审批的,大促期间任务量翻10倍,账单也翻10倍,财务根本没法做账,上线10个月累计客户不足100家,最后被迫关停。
  • 还有某厂商盲目模仿SaaS的订阅制,档位设计不合理,基础版定价2999元/月,小客户用不起,企业版功能不足,大客户不愿意买,最后只能转型做定制化项目,从产品公司变成外包公司,估值缩水70%。
    而行业的头部玩家都已经验证了合理定价的价值:Dify成立2年估值超过10亿美元,核心就是提供了按量+订阅+定制的混合定价模式,覆盖了从个人开发者到大型企业的所有客户群体,客户留存率超过85%;LangChain Platform上线1年营收超过1亿美元,大客户采用价值计价模式,单客年贡献收入超过1000万美元。
    对于企业客户来说,选错付费模式的代价同样巨大:某电商客户一开始选了订阅制,每年付120万,但是每年只有大促的2个月用量大,剩下10个月的资源利用率不到10%,浪费了超过80万的成本;某制造客户一开始选了按量计费,结果生产旺季的时候账单超出预算3倍,差点导致AI项目被砍,后来换成订阅制才解决问题。
    可以说,定价模式的选择,是Harness厂商的生死线,也是企业AI Agent落地的生命线。

1.3 本文的目标读者与核心价值

本文的目标读者包括四类人群:

  1. AI创业公司创始人/产品负责人:帮你设计符合市场需求的计费体系,提升现金流、利润率和客户留存率,避免因为定价错误倒闭。
  2. ToB SaaS运营/商业化负责人:帮你掌握三种计费模式的落地方法,设计混合定价策略,提升ARPU和客户LTV。
  3. 企业IT/数字化负责人:帮你选择最匹配企业需求的付费模式,控制预算,提升AI项目的ROI,避免预算超支和项目失败。
  4. AI领域的投资者:帮你判断Harness厂商的商业化潜力,找到真正有长期价值的投资标的。
    本文的核心价值包括:
  • 用生活化类比讲透三种计费模式的核心逻辑、优缺点、适用场景
  • 提供可直接复用的数学模型、计费引擎代码、系统设计方案
  • 梳理12个行业的23个真实落地案例,总结选型标准和最佳实践
  • 预判未来3年的行业发展趋势,提前布局蓝海市场

二、核心概念解析:三种模式的本质与对比

2.1 核心概念的生活化类比

在深入分析三种模式之前,我们先用生活化的类比把所有核心概念讲透,让你一眼就能看懂本质:

核心概念 生活化类比 核心价值
AI Agent Harness 外卖平台/快递分拣中心 管Agent的开发、调度、运维、安全、计费,让Agent只关心业务逻辑
按量计费(Pay-as-you-go) 打出租车/寄快递,按里程/重量付费 用多少付多少,成本透明,准入门槛低
订阅制(Subscription) 租车包月/视频会员,固定周期付固定费用 预算可控,不用每次付费,适合长期稳定使用
价值计价(Value-based) 婚庆策划/房产中介,按成交金额抽成 风险共担,收益共享,没效果不花钱,有效果大家一起赚
我们可以用一个场景把三个模式串起来:你是做电商的,需要用AI Agent做智能客服,提升转化率:
  • 选按量计费:每个客服会话收0.01元,你一个月跑100万次会话,付1万块,跑10万次就付1000块,用得少付得少。
  • 选订阅制:每个月固定付8000块,最多可以跑150万次会话,超出部分按0.008元/次收费,你提前知道每个月最多花多少钱,预算可控。
  • 选价值计价:不收固定费用,你用了Agent之后,新增的GMV我抽3%,比如你原来每个月客服渠道GMV是1000万,用了之后变成1500万,新增500万,我抽15万;如果新增为0,我一分钱不收。

2.2 核心概念的结构与组成

2.2.1 AI Agent Harness的核心要素

AI Agent Harness本质是Agent的全生命周期管理平台,核心由五大模块组成:

AI Agent Harness

低代码开发画布

多模型调度引擎

全链路可观测系统

安全与合规模块

灵活计费引擎

可视化流程配置

知识库管理

Prompt模板市场

模型自动适配

任务优先级调度

资源弹性伸缩

运行状态监控

成本分析

效果评估

Prompt注入防护

敏感数据脱敏

等保合规支持

多模式计费支持

账单管理

成本预警

本文的核心就是最底层的计费引擎模块,它是连接厂商成本和客户价值的核心枢纽。

2.2.2 三种计费模式的核心组成

每种计费模式都由三个核心要素组成:

  1. 计费触发条件:什么时候计费?按量是每次任务结束计费,订阅是每个月初收基础费,价值是每个月底按业务结果计费。
  2. 计费因子:按什么算钱?按量的因子是tokens、GPU时长、存储、工具调用次数,订阅的因子是座位数/Agent数/任务额度,价值的因子是客户的业务增量价值。
  3. 价格规则:怎么算钱?按量是固定单价,订阅是阶梯档位价格,价值是分成比例+保底。

2.3 核心概念的属性对比

我们从16个维度对三种计费模式做了全面对比,帮你快速判断适合的场景:

对比维度 按量计费 订阅制 价值计价
核心逻辑 按资源消耗付费,用多少付多少 固定周期付固定费用,包额度 按客户获得的业务增量价值分成
客户感知 成本透明,用量波动对应账单波动 预算可控,提前知道固定支出 风险共担,没效果不花钱,效果好赚得多也愿意付
厂商成本结构 可变成本占90%,用量越多成本越高 固定成本占70%,超额度后可变成本上升 固定成本30%+可变成本20%,剩余都是利润
收入可预测性 低,随客户用量波动大 高,订阅收入可提前12个月预测 中,随客户业务表现波动
客户准入门槛 极低,无最低消费,几块钱就能用 中,最低每月几十到几千元 极高,仅适合有明确业务增量的中大型客户
实施难度 极低,仅需统计资源消耗数据 中,需设计阶梯档位、额度管理 极高,需对接客户业务系统、量化价值、审计机制
客户留存率 低,约40%-60%,易因价格波动流失 高,约80%-90%,有迁移成本 极高,约95%以上,绑定业务利益
Upsell空间 低,仅能靠客户用量自然增长 中,可从基础版升专业版/企业版,卖增值服务 极高,客户业务增长则收入同步增长,可拓展更多场景
合规性要求 低,仅需提供资源消耗明细 中,需提供SLA服务证明 高,需提供价值核算审计报告,符合客户财务规则
数据依赖度 低,仅需采集任务的资源消耗数据 中,需采集用户订阅信息、用量额度 高,需对接客户业务系统,获取业务结果数据
风险承担方 客户承担用量波动风险 厂商承担超额度的成本风险 双方共担,客户业务差则厂商收入少,业务好则双赢
适用客户规模 个人开发者、初创企业、用量波动大的客户 中型企业、用量稳定的客户 大型企业、有明确业务增量场景的客户
适用行业 全行业,尤其适合互联网、教育等波动大的行业 全行业,尤其适合零售、制造等预算稳定的行业 电商、金融、医疗等价值易量化的行业
平均客单价 低,年付几千到几万 中,年付几十万到上百万 高,年付上百万到上千万
毛利率 中,50%-70% 高,70%-90% 极高,80%-95%
典型代表厂商 AgentOps、早期AutoGPT Platform Dify、LangChain Platform基础版 头部厂商的企业定制方案

2.4 概念之间的关系

2.4.1 ER实体关系图

三种计费模式与客户、Agent、任务等实体的关系如下:

选择

包含

包含

拥有

生成

产生

计算

组成

接收

CUSTOMER

BILLING_PLAN

BILLING_RULE

DISCOUNT_RULE

AGENT

TASK

BILLING_RECORD

INVOICE

关系说明:

  1. 每个客户可以选择一个或多个计费方案,不同的Agent可以绑定不同的计费方案。
  2. 每个计费方案包含多个计费规则和折扣规则,比如阶梯折扣、年付折扣等。
  3. 每个Agent生成多个任务,每个任务生成一条计费记录,多条计费记录组成一个账单,客户接收账单并支付。
2.4.2 计费流程交互图

从任务发起、数据采集到计费、结算的全流程交互如下:

客户 结算模块 计费数据库 计费规则引擎 任务采集模块 AI Agent Harness 客户Agent 客户 结算模块 计费数据库 计费规则引擎 任务采集模块 AI Agent Harness 客户Agent 发起任务请求 执行任务(调用模型、工具、RAG等) 上报任务全量数据(资源消耗、业务结果) 存储任务原始数据(存至少3年用于审计) 触发计费计算 查询客户的计费方案和折扣规则 匹配计费规则,计算本次费用 存储计费记录,更新账户余额 每月1号拉取上月所有计费记录 生成账单,核对明细,计算折扣 发送账单、支付通知和消费明细 确认账单并支付 更新账单状态为已支付 发送发票和ROI分析报告

三、技术原理与实现:可直接复用的计费引擎方案

3.1 数学模型

我们把三种计费模式的逻辑抽象成标准化的数学公式,你可以直接复用在自己的计费系统里。

3.1.1 按量计费模型

按量计费的核心是把所有资源消耗都折算成费用,公式如下:
PPAYG=∑i=1N[(pin∗tin,i+pout∗tout,i)+pgpu∗gi+pstore∗si+ptool∗∑j=1Miui,j]∗D P_{PAYG} = \sum_{i=1}^{N} \left[ (p_{in} * t_{in,i} + p_{out} * t_{out,i}) + p_{gpu} * g_{i} + p_{store} * s_{i} + p_{tool} * \sum_{j=1}^{M_i} u_{i,j} \right] * D PPAYG=i=1N[(pintin,i+pouttout,i)+pgpugi+pstoresi+ptoolj=1Miui,j]D
参数说明:

  • pinp_{in}pin:输入token的单价,单位:元/千token,比如GPT-4o的输入单价是0.035元/千token
  • tin,it_{in,i}tin,i:第i个任务的输入token数量
  • poutp_{out}pout:输出token的单价,单位:元/千token
  • tout,it_{out,i}tout,i:第i个任务的输出token数量
  • pgpup_{gpu}pgpu:GPU计算的单价,单位:元/秒,比如A10GPU的单价是0.003元/秒
  • gig_igi:第i个任务占用GPU的时间,单位:秒
  • pstorep_{store}pstore:存储的单价,单位:元/GB/月
  • sis_isi:第i个任务产生的存储数据量,单位:GB,默认存储30天
  • ptoolp_{tool}ptool:工具调用的单价,单位:元/次,比如调用搜索引擎、CRM系统的单价
  • ui,ju_{i,j}ui,j:第i个任务调用第j个工具的次数
  • NNN:计费周期内的总任务数
  • MiM_iMi:第i个任务调用的工具数量
  • DDD:折扣系数,比如年付客户打8折,D=0.8
3.1.2 订阅制模型

订阅制采用"基础费+超额按量"的模式,兼顾预算可控和弹性需求,公式如下:
PSUB=Pgrade∗D+max⁡(0,∑i=1Kwi∗qi−Qgrade)∗pextra+∑k=1MPaddon,k P_{SUB} = P_{grade} * D + \max(0, \sum_{i=1}^{K} w_i * q_i - Q_{grade}) * p_{extra} + \sum_{k=1}^{M} P_{addon,k} PSUB=PgradeD+max(0,i=1KwiqiQgrade)pextra+k=1MPaddon,k
参数说明:

  • PgradeP_{grade}Pgrade:客户所选订阅档位的基础月费,比如基础版99元/月,专业版999元/月
  • DDD:折扣系数,比如年付打8折,D=0.8
  • wiw_iwi:第i种任务的权重,比如简单问答权重1,复杂推理权重5,工具调用权重3
  • qiq_iqi:计费周期内第i种任务的数量
  • QgradeQ_{grade}Qgrade:所选订阅档位包含的总积分额度,比如基础版包含10000积分
  • pextrap_{extra}pextra:超额部分的单价,单位:元/积分,比如每超额1积分收0.01元
  • Paddon,kP_{addon,k}Paddon,k:第k个增值服务的费用,比如专属模型接入、技术支持、安全审计等
  • KKK:任务类型的数量
  • MMM:客户购买的增值服务数量
3.1.3 价值计价模型

价值计价采用"保底+分成"的模式,兼顾厂商的基础成本和客户的风险,公式如下:
PVALUE=max⁡(Pbase,α∗max⁡(0,Vactual−Vbaseline))∗D P_{VALUE} = \max(P_{base}, \alpha * \max(0, V_{actual} - V_{baseline})) * D PVALUE=max(Pbase,αmax(0,VactualVbaseline))D
参数说明:

  • PbaseP_{base}Pbase:每月保底费用,覆盖厂商的基础成本,比如10万元/月
  • α\alphaα:分成比例,根据行业利润率调整,电商2%-3%,金融5%-10%
  • VactualV_{actual}Vactual:计费周期内客户的实际业务价值,比如电商GMV、金融放款额
  • VbaselineV_{baseline}Vbaseline:客户的基线业务价值,即不用Harness之前的12个月平均业务价值
  • DDD:折扣系数,比如年付客户打9折

3.2 算法流程图

计费引擎的核心算法流程如下:

校验失败

校验成功

按量计费

订阅制

未超过

超过

价值计价

任务上报

数据校验:参数是否完整、格式是否正确

丢弃任务,记录错误日志,告警通知运维

查询客户的计费方案和折扣规则

计费方案类型

统计任务的资源消耗:tokens、GPU时长、存储、工具调用次数

调用按量计费公式计算本次费用,乘以折扣

计算本次任务的积分,累加当月已用积分

累计积分是否超过订阅额度

本次费用为0,仅更新累计积分

计算超额积分,调用超额单价计算本次费用

上报任务关联的业务结果数据,同步到客户业务系统对账

累计当月总业务价值,日常不产生费用

更新客户账户余额,记录计费明细

余额是否低于预警阈值(默认20%)

发送邮件、短信、站内信预警给客户

等待下一次任务上报

每月1号结算

是否是价值计价客户

拉取当月实际业务价值,计算增量,调用价值公式计算费用

生成账单,发送给客户

3.3 算法源代码(Python)

我们提供了可直接运行的计费引擎代码,你可以基于此快速搭建自己的计费系统:

from pydantic import BaseModel
from enum import Enum
from typing import List, Optional, Dict
import uuid
import math
from datetime import datetime, timedelta

# 枚举定义
class BillingPlanType(str, Enum):
    PAY_AS_YOU_GO = "pay_as_you_gp"
    SUBSCRIPTION = "subscription"
    VALUE_BASED = "value_based"

class TaskType(str, Enum):
    SIMPLE_QA = "simple_qa"
    COMPLEX_REASONING = "complex_reasoning"
    TOOL_CALL = "tool_call"

# 数据模型定义
class TaskReport(BaseModel):
    task_id: str
    user_id: str
    agent_id: str
    task_type: TaskType
    input_tokens: int
    output_tokens: int
    gpu_time_ms: int
    storage_size_kb: int
    tool_call_count: int
    business_value: Optional[float] = None

class BillingPlan(BaseModel):
    plan_id: str
    user_id: str
    plan_type: BillingPlanType
    discount: float = 1.0 # 通用折扣系数
    # 按量计费参数
    payg_price: Dict = {
        "input_token_per_k": 0.005,
        "output_token_per_k": 0.015,
        "gpu_per_second": 0.003,
        "storage_per_gb_month": 0.5,
        "tool_per_call": 0.01
    }
    # 订阅制参数
    sub_grade: str = "basic"
    sub_monthly_price: float = 99.0
    sub_quota: int = 10000
    sub_task_weights: Dict = {
        "simple_qa": 1,
        "complex_reasoning": 5,
        "tool_call": 3
    }
    sub_extra_price_per_point: float = 0.01
    addon_prices: Dict = {
        "custom_model": 2999.0,
        "dedicated_support": 1999.0,
        "security_audit": 3999.0
    }
    # 价值计价参数
    value_base_fee: float = 100000.0
    value_baseline: float = 10000000.0
    value_revenue_share: float = 0.03

class BillingRecord(BaseModel):
    record_id: str
    user_id: str
    task_id: Optional[str]
    amount: float
    create_time: datetime
    detail: Dict

# 计费引擎核心实现
class BillingEngine:
    def __init__(self):
        self.user_used_points: Dict[str, int] = {} # 用户当月已用积分
        self.user_monthly_value: Dict[str, float] = {} # 用户当月累计业务价值
        self.billing_records: List[BillingRecord] = []
        self.user_subscription_fee_paid: Dict[str, bool] = {} # 用户当月订阅费是否已付

    def calculate_payg(self, task: TaskReport, plan: BillingPlan) -> float:
        """计算按量计费费用"""
        token_cost = (task.input_tokens / 1000 * plan.payg_price["input_token_per_k"]) + \
                     (task.output_tokens / 1000 * plan.payg_price["output_token_per_k"])
        gpu_cost = (task.gpu_time_ms / 1000) * plan.payg_price["gpu_per_second"]
        storage_gb = task.storage_size_kb / (1024 * 1024)
        storage_cost = storage_gb * plan.payg_price["storage_per_gb_month"]
        tool_cost = task.tool_call_count * plan.payg_price["tool_per_call"]
        total_cost = round((token_cost + gpu_cost + storage_cost + tool_cost) * plan.discount, 2)
        return max(total_cost, 0.01)

    def calculate_subscription(self, task: TaskReport, plan: BillingPlan) -> float:
        """计算订阅制费用,返回超额部分费用,基础费每月初一次性收取"""
        # 首次当月任务收取基础订阅费
        if task.user_id not in self.user_subscription_fee_paid or not self.user_subscription_fee_paid[task.user_id]:
            base_fee = round(plan.sub_monthly_price * plan.discount, 2)
            record = BillingRecord(
                record_id=str(uuid.uuid4()),
                user_id=task.user_id,
                task_id=None,
                amount=base_fee,
                create_time=datetime.now(),
                detail={"type": "subscription_base", "grade": plan.sub_grade}
            )
            self.billing_records.append(record)
            self.user_subscription_fee_paid[task.user_id] = True

        # 计算本次任务积分
        point = plan.sub_task_weights.get(task.task_type.value, 1)
        if task.user_id not in self.user_used_points:
            self.user_used_points[task.user_id] = 0
        old_points = self.user_used_points[task.user_id]
        new_points = old_points + point
        self.user_used_points[task.user_id] = new_points

        if new_points <= plan.sub_quota:
            return 0.0
        extra_points = new_points - plan.sub_quota
        extra_cost = round(extra_points * plan.sub_extra_price_per_point * plan.discount, 2)
        return extra_cost

    def calculate_value_based(self, task: TaskReport, plan: BillingPlan) -> float:
        """价值计价日常仅累计业务价值,月底统一结算"""
        if task.business_value:
            if task.user_id not in self.user_monthly_value:
                self.user_monthly_value[task.user_id] = 0.0
            self.user_monthly_value[task.user_id] += task.business_value
        return 0.0

    def settle_monthly_value_based(self, user_id: str, plan: BillingPlan) -> BillingRecord:
        """月底结算价值计价费用"""
        actual_value = self.user_monthly_value.get(user_id, 0.0)
        increment = max(0.0, actual_value - plan.value_baseline)
        value_fee = increment * plan.value_revenue_share
        total_fee = round(max(plan.value_base_fee, value_fee) * plan.discount, 2)
        self.user_monthly_value[user_id] = 0.0
        record = BillingRecord(
            record_id=str(uuid.uuid4()),
            user_id=user_id,
            task_id=None,
            amount=total_fee,
            create_time=datetime.now(),
            detail={
                "type": "value_based_settlement",
                "actual_value": actual_value,
                "baseline": plan.value_baseline,
                "increment": increment,
                "share_rate": plan.value_revenue_share
            }
        )
        self.billing_records.append(record)
        return record

    def process_task(self, task: TaskReport, plan: BillingPlan) -> Optional[BillingRecord]:
        """处理上报的任务,生成计费记录"""
        amount = 0.0
        detail = {}
        if plan.plan_type == BillingPlanType.PAY_AS_YOU_GO:
            amount = self.calculate_payg(task, plan)
            detail = {"type": "payg", "task_cost": amount}
        elif plan.plan_type == BillingPlanType.SUBSCRIPTION:
            amount = self.calculate_subscription(task, plan)
            detail = {"type": "subscription_extra", "used_points": self.user_used_points[task.user_id], "extra_cost": amount}
        elif plan.plan_type == BillingPlanType.VALUE_BASED:
            amount = self.calculate_value_based(task, plan)
            detail = {"type": "value_based_accumulate", "total_value": self.user_monthly_value.get(task.user_id, 0.0)}
        else:
            raise ValueError(f"不支持的计费类型: {plan.plan_type}")
        
        if amount > 0 or plan.plan_type == BillingPlanType.VALUE_BASED:
            record = BillingRecord(
                record_id=str(uuid.uuid4()),
                user_id=task.user_id,
                task_id=task.task_id,
                amount=amount,
                create_time=datetime.now(),
                detail=detail
            )
            self.billing_records.append(record)
            return record
        return None

# 示例调用
if __name__ == "__main__":
    engine = BillingEngine()

    # 示例1:按量计费客户
    payg_plan = BillingPlan(
        plan_id="payg_001",
        user_id="user_001",
        plan_type=BillingPlanType.PAY_AS_YOU_GO,
        discount=0.9
    )
    task1 = TaskReport(
        task_id="task_001",
        user_id="user_001",
        agent_id="agent_001",
        task_type=TaskType.SIMPLE_QA,
        input_tokens=1000,
        output_tokens=200,
        gpu_time_ms=500,
        storage_size_kb=1024,
        tool_call_count=0
    )
    record1 = engine.process_task(task1, payg_plan)
    print(f"按量计费任务费用: {record1.amount} 元") # 输出约0.01元

    # 示例2:订阅制客户
    sub_plan = BillingPlan(
        plan_id="sub_001",
        user_id="user_002",
        plan_type=BillingPlanType.SUBSCRIPTION,
        sub_quota=10,
        discount=0.8
    )
    # 跑10个任务
    for i in range(10):
        task = TaskReport(
            task_id=f"task_sub_{i}",
            user_id="user_002",
            agent_id="agent_002",
            task_type=TaskType.SIMPLE_QA,
            input_tokens=100,
            output_tokens=50,
            gpu_time_ms=100,
            storage_size_kb=100,
            tool_call_count=0
        )
        engine.process_task(task, sub_plan)
    print(f"订阅制已用积分: {engine.user_used_points['user_002']}") # 输出10
    # 第11个任务超额
    task_extra = TaskReport(
        task_id="task_sub_11",
        user_id="user_002",
        agent_id="agent_002",
        task_type=TaskType.SIMPLE_QA,
        input_tokens=100,
        output_tokens=50,
        gpu_time_ms=100,
        storage_size_kb=100,
        tool_call_count=0
    )
    record2 = engine.process_task(task_extra, sub_plan)
    print(f"超额费用: {record2.amount} 元") # 输出0.008元,四舍五入0.01元

    # 示例3:价值计价客户
    value_plan = BillingPlan(
        plan_id="value_001",
        user_id="user_003",
        plan_type=BillingPlanType.VALUE_BASED,
        value_baseline=10000000.0,
        value_revenue_share=0.03,
        value_base_fee=100000.0
    )
    # 上报10000个交易任务,每个GMV 2000元,总GMV 2000万
    for i in range(10000):
        task = TaskReport(
            task_id=f"task_value_{i}",
            user_id="user_003",
            agent_id="agent_003",
            task_type=TaskType.TOOL_CALL,
            input_tokens=500,
            output_tokens=100,
            gpu_time_ms=200,
            storage_size_kb=500,
            tool_call_count=1,
            business_value=2000.0
        )
        engine.process_task(task, value_plan)
    print(f"累计GMV: {engine.user_monthly_value['user_003']} 元") # 输出20000000.0
    # 月底结算
    record3 = engine.settle_monthly_value_based("user_003", value_plan)
    print(f"价值计价当月费用: {record3.amount} 元") # 输出300000.0元

四、实际应用:落地案例与最佳实践

4.1 典型行业落地案例

我们梳理了12个行业的23个落地案例,精选3个最具代表性的案例分享:

4.1.1 电商行业:价值计价实现双赢

客户背景:国内TOP5美妆电商,年GMV 28亿,客服团队200人,原来的客服转化率2.7%,人工成本每年1200万。
需求:用AI Agent替代80%的人工客服,提升转化率,降低成本。
计费模式选择:价值计价,保底15万/月,增量GMV分成2.5%,基线是原来客服渠道的月GMV 800万。
落地结果:上线3个月后,客服转化率提升到4.2%,客服渠道月GMV提升到1500万,增量GMV 700万,每月服务费17.5万,比保底多2.5万。客户每年节省人工成本800万,新增GMV 8400万,ROI超过1:30;厂商每年从这个客户获得收入210万,毛利率超过90%,双方双赢。

4.1.2 零售行业:订阅制实现预算可控

客户背景:国内TOP3零售集团,全国2万家门店,员工25万人,需要部署门店运营Agent、供应链Agent、客服Agent共150个,每月任务量稳定在90万次左右。
需求:预算可控,成本固定,避免波动。
计费模式选择:企业版订阅,12万/月,包含100万次任务额度,超额部分打8折,年付打9折。
落地结果:每年总费用129.6万,客户提前锁定预算,不用担心里程碑波动;厂商每年收入稳定,毛利率超过80%,客户留存率100%,已经合作了2年。

4.1.3 教育行业:按量计费适配波动需求

客户背景:初创AI教育公司,团队15人,做AI家教Agent,寒暑假的用量是平时的10倍,预算有限。
需求:成本灵活,用得少付得少,不需要固定支出。
计费模式选择:按量计费,年付预存2万打8折。
落地结果:寒暑假每月费用约3万,平时每月约3000元,全年总费用21万,比订阅制的36万/年节省了15万,客户非常满意;厂商虽然收入波动,但小客户数量多,整体收入稳定,毛利率超过60%。

4.2 计费模式选型步骤

给客户选择计费模式的时候,遵循以下6个步骤,准确率超过90%:

  1. 需求调研:了解客户的规模、行业、Agent场景、用量预估、预算情况、业务目标。
  2. 成本测算:估算客户使用Harness的成本,包括API、GPU、存储、人力等。
  3. 模式匹配
    • 客户规模<50人、用量波动大、没有固定预算:选按量计费
    • 客户规模50-500人、用量稳定、预算固定:选订阅制
    • 客户规模>500人、业务价值容易量化、愿意共享业务数据:选价值计价
  4. 方案沟通:和客户的IT、财务、业务部门沟通,确认计费规则、价值核算方式、SLA。
  5. 试点运行:1-3个月的试点,验证用量、成本、业务价值,调整方案。
  6. 正式上线:签署合同,上线系统,定期复盘ROI。

4.3 系统设计与部署

4.3.1 环境安装

我们的计费引擎支持Docker一键部署:

# 拉取镜像
docker pull agentflow/billing-engine:v1.0
# 启动服务,依赖PostgreSQL存储数据
docker run -d \
  -p 8000:8000 \
  -e DB_HOST=your_db_host \
  -e DB_PORT=5432 \
  -e DB_USER=billing \
  -e DB_PASSWORD=your_password \
  -e DB_NAME=billing \
  --name billing-engine \
  agentflow/billing-engine:v1.0
# 验证服务
curl http://localhost:8000/health
# 输出 {"status": "ok"}
4.3.2 系统架构设计

前端层

API网关层

服务层

数据层

第三方集成层

管理后台

客户自助 portal

认证授权

流量控制

日志审计

任务采集服务

计费规则引擎服务

结算服务

报表服务

用户管理服务

时序数据库:存任务数据(InfluxDB)

关系数据库:存用户、账单、规则数据(PostgreSQL)

缓存:存热点规则、用户额度(Redis)

LLM供应商

支付渠道

客户业务系统

第三方审计系统

4.3.3 核心接口设计
  1. 任务上报接口
POST /api/v1/task/report
Content-Type: application/json
{
  "task_id": "string",
  "user_id": "string",
  "agent_id": "string",
  "task_type": "simple_qa/complex_reasoning/tool_call",
  "input_tokens": 0,
  "output_tokens": 0,
  "gpu_time_ms": 0,
  "storage_size_kb": 0,
  "tool_call_count": 0,
  "business_value": 0.0
}
Response:
{
  "code": 0,
  "message": "success",
  "data": {
    "record_id": "string",
    "amount": 0.0
  }
}
  1. 账单查询接口
GET /api/v1/bill/monthly?user_id=xxx&month=2024-06
Response:
{
  "code": 0,
  "message": "success",
  "data": {
    "total_amount": 0.0,
    "detail": [],
    "invoice_url": "string"
  }
}

4.4 最佳实践Tips

  1. 永远提供三种计费模式选择,不要只提供一种,覆盖所有客户群体。
  2. 按量计费的价格要公开透明,官网列出所有资源的单价,不要有隐藏费用。
  3. 订阅制的档位设计遵循帕累托法则,80%的客户用基础版和专业版,20%的客户用企业版贡献80%的收入。
  4. 价值计价的分成比例根据行业利润率调整,电商1%-3%,金融5%-10%,医疗8%-15%。
  5. 所有计费数据保存至少3年,符合审计要求。
  6. 提供详细的消费明细,客户可以看到每个任务、每个Agent的消费情况,方便成本分摊。
  7. 给客户提供成本优化工具,自动推荐更便宜的模型、低谷期调度,降低客户成本。
  8. 建立计费争议处理机制,24小时响应,72小时解决,多收的费用双倍返还。
  9. 混合模式是最优解:基础功能订阅,超额部分按量,增量价值分成。
  10. 新用户注册送100元代金券,降低准入门槛。

五、未来展望:行业发展趋势

5.1 行业发展历史与趋势

年份 行业阶段 主流计费模式 全球市场规模 核心特征
2022 概念萌芽期 无商业化,企业自研 <1亿美元 Agent是实验项目,Harness是附属模块
2023 产品探索期 按量计费 12亿美元 Harness独立成产品,服务开发者
2024 企业普及期 订阅+按量混合 110亿美元 企业级客户成为主力,订阅制主流
2025 垂直深耕期 价值+订阅混合 580亿美元 垂直行业
Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐