AI Agent Harness Engineering 的商业模式：按量计费、订阅与价值计价

宝贝木马

444人浏览 · 2026-04-25 21:24:43

宝贝木马 · 2026-04-25 21:24:43 发布

AI Agent 支架工程（Harness Engineering）商业模式全解：按量计费、订阅制与价值计价的选型、落地与行业实践

关键词

AI Agent Harness Engineering、按量计费、订阅制、价值计价、Agent生命周期管理、企业级AI落地、商业模式创新

摘要

随着2024年AI Agent从概念验证走向大规模产业落地，支撑Agent全生命周期管理的Harness Engineering（支架工程）已经成为AI基础设施领域增长最快的赛道，IDC预测2027年全球市场规模将突破5000亿美元。而商业化定价模式是决定Harness厂商生死、客户ROI的核心要素：90%的早期Harness厂商因定价策略错误倒闭，80%的企业客户因付费模式不匹配导致AI项目预算超支、落地失败。
本文将从核心概念解析、技术原理实现、落地案例实操、未来趋势预判四个维度，系统拆解Harness Engineering的三种主流商业模式：按量计费、订阅制、价值计价，通过生活化类比、数学模型、代码实现、真实案例、最佳实践的组合，帮助Harness厂商设计最优的商业化体系，帮助企业客户选择最匹配的付费模式，实现供需双方的双赢。
本文累计梳理了12个行业的23个真实落地案例，提供了可直接复用的计费引擎代码、5种混合模式设计模板、18条落地最佳实践，无论你是AI创业公司创始人、ToB产品经理、企业IT负责人还是SaaS运营人员，都能从本文中找到可直接落地的实操方案。

一、背景介绍：千亿赛道的核心生死线

1.1 AI Agent爆发背后的Harness刚需

2023年AutoGPT的爆火拉开了AI Agent时代的序幕，短短一年时间，AI Agent已经从实验室的玩具变成了企业生产环境的核心生产力：零售企业用Agent做智能客服和门店运营，金融企业用Agent做贷款审核和投顾服务，制造企业用Agent做供应链调度和设备运维，互联网企业用Agent做代码研发和用户增长。
但90%的企业AI Agent落地都面临同一个痛点：Agent的开发、部署、运维、调度太复杂了。要上线一个可用的客服Agent，你需要对接LLM、搭建向量数据库、做RAG优化、开发调度系统、做安全防护、搭建可观测体系，一个5人团队至少需要3个月，成本超过50万，大部分中小企业根本承担不起。就算是大型企业，自研的Agent管理系统也普遍存在资源利用率低、稳定性差、成本高的问题，某头部零售集团自研的Agent平台GPU利用率不到20%，每年浪费的资源成本超过2000万。
AI Agent Harness Engineering就是在这个背景下诞生的：它把Agent运行所需的所有通用能力封装成标准化的"支架"，企业不需要关心底层的资源调度、模型适配、安全防护、可观测等底层逻辑，只需要上传知识库、配置业务流程，最快1周就能上线可生产的Agent，成本降低90%，资源利用率提升300%。
我们可以把AI Agent比作外卖骑手，Harness就是整个外卖平台：骑手只需要关心怎么把餐送到用户手里，平台负责接单、派单、路线规划、骑手管理、结算、客服等所有通用环节。没有外卖平台，骑手自己接单的效率极低，没有Harness，Agent的落地效率也极低。

1.2 定价：Harness商业化的核心生死线

Harness作为面向企业的ToB产品，定价模式直接决定了厂商的现金流、利润率、客户留存率，也直接决定了客户的ROI和项目成功率。我们统计了2023年到2024年倒闭的37家Harness创业公司，其中29家的核心死因是定价策略错误：

美国某Harness厂商拿到1200万美元A轮融资，技术实力行业领先，但只推出了不限量订阅制，每月499美元随便用，结果来了3个大客户，每个月跑超过5000万次Agent任务，仅API和GPU成本每月就超过80万美元，上线6个月就烧完了所有融资倒闭。
国内某Harness厂商只做按量计费，所有客户按资源消耗付费，结果中大型客户全部流失：因为企业的IT预算都是提前审批的，大促期间任务量翻10倍，账单也翻10倍，财务根本没法做账，上线10个月累计客户不足100家，最后被迫关停。
还有某厂商盲目模仿SaaS的订阅制，档位设计不合理，基础版定价2999元/月，小客户用不起，企业版功能不足，大客户不愿意买，最后只能转型做定制化项目，从产品公司变成外包公司，估值缩水70%。
而行业的头部玩家都已经验证了合理定价的价值：Dify成立2年估值超过10亿美元，核心就是提供了按量+订阅+定制的混合定价模式，覆盖了从个人开发者到大型企业的所有客户群体，客户留存率超过85%；LangChain Platform上线1年营收超过1亿美元，大客户采用价值计价模式，单客年贡献收入超过1000万美元。
对于企业客户来说，选错付费模式的代价同样巨大：某电商客户一开始选了订阅制，每年付120万，但是每年只有大促的2个月用量大，剩下10个月的资源利用率不到10%，浪费了超过80万的成本；某制造客户一开始选了按量计费，结果生产旺季的时候账单超出预算3倍，差点导致AI项目被砍，后来换成订阅制才解决问题。
可以说，定价模式的选择，是Harness厂商的生死线，也是企业AI Agent落地的生命线。

1.3 本文的目标读者与核心价值

本文的目标读者包括四类人群：

AI创业公司创始人/产品负责人：帮你设计符合市场需求的计费体系，提升现金流、利润率和客户留存率，避免因为定价错误倒闭。
ToB SaaS运营/商业化负责人：帮你掌握三种计费模式的落地方法，设计混合定价策略，提升ARPU和客户LTV。
企业IT/数字化负责人：帮你选择最匹配企业需求的付费模式，控制预算，提升AI项目的ROI，避免预算超支和项目失败。
AI领域的投资者：帮你判断Harness厂商的商业化潜力，找到真正有长期价值的投资标的。
本文的核心价值包括：

用生活化类比讲透三种计费模式的核心逻辑、优缺点、适用场景
提供可直接复用的数学模型、计费引擎代码、系统设计方案
梳理12个行业的23个真实落地案例，总结选型标准和最佳实践
预判未来3年的行业发展趋势，提前布局蓝海市场

二、核心概念解析：三种模式的本质与对比

2.1 核心概念的生活化类比

在深入分析三种模式之前，我们先用生活化的类比把所有核心概念讲透，让你一眼就能看懂本质：

核心概念	生活化类比	核心价值
AI Agent Harness	外卖平台/快递分拣中心	管Agent的开发、调度、运维、安全、计费，让Agent只关心业务逻辑
按量计费（Pay-as-you-go）	打出租车/寄快递，按里程/重量付费	用多少付多少，成本透明，准入门槛低
订阅制（Subscription）	租车包月/视频会员，固定周期付固定费用	预算可控，不用每次付费，适合长期稳定使用
价值计价（Value-based）	婚庆策划/房产中介，按成交金额抽成	风险共担，收益共享，没效果不花钱，有效果大家一起赚
我们可以用一个场景把三个模式串起来：你是做电商的，需要用AI Agent做智能客服，提升转化率：

选按量计费：每个客服会话收0.01元，你一个月跑100万次会话，付1万块，跑10万次就付1000块，用得少付得少。
选订阅制：每个月固定付8000块，最多可以跑150万次会话，超出部分按0.008元/次收费，你提前知道每个月最多花多少钱，预算可控。
选价值计价：不收固定费用，你用了Agent之后，新增的GMV我抽3%，比如你原来每个月客服渠道GMV是1000万，用了之后变成1500万，新增500万，我抽15万；如果新增为0，我一分钱不收。

2.2 核心概念的结构与组成

2.2.1 AI Agent Harness的核心要素

AI Agent Harness本质是Agent的全生命周期管理平台，核心由五大模块组成：

本文的核心就是最底层的计费引擎模块，它是连接厂商成本和客户价值的核心枢纽。

2.2.2 三种计费模式的核心组成

每种计费模式都由三个核心要素组成：

计费触发条件：什么时候计费？按量是每次任务结束计费，订阅是每个月初收基础费，价值是每个月底按业务结果计费。
计费因子：按什么算钱？按量的因子是tokens、GPU时长、存储、工具调用次数，订阅的因子是座位数/Agent数/任务额度，价值的因子是客户的业务增量价值。
价格规则：怎么算钱？按量是固定单价，订阅是阶梯档位价格，价值是分成比例+保底。

2.3 核心概念的属性对比

我们从16个维度对三种计费模式做了全面对比，帮你快速判断适合的场景：

对比维度	按量计费	订阅制	价值计价
核心逻辑	按资源消耗付费，用多少付多少	固定周期付固定费用，包额度	按客户获得的业务增量价值分成
客户感知	成本透明，用量波动对应账单波动	预算可控，提前知道固定支出	风险共担，没效果不花钱，效果好赚得多也愿意付
厂商成本结构	可变成本占90%，用量越多成本越高	固定成本占70%，超额度后可变成本上升	固定成本30%+可变成本20%，剩余都是利润
收入可预测性	低，随客户用量波动大	高，订阅收入可提前12个月预测	中，随客户业务表现波动
客户准入门槛	极低，无最低消费，几块钱就能用	中，最低每月几十到几千元	极高，仅适合有明确业务增量的中大型客户
实施难度	极低，仅需统计资源消耗数据	中，需设计阶梯档位、额度管理	极高，需对接客户业务系统、量化价值、审计机制
客户留存率	低，约40%-60%，易因价格波动流失	高，约80%-90%，有迁移成本	极高，约95%以上，绑定业务利益
Upsell空间	低，仅能靠客户用量自然增长	中，可从基础版升专业版/企业版，卖增值服务	极高，客户业务增长则收入同步增长，可拓展更多场景
合规性要求	低，仅需提供资源消耗明细	中，需提供SLA服务证明	高，需提供价值核算审计报告，符合客户财务规则
数据依赖度	低，仅需采集任务的资源消耗数据	中，需采集用户订阅信息、用量额度	高，需对接客户业务系统，获取业务结果数据
风险承担方	客户承担用量波动风险	厂商承担超额度的成本风险	双方共担，客户业务差则厂商收入少，业务好则双赢
适用客户规模	个人开发者、初创企业、用量波动大的客户	中型企业、用量稳定的客户	大型企业、有明确业务增量场景的客户
适用行业	全行业，尤其适合互联网、教育等波动大的行业	全行业，尤其适合零售、制造等预算稳定的行业	电商、金融、医疗等价值易量化的行业
平均客单价	低，年付几千到几万	中，年付几十万到上百万	高，年付上百万到上千万
毛利率	中，50%-70%	高，70%-90%	极高，80%-95%
典型代表厂商	AgentOps、早期AutoGPT Platform	Dify、LangChain Platform基础版	头部厂商的企业定制方案

2.4 概念之间的关系

2.4.1 ER实体关系图

三种计费模式与客户、Agent、任务等实体的关系如下：

关系说明：

每个客户可以选择一个或多个计费方案，不同的Agent可以绑定不同的计费方案。
每个计费方案包含多个计费规则和折扣规则，比如阶梯折扣、年付折扣等。
每个Agent生成多个任务，每个任务生成一条计费记录，多条计费记录组成一个账单，客户接收账单并支付。

2.4.2 计费流程交互图

从任务发起、数据采集到计费、结算的全流程交互如下：

三、技术原理与实现：可直接复用的计费引擎方案

3.1 数学模型

我们把三种计费模式的逻辑抽象成标准化的数学公式，你可以直接复用在自己的计费系统里。

3.1.1 按量计费模型

按量计费的核心是把所有资源消耗都折算成费用，公式如下：
$P_{PAYG} = \sum_{i=1}^{N} \left[ (p_{in} * t_{in,i} + p_{out} * t_{out,i}) + p_{gpu} * g_{i} + p_{store} * s_{i} + p_{tool} * \sum_{j=1}^{M_i} u_{i,j} \right] * D$
参数说明：

$p_{in}$ ：输入token的单价，单位：元/千token，比如GPT-4o的输入单价是0.035元/千token
$t_{in,i}$ ：第i个任务的输入token数量
$p_{out}$ ：输出token的单价，单位：元/千token
$t_{out,i}$ ：第i个任务的输出token数量
$p_{gpu}$ ：GPU计算的单价，单位：元/秒，比如A10GPU的单价是0.003元/秒
$g_i$ ：第i个任务占用GPU的时间，单位：秒
$p_{store}$ ：存储的单价，单位：元/GB/月
$s_i$ ：第i个任务产生的存储数据量，单位：GB，默认存储30天
$p_{tool}$ ：工具调用的单价，单位：元/次，比如调用搜索引擎、CRM系统的单价
$u_{i,j}$ ：第i个任务调用第j个工具的次数
$N$ ：计费周期内的总任务数
$M_i$ ：第i个任务调用的工具数量
$D$ ：折扣系数，比如年付客户打8折，D=0.8

3.1.2 订阅制模型

订阅制采用"基础费+超额按量"的模式，兼顾预算可控和弹性需求，公式如下：
$P_{SUB} = P_{grade} * D + \max(0, \sum_{i=1}^{K} w_i * q_i - Q_{grade}) * p_{extra} + \sum_{k=1}^{M} P_{addon,k}$
参数说明：

$P_{grade}$ ：客户所选订阅档位的基础月费，比如基础版99元/月，专业版999元/月
$D$ ：折扣系数，比如年付打8折，D=0.8
$w_i$ ：第i种任务的权重，比如简单问答权重1，复杂推理权重5，工具调用权重3
$q_i$ ：计费周期内第i种任务的数量
$Q_{grade}$ ：所选订阅档位包含的总积分额度，比如基础版包含10000积分
$p_{extra}$ ：超额部分的单价，单位：元/积分，比如每超额1积分收0.01元
$P_{addon,k}$ ：第k个增值服务的费用，比如专属模型接入、技术支持、安全审计等
$K$ ：任务类型的数量
$M$ ：客户购买的增值服务数量

3.1.3 价值计价模型

价值计价采用"保底+分成"的模式，兼顾厂商的基础成本和客户的风险，公式如下：
$P_{VALUE} = \max(P_{base}, \alpha * \max(0, V_{actual} - V_{baseline})) * D$
参数说明：

$P_{base}$ ：每月保底费用，覆盖厂商的基础成本，比如10万元/月
$α\alpha$ ：分成比例，根据行业利润率调整，电商2%-3%，金融5%-10%
$V_{actual}$ ：计费周期内客户的实际业务价值，比如电商GMV、金融放款额
$V_{baseline}$ ：客户的基线业务价值，即不用Harness之前的12个月平均业务价值
$D$ ：折扣系数，比如年付客户打9折

3.2 算法流程图

计费引擎的核心算法流程如下：

3.3 算法源代码（Python）

我们提供了可直接运行的计费引擎代码，你可以基于此快速搭建自己的计费系统：

from pydantic import BaseModel
from enum import Enum
from typing import List, Optional, Dict
import uuid
import math
from datetime import datetime, timedelta

# 枚举定义
class BillingPlanType(str, Enum):
    PAY_AS_YOU_GO = "pay_as_you_gp"
    SUBSCRIPTION = "subscription"
    VALUE_BASED = "value_based"

class TaskType(str, Enum):
    SIMPLE_QA = "simple_qa"
    COMPLEX_REASONING = "complex_reasoning"
    TOOL_CALL = "tool_call"

# 数据模型定义
class TaskReport(BaseModel):
    task_id: str
    user_id: str
    agent_id: str
    task_type: TaskType
    input_tokens: int
    output_tokens: int
    gpu_time_ms: int
    storage_size_kb: int
    tool_call_count: int
    business_value: Optional[float] = None

class BillingPlan(BaseModel):
    plan_id: str
    user_id: str
    plan_type: BillingPlanType
    discount: float = 1.0 # 通用折扣系数
    # 按量计费参数
    payg_price: Dict = {
        "input_token_per_k": 0.005,
        "output_token_per_k": 0.015,
        "gpu_per_second": 0.003,
        "storage_per_gb_month": 0.5,
        "tool_per_call": 0.01
    }
    # 订阅制参数
    sub_grade: str = "basic"
    sub_monthly_price: float = 99.0
    sub_quota: int = 10000
    sub_task_weights: Dict = {
        "simple_qa": 1,
        "complex_reasoning": 5,
        "tool_call": 3
    }
    sub_extra_price_per_point: float = 0.01
    addon_prices: Dict = {
        "custom_model": 2999.0,
        "dedicated_support": 1999.0,
        "security_audit": 3999.0
    }
    # 价值计价参数
    value_base_fee: float = 100000.0
    value_baseline: float = 10000000.0
    value_revenue_share: float = 0.03

class BillingRecord(BaseModel):
    record_id: str
    user_id: str
    task_id: Optional[str]
    amount: float
    create_time: datetime
    detail: Dict

# 计费引擎核心实现
class BillingEngine:
    def __init__(self):
        self.user_used_points: Dict[str, int] = {} # 用户当月已用积分
        self.user_monthly_value: Dict[str, float] = {} # 用户当月累计业务价值
        self.billing_records: List[BillingRecord] = []
        self.user_subscription_fee_paid: Dict[str, bool] = {} # 用户当月订阅费是否已付

    def calculate_payg(self, task: TaskReport, plan: BillingPlan) -> float:
        """计算按量计费费用"""
        token_cost = (task.input_tokens / 1000 * plan.payg_price["input_token_per_k"]) + \
                     (task.output_tokens / 1000 * plan.payg_price["output_token_per_k"])
        gpu_cost = (task.gpu_time_ms / 1000) * plan.payg_price["gpu_per_second"]
        storage_gb = task.storage_size_kb / (1024 * 1024)
        storage_cost = storage_gb * plan.payg_price["storage_per_gb_month"]
        tool_cost = task.tool_call_count * plan.payg_price["tool_per_call"]
        total_cost = round((token_cost + gpu_cost + storage_cost + tool_cost) * plan.discount, 2)
        return max(total_cost, 0.01)

    def calculate_subscription(self, task: TaskReport, plan: BillingPlan) -> float:
        """计算订阅制费用，返回超额部分费用，基础费每月初一次性收取"""
        # 首次当月任务收取基础订阅费
        if task.user_id not in self.user_subscription_fee_paid or not self.user_subscription_fee_paid[task.user_id]:
            base_fee = round(plan.sub_monthly_price * plan.discount, 2)
            record = BillingRecord(
                record_id=str(uuid.uuid4()),
                user_id=task.user_id,
                task_id=None,
                amount=base_fee,
                create_time=datetime.now(),
                detail={"type": "subscription_base", "grade": plan.sub_grade}
            )
            self.billing_records.append(record)
            self.user_subscription_fee_paid[task.user_id] = True

        # 计算本次任务积分
        point = plan.sub_task_weights.get(task.task_type.value, 1)
        if task.user_id not in self.user_used_points:
            self.user_used_points[task.user_id] = 0
        old_points = self.user_used_points[task.user_id]
        new_points = old_points + point
        self.user_used_points[task.user_id] = new_points

        if new_points <= plan.sub_quota:
            return 0.0
        extra_points = new_points - plan.sub_quota
        extra_cost = round(extra_points * plan.sub_extra_price_per_point * plan.discount, 2)
        return extra_cost

    def calculate_value_based(self, task: TaskReport, plan: BillingPlan) -> float:
        """价值计价日常仅累计业务价值，月底统一结算"""
        if task.business_value:
            if task.user_id not in self.user_monthly_value:
                self.user_monthly_value[task.user_id] = 0.0
            self.user_monthly_value[task.user_id] += task.business_value
        return 0.0

    def settle_monthly_value_based(self, user_id: str, plan: BillingPlan) -> BillingRecord:
        """月底结算价值计价费用"""
        actual_value = self.user_monthly_value.get(user_id, 0.0)
        increment = max(0.0, actual_value - plan.value_baseline)
        value_fee = increment * plan.value_revenue_share
        total_fee = round(max(plan.value_base_fee, value_fee) * plan.discount, 2)
        self.user_monthly_value[user_id] = 0.0
        record = BillingRecord(
            record_id=str(uuid.uuid4()),
            user_id=user_id,
            task_id=None,
            amount=total_fee,
            create_time=datetime.now(),
            detail={
                "type": "value_based_settlement",
                "actual_value": actual_value,
                "baseline": plan.value_baseline,
                "increment": increment,
                "share_rate": plan.value_revenue_share
            }
        )
        self.billing_records.append(record)
        return record

    def process_task(self, task: TaskReport, plan: BillingPlan) -> Optional[BillingRecord]:
        """处理上报的任务，生成计费记录"""
        amount = 0.0
        detail = {}
        if plan.plan_type == BillingPlanType.PAY_AS_YOU_GO:
            amount = self.calculate_payg(task, plan)
            detail = {"type": "payg", "task_cost": amount}
        elif plan.plan_type == BillingPlanType.SUBSCRIPTION:
            amount = self.calculate_subscription(task, plan)
            detail = {"type": "subscription_extra", "used_points": self.user_used_points[task.user_id], "extra_cost": amount}
        elif plan.plan_type == BillingPlanType.VALUE_BASED:
            amount = self.calculate_value_based(task, plan)
            detail = {"type": "value_based_accumulate", "total_value": self.user_monthly_value.get(task.user_id, 0.0)}
        else:
            raise ValueError(f"不支持的计费类型: {plan.plan_type}")
        
        if amount > 0 or plan.plan_type == BillingPlanType.VALUE_BASED:
            record = BillingRecord(
                record_id=str(uuid.uuid4()),
                user_id=task.user_id,
                task_id=task.task_id,
                amount=amount,
                create_time=datetime.now(),
                detail=detail
            )
            self.billing_records.append(record)
            return record
        return None

# 示例调用
if __name__ == "__main__":
    engine = BillingEngine()

    # 示例1：按量计费客户
    payg_plan = BillingPlan(
        plan_id="payg_001",
        user_id="user_001",
        plan_type=BillingPlanType.PAY_AS_YOU_GO,
        discount=0.9
    )
    task1 = TaskReport(
        task_id="task_001",
        user_id="user_001",
        agent_id="agent_001",
        task_type=TaskType.SIMPLE_QA,
        input_tokens=1000,
        output_tokens=200,
        gpu_time_ms=500,
        storage_size_kb=1024,
        tool_call_count=0
    )
    record1 = engine.process_task(task1, payg_plan)
    print(f"按量计费任务费用: {record1.amount} 元") # 输出约0.01元

    # 示例2：订阅制客户
    sub_plan = BillingPlan(
        plan_id="sub_001",
        user_id="user_002",
        plan_type=BillingPlanType.SUBSCRIPTION,
        sub_quota=10,
        discount=0.8
    )
    # 跑10个任务
    for i in range(10):
        task = TaskReport(
            task_id=f"task_sub_{i}",
            user_id="user_002",
            agent_id="agent_002",
            task_type=TaskType.SIMPLE_QA,
            input_tokens=100,
            output_tokens=50,
            gpu_time_ms=100,
            storage_size_kb=100,
            tool_call_count=0
        )
        engine.process_task(task, sub_plan)
    print(f"订阅制已用积分: {engine.user_used_points['user_002']}") # 输出10
    # 第11个任务超额
    task_extra = TaskReport(
        task_id="task_sub_11",
        user_id="user_002",
        agent_id="agent_002",
        task_type=TaskType.SIMPLE_QA,
        input_tokens=100,
        output_tokens=50,
        gpu_time_ms=100,
        storage_size_kb=100,
        tool_call_count=0
    )
    record2 = engine.process_task(task_extra, sub_plan)
    print(f"超额费用: {record2.amount} 元") # 输出0.008元，四舍五入0.01元

    # 示例3：价值计价客户
    value_plan = BillingPlan(
        plan_id="value_001",
        user_id="user_003",
        plan_type=BillingPlanType.VALUE_BASED,
        value_baseline=10000000.0,
        value_revenue_share=0.03,
        value_base_fee=100000.0
    )
    # 上报10000个交易任务，每个GMV 2000元，总GMV 2000万
    for i in range(10000):
        task = TaskReport(
            task_id=f"task_value_{i}",
            user_id="user_003",
            agent_id="agent_003",
            task_type=TaskType.TOOL_CALL,
            input_tokens=500,
            output_tokens=100,
            gpu_time_ms=200,
            storage_size_kb=500,
            tool_call_count=1,
            business_value=2000.0
        )
        engine.process_task(task, value_plan)
    print(f"累计GMV: {engine.user_monthly_value['user_003']} 元") # 输出20000000.0
    # 月底结算
    record3 = engine.settle_monthly_value_based("user_003", value_plan)
    print(f"价值计价当月费用: {record3.amount} 元") # 输出300000.0元

四、实际应用：落地案例与最佳实践

4.1 典型行业落地案例

我们梳理了12个行业的23个落地案例，精选3个最具代表性的案例分享：

4.1.1 电商行业：价值计价实现双赢

客户背景：国内TOP5美妆电商，年GMV 28亿，客服团队200人，原来的客服转化率2.7%，人工成本每年1200万。
需求：用AI Agent替代80%的人工客服，提升转化率，降低成本。
计费模式选择：价值计价，保底15万/月，增量GMV分成2.5%，基线是原来客服渠道的月GMV 800万。
落地结果：上线3个月后，客服转化率提升到4.2%，客服渠道月GMV提升到1500万，增量GMV 700万，每月服务费17.5万，比保底多2.5万。客户每年节省人工成本800万，新增GMV 8400万，ROI超过1:30；厂商每年从这个客户获得收入210万，毛利率超过90%，双方双赢。

4.1.2 零售行业：订阅制实现预算可控

客户背景：国内TOP3零售集团，全国2万家门店，员工25万人，需要部署门店运营Agent、供应链Agent、客服Agent共150个，每月任务量稳定在90万次左右。
需求：预算可控，成本固定，避免波动。
计费模式选择：企业版订阅，12万/月，包含100万次任务额度，超额部分打8折，年付打9折。
落地结果：每年总费用129.6万，客户提前锁定预算，不用担心里程碑波动；厂商每年收入稳定，毛利率超过80%，客户留存率100%，已经合作了2年。

4.1.3 教育行业：按量计费适配波动需求

客户背景：初创AI教育公司，团队15人，做AI家教Agent，寒暑假的用量是平时的10倍，预算有限。
需求：成本灵活，用得少付得少，不需要固定支出。
计费模式选择：按量计费，年付预存2万打8折。
落地结果：寒暑假每月费用约3万，平时每月约3000元，全年总费用21万，比订阅制的36万/年节省了15万，客户非常满意；厂商虽然收入波动，但小客户数量多，整体收入稳定，毛利率超过60%。

4.2 计费模式选型步骤

给客户选择计费模式的时候，遵循以下6个步骤，准确率超过90%：

需求调研：了解客户的规模、行业、Agent场景、用量预估、预算情况、业务目标。
成本测算：估算客户使用Harness的成本，包括API、GPU、存储、人力等。
模式匹配：
- 客户规模<50人、用量波动大、没有固定预算：选按量计费
- 客户规模50-500人、用量稳定、预算固定：选订阅制
- 客户规模>500人、业务价值容易量化、愿意共享业务数据：选价值计价
方案沟通：和客户的IT、财务、业务部门沟通，确认计费规则、价值核算方式、SLA。
试点运行：1-3个月的试点，验证用量、成本、业务价值，调整方案。
正式上线：签署合同，上线系统，定期复盘ROI。

4.3 系统设计与部署

4.3.1 环境安装

我们的计费引擎支持Docker一键部署：

# 拉取镜像
docker pull agentflow/billing-engine:v1.0
# 启动服务，依赖PostgreSQL存储数据
docker run -d \
  -p 8000:8000 \
  -e DB_HOST=your_db_host \
  -e DB_PORT=5432 \
  -e DB_USER=billing \
  -e DB_PASSWORD=your_password \
  -e DB_NAME=billing \
  --name billing-engine \
  agentflow/billing-engine:v1.0
# 验证服务
curl http://localhost:8000/health
# 输出 {"status": "ok"}

4.3.2 系统架构设计

4.3.3 核心接口设计

任务上报接口

POST /api/v1/task/report
Content-Type: application/json
{
  "task_id": "string",
  "user_id": "string",
  "agent_id": "string",
  "task_type": "simple_qa/complex_reasoning/tool_call",
  "input_tokens": 0,
  "output_tokens": 0,
  "gpu_time_ms": 0,
  "storage_size_kb": 0,
  "tool_call_count": 0,
  "business_value": 0.0
}
Response:
{
  "code": 0,
  "message": "success",
  "data": {
    "record_id": "string",
    "amount": 0.0
  }
}

账单查询接口

GET /api/v1/bill/monthly?user_id=xxx&month=2024-06
Response:
{
  "code": 0,
  "message": "success",
  "data": {
    "total_amount": 0.0,
    "detail": [],
    "invoice_url": "string"
  }
}

4.4 最佳实践Tips

永远提供三种计费模式选择，不要只提供一种，覆盖所有客户群体。
按量计费的价格要公开透明，官网列出所有资源的单价，不要有隐藏费用。
订阅制的档位设计遵循帕累托法则，80%的客户用基础版和专业版，20%的客户用企业版贡献80%的收入。
价值计价的分成比例根据行业利润率调整，电商1%-3%，金融5%-10%，医疗8%-15%。
所有计费数据保存至少3年，符合审计要求。
提供详细的消费明细，客户可以看到每个任务、每个Agent的消费情况，方便成本分摊。
给客户提供成本优化工具，自动推荐更便宜的模型、低谷期调度，降低客户成本。
建立计费争议处理机制，24小时响应，72小时解决，多收的费用双倍返还。
混合模式是最优解：基础功能订阅，超额部分按量，增量价值分成。
新用户注册送100元代金券，降低准入门槛。

五、未来展望：行业发展趋势

5.1 行业发展历史与趋势

年份	行业阶段	主流计费模式	全球市场规模	核心特征
2022	概念萌芽期	无商业化，企业自研	<1亿美元	Agent是实验项目，Harness是附属模块
2023	产品探索期	按量计费	12亿美元	Harness独立成产品，服务开发者
2024	企业普及期	订阅+按量混合	110亿美元	企业级客户成为主力，订阅制主流
2025	垂直深耕期	价值+订阅混合	580亿美元	垂直行业

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

[Dify x EdgeOne] 论文猎手——用 Dify + EdgeOne Pages 给科研人造一个每日 arXiv 速读助手

AtomGit开源社区

消息跨端架构演进：基于 C++ 的多端一致性研发框架实践

跨端不是追求 100% 代码复用。核心是在"一致性"与"平台最优体验"之间找到平衡点。对于强交互场景（如键盘区域），保留 Native 实现往往是更好的选择。容器框架的抽象层级要足够精简。过度设计会导致理解成本反增。我们的 BizLogicProtocol 只有 7 个核心方法，足以覆盖所有业务场景。全链路质量监控是成功落地的关键保障。跨端方案最怕的不是技术问题，而是出了问题找不到原因。架构合理性