Claude Fable 5 深度解读:$10/$50 定价、SWE-Bench Pro 80.3%、与 Opus 4.8 的成本对比
Anthropic 在 2026 年 6 月 9 日发布 Claude Fable 5——首个正式开放(GA)的 Mythos 级模型,输入 $10/百万 token、输出 $50/百万 token,价格正好是 Claude Opus 4.8 的 2 倍。本文基于 Anthropic 官方公告、API 文档、定价页、迁移指南以及 AWS 发布博客整理,数据核验时间 2026 年 6 月 10 日。
先给结论:Fable 5 是给"Opus 4.8 做不动的那 10-20% 高难任务"准备的专用顶配,不是全量替换。 按解题成本算,常规任务上 Opus 4.8 更便宜,前沿难度任务上 Fable 5 反而是最便宜的。
一、这次发布的是"一个模型、两个名字"
Fable 5 和 Mythos 5 是同一个底层模型,唯一区别是安全分类器:
| 模型 | API ID | 谁能用 | 区别 |
|---|---|---|---|
| Claude Fable 5 | claude-fable-5 | 所有人,GA | 分类器开启;高风险请求回落到 Opus 4.8 回答 |
| Claude Mythos 5 | claude-mythos-5 | 仅 Project Glasswing 认证伙伴 | 同一模型,网络安全限制解除,价格同为 $10/$50 |
| Claude Mythos Preview | claude-mythos-preview | 2026 年 4 月起邀请制 | 研究预览版,即将退役;官方称 Fable 5 价格"不到它的一半" |
一个数字解释这个双模型策略:ExploitBench(漏洞利用开发基准)上 Mythos 5 拿 78%,Opus 4.8 只有 40%。公开版主动路由掉的能力,正是认证版专门提供给防御方的能力。
二、定价:每一项费率都是 Opus 4.8 的 2.0 倍
缓存和批量费率首日同步公布,没有出现很多团队预期的"首日费率缺口":
| 费率项 | Fable 5 | Opus 4.8 | 倍数 |
|---|---|---|---|
| 基础输入 | $10.00 | $5.00 | 2.0× |
| 5 分钟缓存写入 | $12.50 | $6.25 | 2.0× |
| 1 小时缓存写入 | $20.00 | $10.00 | 2.0× |
| 缓存读取 | $1.00 | $0.50 | 2.0× |
| 输出 | $50.00 | $25.00 | 2.0× |
| 批量输入(5 折) | $5.00 | $2.50 | 2.0× |
| 批量输出(5 折) | $25.00 | $12.50 | 2.0× |
| 最小可缓存 prompt | 512 token | 1,024 token | Fable 可缓存更短的 prompt |
三个会影响实际账单的细节:
-
无长上下文加价。 官方定价文档原话:"900k token 请求与 9k token 请求按相同单价计费。" 对比 Gemini 3.1 Pro 超过 200K 后输入价直接翻倍($2→$4),Fable 5 在长上下文场景悄悄缩小了差距。
-
分词器是 Opus 4.7 那一代。 同样文本比 4.7 之前的 Claude 模型多产出约 30%(最高 35%)token。跟 Opus 4.8 对比是同口径,跟你历史 Opus 4.5 时代的账单对比不是。
-
没有 fast mode。 而 Opus 4.8 的 fast mode 定价恰好也是 $10/$50——同样的钱,买速度还是买智力,二选一。
三、Benchmark:任务越难,差距越大
全部为 Anthropic 官方发布的 launch eval,独立复测还没出来,建议把"差值"当信号、别把绝对分数当真理:
| 基准 | Fable 5 | Opus 4.8 | GPT-5.5 | Gemini 3.1 Pro |
|---|---|---|---|---|
| SWE-Bench Pro | 80.3% | 69.2% | 58.6% | 54.2% |
| FrontierCode | 29.3% | 13.4% | 5.7% | 未公布 |
SWE-Bench Pro 上领先 11.1 个百分点,有意义但属于渐进式;FrontierCode(生产级长任务)上 29.3% vs 13.4%,完成任务数翻倍还多,这才是卖点。
客户侧数据同方向:Stripe 报告用 Fable 5 一天完成 5000 万行 Ruby 代码库迁移(人工估算约两个月);Davis Polk 律师盲评中每次都选 Fable 的合同修订版本;Anaconda 报告每个 effort 档位都赢 Opus 4.8 且快 25-30%。共 14 家具名客户,全部是厂商口径,未经审计。
四、API 三个破坏性变更(迁移必看)
-
自适应思考永远开启。
thinking: {"type": "disabled"}直接报错。替代杠杆是effort参数:low / medium / high / xhigh / max 五档,默认 high。官方迁移指南明确说:就算你在 Opus 4.8 上跑的是 xhigh,迁过来也先从 high 起步。注意max_tokens现在同时封顶"思考+回复"总量,原来按裸回复设的输出预算会被截断。 -
拒答返回 HTTP 200。 拒答不是错误码,而是正常响应里带
stop_reason: "refusal",stop_details.category标注触发的分类器:"cyber"、"bio"、"reasoning_extraction"或 null。按 HTTP 状态码写的错误处理拦不住它,必须显式检查stop_reason。计费规则:没产出就拒答 = $0;流式中途触发 = 输入 + 已流出的部分照常计费。 -
回落机制有独立账单逻辑。 被分类器标记的请求由 Opus 4.8 回答,按 Opus 价格($5/$25)计费;对话中途触发则前段按 Fable 价、后段按 Opus 价。beta 的
fallbacks参数只在 Claude API 和 Claude Platform on AWS 上做服务端自动重试,Batch API、Bedrock、Vertex、Foundry 上要靠 SDK 中间件(TS/Python/Go/Java/C#)在客户端处理。
原始思维链永远不返回(thinking.display 默认 omitted,可设 summarized);prefill、手动思考预算、采样参数依旧 400,和 4.7/4.8 一致。Claude Code 里有 /claude-api migrate 命令可以自动完成整个代码库的模型替换和参数改造。
五、安全机制与合规代价
官方数据:触发安全分类器的会话不足 5%。但要注意几个实际影响:
-
误伤已经出现。 Hacker News 发布帖里有开发者报告 MRI 脑分割代码、蚊媒疟疾研究都被当成生物风险标记。官方文档对生物领域研究者的措辞很直接:预计几乎所有请求都会回落,后续会开 Biology Trusted Access Program。
-
工作区上下文也能触发。 Claude Code 文档确认:会话第一条请求就可能触发回落,因为它携带 CLAUDE.md、目录名、git status 等上下文——安全工具仓库或生物材料仓库光靠上下文就能踩线。
claude --safe-mode可以剥离自定义内容做诊断。 -
强制 30 天数据保留。 Fable 5 / Mythos 5 被指定为 Covered Model,输入输出强制保留 30 天,零保留(ZDR)协议不适用,没有任何变通。合规上要求 ZDR 的业务(法务、医疗、受监管金融),这个模型直接出局,比价格更硬。
-
越狱测试。 外部漏洞赏金累计 1000+ 小时没产出通用越狱,但官方公告自己承认英国 AI 安全研究所在初测中"取得了接近通用越狱的进展"。
独立批评里最尖锐的来自 Interconnects 的 Nathan Lambert:蒸馏分类器部分通过"prompt 修改、转向向量或参数高效微调"这类不可见手段干预,而非可见拒答。他的原话:"一个会自动变笨且不通知我的 AI 模型,是范畴意义上的未对齐 AI。"
六、值不值 2 倍价:按解题成本算
代表性 agentic 任务(输入 100K + 输出 20K token)单次成本:Fable $2.00、Opus $1.00、GPT-5.5 $1.10。除以各自基准通过率后:
| 难度档 | Fable 5 | Opus 4.8 | GPT-5.5 | 结论 |
|---|---|---|---|---|
| SWE-Bench Pro 档(常规偏难) | $2.49 | $1.45 | $1.88 | Opus 4.8 每解最便宜 |
| FrontierCode 档(前沿难度) | $6.83 | $7.46 | $19.30 | Fable 5 每解最便宜 |
交叉点就是全部决策:常规任务 Opus 解题率够高,2 倍价差守得住;前沿任务 Opus 失败太频繁,重试吃掉省下的钱。按任务难度路由,不要按价格忠诚度路由。
车队规模粗算:每月 5000 万输入 + 1000 万输出 token,Fable 5 月账单 $1,000 vs Opus 4.8 的 $500。一年 $6,000 差价,只有当更高完成率每周帮你省下约一小时工程师复核时间时才回本。
社区实测两边都有:有人报告 Fable 用更少轮次完成任务、diff "更克制更外科手术",甚至有人称 token 用量约一半(如属实,实际成本接近 Opus 持平);也有 Max 订阅用户单日跑出 $82.92 等效 API 用量。方差本身就是结论:先用一周做计量,再决定迁移车队流量。
七、可用性速查
-
Claude API:claude-fable-5,6 月 9 日 GA
-
Amazon Bedrock:anthropic.claude-fable-5(全球端点加 global. 前缀),美东 + 斯德哥尔摩;缓存最小值保持 1,024 token
-
Vertex AI / Microsoft Foundry:claude-fable-5,GA
-
GitHub Copilot:同日 GA
-
Claude Code:
/model fable,要求 v2.1.170+,任何套餐都不是默认模型;ZDR 账户下直接隐藏 -
OpenRouter:anthropic/claude-fable-5,透传 $10/$50
-
Claude.ai 订阅侧:Pro/Max/Team/按席 Enterprise 6 月 9-22 日免费含用,6 月 23 日起改为消耗用量额度
最终建议
把 Fable 5 用在 Opus 4.8 失败率高到让你付重试和复核成本的那 10-20% 前沿难度任务上;其余流量留在 Opus 4.8 和 Sonnet 4.6;ZDR 约束的流量完全别碰它。缓存和批量折扣按精确 2 倍 Opus 费率平移,缓存重的工作负载迁移不会有费率惊喜。官方 benchmark 等独立复测,但解题成本的方向性结论对误差不敏感。
完整英文版(含全部 16 个来源链接、FAQ、可用性矩阵):Claude Fable 5 Review 2026: Pricing, Benchmarks, vs Opus 4.8 - TokenMix Blog
数据来源:Anthropic 官方公告与 API 文档(定价页、迁移指南、模型总览)、AWS News Blog、TechCrunch、The Decoder、CNBC、GitHub Changelog、OpenRouter、Hacker News 发布帖、Interconnects。竞品价格与 OpenAI、Google 官方公示价交叉核对,核验时间 2026-06-10。作者:TokenMix Research Lab(探针),追踪 300+ 大模型定价与 API 可用性。
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐


所有评论(0)