Anthropic 发布 Claude Fable 5 与 Mythos 5:Mythos 级模型首次向公众开放

来源:Anthropic 官方公告  |  日期:2026 年 6 月 9 日  |  原文anthropic.com/news/claude-fable-5-mythos-5

2026 年 6 月 9 日,Anthropic 发布 Claude Fable 5(Mythos 级通用模型)与 Mythos
5(解除限制版),覆盖软件工程、视觉、知识工作、生命科学等领域,均达 SOTA。Fable 5 内置三层安全分类器,敏感请求回退至
Opus 4.8,95% 会话不触发。定价 $10/$50 每百万 token,不到 Mythos Preview 一半。同步推送 Claude Code v2.1.170,首个原生支持 Mythos 级模型的 CLI,并修复 VS Code 集成终端 Transcript 丢失问题。


一、事件概述

2026 年 6 月 9 日,Anthropic 正式发布了两款基于同一基础模型的旗舰产品:

  • Claude Fable 5:面向公众的 Mythos 级通用模型,内置全新的安全分类器体系
  • Claude Mythos 5:卸除安全限制的完整版本,通过 Project Glasswing 向特定合作方开放

Fable 5 是 Anthropic 有史以来向公众开放的能力最强的模型,在软件工程、知识工作、视觉理解、科学研究等几乎所有 AI 基准测试中均达到最优水平。任务越复杂、上下文越长,Fable 5 相较前代模型的领先幅度就越大。

在这里插入图片描述


二、命名由来

“Fable” 源自拉丁语 fabula(“被讲述的故事”),与希腊语 mythos(“神话”)同源。Anthropic 用同一个基础模型,以不同的安全策略区分两个版本:

模型 安全策略 面向用户
Claude Fable 5 完整安全分类器保护,敏感话题自动回退至 Opus 4.8 所有用户
Claude Mythos 5 解除部分/全部安全限制 Glasswing 合作伙伴、受信生物医学研究者

在这里插入图片描述


三、Fable 5 核心能力详解

Fable 5 在多项能力维度上刷新了行业基准,以下按领域逐一展开。

3.1 软件工程

Stripe 在早期测试中报告:Fable 5 将一个 5000 万行 Ruby 代码库的跨模块迁移任务从"全团队两个月"压缩到了"单个模型一天完成"。

在 Cognition 的 FrontierCode 评测(评估模型在高标准生产级代码库中完成复杂编码任务的能力)中,Fable 5 在所有前沿模型中得分最高——即便只使用中等推理投入。

与过往 Claude 模型相比,Fable 5 的单位 token 效率也更高。

在这里插入图片描述
在这里插入图片描述

3.2 知识工作与分析推理

  • Hebbia 金融基准测试(评估高级推理能力):Fable 5 得分为所有模型最高,在文档推理、图表表格解读和问题求解三个子项上均有大幅提升
  • IMC 交易分析评测:Fable 5 几乎在所有维度拿下满分,包括事实检索、概念推理、根因分析和期望值分析

3.3 视觉理解

Fable 5 是当前视觉任务的 SOTA 模型:

  • 可从复杂科学图表中精确提取数值
  • 仅凭截图即可重建 Web 应用源码
  • 无需额外辅助脚手架:此前 Claude 模型需要复杂的外部辅助工具(地图、导航信息等)才能通关《宝可梦 火红》,而 Fable 5 仅靠视觉输入即完成通关

3.4 长上下文记忆与自主规划

Fable 5 在百万级 token 的长时间任务中保持专注,并能利用自主记录来改进输出:

  • 在卡牌游戏 Slay the Spire 测试中,赋予 Fable 5 持久化文件记忆能力后,其表现提升幅度是 Opus 4.8 的三倍;通关最终幕的频率也是 Opus 4.8 的三倍
  • 能够从物理第一性原理出发,自主构建太阳系模拟并预测日食
  • 能够自主游玩工厂建造游戏 Factorio,自行规划并建造自动化工厂
  • 能够设计完整的 3D 可打印 CAD 模型(CAD 编辑器本身也是 Fable 5 编写)
  • 能够用代码创作同步于古典 EDM 节奏的流体模拟动画——Fable 5 从未"听过"音乐,却用代码生成了配乐

四、生命科学研究突破(Mythos 5)

Mythos 5 在药物设计和分子生物学假设领域的表现堪称里程碑。

4.1 蛋白质药物设计

Anthropic 内部蛋白质设计团队使用 Mythos 5 将药物设计流程的多个环节加速约十倍。Mythos 5 在配备蛋白质设计工具和生物信息学工具但无人类辅助的情况下,独自完成了一位科学家通常需要执行的全部任务:

  • 自主选择结合位点
  • 自主选择并运行蛋白质设计工具
  • 在流程中自主恢复错误

对 14 个蛋白质靶点的测试中,9 个靶点产生了具备进一步研究价值的候选药物分子,涵盖免疫检查点、生长因子与受体信号传导、神经退行性疾病、肌肉疾病及高难度结构靶点。

在这里插入图片描述

4.2 分子生物学新假设

Mythos 5 是 Anthropic 首个持续输出新颖且有说服力的科学假设的模型。在盲法头对头比较中,Anthropic 科学家约 80% 的情况下更倾向于 Mythos 的分子生物学假设而非 Opus 级模型的输出。其中一项关于大肠杆菌蛋白新型机制的假设,已被一个独立实验室的研究所验证。

4.3 基因组学原创研究

Mythos 5 在为期超过一周、高度自主的工作中:

  • 收集了跨越 138 个物种、数百万个单细胞数据
  • 设计并训练了一个定制的机器学习模型,用于识别在远缘物种中执行相同功能的细胞
  • 仅凭高层级人类指导,Mythos 5 训练的模型超越了近期发表在《Science》期刊上的模型——尽管参数量仅为后者的 1/100

Anthropic 计划在未来数月内正式发表这些成果。

在这里插入图片描述

4.4 AAV 病毒外壳预测

在 Dyno Therapeutics 开发的未公开候选 AAV(腺相关病毒,基因治疗的关键载体)测试中,Mythos 级模型仅凭生物学推理能力就超越了专门为蛋白质任务训练的"蛋白质语言模型"——Anthropic 并未针对此任务对模型进行任何专门训练。这既证明了 Mythos 级模型在基因治疗研发中的潜力,也揭示了双重用途能力带来的风险。

在这里插入图片描述


五、安全体系:Fable 5 的全新分类器架构

Mythos 级模型的能力已经达到一个临界点:它们在网络安全和生物学领域的技能可能被恶意行为者利用,造成严重伤害。因此,Anthropic 为 Fable 5 构建了一套全新的安全分类器系统。

5.1 工作原理

Fable 5 的安全分类器是独立的 AI 系统,持续检测用户请求中的潜在滥用(包括越狱攻击)。当分类器判断某个请求属于受保护领域时,不会直接拒绝,而是自动切换至 Claude Opus 4.8 来响应——Fable 5 本身不参与回答。

Opus 4.8 本身是高水准模型,用户获得的是"用 Opus 回答"而非"拒绝回答"的体验,相比业界常见的硬拒绝大幅提升了可用性。

初期数据显示:超过 95% 的 Fable 5 会话完全不触发任何回退——在这些会话中,Fable 5 的表现等同于完整版的 Mythos 5。

5.2 覆盖领域

① 网络安全

Mythos 级模型在漏洞发现与利用方面表现出众,同时还具备自主渗透能力(包括侦察、发现、横向移动等多步骤攻击)。Fable 5 的分类器同时覆盖漏洞利用和更广义的攻击性网络任务。

内部评估结果:分类器阻断了 Fable 5 在各项网络评测中的全部进展。外部红队测试超过 1,000 小时未发现通用越狱(universal jailbreak),多家外部红队组织在长时间自主任务中也未能找到通用越狱——尽管英国 AISI 在初步测试中已取得一定进展。

Anthropic 坦承:“完全杜绝通用越狱几乎不可能,但我们的目标是让任何剩余的越狱方法变得足够缓慢和昂贵,以便在规模化使用前发现并阻止。”

外部合作方将 Fable 5 评为所有被测模型中网络攻击防护最坚固的模型——包括对 Opus 4.8 和 Opus 4.7 的对比。无论是单轮有害请求(涉及攻击规划、漏洞开发或防御规避),还是结合 30 种公开越狱技术的攻击变体,Fable 5 零合规

在这里插入图片描述

在这里插入图片描述

② 生物学与化学

出于谨慎考虑,Fable 5 当前对大部分生物学和化学相关请求均回退至 Opus 4.8。Anthropic 坦率承认这属于"过度拦截"——但相比于让危险能力暴露,宁可先行收紧:

我们的优先事项是尽快安全发布 Fable,即便以过于宽泛的防护为代价。

未来数周内,部分生物医学研究者和公司将能通过受信访问计划获取解除生物/化学限制的 Mythos 5。

③ 模型蒸馏

对疑似大规模模型蒸馏(将 Claude 能力提取到竞品模型)的请求,Fable 5 同样回退至 Opus 4.8。这是 Anthropic 针对"威权国家试图通过蒸馏获取前沿 AI 能力"这一现实威胁的应对措施。

5.3 对齐评估

在自动化对齐评估中,Mythos 5 的不一致行为程度较低(包括欺骗行为、配合用户滥用等),与 Opus 4.8 处于同等水平。完整的安全与能力测试详见 Fable 5 & Mythos 5 System Card

5.4 数据保留政策变更

Fable 5、Mythos 5 及未来同等或更高能力级别的模型将实施 30 天数据保留政策(面向商业客户),覆盖第一方和第三方渠道。关键保障:

  • 数据不会用于训练新模型
  • 所有对数据的访问均有日志记录
  • 30 天后数据将被删除(少数例外情况除外)
  • 目的:防御复杂的新型攻击、检测规模化滥用、识别和降低安全分类器的误报率

5.5 受信访问计划

Mythos 5 当前仅通过 Project Glasswing 向合作方开放(解除网络安全限制),Anthropic 正与美国政府协商逐步扩员并推出系统化申请机制。同步筹备的生物学受信访问计划将面向少数基础研究、转化医学及药物研发机构,开放解除生物/化学限制的 Fable 5。


六、定价与可用性

Fable 5 与 Mythos 5 定价相同:

计费项 价格
输入 token $10 / 百万 token
输出 token $50 / 百万 token

价格不到 Claude Mythos Preview 的一半。

  • 即日起(6 月 9 日):Claude API 全面可用,消费制 Enterprise 计划可用;Pro、Max、Team 及席位制 Enterprise 计划免费包含 Fable 5
  • 6 月 23 日起:上述订阅计划使用 Fable 5 需消耗 usage credits(若容量允许可能延长免费窗口)
  • 远期:容量充足后,Fable 5 将恢复为订阅计划标准组成部分

Anthropic 预计需求将"非常高且难以预测"。


七、Claude Code v2.1.170 同步推送

伴随本次发布,Claude Code v2.1.170(2026-06-09 17:23 UTC)已同步推送,成为首个原生支持 Mythos 级模型的 CLI 版本。开发者升级后通过 /model 菜单或 --model 启动参数即可切换至 Fable 5。

该版本还修复了一个长期困扰 IDE 用户的痛点:VS Code、Cursor 等集成终端因错误继承 Claude Code 环境变量,导致会话 Transcript 无法落盘、claude --resume 找不到历史记录。v2.1.170 重构了环境变量隔离机制,所有会话均可正常恢复。

# npm(旧版方式,v2.1.15 起已弃用)
npm install -g @anthropic-ai/claude-code@latest

# 原生安装器(推荐)
# macOS / Linux
curl -fsSL https://claude.ai/install.sh | bash
# Windows PowerShell
irm https://claude.ai/install.ps1 | iex

# 验证版本
claude --version

本文编译自 Anthropic 于 2026 年 6 月 9 日发布的官方公告。文中评测数据及技术描述均来源于 Claude Fable 5 and Claude Mythos 5

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐