广哥在硅谷 · 用思考抵达清晰,用行动靠近自由
ANTHROPIC · 2026/06/09

Claude Fable 5 与 Mythos 5
同一个模型的双胞胎

Claude Fable 5 and Claude Mythos 5 · Curated Chinese Edition
Anthropic 公告 · 2026/06/09 中文精校版 9 章 · 约 35 分钟阅读
📋 内容摘要

2026 年 6 月 9 日,Anthropic 发布 Claude Fable 5 和 Claude Mythos 5——同一个 Mythos-class 底层模型的两个版本Fable 5——加了安全防护,面向所有用户Mythos 5——同样底层,去掉部分防护只给 Glasswing 合作伙伴和受信任的研究者。Fable 5 的能力超过 Anthropic 此前任何普遍发布的模型。Stripe 用 Fable 5 一天完成 5000 万行 Ruby 代码迁移——本来需要团队两个月。Mythos 5 加速药物设计 10 倍第一次稳定产出"被科学家盲评偏好 80% 时间"的新生物学假说,并独立提出一个 E. coli 蛋白机制——被另一个独立实验室同期验证。价格——$10/M 输入 + $50/M 输出,是 Mythos Preview 的一半不到。本文是这次发布的中文精校版。

章节目录
  1. 引言 · Mythos-class 进入普遍发布
    Mythos-class goes general
  2. Fable 与 Mythos · 名字与设计
    Naming the twins
  3. 能力综述 · 长任务的飞跃
    Capabilities summary
  4. 软件工程 · Stripe 一天 vs 两个月
    A day vs two months
  5. 视觉、内存、玩游戏 · 突破性
    Vision, memory, gameplay
  6. 药物设计 · 10 倍加速
    10x in drug design
  7. 分子生物学 · 提出新假说
    Novel hypotheses
  8. 三类安全防护 · 网络、生物、蒸馏
    Three safeguards
  9. 可用性与定价 · 阶段性发布
    Pricing and availability
CHAPTER 01 · INTRODUCTION

引言 · Mythos-class 进入普遍发布

Mythos-class goes general
📌 本节核心要点

2026 年 6 月 9 日,Anthropic 发布 Claude Fable 5 和 Claude Mythos 5。这是 Mythos-class(位于 Opus class 之上的能力等级)第一次以普遍发布的形式向公众开放——一个 4 月通过 Project Glasswing 才向 50 个合作伙伴开放的能力等级,2 个月后就有了"带保护的版本"可以给所有人用。Fable 5——加了完整防护,所有人可用。Mythos 5——同样底层,部分防护被解除只给 Glasswing 合作伙伴和受信任研究者价格是 Mythos Preview 的一半不到——$10/M 输入 + $50/M 输出。

Mythos-class General Release $10/$50 per Million 95% no Fallback

2026 年 6 月 9 日,Anthropic 发布 Claude Fable 5——一款"能安全地用于普遍发布"的 Mythos-class 模型

Anthropic 写道——Fable 5 的能力超过我们普遍发布过的任何模型。它在几乎所有 AI 能力基准上是最新最先进——展现在软件工程、知识工作、视觉、科学研究等多领域例外的性能任务越长越复杂,Fable 5 比其他 Claude 模型的领先就越大

Anthropic 同时毫不掩饰地承认——"发布这种能力的模型伴随着风险"。没有防护的话,Fable 5 在网络安全等领域的能力可能被滥用造成严重损害。所以他们用"防护"启动模型——对某些主题的查询,会被自动转给次强的 Claude Opus 4.8 来回答

为了能同时又安全又快地发布——Anthropic 把防护调得保守。这意味着有时候无害的请求也会被拦截——但平均下来,少于 5% 的会话会触发防护

对一小群网络防御者和基础设施提供商,Anthropic 同时发布 Claude Mythos 5——跟 Fable 5 是同一个底层模型但部分领域防护被解除。Mythos 5 通过 Project Glasswing 部署——和美国政府合作——作为 Mythos Preview 的升级版。它有世界上任何模型中最强的网络安全能力

价格——$10/M 输入 + $50/M 输出——不到 Mythos Preview 的一半

广哥在硅谷◆ ◆ ◆
CHAPTER 02 · NAMING

Fable 与 Mythos · 名字与设计

Naming the twins
📌 本节核心要点

"Fable" 源自拉丁文 fabula——"被讲述的东西"——和希腊词 Mythos 同源。同一个故事,两种讲法——一种带保护、一种不带。Anthropic 用两个不同名字来明确区分——保护机制是两者唯一的区别。这是一个很重要的产品设计哲学——承认能力本身是中性的,"是否有保护"决定了它该被给谁用。这也是 Anthropic 对自己 RSP(Responsible Scaling Policy)的具体应用——在能力上不让步,在分发上做选择

Anthropic 在脚注里解释了这两个名字的来源——

"Fable" 源自拉丁文 fabula——
"被讲述的东西"——
与希腊词 Mythos 同源。

保护机制区分了 Fable 和 Mythos——
这就是我们给它们不同名字的原因。

— ANTHROPIC, ON THE NAMES

这是 Anthropic 一次很有意思的产品设计选择

过去 OpenAI、Google 等都用版本号或后缀区分不同能力等级(GPT-4o、Gemini 1.5 Pro 等)。Anthropic 用不同名字来表示——同一个底层模型,但分发策略不同

这个选择背后的哲学——"能力本身是中性的"——一段 Mythos 级别的网络安全能力,对防御者是工具,对攻击者是武器。所以关键的产品决定是"给谁用",而不只是"做多强"

这也是 Anthropic 自己的 RSP(Responsible Scaling Policy)的具体落地——在能力上不让步,在分发上做选择

广哥在硅谷◆ ◆ ◆
CHAPTER 03 · CAPABILITIES

能力综述 · 长任务的飞跃

Capabilities summary
📌 本节核心要点

Fable 5 和 Mythos 5 在"自主长任务"上比之前所有 Claude 模型走得更远。任务越长越复杂,它们的领先就越大。Anthropic 的能力评测覆盖软件工程、知识工作、视觉、内存与长上下文、药物设计、新假说、基因组学。一项重要观察——对齐评测里,Mythos 5 的不对齐行为水平很低跟 Opus 4.8 相当。Fable 5 是同一底层,对齐水平也相似

这一节给出一个让人记下的事实——Fable 5 和 Mythos 5 比此前所有 Claude 模型自主工作的时间都长

Anthropic 写下的核心特征——"任务越长越复杂,Fable 5 比其他 Claude 模型的领先就越大"。这跟之前 METR 等基准上的趋势一致——AI 能可靠完成的任务时长每 4 个月翻一番。Fable 5 是这个曲线的一个新点。

Anthropic 给出能力评测覆盖的领域——

· 软件工程——Stripe 一天完成两个月的工作(见第 4 章)
· 知识工作——Hebbia 财务基准最高分;IMC 交易分析评测几乎全胜
· 视觉——能从详细科学图表里提取精确数字;用截图重建网页源代码
· 内存与长上下文——能在数百万 tokens 的长任务里保持专注,用自己的笔记改进输出
· 药物设计 / 蛋白质——见第 6 章
· 分子生物学 / 基因组学——见第 7 章
· 对齐——Mythos 5 的不对齐行为水平跟 Opus 4.8 相当。Fable 5 同底层,对齐水平相似

广哥在硅谷◆ ◆ ◆
CHAPTER 04 · STRIPE

软件工程 · Stripe 一天 vs 两个月

A day vs two months
📌 本节核心要点

Anthropic 引用了一个让人难忘的客户案例——Stripe 在早期测试时报告:Fable 5 把几个月的工程压缩成几天。具体例子——在一个5000 万行 Ruby 代码库里,Fable 5 一天内完成了一次跨整个代码库的迁移——而用人手做这件事,需要一整个团队两个月。Fable 5 还更省 token——在 Cognition 的 FrontierCode 评测(测试模型能否在保持高质量生产代码标准的同时完成困难任务)上,即使是中等努力档位,Fable 5 也是前沿模型里最高分

Stripe 50M Lines 1 Day vs 2 Months FrontierCode #1

Anthropic 第一个客户引用是 Stripe——支付基础设施巨头之一。Stripe 报告——Fable 5 把几个月的工程压缩成几天

给出的具体例子让人停下来——

在一个 5000 万行 Ruby 代码库里,
Fable 5 一天内完成了一次跨整个代码库的迁移——

用人手做这件事,需要一整个团队两个月

— STRIPE'S EARLY TESTING, FEATURED BY ANTHROPIC

这个对比的意义在于——5000 万行不是 toy example。这是真实的、生产环境的代码库,是Stripe 业务运行的实际代码"跨代码库迁移"是个很难的任务——它要求理解整个代码库的结构找出所有需要改的地方一次性改完不破坏现有功能

把它压成一天——意味着 Stripe 的整个工程节奏可以重新设计。两个月的工作变成一天,那些"等了几年因为成本太高不做"的迁移现在可以做了

Fable 5 在token 效率上也有提升——在 Cognition 的 FrontierCode 评测上(测试模型能否在保持高质量生产代码标准的同时完成困难任务),Fable 5 在所有前沿模型里得分最高,即使是中等努力档位。这意味着——每一个 token 都更值钱

报告还引用了 GitHub(Microsoft 旗下)的早期反馈——

Claude Fable 5 对
GitHub 服务的开发者来说,
是真实的一步飞跃

在我们早期测试里,
承担了复杂的、长时间跨度的编码任务
展现的自主性和可靠性超过了之前的基准。

但最让我兴奋的是它指向的方向——
一个开发者可以把越来越雄心的工作交给 Agent
并在整个软件生命周期里信任结果的未来

— MARIO RODRIGUEZ, CHIEF PRODUCT OFFICER, GITHUB

Cursor 的 CEO Michael Truell 也评论——Fable 5 是 CursorBench 上的最新最先进模型"它开启了一类之前不可触及的长时间跨度问题"

广哥在硅谷◆ ◆ ◆
CHAPTER 05 · VISION & MEMORY

视觉、内存、玩游戏 · 突破性

Vision, memory, gameplay
📌 本节核心要点

视觉上 Fable 5 是"新的视觉任务最强模型"——能从详细科学图表里提取精确数字,能从截图重建网页源代码。让人惊叹的是它"不再需要支架"——之前的 Claude 就算给了支架也很难玩通 Pokémon FireRed,但 Fable 5 用最简单的"只用视觉"支架就通了关内存与长上下文上——Fable 5 在数百万 tokens 的长任务里保持专注,用自己的笔记改进输出。给它访问基于文件的持久内存,让它的《杀戮尖塔》表现提升 3 倍到达终局的频率也是 Opus 4.8 的 3 倍

Fable 5 在视觉上是"新的视觉任务最强模型"——能完成一系列让人惊叹的任务——

· 从详细科学图表里提取精确数字——这是科研工作流的关键
· 从截图重建网页源代码——给设计师 / 前端工程师巨大杠杆
· "只用太阳和行星图像,从物理第一性原理推导轨道运动、并预测日食"

最让我惊叹的例子是——玩 Pokémon FireRed

之前的 Claude 模型需要一个复杂的辅助支架才能玩 Pokémon——
需要地图、导航辅助、额外游戏状态信息

Claude Fable 5 用只用视觉
最小化支架——
从头到尾玩通了 FireRed

— ANTHROPIC, ON FABLE 5 PLAYING POKEMON

这件事比"它能玩通游戏"重要——重要的是"它需要的支架减少了"支架越少 = 越通用 = 越接近"像人一样工作"。一个不需要专门支架就能玩通老游戏的模型,也意味着它在面对真实世界里"没人专门为它设计辅助"的任务时更可能成功

内存与长上下文上——Fable 5 在数百万 tokens 的长任务里保持专注用自己的笔记改进输出。Anthropic 测了 《杀戮尖塔》(Slay the Spire,一款策略卡牌游戏)——

· 给 Fable 5 访问基于文件的持久内存
· 让它的表现提升 3 倍(比 Opus 4.8 多 3 倍的提升)
· 到达游戏终局的频率也是 Opus 4.8 的 3 倍

广哥在硅谷◆ ◆ ◆
CHAPTER 06 · DRUG DESIGN

药物设计 · 10 倍加速

10x in drug design
📌 本节核心要点

Anthropic 内部的蛋白质设计专家——用 Mythos 5 把药物设计过程的某些方面加速了约 10 倍。具体例子——给 Mythos 5 蛋白设计和生物信息学工具,没有人类辅助它能匹敌或超越熟练的人类操作员。模型自己选择结合位点、选择和运行蛋白设计工具、从失败中恢复——科学家平常做的所有任务。研究里 14 个蛋白质靶点中9 个产生了强候选——目前 Anthropic 正在调查这些用于药物设计

10x Drug Design 9/14 Strong Candidates

Anthropic 内部的蛋白质设计专家——用 Mythos 5 把药物设计过程的某些方面加速了约 10 倍

具体例子让我反复读——给 Mythos 5 蛋白设计和生物信息学工具但没有人类辅助——

Mythos 5 匹敌或超过了熟练的人类操作员

这样做的过程中,模型执行了通常由科学家完成的所有任务——

· 选择结合位点
· 选择和运行蛋白设计工具
· 从沿途的失败中恢复

— ANTHROPIC, ON MYTHOS 5 IN PROTEIN DESIGN

这件事让我心跳加速——"从沿途的失败中恢复"——这是科学家最难做的事之一,需要"知道这条路不通"和"决定下一条路"的判断力。Mythos 5 现在能做这件事。

研究里——14 个蛋白质靶点中,9 个产生了强候选用于药物设计——Anthropic 正在调查它们。靶点覆盖——免疫检查点、生长因子和受体信号、神经退行性疾病、肌肉疾病、更难的结构性靶点

这意味着——Mythos 5 可能在加速整个药物发现管线。Dario 在《充满爱意的机器》里预测的"压缩的 21 世纪"——癌症消除、生命翻倍——这就是它在落地的第一个具体证据

广哥在硅谷◆ ◆ ◆
CHAPTER 07 · NOVEL HYPOTHESES

分子生物学 · 提出新假说

Novel hypotheses
📌 本节核心要点

这是整个公告里最具历史意义的部分——Mythos 5 是我们第一个能稳定产出新颖、引人入胜的科学假说的模型。在盲法对照实验里——比较 Mythos 5 和 Opus-class 的分子生物学假说——Anthropic 的科学家在大约 80% 的时间里偏好 Mythos 5 的假说几个已经被推进到实验评估阶段更让人震惊的是——Mythos 5 提出的一个 E. coli 蛋白的新机制被一个独立实验室同期工作里证实。基因组学上——Mythos 5 用一周自主工作,跨越 138 个动物物种汇编单细胞数据,训练的自定义机器学习模型超过了最近发表在《Science》上的模型——体积只有它的 1/100

80% Preferred E. coli Validated 138 Species 100x Smaller

这是整个公告里最具历史意义的部分

Anthropic 宣布——Mythos 5 是我们第一个能稳定产出新颖、引人入胜的科学假说的模型

怎么测的?盲法对照实验——把 Mythos 5 和 Opus-class 的分子生物学假说对比,不告诉评分者哪个是哪个,让Anthropic 的科学家做偏好选择。结果——

80%
盲法测试中科学家
偏好 Mythos 5 假说
独立验证
E. coli 蛋白机制
被独立实验室证实
138 物种
基因组学项目
跨物种细胞分析
100x 小
模型比《Science》对照
体积小 100 倍

几个已经被推进到实验评估阶段

最让我惊叹的事——Mythos 5 提出的一个 E. coli 蛋白的新机制被一个独立实验室同期工作里证实。也就是说——Mythos 5 提出的假说是真的另一支团队独立得出同一结论。这是"AI 做科学"的一个分水岭——不再是测试集表现,而是真实科学问题上的独立验证

基因组学上,Mythos 5 用一周多基本自主工作,做了——

· 跨越 138 个动物物种汇编单细胞数据——百万级细胞
· 设计并训练一个自定义机器学习模型——识别"在远亲物种里执行相同角色的细胞"
· 这个 Mythos 5 训练的模型超过了一个最近发表在《Science》上的模型——尽管 Mythos 训练的体积只有它的 1/100

Anthropic 说他们计划在未来几个月发表这些结果

广哥在硅谷◆ ◆ ◆
CHAPTER 08 · SAFEGUARDS

三类安全防护 · 网络、生物、蒸馏

Three safeguards
📌 本节核心要点

Fable 5 有三类新的安全防护——通过分类器检测潜在滥用并把请求自动转给 Opus 4.8 处理。(1) 网络安全——挡住攻击工具、漏洞利用、agent 黑客;外部红队 1000+ 小时测试没找到通用越狱(2) 生物与化学——以前只阻挡生物武器相关的窄查询,现在范围扩大——因为模型已经能在真实生物任务上做事。AAV 病毒外壳预测里Mythos-class 超过了专门的蛋白语言模型(3) 蒸馏——阻挡用于训练独裁国家竞争模型的大规模"提取"尝试"用户在 5% 不到的会话里会遇到 fallback"

Classifiers Cyber / Bio / Distillation 95% No Fallback 1000+ Hours Red Team

Fable 5 的关键设计——当分类器检测到某些主题的查询时,响应会被自动转给 Claude Opus 4.8 处理用户会被告知这次 fallback 发生了。Opus 4.8 仍然是非常强的模型,所以fallback 比直接拒绝体验好得多Anthropic 的早期数据显示——超过 95% 的 Fable 会话不涉及任何 fallback

三类分类器覆盖——

🛡️ 三类安全分类器

Anthropic 还引入了新的数据保留政策——Fable 5、Mythos 5 及后续 Mythos-class 模型——所有商业客户的流量保留 30 天第一方和第三方界面都适用

· 这些数据不会用于训练新模型不会用于任何非安全相关用途
· 所有人类对数据的访问都被记录
· 在几乎所有情况下,数据 30 天后被删除

目的——防御复杂和新颖攻击(包括新的越狱和跨多个请求操作的攻击),识别和减少误报

一位外部合作伙伴报告——Fable 5 对有害 cyber 查询的防护是测试过的所有模型中最强的(包括 Opus 4.8 和 Opus 4.7)。Fable 5 对0 个有害单轮请求(关于规划网络攻击、利用开发、防御逃避)响应——无论这些请求是否使用了 30 种公开越狱技巧之一

广哥在硅谷◆ ◆ ◆
CHAPTER 09 · AVAILABILITY

可用性与定价 · 阶段性发布

Pricing and availability
📌 本节核心要点

价格——$10/M 输入 + $50/M 输出——不到 Mythos Preview 的一半Fable 5 当天起所有地方可用Mythos 5 仅限 Glasswing 合作伙伴(cyber 防护解除)和后续选定的生物研究者(生物化学防护解除)。Anthropic 还为生物启动可信访问项目——少量研究者将获得 Fable 5 的生物化学防护解除版本

$10 / $50 per Million Pro / Max / Team Plans Trusted Access Program

价格——$10/M 输入 + $50/M 输出——不到 Mythos Preview 的一半。这意味着——能力升级 + 价格腰斩,AI 经济效应在加速。

Claude Fable 5 当天起所有地方可用。开发者可以通过 Claude API 用 claude-fable-5

Claude Mythos 5——仅限——

· Glasswing 合作伙伴(cyber 防护解除
· 后续选定的生物研究者生物化学防护解除,但 cyber 防护仍在)

Anthropic 还在和美国政府讨论稳步扩大 Mythos 5 的访问——加入更多新合作伙伴,并推出"可信访问项目"——让网络安全组织能系统性申请

对生物研究——新的可信访问项目会启动——加速生物医学研究、用 Mythos-class 能力发现新疗法。这个项目会包含少量来自不同生命科学组织的研究者——基础研究和转化研究都覆盖。Anthropic 计划扩大这个项目同时改善防护

订阅计划阶段性发布——

· 今天起 - 6 月 22 日——Fable 5 在 Pro、Max、Team、按席位 Enterprise 计划无额外费用包含
· 6 月 23 日起——从这些计划里移除 Fable 5,使用需要 usage credits(如果容量允许,会延长包含期)
· 后续——容量足够后,Fable 5 会回到订阅计划标准内容

Anthropic 解释——他们"更愿意早给访问而不是晚给",所以保守发布。

今天的联合发布
是我们朝着"把先进 AI 能力带给尽可能多的用户"的目标
又一步——

尽可能快、尽可能安全地

— ANTHROPIC, 2026/06/09

读完整篇公告,我意识到这次发布是一个完整故事——

· 4 月——Project Glasswing 启动,给 50 个合作伙伴 Mythos Preview
· 5 月 22 日——第一份月度更新——1 万+ 漏洞,瓶颈换位置
· 6 月 2 日——Glasswing 扩展到 150 个新组织
· 6 月 9 日——Fable 5 + Mythos 5 发布——Mythos-class 首次普遍可用

整个时间线只有 2 个月。Anthropic 把"危险能力的负责任普及"压缩成了一个精密的阶段性流程——先给最关键的防御者、然后扩大、最后普及。这个流程本身可能是 AI 工业的一种新范式——把"产品发布"和"风险管理"变成同一件事