人工智能公司Anthropic于2026年6月9日公开发布了Claude Fable 5,这是一款基于其强大Mythos模型的受控版本,配备严格安全护栏,能屏蔽网络安全、生物学和化学等高风险领域的响应请求 [1, 2, 3]。同时,Anthropic将Mythos 5模型维持在授权的项目Glasswing中,开放给约200个组织,遍布超过15个国家,以支持更少限制的高级应用 [4, 2, 5, 6]

Claude Fable 5在软件工程、知识工作、视觉识别和长篇复杂任务等方面表现优异,某些基准测试中比前代Claude Opus 4.8提升超过10% [2, 7, 3]。例如支付公司Stripe使用Fable 5完成了一项原本需两个月手动完成的软件工程任务,仅花费一天时间 [5]。Anthropic产品管理负责人Dianne Penn表示,Fable 5能够精准拒绝安全敏感问题,如网络漏洞查询,将此类请求自动切换到能力较低的Claude Opus 4.8回答,以防止潜在滥用 [7, 6]

为保障安全,Anthropic进行了超过1000小时的内部和外部攻防测试与漏洞奖励计划,目前尚未发现通用的绕过措施。该公司承诺对Fable 5和Mythos 5的用户流量实行30天的数据保留政策,仅用于检测复杂攻击,不会将数据用于训练 [2, 3, 8]。Anthropic联合创始人Jack Clark警告称,Mythos级AI模型若被滥用可能造成财务和网络安全风险,他强调"目前AI行业有油门却缺刹车",呼吁业界建立控制机制放缓快速发展 [1]

Claude Fable 5在Pro、Max、Team和Enterprise订阅计划中免费提供,至6月23日后转为使用量计费,定价约为每百万输入代币10美元,输出代币50美元,约为Opus 4.8的两倍价,约为完整Mythos预览价的一半 [3, 9]

Anthropic在2026年4月向部分合作伙伴私下预览了Mythos模型,发现网络安全漏洞风险,随后于5月底发布了安全性更高的Claude Opus 4.8作为备选。在6月初,Project Glasswing已扩展Mythos用户基础至200个左右组织。此次公开发布Fable 5标志着Anthropic在平衡模型能力与安全防护上迈出关键一步 [1, 2, 5, 6]