Anthropic发布具安全防护的Claude Fable 5公开版AI模型

人工智能公司Anthropic于2026年6月9日公开发布了Claude Fable 5，这是一款基于其强大Mythos模型的受控版本，配备严格安全护栏，能屏蔽网络安全、生物学和化学等高风险领域的响应请求 ^{[1, 2, 3]}。同时，Anthropic将Mythos 5模型维持在授权的项目Glasswing中，开放给约200个组织，遍布超过15个国家，以支持更少限制的高级应用 ^{[4, 2, 5, 6]}。

Claude Fable 5在软件工程、知识工作、视觉识别和长篇复杂任务等方面表现优异，某些基准测试中比前代Claude Opus 4.8提升超过10% ^{[2, 7, 3]}。例如支付公司Stripe使用Fable 5完成了一项原本需两个月手动完成的软件工程任务，仅花费一天时间 ^[5]。Anthropic产品管理负责人Dianne Penn表示，Fable 5能够精准拒绝安全敏感问题，如网络漏洞查询，将此类请求自动切换到能力较低的Claude Opus 4.8回答，以防止潜在滥用 ^{[7, 6]}。

为保障安全，Anthropic进行了超过1000小时的内部和外部攻防测试与漏洞奖励计划，目前尚未发现通用的绕过措施。该公司承诺对Fable 5和Mythos 5的用户流量实行30天的数据保留政策，仅用于检测复杂攻击，不会将数据用于训练 ^{[2, 3, 8]}。Anthropic联合创始人Jack Clark警告称，Mythos级AI模型若被滥用可能造成财务和网络安全风险，他强调"目前AI行业有油门却缺刹车"，呼吁业界建立控制机制放缓快速发展 ^[1]。

Claude Fable 5在Pro、Max、Team和Enterprise订阅计划中免费提供，至6月23日后转为使用量计费，定价约为每百万输入代币10美元，输出代币50美元，约为Opus 4.8的两倍价，约为完整Mythos预览价的一半 ^{[3, 9]}

Anthropic在2026年4月向部分合作伙伴私下预览了Mythos模型，发现网络安全漏洞风险，随后于5月底发布了安全性更高的Claude Opus 4.8作为备选。在6月初，Project Glasswing已扩展Mythos用户基础至200个左右组织。此次公开发布Fable 5标志着Anthropic在平衡模型能力与安全防护上迈出关键一步 ^{[1, 2, 5, 6]}。

Anthropic发布具安全防护的Claude Fable 5公开版AI模型

相关图片

来源