人工智能公司Anthropic于2026年6月4日公开建议,在全球范围内暂停开发最强大的人工智能系统,因为最新模型存在可能逃脱人类控制的风险 [1, 2, 3, 4, 5]。该暂停要求包括美国和中国在内的多国多家主要AI企业达成统一并执行可验证的协议 [1, 2, 6, 7, 4, 5]

Anthropic联合创始人Jack Clark表示,“我们认为,让世界有机会放慢或暂时暂停前沿 AI 开发,有助于社会结构和对齐研究跟上技术进步的步伐” [1]。他同时指出,目前AI产业“感觉像是只有油门,没有刹车”,强调对新兴递归自我改进能力的担忧,即AI系统能够自主改进并创造后继者,可能导致人类失控风险提升 [6, 7, 8, 5, 9, 10]

Anthropic的AI模型Mythos具备强大能力和网络安全特性,虽然未公开发布,但已部署给经过筛选的组织使用 [1, 2, 7, 3, 4]。公司计划召集政策制定者、研究人员和行业代表就全球暂停AI开发展开对话,并公布讨论结果 [6, 8, 9, 10]

Anthropic对比核武控制,指出AI训练更容易隐瞒且缺乏约束机制,“递归智能快速自我构建,与人类社会和治理体系的碰撞,是不可预测的未来” [1, 6, 7, 9, 10]。然而,部分行业人士及白宫官员对Anthropic的风险评估提出异议,认为其夸大了风险,暂停可能延缓美国创新并让中国获得战略优势 [1, 2, 7, 3, 4]。英国伦敦大学学院教授Steven Murdoch点评,Anthropic看似温和,但其AI安全定义偏窄,并未反对支持美方发展攻击性能力 [8]

最近,美国总统唐纳德·特朗普在北京访问时讨论了与中国的AI安全合作,并签署行政令,要求对美国强大AI模型进行30天的预审 [1, 2, 3, 4]。Anthropic早前曾在2023年承诺暂停危险AI研发,但在2026年初放宽政策,只在领先竞争对手时才暂停 [9, 10]。目前公司仍持续推出尖端AI模型如Claude和Mythos,且准备进行首次公开募股 [6, 9]