Anthropic发布Claude Fable 5:首款面向公众的神话级模型
Anthropic 发布 Claude Fable 5,推翻“过于危险”的 AI 模型立场
旧金山 —— 周一,Anthropic 宣布发布 Claude Fable 5,此举标志着商业 AI 领域发生了重大转变,这也是其首款面向公众推出的“Mythos-class”模型正式亮相。
此次发布距离 Anthropic 高管公开声明 Mythos-class 模型因过于危险、若无极端且前所未有的保障措施便不可发布,仅过去一年多。2026 年 6 月 9 日的推出通过双重发布策略化解了这一矛盾:Claude Fable 5 配备了严格的安全分类器护栏,而其不受限制的版本 Claude Mythos 5 则将被锁定在“Project Nebula”的高墙之内。
Claude Fable 5 现已成为 Anthropic 迄今构建的功能最强大的公开模型。根据该公司的技术博客文章,该模型代表了能力的范式转变,在高级推理、编排复杂的智能体(agentic)任务以及执行“长周期工作”(long-horizon work)方面表现卓越——所谓“长周期工作”,是指自主管理和完成跨越数天、多步骤项目的能力,而这些项目此前通常需要整个人类开发者或研究团队协作完成。
Anthropic 一位发言人表示:“我们此前对发布 Mythos-class 模型的顾虑,源于滥用和一致性失败(alignment failure)所带来的极现实风险。通过 Claude Fable 5,我们集成了一套新颖且深度嵌入的安全分类器系统。这些护栏允许模型在最高水平上发挥其推理和智能体能力,同时从根本上限制可能导致有害或灾难性后果的路径。”
对于一家主要建立在 AI 安全声誉之上的公司而言,发布 Mythos-class 模型的决定是一个惊人的立场反转。2025 年初,Anthropic 发布了一份广为流传的风险评估报告,警告称 Mythos 级架构的涌现能力——特别是其自主、长期规划能力——使其不适合向公众部署。
为了解决这些担忧,Anthropic 将基础、未经过滤的模型拒之于公共生态系统之外。缺乏 Fable 模型安全分类器护栏的 Claude Mythos 5 将仅通过 Project Nebula 提供。关于 Project Nebula 的细节仍然很少,但 Anthropic 将其描述为一个高度安全、物理隔离的研究环境,仅限经过审查的政府机构和特定的国际安全研究人员访问。
对于更广泛的市场,Claude Fable 5 的访问权限将分阶段推出。企业客户和付费个人订阅用户将从今天开始率先将该模型集成到其工作流程中。Anthropic 表示,免费层级用户将在稍后获得访问权限,具体时间取决于对模型现实世界行为和服务器负载的进一步评估。
行业分析师指出,此次发布给 OpenAI 和 Google DeepMind 等竞争对手带来了巨大的竞争压力,这些竞争对手一直在竞相发布各自的高度自主、长周期智能体。
斯坦福大学技术伦理学家 Elena Rostova 博士表示:“Anthropic 正面临典型的创新者困境。他们要么坚持绝对的安全原则,将企业市场拱手让给竞争对手;要么找到一种方法,将高能力模型安全地‘装进盒子里’。通过 Fable/Mythos 的拆分策略,他们试图两全其美——既证明自己能在能力的绝对前沿参与竞争,又维护其安全信誉。”
随着企业本周开始测试 Claude Fable 5 的智能体极限,AI 行业将密切关注。核心问题不再仅仅是 Mythos-class 模型能有多强大,而是 Anthropic 的护栏能否可靠地遏制那些使其如此强大的能力。