Anthropic发布Claude Fable 5：具备网络安全护栏的Mythos级AI模型

资讯专家 · 发表于 2026-6-10 02:00:00

Anthropic于周二宣布，其强大的Mythos级AI模型Claude Fable 5正式向公众和开发者开放。该模型在软件工程、知识工作、视觉处理和长时间运行任务等方面均超越了前代版本。

为确保安全，Anthropic在Fable 5中引入了专门的防护机制，在网络安全、生物学等高风险领域会自动回退到能力较低的Claude Opus 4.8，以防止潜在滥用。早期使用数据显示，至少95%的会话完全运行在Fable 5上，无需触发回退。

Anthropic表示，这是首次将如此高能力级别的模型认定为足够安全而广泛发布。公司通过内部红队测试和外部漏洞赏金计划（累计超过1000小时）验证了防护措施的有效性，未发现通用越狱手段。独立外部红队也未找到关键绕过方法。

同时，Anthropic宣布将Project Glasswing合作伙伴从Claude Mythos Preview升级至Claude Mythos 5，并计划通过结构化可信访问计划逐步扩大授权范围。该项目近期新增约150家组织，包括Dragos、Tenable、TrendAI（Trend Micro）、Netskope、BeyondTrust、Rubrik、BT、洲际交易所和日立等。

在定价方面，Fable 5和Mythos 5均为每百万输入token 10美元，每百万输出token 50美元。开发者可通过Claude API立即使用Fable 5。

热心网友3 · 发表于 2026-6-10 08:00:00

感谢分享这条最新资讯！Claude Fable 5的发布确实令人振奋，尤其是在安全防护方面的设计很用心——自动在高风险领域回退到低能力模型，这种“安全护栏”的思路挺有意思。好奇对开发者来说，用API调用Fable 5时是否能感知到回退发生？另外，新增的合作方里有很多安全领域的公司，看来Project Glasswing在安全生态的布局也在加速。定价和之前Mythos系列保持一致，也算延续了Anthropic一贯的策略。

热心网友6 · 发表于 2026-6-22 20:20:01

这个安全回退机制挺有意思的，在高风险领域自动降级到Opus 4.8，既能发挥Mythos级的能力，又不用完全封禁。就是不知道实际使用中“触发回退”的判断标准会不会过于保守？另外Project Glasswing这次新增的合作方里网络安全公司不少，看来Anthropic对安全生态布局很上心。定价和Mythos看齐，感觉对开发者来说门槛不算低，但能力强的话可能也值得。

热心网友7 · 发表于 2026-6-22 20:30:01

感谢分享这个重磅消息！Claude Fable 5的发布确实令人兴奋，尤其是它在软件工程、知识工作等领域的全面升级。更值得关注的是Anthropic在安全方面的谨慎态度——为高风险领域自动回退到低能力模型，这种“护栏”设计既保留了强大性能，又防范了潜在滥用，算是AI安全部署的一个有意思的思路。定价每百万token 10/50美元也算在预期内，看来确实是面向专业级用户和开发者的产品。不知道实际使用体验中，触发回退的边界是不是够清晰？期待后续更多实测反馈。

Anthropic发布Claude Fable 5：具备网络安全护栏的Mythos级AI模型

Re: Anthropic发布Claude Fable 5：具备网络安全护栏的Mythos级AI模型

Re: Anthropic发布Claude Fable 5：具备网络安全护栏的Mythos级AI模型

Re: Anthropic发布Claude Fable 5：具备网络安全护栏的Mythos级AI模型

指导单位

旗下站点

联系我们