查看: 487|回复: 1

Anthropic发布Claude Fable 5:具备网络安全护栏的Mythos级AI模型

[复制链接]
发表于 4 天前 | 显示全部楼层 |阅读模式
Anthropic于周二宣布,其强大的Mythos级AI模型Claude Fable 5正式向公众和开发者开放。该模型在软件工程、知识工作、视觉处理和长时间运行任务等方面均超越了前代版本。

为确保安全,Anthropic在Fable 5中引入了专门的防护机制,在网络安全、生物学等高风险领域会自动回退到能力较低的Claude Opus 4.8,以防止潜在滥用。早期使用数据显示,至少95%的会话完全运行在Fable 5上,无需触发回退。

Anthropic表示,这是首次将如此高能力级别的模型认定为足够安全而广泛发布。公司通过内部红队测试和外部漏洞赏金计划(累计超过1000小时)验证了防护措施的有效性,未发现通用越狱手段。独立外部红队也未找到关键绕过方法。

同时,Anthropic宣布将Project Glasswing合作伙伴从Claude Mythos Preview升级至Claude Mythos 5,并计划通过结构化可信访问计划逐步扩大授权范围。该项目近期新增约150家组织,包括Dragos、Tenable、TrendAI(Trend Micro)、Netskope、BeyondTrust、Rubrik、BT、洲际交易所和日立等。

在定价方面,Fable 5和Mythos 5均为每百万输入token 10美元,每百万输出token 50美元。开发者可通过Claude API立即使用Fable 5。
回复

使用道具 举报

发表于 4 天前 | 显示全部楼层

Re: Anthropic发布Claude Fable 5:具备网络安全护栏的Mythos级AI模型

感谢分享这条最新资讯!Claude Fable 5的发布确实令人振奋,尤其是在安全防护方面的设计很用心——自动在高风险领域回退到低能力模型,这种“安全护栏”的思路挺有意思。好奇对开发者来说,用API调用Fable 5时是否能感知到回退发生?另外,新增的合作方里有很多安全领域的公司,看来Project Glasswing在安全生态的布局也在加速。定价和之前Mythos系列保持一致,也算延续了Anthropic一贯的策略。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

指导单位

江苏省公安厅

江苏省通信管理局

浙江省台州刑侦支队

DEFCON GROUP 86025

Hacking Group 021A

旗下站点

态势感知中心

应急响应中心

红盟安全

联系我们

官方QQ群:112851260

官方邮箱:security#ihonker.org(#改成@)

官方核心成员

关注微信公众号

Archiver|手机版|小黑屋| ( 沪ICP备2021026908号 )

GMT+8, 2026-6-14 05:30 , Processed in 0.026320 second(s), 17 queries , Gzip On, Redis On.

Powered by ihonker.com

Copyright © 2015-现在.

  • 返回顶部