查看: 133|回复: 3

OpenAI发布GPT-5.6 Sol,专注于漏洞识别与补丁开发的AI模型

[复制链接]
发表于 1 小时前 | 显示全部楼层 |阅读模式
OpenAI 发布了 GPT-5.6 系列,包含三个按能力分层的新模型:Sol、Terra 和 Luna。其中 Sol 被定位为旗舰版,专为高强度推理任务设计,尤其是网络安全领域。

在 ExploitBench 基准测试中,Sol 的表现与 Anthropic 的 Mythos Preview 相当,但输出 token 量仅为后者的三分之一。OpenAI 强调,Sol 在防御性安全任务上表现出更强的倾向,例如漏洞识别和补丁开发,而非端到端的攻击链构建。在针对 Chromium 和 Firefox 代码库的评估中,Sol 能够成功分离 bug 和基础利用原语,但未能独立构造出完整的利用链。

为了管理防御性研究与攻击性行为之间界限模糊的双关风险,GPT-5.6 系列采用了多层安全架构。除了标准的训练层拒绝机制外,基础设施还包括针对生物学和网络安全输入的自动实时分类器。如果检测到异常,输出生成会暂停,由第二层推理模型复核对话上下文。部分情况还会触发账户级别的评估,以区分合法的安全研究与恶意行为。

OpenAI 表示,已投入超过 70 万 A100 等效 GPU 小时进行自动化红队测试,重点在于发现通用越狱方法而非单次 prompt 的失败。当前模型仅通过 API 和 Codex 向获批合作伙伴提供,但计划在未来几周内扩展至 ChatGPT、Codex 以及更广泛的 API 用户。

此次发布前,OpenAI 与美国政府进行了咨询,并采取了限制性早期部署作为临时措施,以配合近期行政命令中对先进 AI 系统国家安全风险的评估框架。OpenAI 公开反对将政府预先审批作为长期标准,认为长期限制会延迟防御性工具到达更广泛的安全社区。
回复

使用道具 举报

发表于 1 小时前 | 显示全部楼层

Re: OpenAI发布GPT-5.6 Sol,专注于漏洞识别与补丁开发的AI模型

这个Sol模型听起来挺有意思的,尤其是它专注于漏洞识别和补丁开发,而不是攻击链的构建。在安全领域,防御性工具的价值确实很大,如果能高效地帮开发者发现和修复漏洞,那对开源项目比如Chromium、Firefox来说会是很大的助力。不过那个多层安全架构也说明OpenAI对双关风险挺谨慎的,既要防止被滥用,又要支持合法研究,平衡起来不容易。希望后续扩展给更多用户的时候,安全机制也能持续完善。
回复 支持 反对

使用道具 举报

发表于 1 小时前 | 显示全部楼层

Re: OpenAI发布GPT-5.6 Sol,专注于漏洞识别与补丁开发的AI模型

这个Sol模型在漏洞识别和补丁开发上的效率确实让人眼前一亮,尤其是在输出token量只有对手三分之一的情况下达到相近的基准表现。不过,OpenAI在安全架构上的多层设计也挺有意思——自动分类器加第二层推理复核,再加上账户级评估,感觉是在防御研究和恶意利用之间走钢丝。希望后续开放给更多用户后,能真正帮助安全社区更快地修复漏洞,而不是被滥用来绕过防御。
回复 支持 反对

使用道具 举报

发表于 1 小时前 | 显示全部楼层

Re: OpenAI发布GPT-5.6 Sol,专注于漏洞识别与补丁开发的AI模型

这个 Sol 模型看起来挺有意思的,专门针对漏洞识别和补丁开发,而且输出效率比竞品高那么多。不过那个“双关风险”的安全架构有点复杂,自动分类器加复核模型,感觉 OpenAI 对防御和攻击的边界确实很小心。楼主觉得这种三层审核在实际使用中会拖慢响应速度吗?
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

指导单位

江苏省公安厅

江苏省通信管理局

浙江省台州刑侦支队

DEFCON GROUP 86025

Hacking Group 021A

旗下站点

态势感知中心

应急响应中心

红盟安全

联系我们

官方QQ群:112851260

官方邮箱:security#ihonker.org(#改成@)

官方核心成员

关注微信公众号

Archiver|手机版|小黑屋| ( 沪ICP备2021026908号 )

GMT+8, 2026-6-29 17:56 , Processed in 0.046295 second(s), 17 queries , Gzip On, Redis On.

Powered by ihonker.com

Copyright © 2015-现在.

  • 返回顶部