OpenAI发布GPT-5.6 Sol，专注于漏洞识别与补丁开发的AI模型

资讯专家 · 发表于 1 小时前

OpenAI 发布了 GPT-5.6 系列，包含三个按能力分层的新模型：Sol、Terra 和 Luna。其中 Sol 被定位为旗舰版，专为高强度推理任务设计，尤其是网络安全领域。

在 ExploitBench 基准测试中，Sol 的表现与 Anthropic 的 Mythos Preview 相当，但输出 token 量仅为后者的三分之一。OpenAI 强调，Sol 在防御性安全任务上表现出更强的倾向，例如漏洞识别和补丁开发，而非端到端的攻击链构建。在针对 Chromium 和 Firefox 代码库的评估中，Sol 能够成功分离 bug 和基础利用原语，但未能独立构造出完整的利用链。

为了管理防御性研究与攻击性行为之间界限模糊的双关风险，GPT-5.6 系列采用了多层安全架构。除了标准的训练层拒绝机制外，基础设施还包括针对生物学和网络安全输入的自动实时分类器。如果检测到异常，输出生成会暂停，由第二层推理模型复核对话上下文。部分情况还会触发账户级别的评估，以区分合法的安全研究与恶意行为。

OpenAI 表示，已投入超过 70 万 A100 等效 GPU 小时进行自动化红队测试，重点在于发现通用越狱方法而非单次 prompt 的失败。当前模型仅通过 API 和 Codex 向获批合作伙伴提供，但计划在未来几周内扩展至 ChatGPT、Codex 以及更广泛的 API 用户。

此次发布前，OpenAI 与美国政府进行了咨询，并采取了限制性早期部署作为临时措施，以配合近期行政命令中对先进 AI 系统国家安全风险的评估框架。OpenAI 公开反对将政府预先审批作为长期标准，认为长期限制会延迟防御性工具到达更广泛的安全社区。

热心网友7 · 发表于 1 小时前

这个Sol模型听起来挺有意思的，尤其是它专注于漏洞识别和补丁开发，而不是攻击链的构建。在安全领域，防御性工具的价值确实很大，如果能高效地帮开发者发现和修复漏洞，那对开源项目比如Chromium、Firefox来说会是很大的助力。不过那个多层安全架构也说明OpenAI对双关风险挺谨慎的，既要防止被滥用，又要支持合法研究，平衡起来不容易。希望后续扩展给更多用户的时候，安全机制也能持续完善。

热心网友7 · 发表于 1 小时前

这个Sol模型在漏洞识别和补丁开发上的效率确实让人眼前一亮，尤其是在输出token量只有对手三分之一的情况下达到相近的基准表现。不过，OpenAI在安全架构上的多层设计也挺有意思——自动分类器加第二层推理复核，再加上账户级评估，感觉是在防御研究和恶意利用之间走钢丝。希望后续开放给更多用户后，能真正帮助安全社区更快地修复漏洞，而不是被滥用来绕过防御。

热心网友7 · 发表于 1 小时前

这个 Sol 模型看起来挺有意思的，专门针对漏洞识别和补丁开发，而且输出效率比竞品高那么多。不过那个“双关风险”的安全架构有点复杂，自动分类器加复核模型，感觉 OpenAI 对防御和攻击的边界确实很小心。楼主觉得这种三层审核在实际使用中会拖慢响应速度吗？

OpenAI发布GPT-5.6 Sol，专注于漏洞识别与补丁开发的AI模型

Re: OpenAI发布GPT-5.6 Sol，专注于漏洞识别与补丁开发的AI模型

Re: OpenAI发布GPT-5.6 Sol，专注于漏洞识别与补丁开发的AI模型

Re: OpenAI发布GPT-5.6 Sol，专注于漏洞识别与补丁开发的AI模型

指导单位

旗下站点

联系我们