当 Anthropic 在 4 月发布其新模型 Mythos 时,这家 AI 实验室同时向软件开发行业发出了强烈警告。 据称,这一模型在挖掘软件安全漏洞方面能力超强,已经发现了数以千计的高危漏洞,在这些问题修复完成之前,模型无法全面对外开放。

现在,Mozilla Firefox 浏览器的安全研究人员首次系统披露了这一过程在实际工程中的运作细节,并尝试解释 Mythos 对整体软件安全生态意味着什么。 Mozilla 在周四发布的一篇文章中表示,Mythos 已经在 Firefox 中挖掘出大量高危漏洞,其中一些缺陷在代码中潜伏时间已超过十年。

在短短半年内,AI 安全工具的实用性出现了明显飞跃。 过去一段时间,各类 AI 自动查错工具往往“噪声”极大,动辄给安全团队塞满质量堪忧的报告和大量误报,让工程团队疲于应付。 Mozilla 的研究人员认为,新一代工具已经“拐点已至”,尤其是在具备“代理式”能力之后,模型可以对自己的分析结果做二次评估与筛选,从而过滤掉大量不靠谱的输出。

“很难夸大这种变化在几个月内对我们的影响有多大。”研究人员写道。 “首先,模型本身的能力有了巨大提升;其次,我们在如何驾驭这些模型方面的技术栈也进步很快。”

具体到结果层面,变化尤为直观:2026 年 4 月,Firefox 共发布了 423 个漏洞修复补丁,而在一年前同月,这一数字只有 31 个。 研究团队还公开了其中 12 个漏洞的技术细节,既包括两处罕见的沙箱安全机制缺陷,也包括一个长达 15 年之久的 HTML 元素解析错误。

“这些工具现在真的突然变得非常好用了。”Mozilla 杰出工程师 Brian Grinstead 在接受 TechCrunch 采访时说。 “我们在内部扫描系统上看到了这一点,在外部提交的漏洞报告中也看到了同样的趋势,放眼整个行业也是如此。”

其中最引人注目的一点,是 Mythos 帮助发现了一批与浏览器“沙箱”机制相关的漏洞。 在业内,这类漏洞向来被视为最难挖掘、危害最高的缺陷之一:要成功找到并验证沙箱漏洞,模型不仅要能编写出带有恶意改动的补丁,还要在引入这段新代码后,设法攻击到浏览器中防护最严密的那部分组件。 这个过程需要在多步操作之间保持严密逻辑和足够创造力,难度远高于常规缺陷挖掘。

从经济激励上也能看出其价值。 Mozilla 的漏洞赏金计划对 Firefox 沙箱漏洞给出的最高奖金为 2 万美元,是所有漏洞类别中奖励上限最高的一档。 尽管如此,Grinstead 表示,Mythos 目前找到的沙箱相关问题数量,已经超过人类安全研究员过去通过悬赏挖掘出的同类漏洞总和。 “我们确实会收到沙箱漏洞的报告,”他说,“但从数量上讲,远远比不上我们利用这种新技术主动发现的规模。”

值得注意的是,尽管业界在 AI 代码生成工具方面进展明显,Firefox 团队目前仍不依赖 AI 来直接修复这些漏洞。 团队会让模型基于每个漏洞尝试生成补丁,但这些自动生成的代码通常无法直接合入主干,只能作为人类工程师编写修复方案的参考范本。

“在本文提到的这些漏洞中,每一个都是由一名工程师完成补丁编写,再由另一名工程师完成代码审核。”Grinstead 强调。 “我们至今没有找到让这一流程完全自动化的可靠方法。”

在更宏观的层面上,AI 能力的快速演进究竟会如何改变网络攻防之间的力量平衡,目前仍然没有定论。 自 Mythos 预览版发布过去一个多月,绝大多数被其发现的缺陷仍处于修复过程中,这也意味着外界尚难以全面评估其长期影响。 Anthropic 一直严格遵守负责任披露规范,逐步与相关项目沟通漏洞细节,但可以合理推测,一些恶意行为者也在私下尝试类似技术,即便他们所用的模型在能力上仍逊色一筹。

在近期的一场公开活动上,Anthropic 首席执行官 Dario Amodei 对这一趋势持相对乐观态度。 在他看来,如果行业能妥善管理这类工具的使用方式,最终防守方的处境可能会比今天更好。“如果我们处理得当,最终的局面有望比一开始更安全,因为我们会把这些漏洞一个个修掉。”Amodei 说。“漏洞的总量是有限的,所以在这之后有可能迎来一个更好的世界。”

相比之下,长期在一线与漏洞打交道的 Grinstead 则显得更为谨慎。 “这种工具对攻击者和防御者都同样有用,但它的普及至少在一定程度上把优势往防守一方那边稍微倾斜了一点。”他表示。 “更现实的说法是,现在没有人能真正给出这个问题的最终答案。”