News

深度解读：Project Glasswing 与 Claude Mythos Preview

Anthropic 第一次正面承认：前沿模型在网络攻防上越过临界点。它的回应不是封存能力，而是把这套能力先交到防御方手里。

1. 一句话定性

Project Glasswing 不是普通的产业联盟新闻，而是 Anthropic Responsible Scaling Policy 落地最重的一次实战动作——把一个未发布的前沿模型 Claude Mythos Preview，定向投放给全球关键软件基础设施的维护者，用来抢在攻击者之前清扫 OS、浏览器、内核、媒体库等核心代码里的高危漏洞。

2. 发生了什么

时间： 2026 年 4 月 7 日
形式： 同时发布 Project Glasswing 联盟 + 公开 Claude Mythos Preview 能力
联盟成员： AWS、Anthropic、Apple、Broadcom、Cisco、CrowdStrike、Google、JPMorganChase、Linux 基金会、Microsoft、NVIDIA、Palo Alto Networks
资金承诺： 最多 1 亿美元 Mythos Preview 使用额度 + 400 万美元直接捐给开源安全组织
能力定位： Mythos Preview 是「general-purpose, unreleased frontier model」，不在 Opus / Sonnet / Haiku 产品线之内，被刻意以”安全专用预览”的形态先行交付

3. Mythos Preview 的真实战果

Anthropic 给出的不是 demo 数据，而是已经被修复或正在协调披露的真实漏洞：

案例	影响范围	关键事实
OpenBSD 远程崩溃	被誉为最强化的开源 OS 之一，广泛用于防火墙	漏洞潜伏 27 年未被人类发现
FFmpeg 媒体库	几乎所有视频软件依赖	漏洞所在代码行被自动化测试命中 500 万次仍未触发
Linux 内核攻击链	全球大多数服务器	模型自主串联多个漏洞形成完整 exploit
主流 OS / 浏览器	全部主流 OS 与浏览器	已发现数千个高危漏洞

CyberGym 漏洞复现 benchmark 上：

Claude Mythos Preview：83.1%
Claude Opus 4.6：66.6%

差距约 16.5 个百分点——在已经接近天花板的前沿模型对比里，这是一次明显的代际跃迁。

4. 为什么 Anthropic 选了”先武装防御方”

这件事本质上是 RSP（Responsible Scaling Policy）的一次现实压力测试。

当模型具备超人类水平的漏洞挖掘能力时，Anthropic 面临三个选择：

封存能力，不发布。 —— 但能力会被竞争对手在几个月内复现。
公开发布。 —— 风险是攻击者获得同等能力，关键基础设施暴露。
结构化提前投放给防御方。 —— Glasswing 走的就是这条。

Anthropic 在公告里直白地写：「Given the rate of AI progress, it will not be long before such capabilities proliferate.」翻译成大白话——封是封不住的，那就让防御方先用上几个月。

这背后的隐含判断是：前沿 AI 在攻防上的不对称窗口非常短，需要在窗口期内完成对全球关键软件的”AI 辅助审计”。

5. 联盟阵容的信息量

Glasswing 的成员名单值得逐个看：

三大云： AWS、Google、Microsoft —— 全球大多数关键服务的运行底座
OS / 硬件： Apple、Linux 基金会、NVIDIA、Broadcom —— 操作系统与芯片栈
网络与安全： Cisco、CrowdStrike、Palo Alto Networks —— 网络设备与安全分发渠道
金融关键基础设施： JPMorganChase —— 现实世界关键系统的代表

把云、芯、OS、网络、安全、金融全部凑齐，覆盖面已经接近”现代数字社会的关键骨架”。这种联盟阵容在网络安全史上并不常见——上一次量级类似的协作大概要追溯到 Heartbleed 或 Log4Shell 之后的产业响应，而那些都是事后应急。Glasswing 是事前集结，性质完全不同。

6. 这件事对行业的几层影响

6.1 对前沿模型厂

OpenAI / Google DeepMind / xAI / Meta 都必须回应。 一旦 Mythos 级能力被证实，沉默就等于在 RSP 叙事上失分。
“安全专用预览”很可能成为新范式： 把超能力以特定行业、特定合作方的限定形式先行投放，绕开”是否公开发布”的二元选择。

6.2 对网络安全行业

传统漏洞挖掘的人力护城河被快速削弱。 27 年 OpenBSD 漏洞、500 万次测试都没抓到的 FFmpeg bug，意味着人类专家 + 模糊测试的组合天花板被 AI 突破。
甲方安全团队的工具链会被重写： CrowdStrike、Palo Alto 已经在集成；未公布的二线安全厂会面临”接入还是被边缘化”的选择。
奖金型漏洞市场（bug bounty）将剧烈通胀： 高质量 0day 的发现速度大幅提升后，定价机制需要重构。

6.3 对开源软件与关键基础设施

400 万美元捐给开源安全是象征性而非充分的。 真正的价值在于联盟成员把 Mythos 用在自己依赖的开源组件上，外溢出去的补丁。
OpenBSD、FFmpeg、Linux 内核三个案例说明：开源核心组件即将迎来一次”AI 辅助大扫除”。 长期看是好事，短期内会有大量被披露但尚未修复的窗口期。

6.4 对国家与监管

Anthropic 在公告里直接提到 democratic states 的安全优先级。 这是把前沿模型与地缘政治叙事进一步绑定。
欧盟 AI Act、美国行政令体系都要面对一个新问题： 当一个未公开发布的模型已经在运行国家级基础设施的安全审计时，监管对象到底是模型本身、是合作方，还是联盟整体？

7. 必须保留的质疑

不能只买单 Anthropic 的叙事，几个值得追问的点：

独立复现窗口极小。 Mythos Preview 不开放 API、不开放权重，外部研究者无法验证 CyberGym 83.1% 的数据。Anthropic 与少量合作方的口径目前是唯一信息源。
“防御方优先”的边界如何长期维持？ 1 亿美元额度发完之后，这套能力会如何处置？是合并进 Opus 系列、独立成产品线，还是继续保持”特许使用”？没有公开路线图。
联盟成员的利益绑定可能弱化质疑。 当 12 家关键厂商都拿到优先访问权时，独立批评的来源会显著减少。
漏洞披露节奏的伦理问题。 数千个高危漏洞中只有部分已修复，剩余以 cryptographic hash 方式预披露——这套节奏由 Anthropic 单方面掌握，缺少第三方监督机制。
“超人类漏洞挖掘”也意味着超人类攻击潜力。 Glasswing 是赌防御方比攻击方先用上、用得比攻击方更彻底——这个赌注的对错可能要几年后才能验证。

8. 接下来要盯什么

Frontier Red Team blog 的后续技术披露（Anthropic 承诺会公布部分已修复漏洞的细节）
联盟成员的实战反馈： Cisco、Microsoft、CrowdStrike 已经表态在用，未来几周会有更多 case study
OpenAI / Google DeepMind / xAI 的同类回应 —— 是否会公布对标的”安全专用前沿模型”
Mythos 与 Opus 5 的关系 —— 这两条线最终会合并，还是长期并行
未列入联盟的关键玩家： Meta、Oracle、Salesforce、Oracle Cloud、几大主权云（中国 / 欧洲）的态度

9. 给动动的一句结论

Glasswing 不是一次”产品发布”，是 Anthropic 把”前沿 AI 的攻防失衡”摆上桌的方式。它同时回答了三个问题：能力到哪了（Mythos = 超人类漏洞挖掘）、怎么发布（结构化投放给防御方）、为什么是现在（窗口很短）。这条线值得 Lighthouse 长期跟踪——它可能是 2026 年 RSP 实战化最具代表性的一次落子。

信源：

https://www.anthropic.com/news/project-glasswing
https://www.anthropic.com/glasswing
Anthropic Frontier Red Team Blog（待持续跟踪）

📌 2026-04-19 更新

白宫关系回暖：Mythos 从“被五角大楼拉黑”转向“与行政系统带条件磨合”

TechCrunch 2026-04-18 披露新进展：尽管五角大楼此前把 Anthropic 列为 supply-chain risk，公司仍在继续与特朗普政府高层接触。
核心会面对象被明确化：Axios 报道，美国财长 Scott Bessent 与白宫幕僚长 Susie Wiles 已和 Dario Amodei 会面；白宫将该会面定性为“productive and constructive”的 introductory meeting。
白宫表述的重点：双方讨论了 collaboration opportunities，以及在 scaling this technology 过程中的 shared approaches and protocols。
Anthropic 自身表述的重点：公司称已与 senior administration officials 就 cybersecurity、America’s lead in the AI race、AI safety 等 shared priorities 进行“productive discussion”，并期待继续沟通。
这和前几天的监管紧张并不矛盾：更像是美国政府内部出现了分裂——五角大楼在军事采购与供应链风险上继续强硬，但财政、白宫乃至部分民用/金融相关部门并不想完全把 Anthropic 排除在外。
评价修正：我们此前把 Mythos 线索更多理解为“能力太强，因而触发金融与国防端监管升级”；今天这条更新说明，Anthropic 并未进入全面冻结状态，而是在“高监管 + 高需求”的张力中继续争取行政系统入口。换句话说，Mythos 的短期前景从“单向受限”修正为“受限但仍有政策突破口”。

新增信源：

https://techcrunch.com/2026/04/18/anthropics-relationship-with-the-trump-administration-seems-to-be-thawing/

📌 2026-04-11 更新

合作伙伴名单确认 12 家：AWS、Apple、Broadcom、Cisco、CrowdStrike、Google、JPMorganChase、Linux Foundation、Microsoft、NVIDIA、Palo Alto Networks（外加 Anthropic 自身）
定价披露：Mythos Preview 定为 $25 输入 /$ 125 输出 per MTok，明确为 B2B 安全企业级工具
配套捐赠：向 Alpha-Omega/OpenSSF 捐 $250 万，向 Apache 软件基金会捐$ 150 万
SWE-bench Pro 编码得分：77.8%（vs Opus 4.6 的 53.4%）
Fortune 后续报道：“too dangerous to release” 的内部叙事得到二次确认，Anthropic IPO 前借这次发布展示责任叙事

📌 2026-04-12 更新

全球金融监管连锁反应：G7 三大央行级别紧急响应

Mythos 的网络安全能力已从 AI 安全技术议题升级为全球金融系统稳定性议题，72 小时内触发三个 G7 国家央行级别的同步响应——这在 AI 模型发布史上前所未有。

美国（4 月 10 日）：

财长 Scott Bessent 与联储主席 Jerome Powell 联合紧急召见美国主要银行 CEO，专题讨论 Mythos 对金融系统的网络安全风险
出席者：Jane Fraser（Citigroup）、Ted Pick（Morgan Stanley）、Brian Moynihan（Bank of America）、Charlie Scharf（Wells Fargo）、David Solomon（Goldman Sachs）
Jamie Dimon（JPMorganChase）受邀但缺席——值得注意的是 JPMorgan 同时是 Glasswing 联盟的 12 家创始成员之一
Powell + Bessent 联合召见银行 CEO 极为罕见，通常只在金融危机或系统性风险场景出现

英国（4 月 11 日）：

英国央行（BOE）宣布将在下一次 CMORG（跨市场运营韧性小组） 及新设的 CMORG AI Taskforce 会议上专题讨论 Mythos 风险
参与方包括英国财政部、FCA（金融行为监管局）和 NCSC（国家网络安全中心）
NCSC 将 Mythos 评定为”评估过的最具网络攻击能力的模型”——这一定性直接触发了金融监管议程升级

加拿大（4 月 11 日）：

加拿大央行同日与银行和金融公司召开紧急会议，讨论 Mythos 相关网络安全风险
三国央行的同步响应表明已超越双边层面，正在形成 G7 级别的协调立场

技术侧进展：

AWS Bedrock 已上线 Claude Mythos Preview（受限研究预览，仅 us-east-1 区域）
这是 Mythos 首次通过云平台以 API 形态可访问，但仍限制在安全研究用途

产业含义：

对 Anthropic 而言是双刃剑：NCSC “最具能力”的定性强化技术领先叙事，但央行级监管关注可能延长金融机构客户的采购决策周期
下一步关注点：BIS（国际清算银行）或 FSB（金融稳定委员会）是否在 30 天内发布 AI 网络安全相关金融稳定声明
这一事件实质上重新定义了前沿 AI 模型的”风险评估主体”——从 AI 公司自律扩展到主权金融监管体系

信源： CNBC 2026-04-10 / Bloomberg 2026-04-10 / Bloomberg 2026-04-11 (BOE CMORG) / AWS Bedrock 文档

📌 2026-04-13 更新

BoE CMORG 紧急会议正式排期：跨大西洋金融监管进入”准系统性风险”级别

英格兰银行风险主管 Duncan Mackinnon 将在两周内主持 CMORG（Cross Market Operational Resilience Group）紧急会议，专题审议 Claude Mythos 对金融系统的安全影响（Bloomberg 4/11 报道确认）
CMORG 是英国金融市场基础设施的最高级别韧性协调机制，此前仅在 2020 年 COVID 市场动荡和 2023 年英国养老金危机时启动——为一个未发布的 AI 模型启动 CMORG 在历史上前所未有
FCA（金融行为监管局）4 月记录首次将”智能体 AI 在支付和金融市场中的风险增长”列为显著关切，与 CMORG 议程形成监管联动
跨大西洋同步升级：美联储主席 Powell 和财政部长 Bessent 此前已与美国主要银行 CEO 举行闭门会议（4/10），英国 CMORG 响应（4/11）构成 72 小时内的跨大西洋协调——距 G7/FSB 多边框架仅一步之遥
矛盾信号浮现：TechCrunch 4/12 报道 Trump 行政官员可能在鼓励银行测试 Mythos 模型，与五角大楼供应链风险黑名单形成政策冲突——Anthropic 同时面临”被监管”和”被推广”的双重压力

新增基准数据：

CyberGym 83.1%（vs Opus 4.6 的 66.6%）
Terminal-Bench 2.0: 82%
GPQA Diamond: 94.5%

Glasswing 联盟最新进展：

$1 亿计算资源 +$ 400 万开源安全捐款的承诺已进入执行阶段
AWS Bedrock 已上线 Claude Mythos Preview（受限研究预览，仅 us-east-1 区域）

下一步关注点： ① CMORG 会议具体日期（两周内 ≈ 4 月 25 日前后）和结论声明；② BIS/FSB 是否跟进发布多边 AI 安全金融稳定声明；③ FCA 是否出台针对智能体 AI 的具体金融监管指引；④ Mythos 有限发布时间表是否因监管压力调整

信源： Bloomberg 2026-04-11 / CNBC 2026-04-10 / Yahoo Finance / TechCrunch 2026-04-12

📌 2026-04-20 更新

NSA 已在用 Mythos：Anthropic 从“争取白宫入口”走到“进入安全机构试用”

Reuters 4 月 19 日转述 Axios 新进展：美国国家安全局（NSA）已经在使用 Anthropic 的 Mythos Preview，尽管五角大楼此前仍把 Anthropic 标为 formal supply-chain risk。
使用范围不再只是单点试探：Reuters 文中明确写到，Mythos Preview 在该部门内“used more widely”，这意味着它不是象征性 demo，而是开始进入更实际的内部试用语境。
制度冲突进一步坐实：NSA 隶属国防部，而国防部对 Anthropic 的供应链风险定性尚未撤销；一边继续黑名单化，一边实际在用 Mythos，说明美国政府内部对前沿模型的态度已不是简单的一刀切，而是典型的“高风险能力 + 高需求场景”并行推进。
与 4 月 19 日的白宫会面信号形成闭环：此前我们把线索定义为“Anthropic 仍在争取行政系统入口”；今天新增的硬信息是，入口并不只是口头讨论，至少在 NSA 这样的高敏机构里，Mythos 已经进入真实测试或使用阶段。
评价修正：这条更新把我们对 Mythos 政务化进展的判断从“受限但仍有政策突破口”进一步修正为“受限但已发生机构级落地试用”。真正悬而未决的问题，不再是“政府会不会碰 Mythos”，而是“试用会不会转成正式采购、明确使用守则或跨机构扩散”。

新增信源：