AMD + Meta 6GW 供电协议:一纸合同如何搅动 GPU 垄断格局
AMD + Meta 6GW 供电协议:一纸合同如何搅动 GPU 垄断格局
主要信源:https://www.globenewswire.com/news-release/2026/02/24/3243383/0/en/AMD-and-Meta-Announce-Expanded-Strategic-Partnership-to-Deploy-6-Gigawatts-of-AMD-GPUs.html 交叉验证:https://www.amd.com/en/newsroom/press-releases/2026-2-24-amd-and-meta-announce-expanded-strategic-partnersh.html 事件日期:2026-02-24
速查卡
| 项目 | 内容 |
|---|---|
| 一句话总结 | Meta 与 AMD 签署 5 年战略扩展协议,承诺部署 6 吉瓦 AMD Instinct GPU,这是有史以来最大的非 NVIDIA GPU 供应协议 |
| 大白话版 | Meta 决定不再把鸡蛋全放在 NVIDIA 的篮子里,跟 AMD 签了一个超级大单——6 吉瓦的 GPU 算力,相当于 Mistral 整个算力目标的 30 倍,AMD 还给 Meta 开出了 1.6 亿股的认股权证作为绑定 |
| 核心数字 | 6GW GPU 总部署量 / 5 年协议期 / 1.6 亿股 AMD 认股权证 / 2026 H2 首批 1GW 交付 / MI450 定制 GPU + Venice EPYC CPU |
| 影响评级 | S — 改变 GPU 供应链双寡头格局的结构性事件 |
| 利益相关方 | AMD(收入结构性跃升)/ Meta(算力多元化)/ NVIDIA(垄断地位首次受实质挑战)/ ROCm 生态(获得超大规模验证)/ 整个 AI 基础设施供应链 |
事件全貌
发生了什么
2026 年 2 月 24 日,AMD 与 Meta 联合宣布扩展战略合作伙伴关系,核心条款:
| 项目 | 内容 |
|---|---|
| 协议类型 | 多年期、跨代际扩展战略合作 |
| GPU 部署总量 | 6 吉瓦 AMD Instinct GPU |
| GPU 型号 | 基于 MI450 架构的定制 GPU |
| CPU 配套 | 第 6 代 AMD EPYC “Venice” + 下一代 “Verano” |
| 系统架构 | AMD Helios 机架级架构 |
| 软件栈 | ROCm 平台 |
| 首批交付 | 2026 年下半年,首批 1GW |
| 认股权证 | Meta 获得基于绩效的认股权证,最高可购买 1.6 亿股 AMD 普通股 |
| 路线图对齐 | 芯片、系统、软件三条线全对齐 |
6 吉瓦意味着什么
“吉瓦”在 AI 算力语境中不是一个常见单位,但它正在成为超大规模数据中心的新度量衡。把 6GW 放在参照系中看:
| 对比对象 | 功率 | 比例 |
|---|---|---|
| 本次 AMD-Meta 协议 | 6 GW | 基准 |
| Mistral 全部算力目标 | 200 MW | AMD-Meta 是其 30 倍 |
| 一座典型超大规模数据中心 | 200-500 MW | 相当于 12-30 座 |
| 美国全部数据中心(2024 估算) | ~25 GW | 约占 24% |
| 三峡大坝装机容量 | 22.5 GW | 约占 27% |
| 一座核电站典型输出 | 1 GW | 等于 6 座核电站 |
6GW 不是一个数据中心的概念,而是一个国家级基础设施的概念。这意味着 Meta 正在为未来五年的 AI 基础设施做一个数量级的赌注,而且这个赌注的核心不是 NVIDIA。
为什么是现在
这个时机需要从三个维度理解:
1. Meta 的算力饥渴
Meta 在 AI 基础设施上的投入在 2025-2026 年进入了一个陡峭的上升曲线。Llama 系列模型的训练和推理、Instagram/Facebook 的推荐系统、AR/VR 计算,以及正在快速扩展的 Meta AI Agent 业务,都在消耗巨量 GPU。单一供应商已经不够。
2. AMD 的产品成熟
MI300 系列在 2024-2025 年让 AMD 证明了自己在数据中心 GPU 市场不只是”存在”,而是”可用”。Meta 此前已经大规模部署了 MI300 和 MI350 系列 GPU,以及数百万颗 EPYC CPU。这次合作不是从零开始,而是基于已验证的大规模部署经验。
3. NVIDIA 供应链的结构性约束
NVIDIA 的 GPU 产能长期供不应求。对 Meta 这种级别的客户来说,将 100% 的算力需求绑定在单一供应商上是不可接受的战略风险。6GW 的 AMD 合同本质上是 Meta 在做供应链对冲。
技术解析
MI450:AMD 的超大规模杀手锏
MI450 是 AMD Instinct 系列的下一代旗舰 GPU,也是本次协议的硬件核心。虽然 AMD 尚未披露完整规格表,但从协议和此前公开信息可以推断:
架构定位
MI450 是 MI300 → MI350 → MI450 的演进路线上的产物。MI300 在 2024 年以”整块 GPU 即一台服务器”的封装哲学引起关注,MI350 进一步优化了内存带宽和互联。MI450 要做的,是成为第一款从设计之初就面向吉瓦级部署的 GPU。
“定制”是这里的关键词。AMD 为 Meta 做的不是给标准 MI450 贴个标签,而是在芯片层面进行工作负载优化。这意味着:
- 针对 Meta 的 Llama 系列模型推理特征优化计算单元配比
- 针对 Meta 数据中心的散热和供电条件优化功耗曲线
- 针对 Helios 架构的互联需求优化片上网络
与 NVIDIA 同代产品的竞争维度
| 维度 | AMD MI450(推测) | NVIDIA 同代(Blackwell Ultra/Rubin) |
|---|---|---|
| 制程 | 先进封装 + 台积电先进节点 | 台积电先进节点 |
| 内存 | HBM4(预期) | HBM3e / HBM4 |
| 互联 | Helios 机架级互联 | NVLink + NVSwitch |
| 软件栈 | ROCm | CUDA |
| 定制化 | 为 Meta 定制 | 标准化产品 |
| 供应确定性 | 5 年协议锁定 | 按季度分配 |
AMD 在这笔交易中的核心卖点不是”比 NVIDIA 更快”(在绝对性能上 NVIDIA 仍然领先),而是:供应确定性 + 定制化 + 系统级整合(GPU + CPU + 机架)+ 成本效率。
Venice EPYC:第 6 代服务器 CPU
Venice 是 AMD EPYC 的第 6 代产品,Meta 是其主力客户。关键要点:
- 性能/美元/瓦特的领导力:AMD 在服务器 CPU 上已经连续几代在性能功耗比上领先 Intel。Venice 延续这一趋势。
- 与 MI450 的协同设计:Venice 不只是”旁边放一颗 CPU”,而是与 MI450 在数据通路、内存层次、电源管理上做了系统级协同。
- 下一代 Verano 的路线图:协议中提到 Verano 是 Venice 之后的下一代 CPU,带有”工作负载特定优化”。这暗示 AMD 正在为 Meta 的特定工作负载(比如推荐系统推理、大模型推理)开发定制 CPU 微架构调整。
Meta 已经部署了数百万颗 AMD EPYC CPU。这不是一个新关系的开始,而是一个深度绑定的加深。
Helios:机架级架构的野心
Helios 是 AMD 与 Meta 通过 Open Compute Project(OCP)联合开发的机架级架构,于 2025 年 OCP 全球峰会上发布。
传统数据中心的计算单元是”服务器”——一台机器里放几块 GPU 和 CPU。Helios 的思路是把整个机架作为一个计算单元来设计:
传统架构 Helios 架构
┌─────────────┐ ┌─────────────────────────┐
│ 服务器 1 │ │ Helios 机架 │
│ GPU + CPU │ │ │
├─────────────┤ │ ┌─────┐ ┌─────┐ │
│ 服务器 2 │ │ │ GPU │ │ GPU │ ... │
│ GPU + CPU │ │ │ 托盘 │ │ 托盘 │ │
├─────────────┤ │ └──┬──┘ └──┬──┘ │
│ 服务器 3 │ │ │ │ │
│ GPU + CPU │ │ ┌──┴───────┴──┐ │
├─────────────┤ │ │ 统一互联层 │ │
│ ... │ │ │ (高带宽) │ │
└─────────────┘ │ └──────┬──────┘ │
│ ┌──────┴──────┐ │
各服务器独立, │ │ CPU + 内存 │ │
通过网络交换机互联 │ │ 共享资源池 │ │
│ └─────────────┘ │
│ │
│ 统一供电、散热、管理 │
└─────────────────────────┘
Helios 架构的核心优势:
- 更高的 GPU 密度:去掉每台服务器独立的机箱、电源、风扇等冗余组件,同样的物理空间塞更多 GPU
- 更好的互联带宽:机架内 GPU 之间的通信不需要经过网络交换机,延迟更低、带宽更高
- 统一散热和供电:机架级的液冷和供电设计比服务器级更高效
- 与 OCP 兼容:通过 Open Compute Project 推动标准化,避免被单一厂商锁定
Helios 是 AMD 对抗 NVIDIA DGX SuperPOD 的答案。NVIDIA 用 DGX 定义了”AI 服务器”这个品类,AMD 试图用 Helios 把竞争维度从”服务器”拉到”机架”。
ROCm:软件栈的关键变量
整个协议的执行风险中,ROCm 是最关键的变量。
ROCm 是 AMD 对标 CUDA 的 GPU 计算软件栈。长期以来,ROCm 被认为是 AMD 在数据中心 GPU 市场的最大短板——不是硬件不行,而是软件生态不够成熟。
Meta 6GW 协议对 ROCm 的意义:
| 维度 | 影响 |
|---|---|
| 验证 | 全球最大的 AI 公司之一在吉瓦级规模上押注 ROCm,这是最强的市场信号 |
| 贡献 | Meta 的工程团队会向 ROCm 贡献大量针对实际工作负载的优化和 bug 修复 |
| 生态引力 | 其他超大规模客户看到 Meta 的 ROCm 部署成功后,采用意愿会显著增加 |
| 人才 | ROCm 相关的工程岗位需求增加,吸引更多开发者进入生态 |
但 ROCm 的挑战依然存在:
- CUDA 有超过 15 年的生态积累,ROCm 的库覆盖率和优化深度仍有差距
- 大量第三方 AI 框架和工具默认只支持 CUDA,ROCm 兼容性需要持续投入
- 从”Meta 内部好用”到”整个行业好用”还有很长的路
认股权证结构:金融工程的精妙设计
这笔交易中最被低估的部分是认股权证(warrant)结构。AMD 向 Meta 发行了基于绩效的认股权证,允许 Meta 最多购买 1.6 亿股 AMD 普通股。
认股权证的行权条件
认股权证的行权分多个批次(tranche),行权条件是双重绑定:
| 条件维度 | 具体要求 |
|---|---|
| AMD 侧 | AMD 股价达到特定阈值 |
| Meta 侧 | Meta 完成关键技术和商业里程碑 |
| 第一批次 | 首批 1GW GPU 交付时解锁 |
| 后续批次 | 随采购量从 1GW 扩展到 6GW 逐步解锁 |
为什么这个结构很聪明
对 AMD:
-
锁定客户:Meta 持有 AMD 认股权证意味着 Meta 在财务上与 AMD 股价绑定。如果 Meta 把采购量转给 NVIDIA,AMD 股价可能下跌,Meta 手里的认股权证也会贬值。这创造了一个自我强化的承诺机制。
-
延迟稀释:认股权证只在绩效达标时行权,不会立即稀释现有股东。Jean Hu(AMD CFO)明确表示预期该合作”对非 GAAP 每股收益有增厚效应”——这意味着 AMD 判断订单收入的增长会超过股权稀释的成本。
-
股价催化剂:认股权证的行权条件之一是 AMD 股价达到特定阈值。这意味着市场需要先认可 AMD 的增长故事,认股权证才会行权。
对 Meta:
-
锁定供应 + 获得上涨收益:Meta 不只是买 GPU,还能从 AMD 因这笔交易带来的增长中获利。如果 AMD 因为 Meta 的订单而股价上涨,Meta 持有的认股权证本身就值钱。
-
对冲采购成本:如果 GPU 价格上涨(通常伴随 AMD 股价上涨),认股权证的收益可以部分对冲采购成本的增加。
-
战略影响力:持有 1.6 亿股认股权证使 Meta 成为 AMD 的重要潜在股东,在 AMD 的战略决策中拥有更大的话语权。
1.6 亿股的规模
以 AMD 当前约 16 亿股的流通股计算,1.6 亿股约占 10%。这是一个非常大的比例——如果全部行权,Meta 将成为 AMD 最大的股东之一。
这不是一个简单的买卖关系,而是一个准联盟关系。
产业影响链
上游:GPU 供应格局从单极走向双极
过去五年,超大规模数据中心的 GPU 采购几乎是 NVIDIA 的独角戏。Google 有 TPU,但那是自用。AMD 有 MI 系列,但规模有限。
6GW AMD 协议改变了这个格局:
之前:
NVIDIA ████████████████████████████████████████ 90%+
AMD ███ <10%
之后(预期 2028):
NVIDIA ████████████████████████████████ ~75%
AMD ████████████████ ~20%
其他 ███ ~5%
这不是 AMD “击败” NVIDIA,而是 GPU 市场从单一供应商主导转向双供应商格局。对整个行业来说,这比谁的 benchmark 更高重要得多,因为:
- 双供应商意味着议价能力回归客户
- 双供应商意味着供应链韧性提高
- 双供应商意味着技术创新竞争加速
中游:ROCm 生态的临界点
一个软件生态的成功需要跨过一个临界点——足够多的用户产生足够多的贡献,形成自我强化循环。
Meta 6GW 可能就是 ROCm 的临界点事件:
- Meta 的工程规模:Meta 有世界上最大的 AI 工程团队之一。他们在 ROCm 上的投入会产生大量优化、补丁和最佳实践,这些会回流到开源社区。
- 信号效应:其他超大规模客户(Microsoft、Oracle、字节跳动等)在看到 Meta 的成功案例后,会更愿意在 ROCm 上投入。
- 人才效应:ROCm 从”小众技能”变成”必备技能”,吸引更多工程师加入生态。
但需要警惕的是,Meta 的 ROCm 部署可能高度定制化。如果 Meta 的优化没有回流到通用 ROCm 版本,其他用户可能仍然面临”ROCm 不好用”的问题。
下游:其他超大规模客户的连锁反应
Meta 的 6GW 协议不是在真空中发生的。它会触发其他超大规模客户的战略重新评估:
| 公司 | 可能的反应 |
|---|---|
| Microsoft | 与 NVIDIA 深度绑定(Azure + OpenAI),但可能寻求 AMD 作为补充供应商 |
| 自有 TPU,但也在使用 NVIDIA GPU。可能加速 TPU 部署以减少对外部依赖 | |
| Amazon | 自有 Trainium/Inferentia + NVIDIA GPU。可能考虑引入 AMD 作为第三选项 |
| Oracle | 已经在 OCI 中使用 AMD GPU。可能扩大 AMD 采购比例 |
| 字节跳动 | 在中国面临 NVIDIA 出口限制,AMD 可能成为重要替代选项 |
NVIDIA 的应对
NVIDIA 不会坐视不理。可能的应对包括:
- 价格策略调整:对大客户提供更具竞争力的价格或长期供应保证
- 供应优先级:优先保障超大规模客户的供应,减少中小客户的分配
- 软件锁定加深:通过 CUDA、Dynamo、Nemo 等软件栈加深生态绑定
- 定制化回应:也向大客户提供定制 GPU 选项(此前 NVIDIA 以标准化产品为主)
竞争格局变化
| 维度 | 协议前 | 协议后 |
|---|---|---|
| GPU 供应格局 | NVIDIA 近乎垄断超大规模市场 | AMD 获得吉瓦级验证,双供应商格局初现 |
| AMD 的市场地位 | ”可用的替代品" | "战略级供应商” |
| ROCm 的可信度 | ”能跑,但不确定能大规模跑" | "全球最大 AI 公司之一在吉瓦级规模押注” |
| Meta 的议价能力 | 受限于 NVIDIA 供应分配 | 两个主要供应商可以互相竞价 |
| 定制化趋势 | 超大规模客户接受标准化产品 | 定制 GPU + CPU + 机架成为新常态 |
| 机架级架构 | NVIDIA DGX SuperPOD 主导叙事 | Helios 提供了 OCP 兼容的替代方案 |
时间线与里程碑
| 时间 | 事件 |
|---|---|
| 2024 | Meta 开始大规模部署 AMD MI300 系列 GPU 和 EPYC CPU |
| 2025 | AMD 和 Meta 通过 OCP 发布 Helios 机架级架构 |
| 2025 | MI350 系列交付,Meta 扩大部署 |
| 2026-02-24 | 宣布 6GW 扩展战略合作协议 |
| 2026 H2 | 首批 1GW MI450 + Venice 交付,第一批认股权证解锁 |
| 2027-2028 | 后续批次交付,向 6GW 目标推进 |
| 2028-2030 | Verano 下一代 CPU 交付,协议完全执行 |
批判性分析
1. 6GW 是承诺,不是订单
需要明确的是,6GW 是一个框架协议的目标,不是一张确定的采购订单。协议是”多年期、多代际”的,意味着实际采购量取决于:
- AMD 能否按时交付合格的 MI450 及后续产品
- Meta 的实际算力需求是否如预期增长
- ROCm 在 Meta 内部的部署是否顺利
- 认股权证的绩效条件是否达成
如果 MI450 的性能或可靠性不达预期,Meta 完全可能缩减采购量。6GW 是天花板,不是地板。
2. 认股权证是双刃剑
1.6 亿股认股权证在行权时会稀释 AMD 现有股东约 10%。虽然 AMD CFO 表示对每股收益”有增厚效应”,但这取决于:
- GPU 订单的利润率是否足够高
- AMD 股价是否真的因为这笔交易而上涨到行权阈值
- 如果 AMD 股价不达标,认股权证不行权,Meta 的绑定效应也会减弱
3. 执行风险不容忽视
AMD 从未在单一客户上执行过吉瓦级部署。MI300 的规模部署虽然积累了经验,但从百兆瓦级跳到吉瓦级是一个数量级的跨越。供应链管理、产品质量控制、技术支持团队的扩展,每一个环节都可能成为瓶颈。
4. NVIDIA 不会站着不动
NVIDIA 有超过 10 年的超大规模数据中心经验、全球最成熟的 GPU 软件生态、以及强大的供应链管理能力。面对 AMD 的挑战,NVIDIA 的反应可能包括更激进的定价、更灵活的定制化、以及通过 Dynamo 等软件进一步加深锁定。
竞争从来不是静态的。AMD 今天签了 6GW,不代表明天就能顺利交付 6GW。
5. 被低估的变量:地缘政治
AMD 和 NVIDIA 的 GPU 都依赖台积电制造。如果台海局势紧张,两家公司的供应链都会受到影响。但有一个微妙的差异:AMD 的 CPU(EPYC)为 Meta 的数据中心提供了一个非 Intel 的选择,而 AMD 的 CPU 和 GPU 能够在同一套系统架构中协同工作,这在供应链多元化的角度上有额外价值。
我的判断
AMD-Meta 6GW 协议的核心意义不在于 AMD 能否在 benchmark 上超过 NVIDIA。它的意义在于:
GPU 算力市场第一次出现了真正的结构性竞争。
过去十年,“AI 基础设施”几乎等于”NVIDIA GPU”。这不健康——对客户来说,单一供应商意味着没有议价权和供应风险;对行业来说,缺乏竞争会减缓创新速度。
Meta 用 6GW 的真金白银告诉市场:AMD 是一个可以承载超大规模 AI 负载的平台。这个信号的价值,可能比 6GW 本身更大。
但同时要保持清醒:
- NVIDIA 的生态护城河(CUDA + 全栈软件)不是一纸合同能抹平的
- AMD 的执行能力在吉瓦级规模上尚未被验证
- 认股权证的绑定机制很精巧,但也引入了复杂的利益纠葛
这是一个 “破冰”事件,不是”胜负已分”事件。接下来 12 个月的关键观察点:
- 2026 H2 首批 1GW 是否按时交付
- Meta 内部 ROCm 部署的实际表现(性能、稳定性、工程效率)
- 其他超大规模客户是否跟进与 AMD 签署类似协议
- NVIDIA 的竞争性回应(定价、定制化、软件锁定)
本文基于 AMD/Meta 联合新闻稿、GlobeNewsWire 公告及行业公开信息撰写。技术规格中标注”推测”的部分基于已知产品路线图和行业分析推断,不代表 AMD 官方确认。