News

深度解读：NVIDIA 2026 高端 GPU 出货格局——Blackwell 主导，Rubin 延迟

2026 年全球 AI 算力扩张的引擎是 Blackwell，不是 Rubin。这个判断的调整幅度（Blackwell +10pp，Rubin -7pp）足以改变整个 AI 基础设施投资周期的节奏。

1. 一句话定性

TrendForce 4 月 8 日最新报告最重要的信号不是具体数字，而是方向性变化：Blackwell 从 61% 上调到 71%，Rubin 从 29% 下调到 22%——这意味着下一代 GPU 的产业化进度比预期慢，当前世代的生命周期比预期长。对 AI 基础设施投资者和云厂商而言，这是一次计划调整。

2. 出货结构全景

GPU 系列	代表型号	预估份额	变化	状态
Blackwell	GB300 / B300 NVL	71%	↑ 从 61%	主力出货，云厂商大规模部署中
Rubin	R100 系列	22%	↓ 从 29%	延迟，技术瓶颈待突破
Hopper	H200 / H100	~7%	↓ 持续缩减	生命周期末期，对华出口政策影响

整体增长率： 全年 AI 服务器出货增长约 26%（从 26.8% 微调下行）。中低端 AI 服务器增速 >32%。

3. Blackwell 上调至 71% 的驱动力

3.1 云厂商大规模采购确认

Blackwell 份额上调的直接原因是云厂商的采购确认比预期更强劲：

CoreWeave：与 NVIDIA 签署多年大规模 GPU 采购协议（叠加 Anthropic + Meta 合计 $350 亿基础设施合约）
Oracle Cloud：大幅扩张 GPU 集群，Blackwell 是主力型号
AWS / Azure / GCP：三大云的 2026 CapEx 指引均包含大规模 Blackwell 部署计划

3.2 GB300 NVL72 机架方案的成熟

GB300 NVL72（72 卡机架方案）是 Blackwell 世代的旗舰部署形态：

72 块 GB300 GPU 通过 NVLink 全互联
单机架算力达到 1.4 ExaFLOPS（FP4）
液冷散热方案已通过主要云厂商的数据中心验证

NVL72 方案从”工程样品”到”规模部署”的转变是 Blackwell 份额上调的技术基础——不是更多客户想买，而是更多客户能部署了。

3.3 Blackwell 在 AI 训练/推理的双适用性

与 Hopper 主要定位训练不同，Blackwell 同时优化了训练和推理：

训练： FP8 和 FP4 精度下的算力相比 Hopper 提升约 2.5–4 倍
推理： Transformer Engine 和 MoE 支持显著降低推理延迟和成本

这种”双用途”定位意味着同一批硬件可以在训练和推理之间灵活调配——对云厂商的资产利用率是重大利好。

4. Rubin 延迟的四大技术瓶颈

Rubin（R100 系列）从 29% 下调到 22%，背后是四个相互关联的技术挑战：

4.1 HBM4 量产验证延迟

Rubin 设计搭配 HBM4（高带宽内存第四代），由三星和 SK 海力士供应
HBM4 的量产验证进度落后于原计划——制程复杂度和良率爬坡是主要瓶颈
没有 HBM4，Rubin 无法发挥设计性能——这是最根本的约束

4.2 CX8 → CX9 网络互联切换

NVIDIA 的机架级互联从 ConnectX-8（CX8）升级到 ConnectX-9（CX9）
CX9 支持更高的互联带宽，是 Rubin NVL 机架方案的关键组件
但 CX8 到 CX9 的切换涉及整个网络栈的重新验证——网卡、交换芯片、线缆、固件全部需要同步升级
这种”全栈切换”的验证周期比单一组件升级长得多

4.3 功耗管理

Rubin 单卡 TDP 预计显著高于 Blackwell
机架级功耗密度的提升要求数据中心的电力基础设施升级——不只是 GPU 本身的功耗，而是整个供电和配电系统
部分云厂商的现有数据中心电力容量可能无法直接支持 Rubin 机架

4.4 液冷方案优化

更高的功耗密度要求更先进的液冷散热
Blackwell NVL72 已经推动了液冷在数据中心的普及，但 Rubin 的散热需求进一步提升
液冷系统的设计、部署和运维仍在快速迭代中，尚未完全标准化

四个瓶颈的关键认知： 它们不是独立的，而是串联的——HBM4 延迟 → 整机验证推迟 → CX9 集成推迟 → 机架方案推迟 → 功耗和液冷方案无法实测验证。这种串联效应意味着任何一个环节的延迟都会放大为整体延迟。

5. Hopper 降至 7% 的双重原因

地缘政治影响

H200 对华出口在 BIS 新规下面临进一步收紧（参见同日 CN-2：TSMC “核准芯片设计商”新规）
中国市场曾是 Hopper 系列的重要出货目的地，管制加严直接削减了这部分需求

自然换代

在 Blackwell 性能大幅领先的情况下，非中国客户没有理由继续采购 Hopper
H100 二手市场价格持续下跌，进一步加速了换代

6. 对 AI 算力周期的影响

6.1 2026 年：Blackwell 年

原本市场预期 2026 年下半年 Rubin 开始放量——Rubin 份额下调意味着这个时间点可能推迟到 2027 年初甚至 Q2。2026 年全年将是 Blackwell 绝对主导的一年。

对 AI 公司的含义：

训练大规模模型（>1T 参数）的算力规划需要基于 Blackwell 而非 Rubin 来做
Blackwell 的供应紧张可能持续到 2026 Q3/Q4（因为 Rubin 无法如期分流需求）

6.2 2027 年：Rubin 能否接棒？

Rubin 延迟的幅度决定了 2027 年的算力格局：

乐观场景： HBM4 在 2026 H2 完成验证，Rubin 在 2027 Q1 开始规模出货 → 2027 年 Rubin 占比可达 40–50%
悲观场景： HBM4 延迟到 2027 Q1 才就绪 → Rubin 规模出货推迟到 2027 H2 → Blackwell 继续主导

6.3 AMD 的窗口

NVIDIA Rubin 延迟为 AMD 提供了宝贵的追赶窗口：

Meta 6GW 部署协议（2 月 24 日签署，约 $600 亿，MI450 架构）表明头部客户已在系统性构建多供应商格局
如果 Rubin 延迟到 2027 H2，AMD MI450 可能在部分场景（大规模推理、特定训练工作负载）中获得更多份额
但 NVIDIA 在软件生态（CUDA）上的护城河仍然是 AMD 的最大挑战

7. 中低端 AI 服务器增速 >32% 的信号

报告中容易被忽略的一个数据点：中低端 AI 服务器增速超过 32%，高于整体 26% 的增长率。

这意味着 AI 推理需求的增长速度正在超过训练需求——更多企业在部署已训练好的模型，而非训练新模型。中低端 GPU（如 L40S、H100 NVL 等）主要面向推理工作负载，其高增速反映了 AI 应用从”训练驱动”向”推理驱动”的转变。

8. 必须保留的质疑

TrendForce 数据基于供应链预测，非实际出货。 预测可能因客户延迟下单、产能调整等因素偏离实际。
71% Blackwell 份额是否已计入 AMD 分流？ Meta 6GW × AMD 合约是 2026 年最大的非 NVIDIA AI 芯片订单——如果 TrendForce 的 71% 仅指 NVIDIA 自有出货中的份额分布，AMD 对总市场的冲击需另行评估。
Rubin 22% 是否是保守估计？ 如果 HBM4 验证在 Q3 前完成，Rubin 份额可能回升——22% 可能反映的是”最坏情况”而非”基准情况”。
整体增长 26% 是否可持续？ AI CapEx 热潮已持续两年，云厂商的资本开支增速是否能维持？

9. 接下来要盯什么

SK 海力士 HBM4 量产时间表： 这是 Rubin 能否按时放量的关键变量
NVIDIA Q2 财报中的 Blackwell 出货数据和 Rubin 进度更新
AMD MI450 的首批大规模部署反馈
H200 对华出口政策变化： BIS 新规后 Hopper 7% 是否进一步缩减
GB300 NVL72 在超大规模云的部署规模和客户反馈

信源：

https://www.trendforce.com/presscenter/news/20260408-13003.html
TrendForce AI 服务器研究报告 2026Q2