News
华为昇腾万卡级全栈自主可控智算集群点亮
华为昇腾万卡级全栈自主可控智算集群点亮
主要信源:驱动之家 / 新闻 Google 交叉验证:华为昇腾官方路线图 / 行业分析 事件日期:2026-04-01
速查卡
| 项目 | 内容 |
|---|---|
| 一句话总结 | 全国首个万卡级(10,000+ 卡)全栈自主可控智算集群正式点亮,搭载华为先进昇腾 AI 芯片 |
| 大白话版 | 中国用全部自己造的芯片和软件,搭建了一个一万多张卡的超大 AI 训练集群,不依赖英伟达 |
| 核心数字 | 万卡级集群 / 昇腾 950PR 自研 HBM / 预计 2026 年占中国 AI 芯片市场 50% |
| 影响评级 | A — 中国去英伟达化进程的关键里程碑 |
| 利益相关方 | 受益:华为昇腾生态链 / 受损:NVIDIA 中国市场份额 |
事件全貌
发生了什么?
2026 年 4 月 1 日,全国首个万卡级全栈自主可控智算集群正式点亮。“全栈自主可控”意味着从芯片到框架到集群管理全部国产化:
| 层级 | 组件 | 说明 |
|---|---|---|
| 芯片 | 华为昇腾系列 | AI 训练/推理芯片 |
| HBM | 华为自研 HBM | 昇腾 950PR 首次采用 |
| 框架 | MindSpore / CANN | 训练框架和算子库 |
| 互联 | 华为超节点互联 | 高速芯片间通信 |
| 集群管理 | 华为 Atlas 系列 | 集群调度和管理 |
昇腾三年路线图
| 芯片 | 时间 | 关键特性 | 估价 |
|---|---|---|---|
| 昇腾 910B | 已量产 | 对标 A100 级别 | ~3-4 万元 |
| 昇腾 950PR | 2026 Q1 | 自研 HBM | ~7 万元 |
| 昇腾 960 | 2026 H2 | 性能提升 | — |
| 昇腾 970 | 2027 | ”全球最强超节点”目标 | — |
商业化进展
- 字节跳动:据传将购买 400 亿元昇腾芯片
- 阿里、腾讯:加大昇腾部署
- 市场份额预测:2026 年华为占中国 AI 芯片市场 50%
技术解析
全栈自主可控的含义
“全栈自主可控”在 AI 算力语境下有明确的技术层次:
- 芯片自主:昇腾 AI 处理器,非 ARM 授权的通用核心
- 存储自主:昇腾 950PR 首次采用华为自研 HBM(而非 SK 海力士/三星),这是最关键的突破——HBM 是 AI 芯片的”弹药库”
- 框架自主:MindSpore 训练框架 + CANN 算子库
- 互联自主:超节点间高速互联,对标 NVLink
- 集群自主:Atlas 系列集群管理和调度
与 NVIDIA 集群的对比
| 维度 | 华为昇腾万卡集群 | NVIDIA DGX SuperPOD |
|---|---|---|
| 芯片 | 昇腾 950PR | H100/H200/B200 |
| HBM | 华为自研 HBM | SK 海力士 HBM3E |
| 互联 | 华为超节点 | NVLink + InfiniBand |
| 框架 | MindSpore/CANN | CUDA/cuDNN/NCCL |
| 生态成熟度 | 快速追赶中 | 十年积累,极度成熟 |
| 核心差距 | CUDA 生态兼容性 | 无(行业标准) |
批判性分析
局限性
- 自研 HBM 良率和性能:这是最大的未知数。SK 海力士的 HBM3E 经过多年迭代,华为自研 HBM 首代产品的良率和带宽性能存在不确定性
- 软件生态差距:CANN 相对 CUDA 的算子覆盖率和优化深度仍有差距,特别是在非标准模型架构上
- 超节点性能声明:华为声称超节点性能”超越英伟达”,但缺乏独立第三方 benchmark 验证
- 定价:昇腾 950PR 约 7 万元 vs H200 约 4-5 万美元——考虑到性能差距,性价比对比需要具体任务数据
乐观预期的合理性
- 万卡级点亮证明集群协同工作能力已达标——不是单卡能用,而是万卡能协同
- 字节 400 亿采购(如果属实)是最有力的第三方背书
- 在美国芯片管制持续收紧的背景下,华为是中国 AI 算力的”唯一选择”——需求刚性
独立观察
- 中国 AI 算力正在形成”双轨制”:先进训练用昇腾/国产替代,推理和非关键任务仍大量使用存量 NVIDIA GPU
- 华为的真正竞争力不在于单芯片性能超越 NVIDIA,而在于全栈整合能力——芯片+互联+框架+集群的端到端优化
- 2026 年华为 AI 芯片占中国市场 50% 的预测如果成真,意味着中国 AI 算力对 NVIDIA 的依赖将从”几乎全部”降至”约一半”——这是战略级的变化