News

华为昇腾万卡级全栈自主可控智算集群点亮

华为昇腾万卡级全栈自主可控智算集群点亮

主要信源：驱动之家 / 新闻 Google 交叉验证：华为昇腾官方路线图 / 行业分析事件日期：2026-04-01

速查卡

项目	内容
一句话总结	全国首个万卡级（10,000+ 卡）全栈自主可控智算集群正式点亮，搭载华为先进昇腾 AI 芯片
大白话版	中国用全部自己造的芯片和软件，搭建了一个一万多张卡的超大 AI 训练集群，不依赖英伟达
核心数字	万卡级集群 / 昇腾 950PR 自研 HBM / 预计 2026 年占中国 AI 芯片市场 50%
影响评级	A — 中国去英伟达化进程的关键里程碑
利益相关方	受益：华为昇腾生态链 / 受损：NVIDIA 中国市场份额

事件全貌

发生了什么？

2026 年 4 月 1 日，全国首个万卡级全栈自主可控智算集群正式点亮。“全栈自主可控”意味着从芯片到框架到集群管理全部国产化：

层级	组件	说明
芯片	华为昇腾系列	AI 训练/推理芯片
HBM	华为自研 HBM	昇腾 950PR 首次采用
框架	MindSpore / CANN	训练框架和算子库
互联	华为超节点互联	高速芯片间通信
集群管理	华为 Atlas 系列	集群调度和管理

昇腾三年路线图

芯片	时间	关键特性	估价
昇腾 910B	已量产	对标 A100 级别	~3-4 万元
昇腾 950PR	2026 Q1	自研 HBM	~7 万元
昇腾 960	2026 H2	性能提升	—
昇腾 970	2027	”全球最强超节点”目标	—

商业化进展

字节跳动：据传将购买 400 亿元昇腾芯片
阿里、腾讯：加大昇腾部署
市场份额预测：2026 年华为占中国 AI 芯片市场 50%

技术解析

全栈自主可控的含义

“全栈自主可控”在 AI 算力语境下有明确的技术层次：

芯片自主：昇腾 AI 处理器，非 ARM 授权的通用核心
存储自主：昇腾 950PR 首次采用华为自研 HBM（而非 SK 海力士/三星），这是最关键的突破——HBM 是 AI 芯片的”弹药库”
框架自主：MindSpore 训练框架 + CANN 算子库
互联自主：超节点间高速互联，对标 NVLink
集群自主：Atlas 系列集群管理和调度

与 NVIDIA 集群的对比

维度	华为昇腾万卡集群	NVIDIA DGX SuperPOD
芯片	昇腾 950PR	H100/H200/B200
HBM	华为自研 HBM	SK 海力士 HBM3E
互联	华为超节点	NVLink + InfiniBand
框架	MindSpore/CANN	CUDA/cuDNN/NCCL
生态成熟度	快速追赶中	十年积累，极度成熟
核心差距	CUDA 生态兼容性	无（行业标准）

批判性分析

局限性

自研 HBM 良率和性能：这是最大的未知数。SK 海力士的 HBM3E 经过多年迭代，华为自研 HBM 首代产品的良率和带宽性能存在不确定性
软件生态差距：CANN 相对 CUDA 的算子覆盖率和优化深度仍有差距，特别是在非标准模型架构上
超节点性能声明：华为声称超节点性能”超越英伟达”，但缺乏独立第三方 benchmark 验证
定价：昇腾 950PR 约 7 万元 vs H200 约 4-5 万美元——考虑到性能差距，性价比对比需要具体任务数据

乐观预期的合理性

万卡级点亮证明集群协同工作能力已达标——不是单卡能用，而是万卡能协同
字节 400 亿采购（如果属实）是最有力的第三方背书
在美国芯片管制持续收紧的背景下，华为是中国 AI 算力的”唯一选择”——需求刚性

独立观察

中国 AI 算力正在形成”双轨制”：先进训练用昇腾/国产替代，推理和非关键任务仍大量使用存量 NVIDIA GPU
华为的真正竞争力不在于单芯片性能超越 NVIDIA，而在于全栈整合能力——芯片+互联+框架+集群的端到端优化
2026 年华为 AI 芯片占中国市场 50% 的预测如果成真，意味着中国 AI 算力对 NVIDIA 的依赖将从”几乎全部”降至”约一半”——这是战略级的变化

目录

速查卡
事件全貌
发生了什么？
昇腾三年路线图
商业化进展
技术解析
全栈自主可控的含义
与 NVIDIA 集群的对比
批判性分析
局限性
乐观预期的合理性
独立观察