Esc
输入关键词开始搜索
News

华为昇腾万卡级全栈自主可控智算集群点亮

华为昇腾万卡级全栈自主可控智算集群点亮

主要信源:驱动之家 / 新闻 Google 交叉验证:华为昇腾官方路线图 / 行业分析 事件日期:2026-04-01

速查卡

项目内容
一句话总结全国首个万卡级(10,000+ 卡)全栈自主可控智算集群正式点亮,搭载华为先进昇腾 AI 芯片
大白话版中国用全部自己造的芯片和软件,搭建了一个一万多张卡的超大 AI 训练集群,不依赖英伟达
核心数字万卡级集群 / 昇腾 950PR 自研 HBM / 预计 2026 年占中国 AI 芯片市场 50%
影响评级A — 中国去英伟达化进程的关键里程碑
利益相关方受益:华为昇腾生态链 / 受损:NVIDIA 中国市场份额

事件全貌

发生了什么?

2026 年 4 月 1 日,全国首个万卡级全栈自主可控智算集群正式点亮。“全栈自主可控”意味着从芯片到框架到集群管理全部国产化:

层级组件说明
芯片华为昇腾系列AI 训练/推理芯片
HBM华为自研 HBM昇腾 950PR 首次采用
框架MindSpore / CANN训练框架和算子库
互联华为超节点互联高速芯片间通信
集群管理华为 Atlas 系列集群调度和管理

昇腾三年路线图

芯片时间关键特性估价
昇腾 910B已量产对标 A100 级别~3-4 万元
昇腾 950PR2026 Q1自研 HBM~7 万元
昇腾 9602026 H2性能提升
昇腾 9702027”全球最强超节点”目标

商业化进展

  • 字节跳动:据传将购买 400 亿元昇腾芯片
  • 阿里、腾讯:加大昇腾部署
  • 市场份额预测:2026 年华为占中国 AI 芯片市场 50%

技术解析

全栈自主可控的含义

“全栈自主可控”在 AI 算力语境下有明确的技术层次:

  1. 芯片自主:昇腾 AI 处理器,非 ARM 授权的通用核心
  2. 存储自主:昇腾 950PR 首次采用华为自研 HBM(而非 SK 海力士/三星),这是最关键的突破——HBM 是 AI 芯片的”弹药库”
  3. 框架自主:MindSpore 训练框架 + CANN 算子库
  4. 互联自主:超节点间高速互联,对标 NVLink
  5. 集群自主:Atlas 系列集群管理和调度

与 NVIDIA 集群的对比

维度华为昇腾万卡集群NVIDIA DGX SuperPOD
芯片昇腾 950PRH100/H200/B200
HBM华为自研 HBMSK 海力士 HBM3E
互联华为超节点NVLink + InfiniBand
框架MindSpore/CANNCUDA/cuDNN/NCCL
生态成熟度快速追赶中十年积累,极度成熟
核心差距CUDA 生态兼容性无(行业标准)

批判性分析

局限性

  1. 自研 HBM 良率和性能:这是最大的未知数。SK 海力士的 HBM3E 经过多年迭代,华为自研 HBM 首代产品的良率和带宽性能存在不确定性
  2. 软件生态差距:CANN 相对 CUDA 的算子覆盖率和优化深度仍有差距,特别是在非标准模型架构上
  3. 超节点性能声明:华为声称超节点性能”超越英伟达”,但缺乏独立第三方 benchmark 验证
  4. 定价:昇腾 950PR 约 7 万元 vs H200 约 4-5 万美元——考虑到性能差距,性价比对比需要具体任务数据

乐观预期的合理性

  • 万卡级点亮证明集群协同工作能力已达标——不是单卡能用,而是万卡能协同
  • 字节 400 亿采购(如果属实)是最有力的第三方背书
  • 在美国芯片管制持续收紧的背景下,华为是中国 AI 算力的”唯一选择”——需求刚性

独立观察

  • 中国 AI 算力正在形成”双轨制”:先进训练用昇腾/国产替代,推理和非关键任务仍大量使用存量 NVIDIA GPU
  • 华为的真正竞争力不在于单芯片性能超越 NVIDIA,而在于全栈整合能力——芯片+互联+框架+集群的端到端优化
  • 2026 年华为 AI 芯片占中国市场 50% 的预测如果成真,意味着中国 AI 算力对 NVIDIA 的依赖将从”几乎全部”降至”约一半”——这是战略级的变化