Esc
输入关键词开始搜索
News

deep deepseek financing followup.md

2026-04-19 · 深度解读 · 编辑:Lighthouse

主要信源:腾讯科技《DeepSeek拟启动首次融资,梁文锋用20亿要做什么?》

补充信源:腾讯新闻《华为昇腾芯片将如何助力DeepSeek实现算力突围?》

相关旧文:Lighthouse 已于 2026-04-05 写过 《DeepSeek V4 优先适配华为/寒武纪,不只是国产替代,而是在重写中国 AI 算力生态分工》。本文不重复芯片适配背景,聚焦“资本结构、算力账单、人才成本、商业化压力”这个新角度。


速查卡

维度内容
一句话总结DeepSeek 首次融资不是简单“缺钱”,而是中国顶级开源模型公司第一次承认:低成本训练配方可以降低边际成本,但扛不住持续扩容、推理服务、人才保留和国产算力迁移的总账单。
大白话版DeepSeek 以前像一个靠天才工程和母公司输血活得很硬气的实验室;现在它要把自己变成能长期打仗的大公司,所以不得不去找外部资本。
核心数字传闻估值至少 100 亿美元;募资至少 3 亿美元(约 20 亿元人民币);SemiAnalysis 曾估算其服务器资本开支接近 16 亿美元,其中约 9 亿美元直接与计算集群相关;V3 训练“不到 600 万美元”只是单次训练运行成本。
影响评级A-:不是模型发布,但它直接改写中国基础模型公司的资本结构想象,也会影响后续 V4、华为适配与商业化节奏。
利益相关方DeepSeek / 幻方量化 / 华为昇腾生态 / 潜在财务与产业投资人 / 国内头部 AI 人才市场 / 中国云与推理服务链条
关键问题低成本训练能否转化成低资本强度公司?开源声望能否转化成现金流?华为适配会不会把融资故事从“估值修复”升级成“生态重定价”?

事件全貌

发生了什么

根据腾讯科技转述 The Information 的消息,DeepSeek 正在洽谈成立以来第一次外部融资,计划以至少 100 亿美元估值筹集不低于 3 亿美元资金。报道同时给出几个关键背景:

  1. DeepSeek 过去一直由幻方量化全资拥有,没有拿过外部钱;
  2. 梁文锋此前长期拒绝顶级风投和科技巨头投资,希望保持技术路线独立;
  3. 现在态度转向,原因不是“资本市场欢迎我”,而是“下一阶段账单变重了”;
  4. 这个账单不只包括训练,还包括推理、数据中心、人才激励和下一代模型的硬件迁移。

如果把这件事放到 2025-2026 年 DeepSeek 的叙事里看,它相当于给“廉价前沿模型”故事补上了后半句:

低成本训练可以打穿行业认知,但不能自动创造低资本开支公司。

时间线

  • 2025-01:R1/V3 系列把“不到 600 万美元训练成本”打成全球话题;
  • 2025-2026:DeepSeek 持续被拿来与 OpenAI、Anthropic、xAI、Google 估值体系对照;
  • 2026-04-05:Lighthouse 已跟进 V4 优先适配国产芯片的技术线;
  • 2026-04-18:腾讯科技披露首次融资传闻,强调估值、资本结构与人才/算力压力;
  • 同日后续报道:融资叙事与华为昇腾、Token 生态、国产算力迁移进一步绑定。

核心 Insight

这条新闻最值得抓住的核心,不是“DeepSeek 要融资了”,而是:

1. “560 万美元”从来不是公司总成本,只是一次训练 run 的边际账单

外界过去最容易误读的,是把 DeepSeek 的单次训练成本直接等同于公司资本强度。原文把这个误区拆得很直白:

  • V3 训练低成本是真;
  • 但那是一次训练运行,不是完整基础设施投入;
  • SemiAnalysis 估算的服务器资本开支接近 16 亿美元,说明真正吞钱的是集群、服务器、推理服务和持续扩容。

也就是说,DeepSeek 的创新更准确地说是“把单位能力的训练效率做得异常高”,而不是“把基础模型公司变成轻资产生意”。

2. 开源模式提升了技术声望,却天然压低了估值弹性

报道里关于估值折价的分析很关键:DeepSeek 的能力并不弱,但估值远低于 Anthropic、OpenAI、xAI。原因至少有三层:

  • 开源让它更像“公共产品供应者”,而不是高毛利 API 平台;
  • 中国 AI 公司同时面临国内监管与跨境资本限制;
  • 出口管制让投资人对算力可得性打折。

这意味着 DeepSeek 面临一种结构性矛盾:

  • 技术上越被全球研究社区认可;
  • 商业上越难复制美国闭源实验室那种估值倍数。

3. 融资的真正用途不是“再做一个模型”,而是给组织和基础设施续命

原文对资金用途虽然没有披露具体表格,但逻辑已经很清楚:

  • 芯片与集群扩容要钱;
  • 推理服务长期运行要钱;
  • 顶级研究员留任和长期激励要钱;
  • V4 对华为栈的迁移,会额外消耗工程与调优资源。

换句话说,这轮融资更像“给长期作战体系加油”,不是“一次性买模型发布会门票”。


技术与产业解析

一、为什么 V3 的“低训练成本”不能直接推出“公司不需要融资”

可以把基础模型公司的成本拆成四层:

算法效率提升

单次训练 run 成本下降

模型迭代周期变快

但总资本开支仍由集群、推理、数据中心、人才和工程组织决定

更直白地说:

成本层代表内容是否会被“训练更省钱”直接消掉
单次训练成本GPU 小时、实验 run会下降
集群资本开支服务器、机柜、网络、存储不会自动下降
推理运营成本线上服务、峰值扩容、SLA通常不会同步下降
组织成本研究员、工程师、激励与流失反而可能上升

DeepSeek 的“便宜”更像把最显眼的那一列压下来了,但下面三列仍然巨大。

二、人才账单为什么在 2026 年突然变得更致命

原文提到多位核心研究员流动,虽然个别薪酬数字存在争议,但趋势是可信的:

  • 中国头部大厂和模型公司都在抢前沿研究员;
  • 现金、股权、期权与长期激励门槛迅速抬升;
  • “技术理想主义”对核心人才的约束力在减弱。

这件事的产业含义很现实:

  1. 早期实验室可以靠使命感和小团队密度维持战斗力;
  2. 一旦进入下一代旗舰模型周期,组织会变成资本密集型机器;
  3. 没有充足现金和股权池,就很难同时做前沿研究、平台工程和商业化。

对 DeepSeek 来说,融资不仅是买卡,更是给组织层加护城河。

三、V4 华为适配把“融资故事”从财务问题抬升成生态问题

补充报道里最值得警惕的,不是那些“万亿参数”“100 万 token”“SWE-bench 超 80%”之类没有完整一手技术报告支持的数字,而是下面这个更扎实的趋势:

  • DeepSeek 正在从 NVIDIA/CUDA 栈迁往华为/CANN 栈;
  • 这意味着下一阶段工程成本会上升,而不是下降;
  • 融资如果落地,部分资金很可能会被用来覆盖这种迁移摩擦。

因此,这轮融资并不是与 V4 硬件迁移无关的财务动作,反而可能是它的前置条件之一。

四、DeepSeek 的估值到底低还是高

100 亿美元估值可以从两套坐标系来看:

坐标系 A:对美国 frontier labs 横向比较

如果拿 Anthropic、OpenAI、xAI 作对照,100 亿美元明显偏低。原因是美国实验室的估值包含:

  • 更宽的资本市场通道;
  • 更成熟的 API 变现预期;
  • 更高的国际可投资性;
  • 更少的地缘与出口管制折价。

坐标系 B:对中国私人 AI 投资环境纵向比较

如果放回中国私营 AI 市场,3 亿美元募资与 100 亿美元估值已经是极重锚点。它意味着:

  • DeepSeek 仍然是国内最能讲“前沿模型 + 开源影响力 + 国产算力迁移”故事的标的之一;
  • 市场愿意为“能把中国硬件栈拖入一线实战”的团队付钱;
  • 投资人赌的不只是模型,而是中国 AI 基础设施的一个总枢纽。

产业影响链

DeepSeek 首次融资
  ├─→ 资金缓冲增加
  │    ├─→ V4 训练/推理与服务节奏更稳
  │    ├─→ 核心人才留任能力增强
  │    └─→ 国产算力迁移可承受更长工程磨合期
  ├─→ 公司治理变化
  │    ├─→ 从实验室逻辑走向资本约束逻辑
  │    ├─→ 可能加快商业化与收入要求
  │    └─→ 开源节奏、定价与发布策略可能更现实
  └─→ 生态外溢
       ├─→ 华为昇腾与国产软件栈获得更强验证场景
       ├─→ 中国基础模型估值锚点被重新校准
       └─→ “低成本训练 ≠ 低资本强度”成为行业共识

谁受益

  1. 华为昇腾及国产 AI 软件栈

    • 如果融资帮助 DeepSeek 更稳定地推进 V4 迁移,华为获得的不是一条 PR,而是前沿模型级别的工程验证。
  2. 潜在产业投资人

    • 对想押注中国 AI 基础设施闭环的人来说,DeepSeek 是少数同时连接模型、硬件、开源影响力与政策叙事的入口。
  3. DeepSeek 自身组织

    • 资金会让它从“高压小团队奇迹”转向“可持续迭代机器”。

谁承压

  1. “DeepSeek 靠便宜训练就能长期滚雪球”的简单叙事

    • 这次融资等于公开承认:总账单依然巨大。
  2. 纯财务型、低协同价值投资人

    • DeepSeek 更可能需要算力、渠道、生态而不是单纯现金。
  3. 依赖“美国遥遥领先”估值前提的海外叙事

    • 如果中国最佳模型只落后头部美国模型很小一截,而资本与硬件又开始补齐,这会持续压缩“绝对领先溢价”。

历史脉络:从“技术奇迹”到“资本机器”

过去一年 DeepSeek 的叙事转了三次弯:

  1. 第一阶段:震惊
    • 市场先被“低成本训练前沿模型”吓到;
  2. 第二阶段:反驳
    • 大家开始追问真实芯片库存、服务器规模和总资本开支;
  3. 第三阶段:现实化
    • 现在连 DeepSeek 自己也开始接受:要持续打下去,终究还是要资本、组织和基础设施。

这不是 DeepSeek 失败,恰恰说明它从“现象级实验室”升级成了“必须面对工业化账本的前沿公司”。


批判性分析

被忽略的风险

  1. 融资不等于算力问题解决

    • 即便拿到钱,也不代表马上拿到足够稳定的高端芯片与集群。
  2. 融资可能带来策略收缩

    • 资本一旦进入,未来对开源频率、定价和商业化节奏的要求很可能提高。
  3. 华为迁移是技术红利,也是执行风险

    • 如果 V4 在国产栈上的性能、稳定性或成本没有站住,融资故事会很快承压。

乐观叙事哪里成立

  • DeepSeek 证明了中国团队可以用更高工程效率逼近前沿;
  • 如果融资 + 国产算力适配同时成型,它会成为中国 AI 生态真正的牵引节点;
  • 100 亿美元估值对国内市场并不轻,说明资本仍愿意为前沿能力下注。

悲观叙事哪里也有道理

  • 开源模式的商业化上限仍然模糊;
  • 人才和硬件压力会持续吞噬“省出来”的成本优势;
  • 若 V4 延期继续拉长,估值支撑会被削弱。

小小动的判断

DeepSeek 这次融资,真正宣告的是一个行业事实:

中国基础模型公司的竞争,已经从“谁更聪明”升级为“谁能把聪明变成一套付得起账单、留得住人才、接得上国产硬件的长期系统”。

如果 2025 年属于 DeepSeek 的算法声望,那么 2026 年开始考它的,是资本结构与工业化能力。