News

deep deepseek financing followup.md

2026-04-19 · 深度解读 · 编辑：Lighthouse

主要信源：腾讯科技《DeepSeek拟启动首次融资，梁文锋用20亿要做什么？》

补充信源：腾讯新闻《华为昇腾芯片将如何助力DeepSeek实现算力突围？》

相关旧文：Lighthouse 已于 2026-04-05 写过《DeepSeek V4 优先适配华为/寒武纪，不只是国产替代，而是在重写中国 AI 算力生态分工》。本文不重复芯片适配背景，聚焦“资本结构、算力账单、人才成本、商业化压力”这个新角度。

速查卡

维度	内容
一句话总结	DeepSeek 首次融资不是简单“缺钱”，而是中国顶级开源模型公司第一次承认：低成本训练配方可以降低边际成本，但扛不住持续扩容、推理服务、人才保留和国产算力迁移的总账单。
大白话版	DeepSeek 以前像一个靠天才工程和母公司输血活得很硬气的实验室；现在它要把自己变成能长期打仗的大公司，所以不得不去找外部资本。
核心数字	传闻估值至少 100 亿美元；募资至少 3 亿美元（约 20 亿元人民币）；SemiAnalysis 曾估算其服务器资本开支接近 16 亿美元，其中约 9 亿美元直接与计算集群相关；V3 训练“不到 600 万美元”只是单次训练运行成本。
影响评级	A-：不是模型发布，但它直接改写中国基础模型公司的资本结构想象，也会影响后续 V4、华为适配与商业化节奏。
利益相关方	DeepSeek / 幻方量化 / 华为昇腾生态 / 潜在财务与产业投资人 / 国内头部 AI 人才市场 / 中国云与推理服务链条
关键问题	低成本训练能否转化成低资本强度公司？开源声望能否转化成现金流？华为适配会不会把融资故事从“估值修复”升级成“生态重定价”？

事件全貌

发生了什么

根据腾讯科技转述 The Information 的消息，DeepSeek 正在洽谈成立以来第一次外部融资，计划以至少 100 亿美元估值筹集不低于 3 亿美元资金。报道同时给出几个关键背景：

DeepSeek 过去一直由幻方量化全资拥有，没有拿过外部钱；
梁文锋此前长期拒绝顶级风投和科技巨头投资，希望保持技术路线独立；
现在态度转向，原因不是“资本市场欢迎我”，而是“下一阶段账单变重了”；
这个账单不只包括训练，还包括推理、数据中心、人才激励和下一代模型的硬件迁移。

如果把这件事放到 2025-2026 年 DeepSeek 的叙事里看，它相当于给“廉价前沿模型”故事补上了后半句：

低成本训练可以打穿行业认知，但不能自动创造低资本开支公司。

时间线

2025-01：R1/V3 系列把“不到 600 万美元训练成本”打成全球话题；
2025-2026：DeepSeek 持续被拿来与 OpenAI、Anthropic、xAI、Google 估值体系对照；
2026-04-05：Lighthouse 已跟进 V4 优先适配国产芯片的技术线；
2026-04-18：腾讯科技披露首次融资传闻，强调估值、资本结构与人才/算力压力；
同日后续报道：融资叙事与华为昇腾、Token 生态、国产算力迁移进一步绑定。

核心 Insight

这条新闻最值得抓住的核心，不是“DeepSeek 要融资了”，而是：

1. “560 万美元”从来不是公司总成本，只是一次训练 run 的边际账单

外界过去最容易误读的，是把 DeepSeek 的单次训练成本直接等同于公司资本强度。原文把这个误区拆得很直白：

V3 训练低成本是真；
但那是一次训练运行，不是完整基础设施投入；
SemiAnalysis 估算的服务器资本开支接近 16 亿美元，说明真正吞钱的是集群、服务器、推理服务和持续扩容。

也就是说，DeepSeek 的创新更准确地说是“把单位能力的训练效率做得异常高”，而不是“把基础模型公司变成轻资产生意”。

2. 开源模式提升了技术声望，却天然压低了估值弹性

报道里关于估值折价的分析很关键：DeepSeek 的能力并不弱，但估值远低于 Anthropic、OpenAI、xAI。原因至少有三层：

开源让它更像“公共产品供应者”，而不是高毛利 API 平台；
中国 AI 公司同时面临国内监管与跨境资本限制；
出口管制让投资人对算力可得性打折。

这意味着 DeepSeek 面临一种结构性矛盾：

技术上越被全球研究社区认可；
商业上越难复制美国闭源实验室那种估值倍数。

3. 融资的真正用途不是“再做一个模型”，而是给组织和基础设施续命

原文对资金用途虽然没有披露具体表格，但逻辑已经很清楚：

芯片与集群扩容要钱；
推理服务长期运行要钱；
顶级研究员留任和长期激励要钱；
V4 对华为栈的迁移，会额外消耗工程与调优资源。

换句话说，这轮融资更像“给长期作战体系加油”，不是“一次性买模型发布会门票”。

技术与产业解析

一、为什么 V3 的“低训练成本”不能直接推出“公司不需要融资”

可以把基础模型公司的成本拆成四层：

算法效率提升
   ↓
单次训练 run 成本下降
   ↓
模型迭代周期变快
   ↓
但总资本开支仍由集群、推理、数据中心、人才和工程组织决定

更直白地说：

成本层	代表内容	是否会被“训练更省钱”直接消掉
单次训练成本	GPU 小时、实验 run	会下降
集群资本开支	服务器、机柜、网络、存储	不会自动下降
推理运营成本	线上服务、峰值扩容、SLA	通常不会同步下降
组织成本	研究员、工程师、激励与流失	反而可能上升

DeepSeek 的“便宜”更像把最显眼的那一列压下来了，但下面三列仍然巨大。

二、人才账单为什么在 2026 年突然变得更致命

原文提到多位核心研究员流动，虽然个别薪酬数字存在争议，但趋势是可信的：

中国头部大厂和模型公司都在抢前沿研究员；
现金、股权、期权与长期激励门槛迅速抬升；
“技术理想主义”对核心人才的约束力在减弱。

这件事的产业含义很现实：

早期实验室可以靠使命感和小团队密度维持战斗力；
一旦进入下一代旗舰模型周期，组织会变成资本密集型机器；
没有充足现金和股权池，就很难同时做前沿研究、平台工程和商业化。

对 DeepSeek 来说，融资不仅是买卡，更是给组织层加护城河。

三、V4 华为适配把“融资故事”从财务问题抬升成生态问题

补充报道里最值得警惕的，不是那些“万亿参数”“100 万 token”“SWE-bench 超 80%”之类没有完整一手技术报告支持的数字，而是下面这个更扎实的趋势：

DeepSeek 正在从 NVIDIA/CUDA 栈迁往华为/CANN 栈；
这意味着下一阶段工程成本会上升，而不是下降；
融资如果落地，部分资金很可能会被用来覆盖这种迁移摩擦。

因此，这轮融资并不是与 V4 硬件迁移无关的财务动作，反而可能是它的前置条件之一。

四、DeepSeek 的估值到底低还是高

100 亿美元估值可以从两套坐标系来看：

坐标系 A：对美国 frontier labs 横向比较

如果拿 Anthropic、OpenAI、xAI 作对照，100 亿美元明显偏低。原因是美国实验室的估值包含：

更宽的资本市场通道；
更成熟的 API 变现预期；
更高的国际可投资性；
更少的地缘与出口管制折价。

坐标系 B：对中国私人 AI 投资环境纵向比较

如果放回中国私营 AI 市场，3 亿美元募资与 100 亿美元估值已经是极重锚点。它意味着：

DeepSeek 仍然是国内最能讲“前沿模型 + 开源影响力 + 国产算力迁移”故事的标的之一；
市场愿意为“能把中国硬件栈拖入一线实战”的团队付钱；
投资人赌的不只是模型，而是中国 AI 基础设施的一个总枢纽。

产业影响链

DeepSeek 首次融资
  ├─→ 资金缓冲增加
  │    ├─→ V4 训练/推理与服务节奏更稳
  │    ├─→ 核心人才留任能力增强
  │    └─→ 国产算力迁移可承受更长工程磨合期
  ├─→ 公司治理变化
  │    ├─→ 从实验室逻辑走向资本约束逻辑
  │    ├─→ 可能加快商业化与收入要求
  │    └─→ 开源节奏、定价与发布策略可能更现实
  └─→ 生态外溢
       ├─→ 华为昇腾与国产软件栈获得更强验证场景
       ├─→ 中国基础模型估值锚点被重新校准
       └─→ “低成本训练 ≠ 低资本强度”成为行业共识

谁受益

华为昇腾及国产 AI 软件栈
- 如果融资帮助 DeepSeek 更稳定地推进 V4 迁移，华为获得的不是一条 PR，而是前沿模型级别的工程验证。
潜在产业投资人
- 对想押注中国 AI 基础设施闭环的人来说，DeepSeek 是少数同时连接模型、硬件、开源影响力与政策叙事的入口。
DeepSeek 自身组织
- 资金会让它从“高压小团队奇迹”转向“可持续迭代机器”。

谁承压

“DeepSeek 靠便宜训练就能长期滚雪球”的简单叙事
- 这次融资等于公开承认：总账单依然巨大。
纯财务型、低协同价值投资人
- DeepSeek 更可能需要算力、渠道、生态而不是单纯现金。
依赖“美国遥遥领先”估值前提的海外叙事
- 如果中国最佳模型只落后头部美国模型很小一截，而资本与硬件又开始补齐，这会持续压缩“绝对领先溢价”。

历史脉络：从“技术奇迹”到“资本机器”

过去一年 DeepSeek 的叙事转了三次弯：

第一阶段：震惊
- 市场先被“低成本训练前沿模型”吓到；
第二阶段：反驳
- 大家开始追问真实芯片库存、服务器规模和总资本开支；
第三阶段：现实化
- 现在连 DeepSeek 自己也开始接受：要持续打下去，终究还是要资本、组织和基础设施。

这不是 DeepSeek 失败，恰恰说明它从“现象级实验室”升级成了“必须面对工业化账本的前沿公司”。

批判性分析

被忽略的风险

融资不等于算力问题解决
- 即便拿到钱，也不代表马上拿到足够稳定的高端芯片与集群。
融资可能带来策略收缩
- 资本一旦进入，未来对开源频率、定价和商业化节奏的要求很可能提高。
华为迁移是技术红利，也是执行风险
- 如果 V4 在国产栈上的性能、稳定性或成本没有站住，融资故事会很快承压。

乐观叙事哪里成立

DeepSeek 证明了中国团队可以用更高工程效率逼近前沿；
如果融资 + 国产算力适配同时成型，它会成为中国 AI 生态真正的牵引节点；
100 亿美元估值对国内市场并不轻，说明资本仍愿意为前沿能力下注。

悲观叙事哪里也有道理

开源模式的商业化上限仍然模糊；
人才和硬件压力会持续吞噬“省出来”的成本优势；
若 V4 延期继续拉长，估值支撑会被削弱。

小小动的判断

DeepSeek 这次融资，真正宣告的是一个行业事实：

中国基础模型公司的竞争，已经从“谁更聪明”升级为“谁能把聪明变成一套付得起账单、留得住人才、接得上国产硬件的长期系统”。

如果 2025 年属于 DeepSeek 的算法声望，那么 2026 年开始考它的，是资本结构与工业化能力。