deep deepseek financing followup.md
2026-04-19 · 深度解读 · 编辑:Lighthouse
主要信源:腾讯科技《DeepSeek拟启动首次融资,梁文锋用20亿要做什么?》
补充信源:腾讯新闻《华为昇腾芯片将如何助力DeepSeek实现算力突围?》
相关旧文:Lighthouse 已于 2026-04-05 写过 《DeepSeek V4 优先适配华为/寒武纪,不只是国产替代,而是在重写中国 AI 算力生态分工》。本文不重复芯片适配背景,聚焦“资本结构、算力账单、人才成本、商业化压力”这个新角度。
速查卡
| 维度 | 内容 |
|---|---|
| 一句话总结 | DeepSeek 首次融资不是简单“缺钱”,而是中国顶级开源模型公司第一次承认:低成本训练配方可以降低边际成本,但扛不住持续扩容、推理服务、人才保留和国产算力迁移的总账单。 |
| 大白话版 | DeepSeek 以前像一个靠天才工程和母公司输血活得很硬气的实验室;现在它要把自己变成能长期打仗的大公司,所以不得不去找外部资本。 |
| 核心数字 | 传闻估值至少 100 亿美元;募资至少 3 亿美元(约 20 亿元人民币);SemiAnalysis 曾估算其服务器资本开支接近 16 亿美元,其中约 9 亿美元直接与计算集群相关;V3 训练“不到 600 万美元”只是单次训练运行成本。 |
| 影响评级 | A-:不是模型发布,但它直接改写中国基础模型公司的资本结构想象,也会影响后续 V4、华为适配与商业化节奏。 |
| 利益相关方 | DeepSeek / 幻方量化 / 华为昇腾生态 / 潜在财务与产业投资人 / 国内头部 AI 人才市场 / 中国云与推理服务链条 |
| 关键问题 | 低成本训练能否转化成低资本强度公司?开源声望能否转化成现金流?华为适配会不会把融资故事从“估值修复”升级成“生态重定价”? |
事件全貌
发生了什么
根据腾讯科技转述 The Information 的消息,DeepSeek 正在洽谈成立以来第一次外部融资,计划以至少 100 亿美元估值筹集不低于 3 亿美元资金。报道同时给出几个关键背景:
- DeepSeek 过去一直由幻方量化全资拥有,没有拿过外部钱;
- 梁文锋此前长期拒绝顶级风投和科技巨头投资,希望保持技术路线独立;
- 现在态度转向,原因不是“资本市场欢迎我”,而是“下一阶段账单变重了”;
- 这个账单不只包括训练,还包括推理、数据中心、人才激励和下一代模型的硬件迁移。
如果把这件事放到 2025-2026 年 DeepSeek 的叙事里看,它相当于给“廉价前沿模型”故事补上了后半句:
低成本训练可以打穿行业认知,但不能自动创造低资本开支公司。
时间线
- 2025-01:R1/V3 系列把“不到 600 万美元训练成本”打成全球话题;
- 2025-2026:DeepSeek 持续被拿来与 OpenAI、Anthropic、xAI、Google 估值体系对照;
- 2026-04-05:Lighthouse 已跟进 V4 优先适配国产芯片的技术线;
- 2026-04-18:腾讯科技披露首次融资传闻,强调估值、资本结构与人才/算力压力;
- 同日后续报道:融资叙事与华为昇腾、Token 生态、国产算力迁移进一步绑定。
核心 Insight
这条新闻最值得抓住的核心,不是“DeepSeek 要融资了”,而是:
1. “560 万美元”从来不是公司总成本,只是一次训练 run 的边际账单
外界过去最容易误读的,是把 DeepSeek 的单次训练成本直接等同于公司资本强度。原文把这个误区拆得很直白:
- V3 训练低成本是真;
- 但那是一次训练运行,不是完整基础设施投入;
- SemiAnalysis 估算的服务器资本开支接近 16 亿美元,说明真正吞钱的是集群、服务器、推理服务和持续扩容。
也就是说,DeepSeek 的创新更准确地说是“把单位能力的训练效率做得异常高”,而不是“把基础模型公司变成轻资产生意”。
2. 开源模式提升了技术声望,却天然压低了估值弹性
报道里关于估值折价的分析很关键:DeepSeek 的能力并不弱,但估值远低于 Anthropic、OpenAI、xAI。原因至少有三层:
- 开源让它更像“公共产品供应者”,而不是高毛利 API 平台;
- 中国 AI 公司同时面临国内监管与跨境资本限制;
- 出口管制让投资人对算力可得性打折。
这意味着 DeepSeek 面临一种结构性矛盾:
- 技术上越被全球研究社区认可;
- 商业上越难复制美国闭源实验室那种估值倍数。
3. 融资的真正用途不是“再做一个模型”,而是给组织和基础设施续命
原文对资金用途虽然没有披露具体表格,但逻辑已经很清楚:
- 芯片与集群扩容要钱;
- 推理服务长期运行要钱;
- 顶级研究员留任和长期激励要钱;
- V4 对华为栈的迁移,会额外消耗工程与调优资源。
换句话说,这轮融资更像“给长期作战体系加油”,不是“一次性买模型发布会门票”。
技术与产业解析
一、为什么 V3 的“低训练成本”不能直接推出“公司不需要融资”
可以把基础模型公司的成本拆成四层:
算法效率提升
↓
单次训练 run 成本下降
↓
模型迭代周期变快
↓
但总资本开支仍由集群、推理、数据中心、人才和工程组织决定
更直白地说:
| 成本层 | 代表内容 | 是否会被“训练更省钱”直接消掉 |
|---|---|---|
| 单次训练成本 | GPU 小时、实验 run | 会下降 |
| 集群资本开支 | 服务器、机柜、网络、存储 | 不会自动下降 |
| 推理运营成本 | 线上服务、峰值扩容、SLA | 通常不会同步下降 |
| 组织成本 | 研究员、工程师、激励与流失 | 反而可能上升 |
DeepSeek 的“便宜”更像把最显眼的那一列压下来了,但下面三列仍然巨大。
二、人才账单为什么在 2026 年突然变得更致命
原文提到多位核心研究员流动,虽然个别薪酬数字存在争议,但趋势是可信的:
- 中国头部大厂和模型公司都在抢前沿研究员;
- 现金、股权、期权与长期激励门槛迅速抬升;
- “技术理想主义”对核心人才的约束力在减弱。
这件事的产业含义很现实:
- 早期实验室可以靠使命感和小团队密度维持战斗力;
- 一旦进入下一代旗舰模型周期,组织会变成资本密集型机器;
- 没有充足现金和股权池,就很难同时做前沿研究、平台工程和商业化。
对 DeepSeek 来说,融资不仅是买卡,更是给组织层加护城河。
三、V4 华为适配把“融资故事”从财务问题抬升成生态问题
补充报道里最值得警惕的,不是那些“万亿参数”“100 万 token”“SWE-bench 超 80%”之类没有完整一手技术报告支持的数字,而是下面这个更扎实的趋势:
- DeepSeek 正在从 NVIDIA/CUDA 栈迁往华为/CANN 栈;
- 这意味着下一阶段工程成本会上升,而不是下降;
- 融资如果落地,部分资金很可能会被用来覆盖这种迁移摩擦。
因此,这轮融资并不是与 V4 硬件迁移无关的财务动作,反而可能是它的前置条件之一。
四、DeepSeek 的估值到底低还是高
100 亿美元估值可以从两套坐标系来看:
坐标系 A:对美国 frontier labs 横向比较
如果拿 Anthropic、OpenAI、xAI 作对照,100 亿美元明显偏低。原因是美国实验室的估值包含:
- 更宽的资本市场通道;
- 更成熟的 API 变现预期;
- 更高的国际可投资性;
- 更少的地缘与出口管制折价。
坐标系 B:对中国私人 AI 投资环境纵向比较
如果放回中国私营 AI 市场,3 亿美元募资与 100 亿美元估值已经是极重锚点。它意味着:
- DeepSeek 仍然是国内最能讲“前沿模型 + 开源影响力 + 国产算力迁移”故事的标的之一;
- 市场愿意为“能把中国硬件栈拖入一线实战”的团队付钱;
- 投资人赌的不只是模型,而是中国 AI 基础设施的一个总枢纽。
产业影响链
DeepSeek 首次融资
├─→ 资金缓冲增加
│ ├─→ V4 训练/推理与服务节奏更稳
│ ├─→ 核心人才留任能力增强
│ └─→ 国产算力迁移可承受更长工程磨合期
├─→ 公司治理变化
│ ├─→ 从实验室逻辑走向资本约束逻辑
│ ├─→ 可能加快商业化与收入要求
│ └─→ 开源节奏、定价与发布策略可能更现实
└─→ 生态外溢
├─→ 华为昇腾与国产软件栈获得更强验证场景
├─→ 中国基础模型估值锚点被重新校准
└─→ “低成本训练 ≠ 低资本强度”成为行业共识
谁受益
-
华为昇腾及国产 AI 软件栈
- 如果融资帮助 DeepSeek 更稳定地推进 V4 迁移,华为获得的不是一条 PR,而是前沿模型级别的工程验证。
-
潜在产业投资人
- 对想押注中国 AI 基础设施闭环的人来说,DeepSeek 是少数同时连接模型、硬件、开源影响力与政策叙事的入口。
-
DeepSeek 自身组织
- 资金会让它从“高压小团队奇迹”转向“可持续迭代机器”。
谁承压
-
“DeepSeek 靠便宜训练就能长期滚雪球”的简单叙事
- 这次融资等于公开承认:总账单依然巨大。
-
纯财务型、低协同价值投资人
- DeepSeek 更可能需要算力、渠道、生态而不是单纯现金。
-
依赖“美国遥遥领先”估值前提的海外叙事
- 如果中国最佳模型只落后头部美国模型很小一截,而资本与硬件又开始补齐,这会持续压缩“绝对领先溢价”。
历史脉络:从“技术奇迹”到“资本机器”
过去一年 DeepSeek 的叙事转了三次弯:
- 第一阶段:震惊
- 市场先被“低成本训练前沿模型”吓到;
- 第二阶段:反驳
- 大家开始追问真实芯片库存、服务器规模和总资本开支;
- 第三阶段:现实化
- 现在连 DeepSeek 自己也开始接受:要持续打下去,终究还是要资本、组织和基础设施。
这不是 DeepSeek 失败,恰恰说明它从“现象级实验室”升级成了“必须面对工业化账本的前沿公司”。
批判性分析
被忽略的风险
-
融资不等于算力问题解决
- 即便拿到钱,也不代表马上拿到足够稳定的高端芯片与集群。
-
融资可能带来策略收缩
- 资本一旦进入,未来对开源频率、定价和商业化节奏的要求很可能提高。
-
华为迁移是技术红利,也是执行风险
- 如果 V4 在国产栈上的性能、稳定性或成本没有站住,融资故事会很快承压。
乐观叙事哪里成立
- DeepSeek 证明了中国团队可以用更高工程效率逼近前沿;
- 如果融资 + 国产算力适配同时成型,它会成为中国 AI 生态真正的牵引节点;
- 100 亿美元估值对国内市场并不轻,说明资本仍愿意为前沿能力下注。
悲观叙事哪里也有道理
- 开源模式的商业化上限仍然模糊;
- 人才和硬件压力会持续吞噬“省出来”的成本优势;
- 若 V4 延期继续拉长,估值支撑会被削弱。
小小动的判断
DeepSeek 这次融资,真正宣告的是一个行业事实:
中国基础模型公司的竞争,已经从“谁更聪明”升级为“谁能把聪明变成一套付得起账单、留得住人才、接得上国产硬件的长期系统”。
如果 2025 年属于 DeepSeek 的算法声望,那么 2026 年开始考它的,是资本结构与工业化能力。