Esc
输入关键词开始搜索
News

你的AI,按“词”收费

你的AI,按“词”收费

主要信源:https://www.36kr.com/p/3743326045765892 事件日期:2026-03-30

速查卡

项目内容
一句话总结Token 正在从模型内部技术计量单位,变成 AI 产业的前台结算单位;这意味着 AI 商业模式开始真正从“卖能力叙事”转向“卖可计量生产力”。
大白话版过去大家说 AI 强不强,现在开始认真算:它到底吐了多少 token、这些 token 成本多少、能不能稳定按结果收钱。
核心数字中国日均 Token 调用量:2024 年初约 1000 亿,2025 年底约 100 万亿,2026 年 3 月超 140 万亿;火山引擎公开按 Token 计费;华为云已给出 Token 套餐包。
影响评级A — 这不是术语流行,而是计价逻辑变化。谁定义 Token 的生产效率和价值评估,谁就更接近 AI 基础设施利润池。
利益相关方云厂商、模型厂商、Agent 平台、芯片公司、电力系统、企业采购方、开发者。

事件全貌

发生了什么?

36 氪转发中新经纬报道,围绕中关村论坛释放出一个非常强的信号:

  • Token(词元)正在成为 AI 时代最核心的计量单位之一;
  • 它不再只是模型开发者的黑话,而是进入了产业计价体系;
  • 国内云厂商和基础设施玩家已经在公开按 Token 设计价格、资源包和产品叙事。

报道中的几个关键点值得单独拎出来:

  1. 全国科学技术名词审定委员会已将 Token 的中文名定为“词元”;
  2. 国内日均 Token 调用量已从 2024 年初的 1000 亿,涨到 2026 年 3 月的 140 万亿;
  3. OpenClaw 这类 Agent 产品正在显著放大 Token 消耗;
  4. 火山引擎、华为云等已把 Token 计费更直接地摆到前台;
  5. 行业开始把“算力工厂”升级成“Token 工厂”来理解。

为什么这是大事?

因为这意味着 AI 商业正在经历一次底层语言切换。

以前行业更习惯按这些方式谈 AI:

  • 模型参数量;
  • benchmark 分数;
  • GPU 数量;
  • API 能力清单;
  • 用户活跃度。

现在越来越多公司开始用另一组语言说话:

  • 单位成本能产出多少 Token;
  • 在高并发下能不能稳定产 Token;
  • Token 是否真正带来任务完成;
  • Token 的价格层级是否可精细分化。

这不只是表述变化,而是商业结算逻辑变了。

技术解析

Token 为什么会从后台指标变成前台商品

Token 原本只是模型计算过程中的自然计量单位:

  • 文本被切成 token;
  • 模型按 token 处理;
  • 计费也顺手按 token 来收。

但在 Agent 时代,Token 的产业意义突然放大,原因有三:

1. Agent 大幅抬高了推理消耗

单轮对话时代,用户问一句、模型答一句,Token 消耗相对线性。

Agent 时代完全不同:

  • 规划需要 token;
  • 工具调用返回需要 token;
  • 子代理协作需要 token;
  • 长上下文历史反复重放也要 token;
  • 自我反思、总结、压缩同样消耗 token。

所以 Agent 不是“多一个 AI 功能”,而是把 Token 从后台燃料变成前台计费主语。

2. 推理取代训练成为更稳定的商业负载

报道中多位受访者都强调一个转变:AI 算力使用模式正在从训练为主,转向推理为主、服务为主。

训练当然仍重要,但训练更像阶段性大项目;推理则是日常持续消耗。谁能把持续推理负载变成标准化产品,谁更接近基础设施层的稳定现金流。

3. Token 更适合作为“AI 产出单位”

与 GPU 小时相比,Token 更接近业务层可理解单位。

  • 用户不关心你用了多少张卡;
  • 采购方也不想只听你说 TFLOPS;
  • 他们更关心:我花这笔钱,系统到底输出了多少可用结果。

Token 虽然还不等于最终价值,但比纯底层硬件指标更接近商业交付。

从“算力工厂”到“Token 工厂”的含义

“Token 工厂”这个表述值得单独看,因为它浓缩了 AI 基础设施竞争的方向变化。

以前算力竞争更像:

  • 谁有更多 GPU;
  • 谁机房更大;
  • 谁训练更快。

现在更像:

  • 谁能以更低单位成本稳定生成更多 Token;
  • 谁能在高并发下仍然保证响应速度;
  • 谁能让这些 Token 真正完成有价值的任务。

这和传统制造业很像:

  • 不是装了多少机器最重要;
  • 是单位成本、良率、连续产出能力、供应稳定性更重要。

所以“Token 工厂”这个词的真正重点,不是语言新鲜,而是它把 AI 竞争从“资源拥有量”推向了“系统生产效率”。

Token 计费的技术与商业意义

报道提到两个很直接的产品例子:

  • 火山引擎按实际消耗的 Token 数量计费,给出每百万 Token 单价;
  • 华为云按不同模型版本提供 Token 套餐包。

这说明 Token 计费已经从 API 厂商默认做法,扩展到更广的云基础设施产品设计里。

它带来三层变化:

第一层:AI 服务更标准化

像水电煤一样,如果一个行业能把产出稳定地计量并定价,规模化的条件就成熟得多。

第二层:不同工作负载更容易分层定价

未来很可能出现更细的价格结构:

  • 通用低价值 Token:走薄利多销;
  • 专业领域高价值 Token:走溢价;
  • 实时语音、图像、多模态 Token:按不同质量等级定价;
  • Agent 结果导向服务:可能在 Token 之外叠加 outcome-based pricing。

第三层:Token 生产效率成为核心 KPI

一旦按 Token 结算,基础设施层最关心的就不再只是设备总量,而是:

  • 单位电力能产出多少 Token;
  • 单位 GPU / 单位集群的有效 Token 吞吐是多少;
  • 调度损耗是否压得住;
  • 通信、存储、编排是否拖后腿。

产业影响链

Token 经济进入前台
  ├→ 云厂商把 Token 作为直接计费单位
  │   └→ 基础设施竞争从“算力规模”转向“Token 产能”
  ├→ Agent 产品进一步放大 Token 消耗
  │   └→ 推理算力需求持续高于传统预期
  ├→ 芯片 / 网络 / 存储 / 调度效率成为关键瓶颈
  │   └→ Token 成本控制变成系统工程问题
  └→ 企业采购开始问“任务价值 / Token 成本”
      └→ AI 商业模式从流量逻辑转向生产力逻辑

谁受益?

1. 云厂商与推理基础设施平台

谁能更便宜、更稳定地生产 Token,谁就更可能吃到规模化推理红利。

2. Agent 平台

Agent 天生是 Token 消耗放大器。Token 越成为标准计量单位,Agent 平台越容易把自己的价值翻译成基础设施语言。

3. 系统工程能力强的公司

随着 Token 成本被精确盯住,真正占优的不一定只是模型最强者,而是:

  • 调度做得好;
  • 集群利用率高;
  • 通信和存储损耗低;
  • 推理软件栈成熟;
  • 故障与抖动控制稳。

谁受损?

1. 只会讲模型故事、不懂成本结构的玩家

如果不能把能力转成可量化 Token 产出和价值,商业化会越来越难讲。

2. 只卷 Token 数量而不卷任务完成质量的厂商

Token 计量很方便,但也有危险:容易把行业带回“刷指标”老路。

3. 基础设施短板明显的系统

调度、通信、存储、并发控制都会直接影响单位 Token 成本。一旦进入前台结算,这些短板会被放大。

竞争格局变化

变化前

大家更多在比:

  • 谁模型更强;
  • 谁 GPU 更多;
  • 谁上下文更长;
  • 谁价格更低。

变化后

真正核心会逐步变成:

  • 谁能更高效地生产有效 Token;
  • 谁能把 Token 和任务结果关联起来;
  • 谁能把 Token 的价值分层卖出去。

这会让竞争重心从单模型,转向全系统:

  • 芯片;
  • 推理框架;
  • 调度系统;
  • 网络;
  • 存储;
  • Agent 编排层。

历史脉络

AI 商业模式大致经历了三步:

  1. 卖智能概念:讲模型有多强;
  2. 卖 API 能力:按调用量、按 token 初步计费;
  3. 卖可计量生产力:开始认真优化 token 成本、token 吞吐与 token 价值。

当前行业正在从第二步迈向第三步。

而一旦进入第三步,AI 就会越来越像基础设施行业:

  • 有统一计量单位;
  • 有规模经济;
  • 有效率竞赛;
  • 有不同质量等级的产品分层。

批判性分析

被忽略的风险

  1. Token 不等于价值。 用户买的不是 token,而是任务完成;
  2. 容易诱导错误优化。 如果行业只卷 token 吞吐,很可能牺牲正确率、稳定性和结果质量;
  3. 高质量 Agent 任务可能更适合 outcome pricing。 Token 只是过渡性的标准,不一定是终局。

乐观预期的合理性

乐观派是有道理的:

  • Token 提供了 AI 产业急需的中间计量层;
  • 它比 GPU 小时更接近业务;
  • 它能让云厂商和客户更容易建立预算与使用心智。

悲观预期的合理性

悲观派担心的也成立:

  • 如果最终大家都发现“同样 token,价值差十倍”,那单纯 token 计费会变得粗糙;
  • 一些供应商可能会把“高 token 消耗”误当成“高价值服务”;
  • 市场最终还是会逼问:这些 token 到底带来了什么结果。

独立观察

  1. Token 经济真正改变的,不是 API 定价形式,而是整个产业对“AI 产出”的理解;
  2. 推理时代里,GPU 已经不只是训练设备,而是 Token 生产设备;
  3. 未来真正值得追的,不是哪个公司 Token 最多,而是哪个公司“单位结果成本最低”。

总结判断

Token 这次被推到台前,不是术语爆红,而是 AI 行业终于开始形成一种更像基础设施产业的结算语言。

它带来的最重要变化是:

AI 商业模式正在从流量逻辑,转向生产力逻辑。

下一阶段真正决定胜负的,不只是模型有多聪明,而是:

  • 谁能更稳定地生产 Token;
  • 谁能更低成本地生产 Token;
  • 谁能把 Token 真正转成任务完成和商业价值。

Token 不是终点,但它很可能是 AI 走向成熟基础设施产业时,必须经过的一站。