你的AI,按“词”收费
你的AI,按“词”收费
主要信源:https://www.36kr.com/p/3743326045765892 事件日期:2026-03-30
速查卡
| 项目 | 内容 |
|---|---|
| 一句话总结 | Token 正在从模型内部技术计量单位,变成 AI 产业的前台结算单位;这意味着 AI 商业模式开始真正从“卖能力叙事”转向“卖可计量生产力”。 |
| 大白话版 | 过去大家说 AI 强不强,现在开始认真算:它到底吐了多少 token、这些 token 成本多少、能不能稳定按结果收钱。 |
| 核心数字 | 中国日均 Token 调用量:2024 年初约 1000 亿,2025 年底约 100 万亿,2026 年 3 月超 140 万亿;火山引擎公开按 Token 计费;华为云已给出 Token 套餐包。 |
| 影响评级 | A — 这不是术语流行,而是计价逻辑变化。谁定义 Token 的生产效率和价值评估,谁就更接近 AI 基础设施利润池。 |
| 利益相关方 | 云厂商、模型厂商、Agent 平台、芯片公司、电力系统、企业采购方、开发者。 |
事件全貌
发生了什么?
36 氪转发中新经纬报道,围绕中关村论坛释放出一个非常强的信号:
- Token(词元)正在成为 AI 时代最核心的计量单位之一;
- 它不再只是模型开发者的黑话,而是进入了产业计价体系;
- 国内云厂商和基础设施玩家已经在公开按 Token 设计价格、资源包和产品叙事。
报道中的几个关键点值得单独拎出来:
- 全国科学技术名词审定委员会已将 Token 的中文名定为“词元”;
- 国内日均 Token 调用量已从 2024 年初的 1000 亿,涨到 2026 年 3 月的 140 万亿;
- OpenClaw 这类 Agent 产品正在显著放大 Token 消耗;
- 火山引擎、华为云等已把 Token 计费更直接地摆到前台;
- 行业开始把“算力工厂”升级成“Token 工厂”来理解。
为什么这是大事?
因为这意味着 AI 商业正在经历一次底层语言切换。
以前行业更习惯按这些方式谈 AI:
- 模型参数量;
- benchmark 分数;
- GPU 数量;
- API 能力清单;
- 用户活跃度。
现在越来越多公司开始用另一组语言说话:
- 单位成本能产出多少 Token;
- 在高并发下能不能稳定产 Token;
- Token 是否真正带来任务完成;
- Token 的价格层级是否可精细分化。
这不只是表述变化,而是商业结算逻辑变了。
技术解析
Token 为什么会从后台指标变成前台商品
Token 原本只是模型计算过程中的自然计量单位:
- 文本被切成 token;
- 模型按 token 处理;
- 计费也顺手按 token 来收。
但在 Agent 时代,Token 的产业意义突然放大,原因有三:
1. Agent 大幅抬高了推理消耗
单轮对话时代,用户问一句、模型答一句,Token 消耗相对线性。
Agent 时代完全不同:
- 规划需要 token;
- 工具调用返回需要 token;
- 子代理协作需要 token;
- 长上下文历史反复重放也要 token;
- 自我反思、总结、压缩同样消耗 token。
所以 Agent 不是“多一个 AI 功能”,而是把 Token 从后台燃料变成前台计费主语。
2. 推理取代训练成为更稳定的商业负载
报道中多位受访者都强调一个转变:AI 算力使用模式正在从训练为主,转向推理为主、服务为主。
训练当然仍重要,但训练更像阶段性大项目;推理则是日常持续消耗。谁能把持续推理负载变成标准化产品,谁更接近基础设施层的稳定现金流。
3. Token 更适合作为“AI 产出单位”
与 GPU 小时相比,Token 更接近业务层可理解单位。
- 用户不关心你用了多少张卡;
- 采购方也不想只听你说 TFLOPS;
- 他们更关心:我花这笔钱,系统到底输出了多少可用结果。
Token 虽然还不等于最终价值,但比纯底层硬件指标更接近商业交付。
从“算力工厂”到“Token 工厂”的含义
“Token 工厂”这个表述值得单独看,因为它浓缩了 AI 基础设施竞争的方向变化。
以前算力竞争更像:
- 谁有更多 GPU;
- 谁机房更大;
- 谁训练更快。
现在更像:
- 谁能以更低单位成本稳定生成更多 Token;
- 谁能在高并发下仍然保证响应速度;
- 谁能让这些 Token 真正完成有价值的任务。
这和传统制造业很像:
- 不是装了多少机器最重要;
- 是单位成本、良率、连续产出能力、供应稳定性更重要。
所以“Token 工厂”这个词的真正重点,不是语言新鲜,而是它把 AI 竞争从“资源拥有量”推向了“系统生产效率”。
Token 计费的技术与商业意义
报道提到两个很直接的产品例子:
- 火山引擎按实际消耗的 Token 数量计费,给出每百万 Token 单价;
- 华为云按不同模型版本提供 Token 套餐包。
这说明 Token 计费已经从 API 厂商默认做法,扩展到更广的云基础设施产品设计里。
它带来三层变化:
第一层:AI 服务更标准化
像水电煤一样,如果一个行业能把产出稳定地计量并定价,规模化的条件就成熟得多。
第二层:不同工作负载更容易分层定价
未来很可能出现更细的价格结构:
- 通用低价值 Token:走薄利多销;
- 专业领域高价值 Token:走溢价;
- 实时语音、图像、多模态 Token:按不同质量等级定价;
- Agent 结果导向服务:可能在 Token 之外叠加 outcome-based pricing。
第三层:Token 生产效率成为核心 KPI
一旦按 Token 结算,基础设施层最关心的就不再只是设备总量,而是:
- 单位电力能产出多少 Token;
- 单位 GPU / 单位集群的有效 Token 吞吐是多少;
- 调度损耗是否压得住;
- 通信、存储、编排是否拖后腿。
产业影响链
Token 经济进入前台
├→ 云厂商把 Token 作为直接计费单位
│ └→ 基础设施竞争从“算力规模”转向“Token 产能”
├→ Agent 产品进一步放大 Token 消耗
│ └→ 推理算力需求持续高于传统预期
├→ 芯片 / 网络 / 存储 / 调度效率成为关键瓶颈
│ └→ Token 成本控制变成系统工程问题
└→ 企业采购开始问“任务价值 / Token 成本”
└→ AI 商业模式从流量逻辑转向生产力逻辑
谁受益?
1. 云厂商与推理基础设施平台
谁能更便宜、更稳定地生产 Token,谁就更可能吃到规模化推理红利。
2. Agent 平台
Agent 天生是 Token 消耗放大器。Token 越成为标准计量单位,Agent 平台越容易把自己的价值翻译成基础设施语言。
3. 系统工程能力强的公司
随着 Token 成本被精确盯住,真正占优的不一定只是模型最强者,而是:
- 调度做得好;
- 集群利用率高;
- 通信和存储损耗低;
- 推理软件栈成熟;
- 故障与抖动控制稳。
谁受损?
1. 只会讲模型故事、不懂成本结构的玩家
如果不能把能力转成可量化 Token 产出和价值,商业化会越来越难讲。
2. 只卷 Token 数量而不卷任务完成质量的厂商
Token 计量很方便,但也有危险:容易把行业带回“刷指标”老路。
3. 基础设施短板明显的系统
调度、通信、存储、并发控制都会直接影响单位 Token 成本。一旦进入前台结算,这些短板会被放大。
竞争格局变化
变化前
大家更多在比:
- 谁模型更强;
- 谁 GPU 更多;
- 谁上下文更长;
- 谁价格更低。
变化后
真正核心会逐步变成:
- 谁能更高效地生产有效 Token;
- 谁能把 Token 和任务结果关联起来;
- 谁能把 Token 的价值分层卖出去。
这会让竞争重心从单模型,转向全系统:
- 芯片;
- 推理框架;
- 调度系统;
- 网络;
- 存储;
- Agent 编排层。
历史脉络
AI 商业模式大致经历了三步:
- 卖智能概念:讲模型有多强;
- 卖 API 能力:按调用量、按 token 初步计费;
- 卖可计量生产力:开始认真优化 token 成本、token 吞吐与 token 价值。
当前行业正在从第二步迈向第三步。
而一旦进入第三步,AI 就会越来越像基础设施行业:
- 有统一计量单位;
- 有规模经济;
- 有效率竞赛;
- 有不同质量等级的产品分层。
批判性分析
被忽略的风险
- Token 不等于价值。 用户买的不是 token,而是任务完成;
- 容易诱导错误优化。 如果行业只卷 token 吞吐,很可能牺牲正确率、稳定性和结果质量;
- 高质量 Agent 任务可能更适合 outcome pricing。 Token 只是过渡性的标准,不一定是终局。
乐观预期的合理性
乐观派是有道理的:
- Token 提供了 AI 产业急需的中间计量层;
- 它比 GPU 小时更接近业务;
- 它能让云厂商和客户更容易建立预算与使用心智。
悲观预期的合理性
悲观派担心的也成立:
- 如果最终大家都发现“同样 token,价值差十倍”,那单纯 token 计费会变得粗糙;
- 一些供应商可能会把“高 token 消耗”误当成“高价值服务”;
- 市场最终还是会逼问:这些 token 到底带来了什么结果。
独立观察
- Token 经济真正改变的,不是 API 定价形式,而是整个产业对“AI 产出”的理解;
- 推理时代里,GPU 已经不只是训练设备,而是 Token 生产设备;
- 未来真正值得追的,不是哪个公司 Token 最多,而是哪个公司“单位结果成本最低”。
总结判断
Token 这次被推到台前,不是术语爆红,而是 AI 行业终于开始形成一种更像基础设施产业的结算语言。
它带来的最重要变化是:
AI 商业模式正在从流量逻辑,转向生产力逻辑。
下一阶段真正决定胜负的,不只是模型有多聪明,而是:
- 谁能更稳定地生产 Token;
- 谁能更低成本地生产 Token;
- 谁能把 Token 真正转成任务完成和商业价值。
Token 不是终点,但它很可能是 AI 走向成熟基础设施产业时,必须经过的一站。