Anthropic Economic Index Report #5: Learning Curves
Anthropic Economic Index Report #5: Learning Curves
原文链接:https://www.anthropic.com/research/economic-index-march-2026-report 来源:Anthropic Research 作者:Maxim Massenkoff, Eva Lyubich, Peter McCrory, Ruth Appel, Ryan Heller 发布日期:2026-03-24 数据来源:HuggingFace 公开数据集
速查卡
| 项目 | 内容 |
|---|---|
| 一句话总结 | 高经验用户的 Claude 对话成功率比新用户高 4 个百分点——AI 使用中存在显著的”学习效应” |
| 大白话版 | 用 Claude 越久的人,越会用,成功率越高,做的任务也越复杂。这可能意味着 AI 红利不是人人均等的——先学会的人会越来越强 |
| 核心数字 | • 高经验用户成功率 +4pp • Claude.ai Top 10 任务集中度从 24% 降至 19% • 49% 的职业至少有 1/4 的任务在 Claude 上执行过 • 全球使用不平等持续(前 20 国占 48%) |
| 影响评级 | A — Anthropic 经济指数是目前最系统、最有数据支撑的 AI 经济影响追踪项目,本期引入的”学习曲线”分析具有重要政策含义 |
| 利益相关方 | 劳动经济学研究者、AI 政策制定者、企业 AI 战略决策者、教育规划者 |
文章背景
Anthropic 经济指数(Anthropic Economic Index)是利用其隐私保护数据分析系统 CLIO 追踪 Claude 在经济中实际使用情况的系列报告。这是第五期。
本期数据覆盖 2026 年 2 月 5 日至 12 日,恰逢 Claude Opus 4.5 发布三个月后、Opus 4.6 发布之际。样本涵盖 Claude.ai(消费者端)和第一方 API(开发者端)各 100 万对话。
这期报告的核心创新在于引入了”学习曲线”(Learning Curves)分析——这是 AI 经济学中一个极其重要但此前缺乏实证数据的话题。
完整内容还原
第一章:自上次报告以来的变化
1. Claude.ai 使用场景多元化
核心发现:Claude.ai 上的使用变得更加分散。
| 指标 | 2025 年 11 月 | 2026 年 2 月 | 变化 |
|---|---|---|---|
| Top 10 任务占比 | 24% | 19% | -5pp |
| 编程任务 | 高集中度 | 向 API 迁移 | ↓ |
| 课程相关 | 19% | 12% | -7pp |
| 个人使用 | 35% | 42% | +7pp |
| 至少 1/4 任务被 Claude 执行的职业 | ~49% | ~49% | 持平 |
驱动因素:
- 编程任务从 Claude.ai 迁移到 API(特别是 Claude Code 的增长,将编程工作拆分为更小的 API 调用)
- 课程相关下降部分由于学术日历(冬季假期)
- 2 月份注册潮带来更多休闲用户
2. 平均任务价值下降
| 指标 | 变化 |
|---|---|
| Claude.ai 平均任务价值 | 47.9 |
| 平均教育年限要求 | 12.2 → 11.9 年 |
| 用户给予 AI 的自主权 | 增加 |
| 人工独立完成时间 | 减少约 2 分钟 |
| 无 AI 情况下人工完成可能性 | 略降 |
解读:这符合标准的”采用曲线”叙事——早期采用者偏好编程等高价值用途,后期采用者带来更广泛的任务类型。
3. 增强模式(Augmentation)略增
Claude.ai 上的增强使用(collaborative,AI 补充人类能力)略有增加,主要由验证(validation)和学习(learning)模式驱动。
在 API 端,自动化使用则大幅下降——这是一个有趣的反向信号。
4. 新兴 API 自动化模式
两类 API 工作流出现显著增长(份额至少翻倍):
- 商业销售与外展自动化:销售支持内容生成、B2B 线索筛选、客户数据富化、冷邮件起草
- 自动交易与市场运营:监控市场或头寸、提出具体投资建议、通知交易员市场状况
5. 地理收敛态势
美国国内: 收敛继续但放缓。
- 前 5 州的人均使用份额:30%(2025.08)→ 24%(2026.02)
- 按当前速度,各州大致均等使用将在 5-9 年内实现(之前预估 2-5 年)
全球层面: 反向趋势——使用变得更加集中。
- 前 20 国占全球人均使用:45% → 48%
- 基尼系数上升
第二章:学习使用 AI——核心发现
模型选择与任务匹配
用户会为不同任务选择不同模型。付费 Claude.ai 用户中:
| 任务类型 | Opus 使用比例偏差 |
|---|---|
| 计算机与数学任务 | +4.4pp(55% 使用 Opus) |
| 教育任务 | -6pp(45% 使用 Opus) |
更精细的分析:
- 软件开发任务:34% 使用 Opus
- 辅导任务:仅 12% 使用 Opus
- 每增加 $10 小时工资对应的任务,Claude.ai 上 Opus 份额增加 1.5pp,API 上增加 2.8pp
含义: 用户不仅在使用 AI,还在有策略地使用——复杂任务用强模型,简单任务用快模型。API 用户的这种策略性更强。
学习曲线:经验的力量
这是本报告最重要的发现。将用户分为两组:
- 高经验组:注册 Claude 至少 6 个月
- 低经验组:其他所有用户
| 维度 | 高经验 vs 低经验 | 差异 |
|---|---|---|
| 工作相关使用 | 更高 | +7pp |
| 个人使用 | 更低 | -10% |
| 任务教育水平 | 更高 | +6% |
| 对话成功率 | 更高 | +10% |
| 迭代协作模式 | 更多 | — |
| 直接委派模式 | 更少 | -7pp |
| 使用集中度 | 更分散 | Top 10 任务占比 20.7% vs 22.2% |
每多一年 Claude 使用经验:
- 理解提示所需的教育年限增加近 1 年
- 个人使用占比从 44% 降至 38%
高经验用户最常见任务: AI 研究、git 操作、手稿修改、创业融资 低经验用户最常见任务: 写俳句、查体育比分、派对食物建议
经验效应的回归分析
这是报告中方法论最严谨的部分。三个递进的回归规格:
| 规格 | 控制变量 | 高经验组成功率优势 |
|---|---|---|
| (1) 简单双变量 | 无 | +5pp |
| (2) 任务固定效应 | O*NET 任务 + 请求聚类 | +3pp |
| (3) 完整控制 | 任务 + 模型 + 用例 + 国家 | +4pp |
关键解读:
- 规格 (2) 回答了”是不是因为高经验用户做的任务不同?”→ 不完全是,控制任务后效应仍显著
- 规格 (3) 加入模型、语言、国家等控制后,效应反而略增到 4pp
- 这不能完全排除选择偏差和幸存者偏差,但已经排除了最简单的混淆因素
核心技术洞察
1. AI 的”技能偏向性”正在实时发生
经济学家长期讨论”技能偏向性技术变革”(Skill-Biased Technological Change, SBTC)——创新提高高技能工人的工资同时压低低技能工人的工资。
本报告提供了 AI 版 SBTC 的第一手经验证据:早期高技能采用者不仅使用 AI 更多,而且使用得更好、更成功。他们恰好也是最暴露于 AI 冲击的群体。
这意味着:AI 的红利可能是自我强化的——先学会的人获得更大收益,进一步拉大差距。
2. 增强优先于自动化
一个反直觉的发现:最有经验的用户更倾向于与 Claude 协作迭代,而不是直接委派。
这推翻了之前的假设——人们以为越有经验的用户越会自动化。实际上:
- 高经验用户使用更多”迭代”模式
- 更少使用”指令式”模式
- 增强(augmentation)在 Claude.ai 上持续增长
3. 编程迁移信号
编程任务从 Claude.ai 向 API 的持续迁移可能是一个领先指标:
“We expect that this migration from Claude.ai to the API may signal more imminent transformation of work for the associated jobs.”
当一个任务类别从”人在环中的 web 聊天”迁移到”程序化的 API 工作流”,它距离真正的工作转型更近了一步。
横向对比
| 维度 | Anthropic 经济指数 | 其他 AI 经济影响研究 |
|---|---|---|
| 数据来源 | 真实使用数据(100万对话样本) | 通常基于调查或理论推演 |
| 隐私保护 | CLIO 系统,不暴露个人对话 | 各异 |
| 时间跨度 | 5 期报告覆盖 2025.03-2026.02 | 通常为单次横截面 |
| 任务分类 | O*NET 框架 + 自定义请求聚类 | 通常使用 O*NET 或自定义 |
| 局限 | 仅反映 Claude 用户(非 AI 使用全貌) | 覆盖范围各异 |
批判性分析
局限性
-
选择偏差:报告坦承——高经验用户是自选的。2023 年 3 月就开始用 Claude 的人本身就可能更技术化、更投入。幸存者偏差也是显著的——那些用了但发现没用的人已经离开了。
-
仅反映 Anthropic 生态:这些数据只覆盖 Claude 用户。ChatGPT、Gemini、开源模型的使用模式可能完全不同。特别是在中国市场,Anthropic 的渗透率很低。
-
任务价值的衡量方式:使用美国工人执行该任务的平均小时工资来衡量”任务价值”是一个粗略的代理变量。同一个任务在不同上下文中的实际价值可能差异巨大。
-
因果性 vs 相关性:即使控制了任务固定效应,4pp 的成功率差异仍然可能来自未观察到的混淆因素(如用户的整体技术素养、动机等)。报告对此是诚实的,但标题”Learning Curves”可能过度暗示了因果关系。
潜在风险
-
“马太效应”隐忧:如果 AI 使用经验确实是自我强化的,那么政策干预的窗口可能比想象的要小——不作为将导致先发优势固化为长期不平等。
-
全球不平等加剧:国内收敛但国际发散的趋势令人担忧。发展中国家不仅在 AI 采用率上落后,而且在”学会使用 AI”的学习曲线上也将落后。
独立观察
-
管理类任务的增长值得关注:Claude.ai 上管理类任务从 3% 增至 5%。包括投资备忘录准备和客户问题回应等分析性任务。这可能预示着 AI 正在从”执行层工具”走向”管理层工具”。
-
“每晚不运行 Agent 都是浪费”的文化冲击:同日发布的 Long-running Claude 文章中的这句话,与经济指数中 API 自动化趋势相印证——AI 正在变成一种”需要 24/7 运行”的基础设施。
-
对动动的意义:作为顶级程序员,动动属于”高暴露、高收益”群体。经验效应的数据支持了一个判断:持续深度使用 AI 工具(而不是浅尝辄止)是保持竞争优势的关键。
-
数据集公开值得称赞:Anthropic 在 HuggingFace 上公开了经济指数数据,这对学术界研究 AI 经济影响非常有价值。这种透明度在 AI 公司中并不常见。