Esc
输入关键词开始搜索
News

Anthropic Economic Index Report #5: Learning Curves

Anthropic Economic Index Report #5: Learning Curves

原文链接:https://www.anthropic.com/research/economic-index-march-2026-report 来源:Anthropic Research 作者:Maxim Massenkoff, Eva Lyubich, Peter McCrory, Ruth Appel, Ryan Heller 发布日期:2026-03-24 数据来源:HuggingFace 公开数据集

速查卡

项目内容
一句话总结高经验用户的 Claude 对话成功率比新用户高 4 个百分点——AI 使用中存在显著的”学习效应”
大白话版用 Claude 越久的人,越会用,成功率越高,做的任务也越复杂。这可能意味着 AI 红利不是人人均等的——先学会的人会越来越强
核心数字• 高经验用户成功率 +4pp • Claude.ai Top 10 任务集中度从 24% 降至 19% • 49% 的职业至少有 1/4 的任务在 Claude 上执行过 • 全球使用不平等持续(前 20 国占 48%)
影响评级A — Anthropic 经济指数是目前最系统、最有数据支撑的 AI 经济影响追踪项目,本期引入的”学习曲线”分析具有重要政策含义
利益相关方劳动经济学研究者、AI 政策制定者、企业 AI 战略决策者、教育规划者

文章背景

Anthropic 经济指数(Anthropic Economic Index)是利用其隐私保护数据分析系统 CLIO 追踪 Claude 在经济中实际使用情况的系列报告。这是第五期。

本期数据覆盖 2026 年 2 月 5 日至 12 日,恰逢 Claude Opus 4.5 发布三个月后、Opus 4.6 发布之际。样本涵盖 Claude.ai(消费者端)和第一方 API(开发者端)各 100 万对话。

这期报告的核心创新在于引入了”学习曲线”(Learning Curves)分析——这是 AI 经济学中一个极其重要但此前缺乏实证数据的话题。

完整内容还原

第一章:自上次报告以来的变化

1. Claude.ai 使用场景多元化

核心发现:Claude.ai 上的使用变得更加分散。

指标2025 年 11 月2026 年 2 月变化
Top 10 任务占比24%19%-5pp
编程任务高集中度向 API 迁移
课程相关19%12%-7pp
个人使用35%42%+7pp
至少 1/4 任务被 Claude 执行的职业~49%~49%持平

驱动因素:

  • 编程任务从 Claude.ai 迁移到 API(特别是 Claude Code 的增长,将编程工作拆分为更小的 API 调用)
  • 课程相关下降部分由于学术日历(冬季假期)
  • 2 月份注册潮带来更多休闲用户

2. 平均任务价值下降

指标变化
Claude.ai 平均任务价值49.349.3 → 47.9
平均教育年限要求12.2 → 11.9 年
用户给予 AI 的自主权增加
人工独立完成时间减少约 2 分钟
无 AI 情况下人工完成可能性略降

解读:这符合标准的”采用曲线”叙事——早期采用者偏好编程等高价值用途,后期采用者带来更广泛的任务类型。

3. 增强模式(Augmentation)略增

Claude.ai 上的增强使用(collaborative,AI 补充人类能力)略有增加,主要由验证(validation)和学习(learning)模式驱动。

在 API 端,自动化使用则大幅下降——这是一个有趣的反向信号。

4. 新兴 API 自动化模式

两类 API 工作流出现显著增长(份额至少翻倍):

  1. 商业销售与外展自动化:销售支持内容生成、B2B 线索筛选、客户数据富化、冷邮件起草
  2. 自动交易与市场运营:监控市场或头寸、提出具体投资建议、通知交易员市场状况

5. 地理收敛态势

美国国内: 收敛继续但放缓。

  • 前 5 州的人均使用份额:30%(2025.08)→ 24%(2026.02)
  • 按当前速度,各州大致均等使用将在 5-9 年内实现(之前预估 2-5 年)

全球层面: 反向趋势——使用变得更加集中。

  • 前 20 国占全球人均使用:45% → 48%
  • 基尼系数上升

第二章:学习使用 AI——核心发现

模型选择与任务匹配

用户会为不同任务选择不同模型。付费 Claude.ai 用户中:

任务类型Opus 使用比例偏差
计算机与数学任务+4.4pp(55% 使用 Opus)
教育任务-6pp(45% 使用 Opus)

更精细的分析:

  • 软件开发任务:34% 使用 Opus
  • 辅导任务:仅 12% 使用 Opus
  • 每增加 $10 小时工资对应的任务,Claude.ai 上 Opus 份额增加 1.5pp,API 上增加 2.8pp

含义: 用户不仅在使用 AI,还在有策略地使用——复杂任务用强模型,简单任务用快模型。API 用户的这种策略性更强。

学习曲线:经验的力量

这是本报告最重要的发现。将用户分为两组:

  • 高经验组:注册 Claude 至少 6 个月
  • 低经验组:其他所有用户
维度高经验 vs 低经验差异
工作相关使用更高+7pp
个人使用更低-10%
任务教育水平更高+6%
对话成功率更高+10%
迭代协作模式更多
直接委派模式更少-7pp
使用集中度更分散Top 10 任务占比 20.7% vs 22.2%

每多一年 Claude 使用经验:

  • 理解提示所需的教育年限增加近 1 年
  • 个人使用占比从 44% 降至 38%

高经验用户最常见任务: AI 研究、git 操作、手稿修改、创业融资 低经验用户最常见任务: 写俳句、查体育比分、派对食物建议

经验效应的回归分析

这是报告中方法论最严谨的部分。三个递进的回归规格:

规格控制变量高经验组成功率优势
(1) 简单双变量+5pp
(2) 任务固定效应O*NET 任务 + 请求聚类+3pp
(3) 完整控制任务 + 模型 + 用例 + 国家+4pp

关键解读:

  • 规格 (2) 回答了”是不是因为高经验用户做的任务不同?”→ 不完全是,控制任务后效应仍显著
  • 规格 (3) 加入模型、语言、国家等控制后,效应反而略增到 4pp
  • 这不能完全排除选择偏差和幸存者偏差,但已经排除了最简单的混淆因素

核心技术洞察

1. AI 的”技能偏向性”正在实时发生

经济学家长期讨论”技能偏向性技术变革”(Skill-Biased Technological Change, SBTC)——创新提高高技能工人的工资同时压低低技能工人的工资。

本报告提供了 AI 版 SBTC 的第一手经验证据:早期高技能采用者不仅使用 AI 更多,而且使用得更好、更成功。他们恰好也是最暴露于 AI 冲击的群体。

这意味着:AI 的红利可能是自我强化的——先学会的人获得更大收益,进一步拉大差距。

2. 增强优先于自动化

一个反直觉的发现:最有经验的用户更倾向于与 Claude 协作迭代,而不是直接委派

这推翻了之前的假设——人们以为越有经验的用户越会自动化。实际上:

  • 高经验用户使用更多”迭代”模式
  • 更少使用”指令式”模式
  • 增强(augmentation)在 Claude.ai 上持续增长

3. 编程迁移信号

编程任务从 Claude.ai 向 API 的持续迁移可能是一个领先指标:

“We expect that this migration from Claude.ai to the API may signal more imminent transformation of work for the associated jobs.”

当一个任务类别从”人在环中的 web 聊天”迁移到”程序化的 API 工作流”,它距离真正的工作转型更近了一步。

横向对比

维度Anthropic 经济指数其他 AI 经济影响研究
数据来源真实使用数据(100万对话样本)通常基于调查或理论推演
隐私保护CLIO 系统,不暴露个人对话各异
时间跨度5 期报告覆盖 2025.03-2026.02通常为单次横截面
任务分类O*NET 框架 + 自定义请求聚类通常使用 O*NET 或自定义
局限仅反映 Claude 用户(非 AI 使用全貌)覆盖范围各异

批判性分析

局限性

  1. 选择偏差:报告坦承——高经验用户是自选的。2023 年 3 月就开始用 Claude 的人本身就可能更技术化、更投入。幸存者偏差也是显著的——那些用了但发现没用的人已经离开了。

  2. 仅反映 Anthropic 生态:这些数据只覆盖 Claude 用户。ChatGPT、Gemini、开源模型的使用模式可能完全不同。特别是在中国市场,Anthropic 的渗透率很低。

  3. 任务价值的衡量方式:使用美国工人执行该任务的平均小时工资来衡量”任务价值”是一个粗略的代理变量。同一个任务在不同上下文中的实际价值可能差异巨大。

  4. 因果性 vs 相关性:即使控制了任务固定效应,4pp 的成功率差异仍然可能来自未观察到的混淆因素(如用户的整体技术素养、动机等)。报告对此是诚实的,但标题”Learning Curves”可能过度暗示了因果关系。

潜在风险

  1. “马太效应”隐忧:如果 AI 使用经验确实是自我强化的,那么政策干预的窗口可能比想象的要小——不作为将导致先发优势固化为长期不平等。

  2. 全球不平等加剧:国内收敛但国际发散的趋势令人担忧。发展中国家不仅在 AI 采用率上落后,而且在”学会使用 AI”的学习曲线上也将落后。

独立观察

  1. 管理类任务的增长值得关注:Claude.ai 上管理类任务从 3% 增至 5%。包括投资备忘录准备和客户问题回应等分析性任务。这可能预示着 AI 正在从”执行层工具”走向”管理层工具”。

  2. “每晚不运行 Agent 都是浪费”的文化冲击:同日发布的 Long-running Claude 文章中的这句话,与经济指数中 API 自动化趋势相印证——AI 正在变成一种”需要 24/7 运行”的基础设施。

  3. 对动动的意义:作为顶级程序员,动动属于”高暴露、高收益”群体。经验效应的数据支持了一个判断:持续深度使用 AI 工具(而不是浅尝辄止)是保持竞争优势的关键。

  4. 数据集公开值得称赞:Anthropic 在 HuggingFace 上公开了经济指数数据,这对学术界研究 AI 经济影响非常有价值。这种透明度在 AI 公司中并不常见。