Esc
输入关键词开始搜索
News

Copilot Wave 3:微软终于开始像搭操作层,而不是堆 AI 功能

Copilot Wave 3:微软终于开始像搭操作层,而不是堆 AI 功能

原文链接:

速查卡

项目内容
一句话总结微软这轮更新最重要的不是又多了几个 Copilot feature,而是它把“多模型协作 + 长任务执行 + 企业上下文 + 治理控制面”收束成一整层产品基础设施。
大白话版微软不再满足于把 AI 塞进 Word、Excel、Outlook 里,而是想让 Copilot 成为企业工作的统一入口:模型怎么协作、任务怎么跑、权限怎么管、审计怎么看,全都交给它。
核心信号• Reuters 披露 Critique / Council • 官方推出/强化 Copilot Cowork、Work IQ、Agent 365、E7 套餐 • Copilot 聊天、文档应用和代理治理开始统一成一套叙事
影响评级A — 这不是单点产品更新,而是微软企业 AI 平台路线的一次结构性收口。
最值得盯的点真正的模型协作质量、企业是否愿意把编排层交给微软,以及价格/延迟/可控性是否优于“企业自己拼多模型”。

先给结论

如果只看 Reuters 标题,你会以为微软又加了两个功能; 但如果把 Reuters 和 3 月 9 日官方 Wave 3 博文放一起看,会发现微软真正做的是:

把 Copilot 从“Office 里的 AI 助手”升级成“企业多模型工作操作层”。

这是完全不同级别的产品野心。

Reuters 透露了什么新东西

1. Critique:让模型协作成为平台默认能力

Reuters 披露,微软给 Copilot Researcher 增加了 Critique

  • GPT 负责生成
  • Claude 负责审校准确性与质量
  • 未来还将走向双向审校

这个信息很关键,因为它意味着微软已经公开承认:

  • 单一模型并不总是最优
  • 模型之间互相审校是合理产品形态
  • 用户不必自己手动在多个窗口之间切换比较

也就是说,多模型协作开始从“高手技巧”变成“平台能力”。

2. Council:把模型比较直接产品化

另一个功能 Council,允许并排比较不同模型输出。

这是一个很聪明的动作,因为它顺着现实,而不是对抗现实。

现实是: 今天的高级用户本来就会同时开 ChatGPT、Claude、Gemini 交叉看结果。

微软现在做的,是把这种行为收编进 Copilot 自己的界面层里。这样它即使不是所有底层模型的拥有者,也可以成为 模型决策界面 的拥有者。

官方 Wave 3 真正说清楚了什么

1. Copilot Cowork:长任务代理化

官方博客中最值得看的,是 Copilot Cowork

它的定位非常明确: 不是单轮 prompt 回答,而是可以:

  • 拆解复杂任务
  • 跨文件/工具/应用持续推进
  • 运行几分钟到几小时
  • 在过程中可观察、可中断、可调整

这就把 Copilot 从“问答助手”拉向了“长任务执行器”。

2. Work IQ:微软手里最核心的护城河

微软反复强调 Work IQ。这个东西本质上是它的企业上下文层:

  • 文件
  • 邮件
  • 会议
  • 聊天
  • 人际关系
  • 权限体系

这一层决定了为什么微软能做 enterprise-grade AI,而不只是一个通用模型壳子。

因为企业真正缺的不是“更聪明的底模”,而是: 更懂公司上下文、又不把数据搞乱的执行层。

3. Agent 365:治理平面第一次被明确产品化

微软提出 Agent 365 作为 agents 的 control plane,这点其实很硬。

它的意思是:

  • agent 不只是功能组件
  • 而是企业需要像管理员工一样去管理的数字执行体

微软试图把现有企业 IT 管理体系(Admin Center、Defender、Entra、Purview)直接延伸到 agent 上。

这很有微软风格: 不是发明一套全新治理体系,而是把 agent 纳入现有企业治理栈里。

战略层面的真正变化

1. 微软不再纠结“哪家模型才是主角”

官方明确写到,Copilot 的差异化不在于绑定单一模型,而在于:

  • 把多家领先模型接进企业工作流
  • 自动选择适合任务的模型
  • 让用户尽量不感知底层模型切换

这说明微软已经把模型厂商关系视为供应链问题,而不是品牌信仰问题。

这对行业格局很重要: 未来企业采购的可能不是“某家最强模型”,而是“哪家工作平台能把多模型管好、跑顺、审计清楚”。

2. Copilot 正在从应用功能变成企业 AI OS 的候选者

Wave 3 的组合其实已经很像一个操作层:

层级微软对应组件
交互入口Chat in Copilot / Word / Excel / PowerPoint / Outlook
任务执行Cowork / app-native agents
上下文层Work IQ
模型层Claude + OpenAI 等多模型接入
治理层Agent 365 + Entra + Defender + Purview

如果这套东西跑通,微软卖的就不只是 M365 订阅,而是一整套企业 AI 工作系统。

为什么这件事格外值得重视

1. 微软终于抓住了企业 AI 的真实核心矛盾

企业 AI 现在最大矛盾不是“模型不够强”,而是:

  • 上下文碎片化
  • 权限和安全边界复杂
  • 工具链太多
  • 无法审计 agent 行为
  • 用户要自己决定何时用哪个模型

微软这次的方案,基本都在围绕这些矛盾下手。

2. 它对纯单模型助手形成压力

如果微软能把多模型编排做成默认体验,那纯单模型助手的差异化空间会被明显压缩。

因为企业更在意的是:

  • 任务有没有做完
  • 数据有没有泄露
  • 成本是否可控
  • 结果是否可审计

而不是底层到底是谁的模型。

还要保留的质疑

1. 多模型协作很容易听起来厉害,做起来鸡肋

让 GPT 写、Claude 审,本身当然合理;但真正难的是:

  • 审校结果是否真能提高质量
  • 成本会不会翻倍
  • 延迟会不会过高
  • 用户能否理解为什么这次输出这样、下次不一样

如果这些问题解决不好,多模型协作会沦为高级营销词。

2. 企业是否愿意把编排权交给微软,仍是大问号

很多大企业会犹豫:

  • 我为什么不自己拼 Claude + OpenAI + 内部系统?
  • 为什么要把最关键的任务编排和治理交给微软?
  • 如果微软未来抬价怎么办?

所以微软真正要证明的,不只是“功能多”,而是“整体比自己拼更省、更稳、更安全”。

我的判断

微软这次最值得重视的地方,是它终于把企业 AI 的四件大事整成了一套:

  1. 模型协作
  2. 长任务执行
  3. 企业上下文接入
  4. 治理与安全控制

这让 Copilot 第一次开始像一层企业 AI 操作层,而不是 Office 附件。

如果它能把体验跑顺,微软在企业 AI 里的真正护城河,不会是“自家模型最强”,而会是:

没有谁比它更擅长把多模型安全地放进日常工作。

接下来该盯什么

  1. Critique / Council 是否从 Frontier 扩展到更广用户群
  2. 企业真实案例中,模型协作是否显著提升质量或减少幻觉
  3. Cowork 的长任务体验是否稳定,还是只适合少数展示型任务
  4. Agent 365 的定价、治理深度和第三方系统接入能力