Copilot Wave 3:微软终于开始像搭操作层,而不是堆 AI 功能
Copilot Wave 3:微软终于开始像搭操作层,而不是堆 AI 功能
原文链接:
- https://www.reuters.com/business/microsoft-unveils-ai-upgrades-rolls-out-copilot-cowork-early-access-customers-2026-03-30/
- https://www.microsoft.com/en-us/microsoft-365/blog/2026/03/09/powering-frontier-transformation-with-copilot-and-agents/ 来源:Reuters / Microsoft 官方博客 发布时间:2026-03-30(Reuters),2026-03-09(微软官方)
速查卡
| 项目 | 内容 |
|---|---|
| 一句话总结 | 微软这轮更新最重要的不是又多了几个 Copilot feature,而是它把“多模型协作 + 长任务执行 + 企业上下文 + 治理控制面”收束成一整层产品基础设施。 |
| 大白话版 | 微软不再满足于把 AI 塞进 Word、Excel、Outlook 里,而是想让 Copilot 成为企业工作的统一入口:模型怎么协作、任务怎么跑、权限怎么管、审计怎么看,全都交给它。 |
| 核心信号 | • Reuters 披露 Critique / Council • 官方推出/强化 Copilot Cowork、Work IQ、Agent 365、E7 套餐 • Copilot 聊天、文档应用和代理治理开始统一成一套叙事 |
| 影响评级 | A — 这不是单点产品更新,而是微软企业 AI 平台路线的一次结构性收口。 |
| 最值得盯的点 | 真正的模型协作质量、企业是否愿意把编排层交给微软,以及价格/延迟/可控性是否优于“企业自己拼多模型”。 |
先给结论
如果只看 Reuters 标题,你会以为微软又加了两个功能; 但如果把 Reuters 和 3 月 9 日官方 Wave 3 博文放一起看,会发现微软真正做的是:
把 Copilot 从“Office 里的 AI 助手”升级成“企业多模型工作操作层”。
这是完全不同级别的产品野心。
Reuters 透露了什么新东西
1. Critique:让模型协作成为平台默认能力
Reuters 披露,微软给 Copilot Researcher 增加了 Critique:
- GPT 负责生成
- Claude 负责审校准确性与质量
- 未来还将走向双向审校
这个信息很关键,因为它意味着微软已经公开承认:
- 单一模型并不总是最优
- 模型之间互相审校是合理产品形态
- 用户不必自己手动在多个窗口之间切换比较
也就是说,多模型协作开始从“高手技巧”变成“平台能力”。
2. Council:把模型比较直接产品化
另一个功能 Council,允许并排比较不同模型输出。
这是一个很聪明的动作,因为它顺着现实,而不是对抗现实。
现实是: 今天的高级用户本来就会同时开 ChatGPT、Claude、Gemini 交叉看结果。
微软现在做的,是把这种行为收编进 Copilot 自己的界面层里。这样它即使不是所有底层模型的拥有者,也可以成为 模型决策界面 的拥有者。
官方 Wave 3 真正说清楚了什么
1. Copilot Cowork:长任务代理化
官方博客中最值得看的,是 Copilot Cowork。
它的定位非常明确: 不是单轮 prompt 回答,而是可以:
- 拆解复杂任务
- 跨文件/工具/应用持续推进
- 运行几分钟到几小时
- 在过程中可观察、可中断、可调整
这就把 Copilot 从“问答助手”拉向了“长任务执行器”。
2. Work IQ:微软手里最核心的护城河
微软反复强调 Work IQ。这个东西本质上是它的企业上下文层:
- 文件
- 邮件
- 会议
- 聊天
- 人际关系
- 权限体系
这一层决定了为什么微软能做 enterprise-grade AI,而不只是一个通用模型壳子。
因为企业真正缺的不是“更聪明的底模”,而是: 更懂公司上下文、又不把数据搞乱的执行层。
3. Agent 365:治理平面第一次被明确产品化
微软提出 Agent 365 作为 agents 的 control plane,这点其实很硬。
它的意思是:
- agent 不只是功能组件
- 而是企业需要像管理员工一样去管理的数字执行体
微软试图把现有企业 IT 管理体系(Admin Center、Defender、Entra、Purview)直接延伸到 agent 上。
这很有微软风格: 不是发明一套全新治理体系,而是把 agent 纳入现有企业治理栈里。
战略层面的真正变化
1. 微软不再纠结“哪家模型才是主角”
官方明确写到,Copilot 的差异化不在于绑定单一模型,而在于:
- 把多家领先模型接进企业工作流
- 自动选择适合任务的模型
- 让用户尽量不感知底层模型切换
这说明微软已经把模型厂商关系视为供应链问题,而不是品牌信仰问题。
这对行业格局很重要: 未来企业采购的可能不是“某家最强模型”,而是“哪家工作平台能把多模型管好、跑顺、审计清楚”。
2. Copilot 正在从应用功能变成企业 AI OS 的候选者
Wave 3 的组合其实已经很像一个操作层:
| 层级 | 微软对应组件 |
|---|---|
| 交互入口 | Chat in Copilot / Word / Excel / PowerPoint / Outlook |
| 任务执行 | Cowork / app-native agents |
| 上下文层 | Work IQ |
| 模型层 | Claude + OpenAI 等多模型接入 |
| 治理层 | Agent 365 + Entra + Defender + Purview |
如果这套东西跑通,微软卖的就不只是 M365 订阅,而是一整套企业 AI 工作系统。
为什么这件事格外值得重视
1. 微软终于抓住了企业 AI 的真实核心矛盾
企业 AI 现在最大矛盾不是“模型不够强”,而是:
- 上下文碎片化
- 权限和安全边界复杂
- 工具链太多
- 无法审计 agent 行为
- 用户要自己决定何时用哪个模型
微软这次的方案,基本都在围绕这些矛盾下手。
2. 它对纯单模型助手形成压力
如果微软能把多模型编排做成默认体验,那纯单模型助手的差异化空间会被明显压缩。
因为企业更在意的是:
- 任务有没有做完
- 数据有没有泄露
- 成本是否可控
- 结果是否可审计
而不是底层到底是谁的模型。
还要保留的质疑
1. 多模型协作很容易听起来厉害,做起来鸡肋
让 GPT 写、Claude 审,本身当然合理;但真正难的是:
- 审校结果是否真能提高质量
- 成本会不会翻倍
- 延迟会不会过高
- 用户能否理解为什么这次输出这样、下次不一样
如果这些问题解决不好,多模型协作会沦为高级营销词。
2. 企业是否愿意把编排权交给微软,仍是大问号
很多大企业会犹豫:
- 我为什么不自己拼 Claude + OpenAI + 内部系统?
- 为什么要把最关键的任务编排和治理交给微软?
- 如果微软未来抬价怎么办?
所以微软真正要证明的,不只是“功能多”,而是“整体比自己拼更省、更稳、更安全”。
我的判断
微软这次最值得重视的地方,是它终于把企业 AI 的四件大事整成了一套:
- 模型协作
- 长任务执行
- 企业上下文接入
- 治理与安全控制
这让 Copilot 第一次开始像一层企业 AI 操作层,而不是 Office 附件。
如果它能把体验跑顺,微软在企业 AI 里的真正护城河,不会是“自家模型最强”,而会是:
没有谁比它更擅长把多模型安全地放进日常工作。
接下来该盯什么
- Critique / Council 是否从 Frontier 扩展到更广用户群
- 企业真实案例中,模型协作是否显著提升质量或减少幻觉
- Cowork 的长任务体验是否稳定,还是只适合少数展示型任务
- Agent 365 的定价、治理深度和第三方系统接入能力