News

Copilot Wave 3：微软终于开始像搭操作层，而不是堆 AI 功能

原文链接：

https://www.reuters.com/business/microsoft-unveils-ai-upgrades-rolls-out-copilot-cowork-early-access-customers-2026-03-30/

https://www.microsoft.com/en-us/microsoft-365/blog/2026/03/09/powering-frontier-transformation-with-copilot-and-agents/ 来源：Reuters / Microsoft 官方博客发布时间：2026-03-30（Reuters），2026-03-09（微软官方）

速查卡

项目	内容
一句话总结	微软这轮更新最重要的不是又多了几个 Copilot feature，而是它把“多模型协作 + 长任务执行 + 企业上下文 + 治理控制面”收束成一整层产品基础设施。
大白话版	微软不再满足于把 AI 塞进 Word、Excel、Outlook 里，而是想让 Copilot 成为企业工作的统一入口：模型怎么协作、任务怎么跑、权限怎么管、审计怎么看，全都交给它。
核心信号	• Reuters 披露 Critique / Council • 官方推出/强化 Copilot Cowork、Work IQ、Agent 365、E7 套餐 • Copilot 聊天、文档应用和代理治理开始统一成一套叙事
影响评级	A — 这不是单点产品更新，而是微软企业 AI 平台路线的一次结构性收口。
最值得盯的点	真正的模型协作质量、企业是否愿意把编排层交给微软，以及价格/延迟/可控性是否优于“企业自己拼多模型”。

先给结论

如果只看 Reuters 标题，你会以为微软又加了两个功能；但如果把 Reuters 和 3 月 9 日官方 Wave 3 博文放一起看，会发现微软真正做的是：

把 Copilot 从“Office 里的 AI 助手”升级成“企业多模型工作操作层”。

这是完全不同级别的产品野心。

Reuters 透露了什么新东西

1. Critique：让模型协作成为平台默认能力

Reuters 披露，微软给 Copilot Researcher 增加了 Critique：

GPT 负责生成
Claude 负责审校准确性与质量
未来还将走向双向审校

这个信息很关键，因为它意味着微软已经公开承认：

单一模型并不总是最优
模型之间互相审校是合理产品形态
用户不必自己手动在多个窗口之间切换比较

也就是说，多模型协作开始从“高手技巧”变成“平台能力”。

2. Council：把模型比较直接产品化

另一个功能 Council，允许并排比较不同模型输出。

这是一个很聪明的动作，因为它顺着现实，而不是对抗现实。

现实是：今天的高级用户本来就会同时开 ChatGPT、Claude、Gemini 交叉看结果。

微软现在做的，是把这种行为收编进 Copilot 自己的界面层里。这样它即使不是所有底层模型的拥有者，也可以成为 模型决策界面 的拥有者。

官方 Wave 3 真正说清楚了什么

1. Copilot Cowork：长任务代理化

官方博客中最值得看的，是 Copilot Cowork。

它的定位非常明确：不是单轮 prompt 回答，而是可以：

拆解复杂任务
跨文件/工具/应用持续推进
运行几分钟到几小时
在过程中可观察、可中断、可调整

这就把 Copilot 从“问答助手”拉向了“长任务执行器”。

2. Work IQ：微软手里最核心的护城河

微软反复强调 Work IQ。这个东西本质上是它的企业上下文层：

文件
邮件
会议
聊天
人际关系
权限体系

这一层决定了为什么微软能做 enterprise-grade AI，而不只是一个通用模型壳子。

因为企业真正缺的不是“更聪明的底模”，而是： 更懂公司上下文、又不把数据搞乱的执行层。

3. Agent 365：治理平面第一次被明确产品化

微软提出 Agent 365 作为 agents 的 control plane，这点其实很硬。

它的意思是：

agent 不只是功能组件
而是企业需要像管理员工一样去管理的数字执行体

微软试图把现有企业 IT 管理体系（Admin Center、Defender、Entra、Purview）直接延伸到 agent 上。

这很有微软风格：不是发明一套全新治理体系，而是把 agent 纳入现有企业治理栈里。

战略层面的真正变化

1. 微软不再纠结“哪家模型才是主角”

官方明确写到，Copilot 的差异化不在于绑定单一模型，而在于：

把多家领先模型接进企业工作流
自动选择适合任务的模型
让用户尽量不感知底层模型切换

这说明微软已经把模型厂商关系视为供应链问题，而不是品牌信仰问题。

这对行业格局很重要：未来企业采购的可能不是“某家最强模型”，而是“哪家工作平台能把多模型管好、跑顺、审计清楚”。

2. Copilot 正在从应用功能变成企业 AI OS 的候选者

Wave 3 的组合其实已经很像一个操作层：

层级	微软对应组件
交互入口	Chat in Copilot / Word / Excel / PowerPoint / Outlook
任务执行	Cowork / app-native agents
上下文层	Work IQ
模型层	Claude + OpenAI 等多模型接入
治理层	Agent 365 + Entra + Defender + Purview

如果这套东西跑通，微软卖的就不只是 M365 订阅，而是一整套企业 AI 工作系统。

为什么这件事格外值得重视

1. 微软终于抓住了企业 AI 的真实核心矛盾

企业 AI 现在最大矛盾不是“模型不够强”，而是：

上下文碎片化
权限和安全边界复杂
工具链太多
无法审计 agent 行为
用户要自己决定何时用哪个模型

微软这次的方案，基本都在围绕这些矛盾下手。

2. 它对纯单模型助手形成压力

如果微软能把多模型编排做成默认体验，那纯单模型助手的差异化空间会被明显压缩。

因为企业更在意的是：

任务有没有做完
数据有没有泄露
成本是否可控
结果是否可审计

而不是底层到底是谁的模型。

还要保留的质疑

1. 多模型协作很容易听起来厉害，做起来鸡肋

让 GPT 写、Claude 审，本身当然合理；但真正难的是：

审校结果是否真能提高质量
成本会不会翻倍
延迟会不会过高
用户能否理解为什么这次输出这样、下次不一样

如果这些问题解决不好，多模型协作会沦为高级营销词。

2. 企业是否愿意把编排权交给微软，仍是大问号

很多大企业会犹豫：

我为什么不自己拼 Claude + OpenAI + 内部系统？
为什么要把最关键的任务编排和治理交给微软？
如果微软未来抬价怎么办？

所以微软真正要证明的，不只是“功能多”，而是“整体比自己拼更省、更稳、更安全”。

我的判断

微软这次最值得重视的地方，是它终于把企业 AI 的四件大事整成了一套：

模型协作
长任务执行
企业上下文接入
治理与安全控制

这让 Copilot 第一次开始像一层企业 AI 操作层，而不是 Office 附件。

如果它能把体验跑顺，微软在企业 AI 里的真正护城河，不会是“自家模型最强”，而会是：

没有谁比它更擅长把多模型安全地放进日常工作。

接下来该盯什么

Critique / Council 是否从 Frontier 扩展到更广用户群
企业真实案例中，模型协作是否显著提升质量或减少幻觉
Cowork 的长任务体验是否稳定，还是只适合少数展示型任务
Agent 365 的定价、治理深度和第三方系统接入能力