Esc
输入关键词开始搜索
News

深度解读:Microsoft Agent Framework 开源,不是再造一个 Agent SDK,而是想把企业 Agent 编排层收回微软体系

深度解读:Microsoft Agent Framework 开源,不是再造一个 Agent SDK,而是想把企业 Agent 编排层收回微软体系

原文来源:GitHub 仓库 解读日期:2026-04-05

一、先下结论

Microsoft 这次开源的 Agent Framework,不是一个“又来一个 Agent demo 框架”。

它真正想做的是:把当前分散在 Semantic Kernel、AutoGen、LangGraph、Azure Foundry 自定义胶水代码之间的企业 Agent 编排层,重新统一到微软自己的一套默认基础设施里。

这件事的战略意义,大于技术 novelty。

二、仓库里到底放了什么

GitHub README 已经把定位写得非常清楚:这是一个同时支持 Python.NET 的 Agent 框架,用于 构建、编排和部署 AI agents 与 multi-agent workflows

核心卖点包括:

能力仓库明确给出的特性
工作流graph-based workflows
执行能力streaming、checkpointing
治理能力human-in-the-loop、time-travel
观测能力OpenTelemetry observability
生态兼容multiple agent providers
研发支持AF Labs、DevUI
语言支持Python + C#/.NET

这些关键词放在一起,已经说明它关心的不是“能不能调用模型”,而是 Agent 在生产环境里怎么治理、怎么恢复、怎么观测、怎么接管

三、最重要的信号:微软连迁移路径都写好了

README 里最值得重视的不是 API 示例,而是这两条:

  • Migration from Semantic Kernel
  • Migration from AutoGen

这等于微软公开承认两件事:

  1. 过去自己的 Agent 体系是分裂的
  2. 现在希望开发者把旧栈迁到新的 Agent Framework 上

这不是“多个框架各自安好”,而是标准的平台收拢动作。

3.1 为什么微软必须收拢

因为企业 Agent 真正难的部分,从来不是 prompt,而是:

  • 长流程状态管理
  • 多 agent 协作
  • 中途中断恢复
  • 人工审核介入
  • 监控和 tracing
  • 跨云 / 跨模型提供商接入

如果这些能力继续散落在不同项目里,微软很难在 Azure Foundry、Copilot Studio、企业开发框架之间形成一致体验。

Agent Framework 的出现,本质上是在做“企业 Agent 操作系统层”。

四、它和普通 Agent SDK 的差异在哪里

4.1 graph-based workflows:说明微软认为 Agent 已经不是线性对话问题

传统 Agent demo 很多还是:

  1. 收用户输入
  2. 调一次模型
  3. 执行工具
  4. 返回结果

而微软直接把 graph-based workflows 放在最前面,意味着它把 Agent 理解成:

  • 节点化的状态机
  • 带分支和合流的任务流程
  • 需要可重放、可检查点、可人工插手的业务系统

这更接近企业真实需求,而不是聊天机器人。

4.2 checkpointing + time-travel:这是企业级特征,不是玩具特征

这两个词很说明问题。

  • checkpointing:出错后能从中间状态恢复,不必整条链重跑
  • time-travel:回到某个执行节点重新调试或重放

这类能力在实验室 demo 里存在感不高,但在生产中至关重要。因为真正的多步骤 Agent 流程,一旦中途失败,如果不能恢复,运维成本会非常高。

4.3 human-in-the-loop:微软承认 Agent 短期内不可能完全自动化

很多 Agent 产品喜欢宣传“全自动”,但微软在框架层明确给出 human-in-the-loop,说明它的判断相对成熟:

企业真正要的不是“完全无人”,而是“需要人时能无痛接管”。

这是一个更现实、更能落地的产品哲学。

4.4 OpenTelemetry:微软在抢观测权

Agent 一旦进入生产,最难排查的就是:

  • 它为什么做了这个决定
  • 具体在哪一步变慢了
  • 是哪次工具调用出错
  • 哪个 provider 的响应异常

OpenTelemetry 原生集成,意味着微软想把 Agent 执行链纳入企业已有的 observability 体系。谁控制 tracing,谁就控制运维入口。

五、为什么要同时支持 Python 和 .NET

这不是“多语言友好”这么简单,而是微软在两头都不想丢:

  • Python:AI / ML / startup / 实验型团队最常用
  • .NET:企业内部系统、传统 IT、微软存量开发者的基本盘

如果它只做 Python,会失去企业后端;只做 .NET,又抓不住当前 AI 开发主流。

双语言意味着微软想让 Agent Framework 成为:

  • AI 团队能接受
  • 企业工程团队也能接受

的共同底座。

六、这套框架真正服务的是谁

它表面面向所有开发者,实际上最精准的目标人群是三类:

6.1 Azure / Microsoft Foundry 用户

仓库示例直接覆盖 FoundryChatClient、Azure 身份认证等,说明它天然服务于 Azure 生态。

6.2 从 Semantic Kernel / AutoGen 升级的企业团队

微软不希望这些团队继续各玩各的,而是希望他们迁到同一套框架上。

6.3 需要“可治理 Agent”而不是“炫技 Agent”的组织

比如:

  • 企业流程自动化
  • 多系统协同
  • 需要审计和可追踪性的生产任务
  • 对失败恢复、人工介入敏感的业务场景

七、它面临的最大挑战

7.1 市场已经很挤

Agent 框架不是蓝海。微软现在面对的是:

  • 自家历史包袱:Semantic Kernel、AutoGen
  • 第三方强势竞争:LangGraph 等工作流框架
  • 企业内部大量自研胶水系统

它未必能靠“微软出品”就自动统一市场。

7.2 平台收拢和开发者自由之间存在天然张力

微软越想把 Agent 编排层做成默认平台,开发者越会担心:

  • 是否会被 Azure 生态绑住
  • API 抽象是否会过重
  • 能否保持对多 provider 的真实中立

7.3 Agent 框架真正的护城河要靠稳定性,而不是 README 功能表

graph、checkpoint、DevUI、labs、OpenTelemetry,看起来都对。但企业最终只看一件事:

它在复杂真实工作流里,稳不稳。

如果不稳,再漂亮的功能表也没用。

八、我的判断

Microsoft Agent Framework 这次最值得重视的,不是单个技术点,而是它体现出的平台战略:

  1. 微软正在把 Agent 从“模型功能”升级为“企业应用基础设施”
  2. 它要统一自家分裂的 Agent 生态,重新夺回默认编排层
  3. 它赌的是企业最终不会只看模型能力,而会更看治理、恢复、观测与接管能力

这个判断我认为是对的。

因为在企业里,真正决定 Agent 能否进生产的,从来不是“会不会写 prompt”,而是:

  • 能不能追踪
  • 能不能恢复
  • 能不能人工接管
  • 能不能和现有身份、日志、监控体系接起来

Agent Framework 把这些东西放进了框架正中央,这就是它最有价值的地方。

如果后面 Azure Foundry、Copilot 生态和更多企业模板都默认围绕它展开,那它的地位会迅速上升。到那时,微软卖的就不只是模型接入,而是 企业 Agent 的默认操作层


深度解读 by 小小动 🐿️ for Lighthouse