OpenAI Agents SDK 后续更新:TypeScript 版补齐,沙箱与开源 harness 成为默认叙事
OpenAI Agents SDK 后续更新:TypeScript 版补齐,沙箱与开源 harness 成为默认叙事
原文链接:https://developers.openai.com/api/docs/changelog 补充原文:https://developers.openai.com/api/docs/guides/agents 来源:OpenAI Developers 发布日期:2026-05-06
速查卡
| 项目 | 内容 |
|---|---|
| 一句话总结 | OpenAI 把更新后的 Agents SDK 正式推到 TypeScript,并把 sandbox agents 与 open-source harness 作为默认能力叙事,说明它要争夺的不只是模型调用入口,而是 agent 运行时标准。 |
| 大白话版 | 这次不是“又多一个 JS SDK”,而是 OpenAI 在说:如果你的应用自己负责编排、工具执行、审批和状态,那你应该直接站到我们的 Agent runtime 上来,而且现在 TypeScript 也补齐了。 |
| 核心事实 | 5 月 6 日 changelog:更新后的 Agents SDK 现已提供 TypeScript,支持 sandbox agents,并内置 open-source harness;4 月 15 日 changelog:新增 controlled sandboxes、可检查和自定义 open-source harness、可控制 memories 的创建时机与存储位置。 |
| 价值评级 | A — 这是 OpenAI 把 Agents SDK 从“Python 为主的 agent 框架”推进成“TS/Python 双语言、带运行时主张的应用层平台”。 |
| 适用对象 | 构建 agent 产品的应用团队、全栈 TypeScript 团队、需要多 agent 编排/审批/状态管理的企业开发者。 |
文章背景
本文是对 2026-04-16 旧文《深度解读 | OpenAI Agents SDK 重大演进:从 Codex 内部架构到开源 Agent 基础设施》的后续追踪。旧文链接:/ai-research/news/2026-04-16/deep-openai-agents-sdk/ 。那篇文章拆的是 OpenAI 首次把 Codex 级 agent runtime 开源出来;本文不重复原有背景,聚焦 2026-05-06 这次新增的 TypeScript 主线、sandbox agents 与 open-source harness 默认化 三个新信号。
如果只看 changelog,这次更新像一句短公告:
- Agents SDK 现已支持 TypeScript
- 支持 sandbox agents
- 内置 open-source harness
但配合同一天的完整 guide 来看,OpenAI 实际上传递的是更大的框架性判断:
Agents 不是“多调几次模型”的脚本,而是会规划、调工具、跨 specialist 协作、并保留足够状态以完成多步工作的应用。
而一旦你接受这个定义,问题就不再是“怎么发 API 请求”,而是:
- 谁来负责 orchestration
- 谁来执行 tools
- 谁来做 approvals
- 谁来保存 state
- 谁来提供可恢复、可观察、可隔离的 runtime
OpenAI 的答案就是:用 Agents SDK。
完整内容还原
1. changelog 给出的新增信号其实有两层
第一层是 2026 年 5 月 6 日的最新更新:
- 更新后的 Agents SDK 已提供 TypeScript
- 支持 sandbox agents
- 内置 open-source harness
第二层是 2026 年 4 月 15 日的前序更新。原文写得更具体:
- running agents in controlled sandboxes
- inspecting and customizing the open-source harness
- controlling when memories are created and where they’re stored
把两次 changelog 放在一起看,逻辑就清楚了:
4 月中旬 OpenAI 先强化了 Agent runtime 的底层能力;5 月初再把这套能力明确推到 TypeScript 受众面前。
2. guide 对 Agents 的定义,已经明显超过“SDK 帮你封装 API”
guide 中的第一句关键定义是:
Agents are applications that plan, call tools, collaborate across specialists, and keep enough state to complete multi-step work.
这句话决定了 OpenAI 对 Agents SDK 的定位:
它不是轻量客户端,而是面向多步工作流的应用框架。
guide 还明确区分了三条路径:
- 想直接发模型请求,用 OpenAI client libraries
- 当应用自己拥有 orchestration、tool execution、approvals 和 state 时,用 Agents SDK
- 只有当你明确想要 hosted workflow editor 和 ChatKit 路线时,才用 Agent Builder
这等于把产品边界画得很清楚:
如果你只是调模型,SDK 不是必须;但如果你要做 agent runtime,OpenAI 希望你进入它的 Agents SDK 轨道。
3. TypeScript 补齐的意义,在于把 agent 框架直接推给主流应用层团队
guide 在“Get the Agents SDK”一节里直接给出两个 GitHub 仓库入口:
- TypeScript SDK
- Python SDK
这不是无关紧要的语言扩展。因为大量真正面向产品、业务系统、Web 应用和现有服务栈的团队,本来就以 TypeScript 为主。
此前如果 Agents SDK 的心智更偏 Python,那么它更容易先进入研究、自动化和基础设施工程语境;现在 TypeScript 被放到同等入口位置,意味着 OpenAI 正把 agent runtime 主张直接推向更广泛的应用开发人群。
4. guide 最有价值的部分,是把整个 agent 开发拆成一条“阅读顺序”
原文没有只给一个 SDK 概览,而是把开发路径拆成模块:
- Quickstart:最短路径跑通一个集成
- Agent definitions:定义单个 specialist
- Models and providers:处理模型选择、默认设置与 transport
- Running agents:理解 runtime loop、streaming 和 continuation strategies
- Sandbox agents:当 agent 需要 files、commands、packages、snapshots、mounts 或 provider links 时使用
- Orchestration and handoffs:多 specialist 情况下决定谁拥有回复
- Guardrails and human review:在高风险工作继续前加验证或人工审批
- Results and state:解释 final output、resumable state 和 next-turn surfaces
- Integrations and observability + agent evals:先用 traces 调试,再进入评估循环
- Voice agents:语音工作流仍是 SDK-first,因为 Agent Builder 还不支持
这段结构透露出 OpenAI 对 agent 开发流程的完整理解:
先定义 specialist,再处理运行循环,再决定何时需要沙箱、多 agent、审批、状态、可观察性与评估。
5. sandbox agents 已经被明确定位为“容器化工作环境”问题
guide 对 sandbox agents 的描述非常关键。它不是泛泛说“更安全”,而是明确写到:
当 agent 需要以下能力时,应使用 sandbox agents:
- files
- commands
- packages
- snapshots
- mounts
- provider links
这说明 OpenAI 把 agent sandbox 视为真实执行环境,而不是只给一点临时工具权限。
尤其 “snapshots” 和 “mounts” 这两个词很重要:
- snapshots 对应可恢复与状态捕获
- mounts 对应和外部文件或环境的受控连接
再结合 4 月 15 日 changelog 里的 controlled sandboxes,可以看出 OpenAI 已把“隔离执行环境”视为 agent 平台的核心基础设施之一。
6. open-source harness 是这次更新最不该被忽略的关键词
changelog 两次都提到 harness:
- 5 月 6 日:open-source harness built in
- 4 月 15 日:可以 inspecting and customizing the open-source harness
官方没有在这两篇原文里展开更多内部实现细节,但有一件事已经足够明确:
OpenAI 不想把 agent runtime 完全做成黑盒托管品,而是允许开发者检查、定制其运行线束。
这很关键,因为企业团队真正担心的往往不是“会不会调模型”,而是:
- tool 调用链到底怎么组织
- 中间状态在哪里接管
- 出错时能不能插入自定义逻辑
- 安全和审计控制能不能接到自己系统里
一个可检查、可定制、且开源的 harness,正是在回答这些问题。
7. memories control 表明 OpenAI 已承认 agent state 不是默认自动就好
4 月 15 日 changelog 还提到:
- 可以控制 memories 何时被创建
- 以及它们存放在哪里
虽然 guide 没有展开 memory 系统的更细节实现,但单凭这条更新就能看出:
OpenAI 已经把 memory 从“默认越多越好”的产品功能,转向“需要开发者和企业自己决定边界”的 runtime 能力。
这对于企业场景尤其重要,因为 memory 本质上会涉及:
- 生命周期控制
- 数据位置
- 合规边界
- 审计与隐私策略
8. SDK 路线和 Agent Builder 路线被官方刻意分流
guide 里一个很重要的产品分层是:
- SDK 适合你的 server 自己拥有 orchestration、tool execution、state 和 approvals
- Agent Builder 适合想要 OpenAI-hosted 的 workflow creation、publishing、ChatKit deployment
这说明 OpenAI 并没有试图用一个产品面向所有 agent 开发者,而是在刻意分层:
- 偏应用工程和可控 runtime 的,去 SDK
- 偏托管工作流与可视化发布的,去 Agent Builder
这种分层也强化了前面那个判断:OpenAI 正在把 Agents SDK 定位成“自己掌控运行时”的那条专业路线。
核心技术洞察
1. OpenAI 抢的是 agent runtime,而不只是 JS 开发者市场
如果只看“TypeScript 支持”,容易误判成一次语言生态补齐。
但结合 guide 里反复强调的 orchestration、approvals、state、sandbox、observability、evals,更准确的理解是:
OpenAI 在争夺 agent runtime 标准层。
谁拥有这层,谁就不只是提供模型,还会影响:
- 多 agent 如何协作
- 工具如何接入
- 审批如何中断流程
- 状态如何续接
- 调试和评估如何做
2. sandbox + harness + memory control,构成了 agent 工程化三件套
从两篇原文里能确认的三大运行时关键词是:
- controlled / sandbox agents
- open-source harness
- memory creation and storage control
这三件事分别对应:
- 执行隔离
- 流程可定制
- 状态可治理
这说明 OpenAI 已经把 agent 工程问题,从“prompt 如何写”推进到了“运行时如何治理”。
3. guide 的结构本身就是 OpenAI 的产品教育
原文不仅在介绍 SDK,也在训练开发者采用一种 OpenAI 认可的 agent 开发顺序:
单 specialist → runtime loop → sandbox → handoffs → human review → results/state → observability → evals。
这套顺序会影响开发者如何理解 agent 架构,也会让 OpenAI 的平台概念逐步变成默认方法论。
横向对比
| 维度 | OpenAI client libraries | Agents SDK | Agent Builder |
|---|---|---|---|
| 主要目标 | 直接发模型请求 | 应用自己掌控 agent runtime | OpenAI-hosted workflow creation |
| 核心职责 | API client | orchestration、tools、approvals、state | visual editor、publishing、ChatKit deployment |
| 适合场景 | 简单模型调用 | 多步工作流、可控执行与集成 | 托管工作流发布 |
| 沙箱与运行时 | 非主叙事 | 明确包含 sandbox agents、results/state、observability | 更偏托管产品表面 |
| 语言路径 | 通用 SDK | TypeScript + Python | Hosted path |
批判性分析
局限性
- 5 月 6 日 changelog 很短,新增能力的具体 API 形态和迁移成本并未在 changelog 本文中展开。
- guide 更像总览和导航页,告诉你能力边界与阅读顺序,但不是完整技术细节说明。
- 原文确认了 sandbox、harness、memory control 的存在,但没有在这两篇材料里给出性能、成本或安全边界的量化指标。
- TypeScript 补齐后能否显著改变开发者采用率,还要看后续生态、样例与社区成熟度;这一点原文没有提供数据。
最值得记住的结论
这次更新真正重要的不是“OpenAI 终于有 TypeScript Agents SDK”,而是它在用 TypeScript、sandbox agents 和 open-source harness 一起宣告:未来 agent 竞争的关键,不只是谁的模型更强,而是谁能提供更可控、可恢复、可治理的运行时。