News

Introducing Trusted Contact in ChatGPT

主要信源：https://openai.com/index/introducing-trusted-contact-in-chatgpt 交叉验证：

https://openai.com/news/rss.xml

https://openai.com/index/an-update-on-our-mental-health-related-work 事件日期：2026-05-07

速查卡

项目	内容
一句话总结	OpenAI 把 Trusted Contact 做成 ChatGPT 的可选安全功能：当系统检测到 serious self-harm concerns 时，可以通知用户信任的人。
大白话版	这意味着 ChatGPT 不只在对话里劝你冷静，而是开始尝试把危机升级给现实世界的人类支持网络。
核心数字	• 2026-02 已在心理健康安全更新中提及 trusted contacts • 2026-05-07 正式以独立产品新闻推出
影响评级	A
利益相关方	OpenAI、用户、信任联系人、监管机构、心理健康类 AI 产品

事件全貌

发生了什么？

OpenAI 官方 RSS 在 2026-05-07 发布《Introducing Trusted Contact in ChatGPT》，描述非常明确：这是一个 optional safety feature，当系统检测到 serious self-harm concerns 时，会通知用户预先信任的人。

需要说明的是，openai.com 正文目前被 Cloudflare 挡板拦截，因此具体产品流程和细则暂时无法从原文直接读取；但官方 RSS 已足以确认三件事：

功能已经正式推出
这是可选安全功能，而不是默认强制功能
目标场景是严重自伤风险，而不是一般情绪低落

时间线

2026-02-27：OpenAI 在《An update on our mental health-related work》中已把 trusted contacts 作为心理健康安全工作的一部分提及
2026-05-07：以独立新闻形式推出 Trusted Contact in ChatGPT
同日 sitemap 归类到 safety 路径，而不是普通产品路径

关键声明

当前最硬的一句官方表述是：

“Introducing Trusted Contact in ChatGPT, an optional safety feature that notifies someone you trust if serious self-harm concerns are detected.”

这句话里每个词都很重要：

optional：用户控制权是设计前提之一
safety feature：这不是社交功能，而是安全功能
someone you trust：OpenAI 不是先找平台审核或公共机构，而是优先接入用户自己的人类支持网络
serious self-harm concerns：触发目标是高风险场景，不是一般陪聊

技术解析

这条新闻表面上不讲模型架构，但它本质上是一次产品责任链升级。

技术方案是什么？

从当前可直接确认的信息推断，Trusted Contact 至少包含三个子系统：

风险识别系统
- 负责判断对话是否进入 serious self-harm concerns 区间
联系人机制
- 允许用户预先指定可信赖的人
升级通知链路
- 在符合阈值时，把风险从 AI 对话内部升级到真实世界的人类支持者

这和传统“给你一个热线链接”最大的区别在于，它试图把危机场景处理从内容输出，推进到行动触发。

关键指标

指标	当前已确认	对比	说明
是否正式推出	是	2 月时仅能确认在安全工作中被提及	产品化升级
功能属性	optional safety feature	不是默认联系人功能	强调安全而非社交
触发对象	serious self-harm concerns	比一般 distress 更强	说明阈值较高
通知对象	trusted contact	从 AI 走向现实支持网络	责任链外延

与之前的区别

很多 AI 产品在高风险对话里做的事情，大多仍是：

提供热线
给安抚性文本
建议寻求帮助

Trusted Contact 往前迈了一步：把“寻求帮助”从建议变成一个可能触发的产品机制。这是更主动的干预设计，因此也更有争议。

产业影响链

Trusted Contact 正式推出
  ├→ AI safety 从“拒答/安抚”升级到“现实世界支持网络介入”
  │    ├→ 用户安全能力可能增强
  │    └→ 误报与隐私争议同步上升
  ├→ 心理健康类 AI 产品责任标准被抬高
  │    ├→ 竞品会被追问是否也要提供升级机制
  │    └→ 监管会更关注告警流程与可审计性
  └→ ChatGPT 与用户情绪生活的绑定程度被进一步坐实
       ├→ 带来更强社会责任
       └→ 也带来更强伦理负担

谁受益？

高风险用户
- 在某些极端时刻，现实世界支持网络的介入可能比单纯文字安抚更有用
OpenAI 的安全叙事
- 公司可以展示自己不只是训练模型，也在设计现实层面的保护机制
监管讨论
- 行业内终于有更具体的产品级案例可讨论

谁受损？

用户隐私边界
- 一旦误报或触发逻辑不透明，信任很容易反噬
被通知联系人
- 他们可能被突然卷入高压力情境，但是否准备好、是否知情、是否有支持资源，本身就是问题

对开发者/用户的影响

对普通开发者影响不在 API，而在行业标准：以后任何定位为陪伴、心理支持、青少年辅助、情绪助理的 AI 产品，都会被问一个更尖锐的问题——你的危机升级机制是什么？

对用户来说，最大的变化是：ChatGPT 正在从“只在屏幕里说话的助手”，变成在特定极端场景下可能触发真实世界关系网络的产品。

竞争格局变化

变化前

AI 安全更多停留在：

模型拒答能力
对话措辞优化
热线与资源指引

变化后

OpenAI 把责任边界外推到了“通知可信联系人”。这会迫使 Character.AI、Meta AI、教育/青少年 AI、心理健康聊天产品都重新思考：

是否要有类似机制
谁来承担误报责任
什么时候必须让人类接管

预期各方反应

监管机构：会更关注隐私、年龄、地区合规、人工复核
竞品：会在“更积极干预”与“更少平台责任”之间重新选择
用户群体：会明显分裂，一部分欢迎更主动保护，一部分会强烈警惕平台越界

历史脉络

这条新闻本质上说明一件事：OpenAI 已经默认 ChatGPT 深度进入了用户的情绪和心理场景。否则公司不会专门设计 trusted contacts 这样的机制。

从更长时间线看，AI safety 的重点也在迁移：

早期更关注越狱、违法内容、模型幻觉
现在开始转向现实世界伤害、脆弱人群、关系网络和产品责任链

Trusted Contact 就是这条迁移路线的标志性事件。

批判性分析

被忽略的风险

serious self-harm concerns 的判定逻辑若不透明，会变成巨大信任黑箱
误报不只是技术问题，也是社会问题：联系人可能惊慌、用户可能愤怒、关系本身可能受损
不同国家/文化对家庭、朋友、监护、隐私的边界定义并不一致

乐观预期的合理性

乐观派会说：如果真能在最危险的场景里把支持网络接进来，这比只贴热线链接要有用得多。这个观点有现实基础，尤其对孤立无援的高风险用户来说。

悲观预期的合理性

悲观派担心平台越权，也担心误报和隐私泄露。这种担心同样合理，因为 AI 并不总能正确理解语境、反讽、角色扮演、文学表达或复杂情绪语言。

独立观察

我认为这条功能最关键的意义，是它把“AI 是否该干预现实世界”从抽象伦理问题变成了产品设计问题。过去行业常说“AI 不该替代人类支持系统”；现在 OpenAI 的做法是：那就让 AI 至少能在极端情境里把人类支持系统叫进来。

第二，这类功能会倒逼行业更认真地区分“高风险情绪表达”和“普通情绪陪伴”。一旦平台不愿只做陪聊，就必须开始承担升级责任。

第三，最值得继续盯的，不是功能有没有，而是触发阈值、人工复核、申诉和地区适用范围。如果这些细节处理不好，Trusted Contact 很容易从安全创新变成信任地雷。