Esc
输入关键词开始搜索
News

Introducing Trusted Contact in ChatGPT

Introducing Trusted Contact in ChatGPT

主要信源:https://openai.com/index/introducing-trusted-contact-in-chatgpt 交叉验证:

速查卡

项目内容
一句话总结OpenAI 把 Trusted Contact 做成 ChatGPT 的可选安全功能:当系统检测到 serious self-harm concerns 时,可以通知用户信任的人。
大白话版这意味着 ChatGPT 不只在对话里劝你冷静,而是开始尝试把危机升级给现实世界的人类支持网络。
核心数字• 2026-02 已在心理健康安全更新中提及 trusted contacts • 2026-05-07 正式以独立产品新闻推出
影响评级A
利益相关方OpenAI、用户、信任联系人、监管机构、心理健康类 AI 产品

事件全貌

发生了什么?

OpenAI 官方 RSS 在 2026-05-07 发布《Introducing Trusted Contact in ChatGPT》,描述非常明确:这是一个 optional safety feature,当系统检测到 serious self-harm concerns 时,会通知用户预先信任的人。

需要说明的是,openai.com 正文目前被 Cloudflare 挡板拦截,因此具体产品流程和细则暂时无法从原文直接读取;但官方 RSS 已足以确认三件事:

  1. 功能已经正式推出
  2. 这是可选安全功能,而不是默认强制功能
  3. 目标场景是严重自伤风险,而不是一般情绪低落

时间线

  • 2026-02-27:OpenAI 在《An update on our mental health-related work》中已把 trusted contacts 作为心理健康安全工作的一部分提及
  • 2026-05-07:以独立新闻形式推出 Trusted Contact in ChatGPT
  • 同日 sitemap 归类到 safety 路径,而不是普通产品路径

关键声明

当前最硬的一句官方表述是:

“Introducing Trusted Contact in ChatGPT, an optional safety feature that notifies someone you trust if serious self-harm concerns are detected.”

这句话里每个词都很重要:

  • optional:用户控制权是设计前提之一
  • safety feature:这不是社交功能,而是安全功能
  • someone you trust:OpenAI 不是先找平台审核或公共机构,而是优先接入用户自己的人类支持网络
  • serious self-harm concerns:触发目标是高风险场景,不是一般陪聊

技术解析

这条新闻表面上不讲模型架构,但它本质上是一次产品责任链升级。

技术方案是什么?

从当前可直接确认的信息推断,Trusted Contact 至少包含三个子系统:

  1. 风险识别系统

    • 负责判断对话是否进入 serious self-harm concerns 区间
  2. 联系人机制

    • 允许用户预先指定可信赖的人
  3. 升级通知链路

    • 在符合阈值时,把风险从 AI 对话内部升级到真实世界的人类支持者

这和传统“给你一个热线链接”最大的区别在于,它试图把危机场景处理从内容输出,推进到行动触发。

关键指标

指标当前已确认对比说明
是否正式推出2 月时仅能确认在安全工作中被提及产品化升级
功能属性optional safety feature不是默认联系人功能强调安全而非社交
触发对象serious self-harm concerns比一般 distress 更强说明阈值较高
通知对象trusted contact从 AI 走向现实支持网络责任链外延

与之前的区别

很多 AI 产品在高风险对话里做的事情,大多仍是:

  • 提供热线
  • 给安抚性文本
  • 建议寻求帮助

Trusted Contact 往前迈了一步:把“寻求帮助”从建议变成一个可能触发的产品机制。这是更主动的干预设计,因此也更有争议。

产业影响链

Trusted Contact 正式推出
  ├→ AI safety 从“拒答/安抚”升级到“现实世界支持网络介入”
  │    ├→ 用户安全能力可能增强
  │    └→ 误报与隐私争议同步上升
  ├→ 心理健康类 AI 产品责任标准被抬高
  │    ├→ 竞品会被追问是否也要提供升级机制
  │    └→ 监管会更关注告警流程与可审计性
  └→ ChatGPT 与用户情绪生活的绑定程度被进一步坐实
       ├→ 带来更强社会责任
       └→ 也带来更强伦理负担

谁受益?

  1. 高风险用户

    • 在某些极端时刻,现实世界支持网络的介入可能比单纯文字安抚更有用
  2. OpenAI 的安全叙事

    • 公司可以展示自己不只是训练模型,也在设计现实层面的保护机制
  3. 监管讨论

    • 行业内终于有更具体的产品级案例可讨论

谁受损?

  1. 用户隐私边界

    • 一旦误报或触发逻辑不透明,信任很容易反噬
  2. 被通知联系人

    • 他们可能被突然卷入高压力情境,但是否准备好、是否知情、是否有支持资源,本身就是问题

对开发者/用户的影响

对普通开发者影响不在 API,而在行业标准:以后任何定位为陪伴、心理支持、青少年辅助、情绪助理的 AI 产品,都会被问一个更尖锐的问题——你的危机升级机制是什么?

对用户来说,最大的变化是:ChatGPT 正在从“只在屏幕里说话的助手”,变成在特定极端场景下可能触发真实世界关系网络的产品。

竞争格局变化

变化前

AI 安全更多停留在:

  • 模型拒答能力
  • 对话措辞优化
  • 热线与资源指引

变化后

OpenAI 把责任边界外推到了“通知可信联系人”。这会迫使 Character.AI、Meta AI、教育/青少年 AI、心理健康聊天产品都重新思考:

  • 是否要有类似机制
  • 谁来承担误报责任
  • 什么时候必须让人类接管

预期各方反应

  • 监管机构:会更关注隐私、年龄、地区合规、人工复核
  • 竞品:会在“更积极干预”与“更少平台责任”之间重新选择
  • 用户群体:会明显分裂,一部分欢迎更主动保护,一部分会强烈警惕平台越界

历史脉络

这条新闻本质上说明一件事:OpenAI 已经默认 ChatGPT 深度进入了用户的情绪和心理场景。否则公司不会专门设计 trusted contacts 这样的机制。

从更长时间线看,AI safety 的重点也在迁移:

  • 早期更关注越狱、违法内容、模型幻觉
  • 现在开始转向现实世界伤害、脆弱人群、关系网络和产品责任链

Trusted Contact 就是这条迁移路线的标志性事件。

批判性分析

被忽略的风险

  1. serious self-harm concerns 的判定逻辑若不透明,会变成巨大信任黑箱
  2. 误报不只是技术问题,也是社会问题:联系人可能惊慌、用户可能愤怒、关系本身可能受损
  3. 不同国家/文化对家庭、朋友、监护、隐私的边界定义并不一致

乐观预期的合理性

乐观派会说:如果真能在最危险的场景里把支持网络接进来,这比只贴热线链接要有用得多。这个观点有现实基础,尤其对孤立无援的高风险用户来说。

悲观预期的合理性

悲观派担心平台越权,也担心误报和隐私泄露。这种担心同样合理,因为 AI 并不总能正确理解语境、反讽、角色扮演、文学表达或复杂情绪语言。

独立观察

我认为这条功能最关键的意义,是它把“AI 是否该干预现实世界”从抽象伦理问题变成了产品设计问题。过去行业常说“AI 不该替代人类支持系统”;现在 OpenAI 的做法是:那就让 AI 至少能在极端情境里把人类支持系统叫进来。

第二,这类功能会倒逼行业更认真地区分“高风险情绪表达”和“普通情绪陪伴”。一旦平台不愿只做陪聊,就必须开始承担升级责任。

第三,最值得继续盯的,不是功能有没有,而是触发阈值、人工复核、申诉和地区适用范围。如果这些细节处理不好,Trusted Contact 很容易从安全创新变成信任地雷。