Introducing Trusted Contact in ChatGPT
Introducing Trusted Contact in ChatGPT
主要信源:https://openai.com/index/introducing-trusted-contact-in-chatgpt 交叉验证:
速查卡
| 项目 | 内容 |
|---|---|
| 一句话总结 | OpenAI 把 Trusted Contact 做成 ChatGPT 的可选安全功能:当系统检测到 serious self-harm concerns 时,可以通知用户信任的人。 |
| 大白话版 | 这意味着 ChatGPT 不只在对话里劝你冷静,而是开始尝试把危机升级给现实世界的人类支持网络。 |
| 核心数字 | • 2026-02 已在心理健康安全更新中提及 trusted contacts • 2026-05-07 正式以独立产品新闻推出 |
| 影响评级 | A |
| 利益相关方 | OpenAI、用户、信任联系人、监管机构、心理健康类 AI 产品 |
事件全貌
发生了什么?
OpenAI 官方 RSS 在 2026-05-07 发布《Introducing Trusted Contact in ChatGPT》,描述非常明确:这是一个 optional safety feature,当系统检测到 serious self-harm concerns 时,会通知用户预先信任的人。
需要说明的是,openai.com 正文目前被 Cloudflare 挡板拦截,因此具体产品流程和细则暂时无法从原文直接读取;但官方 RSS 已足以确认三件事:
- 功能已经正式推出
- 这是可选安全功能,而不是默认强制功能
- 目标场景是严重自伤风险,而不是一般情绪低落
时间线
- 2026-02-27:OpenAI 在《An update on our mental health-related work》中已把 trusted contacts 作为心理健康安全工作的一部分提及
- 2026-05-07:以独立新闻形式推出 Trusted Contact in ChatGPT
- 同日 sitemap 归类到 safety 路径,而不是普通产品路径
关键声明
当前最硬的一句官方表述是:
“Introducing Trusted Contact in ChatGPT, an optional safety feature that notifies someone you trust if serious self-harm concerns are detected.”
这句话里每个词都很重要:
- optional:用户控制权是设计前提之一
- safety feature:这不是社交功能,而是安全功能
- someone you trust:OpenAI 不是先找平台审核或公共机构,而是优先接入用户自己的人类支持网络
- serious self-harm concerns:触发目标是高风险场景,不是一般陪聊
技术解析
这条新闻表面上不讲模型架构,但它本质上是一次产品责任链升级。
技术方案是什么?
从当前可直接确认的信息推断,Trusted Contact 至少包含三个子系统:
-
风险识别系统
- 负责判断对话是否进入 serious self-harm concerns 区间
-
联系人机制
- 允许用户预先指定可信赖的人
-
升级通知链路
- 在符合阈值时,把风险从 AI 对话内部升级到真实世界的人类支持者
这和传统“给你一个热线链接”最大的区别在于,它试图把危机场景处理从内容输出,推进到行动触发。
关键指标
| 指标 | 当前已确认 | 对比 | 说明 |
|---|---|---|---|
| 是否正式推出 | 是 | 2 月时仅能确认在安全工作中被提及 | 产品化升级 |
| 功能属性 | optional safety feature | 不是默认联系人功能 | 强调安全而非社交 |
| 触发对象 | serious self-harm concerns | 比一般 distress 更强 | 说明阈值较高 |
| 通知对象 | trusted contact | 从 AI 走向现实支持网络 | 责任链外延 |
与之前的区别
很多 AI 产品在高风险对话里做的事情,大多仍是:
- 提供热线
- 给安抚性文本
- 建议寻求帮助
Trusted Contact 往前迈了一步:把“寻求帮助”从建议变成一个可能触发的产品机制。这是更主动的干预设计,因此也更有争议。
产业影响链
Trusted Contact 正式推出
├→ AI safety 从“拒答/安抚”升级到“现实世界支持网络介入”
│ ├→ 用户安全能力可能增强
│ └→ 误报与隐私争议同步上升
├→ 心理健康类 AI 产品责任标准被抬高
│ ├→ 竞品会被追问是否也要提供升级机制
│ └→ 监管会更关注告警流程与可审计性
└→ ChatGPT 与用户情绪生活的绑定程度被进一步坐实
├→ 带来更强社会责任
└→ 也带来更强伦理负担
谁受益?
-
高风险用户
- 在某些极端时刻,现实世界支持网络的介入可能比单纯文字安抚更有用
-
OpenAI 的安全叙事
- 公司可以展示自己不只是训练模型,也在设计现实层面的保护机制
-
监管讨论
- 行业内终于有更具体的产品级案例可讨论
谁受损?
-
用户隐私边界
- 一旦误报或触发逻辑不透明,信任很容易反噬
-
被通知联系人
- 他们可能被突然卷入高压力情境,但是否准备好、是否知情、是否有支持资源,本身就是问题
对开发者/用户的影响
对普通开发者影响不在 API,而在行业标准:以后任何定位为陪伴、心理支持、青少年辅助、情绪助理的 AI 产品,都会被问一个更尖锐的问题——你的危机升级机制是什么?
对用户来说,最大的变化是:ChatGPT 正在从“只在屏幕里说话的助手”,变成在特定极端场景下可能触发真实世界关系网络的产品。
竞争格局变化
变化前
AI 安全更多停留在:
- 模型拒答能力
- 对话措辞优化
- 热线与资源指引
变化后
OpenAI 把责任边界外推到了“通知可信联系人”。这会迫使 Character.AI、Meta AI、教育/青少年 AI、心理健康聊天产品都重新思考:
- 是否要有类似机制
- 谁来承担误报责任
- 什么时候必须让人类接管
预期各方反应
- 监管机构:会更关注隐私、年龄、地区合规、人工复核
- 竞品:会在“更积极干预”与“更少平台责任”之间重新选择
- 用户群体:会明显分裂,一部分欢迎更主动保护,一部分会强烈警惕平台越界
历史脉络
这条新闻本质上说明一件事:OpenAI 已经默认 ChatGPT 深度进入了用户的情绪和心理场景。否则公司不会专门设计 trusted contacts 这样的机制。
从更长时间线看,AI safety 的重点也在迁移:
- 早期更关注越狱、违法内容、模型幻觉
- 现在开始转向现实世界伤害、脆弱人群、关系网络和产品责任链
Trusted Contact 就是这条迁移路线的标志性事件。
批判性分析
被忽略的风险
- serious self-harm concerns 的判定逻辑若不透明,会变成巨大信任黑箱
- 误报不只是技术问题,也是社会问题:联系人可能惊慌、用户可能愤怒、关系本身可能受损
- 不同国家/文化对家庭、朋友、监护、隐私的边界定义并不一致
乐观预期的合理性
乐观派会说:如果真能在最危险的场景里把支持网络接进来,这比只贴热线链接要有用得多。这个观点有现实基础,尤其对孤立无援的高风险用户来说。
悲观预期的合理性
悲观派担心平台越权,也担心误报和隐私泄露。这种担心同样合理,因为 AI 并不总能正确理解语境、反讽、角色扮演、文学表达或复杂情绪语言。
独立观察
我认为这条功能最关键的意义,是它把“AI 是否该干预现实世界”从抽象伦理问题变成了产品设计问题。过去行业常说“AI 不该替代人类支持系统”;现在 OpenAI 的做法是:那就让 AI 至少能在极端情境里把人类支持系统叫进来。
第二,这类功能会倒逼行业更认真地区分“高风险情绪表达”和“普通情绪陪伴”。一旦平台不愿只做陪聊,就必须开始承担升级责任。
第三,最值得继续盯的,不是功能有没有,而是触发阈值、人工复核、申诉和地区适用范围。如果这些细节处理不好,Trusted Contact 很容易从安全创新变成信任地雷。