News
腾讯混元 HY 3.0:姚顺雨加入后的首个重大产品
腾讯混元 HY 3.0:姚顺雨加入后的首个重大产品
主要信源:https://news.17173.com/content/03182026/201030035.shtml 交叉验证:腾讯年报 / 多家科技媒体 事件日期:2026-03-18(报道)/ 2026-04 预计发布
速查卡
| 项目 | 内容 |
|---|---|
| 一句话总结 | 前 OpenAI 科学家姚顺雨主导的腾讯混元 3.0 正在内部测试,计划 4 月发布,聚焦模型效果、推理和 Agent |
| 大白话版 | 腾讯挖了 OpenAI 的顶级科学家来负责 AI,重建了团队和基础设施,第一个大作品即将发布 |
| 核心要点 | • 姚顺雨直接向刘炽平汇报 • 兼管 AI Infra 部和大语言模型部 • 模型效果+推理+Agent 三维度升级 • 4 月发布 |
| 价值评级 | A — 腾讯”重回牌桌”的关键产品 |
| 适用场景 | 中国大模型竞争格局分析 |
文章背景
腾讯在大模型竞赛中一度被视为”掉队者”——2024 年混元系列模型在 benchmark 上落后于 Qwen、DeepSeek、GLM。2025 年中,前 OpenAI 科学家姚顺雨加入腾讯,直接向 CTO 刘炽平汇报,兼管 AI Infra 部和大语言模型部。过去半年完成了团队重组和基础设施重建,投入即将集中兑现。
完整内容还原
姚顺雨的背景与定位
- 前 OpenAI 科学家:专注语言模型和强化学习
- 汇报线:直接向腾讯 CTO 刘炽平汇报——这是腾讯 AI 业务最高级别的组织架构
- 管辖范围:AI Infra 部 + 大语言模型部——从算力到模型的全链路
- 研究方向:语言 + RL,与 Agent 方向高度契合
混元 3.0 的三维度升级
- 模型效果:整体性能提升,对标 Qwen3.5/DeepSeek V3.2
- 推理能力:深度推理和 CoT 能力强化
- Agent 能力:工具使用、多步规划、自主执行
竞争格局对比
| 公司 | 最新模型 | 发布时间 | 状态 |
|---|---|---|---|
| 字节跳动 | 豆包 2.0 | 2026-02 | 已发布 |
| 阿里 | Qwen3.5-Omni / Qwen 3.6 Plus | 2026-03 | 已发布 |
| DeepSeek | V4(传言) | 2026-04 预计 | 未发布 |
| 腾讯 | 混元 HY 3.0 | 2026-04 预计 | 内测中 |
| 百度 | ERNIE 5.0 | — | 未宣布 |
混元 3.0 如果在 4 月如期发布且追平第一梯队(Qwen3.5/DeepSeek V3.2),腾讯将完成”重回牌桌”。
核心技术洞察
-
OpenAI 方法论 + 腾讯场景:姚顺雨带来的不只是技术能力,更是 OpenAI 的训练方法论(RLHF/GRPO 的实战经验)。腾讯拥有微信、游戏、视频等海量用户场景——方法论+场景的组合有想象空间。
-
RL + Agent 的契合:姚顺雨的研究方向(语言+RL)与 Agent 需求天然契合——2026 年 Agent 是各家竞争的核心战场。
-
全栈重建的决心:兼管 AI Infra 和模型两个部门意味着端到端控制——从训练集群到模型架构到推理优化。这种组织架构在中国大模型公司中是最激进的。
批判性分析
局限性
- benchmark 追赶不等于生态追赶:即使混元 3.0 在 benchmark 上追平,开发者生态和 API 用户基础的积累需要时间
- 内部协调:腾讯内部 AI 组织架构此前经历多次调整,新架构的稳定性是隐忧
- 发布时间不确定性:4 月是”计划”而非”确认”,大模型发布延迟是常态
乐观预期的合理性
- 腾讯的资源(算力、数据、场景)是中国 AI 公司中最顶级的——之前”掉队”不是因为缺资源,而是缺方向
- 姚顺雨的加入是方向性的修正——OpenAI 的方法论+腾讯的资源可能产生化学反应
- 腾讯年报确认 4 月发布计划——这不只是媒体传言
独立观察
- 2026 年 4 月可能是中国大模型最密集的发布月:混元 3.0 + DeepSeek V4(传言)
- 如果两者都如期发布且表现亮眼,中国大模型的第一梯队将从”Qwen + DeepSeek 双强”变为”Qwen + DeepSeek + 混元 三足鼎立”
- 腾讯的微信生态(13 亿 MAU)是 AI 分发的核武器——类似 Google 在搜索中嵌入 Gemini,如果混元深度整合进微信,用户触达将是数量级的优势